한미 공동 연구팀 "5360 종류 효소 고유 번호 예측 가능"

한국과학기술원(KAIST)은 생명화학공학과 이상엽 특훈교수와 미국 캘리포니아대 샌디에이고(UCSD) 생명공학과 버나드 펄슨 교수 공동연구팀이 단백질 서열을 활용, 해당 단백질의 효소 기능을 빠르고 정확하게 예측할 수 있는 인공지능(AI) '딥 EC 트랜스포머'(DeepECtransformer)를 개발했다고 24일 밝혔다.

효소는 생물학적 반응을 촉매하는 단백질로, 생명체에서의 다양한 화학 반응과 이에 따라 결정되는 대사 특성을 파악하기 위해서는 각 효소의 기능을 이해해야 한다.

효소 고유 번호인 EC 번호(Enzyme Commission number)는 국제생화학 및 분자 생물학연맹(IUBMB)이 고안한 효소 기능 분류 체계로, 다양한 유기체의 대사 특성을 이해하기 위해선 게놈 서열에서 존재하는 효소의 종류와 EC 번호를 빠르게 분석할 수 있는 기술 개발이 필요하다.

단백질의 기능 및 효소 기능 예측을 위해 인공지능을 활용하는 다양한 예측 시스템이 보고됐지만, 인공지능의 추론 과정을 직접 확인할 수 없거나, 효소 서열 내 아미노산 잔기(최소 단위) 수준으로 해석하지 못하는 문제가 있었다.

공동연구팀은 심층학습 기법과 단백질 상동성 분석 모듈을 활용해 주어진 단백질 서열의 효소 기능을 예측하는 인공지능 시스템을 개발했다.

더 다양한 효소 기능을 정확하게 예측할 수 있도록 단백질 서열 전체 문맥에서 효소 기능에 중요한 정보를 추출, 이를 통해 효소의 EC 번호를 정확하게 예측할 수 있었다. 이 인공지능은 총 5천360종류의 EC 번호를 예측할 수 있다.

공동연구팀은 이 인공지능의 인공 신경망 내 정보 흐름을 분석해, 인공지능이 추론 과정에서 효소 기능에 중요한 활성 부위나 보조 인자 결합 부위 정보를 활용한다는 것도 밝혀냈다.

이번 연구 논문의 제1 저자인 KAIST 김기배 박사과정생은 "이번에 개발한 예측 시스템을 활용해 아직 밝혀진 적이 없는 효소의 기능을 새롭게 예측하고 실험으로 검증할 수 있었다"고 말했다.

이어 "생명체 내 밝혀지지 않았던 효소를 파악함으로써 유용 화합물을 생합성하는 데 필요한 효소나 플라스틱을 친환경적으로 생분해하기 위해 필요한 효소 등 다양한 대사 과정을 새롭게 밝혀낼 수 있을 것"이라고 덧붙였다.

이번 논문은 국제 학술지 `네이처 커뮤니케이션즈'에 지난 14일 게재됐다.

저작권자 © 중소기업뉴스 무단전재 및 재배포 금지