서울대 통계학과 박태성 교수팀, 딥 러닝 기반 패스웨이 분석 방법론 개발
상태바
서울대 통계학과 박태성 교수팀, 딥 러닝 기반 패스웨이 분석 방법론 개발
  • 이현건 기자
  • 승인 2022.06.06 00:03
  • 댓글 0
이 기사를 공유합니다

          서울대 통계학과 박태성 교수

서울대학교 통계학과 박태성 교수는 김보람연구원과 박찬우연구원과 공동으로 딥 러닝에 기반하여 유전자, 단백질 등과 같은 생물학적 인자의 복잡한 비선형적 상호작용을 반영하여 패스웨이 분석을 할 수 있는 방법론 ‘DeepHisCoM’을 개발했다.

패스웨이(Pathway)는 단백질, 유전자, 세포 등 생체 요소간의 상호작용과 역학관계를 세밀하게 설명할 수 있는 생물학적 심층지식을 말한다. 패스웨이 (pathway) 분석은 유전자와 단백질과 같은 생물학적 인자를 기반으로 질병과 관련된 패스웨이를 식별하는 데 사용되어져 왔다. 이러한 질병 연관 패스웨이의 발견은 생물학적 인자들이 어떠한 생물학적 현상을 통해 질병에 영향을 미치는지에 대한 해석에 도움을 주어 향후 질병의 기작 이해에 도움을 줄 수 있다는 장점이 있다. 그러나 기존의 패스웨이 분석 방법론은 대부분 생물학적 인자와 패스웨이 사이의 복잡한 비선형적 관계를 고려하지 못한다는 한계점이 있어 생물학적 복잡성을 반영하지 못하고 있다. 

박태성교수 연구팀은 이러한 한계를 극복하기 위하여 딥 러닝을 활용한 새로운 패스웨이 방법인 ‘DeepHisCoM’을 개발했다. ‘DeepHisCoM’은 비선형적 관계를 반영할 뿐 아니라 생물학적 인자에서 패스웨이, 질병으로 흐르는 계층적인 생물학적 구조를 반영하며 동시에 대량의 생물학적 인자를 입력받아 수십, 수백 개의 패스웨이를 동시에 분석할 수 있는 딥 러닝 기반의 새로운 패스웨이 분석 방법이다.

박태성교수 연구팀은 DeepHisCoM의 다양한 생물학적 자료 및 질병에 대한 효용성을 확인하기 위하여 네 가지 종류의 오믹스 자료와 두 가지 종류의 질병에 대해 적용하여 각 질병과 유의미하게 연관된 패스웨이를 찾았다.

 

영국 UK Biobank의 COVID-19 환자들의 유전체 (SNP) 자료를 이용하여 중증도와 연관된 패스웨이를 분석한 결과 MAPK signaling pathway, GnRH signaling pathway, hypertrophic cardiomyopathy, dilated cardiomyopathy와 그 외 기존 COVID-19와 연관된 것으로 밝혀진 다수의 패스웨이를 찾았다. COVID-19 기전의 이해에 도움을 줄 수 있는 다수의 후보 패스웨이를 찾아 향후 감염병 연구에의 활용 가능성을 제시했다.

박태성교수 연구팀은 간암 환자의 대사체 자료를 분석하여 lysine degradation, valine, leucine, and isoleucine biosynthesis, phenylalanine, tyrosine, and tryptophan 등 간암 연관 패스웨이를 찾았고, 전사체 및 메타지놈 자료에서 결과의 재현성을 확인했다. 또한 추가적인 시뮬레이션 분석을 통하여 기존의 비선형적 관계를 고려하지 않는 모델과 비교했을 때 DeepHisCoM이 더 높은 성능을 보이는 것을 확인했다.

박태성교수 연구팀은 DeepHisCoM의 다양한 오믹스 자료 및 질병에 대한 적용 가능성을 확인했으며, 향후 질병 연관 패스웨이 발굴을 통해 질병에 대한 생물학적 기전을 해석하는데 기여할 수 있을 것으로 기대하고 있다. 이번 연구는 생물정보학 분야의 세계적인 저널인 Briefings in Bioinformatics 최근호에 게재됐다.

 

 


댓글삭제
삭제한 댓글은 다시 복구할 수 없습니다.
그래도 삭제하시겠습니까?
댓글 0
댓글쓰기
계정을 선택하시면 로그인·계정인증을 통해
댓글을 남기실 수 있습니다.
주요기사