한국인 만 명 게놈 해독 완료! … 초대형 바이오 빅데이터 기반 마련
상태바
한국인 만 명 게놈 해독 완료! … 초대형 바이오 빅데이터 기반 마련
  • 대학지성 In & Out 기자
  • 승인 2021.04.28 03:09
  • 댓글 0
이 기사를 공유합니다

- UNIST, ‘울산 만 명 게놈프로젝트’완료 선언 … 복지형 국민게놈 사업 일환
- 첨단 게놈·바이오의료 서비스 산업 기반이 될 국가 핵심데이터로 활용 기대
기증자 대표 등이 핸드프린팅 기념식을 하고 있다. 각 연령별 대표와 송철호 시장(좌단부터 3번째), 이용훈 총장(좌단부터 4번째), 박종화 교수(우단부터 2번째)

UNIST(총장 이용훈)와 울산광역시(시장 송철호)가 26일(월) 오후 2시 제4공학관(110동) N101호에서 한국인 만 명 게놈 해독 완료를 선언했다. 지난 2015년 출범한 ‘게놈코리아 인 울산(Gemon Korea in Ulsan)’을 통해 진행된 ‘울산 만 명 게놈프로젝트’의 완료를 기념하는 것이다. 

울산 만 명 게놈프로젝트는 2016년 시작해 현재까지 건강인 4,700명, 질환자 5,300명 등 총 10,044명의 한국인 게놈 정보(Korea10K)를 수집, 해독했다. 이 범국민 게놈 기반 건강 연구 사업에는 현재까지 180억 원 이상의 예산이 투입됐다.

울산광역시와 UNIST가 주관한 만 명 게놈프로젝트는 산‧학‧연‧관 협력사업으로 추진됐다. 울산대학교병원, 울산병원, 울산중앙병원, 보람병원, 동강병원 등 지역 내 병원과, 경상대, 경희대, 충북대, 카톨릭대, 서울대, 고려대, 한의학연구원 등 다양한 대학, 연구소, UNIST 1호 벤처이자 코스닥 상장사인 ㈜클리노믹스를 비롯한 기업들이 참여했다.

박종화 UNIST 바이오메디컬공학과 교수는 “게놈은 바이오산업의 반도체로, 많은 나라들이 개개인의 해독된 게놈 정보를 핵심 공공데이터로 구축해 바이오산업의 경쟁력 강화에 나서고 있다”며 “이번 프로젝트는 국민들의 자발적 참여를 바탕으로, 한국인의 유전적 다형성을 정밀하게 지도화 했다는 데 큰 의미가 있다”고 설명했다. 

울산 만 명 게놈프로젝트는 두 가지의 큰 사업성과를 거뒀다. ‘한국인 만 명의 게놈 정보(Korea10K)’와 ‘국내 최고 수준의 슈퍼컴퓨팅 분석 인프라 구축’이다. 

Korea10K는 한국인의 표준 유전자 변이정보 데이터베이스로서 그 가치가 크다. 차세대 게놈 사업의 핵심인 ‘다중오믹스 빅데이터’로 활용될 수 있기 때문이다. 이번 사업에서는 혈액, 타액 등을 통해 수집된 게놈, 전사체, 외유전체 등 오믹스 정보와 건강검진정보, 임상정보, 생활습관정보 등이 종합적으로 구축됐다. 이 데이터는 통합 분석을 통해 특정 질병의 원인에 대한 변화를 찾는 ‘다중오믹스 분석’에 활용될 수 있다. 한층 더 정밀한 유전적 질환 분석이 가능해질 수 있는 것이다. 

만 명 게놈 분석을 위한 고성능 인프라 구축도 큰 성과다. UNIST 게놈산업기술센터(KOGIC)는 수년간 대량의 게놈 정보 분석을 위해 초고성능, 고집적 연산 전자장비와 대용량 저장 공간을 구축해왔다. 빅데이터의 효율적 분석을 위한 자체 기술력 향상도 이어져, 자동화된 파이프라인을 통한 수천 명의 전장 게놈 기초 분석이 진행되고 있다.

UNIST 연구진은 지난 2020년 5월, 한국인 천 명 게놈에 대한 분석결과를 국제 학술지 ‘사이언스 어드밴시스(Science Advances)’에 발표해 주목받기도 했다. 현재 천 명 게놈 분석 데이터는 영국 MRC센터, 케임브리지, UC버클리, UCLA, 서울대, 연세대 의대, KAIST 등 국내외 23개 연구기관에 분양되어 연구에 활용 중이며, Korea10K 또한 곧 게놈규제자유특구를 통해 상용화 연구를 본격화할 예정이다.

선언식 행사 참석자들이 단체 사진촬영을 했다.

이용훈 총장은 “만 명 게놈 프로젝트를 통해 확보된 데이터, 인프라와 노하우는 바이오헬스 분야의 혁신적 경쟁력이 될 것”이라며 “이를 바탕으로 디지털 헬스케어, 정밀의료, 신약개발 등 첨단 바이오분야를 선도해 지역과 함께 성장할 수 있는 모델을 만들어가겠다”고 말했다.
 
송철호 시장은 “울산에서 시작된 게놈프로젝트는 울산 게놈서비스 규제자유특구사업을 통한 신규 기업 유치 등 미래를 이끌 신산업으로 영글고 있다”며 “게놈 데이터를 분석할 수 있는 최첨단 인프라를 마련하고 이를 기업, 연구소와 공유할 수 있도록 지원해 울산이 첨단 질병 예측, 진단, 분석에서 앞서나갈 수 있도록 하겠다”고 말했다. 

울산 만명 게놈프로젝트는 게놈 대중화를 위해 추진된 사업이라는 점에서 해외 대형 프로젝트와 차별점을 갖는다. 질환자의 게놈 정보를 수집하는 데 초점이 맞춰진 해외 사례와 달리 자발적인 참여를 원하는 전 국민을 대상으로 수행됐으며, 참여자들에게 게놈분석 연구리포트가 제공됐기 때문이다. 게놈엑스포 사업을 통한 게놈 기술 및 관련 산업 소개, 게놈 리포트를 통한 게놈 이해 기회는 게놈에 대한 일반인의 의식 제고에도 기여했다는 평가를 받는다. 실제 게놈엑스포에 참여한 1,000명 대상 설문조사의 결과, 참가자의 약 95%가 게놈 분석이 인류의 삶에 긍정적인 변화를 가져올 것이라 답하기도 했다.

<용어 설명>

1. 게놈(유전체, Genome)
유전자(Gene)과 염색체(Chromosome)의 합성어. 유전체라고도 한다. 게놈은 한 개체 유전자의 총 염기서열로, 한 생물종의 거의 완전한 유전 정보의 총합이다. 인간의 유전 정보는 46개(23쌍)의 염색체에 저장된다. 염색체 안에는 마치 실타래처럼 네 종류의 염기가 모여서 있다. 인간의 경우 아데닌(A), 구아닌(G), 시토신(C), 티민(T)이라는 네 종류의 염기 30억 개가 일정한 순서로 늘어서 있다. 이 염기서열에 따라 키와 피부색 등 생물학적 특성이 결정된다.

2. 오믹스(Omics)
게놈 정보뿐만 아니라 전사체, 후성유전체, 단백질체 등 생물학적 정보를 총망라해 해석하는 학문. 염기서열로 유전정보가 저장돼 있더라도 세포분열 등을 위해 정보가 복사되는 과정(전사) 및 유전정보를 이용해 단백질을 만드는 과정에서도 문제가 생겨 질병이 발생할 수 있다. 오믹스 통합 연구를 통해 이런 문제의 근본 원인을 파악할 수 있다. 다중오믹스는 게놈에 기반한 모든 이차, 삼차 빅데이터를 말하며, 특히 유전자의 발현, 조절과 관련된 수십가지의 분야를 총칭하는 용어이다.

3. 유전적 다형성
DNA 염기서열 (A, T, G, C)의 차이를 보이는 유전적 변화 또는 변이를 의미한다. 

4. 표준 유전자 변이정보
인간표준게놈지도와 비교하였을 때 염기서열에 차이를 보이는 변이들의 정보를 모은 것이다. 변이는 각 개인, 인종마다 다르기 때문에 많은 사람들의 변이정보를 총칭하는 용어이다.

5. 파이프라인
분석을 하기 위해 여러 가지 소프트웨어를 순서대로 엮어서 다양한 분석기능을 자동화하도록 하는 소프트웨어를 의미한다. 여러 소프트웨어의 수동 작업들을 제거하며 데이터가 단계별로 순조롭게 흐르도록 자동화하는 것으로, 데이터를 효율적으로 분석하기 위해 필요하다.


댓글삭제
삭제한 댓글은 다시 복구할 수 없습니다.
그래도 삭제하시겠습니까?
댓글 0
댓글쓰기
계정을 선택하시면 로그인·계정인증을 통해
댓글을 남기실 수 있습니다.
주요기사