한국인 1,000명 게놈 빅데이터 공개…약 4,000만개 변이 발견
상태바
한국인 1,000명 게놈 빅데이터 공개…약 4,000만개 변이 발견
  • 김한나 기자
  • 승인 2020.05.31 18:00
  • 댓글 0
이 기사를 공유합니다

[연구성과]
-UNIST, '한국인 1,000명 게놈' 발표...'암 조직 특이 변이' 예측
-박종화·이세민 교수팀 "질병 예측 및 치료 응용 기대"

한국인 1,000여명의 건강검진 자료와 유전정보 등을 융합해 분석한 일종의 빅데이터 결과가 공개됐다. 울산과학기술원(UNIST) 게놈산업기술센터(KOGIC)는 한국인 1,094명의 전장 게놈(유전체)과 건강검진 정보를 통합 분석한 ‘한국인 1,000명 게놈(Korea1K)’ 결과를 국제학술지 '사이언스 어드밴시스'에 27일자로 발표했다고 밝혔다.

▲ 한국인 1천명 게놈정보를 이용한 암 분석 개선
▲ 한국인 1천명 게놈정보를 이용한 암 분석 개선

이번 한국인 1,000여 명의 게놈 정보를 영국과 미국에서 2003년 완성한 인간참조표준게놈지도(표준게놈)와 비교한 결과 총 3,902만5,362개의 변이가 발견됐다. 한국인 1,000명의 게놈이 인간표준게놈과 다른 염기 약 4,000만개를 가진다는 것이다. 특히 이 중 34.5%는 한국인 집단 내에서 한 번만 발견되는 독특한 변이로 밝혀졌다. KOGIC의 이세민 센터장은 “한국인의 개인 특이적 혹은 낮은 빈도의 희귀한 유전변이의 기능과 역할을 잘 설명하려면 더 방대한 게놈 빅데이터 확보가 절실하다”고 밝혔다.
 
‘Korea1K’은 한국인의 암과 관련 있는 유전변이, 즉 ‘암 조직 특이 변이’ 예측도에서 우수한 결과를 보였다. 기존 한국인 위암 환자의 암 게놈 데이터와 그 대조군으로 ‘Korea1K’와 다른 인종의 변이체 데이터를 사용해, 각 집단 내 변이 발생 빈도를 기반으로 ‘암 조직 특이 체세포 변이’를 구분하는 예측분석을 했다. 그 결과 영국에서 수행된 세계 최초의 1,000명 게놈 사업과 같은 기존의 타 인족 중심 변이체를 사용했을 때보다 Korea1K 데이터를 활용했을 때 정확도가 가장 높았다. 이를 분석한 최연송 연구원은 "이것은 ‘Korea1K’의 실용적 가치가 매우 크다는 것을 뜻한다"며 "표준성과 더불어 응용성도 높다"고 설명했다.

▲ 한국인 1천명 게놈정보를 이용한 전장게놈 연관분석
▲ 한국인 1천명 게놈정보를 이용한 전장게놈 연관분석

 

또 ‘Korea1K’에는 건강검진 결과와 유전변이 간 상관관계가 분석(GWAS)된 결과도 담겨있다. 이에 따르면 혈액검사로 알 수 있는 중성지방, 갑성선 호르몬 수치 등 총 11개 건강검진 항목이 15개의 게놈 영역에서 467개의 유전자 변이와 관련이 있다. 이 중 4개 영역은 이번에 새롭게 발견됐으며, 나머지 9개 영역에 대해서는 기존에 알려진 것보다 더 상관관계가 높은 변이를 알아냈다.

제1저자들인 UNIST 생명공학과의 전성원·박영준 연구원은 "과거의 GWAS 연구가 한정된 영역에서의 유전변이만 볼 수 있는 반면에 이 연구에서는 한국인 게놈 전체를 대량으로 읽어서 분석했기 때문에 더 정확한 유전자 연관성을 얻을 수 있었다"며 "미래엔 대부분의 유전자 연구가 전장게놈을 가지고 행해질 것"이라고 밝혔다.

KOGIC 박종화 교수는 “한국인 게놈 사업은 다양한 국가·인족·문화 배경의 사람들이 게놈 기반 공공 빅데이터를 구축하기 위해 시작됐다"며 "앞으로도 과학연구의 목적에 어울리게 한국 국민과 인류 전체에 활용되기를 희망한다"고 말했다.

송철호 울산광역시장은 "국가 바이오 산업 발전을 위해 울산 게놈 빅데이터와 그간의 경험을 다른 국가 바이오 빅데이터 구축 사업 및 기업, 병원, 대학연구자 등에게 공유해 국내 바이오 산업 육성에 주춧돌 역할을 다할 것"이라며 "금년 내 1만명 게놈 해독 완성을 위해 적극 지원하겠다"고 전했다.

해당 사업은 2015년 선언된 ‘울산 만명게놈사업(Genome Korea in Ulsan)’의 일환으로, 한국인의 모든 유전적 다양성을 지도화하기 위한 첫 번째 연구 결과이다. UNIST는 올해까지 1만명의 게놈 데이터를 확보할 예정이다. 울산 만명게놈사업은 참여자의 자발적 동의를 바탕으로 수집된 모든 정보를 가명화 및 익명화 절차를 통해 안전하게 관리한다. 이번 연구에서는 최소 1페타바이트(1PB)의 저장공간(5MB 노래파일 2억개)이 필요한 1,094명의 초대형 바이오 빅데이터를 구축했다. 이러한 게놈 분석에는 슈퍼컴퓨팅 연산자원과 최적화된 게놈 분석 자동화 파이프라인이 필수적이다. 'Korea1K' 데이터는 국가적으로 공유되고 활용되기 위해 최대한 공개되어 다양한 한국인 게놈 데이터 생산에 활용될 예정이다.

▲ [연구진사진](좌측부터) 이세민 교수, 최연송 연구원, 전성원 연구원, 박영준 연구원, 박종화 교수
▲ [연구진사진](좌측부터) 이세민 교수, 최연송 연구원, 전성원 연구원, 박영준 연구원, 박종화 교수

'Korea1K' 변이체 연구의 결과 중 한국인 내 변이 빈도는 'Korea1K' 홈페이지에서 누구나 열람할 수 있다.

연구팀은 "이번 연구는 전장 게놈 데이터와 건강검진 데이터를 동시에 모집하고, 다중 오믹스 정보 등과도 연계 분석해 한국인의 표현형 분석, 질병 예측 등의 후속 연구에 활용될 수 있는 방대한 맞춤 정밀의료 데이터를 마련한 데 의의가 있다"며 "방대한 개인 유전자 정보 생산, 보존, 관리, 활용의 모든 부분에서 최첨단 기술을 적극 도입함으로써, 바이오의료정보 보안기술 분야의 미래 국가 경쟁력을 올리는 데 기여할 것"이라고 기대했다.


댓글삭제
삭제한 댓글은 다시 복구할 수 없습니다.
그래도 삭제하시겠습니까?
댓글 0
댓글쓰기
계정을 선택하시면 로그인·계정인증을 통해
댓글을 남기실 수 있습니다.
주요기사