R&D 이슈 연구동향…빅데이터 생물학–유전체 및 후성유전체 기초연구
상태바
R&D 이슈 연구동향…빅데이터 생물학–유전체 및 후성유전체 기초연구
  • 이현건 기자
  • 승인 2021.11.25 10:32
  • 댓글 0
이 기사를 공유합니다

[NRF R&D BRIEF 2021-20호] 기초연구본부 선정 R&D 이슈 연구동향(7)

 

빅데이터 생물학(Big Data Biology)은 대용량의 생물학적 정보를 효율적으로 정리하고 해석하여 다양한 생명체와 그 생물학적인 현상을 분석하는 연구 분야를 의미한다.

빅데이터 생물학 분야에서의 유전체학 및 후성유전체학은 특정 세포의 전체 유전자를 포함하는 게놈의 구조, 기능, 변형 및 교정 등에 대한 연구를 비롯하여 유전물질의 다양한 변형과 발현조절을 대용량 데이터를 활용하여 연구하는 분야를 일컫는다.

빅데이터 생물학 연구는 방대한 양의 유전체 및 전사체 정보를 분석하고 해석하기 위한 다양한 컴퓨터 프로그램 및 통계학적 활용 기술과의 융복합적 연구를 통해 현대 생명 과학 기술의
변화를 이끌고 있다.

이에 한국연구재단 기초연구본부는 ‘빅데이터 생물학 – 유전체 및 후성유전체’에 대한 연구동향 브리프를 발간했다(NRF R&D BRIEF 2021-20호/생명과학단)

 

■ 왜 주목받고 있나?

ㅇ 최근 DNA 및 단백질을 포함한 다양한 생체고분자 분석기술의 발전에 따라, 생명유전정보와 질병 사이의 관계에 대한 생물학적 정보가 급증하고 있다.

생체고분자는 살아있는 생물체에 의해 생성되는 중합체로, 단량체 분자들이 공유 결합으로 연결되어 큰 구조를 형성한다. DNA나 단백질은 뉴클레오타이드(nucleotide)와 아미노산 단량체가 모인 중합체이다. 생체고분자 중합체의 서열 정보는 DNA 유전정보와 큰 연관성을 가지고 있다. 특히 DNA 염기서열 분석을 통해 얻은 중합체 서열 정보는 현재 생체 빅데이터의 근본이 되고 있다.

ㅇ 인구고령화 및 빅데이터 생물학의 발달로 보건의료의 패러다임이 의료소비자인 개인맞춤형 의료로 변화하고 있으며, 이를 통해 질병에 대한 정확한 진단, 질병 조기 발견 및 예방이 가능할 것이라는 기대감과 함께 유전체 기반의 정밀의료에 대한 수요가 증가하고 있다.

정밀의료(precision medicine)는 환자마다 다른 유전적, 환경적 요인 등을 통합적으로 고려하여 환자에게 적정한 약과 용량으로 사용하는 의료서비스이다. 정밀의료와 맞춤의학을 혼용하여 많이 사용하고 있으나, 미 국립연구회의(National Research Council, 2016) 자료에 의하면 맞춤의학이 특정 개인을 위한 치료법이라는 오해 소지가 있어 정밀의료로 사용함을 권장하고 있다.

ㅇ 유전정보의 변화 없이도 유전자발현을 조절할 수 있는 후성유전학적 현상들에 대한 새로운 시각이 새롭게 주목받고 있으며, 이러한 현상들을 유전 현상과 연결하여 분석할 수 있는 새로운 후성유전체 분석방법에 대한 연구 필요성이 대두되고 있다.

후성유전학적 주요 기전으로는 DNA 메틸화, 히스톤 단백질 변형 및 비암호화 RNA의 역할 등이 알려져 있다. 이들의 변화를 전장 DNA 수준에서 연구하는 것을 후성유전체학이라고 한다. 전장 유전체 수준에서 후성유전학을 이해하기 위해서는 새로운 측면의 후성유전학적 기전들이 심도있게 연구되어야 하며, 이를 위해 2010년대 이후부터 주로 사용하기 시작한 next-generation sequencing 분석 기술과 함께 새로운 실험기술들의 개발이 지속적으로 필요한 상황이다.


■ 최근 많은 연구가 이루어지고 있나?

ㅇ 생물학 분야에서 빅데이터라는 용어는 최근 유전체 및 후성유전체 연구의 핵심 키워드로 자리 잡기 시작했는데, 유전체 및 후성 유전체 데이터는 빅데이터의 3대 요소라 할 수 있는 데이터의 규모(volume), 처리 및 저장속도(velocity), 데이터 종류의 다양성(variety) 3대 요소를 모두 포함하고 있다.

ㅇ 생물학 분야 빅데이터는 소위 차세대 시퀀싱 기술(NGS, Next Generation Sequencing)에 기반한 다양한 종류의 오믹스 데이터, 즉, 유전체학(Genomomics), 전사체학(transcriptomics), 단백체학(proteomics), 후성 유전체학(epigenomics) 및 대사 유전체학(metabolomics) 등의 연구를 통하여 얻어진 데이터를 포함한다.

ㅇ 유전체 및 후성 유전체를 포함한 생물학 분야의 빅데이터를 다양한 개인정보(유전정보, 생활습관 등)와 통합하여 정밀 맞춤 의료를 실현하고, 효율적인 진단 및 치료에 응용하고자 하는 헬스케어 시스템과의 결합을 추진하고자 하는 전 세계적인 노력이 가속화되고 있음. 

(1) 유전체 분야

ㅇ 1990년에서 2003년까지 진행되었던 인간유전체사업(human genome project)을 통한 인간표준게놈서열의 완성은 생물학 연구의 새로운 패러다임 전환을 가져왔다.

ㅇ 2000년대 중반 개발된 NGS 기술의 보급과 성장으로 인해 유전체 빅데이터 생산에 필요한 비용을 획기적으로 낮출 수 있게 되어, 연간 유전체 빅데이터 생산량이 페타(petabyte, 1015 byte) 수준으로 증가했고, 매년 2배 이상 증가하고 있다.

ㅇ 인간유전체사업을 통해 새로이 구축한 시퀀싱 기술과 컴퓨팅 기술, 그리고 유전체 기반 빅데이터를 분석하기 위한 생물정보학 방법론의 등장과 맞물려 유전체 연구는 전 세계적으로 생물학 연구의 필수적인 방법론으로 자리 잡았으며, 새로운 헬스케어에 대한 패러다임의 전환과 더불어 맞춤정밀의료 실현에 있어 핵심 분야로 인식된다.

ㅇ 아래 그림은 2013년부터 현재까지 진행된 유전체사업(Complete Genome Projects)을 통해 완성된 유전체의 수 및 유전체 사업의 수를 보여주는 도표로 드래프트 유전체까지 포함하면 한 해 평균 30,000건 이상의 유전체 서열이 완성되어 발표되고 있는 정도로 활발히 유전체 연구가 진행되고 있다(Genome Online Database, https://gold.jgi.doe.gov/statistics).

 

ㅇ 유전체 시장의 시퀀싱 가격 하락(인간유전체사업 10년 동안 하나의 표준 유전체 서열이 완성되었고, 이때 시퀀싱 비용이 약 10억 달러로 추산되고 있음. 현재는 하나의 유전체 서열 결정에 약 150만 원 이하의 비용)에 따라 더욱 급속도로 성장하고 있으며 결과적으로 시퀀싱 기반 산업의 눈부신 성장을 가져온 계기가 되었다.

ㅇ 유전체 빅데이터의 생산 및 분석은 신약개발, 질병의 초기 진단과 예방 국방, 농업, 수산, 식품, 환경, 에너지 등 거의 모든 산업 영역에 막대한 파급효과를 미칠 것으로 기대되어, 우리나라를 비롯한 여러 선진국에서 경쟁적으로 투자를 확대해 나가고 있는 상황이다.

ㅇ 사물기반 인터넷(IoT, Internet of Thing)과 유전체 정보의 융합 연구를 통하여 환자에 대한 다양한 정보(생활패턴, 바이털정보, 유전체정보)가 결부된 의료의사결정 시스템(Clinical Decision Supporting System)을 개발하고 있다.

(2) 후성 유전체분야

ㅇ ENCODE(Encyclopedia of DNA Elements)는 인간 유전체에 존재하는 유전자 발현 조절 요소의 위치와 기능을 밝히기 위한 대규모 프로젝트로, 9년 동안 진행되었고 2012년에 30편의 관련 논문이 발표되었으며 현재 수많은 연구들이 ENCODE 데이터베이스에 축적된 후성유전체를 참조하여 진행되고 있다.

ㅇ 우리나라는 국립보건원 질병관리본부 형질연구과에서 아시아 국가 최초로 국제인간후성유전체컨소시엄(IHEC)에 가입하여 한국인 당뇨/비만 등 만성질환 관련 타겟세포 유래 메틸롬, Chip-Seq, miRNA-seq을 포함하는 참조 에피유전체 지도 11종의 후성유전체 데이터를 생산하여 IHEC에 공개했다. IHEC은 2011년부터 6년간 전 세계 8개 국가의 9개 기관이 참여한 국제 컨소시엄으로 인간유전체사업 이후 최대 규모의 국제공동연구이다.

ㅇ 인간유전체 관련 기술에 대한 특허는 인간유전체사업 이후 폭발적으로 증가하였고, 현재까지도 꾸준히 증가하고 있는 상황이다. 미국의 출원 건수가 가장 많고, 일본과 영국도 활발하게 특허출원 진행 중이다. 우리나라의 경우도 꾸준히 증가하여 국내 유전체 관련 특허 중 질병 분석 관련 건수는 거의 1,000여 건에 이르는 것으로 추정된다.

 

■ 최근 국내․외 연구 동향은?

(1) 해외 연구 동향

▪ 암의 예방과 조기진단의 중요성이 커지면서 여러 암에 대한 진단검사가 가능한 제품도 개발되고 있다. Illumina는 다중 암 선별검사 제품인 Galleri를 출시 예정이며, Exact Sciences는 ctDNA와 단백질 바이오마커의 상관관계를 활용한 CancerSEEK이라는 다중암선별검사 제품을 개발 중이다.

▪ 2011~2020년까지 진행된 임상시험을 분석한 결과 임상 1상에서 최종 승인까지 성공률은 7.9%에 불과하지만, 유전체 및 후성유전체 분석에 기반을 둔 바이오마커를 활용하여 환자 군을 선별하면 성공률은 15.6%로 상승하게 된다고 알려졌다.

▪ 2010년 중반 이후 유전체 분석시장은 임상 서비스 시장으로 확대되기 시작했다. 암, 태아의 염색체 및 돌연변이를 찾기 위한 비침습적 산전검사(NIPT), 유전성질환검사, 질병예측검사, 개인 유전자 검사시장 등 다양한 제품 등장하기 시작했다. 이 과정에서 인바이테(NVTA US), 나테라(NTRA US), 가던트 헬스(GH US) 같은 유전체 임상 서비스 기업들이 새롭게 주목 받고 있다.

▪ Grandview Research에 의하면 글로벌 유전체 분석 시장은 2020년 40억 달러로 추정되며, 연평균 14% 성장하여 2028년에는 117억 달러 규모로 성장할 것으로 기대된다.

(2) 국내 연구 동향

ㅇ 유전체 및 전사체 정보 분석을 통해 질병의 발생 원인 및 진단 바이오마커로 사용할 수 있는 신규 유전자군의 발굴이 진행되고 있다.

ㅇ 유전체 및 전사체 정보 분석의 고도화 및 후성유전체 통합연구가 지속적으로 진행되고 있다.

ㅇ 포스트게놈 다부처 유전체 사업을 통한 유전체 연구 활성화 및 생체 유전체 빅데이터 분석을 위한 표준안을 마련 중에 있다. 

ㅇ 국내 유전체 정보 포털

 

■ 기초연구사업 지원 현황은?

ㅇ 지원과제 현황

ㅇ 성과현황

 

■ 향후 기초연구사업에서 어떤 연구들이 필요한가?

 

■ 기초연구사업 결과들이 원천기술 확보로 이어지려면?

 


댓글삭제
삭제한 댓글은 다시 복구할 수 없습니다.
그래도 삭제하시겠습니까?
댓글 0
댓글쓰기
계정을 선택하시면 로그인·계정인증을 통해
댓글을 남기실 수 있습니다.
주요기사