본문으로 바로가기 주메뉴 바로가기

사용자별 맞춤메뉴

자주찾는 메뉴

추가하기
닫기

간행물·통계

contents area

detail content area

임상적용을 위한 질병유전체 데이터베이스 소개
  • 작성일2017-01-26
  • 최종수정일2017-01-26
  • 담당부서형질연구과
  • 연락처043-719-8870
임상적용을 위한 질병유전체 데이터베이스 소개

질병관리본부 국립보건연구원 유전체센터 형질연구과
한소희, 문상훈, 김영진, 김봉조*
* 교신저자: kbj6181@korea.kr, 043-719-8870

Abstract

The Introduction of Disease Genomic Database for Clinical Practice

Division of Structural and Functional Genomics, Center for Genome Science, NIH, CDC
Han Sohee, Moon Sanghoon, Kim Young Jin, Kim Bong-Jo

It is becoming increasingly more common for clinicians to use genomic data in their practices for disease prevention, diagnosis, and treatment. Association studies aim to identify disease susceptible gene variants by comparing genetic variants between people with and without the disease of interest. Although over the past few years many associated variants have been identified and replicated via genome-wide association study (GWAS), the usage of systemic databases with GWAS results have been limited in clinical study. The systematic data of GWAS targeted for Koreans is needed to integrate genomic data into the practice of medicine.


들어가는 말

질병의 발생(또는 발병)에 영향을 주는 유전자(또는 유전변이)를 질병 감수성 유전자(susceptibility gene) 또는 질병 관련 유전변이(genetic variation)라 한다(이하 ‘질병 감수성 유전자’). 질병 감수성 유전자는 일반 인구에서 1% 이상으로 흔하게 나타나고, 질병을 일으킬 수 있는 가능성(투과도 또는 발현성, penetrance) 및 위험도(relative risk, attributable risk)가 작다[1]. 비록 하나의 감수성 유전자 자체가 질병에 미치는 영향력은 작지만, 수백 개 이상의 감수성 유전자가 함께 작용한다면 질병 발생에 상당히 큰 영향을 줄 수 있다. 환경요인과 유전요인 등의 복합적 상호작용을 통해 발생되는 만성질환의 경우 수백 개 이상의 감수성 유전자가 만성질환 발생에 관여하는 것으로 알려져 있다. 따라서 만성질환 관련 유전자 발굴을 통해 만성질환 발생 위험도를 예측함으로써 만성질환의 1차적, 2차적 예방 ‘1차 예방’은 질병이 생기지 않게 미리 막는 예방법으로 영양개선, 보건교육, 예방접종 등이 해당되며, ‘2차 예방’은 질병이 이미 발생한 개인에게서 질병이 더욱 진행하기 전에 조기 발견하여 치료를 하는 예방법으로 국민건강검진이 그 예임. 더불어 ‘3차 예방’은 질병이 이미 발생한 환자에게서 재활을 통해서 환자의 사회적 역할을 복구시켜 주거나 혹은 발전시켜 주는 것을 의미하며 재활치료가 그 예임
을 기대해 볼 수 있다.
최근 유전체정보를 이용한 정밀의료 ‘정밀의료’란 유전체정보, 진료․임상 정보, 생활습관 정보를 통합 분석하여 환자 특성에 맞는 적합한(맞춤형) 의료서비스를 제공하는 것을 말함[2]
에 대한 국내‧외 관심이 고조되고 있다. 이에 본 글에서는 정밀의료 실현을 위해 요구되는 질병유전체 데이터베이스에 대해 소개하고자 한다. 그리고 그에 앞서 데이터베이스의 자료가 되는 유전체연구의 필요성에 대해 설명하고자 한다.


몸 말

유전체연구의 필요성

혈액, 뇨 등 몸에서 채취 가능한 생체물질을 통해 단백질, DNA, 대사물질 등을 이용하여 몸 안의 변화를 알아낼 수 있는 지표(marker)를 바이오마커(biomarker)라고 한다[1]. 위험요인에 노출된 후에는 질병이 발생되기까지 ‘노출(exposure)–내부 용량(internal dose)–생물학적 영향 용량(biologically effective dose)–조기 생물학적 영향(early biological effect)-구조 또는 기능 변화(altered structure/function)-질병 발생(clinical disease)-예후 증상(prognostic significance)’의 일련의 과정을 거친다[1](Figure 1). 즉, 외부 노출을 통해 체내로 들어온 위험 물질의 일부(biologically effective dose)는 실제로 다양한 변화를 통해 질병으로 발전하게 되고, 이 과정에서 질병 감수성 유전자와 환경요인(들)이 복합적으로 작용한다. 당뇨병의 경우, 질병 발생 후에는 공복혈당 및 당화혈색소가 증가하는 예후 증상을 보인다. 그러나 이런 증상들은 질병이 발생한 이후에 나타나는 생리학적 변화의 측정값으로 질병의 1차적 예방을 위해서는 질병 발생 이전에 미리 위험도를 예측할 수 있는 질병 감수성 유전자와 같은 바이오마커가 필요하다.

만성질환의 주요 환경요인인 흡연, 음주, 불규칙한 생활습관 등은 인간의 의지로 조절이 가능하지만, 부모로부터 물려받는 유전정보는 우리 마음대로 선택할 수 없다. 따라서 질병의 진단, 예방 등을 위해서는 환경요인과 함께 자신이 어떤 질병에 대한 감수성 유전자를 가지고 있는지에 대한 정보를 확보하는 것이 중요하다.
최근 인간유전체 해독 완결 및 생물정보학 분석 기술의 발달을 통해 질병 발생에 대한 생물학적 지식의 퍼즐이 맞춰지고 있다. 첫 인간유전체 해독은 3조원과 10년의 세월이 걸렸지만, 오늘날 유전체 해독 기술은 약 100만원으로 일주일 이내에 모든 유전자를 해독해 낼 수 있다. 이러한 추세라면, 머지않아 모든 사람이 자신의 유전정보를 알 수 있게 되는 날이 오게 될 것이다. 그러나 질병 발생의 예측 및 예방은 인간의 유전체정보를 단순히 해독하는 것을 넘어 임상적용을 위한 과학적 근거자료를 충분히 확보해야만 가능하다. 즉, 유전체연구를 통해 질병별 감수성 유전자들을 확보하는 것이 요구된다.

질병유전체 데이터베이스 현황

유전체정보 기반의 데이터베이스들은 유전체정보 수집 방법에 따라 크게 4가지 형태–선별(curated), 예측(predictive), 문헌(literature), 그리고 통합(integrative) 자료로 나뉜다[3].
‘선별’ 자료는 특정 주제에 대한 자료를 수집 및 갱신하는 형태로, CTD(Comparative Toxicogenomics Database)와 UNIPROT(Universal Protein Resource) 및 GWAS Catalog가 포함된다[3, 4, 5](Table 1, 2). CTD는 화합물-유전자 상호작용, 화합물-질병 연관성, 유전자-질병 연관성, 화합물-형질(phenotype) 연관성에 대한 과학적 문헌을 제공하고, UNIPROT은 단백질의 생물학적 기능 정보를 제공한다. 그리고 GWAS catalog는 미국 국립인간유전체연구소(National Human Genome Research Institute, NHGRI)와 유럽 생물정보학연구소(European Bioinformatics Institute, EBI)가 공동으로 작업하여 만든 전장유전체연관성분석(genome-wide association study)에 대한 일람표로써 연구저널의 데이터를 기반으로 인간의 다양한 질병 및 형질과 관련된 유전변이 정보를 제공한다.
‘예측’ 자료는 통계적 추정치에 기반한 헝태로 마우스 모델에 대한 유전체 및 생물학적 기능 정보를 제공하는 MGD(Mouse genome Database), 마우스, 쥐, 사람의 주석(annotation) 정보를 제공하는 RGD(Rat genome Database), 멘델리안 질환 연관 유전변이에 의한 질병 정보를 제공하는 OMIM(Online Mendelian Inheritance in Man), 참조유전체 맵핑을 통해 인간 돌연변이 예측에 대한 정보를 제공하는 Ensembl SIFT Tool이 포함된다[3, 5](Table 1, 2).

‘문헌‘ 자료는 문헌, 논문, 도서, 학위논문, 그리고 유전자-질병 데이터베이스에 기반한 형태로 인간의 유전체 연관성 연구결과를 정리한 GAD(Genetic Association Database), 텍스트 마이닝기법을 이용하여 유전자-질병 관련성에 대한 정보를 추출‧정리한 LHGDN(Literature-derived human gene-disease network), 의학논문들을 제목, 저널 등 검색용 인덱스로 체계적으로 정리한 MEDLINE에 등재된 논문 초록들로부터 유전-질병 연관성에 대한 자료를 추출‧정리한 BeFree Data가 포함된다[3, 5](Table 1, 2).
그리고 ‘통합’ 자료는 질병의 기능적 분석을 위한 정보를 제공하는 데이터베이스로 인간 유전질환에 대한 정보를 제공하는 DisGeNET(Gene Disease Association Database)가 대표적이다[3, 5](Table 1, 2).
이 중 유전체 연구 분야 연구자들이 유용하게 사용하는 데이터베이스는 사이트 접속이 용이하고, 등록 정보가 많은 OMIM, GAD, DisGeNET, 그리고 GWAS Catalog이다.


맺는 말

질병 감수성 유전자들이 임상에 사용되기 위해서는 과학적 근거 및 임상적 효용성이 입증되어야 한다. 전장유전체연관성분석(GWAS) ‘전장유전체연관성분석‘이란 대용량의 유전체정보와 임상·역학변수를 분석하여 질병 또는 형질과 연관된 유전변이를 발굴 및 검증하는 것임
등을 통해 많은 질병 감수성 유전자들이 발굴되고 있지만 진단, 치료 등 실제 임상에 사용되는 질병 감수성 유전자들은 일부 암, 약물유전체 치료 등 극히 일부에 불과하다. 그 이유는 임상에의 활용 전 전이·이행연구 ‘전이·이행연구’란 임상에 적용하기 전 기초연구 결과를 활용하여 임상 적용 가능성을 평가하는 것을 말함. 예를 들어 임상에서의 요구(need)를 조사하고, 기초연구를 토대로 in vitro/in vivo연구를 진행함. 이때, 도출된 in vitro/in vivo data가 임상에서의 요구에 적합한지를 평가하는 단계를 전이·이행 연구 또는 중개연구(translation study)라고 함
차원에서 사용할 만한 질병 감수성 유전자들이 어떤 것이 있고, 어떤 연구 설계 방법을 통해 발굴되었는지 등 그 신뢰성을 판단할 수 있는 체계화된 자료가 부족하기 때문일 것이다.
인간 대상 유전체 연구결과들을 체계적으로 정리한 데이터베이스 중 가장 많은 정보가 등록되어 있는 것은 전장유전체연관성분석 일람표(GWAS Catalog)이다. GWAS Catalog에는 심혈관계질환, 대사성질환, 암 등 17개의 카테고리로 분류된 질병이 포함되어 있고, 2016년 12월 현재, 약 2천 3백 개의 연구 논문 데이터에 대한 결과로, 유의확률(p value) ‘유의확률(p value)’이란 검정통계량의 유의성 정도(significance)를 확률값으로 나타낸 것임
1 x 10-5 이하의 유의성을 갖는 약 2만 6천 개 이상의 단일염기다형성(SNP) ‘단일염기다형성(Single nucleotide polymorphism, SNP)’이란 DNA 염기서열에서 하나의 염기서열(A, T, G, C)의 차이를 보이는 유전적 변화 또는 변이를 말함
에 대한 질병 및 형질과의 연관 관계 정보가 정리되어 있다[4]. 국내에는 아직 GWAS Catalog 수준의 한국인 질병 연관 유전자(또는 유전변이) 정보가 정리된 데이터베이스가 없다.
이에 국립보건연구원 유전체센터 형질연구과에서는 한국형 GWAS Catalog 구현을 목적으로 내부연구과제-‘제 2형 당뇨병 연관 유전변이가 한국인에 미치는 유전적 효과 분석’ 연구를 수행하였다. 한편 국립보건연구원 유전체센터에서는 2014년에 한국인 맞춤형 유전체칩(한국인칩)을 제작완료하고, 2018년까지 한국인칩을 이용하여 약 18만 명의 대규모 한국인 유전체정보 생산 계획을 추진하고 있다. 형질연구과는 연구의 일환으로 GWAS catalog 등 공개 데이터베이스를 통해 제공된 유전변이(들)의 유전 효과를 한국인칩을 통해 생산된 유전체정보를 활용하여 재검증하고 있다. 2016년에는 제 2형 당뇨병에 한정하여 연구가 수행되었으며, 2017년부터 고혈압, 비만 등 질병을 확대하여 임상적용을 위한 기반자료를 확보하고, 그 결과는 데이터베이스 형태로 정리하여 논문·웹을 통해 공개할 계획이다. 한국형 GWAS Catalog는 한국인에서 나타나는 질병 감수성 유전자들에 대한 정보를 제공해줌으로써 기능 검증을 위한 유전변이 선별 및 임상적용을 위한 기반자료로 활용이 가능하며, 궁극적으로 유전체정보 기반의 정밀의료 실현을 위한 근거정보의 초석이 될 것으로 기대된다.


<참고문헌>

1. Schulte, P., et al. (1993). Molecular Epidemiology: Principles and Practice. Academic Press
2. 김 등. (2015). 정밀의료(Precision Medicine)-정밀의료(유전체 연구) 관련 동향 및 전망 - 컨트롤 타워 마련과 우수한 보건의료 인프라 적극 활용해야, 보건산업동향
3. https://en.wikipedia.org/wiki/Gene_Disease_Database#Curated_databases
4. Danielle W., et al. (2014). The NHGRI GWAS Catalog, a curated resource of SNP-trait associations. Nucleic Acids Res, 42(Database issue), D1001 - D1006
5. http://www.disgenet.org/web/DisGeNET/menu/dbinfo
본 공공저작물은 공공누리  출처표시+상업적이용금지+변경금지 조건에 따라 이용할 수 있습니다 본 공공저작물은 공공누리 "출처표시+상업적이용금지+변경금지" 조건에 따라 이용할 수 있습니다.
TOP