본문으로 바로가기 주메뉴 바로가기

사용자별 맞춤메뉴

자주찾는 메뉴

추가하기
닫기

간행물·통계

contents area

detail content area

유전체학 대사체학을 만나다: 대사체를 동반한 전장유전체연계분석
  • 작성일2014-10-08
  • 최종수정일2014-10-08
  • 담당부서감염병감시과
  • 연락처043-719-7166
유전체학 대사체학을 만나다: 대사체를 동반한 전장유전체연계분석
Genomics meets Metabolomics: Genome-wide association studies with metabolome

질병관리본부 국립보건연구원 유전체센터 형질연구과
이헌식, 김연정
Abstract


Genome-wide association study (GWAS) is a powerful tool for investigating the genetic components of phenotypes or the causes of diseases using SNP data. This approach has identified numerous genetic loci that are associated with specific phenotypes including diseases. Despite the great success of many GWASs, the number of genetic mechanisms that have been identified to explain the phenotypes has not increased significantly. Moreover, the effect size of genetic associations with clinical phenotypes is often small. Recently, integrated ‘-omics’ approaches are providing a new logical framework to overcome the current limitation of GWAS. Metabolomics is one of the newest ‘-omics’ science that reflects the functional end-point of biological processes triggered by genetic information and various external influences. The use of metabolomics as a functional readout of the physiological state of phenotypes has enabled the discovery of previously undetected biological mechanisms between diseases and metabolic pathways. Thus, metabolomics has emerged as a useful tool to complement GWAS. By combining GWAS with metabolomics as a phenotyping tool, mGWAS enables the simultaneous analysis of the genetic and environmental effects on a homeostatic imbalance and also provides new insight into genetic mechanisms of diseases that is required for personalized medicine. This article introduces the limitation of GWAS, the development of metabolomics, and the latest mGWAS trends as well as a brief presentation of our ongoing study using mGWAS in complex disease.


I. 들어가는 말

  유전체학(Genomics)은 생명체의 유전정보를 담고 있는 유전자(Deoxyribonucleic acid, DNA)의 구조와 기능을 연구하는 학문이다. 인간지놈 프로젝트(Human genome project) 종료 후, 거대 유전체 데이터와 표현형(Phenotype)과의 연계성을 설명하기 위해 효과적인 유전체 분석방법의 필요성이 부각되었다. 2002년 Ozaki 그룹에서 최초로 전장유전체연계분석(Genome-Wide Association Study, GWAS)법을 소개한 이후, 많은 연구그룹에서 유전체 연구를 위해 동일한 방법을 사용하여 유전체 전장에 걸쳐 질병을 포함한 다양한 표현형에 영향을 미치는 유전자 변이를 대량으로 발굴하였으며, 그 결과를 지표(마커)로 GWAS catalog에 수록하였다. 그러나 GWAS로부터 얻은 질병관련 유전 변이들은 유전적 요인으로써 질병에 걸릴 위험성이 있다는 것을 경고해 줄 수 있지만, 그 위험성이 대부분 높지 않을 뿐만 아니라 질병의 원인에 대한 설명을 충분히 하지 못한다는 제한점을 드러내기 시작했다[1]. 이러한 한계를 극복하고자, 변이에 대한 기능을 실험적으로 증명하는 것과 함께 다른 오믹스(Omics) 분야와의 연계분석을 시도하는 연구가 활발히 진행되고 있는 추세이다. 대사체학(Metabolomics)는 오믹스의 한 분야로서 생체내의 저분자 대사산물(Metabolites)을 포괄적으로 해석하여, 대사체(Metabolome)를 다양한 표현형과 관련지어 대사체 네트워크를 총체적으로 이해하는 학문이다. 최근 대사체와 GWAS의 연계분석(mGWAS)을 통해 표현형 결정에 중요한 영향을 미치는 생물학적 기전과 질병의 원인을 설명하는데 보다 향상된 정보를 제공할 수 있다는 결과들이 보고되고 있다.

이 글에서는 mGWAS의 최신 연구동향과 함께 국립보건연구원의 형질연구과에서 진행 중인 연구에 대해 간략하게 소개하고자 한다.

II. 몸말


mGWAS 출현 배경-GWAS의 한계점 극복
  GWAS는 유전체 전체를 본다는 의미에서 “전장유전체(Genome-wide)”라는 표현을 사용하며, 유전체 전체에 걸쳐 대규모 연구를 할 수 있게 되었다는 점에서 큰 의미가 있다. 기본적으로 GWAS는 진화적 측면에서 인류 집단에 보편적으로 발생할 수 있는 질병(Common disease)의 원인을 인류 집단의 유전정보 전체에서 보편적으로 발견되는 변이(Common variant)로 설명할 수 있다는 가설을 전제로 한다. 이러한 가설을 기초로, 많은 연구 그룹에서 지난 10년 동안, 대규모 인구집단을 대상으로 GWAS를 수행 하였다. 2014년 현재, 미국 국립유전체연구소의 GWAS 데이터베이스에 등록된 연구논문의 수는 총 1,751개이며, 총 11,912 유전자표지자(Genetic marker)가 질병을 포함한 다양한 표현형과 연계되어 있는 것으로 보고되었다[2]. 그러나 많은 연구결과의 축적에도 불구하고, GWAS가 질병이나 특정 표현형을 갖는 집단의 유전적 구조를 이해하는 데는 도움이 되겠지만, 질병의 유전적 원인을 규명하거나 질병 치료 및 예방과 같은 실제적인 분야에서는 그 역할이 제한적일 것이라는 우려의 목소리가 높아지고 있다[1]. 이러한 GWAS의 한계점은 다음과 같다. 첫째, GWAS 연구를 통해 얻어진 다수의 질병관련 변이정보가 기능을 할 수 있는 유전자와 연결되어 질병의 원인으로서 생물학적 기작을 명확히 설명하지 못하는데 있다. 둘째, GWAS는 common variant로 단일 염기 다형성(SNP)을 주로 사용하는데, 이외에 복제수변이(Copy number variation, CNV)나 염기서열 삽입/결실(Insertions/deletions, INDELs)과 같은 유전체구조 변이(Structural variations) 역시 질병의 유전적 원인으로 작용함에도 불구하고 이들에 대한 고려는 하지 않고 있다. 셋째, GWAS는 방법적으로 직접적인 질병 유발 유전변이(Causal variant)나 빈도가 낮은 유전변이(Rare variant)를 발굴하기 어렵기 때문에, 인구 집단에서 광범위하게 존재하지 않는 희귀 변이의 경우에는 원인 설명이 어렵다. 넷째, 여러 가지 질병이 혼합되어 있는 표현형임에도 불구하고, 기술적 한계로 단일 표현형으로 취급하여 GWAS 분석을 수행하는 오류에서 오는 한계이다.

이러한 GWAS의 한계점을 극복하기 위해 다양한 연구들이 시도되고 있다. 가장 대표적인 것이 차세대 염기서열 해독방법(Next Generation Sequencing, NGS)을 활용하여 희귀 변이를 발굴하거나, 실험실에서 유전자 편집(Genome editing)기술을 이용해 유전자 변이를 조작하여 초래되는 기능을 밝히는 방법 등을 들 수 있다. 이와 더불어, 최근에는, 전사체(Tranome, eQTL), 단백체(Proteome, pQTL), 대사체(Metabolome, mQTL) 등 다양한 오믹스(Omics)분야와 연계분석을 통해 영향력을 추적하는 방법 등이 활발히 추진되고 있다(Figure 1). 특히, 대사체의 경우 생명현상을 유지하기 위한 최종 단계에 생성되는 물질로서, 유전자 발현과 단백체 변화의 분석만으로 해석할 수 없는 생체 내 생물학적 시스템의 변화를 감시할 수 있다는 장점이 있다.

mGWAS 출현 배경-metabolome의 도약
  대사체(Metabolome)는 생체의 세포, 조직, 기관, 생체액 안에 존재하는 모든 작은 분자량(10-100 Da)을 갖는 대사산물(Metabolites)의 집합체를 뜻한다. 전사체나 단백체 분석결과가 하나의 세포나 조직 안에서 일어나는 모든 생리현상에 대한 설명을 할 수 없음에 비해, 대사체는 해당 세포의 모든 생리적 상황에 대한 실제적 스냅샷을 제공할 수 있을 뿐 아니라, 연구대상이 되는 생체내 대사체 표적수가 다른 오믹스 분야의 그것보다 적어 분석이 용이하다는 장점이 있다. 하지만 유전체와 전사체, 그리고 단백체의 경우 핵산(Nucleic acids)이나 단백질이 분석 대상이기 때문에 분석법의 단일화와 자동화가 가능하였지만, 대사체에서는 대사산물들의 성질에 따라 화학적 다양성이 풍부하여 전체를 분석하기 위한 단일화 및 자동화 방법이 적용되기 어려웠다. 그러나 2000년대 중반 이후 괄목할만한 기술적 발전에 힘입어 최첨단 극미량 질량분석기기와 통계기술이 대용량 대사체 분석에 적용 될 수 있었으며, 이러한 특성을 이용하여 질병, 신약개발, 독성 및 환경, 그리고 미생물 등 다양한 분야에 걸쳐 대사체가 활용되기 시작하였다. 특히, 질병분야에서는 질병관련 대사산물이나 대사체의 검출 및 대사경로를 규명하고, 정상상태의 대사체 프로파일과 비교함으로써 질병을 조기진단 할 수 있는 질병진단 표지물질 발굴을 가능하게 하였다[4].

대사체를 프로파일하기 위해 사용되는 방법은 비표적화(Non-targeted)방법과 표적화(Targeted)방법으로 나눌 수 있고, 핵자기공명장치(Nuclear magnetic resonance spectroscopy, NMR)와 질량분석장치(Mass spectroscopy, MS)를 주로 이용한다. 표적화 방법은 비표적화 방법에 비해 한정된 특정 대사체만을 분석 가능하다는 단점이 있으나, 대사체의 정성 및 정량이 가능하다는 장점이 있다. 최근에는 한 번의 분석으로 수백 개 이상의 대사체를 동시에 정량분석 가능한 multiple reaction monitoring(MRM) 방법이 적용되면서, 표적화 방법에서 high-throughput 연구가 가능한 플랫폼이 개발되어 상용화되었으며, 대사체 연구에 활용되고 있다(Figure 2).

대사체는 유전학의 센트럴 도그마(Central dogma)에 따라 수직적으로 유전자가 전사와 번역 과정을 통해 만든 단백질에 의해 영향을 받기도 하지만, 생활습관이나 노화 등 환경적 요인에 의해서 더 많이 영향을 받는 것으로 알려져 있기 때문에, 유전적 요인과 환경적 요인의 특성을 모두 포함하고 있는 중요한 생체지표이다. 따라서 이러한 대사체 정보와 GWAS의 유전체 정보간의 조합은 질병을 포함한 표현형 규명에 상당한 실마리를 제공할 수 있다.

mGWAS 최신 연구동향
최근에, 여러 연구 그룹에서 유전형과 표현형과의 낮은 상관관계를 보이는 GWAS 결과의 유전적 설명력(잃어버린 유전력; missing heritability)을 높이기 위한 방법으로 GWAS 분석에 혈당, 지질, 아미노산, 그리고 호르몬 등의 대사산물을 형질로 사용하여 mGWAS를 시도하였다. 그 결과, 유전 변이들의 표현형에 대한 설명력을 높일 수가 있었으며, 생물학적 기능과 기작을 밝혀내기도 하였다. 2008년 Gieger 팀에서 최초로 mGWAS 연구를 보고한 이후 현재까지 수십여 편의 논문들이 발표되었다(Table 1). Gieger는 284명의 실험참가자를 대상으로 혈청에서 정량한 364개 대사체와 유전형 정보(187,454 SNPs)를 연계 분석한 결과, 관측된 전체 유전 변이중 18% 이상의 유전 변이가 대사체를 통해 기능 설명이 가능하였으며, 유전형에 따라 혈청 대사체의 농도 차이가 나는 것을 보고하였다[5]. Illing의 보고서에서 1,809명의 유전형 정보(517,480 SNPs)와 163개의 대사체에 대해 대사체 농도 및 농도비로 mGWAS를 수행한 결과, 대사체와 높은 상관관계를 보이는 8개의 유전변이를 발굴하였으며, 이들 중 상당수가 지질이상, 비만, 당뇨와 같은 만성복합질환과 관련성이 있다는 것을 대사체를 통해 설명하였다[6]. Suhre는 mGWAS 연구를 통해 solute carrier family 16 member 9 (SLC16A9)에 표지된 유전변이의 생물학적 기능이 세포내 카르니틴(Carnitine)의 수송(Transporter)과 관련된 역할을 한다는 것을 규명하기도 하였다[7]. 이외에도, Kettunen과 Rhee도 mGWAS를 통해 개인이나 집단 간에 나타나는 대사체의 차이가 임상요인과 별도로 유전변이와 같은 유전적 요인에 의해서 높은 수준으로 발생된다고 보고하였다[8.9].

이와 같이, mGWAS 연구가 질병의 원인이나 표현형의 차이에 대한 유전적 영향력을 이해하는데 훌륭한 정보를 제공함에도 불구하고, 여전히 GWAS에 비해 생산된 대사체 데이터의 양이 충분하지 못하며, 대사체-효소간의 상호조절 관계에 대한 충분한 정보가 축적되지 않았기 때문에 결과를 해석하는데 어려운 부분들이 남아 있다. 이러한 문제점은 대사체 데이터 생산을 위한 대용량-고효율 표적화 연구비용이 저렴해짐에 따라 다양한 시료로부터 많은 대사체 데이터 생산이 가능하게 될 것이고, 이로 인해 축적되는 대사체 데이터의 추가 분석에 의해 점진적으로 해결될 것으로 예측된다. 더 나아가, mGWAS 분석과 추가적인 오믹스 데이터와의 포괄적시스템 생물학분석법(comprehensive systems biology based approach)을 통해 질병의 근본적인 원인을 규명하고, 치료와 예방에 보다 진보된 정보를 제공할 수 있을 것으로 기대된다.

복합질환에서 mGWAS 연구 진행상황
형질연구과에서는 2007년 이후 지역사회 기반 코호트와 정상군/환자군에 대한 GWAS 연구를 수행하여, 다양한 표현형 및 질환 관련 유전자 변이를 선별하였으며, 이를 저명한 저널에 보고하였다. 현재 진행하고 있는 mGWAS연구는 2009년 Nature genetics에 보고한 GWAS 결과[11]를 기반으로, 양적형질(Quantitative traits)의 지표로 발굴된 유전변이에 대해 대사체와의 연계분석을 수행하고 있다. 대사체 분석은 GWAS 연구에 참여한 동일인의 혈청 시료에 대해 Biocrates사 플랫폼을 사용하여 표적화 방법으로 진행하였다.

액체크로마토그래피 질량분석기(LC-MS/MS)와 흐름주입분석법 질량분석기(FIA-MS/MS)를 이용하여 혈청에서 총 186개의 대사체를 uM 범위내에서 정량하였으며, 품질관리시료(Quality control samples)와 표준시료(Reference samples)를 활용하여, 품질관리기준에 적합하게 도출된 130여개의 대사체를 GWAS와의 연계 분석에 사용하였다. 그 결과, 양적 형질과 관련된 유전형에 따라 혈청 내 농도 차이를 보이는 대사체 6종을 확인하였다(Figure 3). 이러한 결과는, 기존에 GWAS로부터 나온 유전변이에 대해 표지하고 있는 유전자를 추적하여 기능을 예측하는 결과에서 더 나아가 직접적으로 유전변이에 의해 차이가 나는 대사체를 확인할 수 있음으로써 GWAS 결과에 대한 설명력이 높아졌다는 것을 의미한다고 볼 수 있다. 추후, 형질연구과에서는 당뇨 등 만성복합질환으로부터 생산된 GWAS 결과와 대사체와의 연계 분석을 통해 질환관련 유전변이 질환의 관련성을 밝히는 연구를 수행할 것이며, 이는 많은 연구자들이 필요로 하는 오믹스 통합 분석을 위한 기반 마련에 활용될 수 있을 것으로 예상한다.

III. 맺음말


  생명현상의 시작을 연구하는 유전체 연구의 대표적 방법인 ‘GWAS’와 생명현상의 최종단계로 나타나는 표현형과 가장 가까운 ‘대사체’와의 만남은, 유전적 요인과 환경적 요인에 영향을 받아 나타나는 질병을 포함한 표현형 규명에 꼭 필요하며, 이러한 요구로 인해 mGWAS 방법이 등장하게 되었다. 그 동안의 mGWAS의 연구는 충분하지 못한 데이터양과 제한적인 분석 방법을 사용하였음에도 불구하고, 표현형에 대한 유전적 영향력을 대사체를 통해 설명 가능하게 하였으며, 몇몇 만성복합질환의 유전적 위험인자의 기능과 기작을 밝히는데 도움을 주고 있다. 점진적인 기술발전으로 저비용․고효율의 거대 대사체 데이터가 생산 가능함에 따라, 유전체-대사체 그리고 다른 오믹스와의 통합분석이 더욱 활발히 수행될 것으로 예상되며, 이를 통해 다양한 질병에서 유전적 및 환경적 질병위험인자를 규명할 수 있게 됨으로써 질병의 예방과 치료에 널리 활용될 수 있을 것이다. 형질연구과에서는 이러한 시대적 흐름에 발맞추어 수년간 집중적으로 수행해온 유전체연구에 대사체를 접목시키는 방법을 통해 유전체-대사체-질병과의 상호조절 관계를 설명할 수 있는 생물학적 기전을 밝히고자 노력하고 있으며, 이러한 결과는 곧 다가올 개인맞춤의학을 위한 중요한 정보로 사용될 것으로 기대한다.

IV. 참고문헌


1. McClellan, J., & King, M. C. 2010. Genetic heterogeneity in human disease. Cell, 141(2):210-217.
2. Welter, D., MacArthur, J., Morales, J., Burdett, T., Hall, P., Junkins, H., et al. 2014. The NHGRI GWAS Catalog, a curated resource of SNP-trait associations. Nucleic Acids Res, 42:D1001-1006.
3. Arbona, V., Manzi, M., Ollas, C., & Gomez-Cadenas, A. 2013. Metabolomics as a tool to investigate abiotic stress tolerance in plants. Int J Mol Sci, 14(3):4885-4911.
4. Raamsdonk, L. M., Teusink, B., Broadhurst, D., Zhang, N., Hayes, A., Walsh, M. C., et al. 2001. A functional genomics strategy that uses metabolome data to reveal the phenotype of silent mutations. Nat Biotechnol, 19(1):45-50.
5. Gieger, C., Geistlinger, L., Altmaier, E., Hrabe de Angelis, M., Kronenberg, F., Meitinger, T., et al. 2008. Genetics meets metabolomics: a genome-wide association study of metabolite profiles in human serum. PLoS Genet, 4(11):e1000282.
6. Illig, T., Gieger, C., Zhai, G., Romisch-Margl, W., Wang-Sattler, R., Prehn, C., et al. 2010. A genome-wide perspective of genetic variation in human metabolism. Nat Genet, 42(2):137-141
7. Suhre, K., Shin, S. Y., Petersen, A. K., Mohney, R. P., Meredith, D., Wagele, B., et al. 2011. Human metabolic individuality in biomedical and pharmaceutical research. Nature, 477(7362):54-60.
8. Kettunen, J., Tukiainen, T., Sarin, A. P., Ortega-Alonso, A., Tikkanen, E., Lyytikainen, L. P., et al. 2012. Genome-wide association study identifies multiple loci influencing human serum metabolite levels. Nat Genet, 44(3):269-276.
9. Rhee, E. P., Ho, J. E., Chen, M. H., Shen, D., Cheng, S., Larson, M. G., et al. 2013. A genome-wide association study of the human metabolome in a community-based cohort. Cell Metab, 18(1):130-143,
10. Dharuri, H., Demirkan, A., van Klinken, J. B., Mook-Kanamori, D. O., van Duijn, C. M., t Hoen, P. A., et al. 2014. Genetics of the human metabolome, what is next? Biochim Biophys Acta, doi:10.1016.
11. Cho, Y. S., Go, M. J., Kim, Y. J., Heo, J. Y., Oh, J. H., Ban, H. J., et al. 2009. A large-scale genome-wide association study of Asian populations uncovers genetic factors influencing eight quantitative traits. Nat Genet, 41(5):527-534.
본 공공저작물은 공공누리  출처표시+상업적이용금지+변경금지 조건에 따라 이용할 수 있습니다 본 공공저작물은 공공누리 "출처표시+상업적이용금지+변경금지" 조건에 따라 이용할 수 있습니다.
TOP