contents area
주간건강과질병
detail content area
코호트 기반의 유전가능성 연구 기반 구축
- 작성일2012-11-30
- 최종수정일2012-11-30
- 담당부서감염병감시과
- 연락처043-719-7179
코호트 기반의 유전가능성 연구 기반 구축
Infrastructure for estimation of heritability based on Korean cohort
Infrastructure for estimation of heritability based on Korean cohort
질병관리본부 국립보건연구원 유전체센터 형질연구과
이주영
이주영
Ⅰ. 들어가는 말
국내인구의 노령화로 인하여 전체 질병 분포에서 당뇨, 고혈압 등의 만성질환이 차지하고 있는 비율이 점점 더 증가하고 있다. 따라서 만성질환 발생에 관여하는 요인들에 대한 추적조사 연구의 필요성이 대두되고 있다. 이와 더불어 유전체 연구는 햅맵프로젝트(Hapmap,'02) 이후 유전체정보가 추가되면서 질환의 원인을 규명하고자 질환 또는 위험요인에 대한 유전체정보를 기반으로 전장유전체연관 연구결과(Genome-wide association study)가 지속적으로 발표되고 있다. 이러한 전장유전체연관연구는 지역이나 인종에 따라 다양하게 나타나고 있어 국내에서도 많은 연구 결과들이 발표되고 있다.
그러나 예를 들어 신장(height)에 대한 최근 전장연관성분석 결과에서 100개 미만의 SNP(Single Neucleotide Polymorphism) 마커들이 유의하게 나타났으나, 이러한 마커들이 단지 10% 미만으로 설명하고 있는 실정이다. 크론병(Crohn's disease)인 경우는 유전체연관 연구 결과가 30개미만의 로커스(locus)가 유의하게 나타났으나, 전체적인 유전가능성을 10% 미만으로 설명하고 있다. 최근 이러한 이슈로 위험요인의 유전가능성 추정(estimation)이 중요한 연구 분야의 하나로 집중연구가 필요함을 제안하는 많은 논문들이 발표되었다.
국내에서도 이러한 설명되지 않는 유전가능성(missing heritability)에 대한 문제점을 보완하기에는 아직 많은 연구가 필요한 상황이나 집중화 되지 못하여 국가적 유전가능성 연구기반을 갖추기 위하여 지속적으로 노력하고 있다.
질병관리본부 유전체센터 형질연구과에서는 유전체역학조사사업(2001)을 통해 확보된 코호트를 대상으로, 한국인유전체분석기반연구사업을 통하여 유전체정보(Single nucleotide polymorphism, SNP)를 생산하였다. 이러한 관련 자료를 통하여 각 건강관련 지표에 관한 유전가능성(heritability)을 추정(estimation)하고자 하였으며, 국내 실정에 맞는 한국인 특이적인 각 요인에 대해 유전적 경향에 대한 기반을 구축하고자 하였다.
따라서 유전체센터에서는 가족데이터(Family-based)와 인구집단 데이터(Population-based)를 이용하여 유전가능성을 추정하는 방안들을 비교하고 국내 데이터에 적정한 추정방안을 찾아내고자 하였으며, 본문에서는 쌍둥이-가족 코호트와 지역사회코호트에 대하여 신장과 비만에 관련한 유전가능성을 추정 하고, 그 결과를 비교분석하였다.
Ⅱ. 몸 말
유전적 경향을 추정하기 위해서는 부모-자식의 최소 트리오의 자료가 필요하나 인구집단기반(population-based)의 자료를 이용하여서도 추정할 수 있는 분석방안이 개발되어 유전가능성을 추정하였다.
가족기반의 자료로는 정상 건강인을 대상으로 하는 쌍둥이-가족(Healthy Twin-Family) 코호트(2,473명)에서 지노타입 정도관리를 통하여 1,861명의 대상을 선정 임상·역학 및 지노타이핑(genotyping) 자료를 확보하였으며, 인구집단기반의 자료로는 지역사회코호트(KARE: Korea Association REsource)를 선정하여 8,842명의 유전체자료를 생산하였다.
유전가능성이란 연속적으로 형질이 다른 개체가 태어나는 양적 형질이 그 중 어느 정도의 비율로 다음 대에 유전되는지를 나타내는 양을 말하는 것으로 표현형 분산과 유전변이가 차지하는 분산을 비율로 나타내며 식은 다음과 같다.
여기서 유전가능성은 분산의 비(ratio)이며, VG는 유전변이에 의한 분산, VE는 환경변이에 의한 분산을 나타내는 것이다. 현재는 임상·역학요인 중 연속형 위험요인만 추정이 가능한 단점이 있으나, 기 확보된 유전체전장정보를 기반으로 유전가능성 추정방법을 보완함으로써 유전적 변이에 따른 추정가능성을 타진하여 왔다. 이러한 유전가능성에 대한 추정은 부모에서 나타난 성향이 멘델리안법칙을 따라 잘 표현된다는 가정이 성립되어야 하며, 이러한 성향의 변이(variant)가 잘 측정된다는 가정이 성립되어야 추정이 가능하나 이러한 가정도 매우 엄격한 가정이다.
가족데이터를 이용하여 유전가능성을 추정하는 선형복합모델(linear mixed model)을 이용하여 개발된 SOLAR (Sequential Oligogenic Linkage Analysis Routines), SAGE(Statistical Analysis of Genetic Epidemiology), GCTA(Genome-wide Complex Trait Analysis)의 프로그램을 사용하였다. 보정변수는 보건 분야의 자료가 연령과 성별에 따라 위험요인별 유전가능성의 차이가 있을 거라는 가정 하에 성별(Sex), 연령(Age) 변수를 기본적으로 사용하였으며 기존에 발표한 논문(Sung, 2010, Breast Cancer Res Treat)에서도 적용하고 있어 이를 보정하여 유전가능성을 추정하였다.
분석 프로그램 SOLAR를 이용하여 아래 유전가능성을 추정한 결과를 살펴보면(Table 2) 일란성 쌍둥이를 구분하여 가중치를 주는 모형으로 분석한 결과 신장(height)이 0.92로 유전가능성이 가장 높게 나왔으며, 쌍둥이가 동일정보임을 감안해 한명을 삭제하고 결과 값에 각 쌍둥이에 대한 평균값으로 대체하여 유전가능성을 추정한 결과 유전적 성향이 75%로 나타났다.
위 결과를 비교해보면 가족의 구조에 따라 구성원의 비에 따라 각 위험요인에 대한 유전가능성 추정의 결과가 차이가 많이 나며(0.92->0.75), 더욱이 쌍둥이 자료에 따라 가중치가 강하게 주어지면서 과 추정되는(over-estimation) 결과를 보여주는 것을 알 수 있다.
SAGE나 GCTA는 유전가능성을 추정하는 방법의 하나로 첫째는 가족정보(Pedigree information)를 이용해 가족 내 개개인간의 상관성(Correlation)을 추정하여 유전가능성을 계산하며, 이 방법은 가족데이터에서만 사용가능하다. 둘째는 유전정보를 이용해 유전적 상관성(genotypic correlation)을 추정하여 유전가능성 계산하는 방법(가족기반자료와 군집기반자료 둘 다 사용 가능)이다. 두 가지 방법 모두 고려하여, 정확한 유전가능성 결과를 추정하였으며, 또한 군집기반 자료에서의 유전가능성에 대한 확대연구를 진행하고 있다.
이때 적용되는 Linear mixed effect 통계모형은 다음과 같다.
Χ : 공변량(Sex, Age 사용)
μ : SNP 효과의 벡터
W : 2(Kinship matrix) or Genotype matrix
여기서 에 대한 분산을 추정하여 genotypic variance를 구하고 유전가능성을 구할 때 분자로 이용한다. Table 3의 결과에 의하여, 신장의 유전가능성이 자료구조에 따라 차이가 나는 것을 알 수 있는데 쌍둥이-가족 코호트의 경우 GCTA방법은 0.77, SAGE 방법은 0.80으로 비슷한 양상을 보이나, 인구집단기반의 지역사회코호트의 경우에는 0.32로 매우 큰 차이를 보이고 있다. 또한 Table 4의 BMI의 경우에도 신장의 결과와 비슷한 결과를 보이고 있는데 가족구조의 자료에서는 분석방안이 달라도 비슷한 유전가능성(SAGE: 0.40, GCTA: 0.46)을 보이고 있는 반면, 지역사회코호트의 경우에는 0.15로 자료의 구조가 유전가능성 연구에 중요한 요건임을 알 수 있었으며, 차이의 원인에 대한 결과를 좀 더 연구할 필요가 있는 것으로 판단되어 지속적인 연구를 진행하고 있다.
신장과 비만(BMI)요인에 대한 유전가능성 추정 결과(95% 신뢰구간), 아래 Table 5와 같으며 자료 구조에 가족정보 유무에 따라 가족기반과 인구집단의 결과가 차이나고 있고, 가족기반의 추정결과가 좀 더 로버스트(robust)한 결과를 보이고 또한 일반적인 결과를 보이고 있다. 이러한 결과는 가족정보가 유전적 경향을 추정하는데 중요한 요인임을 보여주는 것으로 판단되며, 이에 대한 지속적인 연구가 필요하다고 사료된다. 신장만 보더라도 가족구조에서는 0.69-0.85인 것이 지역사회코호트에서는 0.24-0.4의 범위를 나타내고 있어 자료구조상의 차이, 상관정도 추정방법에 따라 차이가 나타나는 것을 알 수 있다.
Ⅲ. 맺는 말
현재 유전체 연구는 다양한 질환 또는 위험요인에 대한 유전체정보를 기반으로 연관성 연구결과가 많이 발표되고 있으나 연관성은 지역이나 인종에 따라 다양하게 나타나고 있어 국내현황에 맞는 연구를 진행하여야 한다.
이 연구는 유전체연구를 위한 기반 구축연구로서 위험성이 높은 위험요인이나 질환에 대한 유전가능성을 추정하고 그를 기반으로 보건정책 수립이나 연구의 중요도를 선정하여 기본 자료로 활용하고자 한다. 또한 향후 다양한 임상·역학 및 유전체 정보를 기반으로 하는 유전적 경양 연구로의 지속적인 확대가 필요하다. 이러한 연구를 기반으로 좀 더 정도 높은 유전체전장연관성 분석이 가능할 것이라 기대한다.
IV. 참고문헌
1. Heritability of Daytime Ambulatory Blood Pressure in an Extended Twin Design, N. Kupper et al., Hypertention, 45(1):80-5, 2005.
2. The power of multivariate quantitative-trait loci linkage analysis is influenced by the correlation between variables,Evans DM., Am J Hum Genet. 2002; 70:1599-1602.
3. Heritability of adults body height: a comparative study of twin cohorts in eight countries, Karri Silventoinen et al, twin research vol5, no 5, 399-408, 2003.
4. 한국유전체코호트 구축의 전략적 고려사항, 성주헌, 조성일, 예방의학회지 제40권 2호,95-101, 2007.
5. Genetics Of Inheritance And Correlations Of Some Morphological And Yield Contributing Traits In Upland Cotton, Manzoor Hussain et al. Pak. J. Bot., 41(6): 2975-2986, 2009.
6. Variations in the G6PC2/ABCB11 genomic region are associated with fasting glucose levels,Wei-Min Chen et al, The J. of Clinical Investigation, vol 118, no. 7: 2620-2628, 2008.
7. Heritability of Longitudinal Changes in Coronary-Heart-Disease Risk Factors in Women Twins, Yechiel Friedlander et al. Am. J. Hum. Genet. 60: 1502-1512, 1997.
8. Heritability of fasting glucose levels in a young genetically isolated population, R. L. P. Santos et al., Diabetologia, 49: 667-672, 2006.
9. Heritability Estimation of Sex-Specific Effects on Human Quantitative Traits, Lin Pan et al., Genetic Epidemiology 31: 338-347, 2007.
10. On the analysis of genome-wide association studies in family-based designs: A universal, robust analysis approach and an application to four genome-wide association studies, Sungho Won et. al. Plos Genetics, 5: e1000741, 2009.
11. Genetic influences on mammographic density in Korean twin and family : the Healthy Twin study, Joohon Sung et al., Breast Cancer Res Treatment vol 124, 467-474, 2010.
본 공공저작물은 공공누리 "출처표시+상업적이용금지+변경금지" 조건에 따라 이용할 수 있습니다.