본문으로 바로가기 주메뉴 바로가기

사용자별 맞춤메뉴

자주찾는 메뉴

추가하기
닫기

간행물·통계

contents area

detail content area

질병의 비밀을 밝히는 전사체 분석의 소개
  • 작성일2012-02-24
  • 최종수정일2012-08-24
  • 담당부서감염병감시과
  • 연락처043-719-7173

     

질병의 비밀을 밝히는 전사체 분석의 소개
Tranome analysis disclosed a secret of disease

질병관리본부 국립보건연구원 유전체센터 바이오과학정보과             
문지협             

  


Ⅰ. 들어가는 말
  사람들은 누구나 몇 가지씩의 질병을 겪으며 살아간다. 알레르기에서부터 사람을 죽게 만드는 암에 이르기까지 질병의 종류는 다양하다. 추운 겨울에는 감기에 걸기 쉽고, 상한 음식을 먹을 때 배탈이 나는 것이 일반적인 사례이다. 하지만 동일한 환경조건이라도 개인에 따라 발병하는 병과 그 강도가  달라질 수 있다. 어떤 이들은 추운 겨울에도 덥다며 반팔을 입고 다니는 반면, 일부 사람들은 감기 때문에 앓아눕는다. 아무거나 잘 먹는 사람이 있는가 하면, 맵거나 특정 음식물 등에 반응하여 위에 탈이 나거나 알레르기를 일으키는 사람들도 있다. 그리고 같은 질환에 걸리더라도 사람마다 증상이 다를 수 있으며, 비슷한 증상이지만 병명이 다를 수 있다. 이처럼 사람에 따라 병의 유무 및 종류, 증상 등이 차이가 나는  이유는 주변 상황이나 개인의 건강상태에 의한 면역력 차이일 수도 있으나, 그보다 개인이 가진 유전적 특성에 더 많은 영향을 받기 때문이다. 유전요인의 중요성이 부각됨에 따라 의료 분야에서는 사람들의 유전적 성향을 파악하여 질병을 예측?예방하고, 개인의 유전정보를 기반으로 한 맞춤의료 서비스에   대한 관심이 높아지고 있다.
  맞춤의료서비스를 제공하기 위해서는 사람의 유전 정보를 분석해야 하는데, 이 경우 전사체(tranome: 세포나 조직에서 한 순간 발현되는 전체 RNA의 모음을 의미한다. 이 RNA들을 이용하여 조직에 따라 발현되는 유전자들의 정보를 얻을 수 있다) 분석을 이용할 수 있다. 전사체 분석을 통해 정상 세포와 비정상 세포 간의 발현되는 RNA 차이를 분석하여 질병과 관련한 유전자를 파악하고, 그에 알맞은 치료를 실시할 수 있다. 이 글에서는 전사체 분석 단계와 도구들에 대해 소개하려 고 한다.
  전사체를 분석하기 위해서는 유전체 서열이나 RNA 서열을 크게 Sequencing(염기서열 분석), Alignment(정렬), Analysis(분석)의 세 단계로 나눌 수 있다(Figure 1).
                     
  가장 먼저 Sequencing이란 A(아데닌), G(구아닌), C(시토신), T(티민)로 이루어진 유전체 서열이나 A(아데닌), G(구아닌), C(시토신), U(우라실)로 이루어진 RNA 서열을 사람이 이해할 수 있는 기호로  번역하는 단계이다. 이 번역 기능을 수행하는 기기들은 한 번에 읽어 들일 수 있는 서열의 길이가 짧게 제한되어 있다. 때문에 작은 조각으로 분할하게 되는데 이 서열 조각을 read라고 한다.
  전사체 분석에서는 세포에서 발현된 RNA를 적당한 길이로 잘라 read를 만들고, read들의 base가 어떠한 염기로 이루어졌는지를 파악한다. Sequencing 중 RNA를 대상으로 하는 방법을 RNA_Seq이라고 한다[1,2]. 이 작업은 Illumina, Roche, Life Technologies 등의 회사에서 만들어진 Solexa, 454 Life Sciences, SOLiD 등의 NGS sequencing 기기들을 통해서 수행될 수 있다. 회사의 기기들은 각각 장단점이 있다. SOLiD는 정확도가 높고 sequencing 비용이 비교적 저렴한데 반해, 454 Life Sciences의 경우 길이가 긴 read를 만들어 낼 수 있어 de novo assembly(read조각들을 조립하여 사람의 전체   유전 서열을 만들어내는 작업을 assembly라고 하는데, reference assembly와 de novo assembly의 두 가지 방법으로 나눌 수 있다. reference assembly는 기존 연구를 통해 알려진 표준 유전체에서 read의 서열과 동일한 부위에 붙여 나가면서 전체 유전 서열을 완성하는 방식이고, de novo assembly는 read와 read 사이에서 겹쳐지는 서열을 이용해서 read의 길이를 늘려나가면서 전체 유전 서열을 완성하는 방식이다[3]에 유리하다. 그리고 Illumina 제품의 경우 무료로 사용 가능한 assembler가 많이   존재한다.
  Sequencing 단계가 끝나면 alignment와 quantification(수량화) 작업을 수행한다. Alignment 단계란 reference assembly의 한 부분으로 표준 유전체에서 read와 얼마만큼 일치하는 서열을 찾을 지(예, 100% 동일한 서열만 허용할 것인지, read의 서열 중 서로 같지 않는 부분을 한 개까지 허용할 것인지 지정)를 설정하고 일치하는 부분의 위치를 찾는 작업이다. Alignment 작업이 끝나면 전체 유전체 서열상에 전사체 분석을 위해 만들어진 read들이 알맞은 위치에 매핑(mapping)되게 된다. 매핑된 read들의 위치와 양을 분석하여 이는 어떤 유전자들이 얼마만큼 발현되었는지를 정의하는 quantification 작업을 수행하게 된다. 그림 2에서는 RNA-Seq 방법을 그림으로 표현하였다(Figure 2).
                       
  마지막으로 Analysis(분석) 단계에서는 측정된 유전자의 종류와 발현량을 이용하여 특정조직과 유전자 간의 연관성을 밝히거나 유전자들 사이의 연관성 등을 찾는 작업을 진행한다.
  현재 질병관리본부 바이오과학정보과에서는 2011년부터 전사체 발현 데이터베이스를 구축하고 있으며, 분석결과를 사용자가 쉽게 확인하고 다양한 방법으로 분석결과를 비교하고 차이점을 이해할 수 있도록 관련 브라우저(browser)들을 개발하고 있다.
  향후 이러한 전사체 분석 작업들을 통해 질병의 원인을 밝힐 수 있으며, 원인에 대한 치료 방법이  연구된다면 환자의 생명을 연장시키는데 도움을 줄 수 있을 것으로 사료된다.


참고문헌

1. Zhong Wang, Mark Gerstein, and Michael Snyder; RNA-Seq: a revolutionary tool for tranomics; 2009, Nat Rev Genet.
2. Fatih Ozsolak and Patrice M.Milos; RNA sequencing: advances, challenges and opportunities; 2011, Nature reviews|genetics.
3. Bo Li and Colin N Dewey; RSEM: accurate tran quantification from RNA-Seq data with or without a reference genome.; 2011, BMC Bioinformatics.

본 공공저작물은 공공누리  출처표시+상업적이용금지+변경금지 조건에 따라 이용할 수 있습니다 본 공공저작물은 공공누리 "출처표시+상업적이용금지+변경금지" 조건에 따라 이용할 수 있습니다.
TOP