본문으로 바로가기 주메뉴 바로가기

사용자별 맞춤메뉴

자주찾는 메뉴

추가하기
닫기

간행물·통계

contents area

detail content area

마이크로RNA의 생물정보학적 분석 및 연구방법
  • 작성일2011-04-22
  • 최종수정일2012-08-24
  • 담당부서감염병감시과
  • 연락처043-719-7173

     

마이크로RNA의 생물정보학적 분석 및 연구방법
Bioinformatics analysis of microRNAs

질병관리본부 국립보건연구원 유전체센터 바이오과학정보과            
이광희           
  


Ⅰ. 들어가는 말
    마이크로RNA(microRNA, miRNA)는 약 22개의 염기서열로 이루어진 짧은 non-coding RNA로서 유전자의 발현 과정에서 전사 후 조절인자(post-tranional regulator)로서 기능을 한다고 알려져 있다. 이들은 상보적인 염기 서열을 가진 표적(target) 메신저RNA(mRNA)에 상보적으로 결합함으로써 표적 mRNA들을 분해시키거나 단백질로 번역되는 것을 억제한다. 이러한 조절 기능이 개체의 발생과정을 조절할뿐만 아니라 질환의 발병원인과 밀접한 관련이 있다는 것이 밝혀짐에 따라 현재 생물학 분야에서 매우 활발히 연구되고 있다. 이 글에서는 miRNA의 생성과정 및 기능을 소개하고 축적된 정보를 이용하여 생물정보학에서 이용되는 연구방법들에 대해 살펴보고자 한다.


Ⅱ. 몸 말
   miRNA는 1993년 미국 하버드대 앰브로스(V.Ambros) 교수팀에 의해 처음으로 밝혀졌다. 예쁜 꼬마선충(Caenorhabditis elegans)의 발생시기를 조절하는 유전자를 찾던 중에 lin-4라고 명명된 짧은 RNA 단편이 LIN-14 단백질의 합성에 영향을 준다는 것을 발견하였으나[1], 당시에는 큰 관심을 끌지 못했다. 이 후 같 종에서 조절인자로서 역할을 하는 let-7이라고 명명된 RNA 단편이 추가로 발견되면서[2] miRNA의 존재와 기능에 대한 관심이 증가하게 되었다.
  세포 내에서 miRNA의 생성과정은 2가지 중간 형태의 RNA 전사체(tran), 즉 pri-miRNA(초기전사체) 1)와 pre-miRNA(전구체) 2)를 거치면서 완성된다[3]. miRNA 전사에 관여하는 효소는 mRNA 전사에 관여하는 RNA 중합효소 II 3)로 알려져 있으며, 일부 miRNA의 경우에는 RNA 중합효소 III 4)에 의해 전사된다고 알려져 있다. miRNA의 초기 형태인 pri-miRNA는 mRNA와 매우 유사한 구조로 전사되는데, 전두부에 cap 구조 5)를 포함하며 후미부에는 아데닌을 다량으로 포함한 poly-A 구조를 가지고 있다[4]. pri-miRNA는 핵 속에 존재하는 RNAase III 단백질인 Drosha 6)에 의해 절단된 후, 약 70개의 염기로 구성된 pre-miRNA로 변형된다[5]. pre-miRNA는 엑스포틴-5(exportin-5) 7)라고 불리는 운반단백질과 결합하여 핵 속에서 세포질로 운반된 후, 세포질에 존재하는 또 다른 RNAase III 단백질인 Dicer 8)의 작용에 의해 절단된 후, 최종적으로 약 22개의 염기로 구성된 최종 miRNA (mature miRNA)가 생성된다[6]. 이 후 miRNA는 Argonaute 9)을 포함하여 여러 가지 단백질과 함께 RNA-induced silencing complex(RISC) 10)라고 불리는 복합체를 형성하고[7], 이 복합체가 표적 유전자와 결합함으로서 표적 mRNA를 분해시키거나 단백질로 번역되는 과정을 억제하게 된다(Figure 1).
                                         
  생물학적으로 miRNA가 유전자의 발현을 조절하는 중요한 조절인자임이 밝혀지고, 또한 지금까지 동식물을 포함한 32가지의 종에서 15,172개의 miRNA가 발견됨에 따라 대량의 데이터를 처리하고 분석하기 위하여 생물정보학적 연구방법이 도입되었다. miRNA들의 서열 및 정보, 특징들을 저장, 관리하는 데이터베이스들이 구축되었는데, miRBase 그리고 ASRP, miRNAMap 등이 널리 이용되는 대표적인 데이터베이스들이다(Table 1). 또한, miRNA 유전자 후보나 miRNA의 표적 유전자를 예측하는 다양한 알고리즘과 이를 적용할 수 있는 애플리케이션 개발도 활발히 진행되고 있다(Table 2).


  miRNA 유전자의 후보를 예측하는 방법에는 일반적으로 RNA 구조(RNA conformation) 기반 검색, 유사한 서열을 가진 miRNA에 대한 호몰로지(homology) 11)검색, miRNA 특성 값을 적용한 기계학습(machine-learning) 방법에 의한 접근 등이 사용된다.
  RNA 구조에 기반한 검색은 pre-miRNA가 가지는 머리핀(hairpin) 구조 12)의 물리화학적 특징을 이용하는 방법으로서 특정 염기서열이 열역학적으로 안정한 머리핀 구조를 가질 수 있는 지를 계산하여 miRNA의 후보인지를 예측하는 과정이다. 호몰로지 검색에 의한 예측은 염기서열의 유사 정도를 확률적으로 계산하여 후보를 예측하는 방법으로 진화적으로 보존되어 있는 miRNA의 서열 예측에 매우 유용하게 적용된다. 기계학습 방법을 통한 예측은 생물정보학 연구에서 널리 사용하는 방법으로 이미 알려진 miRNA에 대한 염기서열이나 분포, 구조적 특이성, 진화보존성과 같은 특징들을 이용하여 반복적으로 학습(training)시킨 후, 새로운 염기서열 정보가 입력되었을 때 학습된 사항에 따라 결과를 예측해 주는 방법이다. 최근에는 차세대염기서열(Next Generation Sequencing) 13)방법을 이용하여 알려진 miRNA의 발현량(expression level)을 추정할뿐만 아니라, 새로운 miRNA의 발굴에도 응용하고 있다. 
  miRNA의 표적 유전자를 예측하는 것은 생물학적으로 miRNA의 기능을 예측하고 생명현상을 설명할 수 있는 단초가 된다는 점에서 더욱 의미가 있다. 그러나 생물정보학적 방법으로 miRNA의 표적 유전자를 예측하는 것은 매우 어렵다. 왜냐하면, 하나의 miRNA가 많은 표적 유전자를 조절할뿐만 아니라 동물이나 식물에 있어서 miRNA와 표적 유전자 간의 상보적인 결합 기작이 다르기 때문이다. 동물에 존재하는 miRNA는 표적 유전자의 3’-untranslated region(3’UTR) 14)에 결합하는 반면, 식물에 존재하는 miRNA는 일반적으로 유전자의 코딩부위(coding region)에 결합하는 것으로 알려져 있다[5]. 특히 동물에 존재하는 miRNA가 표적 유전자와 상보 결합을 이룰 때, 식물에서 일어나는 방식과 같이 miRNA의 모든 염기가 완전하게 표적 유전자와 결합하는 것이 아니라, 몇 개의 염기만이 부분적으로 결합을 이루게 된다. 이 가운데 miRNA상의 2번에서 8번 위치에 존재하는 소위 ‘seed site’라고 불리는 염기서열은 표적 유전자와 반드시 상보적으로 결합해야 표적 유전자의 발현을 조절할 수 있는 것으로 알려져 있다[8](Figure 2).

                                      
  최근 연구 결과에 의하면, ‘seed site’뿐만 아니라 ‘centered site’라고 명명된 또 하나의 새로운 인식 규칙이 보고되었다[9]. 이것은 표적 mRNA에 존재하는 부위로서, miRNA의 중간 부분을 포함하는 11 또는 12개의 염기가 표적 mRNA와 상보 결합을 하는 자리를 말한다(Figure 3). miRNA가 표적 mRNA의 ‘centered site’에 결합함으로서 불안정화 등의 기작을 통해 유전자의 발현을 억제하는 것으로 알려져 있다. 이러한 인식 규칙들이 알려지면서 이 정보를 기반으로 표적 유전자를 예측할 수 있는 TargetScan, miRanda, PicTar와 같은 알고리즘과 웹 툴(web tool)들이 개발되었다[10](Table 2).
                                     


  TargetScan은 seed region의 결합(seed matches)을 이용하여 표적 miRNA를 예측하는 최초의 프로그램이다. 이 프로그램은 miRNA들이 가지는 각 'seed site' 서열에 대해서 서로 상보적으로 결합할 수 있는 후보 서열들을 mRNA의 3'UTR 서열들로부터 찾고 이들이 다른 종과 비교하여 결합부위가 보존되어 있는지를 확인하도록 설계되어 있는데, 최근에는 새로운 규칙을 적용하여 성능을 개선한 TargetScanS가 서비스되고 있다. 반면 miRanda의 경우에는 이들의 상보성뿐만 아니라 결합에 의한 자유에너지(free energy)를 계산한 후 가장 안정한 결합 구조를 가지는 지의 여부를 계산하여 표적 유전자를 예측한다. PicTar에 적용되는 알고리즘은 표적 유전자의 3'UTR과 miRNA의 서열 간에 다중 서열비교(multiple sequence alignment)를 통해 서열의 유사성을 통계기법을 이용한 확률값으로 계산하여 표적 유전자를 예측하는 알고리즘을 사용한다. 이 외에도 언급한 세 가지 알고리즘을 토대로 하여 이를 변형하거나, 종특이성을 적용한 많은 새로운 알고리즘이 개발되었고, 웹을 통해 서비스되고 있다(Table 2). 


Ⅲ. 맺는 말


  지금까지 생물학 및 생물정보학적 관점에서 miRNA를 살펴보았다. miRNA에 대한 다양한 생물정보학적 연구 분야에서 가장 중요한 것 중의 하나는 표적 유전자를 얼마나 정확히 예측하느냐 하는 문제이다. 표적 유전자를 정확히 예측함으로써 miRNA에 의해 조절되는 세포 내 대사 및 신호 전달과정들뿐 만 아니라, 질병의 원인과 상관관계에 대해 보다 깊게 이해할 수 있기 때문이다. miRNA와 표적 유전자 간에 상호 인식하는 규칙들의 발견은 표적 유전자를 정확히 예측할 수 있는 확률을 현저하게 높였으나, 지금까지 밝혀진 인식 규칙들만으로는 모든 miRNA의 표적 유전자를 정확히 예측하지는 못한다. 또한 염색체에서 miRNA의 후보를 찾거나, miRNA의 발현과 관련된 프로모터를 찾기 위한 생물정보학의 연구 분야도 아직 초기단계에 있다. 때문에 miRNA에 대한 최신 연구 결과를 이용하여 새로운 규칙을 찾고 이를 응용한 예측 모델 및 알고리즘을 개발하는 것이 생물정보학이 지속적으로 해결해야 할 과제이다.

                                                                                                                                                                                         

1) pri-miRNA(Primary miRNA, 초기전사체): miRNA가 처음으로 전사되어 나온 최초의 전사체.
2) pre-miRNA(Precursor miRNA, 전구체): pri-miRNA가 Drosha 단백질에 의해 절단되어 만들어진 miRNA의 전구체로서
   약 70염기들의 스템루프(stemloop) 구조로 되어 있다.
3) RNA 중합효소Ⅱ(RNA polymeraseⅡ): DNA의 유전정보를 RNA로 전사하는데 관여하는 효소로서 메신저RNA(mRNA)의 전사에
   주로 관여한다.
4) RNA 중합효소Ⅲ(RNA polymeraseⅢ): DNA의 유전정보를 RNA로 전사하는데 관여하는 효소로서 tRNA를 비롯한 단백질로 번역되지
   않는 RNA의 전사에 주로 관여한다.
5) cap 구조: 전구체 메신저RNA의 5’ 말단에 위치한 특이적으로 변형된 뉴클레오티드.
6) Drosha: pri-miRNA를 절단하여 pre-miRNA로 만드는 RNase Ⅲ 그룹에 속하는 엔도뉴클리아제로서 핵속에 존재한다.
7) exportin-5: pre-miRNA에 특이적으로 작용하여 핵에서 세포질로 운반하는 단백질.
8) Dicer: 세포질에 존재하는 RNase Ⅲ로서 pre-miRNA를 절단 약 22염기의 mature miRNA를 생성한다.
9) Argonaute(Ago): RISC를 구성하는 단백질의 한 가지
10) RNA-induced silencing comlex(RISC): Argonaute 단백질과 mature miRNA로 구성된 복합체로서 표적 유전자와 결합하여
     유전자 발현을 억제한다.
11) 호몰로지(homology): DNA, RNA 또는 단백질의 염기 서열의 유사성.
12) 머리핀 구조(hairpin structure): 염기서열에서 부분적으로 상보적 염기들이 존재하여 이들이 서로 결합함으로서 생기는 루프(loop)
     형태의 2차 구조
13) 차세대염기서열법(Next Generation Sequencing; NGS): Solexa 또는 SOLID 시퀀서를 이용하여 DNA의 염기서열을 대량으로
     동시에 분석할 수 있는 새로운 염기서열분석 방법.
14) 3‘untranslated region (UTR): mRNA에서 단백질로 번역되는 염기서열(open reading frame) 뒤에 이어지는 단밸질로 번역되지 않는
     염기서열을 말한다.


Ⅳ. 참고문헌

1. Lee RC, Feinbaum RL, Ambros V. 1993. The C. elegans heterochronic gene lin-4 encodes small RNAs with antisense complementarity to lin-14. Cell. 1993 Dec 3;75(5):843-54.
2. Reinhart BJ, Slack FJ, Basson M, Pasquinelli AE, Bettinger JC, Rougvie AE, Horvitz HR, Ruvkun G. The 21-nucleotide let-7 RNA regulates developmental timing in Caenorhabditis elegans. Nature. 2000 Feb 24;403(6772):901-6.
3. Natascha Bushati, Stephen M. Cohen microRNA Functions Annu. Rev. Cell Dev. Biol. 2007 23:175-205
4. Cai X, Hagedorn CH, Cullen BR. Human microRNAs are processed from capped, polyadenylated trans that can also function as mRNAs. RNA 2004 10:1957?6
5. Lee Y, Ahn C, Han J, Choi H, Kim J, et al. The nuclear RNase III Drosha initiates microRNA processing. Nature 2003 425:415?9
6. Saito K, Ishizuka A, Siomi H, Siomi MC. Processing of pre-microRNAs by the Dicer-1-Loquacious complex in Drosophila cells. PLoS Biol. 2005 3:e235
7. Gregory RI, Chendrimada TP, Cooch N, Shiekhattar R. Human RISC couples microRNA biogenesis and posttranional gene silencing. Cell 2005 123:631?0
8. Maziere P, Enright AJ  Prediction of microRNA targets. Drug Discov. Today 2007 Jun. 12:452?458
9. Chanseok Shin, Jin-Wu Nam, Kyle Kai-How Farh, H. Rosaria Chiang, Alena Shkumatava and David P. Bartel Expanding the MicroRNA Targeting Code: Functional Sites with Centered Pairing. Mol. Cell 2007 38:789-802
10. Wei Sun, Yi-Shuan Julie Li, Hsien-Da Huang, John Y-J. Shyy, and Shu Chien microRNA: A Master Regulator of Cellular Processes for Bioengineering Systems  Annu. Rev. Biomed. Eng. 2010. 12:1-27

 
 

본 공공저작물은 공공누리  출처표시+상업적이용금지+변경금지 조건에 따라 이용할 수 있습니다 본 공공저작물은 공공누리 "출처표시+상업적이용금지+변경금지" 조건에 따라 이용할 수 있습니다.
TOP