본문으로 바로가기 주메뉴 바로가기

사용자별 맞춤메뉴

자주찾는 메뉴

추가하기
닫기

간행물·통계

contents area

detail content area

유전체 브라우저 소개
  • 작성일2011-02-18
  • 최종수정일2012-08-25
  • 담당부서감염병감시과
  • 연락처043-719-7173

     

유전체 브라우저 소개
Introduction to genome browser

질병관리본부 국립보건연구원 유전체센터 바이오과학정보과         
전병준        
  


Ⅰ. 들어가는 말
  정보과학의 발달은 연구자들에게 다양한 연구방법을 제시함과 동시에 정보과학과 관계된 모든 학문들의 발달이라는 효과를 창출하게 되었다. 인간 유전체(human genome) 프로젝트가 성공적으로 종료되면서 유전체 관련 정보가 폭발적으로 증가하였는데, 이것은 유전체의 염기서열 정보가 증가하면서 다양한 유전체 자료들의 축적으로 인하여 막대한 양의 정보가 발생한 것에 기인한다.
  다양하고 막대한 정보의 발생은 해당 정보를 효과적으로 분석하고 활용할 수 있는 도구의 연구 및  개발로 이어지면서, 유전체 정보의 분석을 위한 다양한 도구들이 등장하게 된다. 이러한 도구들이 개발되고 활용가능해지면서 연구자들이 좀 더 효율적으로 유전체를 분석할 수 있는 환경이 구축되었다.
  유전체 브라우저(genome browser)는 유전체 데이터를 쉽고 편리하게 활용할 수 있도록 도와주는  도구이며, 유전체 데이터에 대한 시각화(visualize)와 브라우징(browsing)을 가능하게 하는 그래픽 인터페이스(interface)이다[1]. 여기서 브라우징은 전체 유전체에서 원하는 부위를 탐색 및 검색하는 기능을 의미한다. 유전체 브라우저의 활용 범위는 다양한 종의 유전체를 연구하는 연구자들이 시각화된 유전체 정보를 활용하는데 사용되며, 유전체의 구조(structure), 단백질(proteins), 발현(expression), 비교분석(comparative analysis) 등이 포함된 그래프 형태의 주석(Annotation) 데이터를 보여준다[1][2].
  Nature Genetics는 2002년 9월에 부록으로 몇 가지 브라우저를 소개하며 각 브라우저의 사용법을 자세하게 설명하였다. 최근 가장 많이 사용되는 유전체 브라우저는 미국 캘리포니아대 산타 클라라 분교(University California Santa Clara; UCSC) 에서 제작한 UCSC 유전체 브라우저[3]와 유럽 생물정보 연구소(EMBL - EBI)와 생거연구소(Sanger Institute)에서 개발한 Ensembl 유전체 브라우저[4]가 있다. 그리고
최근 이슈가 되는 1000 유전체 프로젝트(genome project)에서 제작한 1000 유전체 브라우저[5]가 있다.

Ⅱ. 몸 말

  위에서 소개한 유전체 브라우저 중에서 가장 먼저 등장한 UCSC 유전체 브라우저(http://genome.-ucsc.edu)는 사용자에게 친숙하고 사용에 간편한 사용자 인터페이스를 제공하여 많은 연구자들이 사용하고 있다. 유전자 이름, Accession Number 1), 유전체 위치 정보를 브라우저에 입력하면 Figure 1과 같이 다양한 정보를 결과로 보여준다[2][6].
  UCSC 유전체 브라우저의 특징은 다양한 유전체 정보를 한 화면을 통해서 제공한다는 점이다. 대표적으로 mRNA 2), EST 3), RefSeq 4)정보들을 브라우저를 통해서 확인할 수 있으며, 다양한 나라의 유전체를 연구하는 연구자, 연구팀들과 구축된 네트워크 인프라를 기반으로 하여 이들이 분석한 정보를 브라우저를 통해 보여준다. 이러한 특징은 하나의 브라우저에서 다양하게 연결된 유전체 정보를 확인할 수 있는  장점을 가지며, 인간 유전체 데이터뿐만 아니라 다양한 동물(쥐, 침팬지 등등)의 유전체 데이터를 인간 유전체 데이터와 비교할 수 있는 기능을 제공한다. 그리고 Figure 2와 같이 CpG island 5)와 같은 유전체 서열에 존재하는 특징을 표현하는 것도 가능하고, DNA 칩으로부터 얻은 발현 양상을 해당 염색체 위치에 대하여 보여주기도 한다[2][6].
                                    
                                    

  또한 UCSC 유전체 브라우저는 조사하려는 염기서열이 위치하는 유전체 영역을 빨리 검색할 수 있도록 해주는 BLAT라는 프로그램을 개발하여 브라우저와 함께 배포하고 있다. BLAT는 기존에 NCBI(National Center for Biotechnology Information - 미국 국립생물정보센터)에서 개발한 BLAST(Basic Local Alignment Search Tool)와 유사한 기능을 수행하는 염기서열 비교 프로그램으로, BLAST보다 더 빠른 시간 안에 검색을 할 수 있는 장점이 있다. UCSC의 유전체 브라우저는 BLAT을 이용하여 브라우저를 사용하는 사용자들에게 연결된 유전체 정보를 빠르게 볼 수 있도록 한다[2][6].
  Ensembl 유전체 브라우저(Figure 3) 역시 UCSC 유전체 브라우저와 마찬가지로 브라우저의 소스코드와 브라우저를 통해서 보이는 유전체 데이터를 웹 사이트를 통해서 제공하고 있다. Ensembl 유전체 브라우저의 특징은 단백질에 관련된 정보를 폭넓게 제공한다는 점이다. 특히 특정 도메인을 가지는   단백질이 유전체 상의 어디에 분포하는지 알고 싶거나 특정 유전자 온톨로지(Gene Ontology) 6) 그룹에 속하는 단백질만을 찾고 싶을때 유용하게 사용된다[5].

                                     

  UCSC 유전체 브라우저가 제공하는 BLAT처럼 Ensembl 유전체 브라우저에서는 EnsMart(최근 이름은 BioMart)이라는 데이터 마이닝 서비스를 제공한다. 해당 서비스를 사용하면 염색체 상에서의 위치정보, 발현 정보, 질병과의 관련성, 도메인, 유전자 온톨로지(Gene Ontology) 단일 염기 다형성(Single nucleotide polymorphism) 등의 정보를 종합하여 유전자를 손쉽게 찾을 수 있도록 서비스를 제공하고 있다. 또한 Ensembl 유전체 브라우저는 인간 유전체 정보뿐만 아니라 생쥐, 쥐, 초파리 등의 여러 가지 유전체 정보를 동일한 인터페이스를 통해서 제공한다[2][5].
  최근에 발표된 1000 유전체 프로젝트(Figure 4)의 유전체 브라우저(http://browser.1000genomes.org/-index.html)는 프로젝트의 취지에 맞춰서 인간 1000명의 유전체 정보를 브라우징한다[6][7]. 1000 유전체 프로젝트의 경우 다양한 나라에서 유전체 연구를 진행하는 사람들이 모여서 데이터를 수집한 정보와 함께, 위에서 설명한 UCSC 유전체 데이터와 Ensembl 유전체 데이터를 함께 보여주어 포괄적인 유전체 데이터 정보를 브라우징할 수 있다.
  위에서 소개한 유전체 브라우저 외에도 다른 각도에서 유전체 정보를 제공하는 도구들도 활발히 사용되고 있다. NCBI에서 제공하는 MapViewer(Figure 8)는 유전자 지도(genetic map)의 개념에서 유전체 서열에 관한 정보를 시각화한다[8]. 유전체 브라우저가 위치 정보를 유전체 서열상에서 제공하는 반면, MapViewer는 Ideogram 7), Contig map(인접 서열 지도), Unigene cluster map 8)등의 정보를 이용하여 원하는 서열의 유전체에서의 위치에 관한 정보를 제공한다. Map-Viewer는 유전자지도(Genetic Map)에서 기준을 삼을 수 있는  유전적 표지자(Genetic Marker)를 매핑하는 연구에 특히 유용하게 사용된다.
  유전체 브라우저와는 조금 다르게 유전자 관점에서 정보를 제공하는 브라우저도 현재 많이 개발이  되었다. NCBI에서 제공하는 Entrez Gene과 이스라엘의 와이즈만 연구소에서 제공하는 GeneCards가 대표적인데, 이 시스템들은 유전자를 기준으로 다양한 유전체 정보조직에서의 발현 정보, 연관된 gene ontology, 다른 생물종에서의 상동성 9), SNP 10)정보를 시각화해주고 있다.

                                     
                                      


Ⅲ. 맺는 말


  현재 유전체 브라우저는 다양한 종류의 유전체를 연구하는데 있어서 필수적이고 기초적인 도구로 자리 잡았다. 최근에는 기존의 자료뿐만 아니라 각 연구자가 자신의 실험에서 얻은 자료까지 통합하여 가시화하는 기능도 제공하고 있다. 이와 같이 다양한 유전체 자료가 축적되면서 보다 더 효율적인 사용자 인터페이스의 구성과 유전체 데이터베이스의 통합이 필요하게 되었다. 생물정보학의 발전과 더불어   이러한 조건을 만족시키는 브라우저에 관한 연구가 활발히 진행되고 있으며, 새로운 브라우저가 의생물학 유전체 연구를 더욱 활성화시킬 것이다.

                                                                                                                                                                                        
1) Accession Number : GenBank에 등록된 유전자의 등록번호
2) mRNA(messenger RNA) : 핵 안에 있는 DNA의 유전정보를 세포질 안의 리보솜에 전달하는 RNA
3) EST(Expresse Sequence Tag) : 세포에서 추출한 mRNA를 주형으로 하여 역전사효소를 사용하여 합성한 cDNA를 말단에서
    염기 배열한 데이터
4) RefSeq(NCBI Reference Sequence) : NCBI에서 제공하는 참조 시퀀스 정보
5) CpG island : CG 서열이 가장 많이 포함되는 영역, 프로모터 주변에 많이 존재
6) 온톨로지(Ontology) : 도메인을 표현하는 데이터 모델로서 도메인에 속하는 개념, 개념사이의 관계를 기술하는 정형화된 어휘의 집합
7) Ideogram : 생물의 형태를 도식화하여 나타는 그림
8) Unigene cluster map : 중북을 제거한 EST (Expressed Sequence Tag) 서열의 모음을 나타낸 유전자 지도
9) 상동성(Homology): 생물체의 부분 간에 형태학적으로 등가치의 관계에 있는 것
10) SNP(Single Nucleotide Polymorphism-단일 유전자 변이) : 염색체가 갖고 있는 30억 개의 염기서열 중 개인의 편차를 나타내는
     한 개 또는 수십 개의 염기변이


Ⅳ. 참고문헌

1. Genome Browser, "http://en.wikipedia.org/wiki/Genome_browser"
2. 유전자 기능 분석을 위한 바이오인포매틱스 기법 소개, 김상수, 대한간학회지 제10권 제 1호, 2004. 11. 21
3. UCSC Genome Browser, "http://genome.ucsc.edu/index.html"
4. Ensembl Genome Browser, "http://www.ensembl.org/index.html"
5. 1000 지놈 프로젝트, “http://www.1000-genomes.org/”
6. The Human Genome Browser at UCSC, W. James Kent, Chales W. Sugnet, Terrence S. Furey et al, Cold Spring Harbor Laboratory, 2010. 10. 14
7. 1000 유전체 브라우저, "http://browser.1000genomes.org/index.html"
8. NCBI MapViewer, "http://www.ncbi.nlm.-nih.gov/projects/mapview/"
9. NCBI EnterzGene, "http://www.ncbi.nlm.nih.gov/sites/entrez?db=gene"
10. GeneCard, "http://www.genecards.org/"

본 공공저작물은 공공누리  출처표시+상업적이용금지+변경금지 조건에 따라 이용할 수 있습니다 본 공공저작물은 공공누리 "출처표시+상업적이용금지+변경금지" 조건에 따라 이용할 수 있습니다.
TOP