유전체와 유전변이의 관계
1. 염색체와 유전자
유전체(genome)는 유전자(gene)와 염색체(chromosome)의 합성어로 염색체에 포함된 모든 유전자를 통틀어 유전체(genome)라고 부른다. 따라서 사람의 유전체(genome)는 23쌍의 염색체로 구성되어 있으며 인간유전체사업(human genome project)의 성공적 완료로 인간 유전체가 가지고 있는 모든 유전자의 수를 확인할 수 있게 되었다. (그림 1).
예를 들면, 인간의 염색체 중에서 가장 큰 1번 염색체는 247Mbp 속에 총 2,776개의 유전자를 가지고 있으며 가장 작은 21번 염색체는 367개의 유전자를 가지고 있다. 사람의 유전체(human genome)는 dir 30억 염기서열로 구성되어 있으며 그 중 약 1.1~1.4% 만이 생물학적 기능을 지닌 단백질(proteins)을 만드는 것으로 알려져 있다. 그리고 인간 유전체에 포함되어 있는 유전자의 개수 (gene count)는 최초의 인간유전체사업의 초안에서 예상한 31,000개보다 약간 적은 28,939개 정도로 계산하고 있다. (Human Genome build 36.1; 2006년 7월 기준)
한편 인간유전체사업의 완성으로 질병 등과 같은 특정 표현형에 대한 유전체 위치정보를 알면 현재는 그 영역에 있는 위치적 후보유전자(positional candidate genes)를 쉽게 확인할 수 있어 질병 유전자 발굴을 매우 효율적으로 수행할 수 있게 되었다. 예를 들면, 만약 특정 질병에 관련된 유전자가 염색체 21번에 위치하고 있다면 그 질병은 아마도 염색체 21번에 있는 총 367개 유전자 중의 하나일 것이다.
그리고 만약 염색체 21번에서 보다 상세한 세부 위치정보를 추가로 알게 된다면 후보유전자 수는 더 좁혀질 수 있을 것이다. 따라서 인간유전체에 존재하는 모든 유전자에 대한 상세한 정보는 질병 유전자 발굴에 큰 파급효과를 미칠 수 있다.
그림 1. 인간 염색체의 크기와 염색체별 유전자의 수 |
2. 유전체와 유전변이형
모든 사람은 개인 간에 약 99.9% 동일한 유전적 염기서열을 지니고 있고 약 0.1%의 염기서여만이 개인 간의 차이를 보이게 된다. 따라서 단지 0.1%의 염기서열 차이가 개인 간 유전적 차이의 원인으로 추정되고 있다. 한편 유전변이(genetic variation)는 DNA 복제과정에서 오류(errors)에 의한 돌연변이(mutation)로 만들어진다.
DNA 복제과정에서의 오류가 일반 체세포에서 일어나는 경우에는 새로운 돌연변이가 다음 세대에 전달되지 않지만 만약 정자나 난자의 발생과정에서 일어난다면 새로운 변이형은 다음 세대의 모든 세포 속으로 공통적으로 전달되게 된다. 돌연변이(mutation)는 평균적으로 약 염기서열 당 2.5×10-8의 확률(또는 한 세대에서 유전체당 약 175개의 돌연변이 발생)로 발생하는 것으로 예상하고 있다.
한편 유전체(genome) 내에 존재하는 유전변이에는 다양한 종류가 있다. (표 1). 첫 번째 유전이형의 형태로는 반복염기서열의 길이에 따라 satellite, minisatellite, microsatellite (또는 STR : short tandem repeat라고도 불림) 마커로 분류되는 반복 염기서열 수(copy number)의 차이에 따른 유전변이형이 있다. 두 번째는 retrotransposons에 의해 유전체의 여러 곳에 산발적으로 흩어져 존재하는 LINE, SINE 또는 transposable element 등과 같은 유전변이형이 존재한다.
세 번째의 유전변이형으로는 특정한 유전부위 또는 염기서열이 삽입(insertion)되거나 결손(deletion)되어 나타나는 변이형이 있다. 그리고 네 번째로는 전체 인간 유전 변이형의 약 90% 이상을 차지하고 있는 가장 많이 존재하는 단일염기다형성(SNP : single nucleotide polymorphism) 변이형이 있다.
단일염기다형성 마커는 인간 전체 유전체에서 약 1,100만 개 정도 있을 것으로 추정하고 있다. 최근에는 유전체 분석 기술의 발달로 인간 유전체 변이형에 대한 막대한 정보가 밝혀지고 있으며 특히 SNP에 대한 정보의 발전 속도는 매우 빠르게 진행되고 있다.
표 1. DNA 염기서열 변이의 종류
유전변이형의 그룹 | 대표적 유전변이형의 종류 |
반복염기서열 수의 차이 | satellite DNA minisatellite markers (VNTR) microsatellite (STR : short tandem repeat) |
산발적으로 존재하는 반복 DNA (retrotransposons) | LINEs : long interspersed nuclear elements (Alu) SINEs : short interspersed nuclear elements (L1) transposavle elements |
삽입과 결손 | insertion & deletion |
단일염기다형성(SNP) | 전체 인간 유전변이형의 90% 이상 >11,000,000 SNPs (290 bp 당 1개) |
0 댓글