生物谷报道:美国科学家已标记出了白、黑、黄三个人种基因组中发生单一核苷酸变异的位点,并初步绘成不同人种基因组的差异图。
佩尔金(Perlegen)公司科学家的这一成果不仅当天在华盛顿举行的美国科学促进协会年会上发表,也刊登在18日出版的《科学》杂志上。科学家认为,这一差异图谱将有助于寻找不同种族人群易于发生病变的基因,使得基因治疗方法更具针对性。《科学》杂志总编肯尼迪评论说,它将“为增进人类健康的基因研究提供无价的资料。”
在这一研究中,科学家从公开来源获取了71人的基因组数据,这71人分别是欧洲裔美国人(白色人种)、非洲裔美国人(黑色人种)以及汉族华裔美国人(黄色人种)。科学家们从中鉴别出了158万个单一核苷酸变异的DNA位点,其中绝大部分是三组研究对象共有的。科学家们由此认为,它们可能是人类最普遍的遗传差异。
不同人的基因组至少有99.99%的碱基对是相同的,但就是不到0.01%的差异,也就是被称为“单核苷酸多态性”的DNA链上单一碱基对的变化,不仅决定了他们是否易于得某些疾病,也决定了他们在身高、肤色和体型等方面的差异。此前科学家对其中的关系了解很少,而新绘出的差异图可能成为理解上述关系的“钥匙”。
科学家们是依据基因“连锁不平衡原理”来绘制差异图的。“连锁不平衡原理”是指,某些遗传标记的基因重组发生在物种中的频率,高于或低于从其距离推测的值,这导致DNA链上的某些片段在上万年之后仍然不变,而另一些片段在一代人之后就可能重组。科学家们为此开发了一套特殊的计算方法,来计算分布在整个人类基因组上单一核苷酸变异点的分布。
科学家们说,人类基因组较常见的单一核苷酸变异点大约有1000万个,而这次鉴别出的158万个单一核苷酸变异点相当于道路上的“交通灯”,勾勒出了全部单一核苷酸变异点的结构。佩尔金公司表示,它将参加美国、中国、加拿大、日本、尼日利亚和英国共同资助和合作开展的“国际人类基因组单体型图计划”,绘制出更详细的人类基因组差异图。
科学家们表示,他们绘制的人类基因组差异图将公开使用,不过这一成果应该仅用于基因医学方面的研究,不应该引起与种族问题相关的争议。(http://www.bioon.com)
Fig. 2. Distribution of SNP positions and LD structure across the genome. For each chromosome, the top track shows SNP density per kb, with a window size of 500 kb. The middle track shows, for each population, the fraction of common SNPs with MAF > 10% that are in high LD (r2 > 0.8) with at least one other common SNP, with a window size of 500 kb. The bottom track shows, for each population, the fraction of common SNPs that are in an LD bin extending over at least 50 kb, with a window size of 1000 kb.
Fig. 3. Extended LD bin and haplotype block structure around the CFTR gene. LD bins, where each bin has at least one SNP with r2 > 0.8 with every other SNP, are depicted as light horizontal bars, with the positions of constituent SNPs indicated by vertical tick marks as well as the extreme ends of the bars. Isolated SNPs are indicated by plain tick marks. Haplotype blocks, within which at least 80% of observed haplotypes could be grouped into common patterns with frequencies of at least 5%, are depicted as dark horizontal bars. Unlike haplotype blocks that are by design sequential and nonoverlapping, SNPs in one LD bin can be interdigitated with SNPs in multiple other overlapping bins.