由中美英等国科研机构发起的大型国际科研合作项目“千人基因组计划”28日在英国《自然》杂志上,以封面文章形式发布了迄今最详尽的人类基因多态性图谱,同时也在美国《科学》杂志上报告了在基因研究技术手段上的收获,相关成果标志着人类基因研究进入了一个划时代的新阶段。
“千人基因组计划”由中国深圳华大基因研究院、美国国立人类基因组研究所、英国桑格研究所等机构于2008年启动,旨在绘制迄今最详尽、最有医学应用价值的人类基因多态性图谱。现在报告的是该计划第一阶段的分析成果。
“千人基因组计划”共同主席、英国桑格研究所基因专家、《自然》封面文章主要作者之一理查德·德宾在接受新华社记者采访时说:“这一计划现在取得了两个重要成果,第一是获得了迄今最详尽的人类基因多态性图谱,第二是探索出了研究基因多态性的新技术手段。”
基因多态性是指人与人之间的基因差异。人的基因组总体上差不多,但在有些位置上你我他都不一样,存在各种基因变种,它们最终导致了人与人之间的差异。
德宾说,在第一个成果方面,研究人员找出了1000多万个大大小小的基因变种,其中约800万个都是前所未知的。对于人群携带率在1%以上的基因变种,本次研究的覆盖率达到95%以上,得出了迄今最详尽的基因多态性图谱。这一成果在医学等领域有很高的应用价值,比如通过参照图谱,可以方便地找出致病的基因变种。
在第二个成果方面,研究人员验证了在大型基因研究中综合使用多种基因测序手段的可行性。由于基因测序成本目前仍很高昂,如果能在“精测”一些基因序列的同时,对另一些基因序列只需“粗测”就能保证最终结果的准确性,将可以大幅降低基因测序研究的成本。《科学》杂志上的文章便侧重描述了技术手段方面的进展。
德宾告诉记者,自十年前“人类基因组计划”完成以来,因为难以同时对许多人进行基因测序,基因研究一直只在较小的层面上进行。本次研究不仅使大规模测序成为可能,还绘制了一个详尽的基因图谱以供比对,这标志着人类基因研究进入了一个划时代的新阶段。
他说,本次报告还只是基于“千人基因组计划”第一阶段中搜集的数百人的基因数据,而该计划的最终目标是获得欧、亚、美、非各洲不同人群中2500人的基因数据,预计在2012年发布的最终结果将可以覆盖99%以上的基因变种。
据报道,“千人基因组计划”所获数据存放在公共数据库中,公众可免费查询。(生物谷Bioon.com)
生物谷推荐英文摘要:
Nature doi:10.1038/nature09534
A map of human genome variation from population-scale sequencing
The 1000 Genomes Project Consortium
The 1000 Genomes Project aims to provide a deep characterization of human genome sequence variation as a foundation for investigating the relationship between genotype and phenotype. Here we present results of the pilot phase of the project, designed to develop and compare different strategies for genome-wide sequencing with high-throughput platforms. We undertook three projects: low-coverage whole-genome sequencing of 179 individuals from four populations; high-coverage sequencing of two mother–father–child trios; and exon-targeted sequencing of 697 individuals from seven populations. We describe the location, allele frequency and local haplotype structure of approximately 15 million single nucleotide polymorphisms, 1 million short insertions and deletions, and 20,000 structural variants, most of which were previously undescribed. We show that, because we have catalogued the vast majority of common variation, over 95% of the currently accessible variants found in any individual are present in this data set. On average, each person is found to carry approximately 250 to 300 loss-of-function variants in annotated genes and 50 to 100 variants previously implicated in inherited disorders. We demonstrate how these results can be used to inform association and functional studies. From the two trios, we directly estimate the rate of de novo germline base substitution mutations to be approximately 10?8 per base pair per generation. We explore the data with regard to signatures of natural selection, and identify a marked reduction of genetic variation in the neighbourhood of genes, due to selection at linked sites. These methods and public data will support the next phase of human genetic research.
全文链接:http://www.nature.com/nature/journal/v467/n7319/full/nature09534.html