经过6国科学家13年的共同努力,人类基因组的排序工作已经宣告完成,但是这并不等于之前的工作就可以画上完美的句号,已经有科学家发表论文提出倡议,人类后基因组时代是一个数据核实的年代。倡议者——英国剑桥大学的Peter Forster博士统计表明,以往发表的关于人类线粒体DNA(mtDNA)的文章中,数据存在问题的不在少数。其它基因组数据也存在类似的问题。这一倡议得到了《自然》杂志及众多科学家的附议和关注。我国科学家也对如何有效推断mtDNA数据中可能存在的错误进行了较为系统深入的探讨。日前,中国科学院昆明动物研究所的张亚平研究员向记者介绍了他所领导的研究小组在这方面取得的重要进展。
据张亚平介绍,mtDNA是细胞核外的遗传物质,存在于细胞器线粒体中,是一个闭合环状分子。在遗传过程中,子代的mtDNA来自母亲,父系的mtDNA在精卵结合时一般不能进入卵细胞。因此,在子代个体发育过程中没有父母双方mtDNA的重组发生。mtDNA的这种遗传特性被称为母系遗传。而且,mtDNA的进化速度相对于核基因组DNA来说要高得多。这些特性使它成为人群谱系发生和迁移流动十分有效的遗传标记。
由于母系遗传的背景,序列中积累的大量突变往往带有其发生先后的系统发育关系信息。通过构建和复原突变的先后关系,研究者就可以得到mtDNA世系的系统发育关系树。在这样的系统树中,古老的突变只会出现在树的基部,较年轻一点的突变出现在直接从树干上分出的枝上,如此类推,最年轻的突变则只分布在细小的枝端。得到这样的一棵mtDNA世系的系统发育关系树后,研究者又可以反过来用它来检验一些报道的mtDNA突变数据的可靠性。张亚平说,像这样对得到的序列数据进行理论上的检验和预测非常重要,它可以帮助我们最大限度地在数据发表前排除潜在的错误。
姚永刚、孔庆鹏、孙昌和张亚平先是研究了mtDNA序列中出现的稀少的碱基插入/缺失事件。通过将含有某一种碱基插入/缺失突变的mtDNA世系划归到构建的mtDNA系统发育树中,进而观察该插入/缺失事件在系统树中是表现为某一枝的特异性分布,还是表现为在系统树中的随机分布。特异性的分布提示该碱基插入/缺失突变可以预测,随机性分布则表明该种突变不可预测,只能通过多次独立的实验测定证实。他们基于中华民族50个不同人群2000多个个体中观察到的稀少的碱基插入/缺失事件统计分析表明,mtDNA序列中出现的稀少的碱基插入/缺失事件,尤其当发生的位置上含有该突变碱基(碱基对)的重复时,在mtDNA系统树中大多表现为随机的分布。因此,很难通过世系的系统发育关系来推测其准确性。对于研究中偶尔观察到的个别稀少的碱基插入和缺失事件,只能通过多次独立的实验测定来证实。虽然该研究得到的只是一种否定意义上的结果,但这种基于系统发育思想来检验数据可靠性的做法却很值得提倡。
同样依据mtDNA系统发育关系的思想,姚永刚和张亚平对报道的我国新疆地区和邻近的中亚地区距今2000多年前的古老mtDNA数据进行了重新的分析。分析的结果显示这些古老mtDNA数据的可靠性同样存在或多或少的问题,一些结果有可能是实验过程中污染所致。因此他们认为,对于古老DNA的研究和解释需要十分谨慎。在得到数据后,需要按照系统发育的观点,进行数据可靠性自检,这样才能最大限度地避免错误的结论。
姚永刚和张亚平与国外学者合作,在mtDNA系统发育树的基础上,还对去年《美国人类遗传学杂志》上发表的一批mtDNA数据进行了仔细的检验分析,发现并指出了其中存在的大量错误和问题。他们的论文在《美国人类遗传学杂志》发表时,原文作者也在同期杂志上撰文承认,经他们的重新实验分析验证,姚永刚等人的批评意见基本上都是正确的。这无疑更证实了mtDNA系统发育思想在检验数据时的准确性和适用性。
张亚平告诉记者,这种从mtDNA系统发育关系来分析突变的做法,除了对检验数据的可靠性十分有效外,对于一些mtDNA突变导致的疾病研究同样也有着非常重要的意义。通过比较致病性突变在系统树中的分布形式,也就是看该突变是否特异性地分布于具有相同古老突变的mtDNA类型中,可以对这种mtDNA疾病的发生做出一定的预测。