本文发表在最近一期的Bioinformatics上。将Bayesian方法应用在系统发育树的构建上是最近的热点。本文条理清晰、语言流畅,大家可以将本文作为入门了解的学习资料。
我们所采集到的生物数据是有限的,但是真实的生物进化历程却未知的,因此对进化树的人为估计、计算极易带有不确定性。这种不确定性不但体现在树的枝长,而且主要体现在树的拓扑结构上。在最大似然性方法的框架内,在两个或多个可能的树形中进行判断、选择的方法已经发展了大约二十年。Felsenstein首次提出bootstrap(BP)方法作为评价标准,之后Kishino和Hasegawa提出一种测试方法以评价两个树形之间的差异。这种测试(一般称之为KH)最近的应用与发对这种差异的可能性取对数,并假设该对数值服从于正态分布,在这种零假设下,该差异对数值的期望值为零。如果观察到的差异超过某个置信范围,则认为这两种树形之间被认为存在显著差异。然而,BP方法有着许多已知的不足,而KH测试并不能保证无偏性,尽管有些其他的改进方法,但依然不能让人满意。
Bayes方法可以避免一些在频率学派方法中存在的问题。Bayes方法基本观点是将树的构造和评测工作放在一起完成。然而因为bayes方法要求先验分布的选择,在进化分析中还可能受到所选择的进化模型的影响。但是Bayes方法与其他方法相比仍然存在着优势,其发展受到热切关注。
在这篇文章里,作者分析了两种Bayes方法在树形比较中的应用。文章中的各种推导比较清晰,有组于大家了解bayes技术。