关于蛋白家族分类和功能预测是长期以来生物信息学研究的重点课题,本期编者向大家介绍与之两篇文章,这是第一篇。随着基因组数据的加速积累,越来越迫切的需要发展生物信息学的算法和工具来进行可靠的、大规模的蛋白功能预测和生物学知识发掘。本文作者发展了PIR系统。PIR(Protein Information Resource)提供了一个集成的公共的蛋白信息源来支持基因组和蛋白质组的研究。PIR产生的蛋白质数据库中包含了经过功能预测的蛋白信息。关于功能预测问题,本文作者采用了数据发掘技术,发展了一种算法,该算法有两种特性:classification-driven和rule-based。该方法可以进行敏感的识别,一致的、信息量丰富的预测,对预测错误的系统纠正,以及区分试验验证和计算预测的不同特性。为了更好的说明问题,作者在这篇文章中举了很多有说服力的例子,相信这是一篇很值得一读的文章。