“非典”刚过去,华中科技大学生命科学与技术学院院长骆清铭教授就迫不及待地催促学院相关部门进行一项招标--构建大型生物信息数据中心。
很快招标大会在华中科技大学举行。年轻的竞标者胡雷钧坐在华中科技大学的竞标现场,经过激烈投标,他代表的浪潮北京公司中标了。这让他感到兴奋。他击败了来自国内外的10多家竞争对手。
遭遇爆炸性数据增长
骆清铭并不了解浪潮,他只知道,学院需要尽快找到一个能够将海量的数据管理利用起来的有效的平台。从国外回来后,他就一头扎入华中科技大学生命科学与技术学院的科研建设。目前,学院承担的在研项目就有58个,其中国家自然科学基金20项、“863”项目5项、“973”项目2项、国家转基因专项100万元以上的项目就有6项。这么多的研究项目,数据的存储、处理已经成了科研中的一个瓶颈。
据骆清铭介绍,全球在基因组研究方面,相关信息出现了爆炸性增长,研究人员面对的是海量生物学数据。目前与基因相关的生物学数据增长幅度越来越大,数据翻番时间在不断加快。大量的核酸、蛋白质序列、基因多态、基因表达谱和蛋白质谱数据的积累已远远超出了实验室的分析能力,而传统的计算方法也遇到了挑战。
高性能计算使大规模的、快速的基因组信息数据处理成为可能。建立超大规模计算系统,发展全新的生物信息学的理论、方法来分析这些数据,从中获得有用的信息成为基因组研究取得成果的决定性步骤。
眼光围着用户转
与计算技术结合的瓶颈使我国的生物信息研究目前处于分水岭。骆清铭说,国外进行生物信息的海量数据处理都使用超级计算机,与国外相比,国内生物信息研究在使用高性能计算方面还比较薄弱,这将严重影响我国生物信息学未来的发展水平。要解决这样的问题就必须发展新的分析理论、方法、技术、工具,就必须依赖高性能计算机来完成信息处理工作。
但是,如果采用国外的设备,不仅硬件设施价格昂贵,而且服务费用支出不菲。遍寻国内外高性能服务器生产厂家,反复比较后,才出现了文中开头的一幕。
生物信息数据中心引进了亚太区第一套基于Infiniband高速互联技术的浪潮天梭TS10000高性能系统,用于生物信息学中的科学计算、模拟和可视化研究,构建大型生物信息数据中心。该系统通过运用天梭TS10000高性能计算机硬件平台,为华中科大从事生物信息科研工作者们提供高速、海量的应用服务,为生物信息学研究提供了一个基于硬件、软件和数据库集成环境下的统一运行平台。
以往从事生物研究的科技工作者需要分别采购硬件和软件组成研究平台。这些分别采购来的软硬件可能不兼容,这就需要对软件进行繁杂的移植工作,以适应硬件环境的运行要求。这样往往会耽误相关科研进程。为了更好地帮助华中科大科研工作者们从事生物信息研究,浪潮和该实验室还将进一步在这个领域合作,进行生物信息处理相关的数学模型、算法和应用软件的研究和开发,软硬一体的解决方案,大大缩短了研究周期。
合作升级
在平台建设的过程中,骆清铭发现,浪潮天梭10000完全能够胜任工作,而且服务周到、细致。更让他惊喜的是,浪潮公司有博士后工作站,而生物信息学的人才培养恰恰需要加强这方面的工作,这给双方合作提供了更多想象空间。
骆清铭将这个想法与浪潮北京公司做了沟通。双方一拍即合。很快合作升级。10月19日,在武汉,由浪潮(北京)电子信息产业公司捐助建设的“华中科技大学-浪潮高性能生物信息中心”正式启用。
同时,浪潮向华中科大捐赠了图形工作站、Intel编译器、性能调优工具、高性能并行数学库等并行开发软件,以及浪潮集群管理软件、浪潮并行文件系统、浪潮高性能负载均衡系统软件等软件系统,并提供相应的研发经费,用于启动实验室的面向生命信息领域的高性能计算应用;建立博士后工作站,共同研究生命信息领域的高性能计算应用;浪潮还提供研发人员,与华中科技大学生物医学光子学教育部重点实验室研发人员组成研发团队,共同移植生命科学相关的软件。