2001年2月发布的英国科学家、癌基因工程领导人斯特拉顿在桑格研究中心工作的资料照片。
数据海洋,分析梦魇
如今,随着定序技术和计算生物学的发展,基因测序成本不断下降,测序速度也日益提高。然而,更快、更便宜的测序也带来了分析难题。缺乏高端设备支持,要处理日益增加的海量数据,让许多科学家力不从心。缺少合格的生物信息学专家、计算能力不足、没有合适的软件和算法来进行数据分析等等一系列问题使得海量数据变成科学家的分析梦魇。
实际上,遭遇数据梦魇是意料之中的事。早在人类基因工程的最初阶段,就有关于数据处理和分析的担忧。科学家正在想方设法解决这个问题。而目前所想到的最好办法,则要依赖于正在兴起的信息新技术——云计算。美国国家人类基因组研究所(NHGRI)在今年3月专门研究了数据分析问题,提出可运用如谷歌、亚马逊、微软等公司的存储和计算能力解决基因数据梦魇问题,并计划于今年推出下一个基因组五年计划;欧洲分子生物学实验室下属的欧洲生物信息研究所在今年5月发布了欧洲核苷酸档案,表示将向各研究机构免费提供实验数据和生物基因组研究工具。
|