|
架起从科学数据到科学发现的桥梁
中科曙光发布全球首个科学大数据引擎
中国网/中国发展门户网讯 10月28日,在2016年全国高性能计算学术年会(HPC China 2016)上,中国领先的信息系统综合服务商中科曙光发布了全球首个“科学大数据引擎”,旨在帮助政府部门、科研院所、教育机构、行业技术创新中心、大型企业研发部门等用户向大数据研究方面转型,促进数据密集型计算架构在各行业领域的创新发展和深入应用。曙光公司总裁历军说,科学大数据引擎集成了曙光在高性能计算、海量数据存储和大数据处理分析技术等领域的优势资源,以积极应对科学大数据发展对传统HPC系统提出的挑战。
“科学大数据的时代已经来临。”曙光公司总裁历军介绍说,数字化进程正在引发不同行业领域的群体性技术革命,已经深入到IT互联网、科学研究、工业制造、现代农业、服务业等各个应用场景,有力地带动了产业升级和技术革新。而大数据技术给科学研究带来的影响更为深远——科学发现将越来越依赖数据密集型计算来驱动。今天,大数据研究已经成为继理论、实验和计算模拟之后的第四种科学范式,在新型材料、生物基因、精准医学、地球科学、生态环境、卫星遥感、天文、空间地理、高能物理、现代农业等诸多领域受到广大科研人员的高度重视。
中科曙光发布全球首个“科学大数据引擎”
面向科学大数据应时而动
“科学研究正变成一个又一个的大数据问题。”曙光公司高性能产品事业部总工程师戴荣举例说,“千人基因组计划”每月产生1万亿条碱基序列信息,我国30多个在轨民用航天平台每年有超过3PB遥感卫星数据,FAST 射电望远镜的数据产出速度是6000亿条记录/年,大型强子对撞机实验每年产生15PB原始数据……“未来,基于对科学大数据的处理和分析将成为发现新知识的基本特征。”
其实,去年8月底,国务院就发布了《促进大数据发展行动纲要》,明确提出要发展科学大数据,以实现科学数据的开放共享和应用服务。今年7月,《十三五国家科技创新规划》进一步明确了多个重点领域的大数据发展规划,比如在人工智能方面,要“重点发展大数据驱动的类人智能技术方法”;在材料基因工程方面,要研发“材料大数据”等四大关键技术;在先进高效生物技术方面,要加快推进“生物大数据”等生命科学前沿关键技术突破;在生态环保方面,要开发“生态环境大数据”应用技术;在精准医学方面,要建立“国家生物医学大数据共享平台”;在空天探测开发和利用方面,开展“多源多尺度时空大数据分析与地球系统模拟”等核心关键技术研究及示范应用。
科学大数据的海量、多源、异构、高维等特征,向传统HPC系统发起了全新的挑战。“多数科研项目的数据量非常巨大并快速变化,且往往是分布、异构的,传统的数据管理模式已不能满足需要;此外对科学大数据的‘计算’包括了从数据获取、管理到分析、可视化的全过程,传统的高性能计算亟需将服务向外延拓展。”戴荣解释说。
作为诞生于科研国家队、多年服务于科研领域的HPC领军企业,中科曙光敏锐地洞察到科学大数据的未来前景及其对“计算-存储-分析”架构提出的更高要求,率先将“大力发展科学大数据”列入公司“数据中国加速计划”战略,为科学大数据引擎的进一步开发和水平提高提供了有力的保障。