科学大数据管理技术与系统

发布时间:2018-09-07 11:51:11  |  来源:中国网·中国发展门户网  |  作者:黎建辉 李跃鹏 王华进 陈明奇  |  责任编辑:赵斌宇
关键词:科学大数据,融合查询,流水线,数据共享,弹性伸缩

 

中国网/中国发展门户网讯  Jim Gray提出了科学研究的第四范式——数据密集型科学发现的观点,他认为海量数据是未来驱动科学发现的主要动力之一。2012 年 7 月 4 日,欧洲粒子物理中心(CERN)通过分析过去两年大型强子对撞机(LHC)的实验数据,宣布发现“上帝粒子”;次年,“上帝粒子”预言者获得了诺贝尔物理学奖。激光干涉仪引力波天文台(LIGO)科学合作组织在积累 500 PB 数据、历时 14 年模型和系统改进以后,2016 年 2月11日宣布第一次探测到了引力波的存在,证实了相对论的最后预言;2017 年LIGO 的 3 位重要贡献者获得了诺贝尔物理学奖。环顾当今的重大科学研究装置和项目,如天文领域的大型巡天望远镜(LSST)、高能物理领域的大型强子对撞机(LHC)、生命科学领域的人类基因组计划(HGP)、地球科学领域的灾害风险综合研究计划(IRDR)等,无一不是从大科学装置或观测设备中持续不断采集数据,然后通过数据分析进行科学发现。毫无疑问,如今的科学发现模式已经进入科学大数据驱动的时代。到 2020 年左右,LSST 将全面完工运行,届时 LSST 每 3 天完成 1 次巡天,每天产生 15 TB 数据以用于新星发现、暗物质探测等科研目标;阵列射电望远镜(SKA)每秒将产生 200 GB 原始数据、每秒千万亿次计算、10 倍于现有因特网传输速度,正等待科研人员去突破和挑战。这些大科学项目对于宇宙起源认识、自然规律发现、科技创新具有重大意义,能否有效管理、处理、利用这些数据,将成为我国在新时代下能否取得国际科技领先地位的关键因素之一。

1  2  3  4  5  6  7  >  


返回顶部