前沿物理大科学装置数据策略的一些思考

发布时间:2018-09-07 11:49:30  |  来源:中国网·中国发展门户网  |  作者:陈刚  |  责任编辑:赵斌宇
关键词:大科学装置,大数据,数据管理,数据共享,数据保存,前沿物理

数据共享与利用

前沿物理大科学装置的特点是装置规模大,建设和运行周期长,其科学技术目标为瞄准国际科学技术前沿,为国家经济建设和社会发展作出战略性、基础性和前瞻性贡献。前沿物理大科学装置产生的数据是产生科学成果的金矿。装置性质的不同,数据共享与应用的模式也不同。

粒子物理实验(包括对撞机实验、中微子实验、宇宙线实验等)。当前我国科学家参与的粒子物理实验包括以国外为基地的实验,如欧洲核子中心的 LHC 实验,以及以中国为基地且中国主导的实验,如北京正负电子对撞机 BESIII 实验,大亚湾中微子以及高海拔宇宙线观测站 LHAASO 实验等。所有这些粒子物理实验均采用国际合作的模式,合作各方共同分担实验的建设、运行及管理的任务。因此,粒子物理实验数据基本采用合作成员单位内自由共享、共同利用的模式,合作组内产生的科学成果以集体名义发表并共同拥有成果。尽管如此,大型粒子物理实验的合作成员之间存在竞争,合作各方都尽最大的努力争取首先获得研究成果,提升自己在合作组内及国际上的显现度。因此,除了投入最优秀的科学家以外,需要在数据传输、计算条件方面创造良好的条件,以便以最快的速度产生科学成果。中国在 LHC 实验的建设与升级方面作出了重要的贡献,但是在数据传输共享及科学计算方面的投入不足,这对中国科学家开展 LHC 物理研究造成不利影响。由于 LHC 开始向高亮度升级,数据产生率将有数十倍的增长,这对数据的传输和处理提出巨大的挑战。建议国家在网络及分布式计算等方面给予 LHC 实验中国组强有力的支持,促进中国科学家利用 LHC 国际合作实验数据产生一流物理成果。同时,我们在以中国为主导的粒子物理实验中具有管理主动权。在公平合作的前提下,我们应采取适当的策略和技术手段,在数据共享和利用方面取得主动权。

天文观测(特别是大型通用型望远镜)。在国际上,该研究领域数据的共享大部分采用延时公开。天文观测者在望远镜上取得的观测数据经过一段保护期后将公开发布。在保护期内,观测者可以独享数据并尽快进行数据分析以获得科学成果。保护期后,数据将存放在数据库服务器上供世界各国的天文学家访问和使用。一般这种延时为 1—2 年。天文观测数据的这种共享方式值得其他领域学习。一方面,数据的公开可以让更多的科学家充分利用数据获得更多的研究成果;另一方面,把数据交给同行更有利于检验自己的成果。目前,空间科学卫星及宇宙线观测实验也借鉴这种模式,以一定的方式将卫星观测数据和宇宙线观测数据分批公开,提供给同行用于科学研究。

同步辐射装置及散裂中子源装置。此类装置是国家投资建设的公共实验平台。学术领域的科学家可申请在平台上开展实验,实验产生的数据将用于科学研究。国外的同步装置对实验数据有相应的政策。欧洲同步辐射光源(ESRF)规定,ESRF 将保存所有实验的原始数据和元数据。数据有为期 3 年的保护期,必要时可以延长。在保护期内,实验者有完全的使用权。保护期过后,ESRF 根据相应的许可条件下将数据向 ESRF 的注册用户公开。用户使用数据产生研究成果在发表时须标明引用。国内的同步辐射装置及散裂中子源装置为大学及研究机构的科学家开放免费使用。目前,国内这些装置还没有统一的数据政策,这不利于发挥实验数据的最大利益。由于这些装置都是国家投资建设和运行,国家对装置产生的数据应该拥有共同所有权。因此,建议国家建立与国际上类似的数据政策,既保护实验者对数据的优先使用权,也通过数据共享充分发挥数据的作用。公共实验平台的数据共享可以采取两种模式:①建立数据保护期,期限 2—3 年,确保实验者对数据的优先使用权。②对急需使用实验数据的外部用户,可以与实验者签订合作协议,建立数据共享机制,让这些用户在保护期也能及时利用数据开展科学研究。

<  1  2  3  4  >  


返回顶部