|
数据保存及再利用
前沿物理大科学装置的建造、维护和数据采集消耗了大量的人力、物力,因此实验数据是极其宝贵的。科学家对数据的利用不会随着数据采集的结束而立即停止,很多实验在数据采集结束后的若干年内,仍然在进行数据分析研究并有相关的论文发表。不同大科学装置的数据具有唯一性,随着理论研究的进步和分析手段的提高,旧的实验数据中可能会有新的科学发现。另外,对不同实验的新、旧数据的联合分析和交叉验证,能够提高科学发现的精度和可信度。大科学装置的数据的另一个重要用途是提供给大专院校和中小学校用于教学和科普。由此可见,前沿物理大科学装置的数据的长期保存具有极其重要的意义。
数据的保存不仅仅是实验采集的数据,还应该包括知识库。所谓知识库包含描述实验条件的参数、分级数据所用的软件、文档以及其他数据分析所需的资料。所以这些信息是保证正确进行数据再利用和分析的必要条件。后续数据分析的类型不同,有些数据分析需要使用实验的原始数据,有些只需使用经过处理的高级数据,这对数据的长期保存提出不同要求。以高能物理为例,国际高能物理领域成立了数据长期保存合作组 DPHEP (中国科学院高能物理研究所是发起单位之一),并编写了数据长期保存技术白皮书。该白皮书对数据和知识库的保存、相关技术及策略进行了详尽的描述。我国前沿物理大科学装置的数据策略缺乏系统的数据长期保存及再利用的规划及策略,因此该白皮书对国家制定相关政策具有很好的参考意义。此外,我国的经费资助基本是针对项目的,当大装置运行结束后,很难得到对数据保存给予支持的后续经费。因此,应建立相应的资助机制,以确保大科学装置运行结束后数据的长期保存和高效再利用。