大数据时代:地质学的挑战与机遇

发布时间:2018-09-07 11:50:20  |  来源:中国网·中国发展门户网  |  作者:翟明国 杨树锋 陈宁华 陈汉林   |  责任编辑:赵斌宇
关键词:地质学,大数据,数据密集型,数据挖掘

地质大数据的特点

地质大数据是通过露头地质观测、勘查工程、地球物理探测、地球化学探测、遥感和物理测试、化学分析等手段采集到的一种科学大数据,涉及地球从内到外的各个圈层,涉及地球形成与演化的历史,涉及地球的物质组成及其变化,涉及矿产资源的形成、勘查与开发利用,涉及人类环境的破坏与修复等。

地质大数据具有传统大数据的“4V”特性,即数据量大(volume)、类型繁多(variety)、速度快时效高(velocity)、价值密度低(value),同时还具有科学大数据的“三高”特点,即高维度(high dimension)、高计算复杂性(high complexity)和高不确定性(high uncertainty),且由于地质对象的发展演化时空范围庞大、地质作用影响因素众多,这种高维度、高计算复杂性和高不确定性特点则更加显著。地质大数据的特点主要表现在以下 4 个方面。

多源(元)异构性

地质数据的采集平台和手段繁多,不同手段获取的数据也具有不同的数据组织管理形式。例如:野外露头描述数据、钻孔岩芯描述数据、各种地质报告文档数据,以及大量野外填图、素描和照片,遥感获取的影像数据,地质灾害监测获得实时点位数据等。有的数据是以纸质形式存储和管理,有的经过结构化转换汇聚 GIS 并入库存储。不同的数据组织方式形成了不同的数据结构,对同一地质本体的描述也因空间基准和时空尺度存在差异而形成语义鸿沟。不同的数据采集方法,多角度的描述,造成了地质大数据的严重异构和多模态。

时空相关性

由于地质体、地质结构、地质资源、地质环境和地质灾害通常占据庞大的空间范围且伴随长时序的发展演化,地质大数据的“时间维”具有长期性和阶段性的复杂特点,是其他地球科学数据不具备的。

地质数据高度的时空特性体现在两方面:①地质对象本身具有特定的地质年代,地质学研究也具有明显的区域性,在特定时段、特定区域内的研究对象往往带有明显的差异化特征。②地质数据用来描述某一时间点在特定位置的对象的属性,这种固有属性在获取数据时就已经产生。地质数据的时间尺度可从分秒横跨至数十万年,再加上描述其空间位置的坐标系、投影参数以及探测精度、基本粒度的变化,则进一步增加了地质数据的复杂度。因此,脱离了时间、空间的地质数据是没有意义的,在涉及地质大数据的融合分析时也要将其划归到统一的时空基准下。

复杂性与模糊性

地球是一个复杂的巨系统,地质数据的参与在一定程度上降低了该系统的复杂度,使建模和求解成为可能。然而由于地球各圈层因素相互作用,各类地质过程本身具有高度的复杂性,人类对于许多地质规律的解释和结论还存在争议。再加上地质数据对描述对象的定量化困难,决定了地质数据分析、建模和计算的困难程度。大数据的技术取向之一是“重关联不重因果”,我们不可能仅通过数据就搞清楚地质现象发生的机理,且采集全球样本数据到现阶段还无法实现,因此地质大数据分析的结果大多是模糊不确定的。

地质体的全球性与国家利益

地质体和地质单元的分布不以国家界限为界限,地质资源的分布不以国家和人口的需求而分布。这就造成“国家利益”干预造成的全球数据库建设的困难。

<  1  2  3  4  5  >  


返回顶部