|
多源、多尺度数据整合挖掘与模拟预测成为大数据时代生态学研究的重要手段
遥感数据、长期定位观测数据、实验以及模型模拟数据的快速膨胀有力地促进了生态数据挖掘和分析技术的发展。多源、多尺度整合挖掘与模拟预测成为大数据时代生态学研究的重要手段。大数据支持下的生态数据整合挖掘方法包括三大类:① Meta 分析方法;②基于数据驱动的数据挖掘方法;③基于过程机理的模型—数据融合方法。其中 Meta 分析主要是从已有研究案例中,对多个有共同研究目标又相互独立的研究结果给予定量合并,剖析研究间差异特征,综合评价研究结果;以深度学习为代表的人工智能数据挖掘技术,能够实现多种生态要素之间的深层神经网络式映射关系,有望在已有生态学框架下获取新的认知,继而反推潜在的生态学内部机理;由于人们无法通过观测和控制实验等方法全面获取或者预测区域/全球尺度生态系统状况,计算机模拟分析大尺度生态系统结构和功能变化成为生态模拟预测的一个重要途径。虽然生态观测数据量日益增多,但模型模拟的不确定性仍然显著,而基于过程机理的模型数据融合方法为应用海量数据进行模型评估、基准测试和约束以降低不确定性提供了新的途径。这些方法为及时、有效地集成挖掘不同站点、区域、时间序列、生态系统过程和要素的观测和实验数据,揭示生态系统过程机理、变异规律、对环境因子的响应等普遍规律,以及服务于生态系统管理和决策提供了重要手段。
生态大数据推动生态学“大理论”和新兴学科的发展
由于生态学研究对象的复杂化和长期、海量观测数据的缺失,导致研究人员对生态过程和模式的认知都存在极大不确定性,生态学尚未发展出一个能够被广泛接受、在最大程度上解释及精确预测不同尺度上生态学现象和过程的统一化理论框架[6]。受数据洪流影响,以数据为中心思考、设计和实施科学研究,通过对海量数据的处理和分析来获得科学发现的新范式(第四范式)正逐渐在生态学中出现。同时,大数据时代更需要发展高效的大理论,即从基本原理出发,用最少的参数做出大量的理论预测。由于生态系统组成的多样性及其相关关系的复杂性,不管获得的数据量有多大,如果没有大理论支撑,大数据将会在很大程度上失去其力量和有效性,不得不依赖于统计相关性而进行简单的归纳分析,永远都无法准确预测生态系统变化。只有在海量多尺度、多要素、多过程生态数据支撑下,准确认识生态系统的过程和模式,才可能发展一个统一化的理论框架,集成多源、多尺度数据整合技术和生态模拟预测技术,才能提高生态系统属性和生态过程的预测能力,促进新的生态学科,如宏生态学、预测生态学的发展。
数据开放共享文化亟待培养加强
大数据时代,只有形成开放共享、协同合作的大数据文化,才能真正发挥生态大数据的价值。观测数据是生态学研究的生命线,生态学家将自己的观测数据视为珍宝。大数据时代,只有打破数据封闭的传统模式,形成开放共享的“数据思维”模式,才有可能解决大尺度大生态问题。数据众包采集、数据出版与数据标识等新颖的数据获取和知识产权保护方式的深入应用,也将促进生态领域的数据开放共享。