|
发展趋势
科学大数据智能分析软件的发展趋势呈现出 AI 赋能、一体化、云服务、开放共享和可定制的重要特征。
AI 赋能。科学家在其研究领域尝试使用人工智能新技术进行科学发现的需求日益高涨。因此,智能分析软件除了提供领域相关的基础运算操作和传统算法,还需要支持深度学习、自然语言理解、知识图谱等新型人工智能技术的集成应用,为人工智能模型的训练、测试、部署和运行提供全生命周期的工具化支持。
一体化。科学大数据智能分析包含复杂的数据处理、分析、模式提取和知识发现过程,而现有的大数据框架和平台存在学习曲线高、开发代价大等问题。因此,在传统“编程式”的开发模式基础上,还需要为领域科学家提供简单易用的“拼装式”可视化挖掘分析环境,并利用高质量、可复用的模型与算法库,进行科学大数据分析模型的创新设计,实现涵盖数据源集成、代码编辑、流程设计、模型算法复用以及执行与可视化的一体化支撑。
云服务。云服务化的科学大数据智能分析软件不需要本地进行软件安装和维护。因此,一方面,浏览器成为挖掘分析全流程操作和管理的统一门户界面;另一方面,模型、算法以及数据源将以在线 API 的形式进行共享和复用,这一形式也被称为“功能即服务”(function as a service)。
开放共享。交叉科学的重大发现需要综合应用多领域的分析模型和算法。汇聚跨领域的共性模型,形成类型丰富、性能优异的模型和算法库,这将成为降低领域交叉综合分析模型开发难度、提升开发效率的基础。同时,各领域科学家团队通过共享高质量的模型和算法,也将促进软件系统持续演化,使软件系统更具生命力。例如,R 语言算法库 CRAN 是交叉领域算法共享的典范,该算法库目前收录了各领域科学家贡献的 4 000 多种算法,吸引了大量的用户。
可定制。不同科学领域的数据分析模式千差万别,通用的、固化的大数据分析软件无法满足特定领域科学家团队的个性化分析需求,这种个性化需求存在于分析流程、数据源、算法模型、可视化等各个层面。因此,一个理想的科学大数据智能分析软件应该支持数据、模型算法和可视化视图等多个方面的领域定制与扩展,支持领域科学家以及领域内的软件工程师进行特有组件的开发。