分享到:
链接已复制

LANGUAGES

新闻

新闻直播 要闻 国际 军事 政协 政务 图片 视频

财经

财经 金融 证券 汽车 科技 消费 能源 地产 农业

观点

观点 理论 智库 中国3分钟 中国访谈 中国网评 外媒观察 中国关键词

文化

文化 文创 艺术 时尚 旅游 铁路 悦读 民藏 中医 中国瓷

国情

国情 助残 一带一路 海洋 草原 湾区 联盟 心理 老年

首页> 中国发展门户网> 发展要闻>

博物馆AI讲解员上线,最大挑战是什么?

2026-02-11 10:07

来源:人民日报海外版

分享到:
链接已复制
字体:

看展,AI讲解员做“搭子”

拿起手机,点击“视频通话”,接通后将手机对向博物馆内的展品,属于观众自己的AI讲解员随即上线。

“这幅画作的立意与毕加索的童年有关吗?”

“这一幅下方好像有缺损,是如何造成的?”

……

无论抛出什么问题,屏幕那头总会送来耐心而专业的解答。它不仅能够陪唠,必要的时候,还会委婉纠正观众提问时出现的知识性错误。

在上海浦东美术馆官方AI讲解员的陪伴下,记者收获了一次特别的看展经历。

美育资源突破时空限制

前不久,字节跳动旗下的AI工具豆包,正式成为“图案的奇迹:卢浮宫印度、伊朗与奥斯曼的艺术杰作”与“非常毕加索:保罗·史密斯的新视角”两大国际大展的官方AI讲解员。

陆家嘴集团副总经理、浦东美术馆董事长李旻坤表示,AI讲解员可以极大丰富观众的看展体验,让艺术“千人千面”的风采得以呈现。

“过去的展览我们主要靠展签、二维码等来提供有限信息。人工导览又受限于知识广度,很难满足每个人个性化的好奇心,每个人关注的点都不一样。我们期待这位博学敏锐、持续精进的AI讲解员能成为连接观众与国际艺术瑰宝之间的智慧纽带。”在李旻坤看来,近年来展览行业的许多变化,是科技改变生活的实例。一直以来,展览的物理空间让内容呈现受到制约,随着AI技术的引入,观众可以在看展时获得更多信息,美育资源也将突破时空限制。

“如果AI讲解员的信息足够准确,它就可以极大地丰富大家对于艺术作品的感知和体验,这是很有意义的事情。”她说。

字节跳动副总裁朱骏认为,AI和用户的交互在本质上是一种对话体验。立足于产品设计,团队希望AI讲解员能在观展过程中,通过启发式的对话和更具共情意味的提问,调动观众已有的看展感受和经验。从“看见”到“理解”,AI可以帮助观众“读懂”艺术。

最大挑战是确保内容准确

在博物馆场景中使用AI讲解,技术上最大的挑战是什么?

答案不言自明——确保内容的准确性。

据豆包逛展项目负责人李若瑄介绍,模型需要攻克3个核心难题:区分外观高度相似的展品、解读小众稀缺的文物资料、在观众移动观展时AI保持稳定识别。

“以伊朗15世纪的牡丹纹盘为例,其风格与明代永乐年间的青花牡丹纹盘非常接近,这就要求AI必须从细节入手,能精准识别出文物细微的纹饰、工艺差异,给出正确信息。”李若瑄说。

多角度拍摄也会带来识别挑战。文物从不同视角拍摄时形态差异很大,AI必须稳定识别出同一物品。此外,观众很难在逛展中为AI提供标准化的拍摄环境,画面常有抖动、遮挡和光线变化,观众还会用口语化、连续提问的方式,这对AI的上下文理解和空间感知能力提出了很高的要求。

同时,很多展出的文物,尤其是卢浮宫特展中的藏品,互联网上几乎没有公开信息。AI无法依赖网络搜索,必须依靠与美术馆深度合作的专属数据库才能准确解读。

记者在体验中发现,即使有意识避开展品标签,AI也能够快速精准识别出具体展品。这背后,是豆包C1.8视觉语言模型提供的技术解决方案。该视觉语言模型包括图像推理、多帧视频分析、工具调用和自然对话理解等方面,以提供精准、稳定、人性化的AI导览体验。

2025年5月,豆包上线了基于视觉推理模型的视频通话功能,支持实时视频问答与联网搜索,凭借自然的交互体验吸引了不少用户尝试,为此次美术馆场景的应用积累了技术经验。

从技术层面来看,视频讲解功能来自Seed1.8模型的强大支撑。目前,该模型在视频感知、流式、视频理解领域处于国际第一梯队水平,不再局限于传统AI“拍图—提问—再拍图—再提问”的断点式交互,而是能实时跟随观众视角移动,在与人的交互中持续理解观众眼前变化的场景,从而实现更加自然、连续的人机互动。

定制专属观展路径

“看展,为什么非要按照规定顺序看呢,可以按照我喜欢的方法或者顺序去看吗?”李旻坤的这番话引发了现场不少人的共鸣。

技术带来的变革不仅改变了信息获取方式,更重塑了观展路径与思维方式。在AI讲解员的助力下,“沉浸式”看展的趣味性更强。

比如,传统观展流程遵循美术馆设定的固定路线,所有观众按照同样的顺序完成标准化路径。有了AI讲解员作为看展“搭子”,观众可以打破固定模式,依据自身时间和兴趣定制自己的观展路径。

AI讲解员出现了,观众对人工讲解员的需求会下降吗?

在李旻坤看来,真人面对面之间的交流需求会一直存在,这正是AI讲解员无法替代人工讲解员的原因所在。“人与人之间的互动与人和AI的互动不一样,各有各的乐趣,这同我们日常生活中所有的行为逻辑一样。人脑是有限的,想让人像机器一样博学很难,人工服务可以向着更聚焦、专业、精良的方向发展,为观众提供更加生动的看展体验。”

科技与文化的跨界合作正在重塑文化传播的生态。在浩瀚文明面前,AI正在完成自己的使命——帮助人类更好去“看”,为求知与好奇铺就一条随时可以出发的路。

本报记者 孙亚慧

【责任编辑:杨霄霄】
返回顶部