分享到:
链接已复制

LANGUAGES

新闻

新闻直播 要闻 国际 军事 政协 政务 图片 视频

财经

财经 金融 证券 汽车 科技 消费 能源 地产 农业

观点

观点 理论 智库 中国3分钟 中国访谈 中国网评 外媒观察 中国关键词

文化

文化 文创 艺术 时尚 旅游 铁路 悦读 民藏 中医 中国瓷

国情

国情 助残 一带一路 海洋 草原 湾区 联盟 心理 老年

首页> 中国发展门户网> 发展要闻>

小词元撬动智能经济大市场

2026-04-03 10:52

来源:人民日报

分享到:
链接已复制
字体:

我国日均词元调用量突破140万亿,企业为提升效率付费意愿较强

小词元撬动智能经济大市场

数据来源:国家发展改革委、国家数据局 制图:沈亦伶

词元(Token),大模型处理信息的最小信息单元。我国日均词元调用量大幅增长,不仅折射智能经济的澎湃活力,也意味着一套新型商业逻辑正在加速演进。智能时代,有了可计量、可定价、可交易的词元,人工智能有望成为像水、电一样支撑社会运转的基础资源。

用户端,查资料、写代码、改文案;企业端,金融风控、智能客服、代码修正……如今,人工智能应用落地的每一个场景,都离不开对词元(Token)的海量调用。

词元,大模型处理信息的最小信息单元。今年3月,中国日均词元调用量突破140万亿,两年增长超千倍。怎么理解词元?词元和人工智能产业的关系是什么,未来发展趋势如何?记者进行了采访。

词元调用量爆发性增长,背后是模型能力提升

有人疑惑,词元和常见的数据有何不同?

“人工智能大模型的本质是一套复杂的数学运算系统,它无法像人类一样直接读懂文字、听懂声音、看懂画面。”中国移动研究院网络与IT技术研究所副所长唐华斌说,人工智能大模型必须先将各类原始数据转化为自己能识别的“语言”,再通过运算输出结果,词元就是这套“语言”中最基础的单元。

具体来看,文字词元像“乐高积木”,一个单词或一个汉字被拆成一块块词元;音频词元像“乐谱上的音符”,一段声音被切成极短的时间片段,每一片包含音调、音量;视频词元像“拼图碎片”,每一帧画面被切成一个个小方格,并且还要考虑时间上的连续性……

“在大模型看来,三种模态的词元完全没有差别。在模型眼里,它不觉得自己是在读文字或看视频,它只觉得自己是在处理一串极其复杂的数字序列。”火山引擎智能算法负责人吴迪表示。

一个个基础的词元,构成了智能经济运行的“细胞”。今年3月,中国人工智能大模型周词元调用量连续3周占据领先地位,成为全球大模型应用活跃度最高的国家之一。

“词元调用量爆发性增长,最直接的原因是模型能力的提升。每一次模型能力的提升,就会解锁更多应用场景,从而使大模型词元调用量进一步激增。”吴迪介绍,以Seedance(豆包视频生成模型)2.0为例,生成1分钟视频大约会消耗超过100万个词元。

同时,新的应用形态、新的商业模式,也会驱动大模型词元调用量大幅上涨。唐华斌表示,最近兴起的智能体和传统单轮问答不一样,它的运行往往意味着更长的上下文、更频繁的模型调用、更多轮次的任务拆解,以及工具执行过程中的持续反馈。

“简单任务,如果只需要单轮或几轮工具调用就能搞定,消耗词元只需要几千;如果需要几十轮工具调用,则需要至少消耗几万词元乃至更多。”吴迪说,智能体等新业态的涌现,让词元调用量又进入了一个快速增长的通道。

词元调用集中在信息密度高、迭代周期快的领域

60亿,是爱问答科技创始人李加义过去一年的词元调用量。

走进位于北京海淀区的AI原点社区,一间约16平方米的工作室里,李加义团队正在调试刚刚设计完成的AI玩具。

“这个玩具要具备交互能力,离不开相应的软件系统。放在以前,同等体量的软件系统开发至少要半年,还得多人共同配合。”李加义说,在AI大模型与辅助编程的深度赋能下,消耗数亿词元,开发周期被压缩至两个月。

2025年初,非计算机科班出身的李加义接触AI辅助编程工具后,借助新技术打破了软件开发的专业壁垒。“一年间,我们高效地完成了两款APP和一个AI玩具的开发设计。前不久,我们还将自研的AI硬件产品推向了国际消费电子展(CES)。”李加义说,AI助力不仅让开发成本大大降低,也让小微企业的创新探索有了更多可能。

软件开发,是人工智能应用落地的典型场景之一。总体看,词元调用量的分布呈现出鲜明的行业与场景特征,主要集中在那些信息密度更高、产品迭代周期更快以及模型与生产系统之间联系更紧密的领域。

以豆包大模型2.0为例,吴迪介绍,从行业分类看,互联网行业词元调用比例最高,消费电子、金融、新零售和商务服务紧随其后。

从场景来看,非结构化信息的处理和分析占比最大;教育、内容创作和“搜索与推荐”次之。

观察未来的发展趋势,软件开发、深度研究、个人助理等智能体应用场景或将成为词元调用量爆发的重要领域。“特别是软件开发,当前人工智能正从简单写代码转向理解整个项目,不仅能排查错漏、自动优化,甚至能通过智能体自主完成整个开发任务。代码上下文长、交互轮次多,企业为提升效率的付费意愿较强,这将成为一个巨大的需求增长点。”唐华斌说。

词元可计量,人工智能有望成为社会运转基础资源

“今年1月底以来,有的模型企业创下20天收入超越2025年全年总收入的业绩纪录。这组数字背后,是一套以词元计费为基础的新型商业逻辑正在加速演进。”国家数据局局长刘烈宏表示。

回顾人工智能产业发展历程,过去一段时期,行业聚焦于模型性能的比拼,技术创新与商业落地之间缺乏可量化的衔接桥梁,难以形成“技术迭代—价值产出—持续投入”的良性循环。

“词元本身具备可计量、锚定算力能耗、跨模态通用结算的特点,使其能够成为连接技术供给与商业需求的结算单位。打个比方,大模型输出的智能好比电,智算中心好比发电厂,电用千瓦时来计量,智能调用就用词元来计费。”联想中国基础设施业务群战略管理总监黄山表示,展望未来的智能社会,人工智能有望成为像水、电一样运转的基础资源,随取随用,用多少买多少。

从词元的视角出发,打造智能经济新形态,我国有何优势?有哪些发展着力点?

算法创新持续实现突破,国产大模型通过底层架构优化,与全球顶尖技术的代差逐渐缩小。吴迪说,我国的大模型厂商做了非常多的算法创新,在推理成本、响应速度上不断优化,能以更少的词元完成复杂任务。

基础设施具备领先优势。每生成一个词元,都在调用数据中心的算力,伴随着电力消耗。我国已建成全球门类最全、规模最大的能源体系,电源足、电网强、市场活。唐华斌表示,我国发电供给持续提升、电力成本不断降低,能够有效降低词元调用成本。

“能耗和算力是词元调用的两个关键成本。让每个词元用更少的算力和更少的能耗生产出来,体现的是智算中心等基础设施的生产能力和效率。”黄山表示,要构建起安全、高效、普惠的人工智能基础设施,持续提升大模型推理效率、降低单个词元成本,让人工智能最大程度走向规模化应用落地。(记者 王云杉)

【责任编辑:杨霄霄】
返回顶部