中美两国人工智能头部企业研发和创新的比较分析与启示
中国网/中国发展门户网讯 在日益数字化的时代,人工智能作为下一代技术被认为有望彻底改变人类社会。图像分类、语音识别、对话生成、自动驾驶等相关领域正在迎来爆发式增长。鉴于人工智能对未来社会秩序的深远影响,美国和中国等世界主要国家都在投入大量资源来开发和利用这项技术。中国目前在人工智能领域的论文和专利产出数量上处于领先地位,而美国在该领域的技术突破、企业活跃度和风险投资规模等方面保持优势。
2022年11月,美国OpenAI公司的聊天生成式预训练变换模型ChatGPT上线后,一周内用户数量突破100万人,2个月内用户数量突破1亿人,引发行业震动。这同时也给中国人工智能产业的从业者敲响了警钟,引发了关于为什么此类颠覆式创新没有诞生在中国的讨论,以及中美两国人工智能产业差距的深入思考。一些国内专家认为,中国在人工智能大模型领域起码落后美国2—3年。此外,中国人工智能产业的发展很大程度上依赖于美国的芯片和开发框架等基础技术,例如,TensorFlow和PyTorch这两大开源机器学习框架在中国的市场份额达到85%以上,而人工智能基础算法的专利也主要掌握在美国企业手中。
为了比较中美两国人工智能产业的差异,基于过去5年在中国和美国提交的124026件人工智能授权发明专利数据,笔者构建了一个综合考虑专利数量和其他特征的多维度指标,并据此定义了中美两国人工智能领域的前十大企业。对这2组企业的进一步比较分析表明,尽管中国和美国在人工智能这一关键技术领域都被认为是领先国家,但中美两国的头部企业在技术影响力、布局及研发合作方面存在显著差异。这些差异为中国人工智能产业的进一步发展提供了有效启示,并突显了中美两国在人工智能领域开展更多优势互补型合作的重要性。
识别中美两国人工智能头部企业
为了比较中美两国人工智能产业的差异,本文从企业专利和论文入手,分析了中美两国人工智能头部企业的研发和创新情况。专利和论文是衡量企业研发活动和创新能力的2个重要指标:专利反映了企业在技术创新和知识产权保护方面的成就,而论文体现了企业在学术研究和理论探索方面的深度;专利更侧重于技术的应用和商业化潜力,而论文则侧重于基础研究和理论贡献,这种互补性有助于揭示企业在不同层面的创新表现;专利和论文的国际数据库较为完善,数据容易获取和比较,这为进行跨国比较分析提供了便利。
指标构建
为了定义中美两国人工智能领域的前十大企业,首先构建了一个基于企业过去5年内获得授权的人工智能发明专利的多维度指标。与单一维度指标相比,多维度指标能够涵盖企业在不同方面的专利表现,并减少单一指标可能造成的偏差。鉴于本文的核心焦点在于评估人工智能企业的研发和创新实力,优先考虑了5个关键维度——企业研发产出的总量、研发成果的影响力、研发成果的转化效率、研发产出的市场扩展能力和研发成果受法律保护的程度。基于专利数据信息,分别选取了5个细分指标来测量上述关键维度并构建综合指标:专利总数、专利的被引证的总次数、专利的被转化(包括转让、许可、质押)总次数、专利的海外同族专利总数和专利的权利要求总数。
人工智能专利的定义来自世界知识产权组织(WIPO)界定的62个国际专利分类(IPC)代码和114个联合专利分类(CPC)代码。利用incoPat专利检索分析平台(https://www.incopat.com/)分别检索中国、美国2019年1月1日—2023年4月4日期间获得授权的包含人工智能相关IPC和CPC的发明专利,合并申请号后获得了来自美国的62201件专利和来自中国的61825件专利。本文选择分析过去5年专利数据的主要原因是人工智能技术的快速迭代性。随着技术的迅猛发展,较早申请的专利可能已经过时,甚至失效。中美两国2019年1月1日—2023年4月4日(本文的样本时间)获得授权的人工智能发明专利中,仅有3.3%的专利失效,而2014—2018年专利的失效率则显著提高,达到了23.3%。专利失效一般是由于专利权人未缴纳年费、专利权人提前终止或专利未通过审查。因此,失效的专利无法代表当前产业中的前沿技术,对企业和国家提升科技竞争力的作用也有限。相较于分析更长时间内的专利数据,分析过去5年的专利数据更能揭示当前中美两国人工智能产业的差异。
在对企业进行排序时,合作性质的专利按合作主体比例分配。例如,2个单位合作的专利每个单位将各占0.5。5个专利维度首先被赋予了相同的权重;根据加权后的综合指标,可以对样本内中美两国所有企业进行排序。作为稳健性检验,也考虑了对指标赋予不同权重的情况。由于在使用专利数据测度企业技术创新绩效时,专利数量和引证情况是较常见的2个指标,对其赋予了更高的权重:这2个指标的权重从之前的0.2增加到0.25,其他3个指标的权重从0.2下降到0.167。但新的排序结果与相同权重下的排序结果几乎一致。
中美前十大人工智能企业
基于上述方法并对不同维度赋予相同权重,辨识出中美前十大人工智能企业样本。表1列出了中美两国综合排序最靠前的10家人工智能企业。中国的头部企业包括腾讯、百度、蚂蚁和华为等,美国的领先企业包括IBM、微软、谷歌和英特尔等。其中,浪潮集团虽然在人工智能发明专利总数上位列中国企业第1位,但综合考虑专利的其他特征后该公司的排名降为第10位。
此外,中国人工智能头部企业在其他4个专利维度上的表现也落后于美国头部企业,这体现出中国人工智能企业在国际专利布局、专利保护、专利技术影响力和技术转化应用方面存在进步的空间。
中美前十大人工智能企业的专利技术与科研合作分析
企业专利技术共现分析
为了进一步探索中美两国前十大人工智能企业在技术布局上的差异,利用VOSviewer对这2组企业的人工智能专利类别进行了共现分析(co-occurrence analysis)。共现分析被广泛应用于发现文献或专利文本数据之间的关联关系。其涉及创建一个可视化网络,由文本主题或关键词构成网络节点,节点之间的连线代表它们之间的共现关系,由连线的粗细表示共现关系的强度。在专利分析中,这一分析有助于发现专利样本是否形成了某些特定领域的技术集群,以及技术网络中特定技术领域的中心性。
从人工智能产业发展的角度,人工智能技术可以分为3个层面:底层——基础层、中间——技术层和上层——应用层。基础层是人工智能产业的基础,主要为人工智能产业发展提供数据与算力支持,包括数据平台、传感系统、算力、芯片、存储等方面;技术层是人工智能产业的核心,以模拟人的智能相关特征为出发点构建技术路径,包括机器学习、自然语言处理、计算机视觉与图像、模式识别等技术;应用层是人工智能产业的延伸,通过集成一类或多类人工智能技术,面向特定应用场景需求而形成软硬件产品或解决方案,涉及的领域有零售、金融、电商服务、安保、教育和医疗等。
图1展现了中国前十大人工智能企业专利中出现频率最高的前100项技术的共现关系;可以看到中国前十大人工智能企业的相关专利较为松散地构成了8个技术集群。比较突出的技术集群主要围绕识别模式的方法或装置、冗余数据错误检测或校正、故障硬件检测或定位等技术。表2进一步汇总了出现频率最高的15项技术的信息,包括它们的出现频率、与之共现的技术总数、与其他技术共现的总频率(总连接强度)。“识别模式的方法或装置”“电子设备识别方法或装置”和“冗余数据错误检测或校正”是出现频率最高的三项技术,其中“电子设备识别方法或装置”技术的总连接强度最高,与其他技术共现了763次。
图2展示了美国前十大人工智能企业专利中出现频率最高的前100项技术的共现关系;这些企业的专利数量更多,并且形成了更为明显的6个技术集群。除了中国企业大力布局的识别方法或装置、语音识别和数据错误检测等技术,美国企业还更多地在人工智能基础层和技术层布局。例如,美国企业在处理器架构和配置、基带系统零部件、机器学习等领域拥有大量专利。根据表3的汇总信息,与中国的情况类似,“识别模式的方法或装置”和“冗余数据错误检测或校正”也出现在频率最高的3项技术中。另外,“机器学习”出现的频率排在第3位,达到1072次。“识别模式的方法或装置”技术的总连接强度最高,与其他技术共现了2121次。
以上专利技术的比较分析展现出中美两国人工智能头部企业的技术发展差异。美国的头部企业更加注重推动技术创新,专利数量远为更多,并且涵盖了更广泛的技术类别。美国的头部企业在处理器架构和配置、基带系统零部件、机器学习等人工智能基础层和技术层领域处于领先地位。这表明美国企业更加侧重于在人工智能的核心技术和底层设计方面取得领先优势,通过不断创新来推动整个行业的进步。
相比之下,中国在人工智能技术的发展中表现出更强的实用性。中国企业在图像识别、语音识别、故障硬件检测或定位等领域展现了显著的技术实力,这与中国在面部识别、语音识别等领域公认的国际领先地位相符合。这表明中国企业在人工智能技术落地上具有一定优势,但在人工智能产业的基础层和技术层上需要布局更多的研发工作。
企业科研合作对象分析
当前人工智能技术正处于爆发式增长期,研发合作不仅可以加速创新,还能通过分享资源和降低成本来提高企业的科技竞争力。鉴于企业在专利申请上进行合作并不常见,特从论文合作的角度来分析中美前十大人工智能企业的科研合作模式,并特别关注中美之间的合作。首先从inCites数据库中检索了上文定义的中美前十大人工智能企业过去5年在“计算机科学和人工智能”(Computer Science, and Artificial Intelligence)领域的所有英文学术出版物,包括期刊论文(包括综述)和会议论文。考虑到中国企业可能发表中文论文,同时在中国知网上检索了中美前十大人工智能企业过去5年在“人工智能”领域发表的中文学术期刊论文。
表4列出了每个企业的中英文论文总数。中国企业中,蚂蚁、字节跳动、北京三快(美团)和浪潮的中文论文发表数量超过了英文论文,而其他企业的英文论文发表数量则明显多于中文。产出最多人工智能论文的3家企业是腾讯、华为和百度,它们在过去5年分别产出了1366、1284和865篇论文。在检索范围内,阿波罗智能技术公司并没有人工智能相关论文的产出。在美国企业中,Emc Ip Holding同样没有论文产出,但谷歌、微软、Meta和国际商业4家企业在过去5年都产出了超过1000篇人工智能领域论文。从总量上看,中国前十大人工智能企业在过去五年发表的人工智能论文总数约为美国前十大企业的一半。因此,尽管中国的人工智能论文总数已超过美国,但这些论文很可能更多地来自大学和科研院所而非产业界。
接下来,根据合作论文的频率定义了中美人工智能头部企业论文合作上的前十大伙伴,并特别关注中美机构之间的合作。因为美国企业较少发表中文论文,下面的分析基于企业的英文论文数据。其中,中国的蚂蚁、字节跳动、北京三快(美团)和阿波罗智能技术4家企业没有英文论文产出,而国家电网、浪潮和格力3家企业相关论文数量较少且没有中美合作论文。因此,表5只汇总了腾讯、百度和华为这3家企业的情况。可以看到,这3家企业的前十大人工智能领域论文合作伙伴几乎都是国内顶尖的大学或科研院所,其中中国科学院同时是这三家企业合作最多的机构。此外,除了百度与罗格斯大学新布朗斯维克分校有着较广泛合作外,腾讯或华为都没有与美国机构建立起紧密的合作关系。百度与悉尼科技大学,以及华为与悉尼大学建立了紧密的合作。另外值得注意的是,这几家中国人工智能头部企业的科研合作对象局限在大学或科研院所,并没有与其他人工智能企业建立起广泛的研究合作关系。
表6汇总了美国的微软、英特尔、亚马逊和苹果4家企业的前十大人工智能领域论文合作伙伴。由于国际商业、谷歌、福特、高通和Meta这5家企业的前十大论文合作伙伴中没有来自中国的机构,它们的情况并未在表6中列出。其中,微软和英特尔展现出了极强的中美科研合作。它们的主要中国合作机构包括清华大学、北京大学、上海交通大学、中国科学院、中国科学技术大学和北京航空航天大学。对于微软来说,它与中国机构在人工智能领域的科研合作甚至可能超过了与美国本土机构的合作。此外,表6还显示出美国人工智能头部企业间一定的科研合作。例如谷歌同时是亚马逊和苹果的前十大人工智能论文合作伙伴之一,而苹果也与Meta也有着较广泛的合作。
为了更好地展示中美两国人工智能头部企业的合作伙伴选择之间的差异,在表5和6的基础上绘制了图3进行对比。从图3可以看出,与美国人工智能头部企业相比,中国企业的研发合作网络更多局限在国内顶尖大学和科研院所,应当更积极寻求跨国界的合作关系。此外,中国企业与美国同行相比的另一个差异体现在缺乏企业间的合作。与科研机构相比,企业在人工智能的技术突破和创新中扮演着越来越重要的角色。中国的人工智能头部企业可以通过探索企业间科研合作模式,更大程度地发挥规模优势和比较优势,实现互利共赢。
主要结论与政策启示
主要结论
鉴于人工智能在塑造政治、经济和社会秩序方面的巨大潜力,世界主要国家都在大力发展这一领域。自2015年以来,党中央、国务院发布了多份涉及人工智能的政策文件,其中2017年发布的《新一代人工智能发展规划》将人工智能提升到了国家级战略层面进行部署。美国从2013年开始部署国家层面的人工智能发展战略,近年来更是立法提出要维护美国在人工智能领域的领导力和世界领先地位。尽管中美两国均将人工智能发展纳入国家战略的重点领域,但两国在技术创新和发展方向上存在显著差异。
通过对比中美两国前十大人工智能企业,本文发现了这2个人工智能领先国家在企业技术和研究合作方面的结构性差异。与美国的人工智能头部企业相比,中国的头部企业尚未在人工智能产业的基础层和技术层形成领先的技术集群,尤其在处理器架构和机器学习等领域与美国存在较大差距。这一发现与一个普遍存在的观点一致,即由于人工智能的开放科学性质和快速应用优势,中国企业更倾向于投资图像识别、语音识别等应用场景更明确的技术以获得较快商业回报,而非投资具有更持久影响的基础性技术。展望未来,中国企业需要加强在人工智能产业基础层和核心技术层的研发。
在科研合作方面,以微软和英特尔为代表的美国人工智能头部企业已经与中国科研机构建立起了非常紧密的合作,共同发表人工智能领域的科研论文。而以百度、腾讯、华为等公司为代表的中国头部企业仍然主要是与国内的大学和科研院所进行合作。此外,像谷歌、亚马逊、苹果和Meta这样的美国企业虽然直接竞争,但它们仍在科研合作网络中建立了明显联系。相比之下,中国前十大人工智能企业中没有一家与国内其他人工智能企业建立了明显的科研合作。鉴于企业间知识转移在推动人工智能技术进步中的关键作用,中国企业需要培养更开放的合作文化,以期提高创新能力和竞争力。
政策启示
对中国政府
从政策牵引的角度出发,可以从3个方面入手提升我国人工智能产业的竞争力。
加快设立人工智能领域的企业专项基金或通过税收政策激励企业加大对基础研发的投入,以支持长周期的基础研发项目。通过资金支持,可以强化目前企业在人工智能产业基础层和技术层的薄弱环节。此外,基础研发专项基金也将成为促使企业与科研院所建立更紧密合作关系的催化剂,鼓励双方从实际产业场景和实践问题中挖掘技术逻辑和解决方案。对于在人工智能特定基础技术领域进行研发的企业,还可以提供税收优惠以降低其研发成本,鼓励企业在人工智能更基础性的技术上取得突破。
从人才队伍培养和建设入手,促进人工智能企业的开放与彼此合作。政府可以考虑在大学和科研院所设立工程类专业研究生学位。此举不仅有助于培养人工智能领域的专业人才,还可以成为促进人工智能企业间合作的平台。例如,美国加利福尼亚大学伯克利分校的“人工智能开放共享研究”项目就通过与Meta、微软、谷歌、亚马逊等企业合作研究,并将其校园内的相关数据、代码、结果以非独家形式公开,以促进人工智能领域的开放式研究。在中国,政府同样可以考虑通过鼓励多家企业共同参与人工智能相关学位点建设,提供更多共享资源的机会,并间接促进企业在科学研究方面的合作。
加强中美两国优势互补型合作,共同推动解决未来人类社会发展所面临的关键问题。中美两国在人工智能方面如何开展优势互补型合作也是发展中国人工智能产业需要重点考虑的问题。美国在人工智能基础层和关键技术领域处于领先地位,而中国在人工智能相关人才、数据和应用场景上也具有独特的优势。中国政府可以考虑与美国政府共同设立合作研究项目,特别是在人类社会发展面临的共同关键问题上进行合作,如医疗、环境、教育挑战等。这些合作项目应该涵盖政府部门、研究机构和企业,以提升中国人工智能企业的国际化合作程度,并通过有效整合资源、人才和技术专长推进全球人工智能产业的发展。
对于美国的人工智能产业
持续加强人工智能基础技术的研究与资金投入至关重要。美国人工智能头部企业在基础技术层面拥有显著优势,这为全球人工智能的发展奠定了坚实基础。通过投资长期研究项目,例如量子计算与人工智能的结合,将有助于探索下一代人工智能技术的潜力,为未来技术变革提供动力。
开放式创新是加速技术突破的关键。美国人工智能头部企业应继续深化与学术界及同行业企业的紧密合作,共同孵化新技术。特别是在与中国企业的合作方面,美国企业可以依托其在人工智能基础研究方面的深厚积累,与中国企业在人工智能应用实施方面的广泛经验相结合,共同开发出满足多样化市场需求的解决方案。
作为人工智能领域的先锋,美国企业应推广利用人工智能技术解决全球性问题。例如,增加对能源、环境和生命健康等人类社会重大问题的研发投入,探索人工智能在解决全球性危机中的作用。
(作者:杨锡怡、周小宇,上海科技大学创业与管理学院;贾佳,上海科技大学图书信息中心;汪寿阳,上海科技大学创业与管理学院 中国科学院预测科学研究中心 中国科学院数学与系统科学研究院;编审:金婷;《中国科学院院刊》供稿)