|
中国网/中国发展门户网讯 本文梳理 2021 年度斯坦福大学《人工智能指数报告》主要结论,以期为读者提供人工智能(AI)这一复杂领域的直观感知,并从多个角度展示新冠肺炎(COVID-19)疫情对人工智能发展的影响,为政策制定者、研究人员、企业高管及普通公众提供来源于全球的人工智能相关重要数据。
研发
2019—2020 年,全球发表人工智能领域论文的数量增长了 34.5%。这一数据大幅超出 2018—2019 年的增长比例(19.6%)。
在主要国家和地区中,发表同行评审人工智能论文数量最多的机构类型均是学术机构。但产出论文数量排名第 2 的机构类型在不同国家和地区却各不相同:在美国,各大企业附属的研究机构所发表的论文占论文总数量的 19.2%;而在中国和欧盟,产出论文数量排名第 2 的机构为政府。其中,中国政府机构产出论文数量占论文总数量的 15.6%,而欧盟的该数据为 17.2%。
2020 年,中国在世界范围内的人工智能期刊论文被引用次数首次超过了美国。2004 年,中国的人工智能期刊论文发表总数量曾短暂超过美国,后续在 2017 年又重新夺回领先优势。然而,在过去 10 年中,美国的人工智能领域相关会议论文被引用次数一直且明显高于中国。
受到 COVID-19 的影响,2020 年主要的人工智能相关学术会议大都以线上方式召开,因此登记的参会人数大幅增加。2020 年,9 个会议的参会人数相对 2019 年几乎翻了一番。
在过去的 6 年里,arXiv 上与人工智能相关的论文数量增长了 6 倍多,从 2015 年的 5 478 篇增长到 2020 年的 34 736 篇。
2019 年公开发表的人工智能论文的数量占全球同行评审科学论文总数量的 3.8%,高于 2011 年的 1.3%。
政策和战略
自 2017 年加拿大发布全球首个国家人工智能战略以来,截至 2020 年 12 月,已有 30 多个国家和地区发布了类似文件。
全球人工智能伙伴关系(GPAI)和经济合作与发展组织(OECD)的人工智能政策观察站、人工智能专家网络于 2020 年启动。这些国际组织的成立推动了政府间的协作,以共同支持面向所有人的人工智能发展。
在美国,第 116 届国会(2019 年 1 月—2021 年1 月)是美国历史上对人工智能关注度最高的国会。该届国会在立法、委员会报告和国会研究服务报告中提到人工智能的次数是第 115 届国会的 3 倍多。
经济
巴西、印度、加拿大、新加坡和南非是 2016—2020 年人工智能行业雇用人数增长最多的国家。尽管受到了 COVID-19 的影响,2020 年各国的人工智能行业雇佣的员工人数仍在继续增长。
更多人工智能领域的私人投资集中到了更少的初创公司中。2020 年的私人人工智能投资金额比 2019 年增加了 9.3%。这一数字比 2018—2019 年(5.7%)增加的比例更高。不过,新融资的人工智能相关公司数量连续 3 年减少。
尽管解决与使用人工智能相关的伦理问题的呼声越来越高,但行业内解决这些问题的努力仍然是非常有限的。例如,人工智能中的公平性和公正性等问题仍然很少受到公司的关注。此外,与 2019 年相比,2020 年认为“个人或个体隐私的风险与人工智能相关”的公司仍然很少,正在试图减轻或规避这些风险的公司比例并没有变化。
尽管 COVID-19 大流行导致了经济衰退,但麦肯锡的一项调查中有一半的受访者表示 COVID-19 并没有对他们在人工智能领域的投资产生影响。而实际上有 27% 的人表示他们的投资仍有所增加。只有不到 1/4 的企业减少了它们对人工智能的投资。
2019—2020 年,美国的人工智能相关工作岗位比例有所下降,这是 6 年来的首次下降。2019—2020 年,美国发布的人工智能总数也下降了 8.2%(从 2019 年的 325 724 个工作岗位减少到 2020 年的 300 999 个)。
教育
过去 4 年,世界顶尖大学加大了对人工智能领域教育的投入。构建或部署实用人工智能模型所需技能的本科和研究生课程数量分别增加了 102.9% 和 41.7%。
过去 10 年,北美地区更多的人工智能专业博士毕业生选择在产业界工作,而选择在学术界工作的则较少。其中,选择进入产业界工作的人工智能专业应届博士比例增加了 48%,从 2010 年的 44.4% 增至 2019 年的 65.7%。相比之下,进入学术界的人工智能专业应届博士比例下降了 44%,从 2010 年的 42.1% 降至 2019 年的 23.7%。
在过去 10 年中,在美国获得计算机科学博士学位的总人数中,人工智能专业博士人数所占比例从 14.2% 上升到 2019 年的 23% 左右。与此同时,其他以前非常流行的计算机科学博士学位的受欢迎程度有所下降,包括网络、软件工程和编程语言。与 2010 年相比,程序编译专业博士学位人数都有所减少,而人工智能和机器人/视觉专业则大幅增加。
在经历了 2 年的增长之后,北美地区的人工智能领域由大学转到产业界工作的教师人数从 2018 年的 42 人下降到了 2019 年的 33 人。2004—2019 年,美国卡内基梅隆大学(Carnegie Mellon University)人工智能领域的教师离职人数最多(16 人),其次是乔治亚理工学院(14 人)和华盛顿大学(12 人)。
2019 年,北美人工智能专业博士中国际学生的比例继续上升,达到 64.3%,比 2018 年增长 4.3%。在外国毕业生中,有 81.8% 的人留在美国。
在欧盟,绝大多数人工智能专业的学术课程都是在硕士及以上阶段开设的。学士和硕士阶段最常开设的课程是机器人学和自动化,而相关短期课程中最常开设的专业是机器学习(ML)。
伦理挑战
自 2015 年以来,提交给人工智能相关学术会议的论文标题中包含伦理相关关键词的论文数量有所增长。不过,在主要人工智能会议上标题能够匹配伦理相关关键词的论文平均数量多年来仍然较小。
2020 年,与人工智能伦理道德使用相关的五大最受关注的新闻话题分别是:欧盟委员会发布的人工智能白皮书、谷歌解聘道德研究员 Timnit Gebru、联合国成立的人工智能道德委员会、梵蒂冈的人工智能道德计划,以及美国 IBM 公司正在取消其人脸识别相关业务。
多样性问题
10 多年来,人工智能专业女性博士毕业生和计算机科学终身教职员工中的比例一直很低。美国计算机研究协会(CRA)的一项年度调查显示,北美人工智能专业博士的女性毕业生人数占该专业博士毕业生人数的比例还不到 18%。一项人工智能指数调查结果显示,在世界上的几所大学中计算机科学系终身教职员工中仅有 16% 是女性。
2019 年,在美国人工智能专业博士毕业生新移民中,45% 是白人,22.4% 是亚裔,3.2% 是西班牙裔,2.4% 是非裔美国人。
在过去 10 年中,白人(非西班牙裔)新毕业计算机博士的比例变化不大,平均约为 62.7%。而同期黑人或非裔美国人(非西班牙裔)和西班牙裔计算机博士的比例则明显下降,平均分别下降了 3.1% 和 3.3%。
近年来,全球人工智能顶级学术会议 NeurIPS 中的“Black-in-AI”(黑种人从事人工智能小组)研讨会的参与人数显著增加。2019 年参会人数和提交论文数是 2017 年的 2.6 倍,而接受论文数是 2017 年的 2.1 倍。
技术性能
生成一切。人工智能系统现在可以处理文本、音频和图像并生成足够高质量的产品,且有望生成大量的人工智能下游应用程序。这也促使研究人员致力于检测生成模型的技术研究。DeepFake 检测挑战赛的数据表明了计算机区分不同输出的能力。
计算机视觉的产业化。过去 10 年,得益于机器学习技术(特别是深度学习技术)的应用,计算机视觉研究取得了巨大进展。新的数据显示,计算机视觉正在实现产业化。在一些较大的基准库中,算法或模型的性能已经开始趋于平稳。这表明计算机视觉社区需要致力于开发和确定难度更大的基准,以进一步测试性能。各公司正在投入越来越多的计算资源,以比以往更快的速度训练计算机视觉系统。同时,用于已部署系统的技术,如用于分析视频静止帧的对象检测框架,正在迅速成熟,这表明人工智能将会进一步在产业场景中部署。
自然语言处理(NLP)超越了它的评估指标。得益于 NLP 的快速发展,已经出现了语言能力显著提升的人工智能系统,并且这些系统已经开始对世界产生了有意义的经济影响。谷歌和微软都在其搜索引擎中部署了 BERT 语言模型,而微软、OpenAI 等公司也开发了其他大型语言模型。NLP 的研究进展如此迅速,以至于它已经开始超过了用于测试它们的基准。例如,在 SuperGLUE上获得能和人类的智能水平相当的软件产品正在快速涌现。
关于推理的新分析。大多数技术问题的测量标准都会在固定的基准上显示出在当前时间点上的最佳系统的性能。而为人工智能指数开发的新分析方法提供了允许不断发展的基准的测量标准,并将一段时间内一组系统的总体性能归因于各个单独的系统。这些新分析方法应用于 2 个符号推理问题:自动定理证明和布尔公式的可满足性。
机器学习正在改变医疗和生物学领域的“游戏规则”。随着机器学习技术的引入,医疗和生物行业的格局发生了实质性的变化。DeepMind 公司的 AlphaFold 应用深度学习技术,在蛋白质折叠这一长达数十年的生物学难题上取得了重大突破。科学家利用机器学习模型学习化学分子的表示,以制定更有效的化学合成规划。一家人工智能初创公司在 COVID-19 流行期间使用基于机器学习的技术来加速发现相关的药物。
(《中国科学院院刊》供稿)