产教融合研究院 产教融合大数据云平台

全球人工智能发展态势——基础技术领域

发布时间: 2024-12-13 来源: 科学观察


摘 要

[目的/意义] 揭示全球人工智能领域发展的现状与潜力,剖析我国在人工智能发展中可能面临的挑战,为我国科技政策相关部门制定该领域的布局规划提供参考。[方法/过程] 基于人工智能技术体系视角,以人工智能基础技术领域的WoS论文和DII专利为数据基础,运用文献计量方法,从总体趋势、文献总量的地理分布、高影响力论文的地理分布、重要机构、子领域态势以及应用领域六个维度展开分析。[结果/结论] 研究结论显示,该领域在基础研究和技术布局两个方面皆呈现两超(中、美)多强的格局,中国显示出较强的规模优势,但是在本体工程子领域的核心基础研究有待加强,国内本体工程子领域相关产业的发展有可能遭遇外国企业的专利壁垒。


关键词

人工智能;文献计量;专利;论文;基础研究;技术布局


1  引 言

人工智能(Artificial Intelligence,AI)亦称机器智能,是指由人制造出来的机器所表现出来的智能,所谓的智能,是指可以观察周围环境并据此作出行动以达到目的。通常人工智能是指通过普通计算机程序的手段实现的类人智能技术,人工智能的概念诞生于1956年。在半个多世纪的发展过程中,由于受智能算法、计算速度、存储水平等因素的影响,人工智能技术的发展经历了许多高潮和低谷。自2006年以来,以深度学习[2]为代表的机器学习算法在机器视觉、语音识别等领域取得了巨大的成功,使人工智能再次受到学术界和工业界的广泛关注。

虽然近年来人工智能已成为人尽皆知的热词,但其准确定义目前还没有统一共识。根据中国人工智能学会与罗兰贝格2017年联合发布的《中国人工智能创新应用白皮书》,人工智能是一门利用计算机模拟人类智能行为科学的统称,它涵盖了训练计算机使其能够完成自主学习、判断、决策等人类行为的范畴。中国国家标准化管理委员会发布的《人工智能标准化白皮书2018》将其定义为:人工智能是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。2022年我国首部人工智能产业专项立法《深圳经济特区人工智能产业促进条例》从技术角度对人工智能的概念作出了规定:人工智能是指利用计算机或其控制的设备,通过感知环境、获取知识、推导演绎等方法,对人类智能的模拟、延伸或扩展。

为准确了解全球人工智能领域发展的现状与潜力,有必要对中国及世界主要国家/地区的人工智能发展态势进行分析,剖析我国在人工智能发展中可能面临的挑战,为该领域的企业、研究人员和政策制定者提供参考依据。

本文以科研产出的重要形式——论文和专利为主要分析视角,基于Web of Science(WoS)论文数据和DII(Derwent Innovations Index)专利数据,对中国与世界主要国家/地区人工智能领域的产出规模、产出质量、地理分布、重要参与者等方面展开分析,揭示其发展趋势和特点。


2  数据与方法

2.1  人工智能技术体系

为了给分析内容提供清晰的框架,在广泛开展调研的基础上,参考了美国计算机协会(ACM)的分类体系、WIPO的人工智能技术分类体系和我国新一代人工智能发展规划等,结合行业专家的建议意见,研究并提出了人工智能领域主要技术构成体系,见图 1,分为三层:人工智能底层基础、人工智能核心技术和人工智能应用领域。人工智能底层基础主要包括AI芯片、AI传感器、云计算平台和开源框架等。人工智能核心技术包括基础技术和功能技术两个方面,其中,基础技术聚焦于统计和数学模型的高级形式,如机器学习、模糊逻辑和专家系统。功能技术聚焦于可以使用一种或多种人工智能基础技术实现特定功能,如语音处理、自然语言处理和计算机视觉等功能。人工智能应用层具体涉及交通、农业和生命科学等17个不同子领域。


  

图1  人工智能领域主要技术分类体系


2.2  数据检索


截止2022年10月,共计检索到专利546761项。其中,485545项(89%)专利涉及至少一种人工智能基础技术。为检索到的全部人工智能领域专利做了应用领域标引,每项专利都至少具备一个应用领域标签。图2展示了专利文献所涉及的分类之间相互重合。


图2  人工智能主要技术领域文献数据检索情况


截至2022年10月,共计检索到论文1158347篇。其中,316872篇(27%)论文涉及至少一种人工智能基础技术。为检索到的全部人工智能领域论文做了应用领域标引,每篇论文都至少具备一个应用领域标签。图2展示了论文文献所涉及的分类之间相互重合。


2.3  分析方法


本文主要采用文献计量方法,通过计量指标对人工智能基础技术领域发展态势的各个维度展开测度,包含论文数量及趋势、高影响力论文数量及趋势、重要机构、专利申请数量及趋势、专利公开地域分布及趋势以及文献增长率等基础性计量指标。数据处理和结果展示所用工具主要包括Derwent Innovation、DDA文献分析工具、Vosviwer知识图谱工具、DI ThemeScape专利地图以及Excel等。


3  分析结果

3.1  总体趋势


全球人工智能基础技术领域的基础研究处于规模扩张期。2016-2020年间,论文增长率为84%。1968-1989年的研究尚处于初步研究阶段,年发文量在100篇以下。1990-2009年的研究产出发展迅速,论文数量快速增长,第一次峰值出现在2006年,由于2006年大数据的推广和Hinton等人提出的深度学习技术,人工智能领域掀起一轮研究浪潮。2010-2013年,论文数量有所减少,研究热度稍有下降,随后自2014年起至今,相关论文数量再次快速增长,同时该领域的发文量占全球SCI/CPCI年度发文总量的比例也在逐年增加,相关研究一直处于高位活跃状态,2021年全球总发文量接近36000篇(见图 3)。



图3  人工智能基础技术领域论文发表趋势及全球占比趋势


人们对人工智能基础技术的工业应用越来越感兴趣,有意识地进行抢占市场的技术布局,2020年专利量/论文量比值比2015年增长了52%。在专利申请方面,该领域的专利申请量自2000年开始持续增长,2015年起呈激增态势,同时,专利量/论文量的比值越来越大,由2015年的1.58增长到2020年的2.41(见图 4)。



图4  人工智能基础技术领域科技文献量(论文和专利)变化趋势


3.2  地理分布


按照发文第一作者国家进行统计,得到人工智能基础技术领域发文主要来源国家/地区分布(见表1)。中国(77870篇)在发文数量上拥有绝对优势,其次为美国(42174篇)和印度(17321篇),英国、日本等也都是该技术研究较为集中的国家。TOP10国家发文总量合计205350篇,占全部发文量的68%。中国从2004年起在本领域的发展极为迅速,2005年发文量首次超越美国,跃居全球第一,远高于其他国家,2021年达到年度发文量的峰值(9988篇),而其他国家每年的发文量均在5000篇以下。论文数量可以从一定程度上反应不同国家在该领域的研究投入,TOP10国家中,大部分国家的发文峰值年为近两年,仅西班牙的发文峰值年位于2019年,可以看出,TOP10国家皆重视人工智能基础技术领域的基础研究投入。


表1  主要国家/地区在人工智能基础技术领域的科技文献分布及趋势



人工智能基础技术领域专利受理国家/地区排名前10的依次为中国、美国、日本、韩国等,中国(274908项)在专利申请数量上拥有绝对的优势。中国专利局受理的专利数量占据基础技术领域专利族的91%,美国专利局受理的专利数量占据基础技术领域专利族的50%,中国、美国已经成为人工智能功能技术领域专利权人最重视的保护地区,是各个国家和企业重点关注的区域,可以被视为人工智能基础技术领域的核心技术市场以及企业技术国际化市场战略的重要区域。

综上分析发现,中国、美国、印度和日本既是人工智能基础技术领域基础研究的强国,也是重要的技术来源国。英国、德国、西班牙、意大利、法国和加拿大也在持续加强人工智能基础技术领域的基础研究投入。中国和美国是产业竞争主体最重视的市场国,被视为基础技术领域的核心技术市场以及企业技术国际化市场战略的重要区域。


3.3  高影响力论文的地理分布


高影响力论文是指ESI(Essential Science Indicators)定义的高被引论文和热点论文的集合。其中,高被引论文(Highly Cited Paper)是指最近10年发表的论文中,总被引次数与同年度、同学科发表论文相比排名前1%的论文。热点论文(Hot Paper)是指发表于两年内且最近两个月被引用次数为各领域Top0.1%的文章。因此,高影响力论文的数量可以代表基础研究的影响力和质量。

统计主要国家/地区在人工智能基础技术子领域的论文发表情况(见表2),发现发文量排名靠前的热门研究领域各国的发文量均较多,但在某些领域,不同国家侧重点有所区别。例如中国在机器学习、深度学习、搜索方法、模糊逻辑和本体工程子领域发文高于美国,美国在概率推理和逻辑编程2个子领域的发文高于中国。


表2a  主要国家/地区在人工智能基础技术主要子领域的论文发表情况(单位:篇)



表2b  主要国家/地区在人工智能基础技术主要子领域的高影响力论文发表情况(单位:篇)



全球人工智能基础技术领域高影响力论文主要来源国家/地区包括中国、美国、澳大利亚、英国、新加坡等。中国在该领域的高影响力论文量共934篇,占该领域高影响力论文总量的55%,远高于其他国家,位居全球第一,是人工智能基础技术领域高影响论文最主要的来源国。其次是美国(127篇),印度(65篇)排名第3。

中国的高影响力论文涵盖了人工智能基础技术7个子领域中的6个,且每个子领域的高影响力论文数量均远超其他国家,5个子领域分别为机器学习、深度学习、模糊逻辑、搜索方法和逻辑编程,中国仅在本体工程子领域没有产出高影响力论文。美国的高影响力论文集中在机器学习、深度学习、概率推理和模糊逻辑4个子领域。

中国在大部分基础技术子领域的研究规模和研究影响力均超过其他国家地区,且研究影响力持续增长(2021年高影响力论文较2016年增长200%)(见图 5)。中国在概率推理和逻辑编程2个子领域的研究规模低于美国,但在这两个领域的研究影响力远超美国(中国高影响力论文量分别为31篇和4篇,大于美国的16篇和0篇),中国在本体工程子领域的研究影响力略低(没有高影响力发文)。美国的优势子领域在机器学习、深度学习和概率推理,其研究影响力增长不明显(2021年高影响力论文较2016年增长160%,但较2017年下降18.8%)。印度在基础技术子领域的研究规模和研究影响力位居全球第3,其优势子领域在机器学习、深度学习、搜索方法和模糊逻辑,印度在基础技术子领域的研究影响力持续增长(2021年高影响力论文较2016年增长250%)。澳大利亚虽然研究规模不领先,但其在机器学习和深度学习子领域的研究影响力位居全球第4,近年研究影响力增长不明显(2021年高影响力论文较2016年下降20%)。英国的优势领域在机器学习、深度学习、搜索方法和概率推理,近年研究影响力增长不明显(2021年高影响力论文较2016年增长50%,但是较2017年没有增长)。新加坡虽然研究规模并不领先,但其在机器学习、深度学习和概率推理子领域的研究影响力名列前茅,近年研究影响力波动较大。伊朗虽然研究规模与研究影响力并不领先,但其研究影响力一直在持续增长(2021年高影响力论文5篇,较2016年增长了4篇)。


图5  主要国家/地区在人工智能基础技术领域的高影响力论文发表趋势(单位:篇)


3.4  重要机构


全球人工智能基础技术领域的基础研究机构较为分散,基础研究的内容没有掌握在少数机构手中,TOP10机构发文总量为17362篇,占全球人工智能基础技术领域发文量的5.8%。中国机构在基础研究规模上占据优势,在论文发表量前10机构中占据7席,另外3个来自美国和新加坡(表3)。中国机构在技术布局规模上略微占优,在TOP10机构中占据6席,美国机构仅占3席,但是美国的3个机构分别占据第1位、第3位和第4位。美国IBM公司、中国国家电网、美国谷歌公司、美国微软公司和韩国三星电子是全球人工智能基础技术领域的专利申请量前5的机构。专利申请量前10的机构皆为企业,仅中国科学院作为研究机构上榜,位列第7(表4)。


表3  人工智能基础技术领域论文发表量TOP10机构



表4  人工智能基础技术领域专利申请量TOP10机构


3.5  基础技术子领域态势


全球人工智能基础技术领域科技文献(论文和专利)涉及的子领域分布如表5所示。搜索方法子领域的专利申请量占基础技术领域相关专利族的66.6%,论文数量占基础技术领域相关论文集的9.9%。其他子领域的专利数量占比皆低于论文数量占比。分析发现,搜索方法子领域的专利占比远高于论文占比,具有更广更明确可见的产业应用前景,全球竞争主体更加重视在搜索方法子领域的技术布局。


表5  人工智能基础技术主要子领域的论文和专利分布


表6展示了人工智能基础技术7个主要子领域的基础研究和技术布局态势。7个子领域皆于近年进入技术应用期。其中6个子领域皆在早期发表了大量论文,专利申请势头低于论文发表,处于研究储备阶段,近两年专利申请飙升,进入技术应用时期。仅在深度学习子领域,基础研究与技术布局几乎同步进行,竞争主体普遍看好深度学习相关技术的产业应用。


表6  人工智能基础技术主要子领域态势


主要国家/地区在AI基础技术7个子领域的专利申请呈现两超(中、美)多强(韩国、日本、印度)的格局。中、美在机器学习、深度学习、概率推理、模糊逻辑和逻辑编程5个子领域专利申请量分别位列全球第一、第二,在本体工程子领域专利申请量位列全球第二、第一。在搜索方法子领域,美国、日本、中国的专利申请量位列全球第一、第二和第三。韩国在7个子领域的专利申请量均位列全球前四,日本在机器学习、模糊逻辑、搜索方法、概率推理和逻辑编程个5子领域位于全球前四,印度在本体工程和深度学习2个子领域的专利申请量位于全球前四。

中科院在4子领域(搜索方法、机器学习、深度学习和概率推理)的基础研究中占据重要地位,且保持平稳的发展势头,尤其在搜索方法和概率推理2个子领域的基础研究呈加强之势;清华大学在4个子领域(搜索方法、机器学习、深度学习和概率推理)的基础研究中占据重要地位,在机器学习子领域的基础研究呈加强之势,在深度学习子领域近3年发文比例有所降低,有逐渐减弱之势;南洋理工大学在3个子领域(搜索方法、机器学习和模糊逻辑)的基础研究中占据重要地位,但是近3年在模糊逻辑子领域的基础研究有逐渐减弱之势。

IBM公司在5个子领域(搜索方法、机器学习、概率推理、逻辑编程和本体工程)的全球技术布局中占据重要地位。西门子公司在3个子领域(模糊逻辑、逻辑编程和本体工程)的全球技术布局中占据重要地位。在中国市场进行技术布局的机构主要为中国机构(包括国家电网、百度、浙大等),仅在本体工程子领域美国IBM公司占据重要地位。

近年一些公司和研究机构逐渐在基础技术领域进行技术布局,例如之江实验室开始在机器学习、深度学习和概率推理3个子领域布局专利,浪潮开始在搜索方法和逻辑编程2个子领域布局专利。

在中国市场进行专利申请的机构主要为中国机构,仅在本体工程子领域美国IBM公司的专利申请量位列第三。


3.6  基础技术的应用领域


对人工智能基础技术的7个子领域在17个应用子领域上的专利和论文数量进行统计,见表7和表8。


表7  人工智能基础技术的主要应用子领域(基于专利数据)


表8  人工智能基础技术的主要应用子领域(基于论文数据)


人工智能基础技术的基础研究主要涉及的应用领域为物理工程、成像技术以及自动控制等领域,其中机器学习子领域的基础研究涉及的应用领域最为广泛,达16个。专利技术主要涉及的应用领域为物理工程、通信、成像技术以及公共环境健康等,应用到公共环境健康领域的专利技术主要来自模糊逻辑、概率推理以及本体工程等子领域。


4  结 语

本文以WOS论文和专利为数据基础,通过科学计量学方法定量刻画了人工智能基础技术领域的发展特征。虽然定量指标难以全面洞悉该领域发展的微观细节,但以海量数据为基础的分析却可以在一定程度上揭示领域发展的宏观轮廓。本文重在从人工智能技术体系的视角,揭示全球人工智能基础技术领域的发展现状。统计数据表明,全球人工智能基础技术领域现状如下。

(1) 全球人工智能主要领域进入技术布局的热潮,人们对人工智能领域技术的工业应用越来越感兴趣,竞争主体有意识地进行抢占市场的技术布局,2020年人工智能基础技术领域的专利量/论文量比值比2015年增长了52%。

(2) 人工智能基础技术领域的7个子领域皆于近年进入技术应用期。全球竞争主体更加重视在搜索方法子领域的技术布局,同时普遍看好深度学习相关技术的产业应用。

(3) 中国和美国被全球竞争主体视为人工智能基础技术领域的核心技术市场以及企业技术国际化市场战略的重要区域,是各个国家、企业和机构重点关注的区域。中国专利局受理的基础技术领域专利数量占据其全球专利族的91%,美国专利局受理的基础技术领域专利数量占据其全球专利族的50%。

(4) 中国、美国、印度和日本是人工智能基础技术领域基础研究的强国,也是重要的技术来源国。英国、德国、西班牙、意大利、法国和加拿大在持续加强人工智能基础技术领域的基础研究投入。

(5) 在人工智能基础技术领域的7个子领域中,中、美两国在基础研究和技术研发方面全球领先,同时也是产业竞争主体最重视的市场国。韩国在7个子领域(搜索方法、机器学习、深度学习、概率推理、模糊逻辑、逻辑编程和本体工程)的技术布局占据重要地位,日本在6个子领域(搜索方法、机器学习、深度学习、概率推理、模糊逻辑和逻辑编程)的技术布局占据重要地位。韩国和日本的技术布局仅次于中、美,同时,日本和韩国被全球产业主体视为人工智能基础技术领域仅次于中、美的重要市场。

(6) 在人工智能基础技术领域,中国机构在研究规模上占据优势,在TOP10机构中占据7席。中国机构在技术布局规模上略微占优,在TOP10机构中占据6席,美国机构仅占3席,但是美国的3个机构分别占据第1位、第3位和第4位。

(7) 中国的高影响力论文涵盖人工智能基础技术中的机器学习、深度学习、模糊逻辑、搜索方法、概率推理和逻辑编程,且在每个子领域的高影响力论文数量均远超其他国家,仅在本体工程子领域没有高影响力论文产出。

(8) 人工智能基础技术的基础研究主要涉及的应用领域为物理工程、成像技术以及自动控制等,专利技术主要涉及的应用领域为物理工程、通信、成像技术以及公共环境健康等。

总体来看,人工智能基础技术领域的7个子领域皆于近年进入技术布局热潮,在基础研究和技术布局两个方面皆呈现两超(中、美)多强的格局。中国在本体工程子领域尚未产出高影响力论文,核心基础研究有待加强,国内本体工程子领域相关产业的发展有可能遭遇外国企业的专利壁垒,美国IBM公司在该领域的中国专利申请量遥遥领先。

如有内容错误或侵权问题,欢迎原作者联系我们进行内容更正或删除文章。


上一篇:35个!2024年国家先进制造业集群名单公布

下一篇:2024年10月新能源汽车市场分析