刚刚,斯(sī)坦福全(quán)球AI报告正式发布。
从去年开始,斯坦福大学主导、来(lái)自MIT、OpenAI、哈佛(fó)、麦肯锡等机构的多位专家(jiā)教授(shòu),组建(jiàn)了一个小组,每年发(fā)布AIindex年度报告,全面追踪(zōng)人工(gōng)智能的发展现状和(hé)趋势(shì)。
“我们用硬数据(jù)说话。”报告的(de)负责人、斯坦福大学(xué)教授、前任谷歌(gē)首席科学(xué)家YoavShoham谈(tán)到这份最新的报(bào)告时(shí)表示。
今(jīn)年的报告,从学术、工业、开源、政府等方面(miàn)详细介绍了人工智能发展的现状,并且记录(lù)了计算机视觉、自(zì)然语言理解等(děng)领域(yù)的技术进(jìn)展。
报告要点:
一、美国AI综合(hé)实力最强
美(měi)国的AI论文发布数(shù)量虽然(rán)不是(shì)第一,但美国学者论文被引(yǐn)用的次数(shù)却是全球第一,比(bǐ)全(quán)球平(píng)均水(shuǐ)平高出83%。
2018年美国AI创业公司的(de)数量,比(bǐ)2015年增长2.1倍。而(ér)从2013年到2017年,美国AI初创企业(yè)获得的融资额增长了4.5倍。均高于平(píng)均水平一(yī)倍(bèi)以上。
二、中国AI追赶速度惊人(rén)
清华2017年学AI和机器学(xué)习的学生(shēng)数量(liàng),是2010年16倍。
70%的AAAI论(lùn)文来自(zì)美国或(huò)中国(guó),两国获(huò)接收的(de)论文数量相近,但(dàn)中国提(tí)交的论文总量比美(měi)国多30%。
基于(yú)经同行评议论文数(shù)据库(kù)Scopus的数据,2018年(nián)发布AI论文(wén)最多(duō)的(de)地区(qū)是欧洲(28%)、中国(25%)和美(měi)国(17%)。
与(yǔ)2000相比,2016年中国AI学者论文被引用的次(cì)数,提高了44%。
中国一年的机器人部署安装量,从2012到(dào)现(xiàn)在(zài)增长(zhǎng)了500%。ROS.org来自中(zhōng)国的访(fǎng)问量,2017年比2012年增加了18倍。
三、全球AI发展提速但(dàn)仍不均衡
2017年,全球ML人才需求已经是(shì)2015年的35倍。
整体来说(shuō),自2016年以来,美国、加拿(ná)大、英国(guó)政府在国会/议(yì)会会议中(zhōng)对人工智能(néng)和机器学习的提及(jí)激增(zēng)。
80%的AI教授是男性,统(tǒng)计数据来自UC伯克利、斯坦(tǎn)福、UIUC、CMU、UCLondon、牛津(jīn)和苏黎世联邦理工学院。
美国AI工作岗(gǎng)位的应聘(pìn)者中71%为(wéi)男性。
看过这份(fèn)报告之后(hòu),人工智能大牛吴恩(ēn)达总结(jié)了两点(diǎn):1、AI正在快速(sù)发(fā)展,不(bú)管是(shì)学术(shù)界还是(shì)工业界都是如此。2、AI的发(fā)展仍不均衡,在多样性(xìng)、包容性方面仍需(xū)努力。
以下(xià)是这份报告的主要内容:
AI论文(wén)情况分析(xī)
发表总量增长迅猛
从1996年到2017年,CS领域的年发表(biǎo)论(lùn)文(wén)增长了约五倍(6x),AI领(lǐng)域的年发表论文增长了约七倍(8x)。对比一下,所有(yǒu)学科的年发(fā)表论文总(zǒng)量增长了不到两(liǎng)倍(
划重点,AI论(lùn)文(wén)的年发表量,比(bǐ)CS论文增长要快(kuài)。
各地区AI论文(wén)发表情况
2017年(nián),Scopus上面的AI论(lùn)文,有83%来自美(měi)国以(yǐ)外的地方(fāng)。具体数据(jù)是,28%来自欧(ōu)洲,25%来自中国,17%来(lái)自美国。
从2007年到2017年,中国的年发表AI论文数增长了150%。
细(xì)分领域论文发表情况
2017年(nián)发表的AI论(lùn)文(wén)中,有56%来自机器学习(xí)与概率推理这一研究方(fāng)向。
对比一下,2010年发表的(de)AI论文,只有(yǒu)28%来自这个方向(xiàng)。
另(lìng)外(wài),图表里(lǐ)显示的大部分研(yán)究方向,在2014-2017年间,复合年均增长率(CAGR)比2010-2014年(nián)要高。
比如,神(shén)经网络这一方向的论(lùn)文(wén)发表数量,2014-2017年之间,复合年(nián)均增长率达到37%(如图中红(hóng)色曲线(xiàn)),最为突出。
做个对(duì)比,在2010-2014年(nián)之(zhī)间,神经网络论文发表数,复合(hé)年均增(zēng)长率仅有3%。
arXiv论(lùn)文(wén)
自(zì)2010年以来,arXiv论文总体(tǐ)呈现迅速增长,从(cóng)2010年发布的1,073篇,到2017年(nián)发布的13,325篇,增长超过11倍(12x)。许多细分领域也呈现(xiàn)增长。
这表示,论文作者们倾向于把自己的研究成(chéng)果传(chuán)播出去,不论是经过同行评(píng)审还是在AI会议上发表的(de)论文。这(zhè)也体现了,AI这(zhè)个领域竞争激烈的(de)特质。
在细分领域中(zhōng),计算(suàn)机(jī)视(shì)觉(CV)是(shì)自2014年(nián)起(qǐ)增(zēng)长最(zuì)快的一个(上图蓝色(sè)曲线),从1,099篇增长(zhǎng)到2017年的4,895篇,涨幅(fú)近400%。
AI论(lùn)文引用量
FWCI是(shì)领域权重引用影(yǐng)响系数,可以(yǐ)用来衡量论文的影(yǐng)响力。
报告重新定义(yì)了(le)一种“改(gǎi)装版”(Re-based)的FWCI,不按地(dì)区,而按世(shì)界平均值,来计算影响(xiǎng)力。
在这(zhè)个标准(zhǔn)之下,虽然欧洲发表的AI论文数高(gāo)于中国和美国,不过论(lùn)文影(yǐng)响力曲(qǔ)线比较平缓;相比之下,中国发表(biǎo)的论文(wén)影响力增长剧烈:与2000年相(xiàng)比(bǐ),2016年(nián)平均每(měi)位中(zhōng)国AI论文作(zuò)者的引用率增长了44%。
不过在(zài)这方面,美国(guó)依然全球领先,美(měi)国AI论文作者的平均引用率,比世界平均值(zhí)高(gāo)出83%。
AAAI论文
AAAI2018,提交(jiāo)论文,中美占70%,中(zhōng)选论文,中美占67%。
中国的(de)论文提交(jiāo)数高出(chū)美国约1/3,但二(èr)者中选论文数相差无(wú)几,中国入选265篇(piān),美(měi)国入选(xuǎn)268篇。
高(gāo)校AI课程注册情况
AI和ML进(jìn)军高校的速(sù)度提(tí)升了不少。
报告显示,截(jié)止到2017年底,AI课程注册人数是2012年的3.4倍,ML课程注册(cè)人数是2012年的5倍。
其中,UC伯克利的ML课程的注(zhù)册人数(shù)增长(zhǎng)最快,是(shì)2012年(nián)的6.8倍,但此数值较(jiào)2016年(nián)增长速度(dù)有明显下(xià)降。
报告进一步统计了(le)非美国地区院校(xiào)AI+ML课程注册(cè)人数的变化。结果(guǒ)显示,清华是非(fēi)美国院校外增长率最高的高校,几乎是第二名多伦多大学的2倍。
纵向(xiàng)对比来看,清华2017年AI+ML课程注册人数是2010年的16倍。
学术会议热度
在(zài)大型会议中(zhōng),NeurIPS(曾用(yòng)名(míng)NIPS)、CVPR和ICML,是参与人数(shù)最多的三大AI会议。自2012年以来,论参与人数的增长率,这(zhè)三者也(yě)领先于其他会议(yì)。
NeurIPS和ICML参与人(rén)数增长最快:将(jiāng)2018年与2012年相(xiàng)比(bǐ),NeuRIPS增(zēng)长(zhǎng)3.8倍(4.8x),ICML增长5.8倍(6.8x)。
上(shàng)面讨论的是大型会议,但小型会议的参(cān)与人数同样有明显的增长,甚至可以(yǐ)比大型会议的增长更加明显。
这里最突出(chū)的是,ICLR2018的参会人数达(dá)到了2012年的20倍。
原(yuán)因很可(kě)能是近(jìn)年(nián)来,AI领域越来越关(guān)注深度学习和强化学习了。
AI创业投资情况
从2015年1月到2018年1月,人工智能创业公司的数量增(zēng)长到了(le)原来的2.1倍,而所(suǒ)有活跃的创(chuàng)业公司增长到了(le)原来的1.3倍。
大多数情况(kuàng)下,创业公司的增长都保持相对稳定,而(ér)人工智能创业公司呈指数级增长。
在风投资金方面,从2013年到2017年(nián),人工智能领域的风投(tóu)资金增长到了原来的4.5倍,而所有的风投(tóu)资金只(zhī)增长到了原来的2.08倍。这(zhè)些数据都是年度数(shù)据,不是逐(zhú)年累(lèi)积的。
图(tú)表中有两(liǎng)个高峰(fēng)期,1997-2000年风投资金的(de)激增,对(duì)应的是(shì)网络泡沫时期。2014-2015年出现了一(yī)个较小(xiǎo)的增长,因为当时正处(chù)于一个相对较大的经(jīng)济增长时期。
人才需求(qiú)
报告显示,近几(jǐ)年,社会需(xū)要的(de)AI相关人(rén)才大幅度增加(jiā),目前(qián)对有ML技能的人(rén)才(cái)需求最(zuì)大,其次是深度学习。
可以看(kàn)出,ML人才(cái)需(xū)求也是这两年增长速度最快的。
报告统(tǒng)计,2017年,全(quán)球(qiú)ML人才(cái)需求是(shì)2015年的35倍,从2016年(nián)到2017年的(de)增幅尤为明(míng)显。全球对AI人才的需求(qiú)在2016年骤增。
专利
2014年,大约30%的人工智能专利发明人来自美国,其次(cì)是韩国和(hé)日本,各拥有16%。
在韩国和(hé)中国(guó)台湾(wān)地区,专(zhuān)利的增长速度较快(kuài)。2014年(nián)人工智能专利的数量几乎是2004年(nián)的5倍(bèi)。
财报(bào)电话会议中提及AI和ML的次(cì)数
2015年,科技公司在(zài)财报电话会议中提及AI和(hé)ML的次数(shù)开始有所增加。
2016年,其他行业提及AI次数才开始增长。
相比之下,科技行业的公司提及AI和(hé)ML的次数远比其他行业多。
在财报电话会议(yì)中,除了科技行(háng)业之外,提及AI次数(shù)最多的(de)公司,基本(běn)上分(fèn)布在消费、金融和医疗保健行(háng)业。
机器人安装量
2012年到(dào)2017年,中国机(jī)器人年安装量增长了500%,其他地区,比如韩(hán)国和欧洲,分别(bié)增长(zhǎng)了105%和122%。
在安装量(liàng)较小的地区中,中(zhōng)国台湾比较突出,在(zài)2012-2017年增长最快。
开源(yuán)框架(jià)GitHub标星数
各框架(jià)的标(biāo)星数(shù)反映着他们在开发(fā)者(zhě)群体中的流(liú)行程度。不过,因(yīn)为开发者(zhě)们(men)日常不会“取关”GitHub项目,所以这些星(xīng)星都是多年来积攒下的。
我们可以明显发现,TensorFlow的(de)受欢迎程度在开发者中遥遥领(lǐng)先、稳步增长。
排除(chú)了第一热门,第二名和第(dì)三名分别是scikit-learn和BVLC/caffe。
TensorFlow官方力推的(de)keras排到了第四,但近一年来几无增长势头(tóu)。
另外(wài)两大(dà)热门PyTorch和MXNet分别排到(dào)了第(dì)七和第六,尤其是(shì)PyTorch,作为一个年轻的框架(jià),自2017年初(chū)发布以来至今,GitHub标星数至(zhì)少增长了4倍。获取新用户的势头(tóu)很猛,不知道其中有多少被(bèi)TensorFlow逼疯的人类(lèi)。
各类任务最新成绩
这个部分(fèn)分为CV和NLP两(liǎng)块,分别列(liè)举了各主流任务从发展之初到现(xiàn)在的(de)成绩进步情况。
ImageNet图像识别准确(què)率
2017年是ImageNet比赛的最后(hòu)一届,2018年这项比赛就不再进(jìn)行了。不过,验证集依然有人在用。
蓝色的线条为ImageNet挑(tiāo)战赛历年的成绩变化,由(yóu)于每年比赛所用的数据(jù)不(bú)同,旁边多了一条(tiáo)黄色线条,是以ImageNet2012验证(zhèng)集为评(píng)价标准绘制的。
可以看出,到2015年,机器(qì)在图像分类任务上(shàng)的能力已经明显超越了人眼,而即使比赛不再继续(xù),学术(shù)研究者依然在认真推进该(gāi)任务的表现。
这也侧(cè)面说明,如(rú)果一项工作有了明确的评价标准和固定(dìng)的(de)挑战内容,研究者们围绕此竞争,更容易(yì)让技术在该领域取得突破。
ImageNet训练速度
这张(zhāng)图(tú)是训练ImageNet图像(xiàng)分类神经(jīng)网络所需时间的历年变化(huà)(当然,是(shì)买得(dé)起足够(gòu)计算资源的人和机构所用的(de)时长)。
从2017年6月的1小(xiǎo)时,到2018年11月(yuè)的4分钟,ImageNet图像分类神经网络的训练速度提升了16倍,除了硬件(jiàn)方面的贡献,算法上的提升也不容小觑。
图像(xiàng)分割(gē)COCO
ImageNet挑战赛“退(tuì)休(xiū)”之后,CV领域的朋友们就(jiù)把重点放在了(le)微软(ruǎn)的(de)COCO,挑战(zhàn)语义分割和实(shí)例分割。
四年来,COCO数(shù)据集上图像分割挑战的精确度已经提升了0.2,2018年(nián)的成绩比(bǐ)2015提升了72%。不过,目前还没(méi)有超过0.5,这一项还(hái)有充足的进步(bù)空间。
另外值得一提(tí)的是,COCO比赛近年来占据冠军位置的(de)多是来自中(zhōng)国的公司,包括旷视、商汤等计算机视觉独角(jiǎo)兽日常包揽数个项目的冠军。
语(yǔ)法分析(Parsing)
在确定句子结构这(zhè)种语法分(fèn)析的(de)任务上(shàng),2003年到(dào)2018年的15年间,AI的表现(F1Score得(dé)分(fèn))提(tí)升了将近10%。
机器翻译
在机器翻译任务上(shàng),报(bào)告拿英语-德语互相翻(fān)译举例,评估了(le)AI模型在经典机器翻译评估算法BLEU标准中(zhōng)的(de)表现。
报告(gào)显示,2018年(nián)英(yīng)语转(zhuǎn)德语的BLEU评分是2008年的3.5倍,德语转英语成绩(jì)是2008年的2.5倍。
机器问答:AI2ReasoningChallenge(ARC)
在问答领域,AI表现进(jìn)步更明显,可以按月计(jì)数了(le)。
报告(gào)统计了2018年从四(sì)月到11月间,AI在ARC推理挑战赛(sài)上成(chéng)绩的(de)变(biàn)化:简(jiǎn)单(dān)组(zǔ)得分从63%提升到69%,挑战组得分从27%提升到42%。
这些,都仅是半年间的进步。
机器问答:GLUE
同样(yàng)用于(yú)机器问答的GLUE基准(GeneralLanguageUnderstandingevaluation)推出至今只有7个月的时间,但目(mù)前的表现(xiàn)已经比半年前提(tí)升了90%。
GLUE的推出者、纽约(yuē)大学助理教(jiāo)授SamBowman说,虽然围绕GLUE的大型社区还没有(yǒu)出现,不过已(yǐ)经有了(le)像谷歌BERT这(zhè)样的代(dài)表性技(jì)术用了GLUE基准,面世一(yī)个月内已经被引用8次。在EMNLP会(huì)议中,GLUE时常被(bèi)讨论,可能会成(chéng)为(wéi)语言理解领域中的一个基准线(xiàn)。
政(zhèng)府提及(jí)
整体来(lái)说,自2016年以来,美国、加拿(ná)大、英国(guó)政府在(zài)国会/议会会议中(zhōng)提及人工智能和机器学习的(de)次(cì)数激增。
2016年之(zhī)前,机器学习很少被提及,与人工智(zhì)能相比(bǐ),机器(qì)学习在(zài)总提及量中(zhōng)只(zhī)占很小的一部分。