加载中...请稍后..

人工智能系列报告之(一)

发布日期:
2018-04-10
浏览量:
74021

一、人工智能热度不断提升

 

    自2012年以来,由谷歌、Facebook(FB)、苹果、英特尔等科技巨头发起的AI创企收购项目达200多个,仅2017年第一季度就有30多起并购。其中,谷歌是最为活跃的收购方(11起)、苹果次之(7起)。除了科技公司,福特也在今年Q1以10亿美元买下网络安全公司Sophos。

 

 

人工智能搜索热度示意(对比大数据)

 

 

2012年至今人工智能并购案示意

 

除了收购,专利研发层面,巨头们也是步步紧咬,有趣的案例包括谷歌的照片视角重构和FB基于深度学习的标签预测模型。

 

微软、谷歌、亚马逊、FB、苹果专利数示意

 

人工智能创业热

2012年来,人工智能相关的股权融资已有2250起,融资额达149亿美元。

 

采用人工智能算法的独角兽公司列表

 

 

期间,上亿的巨轮融资项目包括(2亿美元,2016年,A轮)、网络安全公司StackPath(1.8亿美元,2016年,私募)、医疗公司Flatiron(1.75亿美元)、医疗公司碳云智能(1.54亿美元)、生命科学公司zyme(1.3亿美元)。其中,2017年第一季度是种子轮/天使轮最为活跃的一季(48%)。

 

人工智能2012-2017年第一季度融资情况

(柱状图为金额,单位:百万美元;折线图为交易宗数)

 

 

人工智能项目不同阶段的融资情况

 

从投资方来看,随着技术进步和市场扩张,风投所占的AI相关领域的资本比例不断增加,参与者从2012年的127家增至2016年的492家,公司投资、私募、资产/投资管理参与者的数量也是逐年攀升。其中,比较活跃 的投资方包括Data Collective、英特尔资本、NEA、khosla风投、GV、硅谷天使投资基金、Accel Partners、PlugandPlay、通用催化风投。

 

AI相关资本介入方种类

 

 

人工智能可以做什么

最大的进展来自于两大领域:感知(perception)和认知(cognition)。在前一类中,最前沿的进展大部分是和语音相关的。语音识别还没有达到完美,但现在有数百万人已经在使用它们了——想想Siri、Alexa和Google Assistant。你现在正在阅读的这篇文章最初是由我们口述给计算机的,已经比我们自己打字更快了。斯坦福大学计算机科学家James Landay和他的同事进行的一项研究发现,语音识别的速度大约是手机上打字速度的三倍。语音识别的错误率已经从过去的8.5%,下降到4.9%了。令人惊讶的是,这种实质性的进步并非在过去10年,而是从2016年夏天开始。

 

(1)图像识别

图像识别领域的进展也让人惊叹。你可能已经注意到,Facebook和其他app现在已经能从你上传的图片中识别出你的朋友,并提示你用他们的名字来标记他们。在你的智能手机上运行的app可以识别任何野生鸟类。图像识别甚至取代了公司门禁卡。自动驾驶汽车中所使用的视觉系统,在识别一个行人的时候,通常会在30帧中出现一次错误(在这些系统中,相机记录大约每秒30帧);而现在,它们的错误频率要少于1千万帧。ImageNet这个大型数据库中识别图像的错误率,已经从2010年的30%下降到了2016年的4%。

近年来,随着大规模深度神经网络的使用,AI领域的进展日新月异。当然,目前基于机器学习的视觉系统还远远没有完美无缺——但即使是人也不是无所不能的嘛。

 

(2)认知和解决问题方向

AI领域第二类的主要进步是集中在认知和问题解决方向。机器已经打败了最优秀的(人类)扑克玩家和围棋选手——虽然原来专家们预测至少还要再过十年。谷歌的DeepMind团队使用了机器学习系统来提高数据中心的冷却效率提升了15%。像Paypal这样注重网络安全的公司也正在用AI来检测恶意软件。由IBM技术支撑的系统使得新加坡一家保险公司的索赔过程进入了自动化。数十家公司正在使用机器学习来帮助进行金融交易决策,而且越来越多的信贷决定是在AI帮助下做出的。亚马逊采用机器学习来优化库存,并提升给客户的产品推荐。Infinite Analytics公司开发了一个机器学习系统来预测用户是否会点击某个特定的广告,为一家全球消费包装产品公司的在线广告位置进行了优化。另一个开发的系统帮助巴西的一家在线零售商改进客户的搜索和发现过程。第一个系统将广告的ROI提升了三倍,而第二个系统使得年收入增加了1.25亿美元。

机器学习系统不仅在许多应用中取代了旧有的算法,而且在许多曾经被人类做得最好的任务上也占尽先机。尽管这些系统并不完美,但它们的错误率已经表现比人类更好了。语音识别,即使在嘈杂的环境中,现在也几乎等同于人类的表现。这为改变人们的工作和经济带来了巨大的新可能性。一旦基于AI的系统在给定的任务中超过人类的表现,它们就更有可能迅速传播。例如,Aptonomy和Sanbot,这两家分别是无人机和机器人的制造商,他们正在使用改进的视觉系统来自动化大部分保安人员的工作。软件公司Affectiva使用它们来识别诸如快乐、惊讶和焦点小组的愤怒等情绪。Enlitic是几家利用AI来识别医疗影像,进而帮助诊断癌症的深度学习的初创公司之一。

 

人工智能市场逐鹿

CB Insights整理出了百强AI创企,覆盖聊天程序、视觉、汽车、机器人、网络安全、商务智能与分析、广告与销售与客户管理、核心/前沿技术、医疗、文本分析、物联网、消费、金融与保险等领域。

目前,国内对于AI的支持力度也比较大,在学术方面也有很是很大的研究热点。学术机构,以及百度、阿里、腾讯等公司也在语音识别、图像识别、神经网络、自然语言处理等方面都有重要的突破。金准数据认为,国内AI市场将从2015年的12亿元增至2020年的91亿元。

 

总的来看,AI创业运动中,比较热门的领域包括医疗(270起)、横向应用(79起,包括文本分析/ 搜索引擎、视觉、聊天程序等)、金融与保险(30起),其他包括销售、客户管理、网络安全等。

 

 

智能医疗创业地图

 

 

横向AI应用创企示意

 

 

机器人创企地图(2012年以来融资$30亿,488起)

 

 

智能商务创业地图

 

 

早期智能物联网/工业物联网创企示意

 

除了上述热门创业方向之外,还有即将抬头的AI相关创业项目:游戏、监管科技(REG Tech,金融科技的分支)、专业自动化(如论文评分、行程规划、法务)等,可以看到这几大项目的交易热度近年来显著上升,一方面是相关市场的急速拓展,另一方面,人工智能在专业、特定方向上的技术应用也趋于成熟。

 

 

不同领域的AI创业热度及趋势示意

 

二、AI火热的原因分析

1、宏观趋势

人工智能背后代表的先进生产力能够带来巨大的经济效益,因此一直吸引着研发投入。

自1956年达特茅斯会议诞生“人工智能”一词 以来,技术发展已经取得了质的突破:大数据和数据处理技术的逐步成熟,包括深度学习算法的提出,以及适合海量训练数据的GPU的引入,开启了人工智能的入口。

算法和芯片是AI建设的基础层,除了当前AI市场主流芯片,即英伟达的GPU之外,英特尔(收购Nervana Systems;FPGA)和谷歌(研发Tensor)也在推广自己产品。除了目前主流的两种改善通用芯片用于半定制的深度学习算法之外,业内也在积极研发面向人工智能应用的新的芯片,包括谷歌的TPU、我国中科院计算所的寒武纪,这类的针对特定算法以及特定框架的全定制AI芯片,以及更近一步的,IBM 的TrueNorth这类的类脑芯片(BPU)。

 

人工智能芯片一览

 

算法,尤其是深度学习算法领域,则不是巨头垄断,而是掀起了一波包括计算机视觉、语音交互、机器人/自动化、医疗、安全、消费、商务等领域的创业潮。巨头们往往选择更为基础的算法框架入手,进行开源,以构建自家AI生态,如谷歌的TensorFlow和微软的Cognitive Toolkit。

 

 

深度学习创业潮

 

2、当前进展

除了基础层建设,AI的前沿进展还包括马斯克的脑机接口项目、基于ARM的深度学习芯片以及英伟达面向医疗的应用、聊天程序/聊天机器人发展出了自己的语言、英特尔的自动驾驶技术研发等。

金准数据分析:目前我国71%的人工相关企业都在做技术落地应用,在算法技术方面,55%的企业在做计算机视觉,13%在做自然语言处理,只有9%的企业真正研究机器学习。能够很快把技术应用落地是我国的优势,但是对于基层的技术研究,我国的企业实力目前还无法和国外匹敌,这是劣势。”

我们现在看到的AI,距离它正解还很远,不到它真正的能力的5%。

 

当前的AI应用

 

 

三、巨头们关于数据与算法的讨论

1、百度站定算法

李彦宏曾在重庆举行的联盟峰会上说过:我们百度的工程师总结出来一句话,叫‘数据秒杀算法’,但是我后来跟他们讲,真正推动社会进步的是算法,而不是数据。

 

在之后的数博会上,李彦宏再次表达过类似的意思:工业时代最宝贵的东西不是煤,是蒸汽机这样的技术革命、革新,而人工智能时代最宝贵的也不是数据,是因为数据带来的技术的创新。

让我们简单看一下百度大数据的“家底”,其实用两个短语就可以概括:万亿级搜索数据,百亿级定位数据。

试以语音相关的数据为例。作为百度 ALL IN AI 的两大发力方向之一(自动驾驶和智能语音),百度如此展示自己在相关数据上的肌肉:

网上流传一句话,说百度是“数据为重,不为上。” 作为很可能是 BAT 三家中数据量最大的公司,百度的优势在于数据最全面,数据样本比较复杂,数据的广度和多样性上比较强。而问题在于,百度的数据,较之阿里和腾讯,其变现能力可能是最弱的。

 

作为一家技术驱动的公司,百度在数据挖掘技术和 AI 人才的储备上优势明显,但其优势的应用出口较少。也正是在这种背景下,李彦宏在数博会上发言:我觉得这个数据确实重要,没有数据训练的话人工智能走不到今天的,但是数据是不是根本呢?数据不是根本,数据有点像新时代的能源,像燃料,那么推动时代进步的是技术,是创新,不是这些资源......所以工业时代最宝贵的东西不是煤,是蒸汽机这样的技术革命、革新,而人工智能时代最宝贵的也不是数据,是因为数据带来的技术的创新。而且过去一年就有这么多的创新,有大幅度的提升,连我在这个领域的人都要觉得要改变心态,适应这种环境,适应各种各样的可能性。

 

2、阿里、腾讯等多家巨头:数据+场景才最重要

阿里的大数据是基于淘宝天猫业务而诞生的电商数据、信用数据。阿里的核心业务在电子商务上,数据比较聚集,更容易做分析。这种数据类型的优势在于,更容易变现,挖掘出商业价值。正如马云在数博会上所说:“我们对世界的认识将会提升到一个新的高度,大数据会让市场变得更加聪明。”

而腾讯的大数据是基于微信、QQ 诞生的社交数据、关系数据,以及游戏数据,相对较杂,但场景化极高。很自然的,马化腾在数博会上强调了场景的意义:“有了应用场景,有了市场,数据自然会产生,也会驱动技术发展。”“就好像今天BAT三家分别在社交、电商和搜索有各自的主战场和场景;滴滴、摩拜有交通出行的场景;微信、支付宝有支付场景。”腾讯的大数据是其自身各类产品(尤其是游戏)成功的坚实基础。

对于场景化的数据,我们还很容易想到滴滴出行和小米,它们分别在各自的场景中收集并利用其数据优势。

 

滴滴出行基于大数据的路径规划系统

滴滴研究院副院长叶杰平曾在北大 AI 公开课上透露:下面说一下我们的大数据......我们每天大概2000万单,平台的每一辆在开着的车,每几秒钟就会给我们传递 GPS 信息。现在滴滴每天新增的数据量是 70TB,这个数据应该是几个月之前的,现在应该更大了。我们平台在做很多的预测和模型,每天处理的数据是2000TB。每天的路径规划是 90亿,这个数据量特别大。然后是定位数据,我们必须要知道乘客在哪,司机在哪,所以定位是非常重要的,这个数据不光要精确,而且要快速。定位数据每天是 130亿.....”

小米科技联合创始人黄江吉在北大 AI 公开课上也曾透露:“小米全部产品加起来,每天产生的数据量一天是300T。为了存储这个300T,每天我们付出的存储成本是天文数字。为什么我们要存储大量昂贵的数据?其实我们等 AI 这个弯道已经等了很久,终于在去年迎来爆发点。现在,我们有可能利用最前沿的技术,比如深度学习、对抗性网络来取得进一步发展。现在技术发展是以周计算。这对于我们都是好消息。因为技术发展到这个点的时候,我们已经准备了很多大数据。这些技术可以用来验证算法是否靠谱,可以把我们的产品变得更智能化,真正实现闭环。大数据其实讲了很多年。我刚进入微软的第二年,就开始做data warehouse,当时已经存了海量数据,都觉得大数据很有价值......我们对于数据增长很开心,并不在意成本。”

 

从这个角度来说,大数据对 AI 的赋能,确实是从应用场景中来,到应用场景中去的。

 

 

 

 

 

 

 

 

 3、谷歌的大数据野心

 

过去十年中,在计算机视觉领域,虽然计算力(GPU)和模型大小不断增长,数据集的规模一直停步不前。

这项研究,用了 50 颗 K80 GPU(计算等于 8.3 GPU 年),花了整整两个月,在 300M 标记图像的海量数据集上进行图像识别训练。这个名叫“JFT-300M”的内部数据集,含有 18291 个类别,是 ImageNet 的 300 倍。这一研究项目的初衷是看在不调整现有算法、只是给模型多得多的数据的情况下,能否取得更好的图像识别结果。

 

在 JFT-300M 不同子集上的预训练后,进行物体检测的性能。x 轴表示对数刻度的数据集大小,y 轴是 COCO-minival 子集mAP@【0.5,0.95】中的检测性能。

答案是可以。研究人员发现,随着数据增长,模型完成计算机视觉任务的性能直线上升。即使在 300 倍 ImageNet 这么大规模的情况下,性能都没有遭遇平台。谷歌研究人员表示,构建超大规模的数据集应当成为未来研究的重点,他们的目标是朝 10 亿+ 级别的数据进发。

 

四、人工智能商业之路简析

1、前景展望

刚刚过去的首届世界智能大会上,科技部部长万钢表示,最近新一代人工智能发展规划已编制完成,规划对直到2030年的中国人工智能产业进行系统的部署,同时包括与此相关的人工智能重大科技项目。

与此同时,随着技术的进步与需求的拓展,人工智能也掀起了一股投资潮和创业热。资本、技术、政策三重利好的情况下,人工智能的应用场景也在打开。市场调研显示,截至2030年,人工智能将为全球GDP带来14%的增长,也就是15.7万亿美元。其中,6.6万亿美元来自生产力的提高,9.1万亿美元来自相关消费/商业市场。

 

2、障碍与风险

与人类不同,机器还不是很好的故事讲述者,他们不能总是给出一个理由。具有讽刺意味的是,即使我们已经开始克服Polanyi的悖论,我们也面临着另一个版本:机器知道的比它们能告诉我们的更多。

这将带来三个风险。首先,机器可能有隐藏的偏见,不是来自设计者的任何意图,而是来自提供给系统的数据。举个例子,如果一个系统了解到哪些求职者在面试中使用了过去招聘人员所做的一系列决定来接受面试,那么它可能会无意中学会将他们的种族、性别、种族或其他偏见延续下去。此外,这些偏差可能不会作为一个明确的规则出现,而是被考虑到成千上万个因素之间的微妙交互中。

第二个风险是,与传统的基于显式逻辑规则的系统不同,神经网络系统处理的是统计学上的真理,而不是真实的事实。这可能会使证明系统在所有情况下,尤其是在没有在培训数据中表示的情况下工作很难,甚至不可能。缺乏可验证性对于任务型的应用场景是一个问题,例如控制核电站,或者涉及生死抉择。

第三,当机器学习系统确实出现错误时,几乎不可避免地会出现错误诊断和纠正错误。导致解决方案的底层结构可能是难以想象的复杂,如果系统被培训的条件发生变化,那么解决方案可能会远远不够理想。

尽管所有这些风险都是真实的,但适当的标准不是为了定义完美,而是最好的选择。毕竟,我们人类也有偏见、犯错误,并且很难如实解释我们是如何做出一个特定的决定的。基于机器的系统的优点是,它们可以随着时间的推移得到改进,并在提供相同数据时给出一致的答案。

 

五、总结

那人工智能和机器学习能做到一切事情吗?我们有时会听到“人工智能永远不会擅长评估感性、狡诈、善变的人类,它太死板、太没人情味了”等类似的抱怨。那么什么是AI和ML做不到的呢?

然而,像Affectiva这样的机器学习系统,在以声音或面部表情为基础来辨别一个人的情绪状态时,已经达到或超越了人类的表现。其他系统可以推断出,即使是世界上最好的扑克玩家也能在令人惊讶的复杂游戏中击败他们。准确地阅读人们是一件很微妙的工作,但这不是魔法。它需要感知和认知——确切地说,现在的机器学习是强大的,并且一直变得更强大。

讨论人工智能的极限可以从毕加索对计算机的观察出发:“但它们是无用的,只能给你答案。”它们当然不是一无是处,正如机器学习最近的胜利所彰显的那样,但毕加索的观察仍然提供了参考。电脑是用来回答问题的装置,而不是用来造问题的。这意味着企业家、创业者、科学家、创造者和更多的人,他们都要想,下一步要解决的问题是什么,或者有什么新领域要探索,这将是至关重要的。

商业世界的构造变革时代已经开始,由技术进步带来。就像蒸汽动力和电力一样,它本身也无法获得新技术,甚至无法进入顶尖技术人员,将赢家和输家区分开来。相反,它是那些思想开放的创新者,能够看到过去的现状,并设想出截然不同的方法,并且有足够的悟性把它们放在合适的位置。机器学习的最大遗产之一可能是创造新一代的商业领袖。

在我们看来,人工智能,尤其是机器学习,是我们这个时代最重要的通用技术。这些创新对商业和经济的影响不仅反映在他们的直接贡献上,也体现在他们能够支持和鼓励互补创新的能力上。通过更好的视觉系统、语音识别、智能问题解决以及机器学习带来的许多其他功能,新产品和新工艺正在成为可能。

虽然很难准确预测哪些公司会在新环境中占据主导地位,但一般原则是明确的:最灵活、适应性强的公司和执行力将会发展壮大。在AI驱动的时代,任何对趋势敏感且能快速反应的团队都更应该抓住这次好机会。因此,成功的策略是愿意尝试并快速学习。如果职业经理人们没有在机器学习领域增加实验,他们就没有在做他们的工作。未来十年,人工智能不会取代管理人员,但使用人工智能的经理将取代那些不使用人工智能的人。