未来版图:全球聪明公司的科技创新趋势和商业化路径.pdf
http://www.100md.com
2020年1月19日
![]() |
| 第1页 |
![]() |
| 第10页 |
![]() |
| 第11页 |
![]() |
| 第22页 |
![]() |
| 第37页 |
![]() |
| 第763页 |
参见附件(2625KB,783页)。
未来版图:全球聪明公司的科技创新趋势和商业化路径,本书一共花了7年时间,探索全球195家公司,经过探索预测从而写出了这本书,非常适合科技人士、企业家来读。

未来版图内容提要
《麻省理工科技评论》作为世界上历史悠久、影响力极大的技术商业类杂志,每年都会依据公司的科技领军能力和商业敏感度这两个必要条件,从全球范围内选取50家未来可能会成为行业主导的聪明公司。
这些聪明公司,并非都是行业巨头,甚至专利数量、公司所在地以及资金规模都不在考察范围内。这些公司是“高精尖科技创新”与“能够保证公司利益的商业模式”的完美融合。无论公办私营,无关规模大小,这些遍布全球的公司都有能力创造并抓住新的机遇。
本书以2011—2017年的榜单为蓝本,在生物医学、能源材料、计算机与通信、互联网与数字媒体,以及交通运输等行业领域中挑选出在技术创新、商业模式上有亮点的、国内读者比较感兴趣的百余家聪明公司,并以时间为经、行业为纬,梳理这些公司的技术创新和商业沉浮。旨在让读者知道,从判断一个突破性技术到真正实现技术的共享、吸收应用与再创新是一个艰难而微妙的过程。这其中需要对技术由浅入深、从点到面全面认识和理解,而要进一步将前沿知识转移、共享,则更与这个领域内核心人员和社交圈的融合程度密切相关。只有处理好这两点,深度的技术整合应用才有可能。
未来版图作者
《麻省理工科技评论》(MIT Technology Review)于1899 年在美国麻省理工学院创刊,是世界上历史悠久,也是影响力极大的技术商业类杂志。内容覆盖广泛,涉及互联网、通信、计算机技术、能源、新材料、生物医学和商务科技几大领域。
如今,在全球范围内,每月有超过300万来自科技和商业领域的专业人士与leader,通过网站、手机应用、平面杂志以及各种活动组成的传播平台,分享前沿科技资讯。
目前,《麻省理工科技评论》拥有英文、中文、西班牙文、德文、意大利文等不同语言的9个国际版本,读者涵盖147个国家和地区。
《麻省理工科技评论》重点关注新兴科技及其对商业和社会的巨大影响力,为科技人士及商业领袖提供前瞻性的资讯和独到深入的行业趋势研究分析。目前,《麻省理工科技评论》已经脱离了最初的杂志形态,成为以数字科技和线下活动驱动的全球科技创新社区。
每年,《麻省理工科技评论》都推出3个榜单,分别为年度“10大全球突破性技术”,年度 “35位35岁以下科技创新青年”,以及年度“全球50大聪明公司”。
DeepTech深科技是一家专注于新兴科技的内容、文化和服务独立品牌,同时也是《麻省理工科技评论》(MIT Technology Review)中国大陆地区官方合作伙伴。
陈序,《麻省理工科技评论》中国版顾问,“赞赏”出版与BCINSIDE区块链实验室创始人;科技商业与投资观察家,英国《金融时报》中文网特约撰稿人。曾任美国《新闻周刊》中文刊执行主编、美国《机构投资者》中文网编辑顾问。
未来版图主目录
第一章 人工智能,在屋子里出生的大象
第二章 竞速无人驾驶
第三章 未来世界的基础建设
第四章 阅读,修改,设计,永生
第五章 聪明巨人,比国家更大
第六章 从能源到工农业,旧瓶里的新酒
第七章 体验决定的内容王者
第八章 唯有幻想,值得实现
第九章 金钱永不眠
第十章 “全球50大最聪明公司”改变的国家地理
未来版图:全球聪明公司的科技创新趋势和商业化路径截图


图书在版编目(CIP)数据
未来版图:全球聪明公司的科技创新趋势和
商业化路径麻省理工科技评论著.--北京:人民邮
电出版社,2018.6
(科技之巅)
ISBN 978-7-115-48267-9
Ⅰ.①未… Ⅱ.①麻… Ⅲ.①企业管理—技
术革新—研究—世界 Ⅳ.①F279.1
中国版本图书馆CIP数据核字(2018)第
064539号
◆著 麻省理工科技评论
责任编辑 恭竟平
责任印制 周昇亮
◆人民邮电出版社出版发行 北京市丰台
区成寿寺路11号
邮编 100164 电子邮件
315@ptpress.com.cn
网址 http:www.ptpress.com.cn
北京印匠彩色印刷有限公司印刷◆开本:710×1000 116
印张:21.25 2018年6月第1版
字数:325千字 2018年6月北京第1次印
刷
定价:69.80元
读者服务热线:(010)81055296 印装质量热
线:(010)81055316
反盗版热线:(010)81055315
广告经营许可证:京东工商广登字20170147号FUTURE LAY-OUT
未来版图:全球聪明公司的科技创新趋势和商业
化路径
麻省理工科技评论 著
Deep Tech深科技 华创研究院 出品
陈序 编定
小编自己做了一个电子书下载网站, 网址:目 录
封面
扉页
内容提要
前言 新兴科技重塑商业未来
推荐序一 坚守梦想,与AI同行
推荐序二 预测未来最好的方法是创造未来
推荐序三 利用数字技术的鸿沟,“超级巨
星”公司们正在掌控世界经济
推荐序四 现实永远超乎想象
第一章 人工智能,在屋子里出生的大象
苹果独占Siri,却挡不住暗流汹涌
人工智能的早鸟,能不能得到回报
沃森、Go或者是吴恩达……这是争夺注
意力的竞赛
争当卖水人的芯片商们
眼看科大讯飞突起,没有大公司感觉安
全
展望
第二章 竞速无人驾驶
无人驾驶与自动驾驶的分歧与布局
传统汽车商的时间表和创新技术商业化
的问题清单人工智能给无人驾驶踩下油门
围猎算法公司
芯片和传感器闻到现金的味道
展望
第三章 未来世界的基础建设
摩尔定律继续有效还是就此结束?这是
一个问题
你不知道哪块云会下雨,不过雨只可能
在云里
半导体业需要增加“带宽”
给芯片提需求的不只是“人”
光纤不遵守摩尔定律,量子计算可以吗
展望
第四章 阅读,修改,设计,永生
读懂基因的价格决定了优化生育的市场
CRISPR,从复制粘贴到修改编辑
最有价值的目标:癌症
检测天天促销,治疗何时降价
商业化黄金期将至,巨头归来
展望
第五章 聪明巨人,比国家更大
万能的Facebook们
可穿戴的互联网
共享一切,首先是你的数据
听从消费者吩咐的“聪明巨人”大到停不下来的用户增长
展望
第六章 从能源到工农业,旧瓶里的新酒
新能源,清洁的进步
梦想电池,储能技术的圣杯
工业互联网
给农业注入生物技术
3D打印跑起来了
展望
第七章 体验决定的内容王者
追随用户的内容
虚拟现实上线
原创,下游力争上游
为游戏而推动革新
明天才是真正的现实
展望
第八章 唯有幻想,值得实现
人工红利寻找替代品
重启卫星互联网
机器人智能
从云端控制
太空金矿挖掘还是再一次星际迷航
展望
第九章 金钱永不眠
要信用?先买个手机吧来自陌生人的资本
Apple Pay的过人之处
区块链来了
新的信用基础设施开始成长
展望
第十章 “全球50大最聪明公司”改变的国家地
理
代工与仿制的创新升级
创新大国的制造复兴
“聪明巨人”之乡
人工智能竞赛
全球化不会止步
展望
后记
附录 2013—2017年“全球50大最聪明公司”榜
单内容提要
《麻省理工科技评论》作为世界上历史悠
久、影响力极大的技术商业类杂志,每年都会依
据公司的科技领军能力和商业敏感度这两个必要
条件,从全球范围内选取50家未来可能会成为行
业主导的聪明公司。
这些聪明公司,并非都是行业巨头,甚至专
利数量、公司所在地以及资金规模都不在考察范
围内。这些公司是“高精尖科技创新”与“能够保证
公司利益最大化的商业模式”的完美融合。无论
公办私营,无关规模大小,这些遍布全球的公司
都有能力创造并抓住新的机遇。
本书以2011—2017年的榜单为蓝本,在生物
医学、能源材料、计算机与通信、互联网与数字
媒体,以及交通运输等行业领域中挑选出在技术
创新、商业模式上有亮点的、国内读者比较感兴趣的百余家聪明公司,并以时间为经、行业为
纬,梳理这些公司的技术创新和商业沉浮。旨在
让读者知道,从判断一个突破性技术到真正实现
技术的共享、吸收应用与再创新是一个艰难而微
妙的过程。这其中需要对技术由浅入深、从点到
面全面认识和理解,而要进一步将前沿知识转
移、共享,则更与这个领域内核心人员和社交圈
的融合程度密切相关。只有处理好这两点,深度
的技术整合应用才有可能。前言 新兴科技重塑商业未来
自2010年开始,《麻省理工科技评论》每年
都会选出50家公司,作为科技创新的代表。这份
榜单的名字略有变化,在2013年之前,它叫“全
球50大创新公司”;2013年,它叫“全球50大颠覆
公司”;2014年至今,它叫“全球50大最聪明公
司”。
如何定义“聪明”的公司?听起来很难。但当
你看到一家聪明的公司时,你就知道了。当这样
的公司将一项真正创新的技术商业化时,不可思
议的事情就发生了:市场中领导者的地位得到巩
固或被别的公司所取代。竞争者们必须重新定义
或重新思考他们的战略。
当《麻省理工科技评论》的编辑们汇编这个
榜单时,最关注的就是这点。这份榜单并不清点
公司所拥有的专利或雇佣的博士,也不考察公司的大小和名气。而是会问,这个公司在过去的一
年中,有没有做出将会重新定义其所在领域的重
大创新。
每年,都会有新的公司入选。例如,2014年
改变所在领域的最重大创新发生在Illumina。它将
DNA测序的价格降低到将改变医疗业务的水平。
2014年,小米(MI)凭借颠覆式的打法迅速成
长,因此位列2015年榜单的第二名。这也是榜单
为公司排位以来,中国公司获得的最高排名。
2017年,排名第一的公司是GPU的生产商英伟
达,这是因为该公司生产的芯片极大地推动了深
度学习和自动驾驶等领域的进步。
同时,每年也都有公司会落选,离开榜单。
有些公司落选是因为对其所在行业的整体前景的
影响力在下降。例如,在“全球50大最聪明公
司”(以下简称TR50)诞生之初,生产生物燃料
的公司占据了榜单的许多位置,但随后这些公司
则逐渐缺席。这个领域的公司普遍未能将生产扩
大到可与常规燃油相竞争的规模,虽然其技术仍有潜力,但它目前对于能源或交通运输等行业的
影响还很小。
在有些情况下,个别企业失去了其远见,导
致不再能入选TR50榜单。其中一个例子是2012年
的Netflix。2011年,Netflix入选是因为它在已有
的电子邮件订阅DVD业务上,添加了视频点播服
务。Netflix公司已经颠覆了实体影像出租店的商
业模式,并巧妙地防止自己被视频流技术颠覆。
但在 2011年,该公司试图把视频流部分从其DVD
业务中分割出去,做出了一个有严重问题的决
策,引得公众嘲笑,并且在醒悟过来之前损失了
数以十万计的订阅用户。突然之间,Netflix公司
就无法清晰地把握自己的命运了,更不用说对整
个娱乐产业产生影响。
同一年,TR50的常客亚马逊也没有入选。从
2011年到2017年,亚马逊只有那一年缺席了榜
单。如果当年的TR50的产生流程提前几个月,亚
马逊很可能会入选。不过,执行力的缺失最终让
这家科技巨头缺席。当年,亚马逊发布的KindleFire初看起来像是一个很有竞争力的产品,可以
威胁到iPad 在平板电脑市场的主导地位。但是,随着消费者对该设备的日常体验越来越多,他们
最初的兴趣和满意就逐渐变成失望。虽然亚马逊
发布了补丁,称可以解决绝大多数用户关心的问
题,但推出的这个产品表明,在2012年,在将云
计算和消费类电子结合起来这件事情上,亚马逊
仍然是一个挑战者,而不是一个领导者。
在2011年到2017年的7年时间里,共有195家
公司入选TR50的榜单,其中有63家公司至少入选
了2次,23家公司至少入选了3次。IBM(美国国
际商业机器公司)和SpaceX(太空探索技术公
司)各入选了7次,7年之间无一缺席。如果把谷
歌和Alphabet算作一家公司,它也入选了7次。亚
马逊和Facebook各入选了6次,在入选次数排名中
并列第四。在中国公司中,入选次数最多的是腾
讯(Tencent),一共5次进入榜单,和苹果并
列。从入选榜单的公司体量来看,从2011年到
2014年,上市公司在榜单中的比例低于40%。但
是从2015年开始,上市公司的比例显著增加。在
2017年的50家入选公司中,有28家上市公司,占
比56%。这说明,创新可能在向大公司集中。
在国家方面,五大洲都有公司入选,虽然比
例并不平衡。北美洲依靠美国,占据了榜单的大
多数。欧洲和亚洲基本处于旗鼓相当的地位。不
过最近两年,得益于中国技术公司的崛起并在世
界范围内得到承认,亚洲的公司数已经超过了欧
洲。值得一提的是,2017年,阿根廷电子商务公司Mercado Libre首次入选,填补了南美洲的空
白。
在国家分布上,美国的公司每年都占据榜单
的大半,不过优势正在放缓,从名额的80%下降
到60%。总体来说,榜单中的国家组成多样性正
在增加。中国公司的数量也在显著增加,从2013
年的2家到2017年的9家。入选的中国公司既包括
百度、阿里巴巴(Alibaba)、腾讯、华为
(HUAWEI)这样的巨头,也包括小米这样的大
型未上市公司,还包括滴滴出行、旷视科技、大
疆(DJI)等初创企业。《麻省理工科技评论》官方常常把公司分成
生物医学、能源材料、计算机与通信(包括量子计算、机器学习、人工智能等)、互联网与数字
媒体(包括互联网的商业模式创新),以及交通
运输(包括城市交通、太空探索等)。除此之
外,还有两家投资机构因为革新了投资理念和模
式,也进入了TR50榜单。
自2011年以来,交通运输领域入选的公司数
量基本维持在稳定的水平。尼桑、丰田
(Toyota)、奥迪(Audi)等汽车制造商,滴滴
出行等出行服务公司,甚至是SpaceX这样的航天
制造和服务提供商,都曾入选。互联网与数字媒
体公司的数量在2014年达到顶峰后迅速下降,这一趋势符合移动互联网红利结束的时间点。取而
代之的是计算机与通信类型的公司数量快速增
长。大量新兴人工智能技术公司在2016年和2017
年出现,而亚马逊、苹果、腾讯和百度等老牌互
联网公司也纷纷加入人工智能的浪潮。生物医学
领域的公司数量也比较稳定,不过子领域却有明
显的变化,从早期的制药和基因测序,到后来的
基因治疗,再到最近的基因编辑。
三大技术领域的行业焦点
我们通过技术手段,综合分析了生物医学、能源材料以及计算机与通信这三大领域入选公司
的入选理由、专利申请和新闻报道等信息,总结出了2011年到2017年入选TR50的企业的研究焦
点,希望可以借此分析行业变化的趋势。
生物医学领域的行业焦点
2011—2017年生物医学领域的公司研究焦点
在生物医学领域,基因组测序是最为关键的
技术之一,所以一直在TR50榜单中稳定地占据份
额。基因测序公司大致可以分成两大类,一类公
司致力于基础研究,并把全基因组测序的价格压
到市场可以接受的范围。这类公司的代表是位于
美国加利福尼亚州圣迭戈的著名测序公司
Illumina。这家公司自2013年以来,从未缺席过TR50榜单。早在2013年,基因组测序的成本仍需
将近1万美元。但《麻省理工科技评论》编辑部
已经预测,全基因组测序的成本必将降至1000美
元。而这一价格是一个临界点,意味着医保系统
已经可以部分覆盖基因测序的成本,从而让这一
技术进入临床医疗市场。
现在看来,这一目标已经基本达到。2017
年,Illumina再次入选TR50榜单,理由是公司推
出了一种新机器Nova Seq,据说只需两天半的时
间就可以完成多达48个人类全基因组测序。也许
过不了多久就可以将DNA测序成本降低到100美
元。
随着基因测序成本的下降,一些公司开始将
其应用于市场中。23andMe早在2006年就成立
了,旨在为消费者提供基因测序服务,也把“消
费基因测序”的概念传播开来。但是直到最近几
年,公司才开始进入大众视野,并于2016年和
2017年连续两年进入TR50榜单。在此期间,公司
还与美国食品和药物管理局经历了一段艰苦的周旋,终于获得了针对健康性状检测的许可。截至
目前,23andMe已经为超过100万人提供了基因测
序服务。
除了消费基因测序外,基因测序还被用于研
发新型诊断技术中。就在2017年12月4日,Counsyl从高盛和Founders Fund等多家机构获得了
8000万美元的融资。Counsyl早在2015年就进入了
TR50榜单。当时,美国有3.6%的夫妇在产前会使
用Counsyl的产前基因检测服务,以检测潜在疾
病,并提供健康管理和相关预防措施。
生物医学领域的另外两条重要的主线是基因
疗法和基因编辑技术。这两种技术都旨在修改人
类的基因组,从根本上治愈某些复杂的遗传疾
病。只不过基因疗法往往通过基因载体(如病
毒)来把基因运载到基因组里,而基因编辑则采
取更高效精准的方法修改致病基因。虽然理论
上,基因编辑比传统的基因疗法更安全,但是基
因疗法已经经历了10多年的研究和临床试验,所
以逐渐在2015年、2016年开花结果。Spark成立于2013年10月,是一家致力于治疗遗传疾病的生物
技术创新公司,以开发一种全新的私人化的精确
治疗法来治愈原先难以治疗的基因性疾病。Spark
试图研发的遗传疗法可以治疗遗传性视网膜营养
不良,这种疾病的患者从一出生就会逐渐失去视
力,并最终在中年时完全丧失视力。2015年年
底,Spark公布了遗传性视网膜营养不良的疗法
SPK-RPE65的三期临床结果。在临床试验中,这
一疗法获得了良好的结果。因此,Spark也入选了
2016年和2017年的TR50榜单。2017年10月,美国
食品和药物管理局初步批准了Spark的基因疗法,成为2017年度最重要的生物医学新闻之一。
2012年夏天到2013年年初,3个不同的研究
组(Jennifer DoudnaEmmanuelle Charpentier,张
锋,以及George Church)分别发表论文,阐述了
CRISPRCas9在动物和人类细胞内的作用机理,打开了基因编辑的研究和应用大门。2013年,张
锋成立了基因编辑公司Editas Medicine,该公司
于2016年上市并入选当年的TR50榜单。虽然基因编辑在理论上很有优势,但是它仍然是一种很新
的技术,加上临床领域技术应用本身就需要很长
的研发和试验周期,可能还需要一段时间才能赶
上基因疗法在临床市场中的积累。
能源材料领域的行业焦点
2011—2017年能源材料领域的公司研究焦点
在过去7年间,能源材料领域的热点也发生
了很多变化。其中,生物能源的衰落让人叹息。
在所有生物能源相关的公司中,Amyris的经历具
有一定的代表性。Amyris的创始人包括合成生物
领域最顶尖的科学家杰·基斯林(JayD.Keasling)。公司早期就转变了实验室的技
术,用合成生物学的技术让酵母菌生产青蒿素。
Amyris还希望通过合成生物学方法,让改造后的
酵母菌把糖类物质转化成柴油燃料,直接用于加
油站等设施中。2010年9月,Amyris在纳斯达克
上市,数月后股价就翻倍飙升至33美元。2011
年,Amyris公司入选TR50榜单。然而,虽然
Amyris的目标可以在实验室中理论上实现,却始
终无法达到工业生产的规模和成本目标。
在过去7年中,太阳能一直是TR50榜单持续
关注的新能源领域。不过,这一领域的公司也经
历了洗牌。2011年入选的无锡尚德早已破产重
组,而曾经的首富施正荣在长期休整后进入了一
段新的创业旅程。相对稳定的公司是First Solar,它和无锡尚德等很多21世纪头10年引领太阳能行
业的公司不同,这家公司专注于薄膜太阳能技
术,并在过去7年4次入选TR50榜单。
相比之下,电池技术的崛起并不让人惊讶。
一方面,太阳能、风能等可再生能源一直需要符合自身发电特点的电池储能;另一方面,电动汽
车等电能应用场景的快速增长也对电池提出了更
高的要求。开发新电池技术的公司既有24M、Aquion Energy和Sakti3这样打造全新电池(如固
态电池)的企业,也有特斯拉这样因电池技术的
应用落地而入选的企业。事实上,特斯拉入选
2015年TR50榜单的理由就是“将电池技术从汽车
扩展到住宅和商业应用”。
不过,这些企业的命运也有所不同。Sakti3
以9000万美元的价格被英国戴森公司收购。2017
年11月,电动汽车厂商Fisker宣布旗下电动汽车
将使用Sakti3研发的固态电池技术,充电1分钟最
高续航就可达800千米。而曾获得比尔·盖茨投资
的明星公司Aquion Energy就没有那么幸运了。该
公司开发了全新的钠电池,以盐水为电解质并配
以氧化锰阴极和碳基阳极。不过,随着锂离子电
池的成本急剧下降,Aquion Energy激进的扩大产
能措施并没有得到市场的认可,最终于2017年破
产。除此之外,风能、天然气等可替代能源领域
企业也不时出现在历年的TR50榜单中。不过,这
些领域的公司,总体来说,并没有获得太阳能领
域能源企业的转化率和商业成绩,人类探索新能
源的路径仍然漫长。
计算机与通信领域的行业焦点
2011—2017年计算机与通信领域的公司研究焦点
在计算机与通信领域的公司中,最引人注目
的变化是人工智能自2015年开始崛起。在人工智
能领域中,自然语言处理、计算机视觉、语音识
别等相关技术都在蓬勃发展。不过,在2016—2017年,增长最迅猛的是无人驾驶领域的技术,这一趋势很可能会延续到未来几年。
所以,为人工智能(特别是深度学习)提供
计算设备的英伟达公司自2015年起就没有缺席过
TR50榜单。2017年,公司在数据中心和汽车领域
的业务收入分别比2016年增长了186%和24%。很
多主要的互联网和云服务提供商都在使用英伟达
的芯片来优化服务,而包括丰田、奥迪、宝马
(BMW)等50多家汽车制造公司也在使用它们
的自动驾驶技术和平台进行各种试验。
互联网巨头也在向人工智能转型。我们以入
选TR50榜单次数最多的亚马逊公司为例,通过
2011年至2017年亚马逊公司的入选理由,可以清
楚地发现,这家电商公司已经在彻底地拥抱人工
智能技术。人工智能的子领域的发展情况
2011年入选理由:得益于亚马逊,电子书终
于成为一个巨大、主流的消费市场。
2013年入选理由:在某些地区开启一日送到
业务,让网络购买商品的需求获得了提升。
2014年入选理由:和12家顶级在线零售商的
销售额总和持平,提高了我们对电子商务的期
待。
2015年入选理由:物流中心使用的机器人可
以使整个中心更加高效。
2016年入选理由:今年,亚马逊日益强大的Alexa智能语音助手(Echo、Echo DOT、Tap)让
上网、播放音乐、调节灯光和恒温器,都变得简
单。亚马逊的网络及云计算服务也不容小觑,它
正在迅速发展并将成为亚马逊新的增长点。
2017年入选理由:近年来,亚马逊使用了包
括计算机视觉、机器学习和自然语言处理在内的
一系列人工智能技术,彻底升级了移动计算能力
并改善了购物的体验。
除了互联网巨头,创业公司也在这一波人工
智能浪潮中崛起。例如,中国创业公司旷视科技
就入选了2017年的TR50榜单。旷视科技的人脸识
别技术已经被滴滴出行、阿里巴巴等大企业使
用。
值得注意的是,中国的技术企业没有在人工
智能浪潮中落后。2013—2017年,中国公司25次
入选TR50榜单,其中23次入选公司开展的业务都
和人工智能有关。在这些公司中,百度、腾讯、蚂蚁金服(Ant Financial)、滴滴出行等公司已经
公开宣布要重仓支持人工智能技术,而大疆、旷视科技等初创公司则以开发人工智能技术作为主
营业务。
在本书中,我们以时间为经、行业为纬,梳
理了2011—2017这7年百余家聪明公司的技术创
新和商业沉浮。总体来说,我们可以看到,计算
技术、能源材料和生物医学的需求一直存在,但
是具体技术热潮会上下起伏。入选TR50榜单的企
业往往有在实验室阶段就广受瞩目的技术,但生
物能源和很多电池技术因为不能很好地市场化而
遭遇挫折,而人工智能则因为找到了很好的应用
场景而迅速爆发。因此,如何把实验室中的技术
落地到应用场景?如何在大规模生产和成本控制
方面满足市场需要?这样的问题也许是一家技术
公司最重要的课题。推荐序一 坚守梦想,与AI同行
2017年6月,一个炎热的下午,我的微信突
然收到了铺天盖地的祝贺信息。原来,是因为科
大讯飞登上了《麻省理工科技评论》“全球50大
最聪明公司”的榜单,而且有幸被评为世界第
六、中国第一。
作为科大讯飞的创始人和董事长,我的心情
有些微妙:既为公司能在这份颇具公信力和影响
力的榜单上一鸣惊人而感到自豪,同时也为我们
其实并没有如此聪明而忐忑不安!相比一同上榜
的谷歌、英伟达等国际著名公司,更是倍感前路
漫长。诚然,科大讯飞在智能语音和人工智能领
域所做出的探索与成果开始被世界的目光高度肯
定,但一路走来,我们也许总是聪明人中有点笨
的那个——在坎坷和质疑中保持定力,希望追随
梦想而不是抢占风口,能被评价为“大智若愚”已属不易。
从2017年“全球50大最聪明公司”榜单中,我
观察到上榜的中国企业已史无前例占据九席。中
国在推动全球科技进步中的力量不可小觑,想要
精准把握科技发展的脉络就必须汲取中国力量的
元素。《麻省理工科技评论》的主编、尊敬的大
卫·罗特曼(David Rotman)先生特别提到上榜公
司中有不少都与人工智能的发展密切相关。从人
工智能领域来说,全球同步进入“无人区”,既让
人惊喜和期待,也引发了很多人的担忧。而让人
工智能趋利避害,在源头技术、产业应用、法律
系统和人文伦理等方面都需要全球合作。当前世
界,正处在是继续开放合作还是倒退封闭的关键
十字路口。4月10日博鳌亚洲论坛期间的中美
CEO圆桌对话,让我欣慰地看到两国企业家对于
开放合作大趋势的共同期待。我想,无论一个公
司当前有多聪明和多强大,只有坚守正确价值
观,以创新造福人类命运共同体,方可源远流
长、基业长青!科技的浪潮实在太快,虽然不能准确捕捉它
未来的路径和节奏,但人工智能定是其中可窥一
斑而知走向趋势的关键一点。因此,观察并深入
挖掘与之相关的“领头羊”显得格外重要。未来,每个公司可能都会有自己的人工智能、大数据、云计算,在新生态下知识、经验、数据和利益的
分享变得更加重要;彼此正交的不同公司通过混
合的方式建立新生态下的共赢合作,则是成功的
关键。科大讯飞人工智能平台上的创业团队数量
已达60万家,一年内增加了近40万家,呈现出蓬
勃的发展势头。“商业帝国的兴衰”无法预知,生
态却一定会生生不息。我们希望与开发伙伴一
起,用人工智能建设美好世界并分享美好未来。
“那些有能力将高精尖科技创新与利益最大
化完美融合的公司,它们遍布全球,且都有能力
抓住新的机遇。”这是《麻省理工科技评论》放
眼全球挑选聪明公司的准则,也是这本书要详解
的重点。愿这些细致入微的观察和鞭辟入里的分
析,能让永远年轻的奋斗者们抖擞精神后,有所思、有所得。
刘庆峰
科大讯飞董事长推荐序二 预测未来最好的方法是
创造未来
在旧金山飞往北京的飞机上,我一口气读完
了全书。作为科技工作者的我,虽然对书中描述
的很多高科技企业都非常熟悉(我曾经在连续7
年都上榜的IBM工作,指导过的20多位博士毕业
生现在也大都在这些全球最聪明的公司工作,比
如谷歌、英伟达、苹果、优步等),但是编者通
过对《麻省理工科技评论》从2011年以来,每年
评出的全球50家最聪明的公司的系统梳理分析,使得我这样的行业内人士也深深为之吸引,受益
无穷。
能入选《麻省理工科技评论》“全球50大最
聪明公司”榜单的,不一定是大公司,不一定是
上市公司,也不一定是有很大名气的公司。入选的标准,取决于在过去一年中这家公司有没有做
出将会重新定义所在领域的重大创新。这本书的
独特之处,在于它不是单纯地按年份罗列榜单上
每家公司在某年入选的理由,而是按照行业和技
术领域的划分,对这些高科技公司在这些年的技
术发展和商业沉浮做了生动的描述,使得读者能
够迅速地把握该行业和技术领域的历史过程和发
展趋势。
从行业和技术领域来看,生物医学、能源材
料和计算机与通信这三大类的高科技公司是这个
名单上比例最高的公司(2017年的名单中,这三
大类上榜公司占据了80%以上)。虽然具体的技
术热潮会有起伏,但是这三大方向始终领导着创
新的潮流。这一现象能给投资者一定的指导意
义,也会给年轻人对未来职业道路的选择提供一
定的启发。
而在这三大类中,计算机与通信类公司在过
去7年中所占的比例逐年上升,在2017年占据了
50%以上的比例。这也是意料之中,因为即使是在这个“全球50大最聪明公司”榜单开始之前的半
个多世纪中,从集成电路的发明到个人计算机的
普及,从互联网的开始到移动通信的发展,都是
因为计算机与通信技术的飞速进步所导致的。而
其他领域的创新(交通运输领域和金融领域),很大限度上也离不开计算技术的赋能。比如最近
几年,无人驾驶和自动驾驶的兴起和发展,与人
工智能算法以及芯片和传感器的发展息息相关。
在计算技术类的公司中,人工智能相关的公
司也很明显地成为了最近的主流。人工智能的三
大支柱是算法(Algorithm)、大数据(Big data)
和计算能力(Computation),代表着人工智能的
ABC。这三者之间形成了相互促进的正反馈——
更多、更复杂的数据能推动新算法的发明;而新
的算法通常会需要更强更好的硬件架构来提升计
算能力;新的硬件架构又能促进更多、更复杂的
数据的获取。这个紧密的正循环关系,使得最近
几年上榜的不少公司都加强了对人工智能硬件架
构的重视。比如连续7年入选的谷歌,作为在人工智能的算法和大数据上的强者,于2013年开始
组建自己的硬件团队,秘密研制专门针对人工智
能算法加速的TPU(Tensor Processing Unit), 并
且在2016年正式公开。而2017年图灵奖的两位获
得者,计算机硬件架构的最顶尖的专家,斯坦福
大学的John Hennessy和加利福尼亚州伯克利大学
的David Patterson,目前均在谷歌供职。又如2017
年榜单的第一名英伟达连续三年上榜,部分原因
是其提供的GPU成为人工智能计算领域的主力硬
件。而在2014年和2015年均未上榜的英特尔为了
赶上这次人工智能浪潮,在过去的一年多时间里
连续收购了多家人工智能芯片公司,包括
Nervana、Movidius和Mobileye,加强了其在人工
智能领域的影响力,从而在2016年和2017年重新
回到了榜单。
在这个榜单上美国公司一直都占据着最高的
比例,显示着美国依然是世界科技创新的“领头
羊”。但是中国科技公司上榜的数量在逐年增
加,在最新的2017榜单上中国科技公司占据了20%的比例,彰显了中国在创新科技上的崛起并
得到了世界的承认。不过值得注意的是,在生物
医学、能源材料和计算机与通信这三大类的高科
技领域,前两类的中国公司极少,仅有华大基因
和汉能分别在2013年和2014年入选。这说明在这
两个领域,中国的高科技公司还有很长的路要
走。而在人工智能领域,入选的大都为应用和软
件类公司,没有硬件类公司。最近2年,中国的
人工智能芯片初创公司成长速度很快,比如深
鉴、寒武纪、地平线、比特大陆等。作为在这个
领域的研究者,我非常希望在未来的榜单上能出
现它们的名字。
虽然了解过去的历史对技术创新的趋势会有
很大的帮助,但是并不一定能借此很好地预测未
来。正如美国第16任总统亚伯拉罕·林肯所说“预
测未来最好的方法,就是去创造未来”,我期待
此书的出版,能更好地促进中国在高科技领域的
创新能力,在未来的“全球50大最聪明公司”榜单
中,出现更多来自中国的高科技公司。谢源
加州大学圣巴巴拉分校(UCSB)电机与计算机
工程系教授
IEEE Fellow推荐序三 利用数字技术的鸿
沟,“超级巨星”公司们正在掌控
世界经济
如今,世界似乎正在出现一种趋势,那就是
经济格局正在被几家巨头公司把持,它们无处不
在,从亚马逊(Amazon)、Facebook、谷歌
(Google)、苹果以及沃尔玛(Wal-Mart)等老
牌巨头,到爱彼迎(Airbnb)、特斯拉(Tesla)
和优步(Uber)等迅速成长的新公司。
历史上一直都不缺大型甚至垄断公司,但如
今的这一批巨头却十分与众不同,有些经济学家
称这些公司为“超级巨星”公司。它们来自各行各
业,并且或多或少都是凭借技术的力量才踏上巅
峰的。
我们的年度“全球50大最聪明公司”榜单中,就有很多这样的企业,榜单所列出的都是敢于创
新,并且其商业模式可以包容这些创新的公司,榜单是我们对未来市场“霸主”的一个预测。虽然
亚马逊、Facebook、谷歌皆被录入其中,但是也
有许多新公司榜上有名。
这些公司可能目前并不为人所知,但是我们
相信,它们已经走在了新兴科技应用的快车道。
当然,善于创新并不能保证它们将成为下一
家“超级巨星”公司。但是,在如今竞争越来越激
烈的市场上,善于创新起码会给这些公司一个创
造并统治新市场的机会。
“超级巨星”公司的出现在很多方面定义了我
们所处的这个时代。尤其是科技巨头,通过对互
联网、网络效应以及大数据的创新,在赚取巨额
利润的同时,又为我们提供了不可缺少的服务,比如网络搜索、在线购物,以及那些改变我们生
活的产品。
但是互联网公司并不是唯一能成为“超级巨
星”的公司。近日,一项由哈佛大学和麻省理工学院的经济学家所进行的研究显示:“超级巨
星”公司,即任何行业中资本总值排名前4位的公
司, 在所有的行业中的销售份额都经历了大幅度
上涨,不论是交通运输业、服务业,还是金融
业。
该研究的研究人员之一、哈佛大学经济学家
Lawrence Katz对此表示:市场被“超级巨星”公司
掌控的趋势正在加速,这种趋势在过去的10年里
在所有行业和发达经济体中都基本一致,尤其是
那些正在经历快速技术变革的市场。Lawrence
Katz还表示,这背后的原因应该是各公司利用新
技术的能力的区别。换句话来说,你必须是所从
事行业里最聪明的公司,要不然无法成为“超级
巨星”公司。
单独来看,这一点并无坏处。但是该研究报
告的作者们却表现出对由几个企业巨头统治经济
的担忧。20世纪的几大经济定律之一就是:一个
国家的国民工资收入在全国收入中所占的比例是
稳定的。随着经济的发展,国民的工资收入也会按比例提高。但是在过去的几十年里,国民工资
收入所占的比例却越来越小。这一趋势存在于许
多国家,甚至是2000年之后的美国也变得异常明
显。
这种趋势让很多经济学家都感到疑惑。有人
认为,这与可以代替人工的廉价机器人的崛起有
关,但相关的数据却缺乏说服力。Lawrence Katz
和他的同事们则认为,“超级巨星”公司的出现是
这一切背后的原因。随着这些公司越来越高效,利用技术的能力越来越强,它们创造收入所需要
的员工也就越来越少。而当这些“低人力需求”的
公司占据绝大部分市场时,国民的工资收入在全
国收入中所占比例的降低就可以解释了。
除此之外,“超级巨星”公司还有一个问题就
是它们对人才的追求。为了招揽到最优秀的人
才,它们往往会开出更高的薪酬,而这则会加深
一个国家的贫富差距。据斯坦福大学经济学家
Bicholas Bloom和他的同事的研究数据显示,自
1980年起,美国的工资差距中有三分之一都来自于巨头公司所开出的高额工资与正常工资之间的
区别。越来越少受过高等教育的精英能享受到这
些巨头增长所带来的红利。Bicholas Bloom 认
为,这正是美国患有“(经济)焦虑的原因之
一”。
这些“超级巨星”公司的崛起也许还可以解释
另外一个较负面的经济趋势。虽然在过去的十几
年里,软件、电子设备以及人工智能都得到了极
大的发展,为硅谷赚取了大笔的利润,但美国以
及其他发达国家的经济增长速度却十分缓慢。尤
其是“全要素生产率”(是指不包括资本和劳动力
等外来输入,其他所有影响产出的要素)这个反
映创新的指标,简直惨不忍睹。为什么高科技行
业正在急速发展的时候,全国经济却处于龟速?
经济合作与发展组织(OECD)的经济学家
认为他们找到了这个问题的答案。事实上,被经
济合作与发展组织称之为“前沿公司”,即各行业
的顶级公司的生产力确实在迅速提高。这些公司
正在积极地使用互联网、软件以及其他科技来优化自身的运营,开拓新的市场。但是绝大部分的
公司并不能有效地使用新技术。
因此,经济合作与发展组织的经济学家Dan
Andrews表示,这些公司的低生产力拉低了整体
经济。“科技越来越复杂,然而很多公司缺乏可
以适应新技术的能力。”Dan Andrews说道,他和
经济合作与发展组织的同事对美国和其他23个发
达国家进行了分析,并发表了相关的研究报告。
经济合作与发展组织的研究结果在某种程度
上算是很激励人心的,因为它证实了科技发展有
大幅度提高生产力的潜力,虽然这只能在顶级公
司中实现。然而Dan Andrews表示,落后的公司
并没有努力追赶,新的想法和商业模式扩散的速
度比想象中还要慢。没有人知道这背后的原因,但是事实证明,经济“扩散”新技术的效率比我们
想象中还要慢。
这一切都再次证明了“全球50大最聪明公
司”榜单的重要性。因为这个榜单上没有任何落
后者。但是各经济学家的研究一致证明了我们需要一个更好的商业环境,它可以让初创公司和新
想法茁壮成长。今日的“超级巨星”公司的发展速
度越来越快,但是能享受到其红利的人却越来越
少。
不过,这一趋势并不是不可避免的。随着人
工智能等复杂科技的发展,它们将在未来拥有强
大的能力,甚至能影响一家公司是否成功。虽然
这些复杂科技在应用上有极高的难度,甚至可能
拉大领跑者和落后者之间的距离,但它们也会创
造目前还不存在的新市场的可能性。我们确实需
要努力开拓创新,但在祝贺这些上榜公司的同
时,我们还要记住传播知识以及其所带来的财富
的重要性。
大卫·罗特曼(David Rotman)
《麻省理工科技评论》主编推荐序四 现实永远超乎想象
1952年,手冢治虫还是个20岁出头的小伙子
时,就画出了20世纪50年代人类对于人工智能的
期待:铁臂阿童木。到今天为止,我们身边的人
工智能还远远赶不上60多年前一个动漫人物在大
家心里的形象。如果按照2017年耶鲁大学和牛津
大学对352名科学家访谈得出的结论,大家相信
人工智能在2060年可以在一半人类职业上超过人
类。这个预测可能更加理性,但也很可能是非常
保守的。因为最近10年,人类第一次可以拥有足
够的运算能力来实践几十年以来推演的所有算
法,而今天最流行的神经网络架构甚至是20年前
Yann Le Cun在其论文中描述的。
2008年,我和朋友坐在落日下Palo Alto镇上
的星巴克,他拿出第一代圆滚滚的iPhone问
我:“现在回北京创业是不是太晚了?现在连这种设备都出现了。”说着,他用右手食指和拇指放
大了一个他正在浏览的网页。我笑了笑,鼓励他
说:“现在才刚刚开始,机会才刚开始出现。”其
实我心里也没有任何依据,也许只是为了安慰
他。但是,正是从第一代iPhone开始,我们才真
正经历了互联网的大爆发,中国消费互联网全面
赶超硅谷。今天,主流的硅谷基金合伙人会坐在
阳光明媚的Sand Hill红绿灯旁边的落地窗会议室
里面,尴尬地表示“我们现在都是看中国,Copy
from China”。
10年前落日下的Palo Alto看不到2017年超过
万亿美元市值的BATJ(百度、阿里巴巴、腾讯和
京东)。就像我们今天依然会低估未来10年的斜
率。
给予足够长的时间,很多预言都能变成现
实,比如凡尔纳的《海底两万里》和《八十天环
游地球》。但科技行业等不起100年的预测,所
以当我们终于等到《麻省理工科技评论》在我们
这个时代接连做出准确的预测时,我们很欣慰地觉得自己找到了科技投资的“红宝书”。本书筛选
的聪明公司涵盖的行业非常广,从人工智能到基
因测序、从细胞治疗到激光雷达、从运动品牌到
汽车集团、从创业公司到财富500 强、从硅谷到
北京、从非洲到拉丁美洲……纵横交错,缤纷异
常,如同一场全球艺术家混搭的演出盛宴。
细细品读,我惊讶于大象的舞艺和蜉蝣的韧
劲儿。
以最新的2017榜单为例,我们很明显地感受
到人工智能如日中天,从排名第一的英伟达
(NVIDIA)到已经连续4年上榜的百度
(Baidu),50家公司中有大量的上市公司上榜都
是因为人工智能,比如由于智能产线普及而准备
削减6万个工作岗位的富士康(Foxconn)。
由于基因编辑和细胞治疗技术的发展,使今
天的很多长尾疾病也能够看到治愈的方案或者希
望,比如凯德药业(Kite Pharma)的方案使39%
的严重淋巴癌患者6个月之后没有复发,或者
Ionis Pharmaceuticals与Biogen携手解决目前没有任何治疗方案的脊髓性肌肉萎缩症,又或者是考
虑到B类血友病的发病率只有五千分之一而低价
有效治疗的Spark Therapeutics(以下简称
Spark),使这种长尾疾病的患者将在这个时代得
到越来越好的照顾。
基于基因研究和自动化技术交叉点的测序行
业终于迎来了更多的创新:英国牛津纳米孔公司
(Oxford Nanopore)在经历了12年的风风雨雨和
投入了2亿美元的研发费之后,终于推出了一款
可以叫板Illumina的廉价高速测序仪,创纪录地读
取了882000个字符。无论是Illunima还是Nanopore
都在下一代测序研发上积极推动,争取早日实现
成本下降到100美元。
新兴市场里面,印度的Flipkart、阿根廷的
Mercado Libre和尼日利亚的Jumia则都是互联网基
础设施继续向外延伸的代表。
除了互联网、人工智能和精准医疗,清洁能
源也有3家公司上榜: First Solar刚刚从澳大利亚获
得了全球最大的光伏订单、超过40万笔Model 3订单的特斯拉收购了SolarCity和位于肯尼亚、拥有
50万名用户的撒哈拉以南非洲地区最大的离网太
阳能运营商M-KOPA。
不过我自己最感兴趣的其实是一家创业公
司:第一次上榜的量子计算公司Rigetti
Computing。我们拭目以待,看看他们是否能把量
子计算用商业价格带入这个时代。
从书中我们可以看到,一共有195家公司入
选了2011—2017年这7年的TR50榜单,这就意味
着有许多公司多次入选,甚至包括IBM和SpaceX
这两家从未缺席过榜单的公司。而那些曾经经历
过一些挫折的公司,比如遇到竞争的Illumina和失
去光环的HTC(宏达电),也都在新定义的市场
机会中再次找到自己的坐标。
总之,公司无论大小远近,唯一相同的就是
它们对于前沿科技不辍的坚持和投资。很多公
司,包括初创公司,也都经历了市场的几次上
下,终于等到能够撬动巨大机会的阿基米德支点
在运算能力爆发、基因测序成本急剧下降、发现新型靶点、互联网基础设施的加速渗透……种种
几乎令人眼花缭乱的科学探索和技术变迁的觥筹
交错中隐隐出现,才让我们看到这些世界上的聪
明公司。
当一年多前人工智能刚刚成为创业者的新宠
时,业界对10年以后的世界就有了几个猜想,比
如,无人机会不会替代人工?机器人会不会替代
人工?无人驾驶究竟能发展多快?能源、金融、医疗行业里人工智能公司的机会有多大等等,当
时大家争论不休。而从这个意义上看,《未来版
图:全球聪明公司的科技创新趋势和商业化路
径》一书对于数十个技术领域、十余个行业的归
纳、推演和预测,以及对“高精尖科技创新”与“能
够保证公司利益最大化的商业模式”融合的路线
图的构建,在一定程度上回答了以上问题,同时
也为我们提供了另外一个维度来观察和评估那些
始终令人敬佩的商业前沿公司。
熊伟铭
华创资本合伙人第一章 人工智能,在屋子里出生
的大象
任何能对收入千亿美元的企业产生影响的东
西,都是不可以小觑的。
——安德鲁·葛洛夫
(《只有偏执狂才能生存》,1997,光明日报出
版社)
沃森(Watson):“为了提高语言技能,我读
了你所有的歌词。”
鲍勃·迪伦(Bob Dylan):“你读了我所有的
歌词?”
沃森:“我每秒可以读取8亿页的歌词。而且
我分析出你的歌的主题是探讨随着时间的流逝,爱转淡。”
鲍勃·迪伦:“听起来是对的,我想我们可以一起写歌。”
沃森:“我会唱歌。”
鲍勃·迪伦:“你会唱歌?”
接着,沃森开始哼起一段旋律。鲍勃拿起吉
他,转身离开……
这是2015年IBM为人工智能(AI)“沃森”制
作的广告。这不是鲍勃·迪伦第一次为科技公司拍
广告。1997年,鲍勃·迪伦首次接受广告拍摄的邀
请,是乔布斯那个苹果经典广告Think
Different(“不同凡想”),一同出现在广告中的
人物还有甘地、爱因斯坦和马丁·路德·金。也是
在1997年,IBM的“深蓝”(Deep Blue)第一次代
表人工智能击败了人类国际象棋世界冠军加里·卡
斯帕罗夫。
之后,经过18年的发展,棋力最高的人工智
能围棋程序才大约达到业余五段围棋棋手的水
准,且在不让子的情况下,仍无法击败职业棋
手。2012年,在4台PC(个人计算机)上运行的
Zen程序在让5子和让4子的情况下两次击败日籍九段棋手武宫正树。2013年,Crazy Stone在让4子
的情况下击败日籍九段棋手石田芳夫。
会下围棋的人工智能阿尔法狗(AlphaGo)
和之前的围棋程序相比,表现显著提升。在和
Crazy Stone、Zen等其他围棋程序的500局比赛
中,单机版阿尔法狗(运行于一台计算机上)仅
输了一局。而在其后的对局中,分布式版阿尔法
狗(以分布式运算运行于多台计算机上)在500
局比赛中全部获胜,且对抗单机版阿尔法狗约有
77%的胜率。2015年10月开发的分布式运算版本
阿尔法狗使用了1202块CPU(中央处理器)及176
块GPU(图形处理器)。
从2015年到2016年,阿尔法狗一步步战胜最
顶尖的人类棋手,成为围棋的世界第一。即使鲍
勃·迪伦在2016年意外获颁诺贝尔文学奖,也没有
引起如此巨大的轰动。到了2017年,人工智能成
为技术创新与商业结合的最热“电视连续剧”,也
成为投资者行动和消费者讨论的中心。
Gartner公司对923名总裁或更高职位的企业高管的调查显示,76%的企业计划在未来一年里
尝试某种形式的人工智能或机器学习。一系列被
标签为“人工智能”的事件,其影响远远超出了人
们可以预判的范围。而试图“追剧”的观众,找不
到任何一个有能力剧透的对象。
检视所有卷入游戏领域的“全球50大最聪明
公司”,我们找到一条线索:这是一头出生在屋
子里(而不是闯进屋子)的大象。苹果独占Siri,却挡不住暗流汹涌
2013年,“人工智能”这个曾经晦涩的名词已
经成为技术领域最热门的趋势之一,《麻省理工
科技评论》将其选为当年“10大全球突破性技
术”。大型互联网公司正在使用它来推出理解图
像和语音的在线服务,基于深度学习算法的芯片
也正在被设计成无人机、无人驾驶汽车等产品。
其中,语音识别技术因为Siri在消费者超级应用
界面之一——苹果手机上令人印象深刻的表现,在商业上展现出巨大的可能。
Siri(Speech Interpretation and Recognition
Interface)是一款内置在苹果iOS系统中的人工智
能助理软件。此软件使用自然语言处理技术,让
用户可以使用自然的对话与手机进行交互,完成
搜索数据、查询天气、设置手机日历、设置闹铃
等服务。创建于2007年的Siri曾是美国国防部
DARPA(美国国防高级研究计划局)的研究项
目,定位为国家级的虚拟语音助理。之后,Siri
成为iOS手机操作系统中的一个应用程序,也在
黑莓与安卓(Android)平台提供服务。苹果公司
于2010年4月28日收购了Siri并重新开发后,使
Siri成为苹果设备的内置软件,并只允许在苹果
公司拥有的iOS、macOS系统中运行。
2013年,因使语音识别技术成功地实现商业
应用而登上“全球50大最聪明公司”榜单的是一家
纳斯达克上市公司——纽昂斯通信公司(Nuance
Communications, Inc.)。其上榜理由是它“创建了
语音识别技术从汽车到视频游戏的新应用”。
苹果收购Siri后,选择Nuance来作Siri的技术
服务商。一方面,Nuance在语音识别技术上的创
新积累可以大大加快苹果需要在大众消费者面前
展示这项技术给用户体验带来的跃升;另一方
面,合作开发意味着分担研发风险,分享研发收
益。至少在那时,已经拥有超级应用界面的苹果还没有清晰地看到人工智能在语音识别领域的高
投资回报率,或者其他竞争对手的紧迫进逼,迫
使它必须大张旗鼓地加入竞争。更何况,Nuance
的市值也没高到连乔布斯也买不起,必要时仍可
直接出手收购。
但搭上Siri之后,Nuance雄心勃勃。除了给
苹果公司提供技术支持, Nuance还与多家手机、电视机和GPS(全球定位系统)厂商保持合作关
系。三星(Samsung)的S-V oice也运用了Nuance
的技术。
紧接着,Nuance拒绝了苹果的收购,也没有
倒向谷歌。也就是说,Nuance仍然控制着语音识
别技术市场的开放度。它可以继续向三星、谷歌
等苹果的竞争对手提供技术,也保证了带有Siri
的iPhone手机不需要向谷歌缴纳专利费。
然而,这样的控制和保证,对已经尝到Siri
等语音识别技术滋味的公司是远远不够的。虽然
语音识别技术市场上只有Nuance一家市值不到50
亿美元的公司崭露头角,但是互联网高科技公司中的巨头并不是全无警觉与作为。
苹果收购了自动语音识别公司Novauris
Technologies(以下简称Novauris),致力于建立
一支强大的语音识别团队,并最终取代Nuance作
为Siri技术服务商的地位。
成立于2012年的Novauris是英国研究机构
Dragon Systems旗下的附属公司,以语音听写识别
著称。被Nuance 拒绝之后,苹果开始在波士顿招
揽人才,先后招聘了多位前Nuance语音科学家,包括前研究副总裁拉里·吉利克(Larry
Gillick)、Siri 的项目经理贡纳尔·艾弗曼
(Gunnar Evermann)、微软(Microsoft)语音识
别项目高管亚历克斯·阿赛洛(Alex Acero)。
谷歌在2004年从Nuance挖角,把谷歌语音识
别技术的开发部门交给Nuance前联合创始人Mike
Cohen执掌。2008年,在Nuance工作4年的Hugo
Barra跳到谷歌的移动部门,后进入安卓系统开发
核心部门,同时也回到他2000年在麻省理工学院
与同学创办的第一家公司的核心业务——手机语音辨识,参与开发谷歌语音搜寻项目。
2011年,谷歌收购了语音通信技术公司Say
Now 和语音合成技术公司Phonetic Arts。其中,Say Now创建于2005年,可以把语音通信、点对
点对话以及群组通话和社交应用整合在一起,支
持的设备包括PC浏览器、智能手机。一年后(即
2012年),谷歌发布了Google Assistant的前身
Google Now。Hugo Barra也作为参与研发Google
Now的骨干上台作了简报。到2012年时, Hugo
Barra成为谷歌的副总裁,2013年,他加入了当时
销售额增长最快、市场潜力最大的Android系统手
机厂商——小米。
Facebook在2013年收购了语音识别公司
Mobile Technologies。Mobile Technologies创建于
2001年,在2009年推出了Jibbigo应用。Jibbigo应
用允许用户在25种语言中进行选择,使用一种语
言进行语音片段录制或文本输入,然后将翻译显
示在屏幕上,再根据用户选择的另外一种语言读
出来。2013年,亚马逊收购了Nuance的竞争对手、语音技术公司Ivona Software。Ivona Software主要
做文本语音转换,被收购时支持17种语言以及44
种不同的声音类型。当时,亚马逊已经有了2011
年收购的语音识别公司Yap,以及2012年收购的
语音技术公司Evi。成立于2006年的Yap主要提供
语音转文本服务,代表应用是Yap语音邮件。亚
马逊利用Yap的技术建立了自己的语音技术平
台,服务于亚马逊的网上搜索和客户服务等领
域。Evi是一家初创公司,原名True Knowledge;
在获得了Nuance语音识别技术的授权后,它基于
自主的自然语言搜索引擎开发了一款与Siri类似
的应用。
在2013年的市场眼中,Nuance 还是世界上最
大的专门从事语音识别软件、图像处理软件及输
入法软件研发、销售的公司。Nuance拥有当时最
先进的计算机语音识别软件Naturally Speaking。
Nuance的另一款软件Nuance Verifier能提供声纹比
对的功能,与Speech Recognition结合可提供更安全的语音商务服务。人工智能的早鸟,能不能得到回报
2017年,英伟达跑赢了高通(Qualcomm)。
三年前的2014年,高通跑赢了英特尔(Intel)。
它们都是在人工智能上赌对方向的赢家。2017年
的今天,谷歌在人工智能上的成就,也与三年前
击败Facebook、成功收购DeepMind
Technologies(以下简称DeepMind)紧密相连。
2014年,3家公司因为人工智能而上榜“全球
50大最聪明公司”。上榜公司的总市值接近6000
亿美元。排在2014年“全球50大最聪明公司”榜单
第3位的是谷歌。它以超过5亿美元赢得DeepMind
公司。DeepMind将机器学习与神经科学结合起
来,创建了“通用学习算法”。
两年前(即2012年),Google X 实验室开发
出了一套具备自主学习能力的神经网络系统。不
借助任何外界信息的帮助,这种神经网络系统就能从1000万张图片中找出那些有小猫的图片。在
开始分析数据之前,研究者不会向系统输入任何
诸如“猫是什么样子”的信息。一旦系统发现了重
复出现的图像信息,计算机就会自动创建一
个“图像地图”,该地图稍后会帮助系统自动检测
与前述图像信息类似的物体。这个项目没有像通
常做的那样由研究人员为算法框定边界,而是直
接把海量数据投放到算法中,让算法自动从数据
中学习。这个项目的技术被应用到了安卓操作系
统的语音识别系统上。
生于1976年、坚信“数据会说话”的吴恩达
(Andrew Ng)是谷歌“识猫”项目负责人之一,他也曾是斯坦福大学计算机科学系和电气工程系
的副教授、斯坦福人工智能实验室的主任。2008
年,吴恩达入选《麻省理工科技评论》“35位35
岁以下科技创新青年”。2011年,吴恩达在谷歌
创建了“谷歌大脑”项目,通过分布式集群计算机
开发超大规模的人工神经网络。此外,他还与达
芙妮·科勒一起创建了在线教育平台Coursera。2012年,吴恩达开始在 Coursera 平台上线面向全
球的机器学习课程。到2017年年初,Coursera平
台的选课人数已达180多万人。2013年,吴恩达
入选《时代》杂志年度“全球最有影响力100
人”,成为16位科技界代表之一。
把自己的“聪明”程度与人工智能研发越来越
紧密地相连,表明一线大公司对人工智能的潜能
与其在更广泛领域的商业化前景越来越看好。随
着流向人工智能的资本增加,为之铺设“高速公
路”的基础设施商突然意识到了新的需求和机会
——芯片业开始发力。
人工智能的一个创新方向是为智能手机创建
能够运行神经网络的硬件。排在2014年“全球50
大最聪明公司”榜单第18位的高通公司,因开发
以“神经元”计算切入的芯片算力突破技术,2013
年的营收增长30%。高通当年的市值最高超过
1000亿美元,排在英特尔之前(2012年11月高通
的市值第一次超过英特尔)。
当谷歌开发出“认得”猫的人工智能时,在“看”YouTube视频的那个“它”有16000个处理器
和10亿个节点。普渡大学的科学家则努力以更紧
凑、更节能的方式设计深度学习硬件,使智能手
机和其他移动设备也能理解图像和视频内容。
2013年12月,在美国内华达州的神经信息处
理系统大会上,普渡大学研究小组展示了与传统
智能手机处理器连接的协处理器。这个协处理器
可以帮助手机运行深度学习软件,能够检测街道
场景的面部或标签部分。协处理器的设计在
FPGA上进行了测试。FPGA是可重新配置的芯
片,可以通过编程来测试新的硬件设计。
当然,该原型机没有谷歌“识猫”的人工智能
那么强大,但它显示出新的硬件设计可以令
Google Glass这样的智能可穿戴设备也“理解”照片
或视频。而以此为基础开发的应用程序能够在识
别出特定的人物(如妈妈)、对象(如出租车)
或场景(如医院)后采取行动。
深度学习是由模拟神经元构成的多层网络过
滤数据。单个的模拟神经元构成虽然简单,但一起工作却可能表现出复杂的行为。计算机模拟这
样的网络,效率并不高。普渡大学的协处理器专
门用于运行多层神经网络,并将其用于大量的图
像。在测试中,原型机的效率是GPU的15倍,系
统改进后的效率更可以达到目前效率的10倍。
主持这项研发的普渡大学教授Eugenio
Culurciello已经创立了一家名为Tera Deep的公
司,将自己的设计商业化。
与此同时,HRL实验室(波音和通用汽车的
一个联合实验室)神经和涌现系统中心主任
Narayan Srinivasa的研究重点是通过更加极端的解
决方案来解决这个问题:设计具有硅神经元和突
触的芯片,模仿真正的大脑。他表示,使用单独
的硬件实现深度学习是有道理的,因为通常处理
器和内存位于硬件的不同位置,而人类大脑以及
深度神经网络的存储和处理是交织在一起的。
继语音识别技术之后,人工智能下游的消费
应用场景也逐渐丰富起来。随着微软发布语音助
理 Cortana,越来越多的超级应用界面公司意识到,基于人工智能的语音技术不仅是推动用户原
有应用界面的背后力量,更可能成为下一代超级
应用界面。2014年获得1300万美元融资的Expect
Labs成为排名第47位的“全球50大最聪明公司”,它基于实时语音语义分析开发的软件通过倾听对
话而提供相关信息,最多有8人可以通过公司的
Mind Meld应用程序同时在线,参与对话 [1]。
一些公司在试图模仿、替代人脑,另一些公
司则专注于“人机共生”,开发增强人类能力的软
件。心理学家和计算机科学家J.C.R.Licklider在
1960年发表了一篇预言性文章,开创了“人机共
生”这个思考方向。
在“深蓝”打败加里·卡斯帕罗夫的8年后,两
名拥有3台计算机的美国象棋业余爱好者从巨型
计算机象棋大师的手中夺走了2万美元的奖金。
这次,胜利者依靠的不是自身的国际象棋技能,而是一种“人机共生”的工作方式:计算机负责计
算,人负责决策。
Palantir是美国加利福尼亚州帕罗奥图市的一家快速成长的软件公司,其目标就是促进“人机
共生”。Palantir的软件让用户工具能够探索互联
的数据,并尝试通过视觉来呈现信息,通常用作
跟踪人们思考的地图。一家银行购买了Palantir的
软件,以便侦测窃取或泄露敏感信息的员工。监
测的信息包括员工何时何地进入地点,以及公司
网络上的数字活动记录。相较于自动化系统里是
用一个算法根据过去的数据计算出一切,Palantir
这个系统正好相反。
Palantir的创始人在PayPal工作期间受到“人机
共生”理念的启发。原本,PayPal设计了一个自动
化系统来标记欺诈性交易。该系统能够抓住80%
的简单欺诈行为,但是无法应对复杂的骗局。最
后,PayPal研发了一款软件,让操作人员能够追
踪剩下的20%的欺诈行为。其通过分析工具洞察
大量数据中的可疑活动,而不是等待自动化系统
发现。
成立了9年的Palantir有美国中央情报局提供
的资助,数据分析软件的销售对象包括执法机构、银行和其他行业,并正在扩展到医疗保健等
新兴行业。《福布斯》在2013年时估计,这家公
司的收入为4.5亿美元。据彭博社报道,2017年年
底,该公司的订单总额可达35亿美元。
从商业上看,“人机共生”或者说“有限”人工
智能,成功的概率似乎更高。人们适应了个人生
活与智能手机的共生关系,能够在主导权不变的
条件下享受更多工具性的助理服务。
Palantir研发负责人Shyam Sankar和IBM研究
策略总监Zachary Lemnios都是Licklider的粉丝。
Shyam Sankar认为,分析师只有获得了能让他们
从各个角度创造性地检查数据的工具,才能发现
这些“灵光一闪”的时刻。Zachary Lemnios则觉得
Licklider的想法有助于IBM在“认知计算”方面的研
发,包括虚拟助手软件和像大脑一样运作的芯
片。
无论沿着哪一条研发路径走,人工智能都不
是人人可以参与的便宜的联机游戏。在拥有资本
实力的大公司之间,竞争变得白热化,收获却依然很遥远。这一年(2014年),亚马逊的表现仍
然不起眼。Fire手机是一次失败。搭载AWS云计
算软件的Echo智能音箱,也得到一片嘘声。市场
和业界还要等两年才能反应过来,并为之叫好。
而沃森尽管在2011年美国热门益智节目《危
险边缘》(Jeopardy !)中打败了最高奖金得主布
拉德·鲁特(Brad Rutter)和纪录保持人肯·詹宁斯
(Ken Jennings),但到了2014年,IBM投资的10
亿美元只收回不到1亿美元。通过基于沃森的销
售,IBM获得的收入远低于其每年100亿美元的长
期目标。对于IBM来说,认知计算是指了解自然
(人类)语言并可以通过挖掘所有数据业务面临
的所有非结构化数据(如文本和音频)来得出合
理结论的系统。而沃森是IBM在这一领域最大的
商业想象,它决心加大赌注。
于是,从事沃森技术的部门将直接向IBM首
席执行官弗吉尼亚·罗梅蒂(Virginia Rometty)汇
报。员工人数增加了4倍,达到2000人。IBM还计
划将沃森与其他“认知计算”技术结合,并追加投资10亿美元,大步推进沃森的商业化。沃森首席
技术官Rob High 告诉《麻省理工科技评论》,对
于向前推进一个更大的投资,“这是正确的时
间”。
想让沃森成为可以向企业销售的“认知服
务”引擎,就必须添加语音识别和图像识别功
能。不过,IBM的问题是,沃森在现实世界中挖
掘书面信息和处理自然语言的能力仍未达到理想
状态。
IBM一直希望沃森能够阅读医疗记录并推荐
治疗方案,尤其是癌症治疗。如果说参加电视问
答游戏是在周末爬爬北京的香山,那么为癌症患
者提供对症的治疗建议就是一次海拔5000米以上
的登顶挑战。同时,医生写下的医疗记录充斥着
行话、缩略语和不一致的术语,这也给沃森阅读
医疗记录带来了挑战。
与IBM一起研发这种“癌症助理”的美国纪念
斯隆-凯特林癌症中心的研究人员在2013年提供的
数据中,沃森准确地确定了患者记录中的所有关键数据,花费的时间仅仅是平时的一半。但这还
不是医生需要的人工智能的医疗建议。从医学课
本里找一条治疗建议的工作,价格便宜得多的软
件就能完成。纪念斯隆-凯特林癌症中心的癌症专
家想要的沃森是医生的顾问和同事,是临床医学
指南的搜索软件。沃森、Go或者是吴恩达……这是争夺
注意力的竞赛
对技术的商业化而言,吸引资本和注意力,始终是第一要务。
在不同的区域市场,更多的企业意识到,人
工智能可能满足它们通过技术创新来建立新的盈
利增长点的需求。人工智能研发公司也感觉到竞
争加剧,想要获得更多合作伙伴的支持,提高未
来市场的占有率,就必须赢得投资人、客户、最
终消费者和政府等各类决策者的注意力。2015
年,具有高辨识度的智力人才争夺,吸引上下游
实力强劲的合作伙伴加入游戏,像乔布斯那样精
心策划、制作、投放广告,直至公开张扬地挑战
人类智能,都使人工智能走出研究机构和大公司
的实验室,成为一个市场热点。
IBM不惜重金请奥美策划了系列视频广告和《纽约时报》的整版广告。正是在其中一个视频
广告里,沃森和一年之后(2016年)获得诺贝尔
文学奖的音乐人鲍勃·迪伦进行了本章开头的那段
对话。
阿尔法狗也做好了扬名立万的最后准备。
2015年10月,阿尔法狗击败欧洲围棋冠军、华裔
法籍职业棋手樊麾,成为第一个无须让子即可在
19路棋盘上击败围棋职业棋手的计算机围棋程
序,写下了历史。DeepMind也于2016年1月在
《自然》上发表了相关论文。下一步,它要在围
棋竞赛中建立IBM“深蓝”在国际象棋竞赛中那样
的功绩。
2015年,4家公司因在人工智能领域的突破
而登上“全球50大最聪明公司”榜单。上榜公司的
总市值接近3000亿美元。一直紧跟全球科技创新
趋势的中国互联网公司浮出水面。
百度,这个在中国市场占有率第一的搜索引
擎公司,排在2015年“全球50大最聪明公司”榜单
的第21位,上榜理由是“中国互联网公司的新深度学习研究实验室在面部和语音识别领域取得了
值得注意的成果”。百度2014年的研究开支增加
了70%,并在当年5月16日将吴恩达招至麾下。吴
恩达加入百度后,负责“百度大脑”计划,并担任
百度的首席科学家。
刚在旧金山创办一年的公司Enlitic因“其深度
学习技术可以在医学扫描中自动发现肿瘤”名列
2015年“全球50大最聪明公司”榜单的第39位。创
始人兼首席执行官(CEO)杰里米·霍华德来自澳
大利亚的墨尔本,第一次“创业”是销售游戏软
件,18岁时他作为一名自学成才的数据分析师被
麦肯锡雇用,先后创立了Optimal Decision
Group(用数据分析来帮助保险公司提高利润)
和FastMail。2010年,杰里米·霍华德在一场
Kaggle比赛中获得第一,随即被邀请加入 Kaggle
,担任总裁兼首席科学家。
Enlitic 是杰里米·霍华德在2013年12月离开
Kaggle后创建的公司,通过深度学习来改进医学
诊断和临床决策。2015年10月,Enlitic再获1000万美元融资,投资方为影像诊断服务公司Capitol
Health。Capitol Health是一家为澳大利亚各地的
诊所提供影像诊断服务的上市公司。Enlitic通过
为Capitol Health提供深度学习的技术,来提高其
放射科医生的工作效率。Capitol Health则在给
Enlitic提供珍贵的医疗影像的同时,让其放射科
医生与Enlitic的软件工程师进行协作。
澳大利亚医疗保险预算中的放射性检查的费
用在20亿美元以上,2014—2015年的扫描次数约
为3360万次。对这些扫描数据的分析工作,一个
Enlitic程序可以在8天内全部做完,而一个人可能
需要1282年。2016年,将Enlitic算法与4名顶级放
射科医师的工作进行了对比,其结果是,人类放
射科医生未能发现的7%的癌症,Enlitic全部发
现;有66%的病例被人类放射科医生误诊为癌
症,Enlitic为47% [2]。
同样对医疗市场紧紧咬住不放的是IBM。
IBM位列2015年“全球50大最聪明公司”榜单的第
46位,《麻省理工科技评论》认为IBM“关于人工智能的新型研究可以帮助该公司实现长期计划:
让大数据更有用”。2015年, IBM在北美签署使
用沃森系统指导癌症治疗的医院数量达到14家。
与此同时,沃森还在不断拓展应用领域。沃
森在唱歌、拍广告之余,也做沙拉。据《麻省理
工科技评论》报道,沃森记住了10000种食谱。
在沃森的支持下,用户可以选择几种关键食材
来“发现”食谱,然后通过类似在线音乐电台的匹
配算法将具有同样特征的食材分为一组,也可以
用最初选择的食材与系统识别的食材配对,或将
其替换为另一种。
语音个人助理研发、应用与市场在2015年持
续成长。之前,苹果有了Siri,谷歌有了Google
Now,微软有了Cortana。2015年,Facebook 收购
了语音识别公司Wit.ai 。Wit.ai 是孵化器Y
Combinator 旗下的创业公司。在创始团队中,Alex Lebrun 任首席执行官。Alex Lebrun 此前也创
办过一家语音技术公司 VirtuOZ,该公司后来被
Nuance 收购。团队成员Laurent Landowski是VirtuOZ 的欧洲区总经理。Wit.ai在种子轮融资中
得到了300万美元,投资方包括Andreessen
Horowitz、SV Angel、Ignition Partners以及影星
Ashton Kutcher 等。
有观察者认为,该公司的技术有助于
Facebook获得更多信息用于定向广告。而对马克·
扎克伯格来说,事情恐怕没有那么简单。Wit.ai
允许用户直接通过语音来命令移动应用程序 (如
iOS、安卓等平台)、穿戴设备、机器人以及任
何你可以想到的智能设备。简单来说,是“能把
语言转化为可操作的数据”,让创业者能够给自
己的应用程序引入语音识别技术,帮助开发者汇
集他们的语音样本来驱动一个语音与自然语言识
别系统。通常来说,语音算法的开发者需要先创
建“语法”——你希望计算机能够识别的单词和词
组集合,然后“训练”计算机识别那个语法。由于
不同的用户会用不同的方式来表述他们的指令,语法需要能够识别尽可能多的相同意图的不同表
达方式。而Wit.ai让用户能够共享语法和训练数据。开发者能够复制那些语法来随意调整自己的
应用程序。
位于2015年榜单第28位的“全球50大最聪明
公司”是英伟达,其“芯片对深度学习和无人驾驶
汽车这样的尖端技术而言是至关重要的硬件”。
作为一家早在1993年就成立的芯片公司,英伟达
的名声一直限于计算机游戏的GPU供应商。2015
年英伟达的收入为47亿美元,股价为20美元。然
而,仅仅两年后(截至2017年11月),英伟达的
收入就增至69.1亿美元,股价已超过200美元,因
为现在它的客户是人工智能。争当卖水人的芯片商们
需求正在改变。对芯片商来说,对未来订单
的预期决定了一切。在人工智能和机器学习的早
期阶段,按美国航空航天局前局长丹·戈尔丁
(Dan Goldin)的说法:“就像狂野的西部,总会
有疯狂的事情发生。”
丹·戈尔丁创办的Knupath公司在2016年6月推
出了一款名为Hermosa的人工智能芯片,以及连
接51.2万个Hermosa和其他芯片的软件。第一个版
本将专注于在嘈杂的环境中识别特定的声音。用
户可以开着敞篷车,边听收音机,边用自己的声
音登录电子银行。该公司筹集了1亿美元的资
金。
2016年,在人工智能领域有4家公司登上“全
球50大最聪明公司”榜单。上榜公司的总市值接
近9000亿美元。名列2016年“全球50大最聪明公司”榜单第30
位的是一家叫Movidius的初创公司。Movidius的
主要业务是为计算机视觉应用开发专用芯片,以
及全新的增强现实与虚拟现实专用芯片。这对增
强现实与虚拟现实设备,以及下一代智能手机和
无人机,都具有重要意义。
这家公司由Sean Mitchell和David Moloney创
立于2006年,早期做的是将旧电影转为3D电影的
业务,为3D电影市场做内容。后期开始研发应用
于3D渲染的芯片,并开始应用于计算机视觉应用
领域。2015年4月,Movidius宣布完成4000万美元
的E轮融资,由Summit Bridge Capital、Capital-
E、德丰杰和Emertec Gestion等投资机构投资,融
资总额达到8650万美元。
Movidius花费9年时间自主研发低功耗视觉处
理器Myriad系列VPU,它能够为设备提供强大的
自主运算能力,从无人机、虚拟现实(VR)到增
强现实(AR)都有所涉猎。2014年,Movidius与
谷歌的Project Tango项目合作,用Myriad 1打造室内三维地图。2016年2月,谷歌与 Movidius 合
作,将图片识别功能整合在手机上,以促进深度
学习功能在移动终端的运用。2016年3月,大疆
的“精灵4”同样采用了Movidius 的 Myriad 2芯片。
2016年6月,联想也和 Movidius 建立了战略合作
伙伴关系,由后者在未来为其虚拟现实设备提供
技术支持 [3]。
毫无疑问,2016年“全球50大最聪明公司”榜
单上排在第49位的另一家公司——英特尔密切关
注着Movidius的一举一动。将人工智能嵌入移动
设备(如手机、可穿戴设备、平板电脑、汽车
等),这样的芯片不是英特尔的“菜”。类似芯片
的单位利润也远远比不上英特尔的主流产品的单
位利润。但Movidius这类新型芯片商看重的是人
工智能所形成的新市场的规模。仅无人驾驶汽车
每年的产量就可能达到数千万台,如果每辆车都
有很多这样的芯片,这个细分市场的规模即可匹
敌传统的PC市场。
英特尔在前几波计算机行业的浪潮中一直扮演着“卖水人”的角色。现在,它又发现了涌向“新
金山”的人潮。不过,像每一次“淘金潮”所发生的
那样,试图垄断“卖水生意”的绝不止英特尔一
个。英特尔在计算机芯片市场长期独占鳌头,靠
的是走在客户需求的前面。
1997年,英特尔首席执行官安迪·格罗夫
(Andy Grove)成为哈佛商学院教授克莱顿·克里
斯坦森(Clayton Christensen)教授的第一批大企
业家。察觉到英特尔可能被PC芯片的竞争对手以
更便宜的产品削弱,安迪·格罗夫邀请克莱顿·克
里斯坦森与他的团队讨论对策。没多久,英特尔
为PC推出了一系列低端赛扬处理器,摧毁了
Advanced Micro Devices等公司的赶超梦。
但是,最近10年,世界上最大的芯片制造商
错失了芯片制造方面的最大机会——移动芯片。
尽管投资巨大,英特尔还是取消了部分移动芯片
Atom的开发,同时裁减了12000个工作岗位。而
更近一些,英特尔对又一个潜在的巨大市场——
为深度学习开发人工智能芯片也不太上心。直到2016年。
4月,英伟达发布了运算速度极快的深度学
习算法芯片——特斯拉P100 GPU。对于英伟达来
说,深度学习正在创造收入增长。将发展重点放
在人工智能,主要在于往深度学习方向发展的大
型互联网公司,发现GPU可以帮上忙。最好的英
特尔处理器中的每一个都包含几十个用于运行复
杂算法的内核,拥有足够的处理能力来运行大量
的电子表格或企业软件,但对运行深度学习算法
反而浪费和低效。针对深度学习算法优化的芯片
会将特定类型的问题(如理解语音命令或识别图
像)分解成数百万个小块。包含数千个微处理器
核心的英伟达的GPU的算力,正好能“不假思
索”地同时处理数千个这样的小块,一次性地对
图像或其他数据进行正确分类。
因此,英伟达一下子在新兴市场上占据了领
先地位。从汽车到制药再到金融服务,3500个客
户的合作需求涌向圣克拉拉。
5月,谷歌宣布,其专门为深度学习算法Tensor Flow设计的专用集成芯片TPU已经秘密使
用了一年多。这是谷歌第一次逆行到昂贵且困难
的上游产业——芯片,因为谷歌不满足于市场上
的现成产品。尽管谷歌将继续在计算基础架构中
使用英特尔处理器,但其人工智能的快速发展和
越来越激烈的竞争都要求定制化硬件。
9月,微软发布了可以执行BING机器学习算
法、支持Azure和Office365的FPGA。这个与英特
尔长期合作的大客户正尝试利用Altera等公司的
可编程芯片,例如FPGA,来增强英特尔处理器
的计算性能,以提高网页搜索速度。Altera在20
年前发明了世界上第一个可编程逻辑器件,尤以
FPGA芯片著称。FPGA芯片被广泛用于手机、平
板电脑等小型嵌入设备和数据中心的服务器中。
相比英特尔所生产的传统芯片,这种芯片最大的
不同在于可以根据不同场景进行重新编程,且运
行速度高于常规微处理器。
同时,高通也在推出软件工具来帮助客户使
用移动芯片进行深度学习。Knupath和Nervana等创业公司则在重新设计全新的深度学习芯片。
英特尔终于准备推出专为深度学习而设计的
第一个芯片。这是一个新版本的Xeon Phi协处理
器,它与英特尔的旗舰X86微处理器配合使用。
英特尔的另一个大客户——百度的语音识别技术
和深度学习团队负责人布莱恩·卡坦扎罗(Bryan
Catanzaro)测试Xeon Phi协处理器之后,表示它
可以像GPU那样有效处理大约90%的深度学习任
务。布莱恩·卡坦扎罗是加州大学伯克利分校
(UC Berkeley)的电气工程和计算机科学双料博
士。他于2014年6月加入百度,带领一个15人的
研发团队,探索语音识别领域,训练和部署深度
神经网络的工具和方法。他去百度之前,还在英
伟达工作了3年。
但布莱恩·卡坦扎罗担心英特尔没有开发软件
工具来帮助客户完善和维护神经网络,像英伟达
(或高通)所提供的软件工具一样。作为客户,他不希望英伟达是唯一可行的选择。有趣的是,2016年9月,布莱恩·卡坦扎罗离开百度,重新加入英伟达,成为英伟达深度学习应用研究部门的
副总裁。
竞争对手英伟达建立了先发优势。当英特尔
犹豫不定时,百度从英伟达购进的深度学习芯片
的数量已经是向英特尔采购的4倍。不过,英特
尔在这方面的财务损失有限。市场研究公司
Tractica表示,亚马逊、谷歌和其他云服务巨头购
买了价值1.33亿美元的芯片来运行深度学习系
统。这是英特尔2015年560亿美元收入的一大亮
点。
说到底,成立半个世纪、看惯了前沿技术商
业化过程中周期性表现的英特尔担心深度学习好
景不长。人工智能有过疯狂的过去,当一种技术
风潮的周期结束时,裸泳者比比皆是。不能因为
只盯住了深度学习,就排除了其他发展人工智能
的方法。英特尔首席执行官布莱恩·克赞尼奇
(Brian Krzanich)判断,公司的未来取决于其在
大型数据中心和物联网中的表现。
英特尔的风格一向是务实。当然,谨慎是以速度为代价的。面对对手不断发布人工智能“定
制”产品而带来的内部研发压力,英特尔需要用
其他手段来化解市场焦虑,平衡公司战略。
花了一年的时间,英特尔以167亿美元收购
了Altera,展示了自己在人工智能领域战略布局
的能力。收购完成后,英特尔可以将Xeon芯片和
FPGA封装在一起,集成为一个芯片,尽可能以
提升性能来应对客户不断增长的需求。这一收购
表明,布莱恩·克赞尼奇计划利用公司巨大的制造
规模和行业最先进的工艺技术来扩大市场份额,同时强化英特尔在数据中心和物联网市场的地
位。
2016年8月,英特尔以3.5亿美元收购了一家
主攻深度学习的公司Nervana。这一次收购能够让
英特尔获得深度学习的IP(知识产权)和具体产
品,能够满足人工智能开发及数据中心对芯片的
强大需求。Nervana的开发工具不仅可以支持
Altera的FPGA的最优化,也可以支持GPU的开
发。又过了一个月(2016年9月),英特尔宣布
收购 Movidius。世界上最大的无人机制造商大疆
在最新的Phantom 4中增加了Movidius制造的“视觉
处理单元”。该芯片处理Phantom 4的摄像机所看
到的事物的功能,使得无人机能够避免撞到飞行
物。
即使Movidius首席执行官Remi El-Ouazzane在
不久之前公开称,感觉不到英特尔的热情,但他
也算得很清楚:英特尔在银行里有150亿美元,而且,“他们不蠢”。
依靠一系列并购,下一年(2017年),英特
尔将保留“全球50大最聪明公司”的称号,并上升
到榜单的第13位。
拥有吴恩达的百度发力人工智能,在硅谷加
速扩张。2015年,百度开发了语音识别系统“深
度语音2”(Deep Speech 2)。深度语音2可以进
行深度学习,它的语音识别能力甚至比人还强。
深度语音2作为百度硅谷人工智能实验室
(SV AIL)的研究成果,吴恩达认为,这证明了端对端深度学习方法可以被用于识别差别很大的
语言。采用高性能计算技术导致了7倍的加
速。“与一年前这个时候相比,需要几周才能完
成的实验现在只需要几天。这使得迭代更快
了。”百度成为2016年“全球50大最聪明公司”榜单
的第2名。
麻省理工学院于1964年研发的伊丽莎
(Eliza)可能是最早的一批聊天机器人。伊丽莎
扮演心理治疗师的角色,用一个简单的动作来吸
引你的注意力:提出标准的问题,并经常在问题
中引用对方的回答。
排在2016年“全球50大最聪明公司”榜单第26
位的微软除了在2015年赢得全球图像识别大赛
(其研发的深度神经网络系统拥有152层虚拟神
经元)之外,还试图将深度神经网络整合到
Skype的服务中,以实现通话同步翻译。一下
子,无数个聊天机器人出现在即时通信应用中,伴随着惊喜,也引发了期待。这些应用包括
Kik、微信、Telegram和现在的FacebookMessenger。有些只是为了娱乐,但越来越多的人
用它们做些有用的事情:可以预订航班,仔细阅
读最新的高科技头条新闻,甚至通过向虚拟助手
输入消息,从汉堡王购买汉堡。创业公司正在竞
相提供工具,以加速这些虚拟管家的开发、管理
和“货币化”。
新一波聊天机器人热潮显然受到人工智能在
图像和音频方面进步的激励,但在训练计算机处
理和应对语言方面没有根本的突破。人类语言的
复杂和微妙之处,仍然容易迷惑机器人。卡内基
梅隆大学助理教授克里斯·戴尔(Chris Dyer)提
醒,虽然对解析语言每几个月都会有令人兴奋的
成果,但不要期待机器人马上可以处理一切,不
论是法律咨询、医疗咨询和精神科咨询可能都是
非常危险的。
磨了很多年的剑之后,亚马逊依靠标价89.99
美元的Echo Dot及其背后Alexa的语音服务排在
2016年“全球50大最聪明公司”榜单的第1位。亚
马逊日益强大的Alexa智能语音助手,使语音服务联结了消费者对上网、播放音乐、调节灯光和设
定恒温器的需求。同时,网络及云计算服务也正
在迅速发展并将成为亚马逊新的增长点。
谷歌的母公司Alphabet也毫不意外地上榜
了,排在2016年“全球50大最聪明公司”榜单的第
8位。它的人工智能项目和无人驾驶技术均已名
声大噪,尤其是阿尔法狗。
自2014年起,阿尔法狗以英国棋友deepmind
的名义开始在弈城围棋网上对弈。deepmind在
2014年4月到2015年9月,棋力维持在七段到八段
之间,总共下了300多盘棋。2015年9月16日其棋
力首次升上九段,10月击败樊麾。
2016年3月,通过自我对弈数以万计盘进行
强化练习,阿尔法狗在一场五番棋比赛中以4:1击
败顶尖职业棋手李世石,成为第一个不借助让子
而击败围棋职业九段棋手的计算机围棋程序。五
局赛后,韩国棋院授予阿尔法狗有史以来第一
位“名誉职业九段”称号。
战胜李世石之后,2016年12月29日至2017年1月4日,再度强化的阿尔法狗以“Master”为账号
名称,在未公开其真实身份的情况下,借非正式
的网络快棋对战进行测试,挑战中韩日的一流高
手;测试结束时它60战全胜。在2017年5月23日
至27日的乌镇围棋峰会上,最新的强化版阿尔法
狗与世界第一棋手柯洁比试,并配合八段棋手协
同作战,对决5位顶尖九段棋手,5场比赛获得3:0
全胜的战绩,团队战与组队战也全胜。此次阿尔
法狗利用谷歌TPU运行,加上快速进化的机器学
习法,运算资源消耗仅占李世石版本的十分之
一。在与柯洁的比赛结束后,中国围棋协会授予
阿尔法狗职业围棋九段的称号。从业余棋手到无
可置疑的世界第一,阿尔法狗只花了两年时间。眼看科大讯飞突起,没有大公司感觉
安全
人工智能已经成为席卷所有行业的流行时
尚,而语音识别技术俨然已是一个成熟市场。根
据国际市场研究公司Research and Markets 发布的
《全球及中国语音产业报告,2015-2020》,虽然
2013年的上榜公司Nuance在语音识别领域的市场
份额仍位居第一,但其全球市场占有率已经从
2014年的高达60%跌至31.1%。从Nuance手里“切
走奶酪”的公司,分别是谷歌(20.7%)、苹果
(13.4%)、微软(12.9%)、科大讯飞
(6.7%)。而科大讯飞(Iflytek)在中国语音技
术市场的占有率更是达到了70%。
科大讯飞排在2017年“全球50大最聪明公
司”榜单的第6位,其上榜理由为,该公司旗下的
语音助理技术是中国版的Siri。科大讯飞的实时翻译技术则是杰出的人工智能应用,克服了方
言、俚语和背景杂音等困难,可将汉语精准地翻
译成十几种语言。有超过16万名开发者使用科大
讯飞的软件,超过4亿消费者使用其产品。
2016年,科大讯飞在多项与人工智能相关的
国际比赛中胜出。其首次参加由谷歌承办的第四
届国际语音识别大赛(CHi ME),就获得全部三
项赛事的第一名并刷新历史纪录;首次参加国际
知识图谱构建大赛(NIST TAC Knowledge Base
Population Entity Discovery and Linkong Track),就包揽了赛事核心任务的冠亚军。其在国际认知
智能测试(Winograd Schema Challenge)中也获得
第一。
科大讯飞脱颖而出,很大程度上得益于中国
——这个规模大到不可思议的市场。在中国商业
客户需求巨大且最终消费者乐于尝试的面部识别
服务市场,排在2017年“全球50大最聪明公司”榜
单第11位的旷视科技,其所开发的面部识别技术
可以在人脸上追踪最多106个点位,获得了与众多最受欢迎的应用程序合作的机会。例如,在线
支付平台支付宝应用了该技术,让用户可以使用
他们的脸作为ID登录;共享出行软件滴滴出行使
用它来验证平台自由职业者的身份;智能手机应
用程序美图秀秀使用它来提供精准的照片修饰功
能……这个5岁的初创公司被认为是第一个面部
识别的“独角兽”,近年来至少募集了1.45亿美元
资金,这其中包括在2016年12月募集的1亿美
元。
2017年,“全球50大最聪明公司”榜单中的12
家公司的上榜理由的关键词是“人工智能”,上榜
公司的总市值超过1.1万亿美元。人工智能的市场
边界和竞争格局已经远远超出了科技公司和互联
网公司,那些经历了多次技术革命和人类全球战
争的传统公司也积极赶了上来。
排在2017年“全球50大最聪明公司”榜单第40
位的是通用电气(General Electric,GE)。通用
电气的目标是,到2020年之前成为世界顶级的软
件供应商;那一年,将有60000台喷气式发动机的数据会接入互联网,成为人工智能的分析对
象。
在2011年,通用电气就进行了初步探索:启
动了一项10亿美元的计划,来收集和分析来自机
器中的传感器数据。通用电气的下一步战略计划
是通过人工智能创建更智能的模型,希望借此能
比其长期竞争对手(如西门子)和软件巨头(如
已经将业务伸展到工业分析的IBM)更具优势。
该公司的大型服务性业务建立在监测现有产品之
上,如飞机发动机、机车和燃气轮机。公司也一
直专注于通过这些业务收集和分析数据。现在,上述这些数据系统中加入了人工智能,用于记录
工厂状况并提前预测故障。
这家125岁的公司在历史上曾无数次调整发
展战略。这次,首席执行官约翰·弗兰纳里(John
Flannery)再次改变公司的战略:利用复合型科
学家将人工智能贯穿公司整个业务。
通用电气在全球范围内拥有30万名员工,为
了顺利完成整合,公司首先是培训技术精英。2011年,詹森·尼克尔斯(Jason Nichols)在完成
加州大学伯克利分校有机化学博士学业后,加入
通用电气全球研究中心,从事了4年的制造和研
发用于工业废水处理的材料及系统。之后,他被
调到公司的机器学习实验室,接着又开始研究增
强现实技术。由于公司未来致力于将人工智能注
入其机器和工业流程中,所以像詹森·尼克尔斯这
样的复合型人才对公司未来的发展至关重要。詹
森·尼克尔斯所在的通用电气全球研发中心开发了
机器学习在线课程,以及可供科学家探索新角色
的专题讨论会。截至目前,公司有近400名员工
完成了通用电气数据分析认证项目,约有50名科
学家与詹森·尼克尔斯一样调到数字分析岗位。
这些双重角色科学家中的许多人,帮助制造
了通用设备的云端软件模型,既节省了资金,也
提高了用户使用的安全性。通用电气利用机器传
感器收集的信息,辅以基于物理的模型、人工智
能、数据分析以及科学家和工程师的知识,建立
了“数字双胞胎”。虽然数字双胞胎主要是一行行软件代码,但是最精细的版本看起来像3D计算机
辅助设计图,图中充满了交互式表格、图表和数
据点。它们使通用电气能够利用传感器数据而非
假设或估算数据来跟踪其飞机发动机、机车、燃
气轮机和风力涡轮机的磨损,从而更容易预测何
时需要维修。例如,在加利福尼亚州的通用电气
计算机服务器上安装一对数字双胞胎,来帮助一
架飞越美国的飞机发动机确定其零部件的最佳服
务时间。
除了预测机器的预期寿命外,虚拟模型还能
优化产品的运营。通用电气表示,数字双胞胎能
使风力发电厂的发电量增加20%,其中一部机车
每年可减少32000加仑(约121000升)的燃料和
17.4万吨碳排放量。截至2017年7月,通用电气已
经向客户交付了70多万个模型。这项技术依靠的
是人工智能的不断自我更新。例如,检测引擎的
微型机器人只比一个火柴盒稍大一点。利用计算
机视觉和各种人工智能技术,机器人可以通过在
缓慢移动的风扇叶片上行驶来寻找飞机发动机内的裂纹。类似的技术可以装到无人机上,用于发
现200英尺(约60.96米)高的火炬塔(油气厂用
于燃烧多余油气的设施)上的腐蚀。
为了开发和使用这些系统,通用电气的研究
人员不仅需要了解机器的物理特性,还要了解人
工智能的算法。通用电气全球研发中心的分析技
术总监马克·葛莱伯(Mark Grabb)看好分子生物
学家、机器学习专家、控制专家与材料科学家的
协作,这将会非常强大。对于一个在从涡轮机、喷气发动机到机车等竞争性“红海”中寻找增长机
会的传统公司来说,复合型科学家带动的人工智
能发展,可能是通向未来的最佳交通工具。
那些跟不上的科学家,就会被抛在后面。
2016年,通用电气创建了100个与人工智能和机
器人技术有关的研究工作;2017年1月,通用电
气解雇了研究领域被认为与“数字工业”战略关系
不大的研究人员。
2017年,围绕更适应人工智能进化要求的计
算,芯片业战况加剧。虽然排在2017年“全球50大最聪明公司”榜单第13位的英特尔在2017年3月
推出了一系列新产品,增强了在人工智能领域的
影响力,但英伟达的领先优势仍在扩大,其市值
在两年中增加了近9倍,达到909亿美元。连对计
算机如何工作一知半解的普通投资者也知道了这
家芯片公司。这一年,英伟达的市值一度超过了
高通——这个6年前黄仁勋公开指认的公司最直
接的竞争对手。
英伟达被评为 2017年“全球50大最聪明公
司”榜单的第1名。虽然英伟达的主要收入仍然依
靠图形处理器的销售,不过,它在人工智能软件
处理能力上也取得了长足进步。据最新的季报显
示,公司在数据中心和汽车领域的业务收入分别
比2016年增长了186%和24%。
其他在研发上艰苦积累多年的市场玩家也开
始在更广泛的应用场景中看到了回报。
开发者为Alexa开发的程序数已经达到12000
个。2017年继续保持“全球50大最聪明公司”称
号、位列该榜单第3位的亚马逊,正在创造由人工智能驱动的未来商店Amazon Go,并且正在将
语音助手Alexa整合到手机、汽车以及更多的产品
中。
近年来,亚马逊使用了包括计算机视觉、机
器学习和自然语言处理在内的一系列人工智能技
术,彻底升级了移动计算能力并改善了消费者的
购物体验。消费者可以通过该公司研发的语音助
手Alexa控制电视、汽车等诸多物件,而且它有望
在将来成为下一个重要的计算平台。
此外,亚马逊还通过位于西雅图的亚马逊便
利店简化线下购物体验。消费者进入商店,扫描
智能手机上的应用程序,随后带着想买的物品离
开便利店,即可完成购买过程。得益于人工智能
技术,亚马逊可以使用相机和传感器来识别消费
者选择的商品,并自动结算,无须排队结账。
如同所有前沿技术的研发,对人工智能的持
续投入离真正的现金牛业务还很远。雄心将时时
面对挫败和重新出发。排在2017年“全球50大最
聪明公司”榜单最后一位的百度虽然收入放缓,却依然不断向人工智能研究投入资金。2017年1
月,百度与合作伙伴推出了一款与亚马逊的Alexa
类似的、搭载了Duer OS的智能语音助手。
百度在人工智能研究上投入了大量成本,能
否将这些项目商业化还有待时间的检验,但中国
政府选择了百度来领导中国的第一个国家级人工
智能研究实验室。现在,百度有1700名专职从事
与人工智能相关工作的员工——只是,吴恩达离
开了。
技术创新投资和财务回报的矛盾也摆在了排
在2017年“全球50大最聪明公司”榜单第39位的
IBM面前。IBM投资了一系列新兴技术,该公司
认为这些技术将会为公司带来可持续的收益增
长。尽管IBM多年来一直向投资者允诺其新业务
(包括区块链、云计算和人工智能服务)带来的
收入将达到2016年公司总收入的40%以上,但到
2016年年底,IBM的销售量已经连续经历了16个
季度的下降。
IBM正在给自己挖下过度承诺的陷阱。沃森是其中最大的一个陷阱。2013年,IBM 声称“新
的计算时代已经来临”,同时向《福布斯》杂志
暗示沃森“已进入临床试验阶段”,将在短短几个
月内投入使用。2015年,《华盛顿邮报》引用了
一位 IBM 沃森经理的话,描述沃森如何忙着建立
一个“沟通机器与人的集体智能模型”。《华盛顿
邮报》还说,沃森系统会“和医生一起训练,去
做他们做不到的事”。
如今,IBM 公司的营业额低迷,股价波动,分析师们一直质疑沃森何时能为公司提供现金回
报。资深技术投资者和风投公司Social Capital的
创始人Chamath Palihapitiya 甚至在CNBC(美国消
费者新闻和商业频道)上评论:“沃森就是个笑
话。”
从某种角度看,沃森是IBM赌上前程的机器
学习系统,而它在IBM寄予厚望的医疗领域的进
展差强人意。像坚持为孩子捕食的母兽,IBM将
并购猎得的数据库用来喂食、训练自己的人工智
能系统“沃森”。但IBM对市场和投资人的承诺中包括一个“沃森”实现商业回报的时间表,这个时
间表能否如期实现还是未知数。
和在单个商业应用领域投入的公司相比,把
人工智能当成未来基础设施的一部分这一战略,使谷歌的母公司Alphabet成功地将下属一系列子
公司打造成自动驾驶、虚拟现实和增强现实等领
域的技术领先企业;人工智能的应用渗透到了所
有这些公司,甚至还可以节能。通过使用旗下公
司Deep Mind的机器学习算法来进行控制优化,数据中心的冷却系统节省了40%的能耗。
Alphabet排在2017年“全球50大最聪明公司”榜单
的第5位。
Deep Mind不断开发新型人工智能系统来模
仿人类智能,并提升学习速度。其自动驾驶项目
Waymo 的性能不断提升。作为 Alphabet 最知名且
最大的子公司,谷歌与硬件制造商合作,为其
Daydream VR平台创建独立的虚拟现实头显。新
产品将内置处理器和显示器,不再依赖用户的智
能手机,此外还会使用传感器以更好地追踪人类在虚拟世界的运动。
还记得在2015年年初,谷歌的人工智能研究
人员创造了Tensor Flow。两年之后,这一用于建
立机器学习软件的工具支持了谷歌及其母公司
Alphabet的未来愿景。Alphabet认为它可以通过帮
助公司利用机器学习来抢占亚马逊的云计算市
场。
早在2015年,谷歌的人工智能专家就创建了
一套名为Tensor Flow的软件,当时这款软件鲜为
人知。借助 TensorFlow,公司的工程师们可以更
容易地将新的人工智能方法翻译成实用代码;同
时进一步提高搜索和语音识别服务的精确性。令
人惊讶的是,在将TensorFlow开放给公司内部的程
序员数月后,谷歌随即宣布该软件免费向全球开
放。
近两年过去后,这一机器学习平台成了谷歌
和其母公司Alphabet的很多雄心壮志的基础。可
以清晰地看到所谓人工智能“民主化”带来的好处
——Tensor Flow成为程序员使用机器学习搭建新平台的首选工具。
领导了TensorFlow设计工作的谷歌人工智能
核心研究团队负责人杰夫·迪恩(Jeff Dean)表
示,一旦程序员使用TensorFlow开发出新产品,他就可以在任何地方运行它;此外,将其转移到
谷歌的云平台也非常容易。当前,云平台基础设
施的市场份额约为400亿美元(且持续增长),亚马逊和微软占据了大半江山;谷歌目前位居第
三,但与前两者还有很大的差距。谷歌云业务负
责人戴安·格林(Diane Greene)则估计谷歌的市
场份额在5年内会跃升至首位,而实现这一目标
的假设前提是投资人工智能的公司会向云服务提
供商砸下重金,从而让自身搭建和运行人工智能
的成本更低,同时也更容易,就像他们需要向电
子邮件和网站托管服务付费一样。
来自保险业的客户安盛(AXA)也在使用与
谷歌相同的基础设施,利用TensorFlow 来开发可
预测保费高昂的交通事故的系统。谷歌表示,这
就意味着更具竞争力的价格以及更好的表现。风险投资基金Madrona的总经理索马塞加
(S.Somasegar)曾是微软开发部门的负责人,他
表示,谷歌用了一个很好的策略改变了其在云服
务领域落后的局面。TensorFlow就是这个策略的
核心。
TensorFlow当然不是唯一能搭建机器学习软
件的工具。谷歌发布TensorFlow之后,它的云计
算竞争者微软和亚马逊也不甘示弱,相继发布或
开始支持它们自己的免费软件工具,来帮助程序
员搭建机器学习系统。
斯坦福大学客座教授雷扎·扎德(Reza
Zadeh)最初使用一款名为 Caffe的工具来帮助自
己的公司开发图像识别软件,但在接触并尝试了
TensorFlow后,谷歌的品牌价值和技术优势使其
最终决定完全放弃自己的平台。谷歌的工具也已
经在下一代人工智能研发人员和创业者的头脑中
扎下了根。在加拿大多伦多大学,人工智能研究
中心已经培养了众多如今声名赫赫的领袖级专
家。该大学的机器学习入门课程经常爆满,课程讲师Michael Guerzhoy负责讲授TensorFlow。因
为,10年前他可能需要花费数月时间开发的系
统,他的学生借助TensorFlow几天就能实现。
在围棋之外的竞技领域,谷歌旗下的
DeepMind在寻找新突破。2016年年底,暴雪宣布
与DeepMind合作,让人工智能在《星际争霸》的
游戏环境里进行特训。主导这项特训的是Oriol
Vinyals 。Oriol Vinyals也是2016年MIT TR35
(《麻省理工科技评论》“35位35岁以下科技创
新青年”)荣誉获得者之一。
据报道,出生在巴塞罗那的 Oriol Vinyals在
15 岁时就开始玩《星际争霸》,一度成为在西班
牙排名第一、全欧洲排名第16的知名电竞玩家。
Oriol Vinyals在加泰罗尼亚理工大学完成电信工程
及数学双学位之后,前往美国攻读工程学及计算
机科学,他也参与了 Berkeley Overmind 计划。
Berkeley Overmind取名于《星际争霸》游戏中虫
族的“主宰”(Overmind)角色。这项专案深入研
究利用各种人工智能计算技术,开发一个懂得如何玩即时战略游戏的人工智能机器人。在 2010年
的人工智能和互动数字娱乐(AIIDE)大会上,首次举办了《星际争霸》人工智能比赛;在完整
游戏模式类别,Berkeley Overmind 拿下了冠军,一战成名。
之后,Oriol Vinyals 进入了谷歌人工智能团
队,负责为翻译系统打造新的技术。Oriol Vinyals
想实现的翻译是从像素到解释,他想让计算机能
精准识别图像。基于这个想法,他更动了一行代
码,用自己写的图像代码取代了先前的翻译程
序。次日,他向计算机展示了一幅场景为热闹集
市的图像,摊位旁边的地上放了很多香蕉。计算
机识别为“一群人在市场买水果”。这代表着机器
可以阅读复杂的图片。这项技术被应用在谷歌图
像搜寻服务里。
2016年1月,Oriol Vinyals 加入DeepMind,挑
战比下围棋还难的人工智能——教计算机打游
戏,不靠输入死板的编码规则,而是只让计算机
通过经验自主学习。用来训练机器的游戏环境正是 Oriol Vinyals 最擅长的《星际争霸》。选择
《星际争霸》最主要的原因是其更接近真实世界
决策的复杂性。
在阿尔法狗打败人类棋王之前,许多人不认
为机器会获胜,但也有人觉得机器胜算大。同样
的分歧也出现在游戏领域。2017年8月,Elon
Musk 创立的人工智能非营利组织Open AI在一场
电竞表演赛中以一对一的方式击败《Dota 2》的
职业选手Dendi。
最流行的人工智能技术都需要大量的数据来
训练系统。排在2017年“全球50大最聪明公司”榜
单第21位的Gamalon声称其概率编程算法的效率
要比其他算法更高,该技术与其他机器学习技术
效率之差可以达到100倍。Gamalon算法的特点是
可以只从很少的算例中学习,还可以在iPad或笔
记本电脑上运行,不需要昂贵的服务器和图形处
理器。这家初创公司于2017年2月摆脱隐身模式
后,目前正在帮助电子商务和制造公司结合与匹
配不同来源的文本数据,如库存数据库。公司已经筹集了454万美元的种子资金,还与美国政府
签订了770万美元的合同。
更多的公司在2017年认识到,人工智能在用
户基数越大的行业越有机会进行效率提升和产品
创新。这些公司分别来自金融、医疗卫生、法律
以及其他服务业。
由阿里巴巴(位居2017年“全球50大最聪明
公司”榜单的第41位)创建于2014年的“蚂蚁金
服”公司,运营着快速增长的支付宝移动支付业
务。该公司野心勃勃地进军全球,投资了印度、泰国、新加坡和美国的金融企业。该公司独自运
营着中国过半的移动支付交易,每年的活跃用户
超过4.5亿。相比之下,Apple Pay仅有大约1200
万名用户。光凭这一点,就使蚂蚁金服在将人工
智能引入到新产品中的成功概率大大提高。其中
一项新产品是用机器学习处理智能手机上拍摄到
的意外事故录像的保险索赔系统,这一系统可以
确定损坏程度并协同保险公司处理索赔。
排在2017年“全球50大最聪明公司”榜单第43位的蓝色棱镜(Blue Prism)是一家位于伦敦的
英国上市公司。该公司的软件可以帮助银行和保
险公司等企业使用人工智能去做办公室的文职工
作。蓝色棱镜的机器人流程自动化软件模仿人类
完成基于规则(rules-based)的任务的方式,例
如手动将数据从纸质表单输入数据库。自2016年
3月上市以来,该公司的市值上涨了10倍, 2017
年达到5亿英镑。该公司在2016年全年所签署的
合同数,是2015年的4倍多。
Salesforce是一家位于美国旧金山的上市公
司,排在2017年“全球50大最聪明公司”榜单的第
47位。Salesforce及其销售平台2016年的年营收为
84亿美元,在客户关系软件市场的份额为20%。
该公司正在研究如何将人工智能融入其具有庞大
用户基础的产品中,比如可以对文件进行总结的
算法。公司预计,未来5年人工智能将改变人们
的工作方式,并推动客户关系管理软件的发展。
在2016年收购自然语言创业公司MetaMind之后,该公司于2017年推出了一种算法,展示了未来工作与生活方式可能的演化方向之一。它应用机器
学习对文档进行总结,制作出了连贯而准确的概
要;它还可以帮助整理电子邮件或当天的新闻报
道。展望
2018年2月1日,麻省理工学院正式宣布启动
一项雄心勃勃的项目——MIT Intelligence Quest
(MIT IQ)项目,该项目旨在了解人类智力,并
利用研究成果开发智能机器,这是该校有史以来
最大的人工智能项目,也被视为学术界发起的一
场旨在人工智能领域赢回主动权、意义深远的努
力,麻省理工学院更是动员了所有的五大学院,共同投入到这个项目中。
除了麻省理工学院的校长L.Rafael Reif,项目
的主要领导人也由麻省理工学院核心院系及实验
室的负责人组成,包括工程学院院长Anantha
Chandrakasan、麻省理工学院计算机科学与人工
智能实验室主任Daniela Rus、电子工程和计算机
科学系教授Dina Katabi、大脑与认知科学学院神
经科学系主任 James Di Carlo、认知科学和计算科学教授Josh Tenenbaum 。
人工智能技术的发展在不同国家、地区、企
业与研究机构之间,围绕着战略格局、经济利益
和学术荣誉,表现出日益浓重的决战气氛。一方
面,市场对人工智能的需求与期待空前膨胀;另
一方面,人工智能技术的发展亟待深度学习和强
化学习之后新的理论突破。正如2018年1月28日
上午,麻省理工学院计算机科学与人工智能实验
室教授 Tomaso Poggio 在《麻省理工科技评论》
EmTech China 全球新兴科技峰会上所说,深度学
习可以帮助我们解决10%的难题,剩下的90%需
要来自神经科学以及认知科学的研究,需要更好
地了解人的思维和大脑。
这应该也是谷歌母公司Alphabet会延请斯坦
福大学前校长John Hennessy出任董事长的原因,以进一步加强对科研与人才源头的影响力。
另一个值得注意的趋势是,中国公司在人工
智能领域开始取得资本等生产要素的优势。例
如,2017年,全球在人工智能领域的投资有152亿美元,其中中国企业所获得的投资额以48%的
占比占据第一(美国企业占38%)。而2016年,中国企业所获得投资仅占全球人工智能总投资的
不到12%。Broad研究所所长Eric Lander认为,美
国在人工智能领域的优势只比中国领先半年。
而像商汤科技这样的中国初创企业也已经被
邀请加入MIT IQ的研究项目。
[1]. “Lizette Chapman Expect Labs Raises 13
Million for Anticipatory computing”, The Wall Street
Journal, 2014-12-18.
[2]. Mark White,“I wasn't interested in just following
the rules: Data scientist Jeremy Howard and the next
internet”, the Sydney Morning Herald,2016-5-29.
[3]. “Movidius acquired by Intel”, Crunchbase, 2016-
9-6.第二章 竞速无人驾驶
过去,好的驾驶体验来自……强劲的引擎,未来,好的驾驶体验将来自强大的……运算能
力。
——黄仁勋
有一个老笑话,说外星人小分队侦察完地球
后回去报告:这个星球的主导生物叫“汽车”,它
们吃黑色的液体,排泄气味不佳的气体,日落之
后会眼睛发亮;在它们每个单体的内部,生存着
一种叫“人”的寄生虫。抛开未来人的价值和未来
汽车的灵魂这样的敏感议题,单就驾驶操作转移
而言,无人驾驶汽车正在取得某种控制权上的平
等地位。
在某种意义上,汽车技术发明并取代马的运
输能力之后130年,终于进化到接近一匹识途老
马了。不论以哪一种研发理念和路径进步的无人驾
驶
[1]
技术,汽车,准确地说是其配置的先进传感
器和强大的芯片,以及背后的云数据中心,都在
解放驾驶者。能够控制转向、制动和加速的自驾
系统已经出现在新型汽车中,而这并不是终局。
马上,可能不到5年,曾经不厌其烦地提示你更
多数据和更多责任的汽车将不耐烦地接手一切。
在这方面,无人驾驶充分体现了人工智能异于常
人的优点——不会因为学习曲线和责任压力而逃
避自由。
2017年9月5日下午7:58,一辆丰田无人驾驶
汽车在旧金山附近被路人目击。由于靠近硅谷,这个城市的居民随时可能遇到无人驾驶原型车。
如果是在2013年,同样的经历还值得在晚餐桌上
聊一聊,现在,太平常了。
优步、通用和Waymo是加利福尼亚州最常见
的无人驾驶原型车。最近,也有人看到过苹果的
原型车。此外,还有三星、梅赛德斯-奔驰、百度
和Auto X……不少于39家公司在加利福尼亚州的道路上获准测试无人驾驶原型车。
从交通系统进步的角度,全面无人驾驶可能
是一个付出更少生命成本而系统收益更高的新选
择。根据美国汽车协会的数据,美国每年有将近
3.3万人死于道路交通事故,损失金额高达3000亿
美元。世界卫生组织估计,全世界每年有超过
120万人死于道路交通事故。美国国家高速公路
交通安全管理局估计,90%以上的道路交通事故
涉及人为失误。乐观者预测,自动驾驶将减少同
样百分比的道路交通事故。
经济上,一旦实现无人驾驶,还将提高道路
的安全性、减少拥堵、释放被停车场占用的宝贵
土地。驾驶者都变成了单纯的乘客,利用节省下
来的数百万小时在日常通勤中工作、娱乐、用餐
或睡觉。被释放的驾驶时间将流入其他行业,即
使到那时人工智能已经拿走了这些行业多数的就
业岗位,“增加”的时间仍然会刺激消费。
更美好的是,它还可能降低燃料消费、改善
污染。1997年在加州大学河滨分校进行的示范以及2011年进行的涉及改装道路车辆的实验表明,使车辆以高速自动“排”行驶,从而减少空气动力
阻力,可以使燃料消耗降低20%。而2016年发表
的一项工程研究得出结论,自动化在理论上可以
允许在特定高速公路上行驶几乎四倍的汽车。得
克萨斯州运输学院指出,这样可以节省55亿小时
和29亿加仑(约110亿升)燃料中每年由于交通
拥塞而浪费的那一部分。
批评者关注无人驾驶如何一步步夺去司机作
为一项职业的民生意义。对以此谋生的职业驾驶
者来说,这当然不能接受。而支持者,主要是那
些把提供未来交通服务视为己任的企业,它们正
试图将未来的盈利模式建立在由芯片操控的车辆
上,彻底摆脱纷争不断、代价昂贵的劳资关系
(即使以共享模式建立的新型合约关系也只是减
轻而不是解决了这一矛盾)。
在高回报面前,谁在乎代价?在全球市场,掌握公共资源的政府、说服能力较强的汽车业和
急于实现资本回报的互联网科技企业,不论人工智能还是共享租车,都卷入了这场技术驱动的商
业游戏。
“想象一下:在市中心的午餐时间,你不需
要花20分钟找到停车位。即使记不住车钥匙放在
哪里,老年人也能来去自如。”2014年春天,谷
歌无人驾驶汽车项目主管Chris Urmson在公司的
官方博客上写道,“醉驾和开车走神?拜拜。”无人驾驶与自动驾驶的分歧与布局
在研发可以商用的无人驾驶车辆之前,大众
集团电子研究实验室成员与斯坦福大学动力设计
实验室合作,在2010年打造出一款无人驾驶的奥
迪TTS ,征服了美国科罗拉多州的派克峰赛道。
在27分钟的时间里,TTS的最高时速曾达到75千
米。
2013年,大众公司旗下的成立于1909年的奥
迪,第一次因为无人驾驶技术登上“全球50大最
聪明公司”榜单。这家市值340亿美元的公司的上
榜理由是,其运用适合车辆前格栅的激光扫描道
路探测器使自主驾驶更容易实现。2015年1月11
日,在一年一度的美国拉斯维加斯举办的国际消
费电子展(Consumer Electronics Show,CES)
上,奥迪演示了“Piloted Driving”系统,并计划在
未来10年推广这一技术。奥迪对于无人驾驶的开发理念,可以说
是“自动驾驶”。其对消费动机和应用场景的设计
仍然源自传统汽车厂商对消费者的理解。传统汽
车厂商认为,消费者购买汽车主要是为了追求驾
驶乐趣。但如果消费者在高速路上遇到堵车,那
所谓的“驾驶乐趣”便荡然无存。因此,奥
迪“Piloted Driving”驾驶系统的设计是,如果驾驶
员遇到堵车,且车辆的时速保持在35英里(约
56.33千米)以下,驾驶员就可以按下方向盘上的
按钮来激活这一系统。在系统介入后,驾驶员的
双手便可以离开方向盘,脚也不必继续放在踏板
上。如果驾驶员希望主动变道并取消系统自动驾
驶,只需轻踩踏板或主动转动方向盘即可。
其实,在这届CES上,丰田公司也向公众展
示了一辆雷克萨斯 LS 无人驾驶汽车。这款汽车
采用了很多谷歌无人驾驶汽车中的技术,比如在
车顶安装一个可 360°监测的 LIDAR 系统。不同
于奥迪,丰田希望将自动驾驶系统打造成驾驶员
开车的辅助系统,帮助其更好地驾驭车辆并给予驾驶员保护。一名雷克萨斯公司的工作人员对媒
体做了如下补充说明:从理念上来看,两家公司
的无人驾驶方案完全不同,因为雷克萨斯认为
的“自动驾驶”不等于“无人驾驶”。显然,雷克萨
斯的“自动驾驶”不如说是“辅助驾驶”。
2013年的特斯拉还是硅谷的一家小型汽车制
造商。不过,特斯拉的首席执行官埃隆·马斯克
(Elon Musk)也提出了无人驾驶汽车的开发目
标。埃隆·马斯克告诉媒体,他们正在开发无人驾
驶汽车,但驾驶员仍然需要在驾驶室内进行少量
操作。埃隆·马斯克并没有透露关于特斯拉无人驾
驶汽车计划的细节,只提到“无人驾驶”并非无
人。他想象中的无人驾驶汽车系统更类似于一套
自动操控系统,开启这套系统后驾驶员无需在大
多数的场景下进行操作。这听上去更接近奥迪,远比丰田积极,而和谷歌保持着距离。
埃隆·马斯克称,三年时间能实现 90%的路
程无需人类驾驶。他强调,特斯拉无人驾驶汽车
已经处于内部开发阶段,并不打算将相关技术提供给其他公司。尽管过去他曾提过与谷歌的合作
计划,但特斯拉无人驾驶汽车不会与谷歌展开合
作。
谷歌,是完全“无人驾驶”的最积极分子。
2012年5月,美国内华达州机动车驾驶管理处为
谷歌的无人驾驶汽车颁发了一张车牌。
最初,谷歌的无人驾驶汽车有一个驾驶员坐
在方向盘的后面,随时准备在有情况发生的时候
接管汽车。同时,还有一个技术人员在监控着导
航计算机。2013年,谷歌开始让部分员工坐着无
人驾驶汽车上下班通勤。在远程摄像机记录的试
验过程中,不少员工在方向盘后面睡着了。于
是,谷歌工程师们确信,在危机发生时,不存在
驾驶员从分心状态下回过神来比计算机系统的反
应速度更快的可能。
不完全的无人驾驶,实际上是一辆车要受控
于两个驾驶员。让人不由想起卡罗·奥斯瓦尔多·
哥尔多尼(Carlo Osvaldo Goldoni)的《一仆二
主》,以及联席首席执行官制度怎么在黑莓的衰退中推了一把。麻省理工学院Age lab的科学家布
赖恩·赖默认为,也许无人驾驶汽车发展中的“最
大阻碍因素”将是与人类经验相关的因素,人类
驾驶员分心后如何继续驾驶是一个难题。
为了解决这个问题,一方面,汽车制造商要
监控人类驾驶员,提醒他们不能过分分心;另一
方面,负责交棒的无人驾驶系统需要知道在什么
情况下要留出多少时间让人类驾驶员可以顺利接
棒。斯坦福大学汽车研究中心主任Clifford Nass
认为,第一代(自主汽车)将要求驾驶员在某些
地方进行干预。而驾驶员可能需要5秒以上的时
间才能真正掌控车辆。
谷歌的选择是不相信人类驾驶员时刻警惕与
及时介入的能力。它选择了另一条技术路线——
用计算机系统完全取代方向盘后的人类,并设计
了一种新的测试车辆:没有方向盘、刹车踏板和
加速器,且只能以时速25英里(约40.23千米)的
速度行驶。
与此同时,谷歌还开始为重组市场进行准备。
优步是一家交通网络公司,总部位于美国加
利福尼亚州的旧金山,2009年,优步由特拉维斯·
卡兰尼克和格瑞特·坎普创建,当时名为“优步
Cab”。优步开发了联结乘客和司机的移动应用程
序,提供载客车辆租赁及实时共乘的分享型经济
服务。乘客可以通过发送短信或使用移动应用程
序来预约这些载客的车辆;利用移动应用程序时
还可以追踪车辆的位置。
优步的移动应用程序在旧金山地区推出后,2010年下半年就获得一群加利福尼亚州硅谷超级
天使投资者的创投资金挹注。2011年年初,优步
获得来自创投公司Benchmark的3200万美元资
金。2011年下半年,优步再次从多位投资者处获
得了3200万美元的资金,投资者包括高盛、Menlo Ventures和杰佛瑞·贝佐斯等,这让优步获
得的总投资高达4950万美元。
谷歌看到了优步在未来交通市场的潜在价
值,2013年通过母公司Alphabet旗下的GV向其投资了2.58亿美元,成为优步的股东之一。双方没
有预料到,不到5年,它们就要为了无人驾驶而
兵戎相见。
尽管在不同行业的无人驾驶开发者沿着辅助
驾驶、自动驾驶和完全无人驾驶的不同方向着手
布局,在2013年,没人认为无人驾驶汽车很快就
能接管道路。传统汽车商的时间表和创新技术商业
化的问题清单
市场调研公司 IHS Automotive 在 2014年1月
预计,2025年自动驾驶汽车的数量将达到 23万
部,并在 2035年达到 1180万部。对于豪华汽车
制造商而言,在竞争激烈的市场上,不以最新的
技术取悦消费者、不在无人驾驶上投入巨资等于
自杀。
2014年,排在“全球50大最聪明公司”榜单第
7位的是德国宝马公司。这家传统汽车制造厂商
通过在汽车上增加无人驾驶技术,走在了最前
沿。宝马无人驾驶项目负责人维尔纳·胡伯
(Werner Huber)表示,公司的目标是在2020年
成为世界第一家在高速公路上引入无人驾驶技术
的汽车制造商。
此时,德国、美国、日本的汽车厂商都决定规划以自动驾驶为方向的时间表。宝马、奥迪、梅赛德斯—奔驰和大众都忙着试图将自主驾驶从
实验室里的研究转化为最新车型上的可选模式。
制造经验和庞大的客户基础使传统汽车制造业拥
有交通领域最有价值的超级用户界面和技术变现
能力,它们不能坐等上游的互联网科技公司利用
算法和数据的优势掌握主动。而互联网高科技公
司则希望通过计算机领域的积累帮助它们实现更
具颠覆性的改变。
2014年5月27日,《时代》周刊报道了谷歌
推出了一款令人期待的无人驾驶汽车原型,它没
有刹车、脚踏板或方向盘。近几年来,谷歌一直
在广泛使用改装奥迪、丰田普锐斯和雷克萨斯车
型来测试自动驾驶汽车。2014年4月,它宣布其
无人驾驶汽车已经测试了近70万英里(约110万
千米)。谷歌的双座原型车是在世界各地汽车零
部件供应商的协助下建造的,车速以时速25英里
(约40千米)为上限。车载传感器可以在两个足
球场的距离范围内检测任何方向上的物体。谷歌无人驾驶汽车项目主管Urmson表示,如果这批原
型车(约100辆)的性能令人满意,谷歌计划在
未来两年内在加利福尼亚州开展试点。
就在《时代》报道谷歌原型车的第二天,排
在2014年“全球50大最聪明公司”榜单第26位的优
步的首席执行官Travis Kalanick说他非常喜欢无人
驾驶汽车的想法,并且乐于用无人驾驶车队取代
他的司机。Travis Kalanick还表示,随着时间的推
移,乘坐的成本将非常低,人们甚至不需要再拥
有一辆汽车。看起来,优步会加入无人驾驶研发
队伍,即使作为谷歌的竞争者。
以消费者体验为第一优先的豪华汽车制造
商,当然不会让无人驾驶原型车顶上一个巨大的
旋转激光扫描仪。宝马和其他汽车制造商不得不
想办法将更小、更有限的传感器装入汽车车身,以避免影响重量或造型。宝马的前后保险杠内部
隐藏着2个激光扫描仪和3个雷达传感器,前后可
扫描大约200米的范围。在挡风玻璃和后窗的顶
部嵌入了跟踪道路标记和检测路标的相机。每个后视镜附近都有广角激光扫描仪,每个都有近
180°的视角,可以观看左右。车轮上方的4个超
声波传感器监测靠近车辆的区域。最后,差分全
球定位系统接收机将地面站信号与卫星信号相结
合,确定汽车的位置,误差只有几厘米。
宝马原型车行李箱内的几台计算机能瞬间完
成测量和计算,处理来自传感器的数据。软件根
据车辆的速度和附近车辆的行为为每条车道分配
一个数值。这个软件使用一种有助于消除传感器
读数误差的概率技术,决定是否切换到另一个车
道、向前超车,或避开从后面接近的车辆。指令
被传送到控制加速、制动和转向的独立计算机。
而另一个计算机系统则监视与自动驾驶相关的一
切事情,监测故障征候。
戴姆勒公司的梅赛德斯-奔驰原型车的计算机
不仅能够制动和加速,而且还能转向。使用立体
相机、雷达和红外摄像机,这辆奔驰S级轿车还
可以在前方道路上发现物体,并控制刹车以防止
事故发生。在实验中,在时速80千米的速度下松开方向盘和油门,还能表演紧急刹车。
福特、丰田、东风日产、沃尔沃和奥迪都宣
称,力争在10年内销售某种形式的无人驾驶汽
车,能够接管高速公路上的驾驶或把自己停进车
库。一向乐观的埃隆·马斯克则表示,无人驾驶汽
车上路行驶的时间可能会比多数人预料得更早,特斯拉正在开发一项“全面自动驾驶”技术,希望
在5年内应用到汽车上。2014年9月,通用汽车宣
布2017年的凯迪拉克将是第一辆在公路上提供无
人驾驶的汽车。
总能紧跟形势的中国互联网公司当然不会放
过一个日渐清晰的市场趋势。2014年8月,百度
宣布将在无人驾驶领域有所作为。排在2014
年“全球50大最聪明公司”榜单第28位的百度在硅
谷的研究室离谷歌只有8英里(约12.87千米)。
百度准备用一些传感器包括激光雷达、GPS 结合
的定位系统来采集数据,制作三维地图,这个三
维地图最后存成一个特定的格式,将成为无人驾
驶的基础。一个月后,中国数字地图服务商高德也向公众展示了其面向无人驾驶环境的高级驾驶
辅助系统(ADAS),利用汽车上的多种传感器
与高精度地图数据,辅助驾驶者更安全舒适、高
效经济地驾驶。
不过,无人驾驶技术的商业化还有一张很长
的问题清单。
第一,成本。
宝马汽车和其他原型车中的许多传感器和计
算机太昂贵,无法广泛部署。实现更完全的自动
化可能意味着使用更先进、更昂贵的传感器和计
算机。比如,谷歌原型车的车顶上的Li DAR激光
雷达能够提供关于周围环境最优秀的三维图像,精度可以达到2厘米,但售价约为8万美元。这种
仪器还需要进行小型化和重新设计。
第二,法律需要更新。
截至2014年,虽然美国几个州通过了允许自
动驾驶汽车在道路上进行测试的法律,但是美国
国家公路交通安全管理局还没有制定测试和认证
自主特征安全性和可靠性的规定。两个主要的国际条约——《维也纳公路交通公约》和《日内瓦
公路交通公约》可能需要修订,用于在欧洲和美
国使用的汽车,因为这两份文件均指出,驾驶员
必须随时对车辆保持完全的控制。
第三,日常交通的复杂与不确定。
当无人驾驶的使用局限于相对简单的场景,如高速公路行驶,还容易些。但这项技术仍然无
法应对复杂的车流、道路和行人所带来的不确定
性。麻省理工学院教授约翰·伦纳德(John
Leonard)曾经带队参加了2007年的美国国防部高
级研究计划局城市挑战赛。比赛需要完成的挑战
是让无人驾驶车辆穿越城市街道模型,现场会有
红绿灯和其他车辆。约翰·伦纳德认为,一些主要
的基本问题还没有解决,如关于整个世界的呈现
以及对可能发生的事情的预测。真正实现这项技
术的应用可能还需要数十年。
针对这一问题,美国密歇根州安娜堡市建设
了一个专供无人驾驶的仿真城市,并于2015年对
外开放。仿真城市位于密歇根大学校园的边缘,包括4英里(约6.44千米)的道路,涉及13个不同
的路口。密歇根州交通部门和13家参与开发自动
化驾驶技术的公司提供了资助。
这个城市被用于创建自动驾驶系统一直以来
难以处理的情况,例如驾驶员和行人之间微妙的
相互作用,不寻常的路面、隧道和树冠,它们都
有可能混淆传感器并遮挡GPS信号。从复杂的交
叉路口、混乱的车道标线到繁忙的施工队伍,都
将被用来衡量最新的汽车传感器和驾驶算法的能
力;行人甚至会从停放的车辆之间跳入道路,来测
试车载安全系统是否会出错。
另一项已经在安娜堡仿真城市进行测试的技
术是车对车通信(V2V)。在由密歇根大学完成
的政府资助项目中,数千辆配备信号传送器的车
辆向其他车辆和城市基础设施广播位置、行驶方
向、速度和其他信息。试验表明,通过提前预警
可能发生的碰撞,车对车和车对基础设施的通信
可以用来防止许多常见的事故。
第四,安全。通过软件控制的汽车可能成为远程操控犯罪
的目标。2010年2月,得克萨斯州数十辆汽车突
然拒绝启动,莫名其妙地开始响起喇叭。这些汽
车属于一家租赁公司,公司在车上安装了跟踪设
备,如果驾驶员没能付款,软件可以停用这辆
车,付款后则可恢复。结果,一个不满该公司的
前雇员访问了该公司的后台系统,使用这个小工
具造成了严重破坏。2013年,在拉斯维加斯的
DEF CON大会(世界黑客大会)上,两名计算机
安全专家Charlie Miller和Chris Valasek表示,他们
劫持了一辆2010年款丰田普锐斯的内部网络,并
远程控制了关键功能,包括转向和制动。
第五,最大的困难还是计算。
仅列举惯性导航系统一例,它通过监测车辆
自身的运动提供精确的定位信息,并将结果数据
与差分全球定位系统和高度精确的数字地图相结
合。很多原型车严重依赖数字地图,而卖给消费
者的汽车如果依赖于一张先前绘制好、非常准确
的地图,那么它必须能有足够的容错率。这些都需要更强大的计算能力。
所幸,另一项科技的进步给汽车计算能力的
提升带来了希望。人工智能给无人驾驶踩下油门
20世纪70年代末,汽车制造商已经使用集成
电路来监测和控制基本的发动机功能;20世纪80
年代,汽车发动机控制的计算机化随着关于燃料
效率和排放规定的实施而加快。1982年,部分车
型的内置计算机全面控制了自动变速器。
到2015年,汽车制造商可以通过无线链路远
程诊断车辆问题,并且可以将硬件设备插入汽车
的诊断端口,以通过智能手机应用程序识别引擎
问题或追踪驾驶习惯。一辆新车里会有50~100
台计算机,运行着数百万行代码。
随着无人驾驶汽车商业化需求的爆发,市场
开始研究人工智能与汽车业能碰出什么火花。在
人工智能领域先行一步的芯片制造商英伟达首先
意识到,在汽车智能化的进程中,芯片能扮演重
要角色。按公司高级主管丹尼·夏皮罗(DannyShapiro)的说法:“现在我们正在讨论是否需要
在汽车上进行超级计算。”
2015年2月,年度“全球50大最聪明公司”之
一的英伟达宣布推出2款新产品,旨在为汽车提
供更多的计算能力。一个能够同时在3个不同的
车载显示器渲染并呈现3D图案;另一个可以收集
和处理汽车周围多达12个摄像头的数据,并且具
有可以帮助防撞系统甚至自动驾驶系统识别某些
道路障碍的机器学习软件。这两个系统意味着先
进的汽车传感器和计算机系统为软件制造商提供
的巨大机会。
如果要问谁可以好好利用车轮上的巨型计算
机,非斯坦福大学动力设计实验室的机械工程教
授Chris Gerdes莫属。在Chris Gerdes的实验室
里,学生们正在持续进行着多个项目:一辆轻型
太阳能车;一辆装满了传感器的福特Fusion和一
辆类似沙地车的手动挡双人车。那辆“沙地车”将
可编程性提升到极致。几乎每个部件都由连接到
计算机的作动器控制。这意味着软件可以配置每个车轮的行为方式,使普通的路面感觉像被冰覆
盖一样。或者,使用安装在汽车前部的传感器的
数据,经过配置,让新手驾驶者像赛车司机一样
做出反应。整辆车的概念就是探索计算机如何使
驾驶更安全、更高效,而不必完全脱离驾驶员的
控制。
在硅谷,竞争性合作在汽车制造商和互联网
高科技公司之间贴身展开。苹果和谷歌这样的公
司正在通过为汽车提供更好的智能手机型接口而
介入车辆的操作系统。它们成功利用了一个统计
事实:根据非营利组织美国国家安全委员会的研
究,超过25%的道路交通事故是因司机玩手机导
致的。
大多数汽车制造商支持苹果公司的Car Play
软件以及谷歌的同类竞品Android Auto。现代汽
车在2015年夏天上市的新款索纳塔将是第一个支
持Car Play的车型。Android Auto展示了更多的可
能性。当驾驶者将Nexus智能手机插入车内,触
控屏即被Google Now接管,Google Now打通了其他谷歌公司的服务,可以根据你的位置、搜索记
录和Gmail邮件信息提供建议。值得注意的是,Android Auto界面底部已有一枚按钮可用于展示
车辆未来可能具有的诊断功能。谷歌希望汽车制
造商先开发出能够进一步显示车辆运行数据的应
用程序。如果Android Auto知道你的引擎过热,Google Now可能会为你规划线路,找到附近的机
修工。
现在,Car Play和Android Auto服务只能读取
基本的车辆数据,例如汽车是在行驶、停着还是
在倒车。这不是人工智能的用武之地。谷歌和苹
果的意图是通过Car Play和Android Auto渗透到汽
车的人机交互界面,深入控制汽车系统的车载计
算机,进而重新设计转向或防撞这样的功能,最
后为汽车全盘设计操作系统。那时,汽车制造商
改称为“汽车零部件和内饰的总承包商”可能更为
合适。
在人工智能迅速崛起的2015年,谷歌的无人
驾驶原型车已经上路,其结合了先进的传感器、地图数据、智能导航和控制软件。苹果公司也刚
雇佣了数十名具有汽车设计、工程和战略技能的
人士。汽车制造商会拱手让出汽车大脑的控制权
吗?
在互联网科技公司和汽车制造商之间,还存
在一个特立独行的另类。2015年,排在“全球50
大最聪明公司”榜单第1位的特斯拉正以软件创新
的形式接管汽车。虽然在互联网和汽车制造这两
方面都没有光荣传统,但特斯拉却拥有自己品牌
的汽车可供尽情编程。
总部位于帕罗奥图的特斯拉汽车公司打造了
世界上堪称最计算机化的消费级汽车。2012年发
布的电动轿车Model S拥有17英寸(约 2.54 厘
米)触摸屏显示器、3G手机连接甚至Web浏览
器。触摸屏显示娱乐应用程序、显示附近充电站
的地图以及有关汽车电池的详细信息,也可以用
它进行各种车辆设置,包括停止和加速模式(根
据型号有多种选择,从“正常”到“运动”或从“运
动”到“疯狂”)。每隔几个月,特斯拉的车主就会收到一个更
新的软件,为他们的车辆增加新的功能。自从
Model S发布以来,已经更新了更详细的地图、更好的加速度设置、防止溜车的坡启模式,以及
盲点警告(如果汽车配有相应的传感器)。
这些软件更新可以做的不仅仅是添加新的提
示音。2013年年底,特斯拉面临安全恐慌,数辆
Model S在驶过碎石路后电池组遭到破坏,引发
火灾。特斯拉工程师认为火灾是罕见的事件,通
过简单的补救就能修正,但这意味着路上的每一
辆Model S的悬挂系统都需要升级。特斯拉没有
像传统汽车制造商那样要求车主将车带到修车
点,而是发布了调整悬挂系统的软件补丁,让车
辆在更高的速度下也能保持悬挂的高度,从而大
大减少了事故发生的概率。
特斯拉证明了可编程程度与汽车的市场价值
很可能成正比。虽有很多质疑,但特斯拉的首席
执行官埃隆·马斯克并不介意。作为一家创始人还
健在的新兴公司,特斯拉不需要花太多成本克服保守势力。相比之下,传统汽车厂商需要同内部
的传统派达成一致,因而困难大得多。
福特于2015年1月开设了一个研究实验室。
该实验室位于谷歌办公室以北,相距大约10分钟
的车程,在Skype的隔壁,靠近惠普的大门。这
个实验室正在开发一种新的驾驶者界面Sync 3。
除了运行Spotify和Pandora Radio等应用程序,Sync 3还可以连接到家庭Wi-Fi网络,以接收bug
修复和更新。
福特显然希望司机更倾向于使用自己的系
统,而不是CarPlay或Android Auto。不过,福特
在这方面的创新记录并不愉快。其第一个触摸屏
界面MyFord Touch在2010年推出的时候,频繁出
现故障,客户抱怨它过于复杂。当福特在2011年
《消费者报告》的年度可靠性评级中从第10位下
降到第20位时,报道认为MyFord Touch是其排名
下降的关键原因。该公司最终发放了超过25万个
包含软件修复程序的内存卡,供用户将更新上传
到汽车。汽车业正处在巨变的前夜,曾经声名赫赫的
汽车制造商需要和高科技公司甚至芯片商争夺打
开未来之门的钥匙。更可怕的是,个人汽车市场
数量庞大而分散的车 ......
未来版图:全球聪明公司的科技创新趋势和
商业化路径麻省理工科技评论著.--北京:人民邮
电出版社,2018.6
(科技之巅)
ISBN 978-7-115-48267-9
Ⅰ.①未… Ⅱ.①麻… Ⅲ.①企业管理—技
术革新—研究—世界 Ⅳ.①F279.1
中国版本图书馆CIP数据核字(2018)第
064539号
◆著 麻省理工科技评论
责任编辑 恭竟平
责任印制 周昇亮
◆人民邮电出版社出版发行 北京市丰台
区成寿寺路11号
邮编 100164 电子邮件
315@ptpress.com.cn
网址 http:www.ptpress.com.cn
北京印匠彩色印刷有限公司印刷◆开本:710×1000 116
印张:21.25 2018年6月第1版
字数:325千字 2018年6月北京第1次印
刷
定价:69.80元
读者服务热线:(010)81055296 印装质量热
线:(010)81055316
反盗版热线:(010)81055315
广告经营许可证:京东工商广登字20170147号FUTURE LAY-OUT
未来版图:全球聪明公司的科技创新趋势和商业
化路径
麻省理工科技评论 著
Deep Tech深科技 华创研究院 出品
陈序 编定
小编自己做了一个电子书下载网站, 网址:目 录
封面
扉页
内容提要
前言 新兴科技重塑商业未来
推荐序一 坚守梦想,与AI同行
推荐序二 预测未来最好的方法是创造未来
推荐序三 利用数字技术的鸿沟,“超级巨
星”公司们正在掌控世界经济
推荐序四 现实永远超乎想象
第一章 人工智能,在屋子里出生的大象
苹果独占Siri,却挡不住暗流汹涌
人工智能的早鸟,能不能得到回报
沃森、Go或者是吴恩达……这是争夺注
意力的竞赛
争当卖水人的芯片商们
眼看科大讯飞突起,没有大公司感觉安
全
展望
第二章 竞速无人驾驶
无人驾驶与自动驾驶的分歧与布局
传统汽车商的时间表和创新技术商业化
的问题清单人工智能给无人驾驶踩下油门
围猎算法公司
芯片和传感器闻到现金的味道
展望
第三章 未来世界的基础建设
摩尔定律继续有效还是就此结束?这是
一个问题
你不知道哪块云会下雨,不过雨只可能
在云里
半导体业需要增加“带宽”
给芯片提需求的不只是“人”
光纤不遵守摩尔定律,量子计算可以吗
展望
第四章 阅读,修改,设计,永生
读懂基因的价格决定了优化生育的市场
CRISPR,从复制粘贴到修改编辑
最有价值的目标:癌症
检测天天促销,治疗何时降价
商业化黄金期将至,巨头归来
展望
第五章 聪明巨人,比国家更大
万能的Facebook们
可穿戴的互联网
共享一切,首先是你的数据
听从消费者吩咐的“聪明巨人”大到停不下来的用户增长
展望
第六章 从能源到工农业,旧瓶里的新酒
新能源,清洁的进步
梦想电池,储能技术的圣杯
工业互联网
给农业注入生物技术
3D打印跑起来了
展望
第七章 体验决定的内容王者
追随用户的内容
虚拟现实上线
原创,下游力争上游
为游戏而推动革新
明天才是真正的现实
展望
第八章 唯有幻想,值得实现
人工红利寻找替代品
重启卫星互联网
机器人智能
从云端控制
太空金矿挖掘还是再一次星际迷航
展望
第九章 金钱永不眠
要信用?先买个手机吧来自陌生人的资本
Apple Pay的过人之处
区块链来了
新的信用基础设施开始成长
展望
第十章 “全球50大最聪明公司”改变的国家地
理
代工与仿制的创新升级
创新大国的制造复兴
“聪明巨人”之乡
人工智能竞赛
全球化不会止步
展望
后记
附录 2013—2017年“全球50大最聪明公司”榜
单内容提要
《麻省理工科技评论》作为世界上历史悠
久、影响力极大的技术商业类杂志,每年都会依
据公司的科技领军能力和商业敏感度这两个必要
条件,从全球范围内选取50家未来可能会成为行
业主导的聪明公司。
这些聪明公司,并非都是行业巨头,甚至专
利数量、公司所在地以及资金规模都不在考察范
围内。这些公司是“高精尖科技创新”与“能够保证
公司利益最大化的商业模式”的完美融合。无论
公办私营,无关规模大小,这些遍布全球的公司
都有能力创造并抓住新的机遇。
本书以2011—2017年的榜单为蓝本,在生物
医学、能源材料、计算机与通信、互联网与数字
媒体,以及交通运输等行业领域中挑选出在技术
创新、商业模式上有亮点的、国内读者比较感兴趣的百余家聪明公司,并以时间为经、行业为
纬,梳理这些公司的技术创新和商业沉浮。旨在
让读者知道,从判断一个突破性技术到真正实现
技术的共享、吸收应用与再创新是一个艰难而微
妙的过程。这其中需要对技术由浅入深、从点到
面全面认识和理解,而要进一步将前沿知识转
移、共享,则更与这个领域内核心人员和社交圈
的融合程度密切相关。只有处理好这两点,深度
的技术整合应用才有可能。前言 新兴科技重塑商业未来
自2010年开始,《麻省理工科技评论》每年
都会选出50家公司,作为科技创新的代表。这份
榜单的名字略有变化,在2013年之前,它叫“全
球50大创新公司”;2013年,它叫“全球50大颠覆
公司”;2014年至今,它叫“全球50大最聪明公
司”。
如何定义“聪明”的公司?听起来很难。但当
你看到一家聪明的公司时,你就知道了。当这样
的公司将一项真正创新的技术商业化时,不可思
议的事情就发生了:市场中领导者的地位得到巩
固或被别的公司所取代。竞争者们必须重新定义
或重新思考他们的战略。
当《麻省理工科技评论》的编辑们汇编这个
榜单时,最关注的就是这点。这份榜单并不清点
公司所拥有的专利或雇佣的博士,也不考察公司的大小和名气。而是会问,这个公司在过去的一
年中,有没有做出将会重新定义其所在领域的重
大创新。
每年,都会有新的公司入选。例如,2014年
改变所在领域的最重大创新发生在Illumina。它将
DNA测序的价格降低到将改变医疗业务的水平。
2014年,小米(MI)凭借颠覆式的打法迅速成
长,因此位列2015年榜单的第二名。这也是榜单
为公司排位以来,中国公司获得的最高排名。
2017年,排名第一的公司是GPU的生产商英伟
达,这是因为该公司生产的芯片极大地推动了深
度学习和自动驾驶等领域的进步。
同时,每年也都有公司会落选,离开榜单。
有些公司落选是因为对其所在行业的整体前景的
影响力在下降。例如,在“全球50大最聪明公
司”(以下简称TR50)诞生之初,生产生物燃料
的公司占据了榜单的许多位置,但随后这些公司
则逐渐缺席。这个领域的公司普遍未能将生产扩
大到可与常规燃油相竞争的规模,虽然其技术仍有潜力,但它目前对于能源或交通运输等行业的
影响还很小。
在有些情况下,个别企业失去了其远见,导
致不再能入选TR50榜单。其中一个例子是2012年
的Netflix。2011年,Netflix入选是因为它在已有
的电子邮件订阅DVD业务上,添加了视频点播服
务。Netflix公司已经颠覆了实体影像出租店的商
业模式,并巧妙地防止自己被视频流技术颠覆。
但在 2011年,该公司试图把视频流部分从其DVD
业务中分割出去,做出了一个有严重问题的决
策,引得公众嘲笑,并且在醒悟过来之前损失了
数以十万计的订阅用户。突然之间,Netflix公司
就无法清晰地把握自己的命运了,更不用说对整
个娱乐产业产生影响。
同一年,TR50的常客亚马逊也没有入选。从
2011年到2017年,亚马逊只有那一年缺席了榜
单。如果当年的TR50的产生流程提前几个月,亚
马逊很可能会入选。不过,执行力的缺失最终让
这家科技巨头缺席。当年,亚马逊发布的KindleFire初看起来像是一个很有竞争力的产品,可以
威胁到iPad 在平板电脑市场的主导地位。但是,随着消费者对该设备的日常体验越来越多,他们
最初的兴趣和满意就逐渐变成失望。虽然亚马逊
发布了补丁,称可以解决绝大多数用户关心的问
题,但推出的这个产品表明,在2012年,在将云
计算和消费类电子结合起来这件事情上,亚马逊
仍然是一个挑战者,而不是一个领导者。
在2011年到2017年的7年时间里,共有195家
公司入选TR50的榜单,其中有63家公司至少入选
了2次,23家公司至少入选了3次。IBM(美国国
际商业机器公司)和SpaceX(太空探索技术公
司)各入选了7次,7年之间无一缺席。如果把谷
歌和Alphabet算作一家公司,它也入选了7次。亚
马逊和Facebook各入选了6次,在入选次数排名中
并列第四。在中国公司中,入选次数最多的是腾
讯(Tencent),一共5次进入榜单,和苹果并
列。从入选榜单的公司体量来看,从2011年到
2014年,上市公司在榜单中的比例低于40%。但
是从2015年开始,上市公司的比例显著增加。在
2017年的50家入选公司中,有28家上市公司,占
比56%。这说明,创新可能在向大公司集中。
在国家方面,五大洲都有公司入选,虽然比
例并不平衡。北美洲依靠美国,占据了榜单的大
多数。欧洲和亚洲基本处于旗鼓相当的地位。不
过最近两年,得益于中国技术公司的崛起并在世
界范围内得到承认,亚洲的公司数已经超过了欧
洲。值得一提的是,2017年,阿根廷电子商务公司Mercado Libre首次入选,填补了南美洲的空
白。
在国家分布上,美国的公司每年都占据榜单
的大半,不过优势正在放缓,从名额的80%下降
到60%。总体来说,榜单中的国家组成多样性正
在增加。中国公司的数量也在显著增加,从2013
年的2家到2017年的9家。入选的中国公司既包括
百度、阿里巴巴(Alibaba)、腾讯、华为
(HUAWEI)这样的巨头,也包括小米这样的大
型未上市公司,还包括滴滴出行、旷视科技、大
疆(DJI)等初创企业。《麻省理工科技评论》官方常常把公司分成
生物医学、能源材料、计算机与通信(包括量子计算、机器学习、人工智能等)、互联网与数字
媒体(包括互联网的商业模式创新),以及交通
运输(包括城市交通、太空探索等)。除此之
外,还有两家投资机构因为革新了投资理念和模
式,也进入了TR50榜单。
自2011年以来,交通运输领域入选的公司数
量基本维持在稳定的水平。尼桑、丰田
(Toyota)、奥迪(Audi)等汽车制造商,滴滴
出行等出行服务公司,甚至是SpaceX这样的航天
制造和服务提供商,都曾入选。互联网与数字媒
体公司的数量在2014年达到顶峰后迅速下降,这一趋势符合移动互联网红利结束的时间点。取而
代之的是计算机与通信类型的公司数量快速增
长。大量新兴人工智能技术公司在2016年和2017
年出现,而亚马逊、苹果、腾讯和百度等老牌互
联网公司也纷纷加入人工智能的浪潮。生物医学
领域的公司数量也比较稳定,不过子领域却有明
显的变化,从早期的制药和基因测序,到后来的
基因治疗,再到最近的基因编辑。
三大技术领域的行业焦点
我们通过技术手段,综合分析了生物医学、能源材料以及计算机与通信这三大领域入选公司
的入选理由、专利申请和新闻报道等信息,总结出了2011年到2017年入选TR50的企业的研究焦
点,希望可以借此分析行业变化的趋势。
生物医学领域的行业焦点
2011—2017年生物医学领域的公司研究焦点
在生物医学领域,基因组测序是最为关键的
技术之一,所以一直在TR50榜单中稳定地占据份
额。基因测序公司大致可以分成两大类,一类公
司致力于基础研究,并把全基因组测序的价格压
到市场可以接受的范围。这类公司的代表是位于
美国加利福尼亚州圣迭戈的著名测序公司
Illumina。这家公司自2013年以来,从未缺席过TR50榜单。早在2013年,基因组测序的成本仍需
将近1万美元。但《麻省理工科技评论》编辑部
已经预测,全基因组测序的成本必将降至1000美
元。而这一价格是一个临界点,意味着医保系统
已经可以部分覆盖基因测序的成本,从而让这一
技术进入临床医疗市场。
现在看来,这一目标已经基本达到。2017
年,Illumina再次入选TR50榜单,理由是公司推
出了一种新机器Nova Seq,据说只需两天半的时
间就可以完成多达48个人类全基因组测序。也许
过不了多久就可以将DNA测序成本降低到100美
元。
随着基因测序成本的下降,一些公司开始将
其应用于市场中。23andMe早在2006年就成立
了,旨在为消费者提供基因测序服务,也把“消
费基因测序”的概念传播开来。但是直到最近几
年,公司才开始进入大众视野,并于2016年和
2017年连续两年进入TR50榜单。在此期间,公司
还与美国食品和药物管理局经历了一段艰苦的周旋,终于获得了针对健康性状检测的许可。截至
目前,23andMe已经为超过100万人提供了基因测
序服务。
除了消费基因测序外,基因测序还被用于研
发新型诊断技术中。就在2017年12月4日,Counsyl从高盛和Founders Fund等多家机构获得了
8000万美元的融资。Counsyl早在2015年就进入了
TR50榜单。当时,美国有3.6%的夫妇在产前会使
用Counsyl的产前基因检测服务,以检测潜在疾
病,并提供健康管理和相关预防措施。
生物医学领域的另外两条重要的主线是基因
疗法和基因编辑技术。这两种技术都旨在修改人
类的基因组,从根本上治愈某些复杂的遗传疾
病。只不过基因疗法往往通过基因载体(如病
毒)来把基因运载到基因组里,而基因编辑则采
取更高效精准的方法修改致病基因。虽然理论
上,基因编辑比传统的基因疗法更安全,但是基
因疗法已经经历了10多年的研究和临床试验,所
以逐渐在2015年、2016年开花结果。Spark成立于2013年10月,是一家致力于治疗遗传疾病的生物
技术创新公司,以开发一种全新的私人化的精确
治疗法来治愈原先难以治疗的基因性疾病。Spark
试图研发的遗传疗法可以治疗遗传性视网膜营养
不良,这种疾病的患者从一出生就会逐渐失去视
力,并最终在中年时完全丧失视力。2015年年
底,Spark公布了遗传性视网膜营养不良的疗法
SPK-RPE65的三期临床结果。在临床试验中,这
一疗法获得了良好的结果。因此,Spark也入选了
2016年和2017年的TR50榜单。2017年10月,美国
食品和药物管理局初步批准了Spark的基因疗法,成为2017年度最重要的生物医学新闻之一。
2012年夏天到2013年年初,3个不同的研究
组(Jennifer DoudnaEmmanuelle Charpentier,张
锋,以及George Church)分别发表论文,阐述了
CRISPRCas9在动物和人类细胞内的作用机理,打开了基因编辑的研究和应用大门。2013年,张
锋成立了基因编辑公司Editas Medicine,该公司
于2016年上市并入选当年的TR50榜单。虽然基因编辑在理论上很有优势,但是它仍然是一种很新
的技术,加上临床领域技术应用本身就需要很长
的研发和试验周期,可能还需要一段时间才能赶
上基因疗法在临床市场中的积累。
能源材料领域的行业焦点
2011—2017年能源材料领域的公司研究焦点
在过去7年间,能源材料领域的热点也发生
了很多变化。其中,生物能源的衰落让人叹息。
在所有生物能源相关的公司中,Amyris的经历具
有一定的代表性。Amyris的创始人包括合成生物
领域最顶尖的科学家杰·基斯林(JayD.Keasling)。公司早期就转变了实验室的技
术,用合成生物学的技术让酵母菌生产青蒿素。
Amyris还希望通过合成生物学方法,让改造后的
酵母菌把糖类物质转化成柴油燃料,直接用于加
油站等设施中。2010年9月,Amyris在纳斯达克
上市,数月后股价就翻倍飙升至33美元。2011
年,Amyris公司入选TR50榜单。然而,虽然
Amyris的目标可以在实验室中理论上实现,却始
终无法达到工业生产的规模和成本目标。
在过去7年中,太阳能一直是TR50榜单持续
关注的新能源领域。不过,这一领域的公司也经
历了洗牌。2011年入选的无锡尚德早已破产重
组,而曾经的首富施正荣在长期休整后进入了一
段新的创业旅程。相对稳定的公司是First Solar,它和无锡尚德等很多21世纪头10年引领太阳能行
业的公司不同,这家公司专注于薄膜太阳能技
术,并在过去7年4次入选TR50榜单。
相比之下,电池技术的崛起并不让人惊讶。
一方面,太阳能、风能等可再生能源一直需要符合自身发电特点的电池储能;另一方面,电动汽
车等电能应用场景的快速增长也对电池提出了更
高的要求。开发新电池技术的公司既有24M、Aquion Energy和Sakti3这样打造全新电池(如固
态电池)的企业,也有特斯拉这样因电池技术的
应用落地而入选的企业。事实上,特斯拉入选
2015年TR50榜单的理由就是“将电池技术从汽车
扩展到住宅和商业应用”。
不过,这些企业的命运也有所不同。Sakti3
以9000万美元的价格被英国戴森公司收购。2017
年11月,电动汽车厂商Fisker宣布旗下电动汽车
将使用Sakti3研发的固态电池技术,充电1分钟最
高续航就可达800千米。而曾获得比尔·盖茨投资
的明星公司Aquion Energy就没有那么幸运了。该
公司开发了全新的钠电池,以盐水为电解质并配
以氧化锰阴极和碳基阳极。不过,随着锂离子电
池的成本急剧下降,Aquion Energy激进的扩大产
能措施并没有得到市场的认可,最终于2017年破
产。除此之外,风能、天然气等可替代能源领域
企业也不时出现在历年的TR50榜单中。不过,这
些领域的公司,总体来说,并没有获得太阳能领
域能源企业的转化率和商业成绩,人类探索新能
源的路径仍然漫长。
计算机与通信领域的行业焦点
2011—2017年计算机与通信领域的公司研究焦点
在计算机与通信领域的公司中,最引人注目
的变化是人工智能自2015年开始崛起。在人工智
能领域中,自然语言处理、计算机视觉、语音识
别等相关技术都在蓬勃发展。不过,在2016—2017年,增长最迅猛的是无人驾驶领域的技术,这一趋势很可能会延续到未来几年。
所以,为人工智能(特别是深度学习)提供
计算设备的英伟达公司自2015年起就没有缺席过
TR50榜单。2017年,公司在数据中心和汽车领域
的业务收入分别比2016年增长了186%和24%。很
多主要的互联网和云服务提供商都在使用英伟达
的芯片来优化服务,而包括丰田、奥迪、宝马
(BMW)等50多家汽车制造公司也在使用它们
的自动驾驶技术和平台进行各种试验。
互联网巨头也在向人工智能转型。我们以入
选TR50榜单次数最多的亚马逊公司为例,通过
2011年至2017年亚马逊公司的入选理由,可以清
楚地发现,这家电商公司已经在彻底地拥抱人工
智能技术。人工智能的子领域的发展情况
2011年入选理由:得益于亚马逊,电子书终
于成为一个巨大、主流的消费市场。
2013年入选理由:在某些地区开启一日送到
业务,让网络购买商品的需求获得了提升。
2014年入选理由:和12家顶级在线零售商的
销售额总和持平,提高了我们对电子商务的期
待。
2015年入选理由:物流中心使用的机器人可
以使整个中心更加高效。
2016年入选理由:今年,亚马逊日益强大的Alexa智能语音助手(Echo、Echo DOT、Tap)让
上网、播放音乐、调节灯光和恒温器,都变得简
单。亚马逊的网络及云计算服务也不容小觑,它
正在迅速发展并将成为亚马逊新的增长点。
2017年入选理由:近年来,亚马逊使用了包
括计算机视觉、机器学习和自然语言处理在内的
一系列人工智能技术,彻底升级了移动计算能力
并改善了购物的体验。
除了互联网巨头,创业公司也在这一波人工
智能浪潮中崛起。例如,中国创业公司旷视科技
就入选了2017年的TR50榜单。旷视科技的人脸识
别技术已经被滴滴出行、阿里巴巴等大企业使
用。
值得注意的是,中国的技术企业没有在人工
智能浪潮中落后。2013—2017年,中国公司25次
入选TR50榜单,其中23次入选公司开展的业务都
和人工智能有关。在这些公司中,百度、腾讯、蚂蚁金服(Ant Financial)、滴滴出行等公司已经
公开宣布要重仓支持人工智能技术,而大疆、旷视科技等初创公司则以开发人工智能技术作为主
营业务。
在本书中,我们以时间为经、行业为纬,梳
理了2011—2017这7年百余家聪明公司的技术创
新和商业沉浮。总体来说,我们可以看到,计算
技术、能源材料和生物医学的需求一直存在,但
是具体技术热潮会上下起伏。入选TR50榜单的企
业往往有在实验室阶段就广受瞩目的技术,但生
物能源和很多电池技术因为不能很好地市场化而
遭遇挫折,而人工智能则因为找到了很好的应用
场景而迅速爆发。因此,如何把实验室中的技术
落地到应用场景?如何在大规模生产和成本控制
方面满足市场需要?这样的问题也许是一家技术
公司最重要的课题。推荐序一 坚守梦想,与AI同行
2017年6月,一个炎热的下午,我的微信突
然收到了铺天盖地的祝贺信息。原来,是因为科
大讯飞登上了《麻省理工科技评论》“全球50大
最聪明公司”的榜单,而且有幸被评为世界第
六、中国第一。
作为科大讯飞的创始人和董事长,我的心情
有些微妙:既为公司能在这份颇具公信力和影响
力的榜单上一鸣惊人而感到自豪,同时也为我们
其实并没有如此聪明而忐忑不安!相比一同上榜
的谷歌、英伟达等国际著名公司,更是倍感前路
漫长。诚然,科大讯飞在智能语音和人工智能领
域所做出的探索与成果开始被世界的目光高度肯
定,但一路走来,我们也许总是聪明人中有点笨
的那个——在坎坷和质疑中保持定力,希望追随
梦想而不是抢占风口,能被评价为“大智若愚”已属不易。
从2017年“全球50大最聪明公司”榜单中,我
观察到上榜的中国企业已史无前例占据九席。中
国在推动全球科技进步中的力量不可小觑,想要
精准把握科技发展的脉络就必须汲取中国力量的
元素。《麻省理工科技评论》的主编、尊敬的大
卫·罗特曼(David Rotman)先生特别提到上榜公
司中有不少都与人工智能的发展密切相关。从人
工智能领域来说,全球同步进入“无人区”,既让
人惊喜和期待,也引发了很多人的担忧。而让人
工智能趋利避害,在源头技术、产业应用、法律
系统和人文伦理等方面都需要全球合作。当前世
界,正处在是继续开放合作还是倒退封闭的关键
十字路口。4月10日博鳌亚洲论坛期间的中美
CEO圆桌对话,让我欣慰地看到两国企业家对于
开放合作大趋势的共同期待。我想,无论一个公
司当前有多聪明和多强大,只有坚守正确价值
观,以创新造福人类命运共同体,方可源远流
长、基业长青!科技的浪潮实在太快,虽然不能准确捕捉它
未来的路径和节奏,但人工智能定是其中可窥一
斑而知走向趋势的关键一点。因此,观察并深入
挖掘与之相关的“领头羊”显得格外重要。未来,每个公司可能都会有自己的人工智能、大数据、云计算,在新生态下知识、经验、数据和利益的
分享变得更加重要;彼此正交的不同公司通过混
合的方式建立新生态下的共赢合作,则是成功的
关键。科大讯飞人工智能平台上的创业团队数量
已达60万家,一年内增加了近40万家,呈现出蓬
勃的发展势头。“商业帝国的兴衰”无法预知,生
态却一定会生生不息。我们希望与开发伙伴一
起,用人工智能建设美好世界并分享美好未来。
“那些有能力将高精尖科技创新与利益最大
化完美融合的公司,它们遍布全球,且都有能力
抓住新的机遇。”这是《麻省理工科技评论》放
眼全球挑选聪明公司的准则,也是这本书要详解
的重点。愿这些细致入微的观察和鞭辟入里的分
析,能让永远年轻的奋斗者们抖擞精神后,有所思、有所得。
刘庆峰
科大讯飞董事长推荐序二 预测未来最好的方法是
创造未来
在旧金山飞往北京的飞机上,我一口气读完
了全书。作为科技工作者的我,虽然对书中描述
的很多高科技企业都非常熟悉(我曾经在连续7
年都上榜的IBM工作,指导过的20多位博士毕业
生现在也大都在这些全球最聪明的公司工作,比
如谷歌、英伟达、苹果、优步等),但是编者通
过对《麻省理工科技评论》从2011年以来,每年
评出的全球50家最聪明的公司的系统梳理分析,使得我这样的行业内人士也深深为之吸引,受益
无穷。
能入选《麻省理工科技评论》“全球50大最
聪明公司”榜单的,不一定是大公司,不一定是
上市公司,也不一定是有很大名气的公司。入选的标准,取决于在过去一年中这家公司有没有做
出将会重新定义所在领域的重大创新。这本书的
独特之处,在于它不是单纯地按年份罗列榜单上
每家公司在某年入选的理由,而是按照行业和技
术领域的划分,对这些高科技公司在这些年的技
术发展和商业沉浮做了生动的描述,使得读者能
够迅速地把握该行业和技术领域的历史过程和发
展趋势。
从行业和技术领域来看,生物医学、能源材
料和计算机与通信这三大类的高科技公司是这个
名单上比例最高的公司(2017年的名单中,这三
大类上榜公司占据了80%以上)。虽然具体的技
术热潮会有起伏,但是这三大方向始终领导着创
新的潮流。这一现象能给投资者一定的指导意
义,也会给年轻人对未来职业道路的选择提供一
定的启发。
而在这三大类中,计算机与通信类公司在过
去7年中所占的比例逐年上升,在2017年占据了
50%以上的比例。这也是意料之中,因为即使是在这个“全球50大最聪明公司”榜单开始之前的半
个多世纪中,从集成电路的发明到个人计算机的
普及,从互联网的开始到移动通信的发展,都是
因为计算机与通信技术的飞速进步所导致的。而
其他领域的创新(交通运输领域和金融领域),很大限度上也离不开计算技术的赋能。比如最近
几年,无人驾驶和自动驾驶的兴起和发展,与人
工智能算法以及芯片和传感器的发展息息相关。
在计算技术类的公司中,人工智能相关的公
司也很明显地成为了最近的主流。人工智能的三
大支柱是算法(Algorithm)、大数据(Big data)
和计算能力(Computation),代表着人工智能的
ABC。这三者之间形成了相互促进的正反馈——
更多、更复杂的数据能推动新算法的发明;而新
的算法通常会需要更强更好的硬件架构来提升计
算能力;新的硬件架构又能促进更多、更复杂的
数据的获取。这个紧密的正循环关系,使得最近
几年上榜的不少公司都加强了对人工智能硬件架
构的重视。比如连续7年入选的谷歌,作为在人工智能的算法和大数据上的强者,于2013年开始
组建自己的硬件团队,秘密研制专门针对人工智
能算法加速的TPU(Tensor Processing Unit), 并
且在2016年正式公开。而2017年图灵奖的两位获
得者,计算机硬件架构的最顶尖的专家,斯坦福
大学的John Hennessy和加利福尼亚州伯克利大学
的David Patterson,目前均在谷歌供职。又如2017
年榜单的第一名英伟达连续三年上榜,部分原因
是其提供的GPU成为人工智能计算领域的主力硬
件。而在2014年和2015年均未上榜的英特尔为了
赶上这次人工智能浪潮,在过去的一年多时间里
连续收购了多家人工智能芯片公司,包括
Nervana、Movidius和Mobileye,加强了其在人工
智能领域的影响力,从而在2016年和2017年重新
回到了榜单。
在这个榜单上美国公司一直都占据着最高的
比例,显示着美国依然是世界科技创新的“领头
羊”。但是中国科技公司上榜的数量在逐年增
加,在最新的2017榜单上中国科技公司占据了20%的比例,彰显了中国在创新科技上的崛起并
得到了世界的承认。不过值得注意的是,在生物
医学、能源材料和计算机与通信这三大类的高科
技领域,前两类的中国公司极少,仅有华大基因
和汉能分别在2013年和2014年入选。这说明在这
两个领域,中国的高科技公司还有很长的路要
走。而在人工智能领域,入选的大都为应用和软
件类公司,没有硬件类公司。最近2年,中国的
人工智能芯片初创公司成长速度很快,比如深
鉴、寒武纪、地平线、比特大陆等。作为在这个
领域的研究者,我非常希望在未来的榜单上能出
现它们的名字。
虽然了解过去的历史对技术创新的趋势会有
很大的帮助,但是并不一定能借此很好地预测未
来。正如美国第16任总统亚伯拉罕·林肯所说“预
测未来最好的方法,就是去创造未来”,我期待
此书的出版,能更好地促进中国在高科技领域的
创新能力,在未来的“全球50大最聪明公司”榜单
中,出现更多来自中国的高科技公司。谢源
加州大学圣巴巴拉分校(UCSB)电机与计算机
工程系教授
IEEE Fellow推荐序三 利用数字技术的鸿
沟,“超级巨星”公司们正在掌控
世界经济
如今,世界似乎正在出现一种趋势,那就是
经济格局正在被几家巨头公司把持,它们无处不
在,从亚马逊(Amazon)、Facebook、谷歌
(Google)、苹果以及沃尔玛(Wal-Mart)等老
牌巨头,到爱彼迎(Airbnb)、特斯拉(Tesla)
和优步(Uber)等迅速成长的新公司。
历史上一直都不缺大型甚至垄断公司,但如
今的这一批巨头却十分与众不同,有些经济学家
称这些公司为“超级巨星”公司。它们来自各行各
业,并且或多或少都是凭借技术的力量才踏上巅
峰的。
我们的年度“全球50大最聪明公司”榜单中,就有很多这样的企业,榜单所列出的都是敢于创
新,并且其商业模式可以包容这些创新的公司,榜单是我们对未来市场“霸主”的一个预测。虽然
亚马逊、Facebook、谷歌皆被录入其中,但是也
有许多新公司榜上有名。
这些公司可能目前并不为人所知,但是我们
相信,它们已经走在了新兴科技应用的快车道。
当然,善于创新并不能保证它们将成为下一
家“超级巨星”公司。但是,在如今竞争越来越激
烈的市场上,善于创新起码会给这些公司一个创
造并统治新市场的机会。
“超级巨星”公司的出现在很多方面定义了我
们所处的这个时代。尤其是科技巨头,通过对互
联网、网络效应以及大数据的创新,在赚取巨额
利润的同时,又为我们提供了不可缺少的服务,比如网络搜索、在线购物,以及那些改变我们生
活的产品。
但是互联网公司并不是唯一能成为“超级巨
星”的公司。近日,一项由哈佛大学和麻省理工学院的经济学家所进行的研究显示:“超级巨
星”公司,即任何行业中资本总值排名前4位的公
司, 在所有的行业中的销售份额都经历了大幅度
上涨,不论是交通运输业、服务业,还是金融
业。
该研究的研究人员之一、哈佛大学经济学家
Lawrence Katz对此表示:市场被“超级巨星”公司
掌控的趋势正在加速,这种趋势在过去的10年里
在所有行业和发达经济体中都基本一致,尤其是
那些正在经历快速技术变革的市场。Lawrence
Katz还表示,这背后的原因应该是各公司利用新
技术的能力的区别。换句话来说,你必须是所从
事行业里最聪明的公司,要不然无法成为“超级
巨星”公司。
单独来看,这一点并无坏处。但是该研究报
告的作者们却表现出对由几个企业巨头统治经济
的担忧。20世纪的几大经济定律之一就是:一个
国家的国民工资收入在全国收入中所占的比例是
稳定的。随着经济的发展,国民的工资收入也会按比例提高。但是在过去的几十年里,国民工资
收入所占的比例却越来越小。这一趋势存在于许
多国家,甚至是2000年之后的美国也变得异常明
显。
这种趋势让很多经济学家都感到疑惑。有人
认为,这与可以代替人工的廉价机器人的崛起有
关,但相关的数据却缺乏说服力。Lawrence Katz
和他的同事们则认为,“超级巨星”公司的出现是
这一切背后的原因。随着这些公司越来越高效,利用技术的能力越来越强,它们创造收入所需要
的员工也就越来越少。而当这些“低人力需求”的
公司占据绝大部分市场时,国民的工资收入在全
国收入中所占比例的降低就可以解释了。
除此之外,“超级巨星”公司还有一个问题就
是它们对人才的追求。为了招揽到最优秀的人
才,它们往往会开出更高的薪酬,而这则会加深
一个国家的贫富差距。据斯坦福大学经济学家
Bicholas Bloom和他的同事的研究数据显示,自
1980年起,美国的工资差距中有三分之一都来自于巨头公司所开出的高额工资与正常工资之间的
区别。越来越少受过高等教育的精英能享受到这
些巨头增长所带来的红利。Bicholas Bloom 认
为,这正是美国患有“(经济)焦虑的原因之
一”。
这些“超级巨星”公司的崛起也许还可以解释
另外一个较负面的经济趋势。虽然在过去的十几
年里,软件、电子设备以及人工智能都得到了极
大的发展,为硅谷赚取了大笔的利润,但美国以
及其他发达国家的经济增长速度却十分缓慢。尤
其是“全要素生产率”(是指不包括资本和劳动力
等外来输入,其他所有影响产出的要素)这个反
映创新的指标,简直惨不忍睹。为什么高科技行
业正在急速发展的时候,全国经济却处于龟速?
经济合作与发展组织(OECD)的经济学家
认为他们找到了这个问题的答案。事实上,被经
济合作与发展组织称之为“前沿公司”,即各行业
的顶级公司的生产力确实在迅速提高。这些公司
正在积极地使用互联网、软件以及其他科技来优化自身的运营,开拓新的市场。但是绝大部分的
公司并不能有效地使用新技术。
因此,经济合作与发展组织的经济学家Dan
Andrews表示,这些公司的低生产力拉低了整体
经济。“科技越来越复杂,然而很多公司缺乏可
以适应新技术的能力。”Dan Andrews说道,他和
经济合作与发展组织的同事对美国和其他23个发
达国家进行了分析,并发表了相关的研究报告。
经济合作与发展组织的研究结果在某种程度
上算是很激励人心的,因为它证实了科技发展有
大幅度提高生产力的潜力,虽然这只能在顶级公
司中实现。然而Dan Andrews表示,落后的公司
并没有努力追赶,新的想法和商业模式扩散的速
度比想象中还要慢。没有人知道这背后的原因,但是事实证明,经济“扩散”新技术的效率比我们
想象中还要慢。
这一切都再次证明了“全球50大最聪明公
司”榜单的重要性。因为这个榜单上没有任何落
后者。但是各经济学家的研究一致证明了我们需要一个更好的商业环境,它可以让初创公司和新
想法茁壮成长。今日的“超级巨星”公司的发展速
度越来越快,但是能享受到其红利的人却越来越
少。
不过,这一趋势并不是不可避免的。随着人
工智能等复杂科技的发展,它们将在未来拥有强
大的能力,甚至能影响一家公司是否成功。虽然
这些复杂科技在应用上有极高的难度,甚至可能
拉大领跑者和落后者之间的距离,但它们也会创
造目前还不存在的新市场的可能性。我们确实需
要努力开拓创新,但在祝贺这些上榜公司的同
时,我们还要记住传播知识以及其所带来的财富
的重要性。
大卫·罗特曼(David Rotman)
《麻省理工科技评论》主编推荐序四 现实永远超乎想象
1952年,手冢治虫还是个20岁出头的小伙子
时,就画出了20世纪50年代人类对于人工智能的
期待:铁臂阿童木。到今天为止,我们身边的人
工智能还远远赶不上60多年前一个动漫人物在大
家心里的形象。如果按照2017年耶鲁大学和牛津
大学对352名科学家访谈得出的结论,大家相信
人工智能在2060年可以在一半人类职业上超过人
类。这个预测可能更加理性,但也很可能是非常
保守的。因为最近10年,人类第一次可以拥有足
够的运算能力来实践几十年以来推演的所有算
法,而今天最流行的神经网络架构甚至是20年前
Yann Le Cun在其论文中描述的。
2008年,我和朋友坐在落日下Palo Alto镇上
的星巴克,他拿出第一代圆滚滚的iPhone问
我:“现在回北京创业是不是太晚了?现在连这种设备都出现了。”说着,他用右手食指和拇指放
大了一个他正在浏览的网页。我笑了笑,鼓励他
说:“现在才刚刚开始,机会才刚开始出现。”其
实我心里也没有任何依据,也许只是为了安慰
他。但是,正是从第一代iPhone开始,我们才真
正经历了互联网的大爆发,中国消费互联网全面
赶超硅谷。今天,主流的硅谷基金合伙人会坐在
阳光明媚的Sand Hill红绿灯旁边的落地窗会议室
里面,尴尬地表示“我们现在都是看中国,Copy
from China”。
10年前落日下的Palo Alto看不到2017年超过
万亿美元市值的BATJ(百度、阿里巴巴、腾讯和
京东)。就像我们今天依然会低估未来10年的斜
率。
给予足够长的时间,很多预言都能变成现
实,比如凡尔纳的《海底两万里》和《八十天环
游地球》。但科技行业等不起100年的预测,所
以当我们终于等到《麻省理工科技评论》在我们
这个时代接连做出准确的预测时,我们很欣慰地觉得自己找到了科技投资的“红宝书”。本书筛选
的聪明公司涵盖的行业非常广,从人工智能到基
因测序、从细胞治疗到激光雷达、从运动品牌到
汽车集团、从创业公司到财富500 强、从硅谷到
北京、从非洲到拉丁美洲……纵横交错,缤纷异
常,如同一场全球艺术家混搭的演出盛宴。
细细品读,我惊讶于大象的舞艺和蜉蝣的韧
劲儿。
以最新的2017榜单为例,我们很明显地感受
到人工智能如日中天,从排名第一的英伟达
(NVIDIA)到已经连续4年上榜的百度
(Baidu),50家公司中有大量的上市公司上榜都
是因为人工智能,比如由于智能产线普及而准备
削减6万个工作岗位的富士康(Foxconn)。
由于基因编辑和细胞治疗技术的发展,使今
天的很多长尾疾病也能够看到治愈的方案或者希
望,比如凯德药业(Kite Pharma)的方案使39%
的严重淋巴癌患者6个月之后没有复发,或者
Ionis Pharmaceuticals与Biogen携手解决目前没有任何治疗方案的脊髓性肌肉萎缩症,又或者是考
虑到B类血友病的发病率只有五千分之一而低价
有效治疗的Spark Therapeutics(以下简称
Spark),使这种长尾疾病的患者将在这个时代得
到越来越好的照顾。
基于基因研究和自动化技术交叉点的测序行
业终于迎来了更多的创新:英国牛津纳米孔公司
(Oxford Nanopore)在经历了12年的风风雨雨和
投入了2亿美元的研发费之后,终于推出了一款
可以叫板Illumina的廉价高速测序仪,创纪录地读
取了882000个字符。无论是Illunima还是Nanopore
都在下一代测序研发上积极推动,争取早日实现
成本下降到100美元。
新兴市场里面,印度的Flipkart、阿根廷的
Mercado Libre和尼日利亚的Jumia则都是互联网基
础设施继续向外延伸的代表。
除了互联网、人工智能和精准医疗,清洁能
源也有3家公司上榜: First Solar刚刚从澳大利亚获
得了全球最大的光伏订单、超过40万笔Model 3订单的特斯拉收购了SolarCity和位于肯尼亚、拥有
50万名用户的撒哈拉以南非洲地区最大的离网太
阳能运营商M-KOPA。
不过我自己最感兴趣的其实是一家创业公
司:第一次上榜的量子计算公司Rigetti
Computing。我们拭目以待,看看他们是否能把量
子计算用商业价格带入这个时代。
从书中我们可以看到,一共有195家公司入
选了2011—2017年这7年的TR50榜单,这就意味
着有许多公司多次入选,甚至包括IBM和SpaceX
这两家从未缺席过榜单的公司。而那些曾经经历
过一些挫折的公司,比如遇到竞争的Illumina和失
去光环的HTC(宏达电),也都在新定义的市场
机会中再次找到自己的坐标。
总之,公司无论大小远近,唯一相同的就是
它们对于前沿科技不辍的坚持和投资。很多公
司,包括初创公司,也都经历了市场的几次上
下,终于等到能够撬动巨大机会的阿基米德支点
在运算能力爆发、基因测序成本急剧下降、发现新型靶点、互联网基础设施的加速渗透……种种
几乎令人眼花缭乱的科学探索和技术变迁的觥筹
交错中隐隐出现,才让我们看到这些世界上的聪
明公司。
当一年多前人工智能刚刚成为创业者的新宠
时,业界对10年以后的世界就有了几个猜想,比
如,无人机会不会替代人工?机器人会不会替代
人工?无人驾驶究竟能发展多快?能源、金融、医疗行业里人工智能公司的机会有多大等等,当
时大家争论不休。而从这个意义上看,《未来版
图:全球聪明公司的科技创新趋势和商业化路
径》一书对于数十个技术领域、十余个行业的归
纳、推演和预测,以及对“高精尖科技创新”与“能
够保证公司利益最大化的商业模式”融合的路线
图的构建,在一定程度上回答了以上问题,同时
也为我们提供了另外一个维度来观察和评估那些
始终令人敬佩的商业前沿公司。
熊伟铭
华创资本合伙人第一章 人工智能,在屋子里出生
的大象
任何能对收入千亿美元的企业产生影响的东
西,都是不可以小觑的。
——安德鲁·葛洛夫
(《只有偏执狂才能生存》,1997,光明日报出
版社)
沃森(Watson):“为了提高语言技能,我读
了你所有的歌词。”
鲍勃·迪伦(Bob Dylan):“你读了我所有的
歌词?”
沃森:“我每秒可以读取8亿页的歌词。而且
我分析出你的歌的主题是探讨随着时间的流逝,爱转淡。”
鲍勃·迪伦:“听起来是对的,我想我们可以一起写歌。”
沃森:“我会唱歌。”
鲍勃·迪伦:“你会唱歌?”
接着,沃森开始哼起一段旋律。鲍勃拿起吉
他,转身离开……
这是2015年IBM为人工智能(AI)“沃森”制
作的广告。这不是鲍勃·迪伦第一次为科技公司拍
广告。1997年,鲍勃·迪伦首次接受广告拍摄的邀
请,是乔布斯那个苹果经典广告Think
Different(“不同凡想”),一同出现在广告中的
人物还有甘地、爱因斯坦和马丁·路德·金。也是
在1997年,IBM的“深蓝”(Deep Blue)第一次代
表人工智能击败了人类国际象棋世界冠军加里·卡
斯帕罗夫。
之后,经过18年的发展,棋力最高的人工智
能围棋程序才大约达到业余五段围棋棋手的水
准,且在不让子的情况下,仍无法击败职业棋
手。2012年,在4台PC(个人计算机)上运行的
Zen程序在让5子和让4子的情况下两次击败日籍九段棋手武宫正树。2013年,Crazy Stone在让4子
的情况下击败日籍九段棋手石田芳夫。
会下围棋的人工智能阿尔法狗(AlphaGo)
和之前的围棋程序相比,表现显著提升。在和
Crazy Stone、Zen等其他围棋程序的500局比赛
中,单机版阿尔法狗(运行于一台计算机上)仅
输了一局。而在其后的对局中,分布式版阿尔法
狗(以分布式运算运行于多台计算机上)在500
局比赛中全部获胜,且对抗单机版阿尔法狗约有
77%的胜率。2015年10月开发的分布式运算版本
阿尔法狗使用了1202块CPU(中央处理器)及176
块GPU(图形处理器)。
从2015年到2016年,阿尔法狗一步步战胜最
顶尖的人类棋手,成为围棋的世界第一。即使鲍
勃·迪伦在2016年意外获颁诺贝尔文学奖,也没有
引起如此巨大的轰动。到了2017年,人工智能成
为技术创新与商业结合的最热“电视连续剧”,也
成为投资者行动和消费者讨论的中心。
Gartner公司对923名总裁或更高职位的企业高管的调查显示,76%的企业计划在未来一年里
尝试某种形式的人工智能或机器学习。一系列被
标签为“人工智能”的事件,其影响远远超出了人
们可以预判的范围。而试图“追剧”的观众,找不
到任何一个有能力剧透的对象。
检视所有卷入游戏领域的“全球50大最聪明
公司”,我们找到一条线索:这是一头出生在屋
子里(而不是闯进屋子)的大象。苹果独占Siri,却挡不住暗流汹涌
2013年,“人工智能”这个曾经晦涩的名词已
经成为技术领域最热门的趋势之一,《麻省理工
科技评论》将其选为当年“10大全球突破性技
术”。大型互联网公司正在使用它来推出理解图
像和语音的在线服务,基于深度学习算法的芯片
也正在被设计成无人机、无人驾驶汽车等产品。
其中,语音识别技术因为Siri在消费者超级应用
界面之一——苹果手机上令人印象深刻的表现,在商业上展现出巨大的可能。
Siri(Speech Interpretation and Recognition
Interface)是一款内置在苹果iOS系统中的人工智
能助理软件。此软件使用自然语言处理技术,让
用户可以使用自然的对话与手机进行交互,完成
搜索数据、查询天气、设置手机日历、设置闹铃
等服务。创建于2007年的Siri曾是美国国防部
DARPA(美国国防高级研究计划局)的研究项
目,定位为国家级的虚拟语音助理。之后,Siri
成为iOS手机操作系统中的一个应用程序,也在
黑莓与安卓(Android)平台提供服务。苹果公司
于2010年4月28日收购了Siri并重新开发后,使
Siri成为苹果设备的内置软件,并只允许在苹果
公司拥有的iOS、macOS系统中运行。
2013年,因使语音识别技术成功地实现商业
应用而登上“全球50大最聪明公司”榜单的是一家
纳斯达克上市公司——纽昂斯通信公司(Nuance
Communications, Inc.)。其上榜理由是它“创建了
语音识别技术从汽车到视频游戏的新应用”。
苹果收购Siri后,选择Nuance来作Siri的技术
服务商。一方面,Nuance在语音识别技术上的创
新积累可以大大加快苹果需要在大众消费者面前
展示这项技术给用户体验带来的跃升;另一方
面,合作开发意味着分担研发风险,分享研发收
益。至少在那时,已经拥有超级应用界面的苹果还没有清晰地看到人工智能在语音识别领域的高
投资回报率,或者其他竞争对手的紧迫进逼,迫
使它必须大张旗鼓地加入竞争。更何况,Nuance
的市值也没高到连乔布斯也买不起,必要时仍可
直接出手收购。
但搭上Siri之后,Nuance雄心勃勃。除了给
苹果公司提供技术支持, Nuance还与多家手机、电视机和GPS(全球定位系统)厂商保持合作关
系。三星(Samsung)的S-V oice也运用了Nuance
的技术。
紧接着,Nuance拒绝了苹果的收购,也没有
倒向谷歌。也就是说,Nuance仍然控制着语音识
别技术市场的开放度。它可以继续向三星、谷歌
等苹果的竞争对手提供技术,也保证了带有Siri
的iPhone手机不需要向谷歌缴纳专利费。
然而,这样的控制和保证,对已经尝到Siri
等语音识别技术滋味的公司是远远不够的。虽然
语音识别技术市场上只有Nuance一家市值不到50
亿美元的公司崭露头角,但是互联网高科技公司中的巨头并不是全无警觉与作为。
苹果收购了自动语音识别公司Novauris
Technologies(以下简称Novauris),致力于建立
一支强大的语音识别团队,并最终取代Nuance作
为Siri技术服务商的地位。
成立于2012年的Novauris是英国研究机构
Dragon Systems旗下的附属公司,以语音听写识别
著称。被Nuance 拒绝之后,苹果开始在波士顿招
揽人才,先后招聘了多位前Nuance语音科学家,包括前研究副总裁拉里·吉利克(Larry
Gillick)、Siri 的项目经理贡纳尔·艾弗曼
(Gunnar Evermann)、微软(Microsoft)语音识
别项目高管亚历克斯·阿赛洛(Alex Acero)。
谷歌在2004年从Nuance挖角,把谷歌语音识
别技术的开发部门交给Nuance前联合创始人Mike
Cohen执掌。2008年,在Nuance工作4年的Hugo
Barra跳到谷歌的移动部门,后进入安卓系统开发
核心部门,同时也回到他2000年在麻省理工学院
与同学创办的第一家公司的核心业务——手机语音辨识,参与开发谷歌语音搜寻项目。
2011年,谷歌收购了语音通信技术公司Say
Now 和语音合成技术公司Phonetic Arts。其中,Say Now创建于2005年,可以把语音通信、点对
点对话以及群组通话和社交应用整合在一起,支
持的设备包括PC浏览器、智能手机。一年后(即
2012年),谷歌发布了Google Assistant的前身
Google Now。Hugo Barra也作为参与研发Google
Now的骨干上台作了简报。到2012年时, Hugo
Barra成为谷歌的副总裁,2013年,他加入了当时
销售额增长最快、市场潜力最大的Android系统手
机厂商——小米。
Facebook在2013年收购了语音识别公司
Mobile Technologies。Mobile Technologies创建于
2001年,在2009年推出了Jibbigo应用。Jibbigo应
用允许用户在25种语言中进行选择,使用一种语
言进行语音片段录制或文本输入,然后将翻译显
示在屏幕上,再根据用户选择的另外一种语言读
出来。2013年,亚马逊收购了Nuance的竞争对手、语音技术公司Ivona Software。Ivona Software主要
做文本语音转换,被收购时支持17种语言以及44
种不同的声音类型。当时,亚马逊已经有了2011
年收购的语音识别公司Yap,以及2012年收购的
语音技术公司Evi。成立于2006年的Yap主要提供
语音转文本服务,代表应用是Yap语音邮件。亚
马逊利用Yap的技术建立了自己的语音技术平
台,服务于亚马逊的网上搜索和客户服务等领
域。Evi是一家初创公司,原名True Knowledge;
在获得了Nuance语音识别技术的授权后,它基于
自主的自然语言搜索引擎开发了一款与Siri类似
的应用。
在2013年的市场眼中,Nuance 还是世界上最
大的专门从事语音识别软件、图像处理软件及输
入法软件研发、销售的公司。Nuance拥有当时最
先进的计算机语音识别软件Naturally Speaking。
Nuance的另一款软件Nuance Verifier能提供声纹比
对的功能,与Speech Recognition结合可提供更安全的语音商务服务。人工智能的早鸟,能不能得到回报
2017年,英伟达跑赢了高通(Qualcomm)。
三年前的2014年,高通跑赢了英特尔(Intel)。
它们都是在人工智能上赌对方向的赢家。2017年
的今天,谷歌在人工智能上的成就,也与三年前
击败Facebook、成功收购DeepMind
Technologies(以下简称DeepMind)紧密相连。
2014年,3家公司因为人工智能而上榜“全球
50大最聪明公司”。上榜公司的总市值接近6000
亿美元。排在2014年“全球50大最聪明公司”榜单
第3位的是谷歌。它以超过5亿美元赢得DeepMind
公司。DeepMind将机器学习与神经科学结合起
来,创建了“通用学习算法”。
两年前(即2012年),Google X 实验室开发
出了一套具备自主学习能力的神经网络系统。不
借助任何外界信息的帮助,这种神经网络系统就能从1000万张图片中找出那些有小猫的图片。在
开始分析数据之前,研究者不会向系统输入任何
诸如“猫是什么样子”的信息。一旦系统发现了重
复出现的图像信息,计算机就会自动创建一
个“图像地图”,该地图稍后会帮助系统自动检测
与前述图像信息类似的物体。这个项目没有像通
常做的那样由研究人员为算法框定边界,而是直
接把海量数据投放到算法中,让算法自动从数据
中学习。这个项目的技术被应用到了安卓操作系
统的语音识别系统上。
生于1976年、坚信“数据会说话”的吴恩达
(Andrew Ng)是谷歌“识猫”项目负责人之一,他也曾是斯坦福大学计算机科学系和电气工程系
的副教授、斯坦福人工智能实验室的主任。2008
年,吴恩达入选《麻省理工科技评论》“35位35
岁以下科技创新青年”。2011年,吴恩达在谷歌
创建了“谷歌大脑”项目,通过分布式集群计算机
开发超大规模的人工神经网络。此外,他还与达
芙妮·科勒一起创建了在线教育平台Coursera。2012年,吴恩达开始在 Coursera 平台上线面向全
球的机器学习课程。到2017年年初,Coursera平
台的选课人数已达180多万人。2013年,吴恩达
入选《时代》杂志年度“全球最有影响力100
人”,成为16位科技界代表之一。
把自己的“聪明”程度与人工智能研发越来越
紧密地相连,表明一线大公司对人工智能的潜能
与其在更广泛领域的商业化前景越来越看好。随
着流向人工智能的资本增加,为之铺设“高速公
路”的基础设施商突然意识到了新的需求和机会
——芯片业开始发力。
人工智能的一个创新方向是为智能手机创建
能够运行神经网络的硬件。排在2014年“全球50
大最聪明公司”榜单第18位的高通公司,因开发
以“神经元”计算切入的芯片算力突破技术,2013
年的营收增长30%。高通当年的市值最高超过
1000亿美元,排在英特尔之前(2012年11月高通
的市值第一次超过英特尔)。
当谷歌开发出“认得”猫的人工智能时,在“看”YouTube视频的那个“它”有16000个处理器
和10亿个节点。普渡大学的科学家则努力以更紧
凑、更节能的方式设计深度学习硬件,使智能手
机和其他移动设备也能理解图像和视频内容。
2013年12月,在美国内华达州的神经信息处
理系统大会上,普渡大学研究小组展示了与传统
智能手机处理器连接的协处理器。这个协处理器
可以帮助手机运行深度学习软件,能够检测街道
场景的面部或标签部分。协处理器的设计在
FPGA上进行了测试。FPGA是可重新配置的芯
片,可以通过编程来测试新的硬件设计。
当然,该原型机没有谷歌“识猫”的人工智能
那么强大,但它显示出新的硬件设计可以令
Google Glass这样的智能可穿戴设备也“理解”照片
或视频。而以此为基础开发的应用程序能够在识
别出特定的人物(如妈妈)、对象(如出租车)
或场景(如医院)后采取行动。
深度学习是由模拟神经元构成的多层网络过
滤数据。单个的模拟神经元构成虽然简单,但一起工作却可能表现出复杂的行为。计算机模拟这
样的网络,效率并不高。普渡大学的协处理器专
门用于运行多层神经网络,并将其用于大量的图
像。在测试中,原型机的效率是GPU的15倍,系
统改进后的效率更可以达到目前效率的10倍。
主持这项研发的普渡大学教授Eugenio
Culurciello已经创立了一家名为Tera Deep的公
司,将自己的设计商业化。
与此同时,HRL实验室(波音和通用汽车的
一个联合实验室)神经和涌现系统中心主任
Narayan Srinivasa的研究重点是通过更加极端的解
决方案来解决这个问题:设计具有硅神经元和突
触的芯片,模仿真正的大脑。他表示,使用单独
的硬件实现深度学习是有道理的,因为通常处理
器和内存位于硬件的不同位置,而人类大脑以及
深度神经网络的存储和处理是交织在一起的。
继语音识别技术之后,人工智能下游的消费
应用场景也逐渐丰富起来。随着微软发布语音助
理 Cortana,越来越多的超级应用界面公司意识到,基于人工智能的语音技术不仅是推动用户原
有应用界面的背后力量,更可能成为下一代超级
应用界面。2014年获得1300万美元融资的Expect
Labs成为排名第47位的“全球50大最聪明公司”,它基于实时语音语义分析开发的软件通过倾听对
话而提供相关信息,最多有8人可以通过公司的
Mind Meld应用程序同时在线,参与对话 [1]。
一些公司在试图模仿、替代人脑,另一些公
司则专注于“人机共生”,开发增强人类能力的软
件。心理学家和计算机科学家J.C.R.Licklider在
1960年发表了一篇预言性文章,开创了“人机共
生”这个思考方向。
在“深蓝”打败加里·卡斯帕罗夫的8年后,两
名拥有3台计算机的美国象棋业余爱好者从巨型
计算机象棋大师的手中夺走了2万美元的奖金。
这次,胜利者依靠的不是自身的国际象棋技能,而是一种“人机共生”的工作方式:计算机负责计
算,人负责决策。
Palantir是美国加利福尼亚州帕罗奥图市的一家快速成长的软件公司,其目标就是促进“人机
共生”。Palantir的软件让用户工具能够探索互联
的数据,并尝试通过视觉来呈现信息,通常用作
跟踪人们思考的地图。一家银行购买了Palantir的
软件,以便侦测窃取或泄露敏感信息的员工。监
测的信息包括员工何时何地进入地点,以及公司
网络上的数字活动记录。相较于自动化系统里是
用一个算法根据过去的数据计算出一切,Palantir
这个系统正好相反。
Palantir的创始人在PayPal工作期间受到“人机
共生”理念的启发。原本,PayPal设计了一个自动
化系统来标记欺诈性交易。该系统能够抓住80%
的简单欺诈行为,但是无法应对复杂的骗局。最
后,PayPal研发了一款软件,让操作人员能够追
踪剩下的20%的欺诈行为。其通过分析工具洞察
大量数据中的可疑活动,而不是等待自动化系统
发现。
成立了9年的Palantir有美国中央情报局提供
的资助,数据分析软件的销售对象包括执法机构、银行和其他行业,并正在扩展到医疗保健等
新兴行业。《福布斯》在2013年时估计,这家公
司的收入为4.5亿美元。据彭博社报道,2017年年
底,该公司的订单总额可达35亿美元。
从商业上看,“人机共生”或者说“有限”人工
智能,成功的概率似乎更高。人们适应了个人生
活与智能手机的共生关系,能够在主导权不变的
条件下享受更多工具性的助理服务。
Palantir研发负责人Shyam Sankar和IBM研究
策略总监Zachary Lemnios都是Licklider的粉丝。
Shyam Sankar认为,分析师只有获得了能让他们
从各个角度创造性地检查数据的工具,才能发现
这些“灵光一闪”的时刻。Zachary Lemnios则觉得
Licklider的想法有助于IBM在“认知计算”方面的研
发,包括虚拟助手软件和像大脑一样运作的芯
片。
无论沿着哪一条研发路径走,人工智能都不
是人人可以参与的便宜的联机游戏。在拥有资本
实力的大公司之间,竞争变得白热化,收获却依然很遥远。这一年(2014年),亚马逊的表现仍
然不起眼。Fire手机是一次失败。搭载AWS云计
算软件的Echo智能音箱,也得到一片嘘声。市场
和业界还要等两年才能反应过来,并为之叫好。
而沃森尽管在2011年美国热门益智节目《危
险边缘》(Jeopardy !)中打败了最高奖金得主布
拉德·鲁特(Brad Rutter)和纪录保持人肯·詹宁斯
(Ken Jennings),但到了2014年,IBM投资的10
亿美元只收回不到1亿美元。通过基于沃森的销
售,IBM获得的收入远低于其每年100亿美元的长
期目标。对于IBM来说,认知计算是指了解自然
(人类)语言并可以通过挖掘所有数据业务面临
的所有非结构化数据(如文本和音频)来得出合
理结论的系统。而沃森是IBM在这一领域最大的
商业想象,它决心加大赌注。
于是,从事沃森技术的部门将直接向IBM首
席执行官弗吉尼亚·罗梅蒂(Virginia Rometty)汇
报。员工人数增加了4倍,达到2000人。IBM还计
划将沃森与其他“认知计算”技术结合,并追加投资10亿美元,大步推进沃森的商业化。沃森首席
技术官Rob High 告诉《麻省理工科技评论》,对
于向前推进一个更大的投资,“这是正确的时
间”。
想让沃森成为可以向企业销售的“认知服
务”引擎,就必须添加语音识别和图像识别功
能。不过,IBM的问题是,沃森在现实世界中挖
掘书面信息和处理自然语言的能力仍未达到理想
状态。
IBM一直希望沃森能够阅读医疗记录并推荐
治疗方案,尤其是癌症治疗。如果说参加电视问
答游戏是在周末爬爬北京的香山,那么为癌症患
者提供对症的治疗建议就是一次海拔5000米以上
的登顶挑战。同时,医生写下的医疗记录充斥着
行话、缩略语和不一致的术语,这也给沃森阅读
医疗记录带来了挑战。
与IBM一起研发这种“癌症助理”的美国纪念
斯隆-凯特林癌症中心的研究人员在2013年提供的
数据中,沃森准确地确定了患者记录中的所有关键数据,花费的时间仅仅是平时的一半。但这还
不是医生需要的人工智能的医疗建议。从医学课
本里找一条治疗建议的工作,价格便宜得多的软
件就能完成。纪念斯隆-凯特林癌症中心的癌症专
家想要的沃森是医生的顾问和同事,是临床医学
指南的搜索软件。沃森、Go或者是吴恩达……这是争夺
注意力的竞赛
对技术的商业化而言,吸引资本和注意力,始终是第一要务。
在不同的区域市场,更多的企业意识到,人
工智能可能满足它们通过技术创新来建立新的盈
利增长点的需求。人工智能研发公司也感觉到竞
争加剧,想要获得更多合作伙伴的支持,提高未
来市场的占有率,就必须赢得投资人、客户、最
终消费者和政府等各类决策者的注意力。2015
年,具有高辨识度的智力人才争夺,吸引上下游
实力强劲的合作伙伴加入游戏,像乔布斯那样精
心策划、制作、投放广告,直至公开张扬地挑战
人类智能,都使人工智能走出研究机构和大公司
的实验室,成为一个市场热点。
IBM不惜重金请奥美策划了系列视频广告和《纽约时报》的整版广告。正是在其中一个视频
广告里,沃森和一年之后(2016年)获得诺贝尔
文学奖的音乐人鲍勃·迪伦进行了本章开头的那段
对话。
阿尔法狗也做好了扬名立万的最后准备。
2015年10月,阿尔法狗击败欧洲围棋冠军、华裔
法籍职业棋手樊麾,成为第一个无须让子即可在
19路棋盘上击败围棋职业棋手的计算机围棋程
序,写下了历史。DeepMind也于2016年1月在
《自然》上发表了相关论文。下一步,它要在围
棋竞赛中建立IBM“深蓝”在国际象棋竞赛中那样
的功绩。
2015年,4家公司因在人工智能领域的突破
而登上“全球50大最聪明公司”榜单。上榜公司的
总市值接近3000亿美元。一直紧跟全球科技创新
趋势的中国互联网公司浮出水面。
百度,这个在中国市场占有率第一的搜索引
擎公司,排在2015年“全球50大最聪明公司”榜单
的第21位,上榜理由是“中国互联网公司的新深度学习研究实验室在面部和语音识别领域取得了
值得注意的成果”。百度2014年的研究开支增加
了70%,并在当年5月16日将吴恩达招至麾下。吴
恩达加入百度后,负责“百度大脑”计划,并担任
百度的首席科学家。
刚在旧金山创办一年的公司Enlitic因“其深度
学习技术可以在医学扫描中自动发现肿瘤”名列
2015年“全球50大最聪明公司”榜单的第39位。创
始人兼首席执行官(CEO)杰里米·霍华德来自澳
大利亚的墨尔本,第一次“创业”是销售游戏软
件,18岁时他作为一名自学成才的数据分析师被
麦肯锡雇用,先后创立了Optimal Decision
Group(用数据分析来帮助保险公司提高利润)
和FastMail。2010年,杰里米·霍华德在一场
Kaggle比赛中获得第一,随即被邀请加入 Kaggle
,担任总裁兼首席科学家。
Enlitic 是杰里米·霍华德在2013年12月离开
Kaggle后创建的公司,通过深度学习来改进医学
诊断和临床决策。2015年10月,Enlitic再获1000万美元融资,投资方为影像诊断服务公司Capitol
Health。Capitol Health是一家为澳大利亚各地的
诊所提供影像诊断服务的上市公司。Enlitic通过
为Capitol Health提供深度学习的技术,来提高其
放射科医生的工作效率。Capitol Health则在给
Enlitic提供珍贵的医疗影像的同时,让其放射科
医生与Enlitic的软件工程师进行协作。
澳大利亚医疗保险预算中的放射性检查的费
用在20亿美元以上,2014—2015年的扫描次数约
为3360万次。对这些扫描数据的分析工作,一个
Enlitic程序可以在8天内全部做完,而一个人可能
需要1282年。2016年,将Enlitic算法与4名顶级放
射科医师的工作进行了对比,其结果是,人类放
射科医生未能发现的7%的癌症,Enlitic全部发
现;有66%的病例被人类放射科医生误诊为癌
症,Enlitic为47% [2]。
同样对医疗市场紧紧咬住不放的是IBM。
IBM位列2015年“全球50大最聪明公司”榜单的第
46位,《麻省理工科技评论》认为IBM“关于人工智能的新型研究可以帮助该公司实现长期计划:
让大数据更有用”。2015年, IBM在北美签署使
用沃森系统指导癌症治疗的医院数量达到14家。
与此同时,沃森还在不断拓展应用领域。沃
森在唱歌、拍广告之余,也做沙拉。据《麻省理
工科技评论》报道,沃森记住了10000种食谱。
在沃森的支持下,用户可以选择几种关键食材
来“发现”食谱,然后通过类似在线音乐电台的匹
配算法将具有同样特征的食材分为一组,也可以
用最初选择的食材与系统识别的食材配对,或将
其替换为另一种。
语音个人助理研发、应用与市场在2015年持
续成长。之前,苹果有了Siri,谷歌有了Google
Now,微软有了Cortana。2015年,Facebook 收购
了语音识别公司Wit.ai 。Wit.ai 是孵化器Y
Combinator 旗下的创业公司。在创始团队中,Alex Lebrun 任首席执行官。Alex Lebrun 此前也创
办过一家语音技术公司 VirtuOZ,该公司后来被
Nuance 收购。团队成员Laurent Landowski是VirtuOZ 的欧洲区总经理。Wit.ai在种子轮融资中
得到了300万美元,投资方包括Andreessen
Horowitz、SV Angel、Ignition Partners以及影星
Ashton Kutcher 等。
有观察者认为,该公司的技术有助于
Facebook获得更多信息用于定向广告。而对马克·
扎克伯格来说,事情恐怕没有那么简单。Wit.ai
允许用户直接通过语音来命令移动应用程序 (如
iOS、安卓等平台)、穿戴设备、机器人以及任
何你可以想到的智能设备。简单来说,是“能把
语言转化为可操作的数据”,让创业者能够给自
己的应用程序引入语音识别技术,帮助开发者汇
集他们的语音样本来驱动一个语音与自然语言识
别系统。通常来说,语音算法的开发者需要先创
建“语法”——你希望计算机能够识别的单词和词
组集合,然后“训练”计算机识别那个语法。由于
不同的用户会用不同的方式来表述他们的指令,语法需要能够识别尽可能多的相同意图的不同表
达方式。而Wit.ai让用户能够共享语法和训练数据。开发者能够复制那些语法来随意调整自己的
应用程序。
位于2015年榜单第28位的“全球50大最聪明
公司”是英伟达,其“芯片对深度学习和无人驾驶
汽车这样的尖端技术而言是至关重要的硬件”。
作为一家早在1993年就成立的芯片公司,英伟达
的名声一直限于计算机游戏的GPU供应商。2015
年英伟达的收入为47亿美元,股价为20美元。然
而,仅仅两年后(截至2017年11月),英伟达的
收入就增至69.1亿美元,股价已超过200美元,因
为现在它的客户是人工智能。争当卖水人的芯片商们
需求正在改变。对芯片商来说,对未来订单
的预期决定了一切。在人工智能和机器学习的早
期阶段,按美国航空航天局前局长丹·戈尔丁
(Dan Goldin)的说法:“就像狂野的西部,总会
有疯狂的事情发生。”
丹·戈尔丁创办的Knupath公司在2016年6月推
出了一款名为Hermosa的人工智能芯片,以及连
接51.2万个Hermosa和其他芯片的软件。第一个版
本将专注于在嘈杂的环境中识别特定的声音。用
户可以开着敞篷车,边听收音机,边用自己的声
音登录电子银行。该公司筹集了1亿美元的资
金。
2016年,在人工智能领域有4家公司登上“全
球50大最聪明公司”榜单。上榜公司的总市值接
近9000亿美元。名列2016年“全球50大最聪明公司”榜单第30
位的是一家叫Movidius的初创公司。Movidius的
主要业务是为计算机视觉应用开发专用芯片,以
及全新的增强现实与虚拟现实专用芯片。这对增
强现实与虚拟现实设备,以及下一代智能手机和
无人机,都具有重要意义。
这家公司由Sean Mitchell和David Moloney创
立于2006年,早期做的是将旧电影转为3D电影的
业务,为3D电影市场做内容。后期开始研发应用
于3D渲染的芯片,并开始应用于计算机视觉应用
领域。2015年4月,Movidius宣布完成4000万美元
的E轮融资,由Summit Bridge Capital、Capital-
E、德丰杰和Emertec Gestion等投资机构投资,融
资总额达到8650万美元。
Movidius花费9年时间自主研发低功耗视觉处
理器Myriad系列VPU,它能够为设备提供强大的
自主运算能力,从无人机、虚拟现实(VR)到增
强现实(AR)都有所涉猎。2014年,Movidius与
谷歌的Project Tango项目合作,用Myriad 1打造室内三维地图。2016年2月,谷歌与 Movidius 合
作,将图片识别功能整合在手机上,以促进深度
学习功能在移动终端的运用。2016年3月,大疆
的“精灵4”同样采用了Movidius 的 Myriad 2芯片。
2016年6月,联想也和 Movidius 建立了战略合作
伙伴关系,由后者在未来为其虚拟现实设备提供
技术支持 [3]。
毫无疑问,2016年“全球50大最聪明公司”榜
单上排在第49位的另一家公司——英特尔密切关
注着Movidius的一举一动。将人工智能嵌入移动
设备(如手机、可穿戴设备、平板电脑、汽车
等),这样的芯片不是英特尔的“菜”。类似芯片
的单位利润也远远比不上英特尔的主流产品的单
位利润。但Movidius这类新型芯片商看重的是人
工智能所形成的新市场的规模。仅无人驾驶汽车
每年的产量就可能达到数千万台,如果每辆车都
有很多这样的芯片,这个细分市场的规模即可匹
敌传统的PC市场。
英特尔在前几波计算机行业的浪潮中一直扮演着“卖水人”的角色。现在,它又发现了涌向“新
金山”的人潮。不过,像每一次“淘金潮”所发生的
那样,试图垄断“卖水生意”的绝不止英特尔一
个。英特尔在计算机芯片市场长期独占鳌头,靠
的是走在客户需求的前面。
1997年,英特尔首席执行官安迪·格罗夫
(Andy Grove)成为哈佛商学院教授克莱顿·克里
斯坦森(Clayton Christensen)教授的第一批大企
业家。察觉到英特尔可能被PC芯片的竞争对手以
更便宜的产品削弱,安迪·格罗夫邀请克莱顿·克
里斯坦森与他的团队讨论对策。没多久,英特尔
为PC推出了一系列低端赛扬处理器,摧毁了
Advanced Micro Devices等公司的赶超梦。
但是,最近10年,世界上最大的芯片制造商
错失了芯片制造方面的最大机会——移动芯片。
尽管投资巨大,英特尔还是取消了部分移动芯片
Atom的开发,同时裁减了12000个工作岗位。而
更近一些,英特尔对又一个潜在的巨大市场——
为深度学习开发人工智能芯片也不太上心。直到2016年。
4月,英伟达发布了运算速度极快的深度学
习算法芯片——特斯拉P100 GPU。对于英伟达来
说,深度学习正在创造收入增长。将发展重点放
在人工智能,主要在于往深度学习方向发展的大
型互联网公司,发现GPU可以帮上忙。最好的英
特尔处理器中的每一个都包含几十个用于运行复
杂算法的内核,拥有足够的处理能力来运行大量
的电子表格或企业软件,但对运行深度学习算法
反而浪费和低效。针对深度学习算法优化的芯片
会将特定类型的问题(如理解语音命令或识别图
像)分解成数百万个小块。包含数千个微处理器
核心的英伟达的GPU的算力,正好能“不假思
索”地同时处理数千个这样的小块,一次性地对
图像或其他数据进行正确分类。
因此,英伟达一下子在新兴市场上占据了领
先地位。从汽车到制药再到金融服务,3500个客
户的合作需求涌向圣克拉拉。
5月,谷歌宣布,其专门为深度学习算法Tensor Flow设计的专用集成芯片TPU已经秘密使
用了一年多。这是谷歌第一次逆行到昂贵且困难
的上游产业——芯片,因为谷歌不满足于市场上
的现成产品。尽管谷歌将继续在计算基础架构中
使用英特尔处理器,但其人工智能的快速发展和
越来越激烈的竞争都要求定制化硬件。
9月,微软发布了可以执行BING机器学习算
法、支持Azure和Office365的FPGA。这个与英特
尔长期合作的大客户正尝试利用Altera等公司的
可编程芯片,例如FPGA,来增强英特尔处理器
的计算性能,以提高网页搜索速度。Altera在20
年前发明了世界上第一个可编程逻辑器件,尤以
FPGA芯片著称。FPGA芯片被广泛用于手机、平
板电脑等小型嵌入设备和数据中心的服务器中。
相比英特尔所生产的传统芯片,这种芯片最大的
不同在于可以根据不同场景进行重新编程,且运
行速度高于常规微处理器。
同时,高通也在推出软件工具来帮助客户使
用移动芯片进行深度学习。Knupath和Nervana等创业公司则在重新设计全新的深度学习芯片。
英特尔终于准备推出专为深度学习而设计的
第一个芯片。这是一个新版本的Xeon Phi协处理
器,它与英特尔的旗舰X86微处理器配合使用。
英特尔的另一个大客户——百度的语音识别技术
和深度学习团队负责人布莱恩·卡坦扎罗(Bryan
Catanzaro)测试Xeon Phi协处理器之后,表示它
可以像GPU那样有效处理大约90%的深度学习任
务。布莱恩·卡坦扎罗是加州大学伯克利分校
(UC Berkeley)的电气工程和计算机科学双料博
士。他于2014年6月加入百度,带领一个15人的
研发团队,探索语音识别领域,训练和部署深度
神经网络的工具和方法。他去百度之前,还在英
伟达工作了3年。
但布莱恩·卡坦扎罗担心英特尔没有开发软件
工具来帮助客户完善和维护神经网络,像英伟达
(或高通)所提供的软件工具一样。作为客户,他不希望英伟达是唯一可行的选择。有趣的是,2016年9月,布莱恩·卡坦扎罗离开百度,重新加入英伟达,成为英伟达深度学习应用研究部门的
副总裁。
竞争对手英伟达建立了先发优势。当英特尔
犹豫不定时,百度从英伟达购进的深度学习芯片
的数量已经是向英特尔采购的4倍。不过,英特
尔在这方面的财务损失有限。市场研究公司
Tractica表示,亚马逊、谷歌和其他云服务巨头购
买了价值1.33亿美元的芯片来运行深度学习系
统。这是英特尔2015年560亿美元收入的一大亮
点。
说到底,成立半个世纪、看惯了前沿技术商
业化过程中周期性表现的英特尔担心深度学习好
景不长。人工智能有过疯狂的过去,当一种技术
风潮的周期结束时,裸泳者比比皆是。不能因为
只盯住了深度学习,就排除了其他发展人工智能
的方法。英特尔首席执行官布莱恩·克赞尼奇
(Brian Krzanich)判断,公司的未来取决于其在
大型数据中心和物联网中的表现。
英特尔的风格一向是务实。当然,谨慎是以速度为代价的。面对对手不断发布人工智能“定
制”产品而带来的内部研发压力,英特尔需要用
其他手段来化解市场焦虑,平衡公司战略。
花了一年的时间,英特尔以167亿美元收购
了Altera,展示了自己在人工智能领域战略布局
的能力。收购完成后,英特尔可以将Xeon芯片和
FPGA封装在一起,集成为一个芯片,尽可能以
提升性能来应对客户不断增长的需求。这一收购
表明,布莱恩·克赞尼奇计划利用公司巨大的制造
规模和行业最先进的工艺技术来扩大市场份额,同时强化英特尔在数据中心和物联网市场的地
位。
2016年8月,英特尔以3.5亿美元收购了一家
主攻深度学习的公司Nervana。这一次收购能够让
英特尔获得深度学习的IP(知识产权)和具体产
品,能够满足人工智能开发及数据中心对芯片的
强大需求。Nervana的开发工具不仅可以支持
Altera的FPGA的最优化,也可以支持GPU的开
发。又过了一个月(2016年9月),英特尔宣布
收购 Movidius。世界上最大的无人机制造商大疆
在最新的Phantom 4中增加了Movidius制造的“视觉
处理单元”。该芯片处理Phantom 4的摄像机所看
到的事物的功能,使得无人机能够避免撞到飞行
物。
即使Movidius首席执行官Remi El-Ouazzane在
不久之前公开称,感觉不到英特尔的热情,但他
也算得很清楚:英特尔在银行里有150亿美元,而且,“他们不蠢”。
依靠一系列并购,下一年(2017年),英特
尔将保留“全球50大最聪明公司”的称号,并上升
到榜单的第13位。
拥有吴恩达的百度发力人工智能,在硅谷加
速扩张。2015年,百度开发了语音识别系统“深
度语音2”(Deep Speech 2)。深度语音2可以进
行深度学习,它的语音识别能力甚至比人还强。
深度语音2作为百度硅谷人工智能实验室
(SV AIL)的研究成果,吴恩达认为,这证明了端对端深度学习方法可以被用于识别差别很大的
语言。采用高性能计算技术导致了7倍的加
速。“与一年前这个时候相比,需要几周才能完
成的实验现在只需要几天。这使得迭代更快
了。”百度成为2016年“全球50大最聪明公司”榜单
的第2名。
麻省理工学院于1964年研发的伊丽莎
(Eliza)可能是最早的一批聊天机器人。伊丽莎
扮演心理治疗师的角色,用一个简单的动作来吸
引你的注意力:提出标准的问题,并经常在问题
中引用对方的回答。
排在2016年“全球50大最聪明公司”榜单第26
位的微软除了在2015年赢得全球图像识别大赛
(其研发的深度神经网络系统拥有152层虚拟神
经元)之外,还试图将深度神经网络整合到
Skype的服务中,以实现通话同步翻译。一下
子,无数个聊天机器人出现在即时通信应用中,伴随着惊喜,也引发了期待。这些应用包括
Kik、微信、Telegram和现在的FacebookMessenger。有些只是为了娱乐,但越来越多的人
用它们做些有用的事情:可以预订航班,仔细阅
读最新的高科技头条新闻,甚至通过向虚拟助手
输入消息,从汉堡王购买汉堡。创业公司正在竞
相提供工具,以加速这些虚拟管家的开发、管理
和“货币化”。
新一波聊天机器人热潮显然受到人工智能在
图像和音频方面进步的激励,但在训练计算机处
理和应对语言方面没有根本的突破。人类语言的
复杂和微妙之处,仍然容易迷惑机器人。卡内基
梅隆大学助理教授克里斯·戴尔(Chris Dyer)提
醒,虽然对解析语言每几个月都会有令人兴奋的
成果,但不要期待机器人马上可以处理一切,不
论是法律咨询、医疗咨询和精神科咨询可能都是
非常危险的。
磨了很多年的剑之后,亚马逊依靠标价89.99
美元的Echo Dot及其背后Alexa的语音服务排在
2016年“全球50大最聪明公司”榜单的第1位。亚
马逊日益强大的Alexa智能语音助手,使语音服务联结了消费者对上网、播放音乐、调节灯光和设
定恒温器的需求。同时,网络及云计算服务也正
在迅速发展并将成为亚马逊新的增长点。
谷歌的母公司Alphabet也毫不意外地上榜
了,排在2016年“全球50大最聪明公司”榜单的第
8位。它的人工智能项目和无人驾驶技术均已名
声大噪,尤其是阿尔法狗。
自2014年起,阿尔法狗以英国棋友deepmind
的名义开始在弈城围棋网上对弈。deepmind在
2014年4月到2015年9月,棋力维持在七段到八段
之间,总共下了300多盘棋。2015年9月16日其棋
力首次升上九段,10月击败樊麾。
2016年3月,通过自我对弈数以万计盘进行
强化练习,阿尔法狗在一场五番棋比赛中以4:1击
败顶尖职业棋手李世石,成为第一个不借助让子
而击败围棋职业九段棋手的计算机围棋程序。五
局赛后,韩国棋院授予阿尔法狗有史以来第一
位“名誉职业九段”称号。
战胜李世石之后,2016年12月29日至2017年1月4日,再度强化的阿尔法狗以“Master”为账号
名称,在未公开其真实身份的情况下,借非正式
的网络快棋对战进行测试,挑战中韩日的一流高
手;测试结束时它60战全胜。在2017年5月23日
至27日的乌镇围棋峰会上,最新的强化版阿尔法
狗与世界第一棋手柯洁比试,并配合八段棋手协
同作战,对决5位顶尖九段棋手,5场比赛获得3:0
全胜的战绩,团队战与组队战也全胜。此次阿尔
法狗利用谷歌TPU运行,加上快速进化的机器学
习法,运算资源消耗仅占李世石版本的十分之
一。在与柯洁的比赛结束后,中国围棋协会授予
阿尔法狗职业围棋九段的称号。从业余棋手到无
可置疑的世界第一,阿尔法狗只花了两年时间。眼看科大讯飞突起,没有大公司感觉
安全
人工智能已经成为席卷所有行业的流行时
尚,而语音识别技术俨然已是一个成熟市场。根
据国际市场研究公司Research and Markets 发布的
《全球及中国语音产业报告,2015-2020》,虽然
2013年的上榜公司Nuance在语音识别领域的市场
份额仍位居第一,但其全球市场占有率已经从
2014年的高达60%跌至31.1%。从Nuance手里“切
走奶酪”的公司,分别是谷歌(20.7%)、苹果
(13.4%)、微软(12.9%)、科大讯飞
(6.7%)。而科大讯飞(Iflytek)在中国语音技
术市场的占有率更是达到了70%。
科大讯飞排在2017年“全球50大最聪明公
司”榜单的第6位,其上榜理由为,该公司旗下的
语音助理技术是中国版的Siri。科大讯飞的实时翻译技术则是杰出的人工智能应用,克服了方
言、俚语和背景杂音等困难,可将汉语精准地翻
译成十几种语言。有超过16万名开发者使用科大
讯飞的软件,超过4亿消费者使用其产品。
2016年,科大讯飞在多项与人工智能相关的
国际比赛中胜出。其首次参加由谷歌承办的第四
届国际语音识别大赛(CHi ME),就获得全部三
项赛事的第一名并刷新历史纪录;首次参加国际
知识图谱构建大赛(NIST TAC Knowledge Base
Population Entity Discovery and Linkong Track),就包揽了赛事核心任务的冠亚军。其在国际认知
智能测试(Winograd Schema Challenge)中也获得
第一。
科大讯飞脱颖而出,很大程度上得益于中国
——这个规模大到不可思议的市场。在中国商业
客户需求巨大且最终消费者乐于尝试的面部识别
服务市场,排在2017年“全球50大最聪明公司”榜
单第11位的旷视科技,其所开发的面部识别技术
可以在人脸上追踪最多106个点位,获得了与众多最受欢迎的应用程序合作的机会。例如,在线
支付平台支付宝应用了该技术,让用户可以使用
他们的脸作为ID登录;共享出行软件滴滴出行使
用它来验证平台自由职业者的身份;智能手机应
用程序美图秀秀使用它来提供精准的照片修饰功
能……这个5岁的初创公司被认为是第一个面部
识别的“独角兽”,近年来至少募集了1.45亿美元
资金,这其中包括在2016年12月募集的1亿美
元。
2017年,“全球50大最聪明公司”榜单中的12
家公司的上榜理由的关键词是“人工智能”,上榜
公司的总市值超过1.1万亿美元。人工智能的市场
边界和竞争格局已经远远超出了科技公司和互联
网公司,那些经历了多次技术革命和人类全球战
争的传统公司也积极赶了上来。
排在2017年“全球50大最聪明公司”榜单第40
位的是通用电气(General Electric,GE)。通用
电气的目标是,到2020年之前成为世界顶级的软
件供应商;那一年,将有60000台喷气式发动机的数据会接入互联网,成为人工智能的分析对
象。
在2011年,通用电气就进行了初步探索:启
动了一项10亿美元的计划,来收集和分析来自机
器中的传感器数据。通用电气的下一步战略计划
是通过人工智能创建更智能的模型,希望借此能
比其长期竞争对手(如西门子)和软件巨头(如
已经将业务伸展到工业分析的IBM)更具优势。
该公司的大型服务性业务建立在监测现有产品之
上,如飞机发动机、机车和燃气轮机。公司也一
直专注于通过这些业务收集和分析数据。现在,上述这些数据系统中加入了人工智能,用于记录
工厂状况并提前预测故障。
这家125岁的公司在历史上曾无数次调整发
展战略。这次,首席执行官约翰·弗兰纳里(John
Flannery)再次改变公司的战略:利用复合型科
学家将人工智能贯穿公司整个业务。
通用电气在全球范围内拥有30万名员工,为
了顺利完成整合,公司首先是培训技术精英。2011年,詹森·尼克尔斯(Jason Nichols)在完成
加州大学伯克利分校有机化学博士学业后,加入
通用电气全球研究中心,从事了4年的制造和研
发用于工业废水处理的材料及系统。之后,他被
调到公司的机器学习实验室,接着又开始研究增
强现实技术。由于公司未来致力于将人工智能注
入其机器和工业流程中,所以像詹森·尼克尔斯这
样的复合型人才对公司未来的发展至关重要。詹
森·尼克尔斯所在的通用电气全球研发中心开发了
机器学习在线课程,以及可供科学家探索新角色
的专题讨论会。截至目前,公司有近400名员工
完成了通用电气数据分析认证项目,约有50名科
学家与詹森·尼克尔斯一样调到数字分析岗位。
这些双重角色科学家中的许多人,帮助制造
了通用设备的云端软件模型,既节省了资金,也
提高了用户使用的安全性。通用电气利用机器传
感器收集的信息,辅以基于物理的模型、人工智
能、数据分析以及科学家和工程师的知识,建立
了“数字双胞胎”。虽然数字双胞胎主要是一行行软件代码,但是最精细的版本看起来像3D计算机
辅助设计图,图中充满了交互式表格、图表和数
据点。它们使通用电气能够利用传感器数据而非
假设或估算数据来跟踪其飞机发动机、机车、燃
气轮机和风力涡轮机的磨损,从而更容易预测何
时需要维修。例如,在加利福尼亚州的通用电气
计算机服务器上安装一对数字双胞胎,来帮助一
架飞越美国的飞机发动机确定其零部件的最佳服
务时间。
除了预测机器的预期寿命外,虚拟模型还能
优化产品的运营。通用电气表示,数字双胞胎能
使风力发电厂的发电量增加20%,其中一部机车
每年可减少32000加仑(约121000升)的燃料和
17.4万吨碳排放量。截至2017年7月,通用电气已
经向客户交付了70多万个模型。这项技术依靠的
是人工智能的不断自我更新。例如,检测引擎的
微型机器人只比一个火柴盒稍大一点。利用计算
机视觉和各种人工智能技术,机器人可以通过在
缓慢移动的风扇叶片上行驶来寻找飞机发动机内的裂纹。类似的技术可以装到无人机上,用于发
现200英尺(约60.96米)高的火炬塔(油气厂用
于燃烧多余油气的设施)上的腐蚀。
为了开发和使用这些系统,通用电气的研究
人员不仅需要了解机器的物理特性,还要了解人
工智能的算法。通用电气全球研发中心的分析技
术总监马克·葛莱伯(Mark Grabb)看好分子生物
学家、机器学习专家、控制专家与材料科学家的
协作,这将会非常强大。对于一个在从涡轮机、喷气发动机到机车等竞争性“红海”中寻找增长机
会的传统公司来说,复合型科学家带动的人工智
能发展,可能是通向未来的最佳交通工具。
那些跟不上的科学家,就会被抛在后面。
2016年,通用电气创建了100个与人工智能和机
器人技术有关的研究工作;2017年1月,通用电
气解雇了研究领域被认为与“数字工业”战略关系
不大的研究人员。
2017年,围绕更适应人工智能进化要求的计
算,芯片业战况加剧。虽然排在2017年“全球50大最聪明公司”榜单第13位的英特尔在2017年3月
推出了一系列新产品,增强了在人工智能领域的
影响力,但英伟达的领先优势仍在扩大,其市值
在两年中增加了近9倍,达到909亿美元。连对计
算机如何工作一知半解的普通投资者也知道了这
家芯片公司。这一年,英伟达的市值一度超过了
高通——这个6年前黄仁勋公开指认的公司最直
接的竞争对手。
英伟达被评为 2017年“全球50大最聪明公
司”榜单的第1名。虽然英伟达的主要收入仍然依
靠图形处理器的销售,不过,它在人工智能软件
处理能力上也取得了长足进步。据最新的季报显
示,公司在数据中心和汽车领域的业务收入分别
比2016年增长了186%和24%。
其他在研发上艰苦积累多年的市场玩家也开
始在更广泛的应用场景中看到了回报。
开发者为Alexa开发的程序数已经达到12000
个。2017年继续保持“全球50大最聪明公司”称
号、位列该榜单第3位的亚马逊,正在创造由人工智能驱动的未来商店Amazon Go,并且正在将
语音助手Alexa整合到手机、汽车以及更多的产品
中。
近年来,亚马逊使用了包括计算机视觉、机
器学习和自然语言处理在内的一系列人工智能技
术,彻底升级了移动计算能力并改善了消费者的
购物体验。消费者可以通过该公司研发的语音助
手Alexa控制电视、汽车等诸多物件,而且它有望
在将来成为下一个重要的计算平台。
此外,亚马逊还通过位于西雅图的亚马逊便
利店简化线下购物体验。消费者进入商店,扫描
智能手机上的应用程序,随后带着想买的物品离
开便利店,即可完成购买过程。得益于人工智能
技术,亚马逊可以使用相机和传感器来识别消费
者选择的商品,并自动结算,无须排队结账。
如同所有前沿技术的研发,对人工智能的持
续投入离真正的现金牛业务还很远。雄心将时时
面对挫败和重新出发。排在2017年“全球50大最
聪明公司”榜单最后一位的百度虽然收入放缓,却依然不断向人工智能研究投入资金。2017年1
月,百度与合作伙伴推出了一款与亚马逊的Alexa
类似的、搭载了Duer OS的智能语音助手。
百度在人工智能研究上投入了大量成本,能
否将这些项目商业化还有待时间的检验,但中国
政府选择了百度来领导中国的第一个国家级人工
智能研究实验室。现在,百度有1700名专职从事
与人工智能相关工作的员工——只是,吴恩达离
开了。
技术创新投资和财务回报的矛盾也摆在了排
在2017年“全球50大最聪明公司”榜单第39位的
IBM面前。IBM投资了一系列新兴技术,该公司
认为这些技术将会为公司带来可持续的收益增
长。尽管IBM多年来一直向投资者允诺其新业务
(包括区块链、云计算和人工智能服务)带来的
收入将达到2016年公司总收入的40%以上,但到
2016年年底,IBM的销售量已经连续经历了16个
季度的下降。
IBM正在给自己挖下过度承诺的陷阱。沃森是其中最大的一个陷阱。2013年,IBM 声称“新
的计算时代已经来临”,同时向《福布斯》杂志
暗示沃森“已进入临床试验阶段”,将在短短几个
月内投入使用。2015年,《华盛顿邮报》引用了
一位 IBM 沃森经理的话,描述沃森如何忙着建立
一个“沟通机器与人的集体智能模型”。《华盛顿
邮报》还说,沃森系统会“和医生一起训练,去
做他们做不到的事”。
如今,IBM 公司的营业额低迷,股价波动,分析师们一直质疑沃森何时能为公司提供现金回
报。资深技术投资者和风投公司Social Capital的
创始人Chamath Palihapitiya 甚至在CNBC(美国消
费者新闻和商业频道)上评论:“沃森就是个笑
话。”
从某种角度看,沃森是IBM赌上前程的机器
学习系统,而它在IBM寄予厚望的医疗领域的进
展差强人意。像坚持为孩子捕食的母兽,IBM将
并购猎得的数据库用来喂食、训练自己的人工智
能系统“沃森”。但IBM对市场和投资人的承诺中包括一个“沃森”实现商业回报的时间表,这个时
间表能否如期实现还是未知数。
和在单个商业应用领域投入的公司相比,把
人工智能当成未来基础设施的一部分这一战略,使谷歌的母公司Alphabet成功地将下属一系列子
公司打造成自动驾驶、虚拟现实和增强现实等领
域的技术领先企业;人工智能的应用渗透到了所
有这些公司,甚至还可以节能。通过使用旗下公
司Deep Mind的机器学习算法来进行控制优化,数据中心的冷却系统节省了40%的能耗。
Alphabet排在2017年“全球50大最聪明公司”榜单
的第5位。
Deep Mind不断开发新型人工智能系统来模
仿人类智能,并提升学习速度。其自动驾驶项目
Waymo 的性能不断提升。作为 Alphabet 最知名且
最大的子公司,谷歌与硬件制造商合作,为其
Daydream VR平台创建独立的虚拟现实头显。新
产品将内置处理器和显示器,不再依赖用户的智
能手机,此外还会使用传感器以更好地追踪人类在虚拟世界的运动。
还记得在2015年年初,谷歌的人工智能研究
人员创造了Tensor Flow。两年之后,这一用于建
立机器学习软件的工具支持了谷歌及其母公司
Alphabet的未来愿景。Alphabet认为它可以通过帮
助公司利用机器学习来抢占亚马逊的云计算市
场。
早在2015年,谷歌的人工智能专家就创建了
一套名为Tensor Flow的软件,当时这款软件鲜为
人知。借助 TensorFlow,公司的工程师们可以更
容易地将新的人工智能方法翻译成实用代码;同
时进一步提高搜索和语音识别服务的精确性。令
人惊讶的是,在将TensorFlow开放给公司内部的程
序员数月后,谷歌随即宣布该软件免费向全球开
放。
近两年过去后,这一机器学习平台成了谷歌
和其母公司Alphabet的很多雄心壮志的基础。可
以清晰地看到所谓人工智能“民主化”带来的好处
——Tensor Flow成为程序员使用机器学习搭建新平台的首选工具。
领导了TensorFlow设计工作的谷歌人工智能
核心研究团队负责人杰夫·迪恩(Jeff Dean)表
示,一旦程序员使用TensorFlow开发出新产品,他就可以在任何地方运行它;此外,将其转移到
谷歌的云平台也非常容易。当前,云平台基础设
施的市场份额约为400亿美元(且持续增长),亚马逊和微软占据了大半江山;谷歌目前位居第
三,但与前两者还有很大的差距。谷歌云业务负
责人戴安·格林(Diane Greene)则估计谷歌的市
场份额在5年内会跃升至首位,而实现这一目标
的假设前提是投资人工智能的公司会向云服务提
供商砸下重金,从而让自身搭建和运行人工智能
的成本更低,同时也更容易,就像他们需要向电
子邮件和网站托管服务付费一样。
来自保险业的客户安盛(AXA)也在使用与
谷歌相同的基础设施,利用TensorFlow 来开发可
预测保费高昂的交通事故的系统。谷歌表示,这
就意味着更具竞争力的价格以及更好的表现。风险投资基金Madrona的总经理索马塞加
(S.Somasegar)曾是微软开发部门的负责人,他
表示,谷歌用了一个很好的策略改变了其在云服
务领域落后的局面。TensorFlow就是这个策略的
核心。
TensorFlow当然不是唯一能搭建机器学习软
件的工具。谷歌发布TensorFlow之后,它的云计
算竞争者微软和亚马逊也不甘示弱,相继发布或
开始支持它们自己的免费软件工具,来帮助程序
员搭建机器学习系统。
斯坦福大学客座教授雷扎·扎德(Reza
Zadeh)最初使用一款名为 Caffe的工具来帮助自
己的公司开发图像识别软件,但在接触并尝试了
TensorFlow后,谷歌的品牌价值和技术优势使其
最终决定完全放弃自己的平台。谷歌的工具也已
经在下一代人工智能研发人员和创业者的头脑中
扎下了根。在加拿大多伦多大学,人工智能研究
中心已经培养了众多如今声名赫赫的领袖级专
家。该大学的机器学习入门课程经常爆满,课程讲师Michael Guerzhoy负责讲授TensorFlow。因
为,10年前他可能需要花费数月时间开发的系
统,他的学生借助TensorFlow几天就能实现。
在围棋之外的竞技领域,谷歌旗下的
DeepMind在寻找新突破。2016年年底,暴雪宣布
与DeepMind合作,让人工智能在《星际争霸》的
游戏环境里进行特训。主导这项特训的是Oriol
Vinyals 。Oriol Vinyals也是2016年MIT TR35
(《麻省理工科技评论》“35位35岁以下科技创
新青年”)荣誉获得者之一。
据报道,出生在巴塞罗那的 Oriol Vinyals在
15 岁时就开始玩《星际争霸》,一度成为在西班
牙排名第一、全欧洲排名第16的知名电竞玩家。
Oriol Vinyals在加泰罗尼亚理工大学完成电信工程
及数学双学位之后,前往美国攻读工程学及计算
机科学,他也参与了 Berkeley Overmind 计划。
Berkeley Overmind取名于《星际争霸》游戏中虫
族的“主宰”(Overmind)角色。这项专案深入研
究利用各种人工智能计算技术,开发一个懂得如何玩即时战略游戏的人工智能机器人。在 2010年
的人工智能和互动数字娱乐(AIIDE)大会上,首次举办了《星际争霸》人工智能比赛;在完整
游戏模式类别,Berkeley Overmind 拿下了冠军,一战成名。
之后,Oriol Vinyals 进入了谷歌人工智能团
队,负责为翻译系统打造新的技术。Oriol Vinyals
想实现的翻译是从像素到解释,他想让计算机能
精准识别图像。基于这个想法,他更动了一行代
码,用自己写的图像代码取代了先前的翻译程
序。次日,他向计算机展示了一幅场景为热闹集
市的图像,摊位旁边的地上放了很多香蕉。计算
机识别为“一群人在市场买水果”。这代表着机器
可以阅读复杂的图片。这项技术被应用在谷歌图
像搜寻服务里。
2016年1月,Oriol Vinyals 加入DeepMind,挑
战比下围棋还难的人工智能——教计算机打游
戏,不靠输入死板的编码规则,而是只让计算机
通过经验自主学习。用来训练机器的游戏环境正是 Oriol Vinyals 最擅长的《星际争霸》。选择
《星际争霸》最主要的原因是其更接近真实世界
决策的复杂性。
在阿尔法狗打败人类棋王之前,许多人不认
为机器会获胜,但也有人觉得机器胜算大。同样
的分歧也出现在游戏领域。2017年8月,Elon
Musk 创立的人工智能非营利组织Open AI在一场
电竞表演赛中以一对一的方式击败《Dota 2》的
职业选手Dendi。
最流行的人工智能技术都需要大量的数据来
训练系统。排在2017年“全球50大最聪明公司”榜
单第21位的Gamalon声称其概率编程算法的效率
要比其他算法更高,该技术与其他机器学习技术
效率之差可以达到100倍。Gamalon算法的特点是
可以只从很少的算例中学习,还可以在iPad或笔
记本电脑上运行,不需要昂贵的服务器和图形处
理器。这家初创公司于2017年2月摆脱隐身模式
后,目前正在帮助电子商务和制造公司结合与匹
配不同来源的文本数据,如库存数据库。公司已经筹集了454万美元的种子资金,还与美国政府
签订了770万美元的合同。
更多的公司在2017年认识到,人工智能在用
户基数越大的行业越有机会进行效率提升和产品
创新。这些公司分别来自金融、医疗卫生、法律
以及其他服务业。
由阿里巴巴(位居2017年“全球50大最聪明
公司”榜单的第41位)创建于2014年的“蚂蚁金
服”公司,运营着快速增长的支付宝移动支付业
务。该公司野心勃勃地进军全球,投资了印度、泰国、新加坡和美国的金融企业。该公司独自运
营着中国过半的移动支付交易,每年的活跃用户
超过4.5亿。相比之下,Apple Pay仅有大约1200
万名用户。光凭这一点,就使蚂蚁金服在将人工
智能引入到新产品中的成功概率大大提高。其中
一项新产品是用机器学习处理智能手机上拍摄到
的意外事故录像的保险索赔系统,这一系统可以
确定损坏程度并协同保险公司处理索赔。
排在2017年“全球50大最聪明公司”榜单第43位的蓝色棱镜(Blue Prism)是一家位于伦敦的
英国上市公司。该公司的软件可以帮助银行和保
险公司等企业使用人工智能去做办公室的文职工
作。蓝色棱镜的机器人流程自动化软件模仿人类
完成基于规则(rules-based)的任务的方式,例
如手动将数据从纸质表单输入数据库。自2016年
3月上市以来,该公司的市值上涨了10倍, 2017
年达到5亿英镑。该公司在2016年全年所签署的
合同数,是2015年的4倍多。
Salesforce是一家位于美国旧金山的上市公
司,排在2017年“全球50大最聪明公司”榜单的第
47位。Salesforce及其销售平台2016年的年营收为
84亿美元,在客户关系软件市场的份额为20%。
该公司正在研究如何将人工智能融入其具有庞大
用户基础的产品中,比如可以对文件进行总结的
算法。公司预计,未来5年人工智能将改变人们
的工作方式,并推动客户关系管理软件的发展。
在2016年收购自然语言创业公司MetaMind之后,该公司于2017年推出了一种算法,展示了未来工作与生活方式可能的演化方向之一。它应用机器
学习对文档进行总结,制作出了连贯而准确的概
要;它还可以帮助整理电子邮件或当天的新闻报
道。展望
2018年2月1日,麻省理工学院正式宣布启动
一项雄心勃勃的项目——MIT Intelligence Quest
(MIT IQ)项目,该项目旨在了解人类智力,并
利用研究成果开发智能机器,这是该校有史以来
最大的人工智能项目,也被视为学术界发起的一
场旨在人工智能领域赢回主动权、意义深远的努
力,麻省理工学院更是动员了所有的五大学院,共同投入到这个项目中。
除了麻省理工学院的校长L.Rafael Reif,项目
的主要领导人也由麻省理工学院核心院系及实验
室的负责人组成,包括工程学院院长Anantha
Chandrakasan、麻省理工学院计算机科学与人工
智能实验室主任Daniela Rus、电子工程和计算机
科学系教授Dina Katabi、大脑与认知科学学院神
经科学系主任 James Di Carlo、认知科学和计算科学教授Josh Tenenbaum 。
人工智能技术的发展在不同国家、地区、企
业与研究机构之间,围绕着战略格局、经济利益
和学术荣誉,表现出日益浓重的决战气氛。一方
面,市场对人工智能的需求与期待空前膨胀;另
一方面,人工智能技术的发展亟待深度学习和强
化学习之后新的理论突破。正如2018年1月28日
上午,麻省理工学院计算机科学与人工智能实验
室教授 Tomaso Poggio 在《麻省理工科技评论》
EmTech China 全球新兴科技峰会上所说,深度学
习可以帮助我们解决10%的难题,剩下的90%需
要来自神经科学以及认知科学的研究,需要更好
地了解人的思维和大脑。
这应该也是谷歌母公司Alphabet会延请斯坦
福大学前校长John Hennessy出任董事长的原因,以进一步加强对科研与人才源头的影响力。
另一个值得注意的趋势是,中国公司在人工
智能领域开始取得资本等生产要素的优势。例
如,2017年,全球在人工智能领域的投资有152亿美元,其中中国企业所获得的投资额以48%的
占比占据第一(美国企业占38%)。而2016年,中国企业所获得投资仅占全球人工智能总投资的
不到12%。Broad研究所所长Eric Lander认为,美
国在人工智能领域的优势只比中国领先半年。
而像商汤科技这样的中国初创企业也已经被
邀请加入MIT IQ的研究项目。
[1]. “Lizette Chapman Expect Labs Raises 13
Million for Anticipatory computing”, The Wall Street
Journal, 2014-12-18.
[2]. Mark White,“I wasn't interested in just following
the rules: Data scientist Jeremy Howard and the next
internet”, the Sydney Morning Herald,2016-5-29.
[3]. “Movidius acquired by Intel”, Crunchbase, 2016-
9-6.第二章 竞速无人驾驶
过去,好的驾驶体验来自……强劲的引擎,未来,好的驾驶体验将来自强大的……运算能
力。
——黄仁勋
有一个老笑话,说外星人小分队侦察完地球
后回去报告:这个星球的主导生物叫“汽车”,它
们吃黑色的液体,排泄气味不佳的气体,日落之
后会眼睛发亮;在它们每个单体的内部,生存着
一种叫“人”的寄生虫。抛开未来人的价值和未来
汽车的灵魂这样的敏感议题,单就驾驶操作转移
而言,无人驾驶汽车正在取得某种控制权上的平
等地位。
在某种意义上,汽车技术发明并取代马的运
输能力之后130年,终于进化到接近一匹识途老
马了。不论以哪一种研发理念和路径进步的无人驾
驶
[1]
技术,汽车,准确地说是其配置的先进传感
器和强大的芯片,以及背后的云数据中心,都在
解放驾驶者。能够控制转向、制动和加速的自驾
系统已经出现在新型汽车中,而这并不是终局。
马上,可能不到5年,曾经不厌其烦地提示你更
多数据和更多责任的汽车将不耐烦地接手一切。
在这方面,无人驾驶充分体现了人工智能异于常
人的优点——不会因为学习曲线和责任压力而逃
避自由。
2017年9月5日下午7:58,一辆丰田无人驾驶
汽车在旧金山附近被路人目击。由于靠近硅谷,这个城市的居民随时可能遇到无人驾驶原型车。
如果是在2013年,同样的经历还值得在晚餐桌上
聊一聊,现在,太平常了。
优步、通用和Waymo是加利福尼亚州最常见
的无人驾驶原型车。最近,也有人看到过苹果的
原型车。此外,还有三星、梅赛德斯-奔驰、百度
和Auto X……不少于39家公司在加利福尼亚州的道路上获准测试无人驾驶原型车。
从交通系统进步的角度,全面无人驾驶可能
是一个付出更少生命成本而系统收益更高的新选
择。根据美国汽车协会的数据,美国每年有将近
3.3万人死于道路交通事故,损失金额高达3000亿
美元。世界卫生组织估计,全世界每年有超过
120万人死于道路交通事故。美国国家高速公路
交通安全管理局估计,90%以上的道路交通事故
涉及人为失误。乐观者预测,自动驾驶将减少同
样百分比的道路交通事故。
经济上,一旦实现无人驾驶,还将提高道路
的安全性、减少拥堵、释放被停车场占用的宝贵
土地。驾驶者都变成了单纯的乘客,利用节省下
来的数百万小时在日常通勤中工作、娱乐、用餐
或睡觉。被释放的驾驶时间将流入其他行业,即
使到那时人工智能已经拿走了这些行业多数的就
业岗位,“增加”的时间仍然会刺激消费。
更美好的是,它还可能降低燃料消费、改善
污染。1997年在加州大学河滨分校进行的示范以及2011年进行的涉及改装道路车辆的实验表明,使车辆以高速自动“排”行驶,从而减少空气动力
阻力,可以使燃料消耗降低20%。而2016年发表
的一项工程研究得出结论,自动化在理论上可以
允许在特定高速公路上行驶几乎四倍的汽车。得
克萨斯州运输学院指出,这样可以节省55亿小时
和29亿加仑(约110亿升)燃料中每年由于交通
拥塞而浪费的那一部分。
批评者关注无人驾驶如何一步步夺去司机作
为一项职业的民生意义。对以此谋生的职业驾驶
者来说,这当然不能接受。而支持者,主要是那
些把提供未来交通服务视为己任的企业,它们正
试图将未来的盈利模式建立在由芯片操控的车辆
上,彻底摆脱纷争不断、代价昂贵的劳资关系
(即使以共享模式建立的新型合约关系也只是减
轻而不是解决了这一矛盾)。
在高回报面前,谁在乎代价?在全球市场,掌握公共资源的政府、说服能力较强的汽车业和
急于实现资本回报的互联网科技企业,不论人工智能还是共享租车,都卷入了这场技术驱动的商
业游戏。
“想象一下:在市中心的午餐时间,你不需
要花20分钟找到停车位。即使记不住车钥匙放在
哪里,老年人也能来去自如。”2014年春天,谷
歌无人驾驶汽车项目主管Chris Urmson在公司的
官方博客上写道,“醉驾和开车走神?拜拜。”无人驾驶与自动驾驶的分歧与布局
在研发可以商用的无人驾驶车辆之前,大众
集团电子研究实验室成员与斯坦福大学动力设计
实验室合作,在2010年打造出一款无人驾驶的奥
迪TTS ,征服了美国科罗拉多州的派克峰赛道。
在27分钟的时间里,TTS的最高时速曾达到75千
米。
2013年,大众公司旗下的成立于1909年的奥
迪,第一次因为无人驾驶技术登上“全球50大最
聪明公司”榜单。这家市值340亿美元的公司的上
榜理由是,其运用适合车辆前格栅的激光扫描道
路探测器使自主驾驶更容易实现。2015年1月11
日,在一年一度的美国拉斯维加斯举办的国际消
费电子展(Consumer Electronics Show,CES)
上,奥迪演示了“Piloted Driving”系统,并计划在
未来10年推广这一技术。奥迪对于无人驾驶的开发理念,可以说
是“自动驾驶”。其对消费动机和应用场景的设计
仍然源自传统汽车厂商对消费者的理解。传统汽
车厂商认为,消费者购买汽车主要是为了追求驾
驶乐趣。但如果消费者在高速路上遇到堵车,那
所谓的“驾驶乐趣”便荡然无存。因此,奥
迪“Piloted Driving”驾驶系统的设计是,如果驾驶
员遇到堵车,且车辆的时速保持在35英里(约
56.33千米)以下,驾驶员就可以按下方向盘上的
按钮来激活这一系统。在系统介入后,驾驶员的
双手便可以离开方向盘,脚也不必继续放在踏板
上。如果驾驶员希望主动变道并取消系统自动驾
驶,只需轻踩踏板或主动转动方向盘即可。
其实,在这届CES上,丰田公司也向公众展
示了一辆雷克萨斯 LS 无人驾驶汽车。这款汽车
采用了很多谷歌无人驾驶汽车中的技术,比如在
车顶安装一个可 360°监测的 LIDAR 系统。不同
于奥迪,丰田希望将自动驾驶系统打造成驾驶员
开车的辅助系统,帮助其更好地驾驭车辆并给予驾驶员保护。一名雷克萨斯公司的工作人员对媒
体做了如下补充说明:从理念上来看,两家公司
的无人驾驶方案完全不同,因为雷克萨斯认为
的“自动驾驶”不等于“无人驾驶”。显然,雷克萨
斯的“自动驾驶”不如说是“辅助驾驶”。
2013年的特斯拉还是硅谷的一家小型汽车制
造商。不过,特斯拉的首席执行官埃隆·马斯克
(Elon Musk)也提出了无人驾驶汽车的开发目
标。埃隆·马斯克告诉媒体,他们正在开发无人驾
驶汽车,但驾驶员仍然需要在驾驶室内进行少量
操作。埃隆·马斯克并没有透露关于特斯拉无人驾
驶汽车计划的细节,只提到“无人驾驶”并非无
人。他想象中的无人驾驶汽车系统更类似于一套
自动操控系统,开启这套系统后驾驶员无需在大
多数的场景下进行操作。这听上去更接近奥迪,远比丰田积极,而和谷歌保持着距离。
埃隆·马斯克称,三年时间能实现 90%的路
程无需人类驾驶。他强调,特斯拉无人驾驶汽车
已经处于内部开发阶段,并不打算将相关技术提供给其他公司。尽管过去他曾提过与谷歌的合作
计划,但特斯拉无人驾驶汽车不会与谷歌展开合
作。
谷歌,是完全“无人驾驶”的最积极分子。
2012年5月,美国内华达州机动车驾驶管理处为
谷歌的无人驾驶汽车颁发了一张车牌。
最初,谷歌的无人驾驶汽车有一个驾驶员坐
在方向盘的后面,随时准备在有情况发生的时候
接管汽车。同时,还有一个技术人员在监控着导
航计算机。2013年,谷歌开始让部分员工坐着无
人驾驶汽车上下班通勤。在远程摄像机记录的试
验过程中,不少员工在方向盘后面睡着了。于
是,谷歌工程师们确信,在危机发生时,不存在
驾驶员从分心状态下回过神来比计算机系统的反
应速度更快的可能。
不完全的无人驾驶,实际上是一辆车要受控
于两个驾驶员。让人不由想起卡罗·奥斯瓦尔多·
哥尔多尼(Carlo Osvaldo Goldoni)的《一仆二
主》,以及联席首席执行官制度怎么在黑莓的衰退中推了一把。麻省理工学院Age lab的科学家布
赖恩·赖默认为,也许无人驾驶汽车发展中的“最
大阻碍因素”将是与人类经验相关的因素,人类
驾驶员分心后如何继续驾驶是一个难题。
为了解决这个问题,一方面,汽车制造商要
监控人类驾驶员,提醒他们不能过分分心;另一
方面,负责交棒的无人驾驶系统需要知道在什么
情况下要留出多少时间让人类驾驶员可以顺利接
棒。斯坦福大学汽车研究中心主任Clifford Nass
认为,第一代(自主汽车)将要求驾驶员在某些
地方进行干预。而驾驶员可能需要5秒以上的时
间才能真正掌控车辆。
谷歌的选择是不相信人类驾驶员时刻警惕与
及时介入的能力。它选择了另一条技术路线——
用计算机系统完全取代方向盘后的人类,并设计
了一种新的测试车辆:没有方向盘、刹车踏板和
加速器,且只能以时速25英里(约40.23千米)的
速度行驶。
与此同时,谷歌还开始为重组市场进行准备。
优步是一家交通网络公司,总部位于美国加
利福尼亚州的旧金山,2009年,优步由特拉维斯·
卡兰尼克和格瑞特·坎普创建,当时名为“优步
Cab”。优步开发了联结乘客和司机的移动应用程
序,提供载客车辆租赁及实时共乘的分享型经济
服务。乘客可以通过发送短信或使用移动应用程
序来预约这些载客的车辆;利用移动应用程序时
还可以追踪车辆的位置。
优步的移动应用程序在旧金山地区推出后,2010年下半年就获得一群加利福尼亚州硅谷超级
天使投资者的创投资金挹注。2011年年初,优步
获得来自创投公司Benchmark的3200万美元资
金。2011年下半年,优步再次从多位投资者处获
得了3200万美元的资金,投资者包括高盛、Menlo Ventures和杰佛瑞·贝佐斯等,这让优步获
得的总投资高达4950万美元。
谷歌看到了优步在未来交通市场的潜在价
值,2013年通过母公司Alphabet旗下的GV向其投资了2.58亿美元,成为优步的股东之一。双方没
有预料到,不到5年,它们就要为了无人驾驶而
兵戎相见。
尽管在不同行业的无人驾驶开发者沿着辅助
驾驶、自动驾驶和完全无人驾驶的不同方向着手
布局,在2013年,没人认为无人驾驶汽车很快就
能接管道路。传统汽车商的时间表和创新技术商业
化的问题清单
市场调研公司 IHS Automotive 在 2014年1月
预计,2025年自动驾驶汽车的数量将达到 23万
部,并在 2035年达到 1180万部。对于豪华汽车
制造商而言,在竞争激烈的市场上,不以最新的
技术取悦消费者、不在无人驾驶上投入巨资等于
自杀。
2014年,排在“全球50大最聪明公司”榜单第
7位的是德国宝马公司。这家传统汽车制造厂商
通过在汽车上增加无人驾驶技术,走在了最前
沿。宝马无人驾驶项目负责人维尔纳·胡伯
(Werner Huber)表示,公司的目标是在2020年
成为世界第一家在高速公路上引入无人驾驶技术
的汽车制造商。
此时,德国、美国、日本的汽车厂商都决定规划以自动驾驶为方向的时间表。宝马、奥迪、梅赛德斯—奔驰和大众都忙着试图将自主驾驶从
实验室里的研究转化为最新车型上的可选模式。
制造经验和庞大的客户基础使传统汽车制造业拥
有交通领域最有价值的超级用户界面和技术变现
能力,它们不能坐等上游的互联网科技公司利用
算法和数据的优势掌握主动。而互联网高科技公
司则希望通过计算机领域的积累帮助它们实现更
具颠覆性的改变。
2014年5月27日,《时代》周刊报道了谷歌
推出了一款令人期待的无人驾驶汽车原型,它没
有刹车、脚踏板或方向盘。近几年来,谷歌一直
在广泛使用改装奥迪、丰田普锐斯和雷克萨斯车
型来测试自动驾驶汽车。2014年4月,它宣布其
无人驾驶汽车已经测试了近70万英里(约110万
千米)。谷歌的双座原型车是在世界各地汽车零
部件供应商的协助下建造的,车速以时速25英里
(约40千米)为上限。车载传感器可以在两个足
球场的距离范围内检测任何方向上的物体。谷歌无人驾驶汽车项目主管Urmson表示,如果这批原
型车(约100辆)的性能令人满意,谷歌计划在
未来两年内在加利福尼亚州开展试点。
就在《时代》报道谷歌原型车的第二天,排
在2014年“全球50大最聪明公司”榜单第26位的优
步的首席执行官Travis Kalanick说他非常喜欢无人
驾驶汽车的想法,并且乐于用无人驾驶车队取代
他的司机。Travis Kalanick还表示,随着时间的推
移,乘坐的成本将非常低,人们甚至不需要再拥
有一辆汽车。看起来,优步会加入无人驾驶研发
队伍,即使作为谷歌的竞争者。
以消费者体验为第一优先的豪华汽车制造
商,当然不会让无人驾驶原型车顶上一个巨大的
旋转激光扫描仪。宝马和其他汽车制造商不得不
想办法将更小、更有限的传感器装入汽车车身,以避免影响重量或造型。宝马的前后保险杠内部
隐藏着2个激光扫描仪和3个雷达传感器,前后可
扫描大约200米的范围。在挡风玻璃和后窗的顶
部嵌入了跟踪道路标记和检测路标的相机。每个后视镜附近都有广角激光扫描仪,每个都有近
180°的视角,可以观看左右。车轮上方的4个超
声波传感器监测靠近车辆的区域。最后,差分全
球定位系统接收机将地面站信号与卫星信号相结
合,确定汽车的位置,误差只有几厘米。
宝马原型车行李箱内的几台计算机能瞬间完
成测量和计算,处理来自传感器的数据。软件根
据车辆的速度和附近车辆的行为为每条车道分配
一个数值。这个软件使用一种有助于消除传感器
读数误差的概率技术,决定是否切换到另一个车
道、向前超车,或避开从后面接近的车辆。指令
被传送到控制加速、制动和转向的独立计算机。
而另一个计算机系统则监视与自动驾驶相关的一
切事情,监测故障征候。
戴姆勒公司的梅赛德斯-奔驰原型车的计算机
不仅能够制动和加速,而且还能转向。使用立体
相机、雷达和红外摄像机,这辆奔驰S级轿车还
可以在前方道路上发现物体,并控制刹车以防止
事故发生。在实验中,在时速80千米的速度下松开方向盘和油门,还能表演紧急刹车。
福特、丰田、东风日产、沃尔沃和奥迪都宣
称,力争在10年内销售某种形式的无人驾驶汽
车,能够接管高速公路上的驾驶或把自己停进车
库。一向乐观的埃隆·马斯克则表示,无人驾驶汽
车上路行驶的时间可能会比多数人预料得更早,特斯拉正在开发一项“全面自动驾驶”技术,希望
在5年内应用到汽车上。2014年9月,通用汽车宣
布2017年的凯迪拉克将是第一辆在公路上提供无
人驾驶的汽车。
总能紧跟形势的中国互联网公司当然不会放
过一个日渐清晰的市场趋势。2014年8月,百度
宣布将在无人驾驶领域有所作为。排在2014
年“全球50大最聪明公司”榜单第28位的百度在硅
谷的研究室离谷歌只有8英里(约12.87千米)。
百度准备用一些传感器包括激光雷达、GPS 结合
的定位系统来采集数据,制作三维地图,这个三
维地图最后存成一个特定的格式,将成为无人驾
驶的基础。一个月后,中国数字地图服务商高德也向公众展示了其面向无人驾驶环境的高级驾驶
辅助系统(ADAS),利用汽车上的多种传感器
与高精度地图数据,辅助驾驶者更安全舒适、高
效经济地驾驶。
不过,无人驾驶技术的商业化还有一张很长
的问题清单。
第一,成本。
宝马汽车和其他原型车中的许多传感器和计
算机太昂贵,无法广泛部署。实现更完全的自动
化可能意味着使用更先进、更昂贵的传感器和计
算机。比如,谷歌原型车的车顶上的Li DAR激光
雷达能够提供关于周围环境最优秀的三维图像,精度可以达到2厘米,但售价约为8万美元。这种
仪器还需要进行小型化和重新设计。
第二,法律需要更新。
截至2014年,虽然美国几个州通过了允许自
动驾驶汽车在道路上进行测试的法律,但是美国
国家公路交通安全管理局还没有制定测试和认证
自主特征安全性和可靠性的规定。两个主要的国际条约——《维也纳公路交通公约》和《日内瓦
公路交通公约》可能需要修订,用于在欧洲和美
国使用的汽车,因为这两份文件均指出,驾驶员
必须随时对车辆保持完全的控制。
第三,日常交通的复杂与不确定。
当无人驾驶的使用局限于相对简单的场景,如高速公路行驶,还容易些。但这项技术仍然无
法应对复杂的车流、道路和行人所带来的不确定
性。麻省理工学院教授约翰·伦纳德(John
Leonard)曾经带队参加了2007年的美国国防部高
级研究计划局城市挑战赛。比赛需要完成的挑战
是让无人驾驶车辆穿越城市街道模型,现场会有
红绿灯和其他车辆。约翰·伦纳德认为,一些主要
的基本问题还没有解决,如关于整个世界的呈现
以及对可能发生的事情的预测。真正实现这项技
术的应用可能还需要数十年。
针对这一问题,美国密歇根州安娜堡市建设
了一个专供无人驾驶的仿真城市,并于2015年对
外开放。仿真城市位于密歇根大学校园的边缘,包括4英里(约6.44千米)的道路,涉及13个不同
的路口。密歇根州交通部门和13家参与开发自动
化驾驶技术的公司提供了资助。
这个城市被用于创建自动驾驶系统一直以来
难以处理的情况,例如驾驶员和行人之间微妙的
相互作用,不寻常的路面、隧道和树冠,它们都
有可能混淆传感器并遮挡GPS信号。从复杂的交
叉路口、混乱的车道标线到繁忙的施工队伍,都
将被用来衡量最新的汽车传感器和驾驶算法的能
力;行人甚至会从停放的车辆之间跳入道路,来测
试车载安全系统是否会出错。
另一项已经在安娜堡仿真城市进行测试的技
术是车对车通信(V2V)。在由密歇根大学完成
的政府资助项目中,数千辆配备信号传送器的车
辆向其他车辆和城市基础设施广播位置、行驶方
向、速度和其他信息。试验表明,通过提前预警
可能发生的碰撞,车对车和车对基础设施的通信
可以用来防止许多常见的事故。
第四,安全。通过软件控制的汽车可能成为远程操控犯罪
的目标。2010年2月,得克萨斯州数十辆汽车突
然拒绝启动,莫名其妙地开始响起喇叭。这些汽
车属于一家租赁公司,公司在车上安装了跟踪设
备,如果驾驶员没能付款,软件可以停用这辆
车,付款后则可恢复。结果,一个不满该公司的
前雇员访问了该公司的后台系统,使用这个小工
具造成了严重破坏。2013年,在拉斯维加斯的
DEF CON大会(世界黑客大会)上,两名计算机
安全专家Charlie Miller和Chris Valasek表示,他们
劫持了一辆2010年款丰田普锐斯的内部网络,并
远程控制了关键功能,包括转向和制动。
第五,最大的困难还是计算。
仅列举惯性导航系统一例,它通过监测车辆
自身的运动提供精确的定位信息,并将结果数据
与差分全球定位系统和高度精确的数字地图相结
合。很多原型车严重依赖数字地图,而卖给消费
者的汽车如果依赖于一张先前绘制好、非常准确
的地图,那么它必须能有足够的容错率。这些都需要更强大的计算能力。
所幸,另一项科技的进步给汽车计算能力的
提升带来了希望。人工智能给无人驾驶踩下油门
20世纪70年代末,汽车制造商已经使用集成
电路来监测和控制基本的发动机功能;20世纪80
年代,汽车发动机控制的计算机化随着关于燃料
效率和排放规定的实施而加快。1982年,部分车
型的内置计算机全面控制了自动变速器。
到2015年,汽车制造商可以通过无线链路远
程诊断车辆问题,并且可以将硬件设备插入汽车
的诊断端口,以通过智能手机应用程序识别引擎
问题或追踪驾驶习惯。一辆新车里会有50~100
台计算机,运行着数百万行代码。
随着无人驾驶汽车商业化需求的爆发,市场
开始研究人工智能与汽车业能碰出什么火花。在
人工智能领域先行一步的芯片制造商英伟达首先
意识到,在汽车智能化的进程中,芯片能扮演重
要角色。按公司高级主管丹尼·夏皮罗(DannyShapiro)的说法:“现在我们正在讨论是否需要
在汽车上进行超级计算。”
2015年2月,年度“全球50大最聪明公司”之
一的英伟达宣布推出2款新产品,旨在为汽车提
供更多的计算能力。一个能够同时在3个不同的
车载显示器渲染并呈现3D图案;另一个可以收集
和处理汽车周围多达12个摄像头的数据,并且具
有可以帮助防撞系统甚至自动驾驶系统识别某些
道路障碍的机器学习软件。这两个系统意味着先
进的汽车传感器和计算机系统为软件制造商提供
的巨大机会。
如果要问谁可以好好利用车轮上的巨型计算
机,非斯坦福大学动力设计实验室的机械工程教
授Chris Gerdes莫属。在Chris Gerdes的实验室
里,学生们正在持续进行着多个项目:一辆轻型
太阳能车;一辆装满了传感器的福特Fusion和一
辆类似沙地车的手动挡双人车。那辆“沙地车”将
可编程性提升到极致。几乎每个部件都由连接到
计算机的作动器控制。这意味着软件可以配置每个车轮的行为方式,使普通的路面感觉像被冰覆
盖一样。或者,使用安装在汽车前部的传感器的
数据,经过配置,让新手驾驶者像赛车司机一样
做出反应。整辆车的概念就是探索计算机如何使
驾驶更安全、更高效,而不必完全脱离驾驶员的
控制。
在硅谷,竞争性合作在汽车制造商和互联网
高科技公司之间贴身展开。苹果和谷歌这样的公
司正在通过为汽车提供更好的智能手机型接口而
介入车辆的操作系统。它们成功利用了一个统计
事实:根据非营利组织美国国家安全委员会的研
究,超过25%的道路交通事故是因司机玩手机导
致的。
大多数汽车制造商支持苹果公司的Car Play
软件以及谷歌的同类竞品Android Auto。现代汽
车在2015年夏天上市的新款索纳塔将是第一个支
持Car Play的车型。Android Auto展示了更多的可
能性。当驾驶者将Nexus智能手机插入车内,触
控屏即被Google Now接管,Google Now打通了其他谷歌公司的服务,可以根据你的位置、搜索记
录和Gmail邮件信息提供建议。值得注意的是,Android Auto界面底部已有一枚按钮可用于展示
车辆未来可能具有的诊断功能。谷歌希望汽车制
造商先开发出能够进一步显示车辆运行数据的应
用程序。如果Android Auto知道你的引擎过热,Google Now可能会为你规划线路,找到附近的机
修工。
现在,Car Play和Android Auto服务只能读取
基本的车辆数据,例如汽车是在行驶、停着还是
在倒车。这不是人工智能的用武之地。谷歌和苹
果的意图是通过Car Play和Android Auto渗透到汽
车的人机交互界面,深入控制汽车系统的车载计
算机,进而重新设计转向或防撞这样的功能,最
后为汽车全盘设计操作系统。那时,汽车制造商
改称为“汽车零部件和内饰的总承包商”可能更为
合适。
在人工智能迅速崛起的2015年,谷歌的无人
驾驶原型车已经上路,其结合了先进的传感器、地图数据、智能导航和控制软件。苹果公司也刚
雇佣了数十名具有汽车设计、工程和战略技能的
人士。汽车制造商会拱手让出汽车大脑的控制权
吗?
在互联网科技公司和汽车制造商之间,还存
在一个特立独行的另类。2015年,排在“全球50
大最聪明公司”榜单第1位的特斯拉正以软件创新
的形式接管汽车。虽然在互联网和汽车制造这两
方面都没有光荣传统,但特斯拉却拥有自己品牌
的汽车可供尽情编程。
总部位于帕罗奥图的特斯拉汽车公司打造了
世界上堪称最计算机化的消费级汽车。2012年发
布的电动轿车Model S拥有17英寸(约 2.54 厘
米)触摸屏显示器、3G手机连接甚至Web浏览
器。触摸屏显示娱乐应用程序、显示附近充电站
的地图以及有关汽车电池的详细信息,也可以用
它进行各种车辆设置,包括停止和加速模式(根
据型号有多种选择,从“正常”到“运动”或从“运
动”到“疯狂”)。每隔几个月,特斯拉的车主就会收到一个更
新的软件,为他们的车辆增加新的功能。自从
Model S发布以来,已经更新了更详细的地图、更好的加速度设置、防止溜车的坡启模式,以及
盲点警告(如果汽车配有相应的传感器)。
这些软件更新可以做的不仅仅是添加新的提
示音。2013年年底,特斯拉面临安全恐慌,数辆
Model S在驶过碎石路后电池组遭到破坏,引发
火灾。特斯拉工程师认为火灾是罕见的事件,通
过简单的补救就能修正,但这意味着路上的每一
辆Model S的悬挂系统都需要升级。特斯拉没有
像传统汽车制造商那样要求车主将车带到修车
点,而是发布了调整悬挂系统的软件补丁,让车
辆在更高的速度下也能保持悬挂的高度,从而大
大减少了事故发生的概率。
特斯拉证明了可编程程度与汽车的市场价值
很可能成正比。虽有很多质疑,但特斯拉的首席
执行官埃隆·马斯克并不介意。作为一家创始人还
健在的新兴公司,特斯拉不需要花太多成本克服保守势力。相比之下,传统汽车厂商需要同内部
的传统派达成一致,因而困难大得多。
福特于2015年1月开设了一个研究实验室。
该实验室位于谷歌办公室以北,相距大约10分钟
的车程,在Skype的隔壁,靠近惠普的大门。这
个实验室正在开发一种新的驾驶者界面Sync 3。
除了运行Spotify和Pandora Radio等应用程序,Sync 3还可以连接到家庭Wi-Fi网络,以接收bug
修复和更新。
福特显然希望司机更倾向于使用自己的系
统,而不是CarPlay或Android Auto。不过,福特
在这方面的创新记录并不愉快。其第一个触摸屏
界面MyFord Touch在2010年推出的时候,频繁出
现故障,客户抱怨它过于复杂。当福特在2011年
《消费者报告》的年度可靠性评级中从第10位下
降到第20位时,报道认为MyFord Touch是其排名
下降的关键原因。该公司最终发放了超过25万个
包含软件修复程序的内存卡,供用户将更新上传
到汽车。汽车业正处在巨变的前夜,曾经声名赫赫的
汽车制造商需要和高科技公司甚至芯片商争夺打
开未来之门的钥匙。更可怕的是,个人汽车市场
数量庞大而分散的车 ......
您现在查看是摘要介绍页, 详见PDF附件(2625KB,783页)。





