当前位置: 首页 > 新闻 > 信息荟萃
编号:2971
一本书读懂人工智能图解.pdf
http://www.100md.com 2020年2月13日
第1页
第4页
第18页
第23页
第49页
第143页

    参见附件(5869KB,153页)。

     一本书读懂人工智能,人工智能在最近几年开始越来越火了,这大大的方便了人们的居家生活等,那到底什么是人工智能,这本书带你走进了解。

    内容提要

    阿尔法狗与李世石的人机“世纪大战”让人工智能又一次成为了人们关注的焦点。到底什么是人工智能?人工智能的发展历程如何?人工智能将怎样改变我们的生活?本书将带你找到这些问题的答案。

    本书共分为7章,第1章简要介绍了我们生活中常见的人工智能与相关知识,第2章至第5章分别详细介绍了人工智能发展历程中的1.0至4.0四个时代,第6章阐述了人工智能对人类社会的影响,第7章展望了人工智能与人类的未来生活。

    本书适合对人工智能有兴趣,希望了解人工智能的读者阅读。

    作者信息

    李连德

    2009年毕业于东北大学,并获得博士学位。辽宁省普通高等学校自动化类专业教学指导委员会委员,现任沈阳城市学院机电工程学院院长,主要研究领域为嵌入式系统及智能控制系统,曾主持并参与多项企业工程项目。近年来主持并参与了三项省级教学改革项目,一项省级科学研究项目;指导多个国家和省级大学生创新创业项目;多次指导学生参加ACM大赛,并获得奖项。在核心刊物上发表了多篇学术论文,出版了教材和实验指导手册。

    主目录

    第1章 人工智能:藏于冰山下的万亿级巨大市场

    第2章 人工智能1.0时代:图灵的计算王国

    第3章 人工智能2.0时代:知识,让计算机更聪明

    第4章人工智能3.0时代:悄然兴起的“机器学习”

    第5章 人工智能4.0时代:“深度学习”打破沉寂

    第6章 正在展开的未来:人工智能对人类社会的影响

    第7章 信息奇点:让人类永生,还是做人类的主人

    到底什么是人工智能

    人工智能(Artificial Intelligence)简称AI,从科学的角度来说,人工智能是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术应用系统的一门科学。这门学科的研究范围包括语言识别、图像识别、专家系统和我们最熟悉的机器人等。

    一本书读懂人工智能截图

    一本书读懂人工智能(图解版)

    李连德 著

    人民邮电出版社

    北京

    更多电子书资料请搜索「雅书」:http:www.yabook.org图书在版编目(CIP)数据

    一本书读懂人工智能:图解版李连德著.--北京:人民邮电出版社,2016.7

    ISBN 978-7-115-42403-7

    Ⅰ.①一… Ⅱ.①李… Ⅲ.①人工智能一图解 Ⅳ.①TP18-64

    中国版本图书馆CIP数据核字(2016)第095842号

    ◆著 李连德

    责任编辑 庞卫军

    执行编辑 唐可人

    责任印制 焦志炜?

    ◆人民邮电出版社出版发行 北京市丰台区成寿寺路11号

    邮编 100164 电子邮件 315@ptpress.com.cn

    网址 http:www.ptpress.com.cn

    ◆开本:700×1000 116

    印张:12.5 2016年7月第1版?

    字数:120千字 2016年7月北京第1次印刷?

    定价:35.00元

    读者服务热线:(010)81055488 印装质量热线:(010)81055316

    反盗版热线:(010)81055315

    广告经营许可证:京东工商广字第8052号目 录

    封面

    扉页

    内容提要

    前言

    第1章 人工智能:藏于冰山下的万亿级巨大市场

    1.1 世纪大战:阿尔法狗VS李世石

    1.2 到底什么是人工智能

    1.3 汽车会改变,机器人也会改变

    1.4 超高速运算的威力

    1.5 谷歌狂想:创造真正的人工智能

    1.6 百度的先见之明

    第2章 人工智能1.0时代:图灵的计算王国

    2.1 人工智能之父:阿兰·图灵

    2.2 推理与搜索的年代

    2.3 “人工智能”术语的起源

    2.4 用搜索树探寻迷宫

    2.5 机器人行动过程规划

    第3章 人工智能2.0时代:知识,让计算机更聪明

    3.1 人机对话

    3.2 堪比专家的专家系统

    3.3 本体研究:如何正确描述知识

    3.4 重量级本体论与轻量级本体论

    3.5 机器翻译难在何处

    3.6 生不逢时的第五代计算机

    3.7 第二次人工智能浪潮消退

    第4章 人工智能3.0时代:悄然兴起的“机器学习”

    4.1 数据激增与机器学习的兴起

    4.2 学习即区分

    4.3 有监督学习与无监督学习

    4.4 各式各样的分类方法

    4.5 用人工神经网络识别手写文字

    4.6 机器学习的难点

    第5章 人工智能4.0时代:“深度学习”打破沉寂

    5.1 深度学习开创新时代

    5.2 自动编码器:输入与输出相同

    5.3 多层架构深度挖掘

    5.4 情绪识别里的“深度学习”

    5.5 鲁棒性:飞跃发展的关键

    第6章 正在展开的未来:人工智能对人类社会的影响

    6.1 人工智能对人类社会的影响

    6.2 将要消失的职业与被保留的职业

    更多电子书资料请搜索「雅书」:http:www.yabook.org6.3 人工智能催生新业务

    6.4 人工智能与军事

    6.5 “知识转移”改变产业结构

    6.6 人工智能垄断阴云

    6.7 濒临失业的人们

    第7章 信息奇点:让人类永生,还是做人类的主人

    7.1 信息奇点:超人类智能时代

    7.2 人工智能的摩尔定律

    7.3 人类永生:半人半机器人

    7.4 三体世界中的人工智能

    7.5 假如人工智能妄想征服人类

    7.6 人工智能须造福大众内容提要

    阿尔法狗与李世石的人机“世纪大战”让人工智能又一次成为了人们关注的焦点。到底

    什么是人工智能?人工智能的发展历程如何?人工智能将怎样改变我们的生活?本书将带

    你找到这些问题的答案。

    本书共分为7章,第1章简要介绍了我们生活中常见的人工智能与相关知识,第2章至

    第5章分别详细介绍了人工智能发展历程中的1.0至4.0四个时代,第6章阐述了人工智能对

    人类社会的影响,第7章展望了人工智能与人类的未来生活。

    本书适合对人工智能有兴趣,希望了解人工智能的读者阅读。

    更多电子书资料请搜索「雅书」:http:www.yabook.org前言

    智能家居、手机助手、人机“世纪大战”……人工智能再也不是好莱坞科幻片里满足观

    众感官的主题,很久以前被人们认为是技术狂们不切实际的“幻想”正在一点点成为现实。

    创造出能够像我们人类一样思考的人工智能,已经成为了全世界都在研究的课题。

    人工智能是一门非常复杂、庞大的科学,其中的机器学习、深度学习等细分学科是当

    下的研究热点。从1956年至今,无数科学家历经艰辛与坎坷,终于让人工智能迈出了属于

    全人类的一大步。人工智能在数据挖掘、计算机视觉、专家系统等方面的突破性进展不但

    为企业带来了良好的经济效益,也为大众带来了更加舒适、便捷的生活。

    不知不觉中,我们已经进入人工智能时代,人工智能已经无处不在。但是我们对人工

    智能又了解多少呢?到底什么是人工智能?人工智能源于何时?人工智能的发展过程中经

    历了怎样的艰辛?当人工智能拥有人类思维之时,我们的世界又会变成什么样?对于普通

    人来说,任何一个问题回答起来都不是那么容易,但是这些问题确实与我们的生活息息相

    关。

    在中国,人们对于真正的人工智能知之甚少,然而人工智能已经渗透到了我们生活的

    方方面面,给我们的生活带来了很多便利和好处。我创作这本书就是为了能够让老百姓了

    解这些,让看起来很“高大上”的人工智能更加“接地气”。

    本书以时间为主线,讲述了人工智能的发展历程,书中内容尽量避免涉及晦涩难懂的

    专业知识,只有简单朴实的科普内容。

    在第1章中,我们通过最新时事,为读者们概述了人工智能的相关知识。在第2章至第

    5章里,我们将人工智能的整个发展过程分别分成了从1.0到4.0的四个时代,每个时代都有

    着关于人工智能发展的里程碑式的事件,为读者全面解读了人工智能到底是什么,究竟是

    如何发展到今天的。第6章通过大量的案例为读者们讲述了人工智能到底怎样影响着我们

    的生活,让读者们了解到人工智能其实离我们并不远。本书的最后一章大胆畅想了人工智

    能会变成什么样子,而我们人类又将面对怎样的未来生活。

    为了能使读者拥有更好的阅读体验,书中含有大量的图片,这些图片可以帮助读者更

    好地理解什么是人工智能。读者利用休息时间或工作的间隙就能轻松了解人工智能,相信

    从你开始读这本书就会喜欢上它。

    在本书的编写过程中,作者得到了张雪松、李雪、马凯旋、孙兆奇、杨爱瑞、杨伟

    云、赵蕊、孟凡齐、崔基哲、薛梅、李金艳、张春梅、刘星、王春梅、潘玉芳等人的支持

    与帮助,在此向他们深表谢意。第1章 人工智能:藏于冰山下的万亿级巨大市场

    人工智能技术的发展,不仅改变了人们的日常生活,同时也改造着生产和管理模式,它已渗入现代社会的方方面面。随着大数据、云计算、移动互联网等新一代信息技术与机

    器人技术相互融合步伐的加快,“人工智能革命”将开启价值数万亿美元的市场,先进性的

    较量暗潮汹涌。

    更多电子书资料请搜索「雅书」:http:www.yabook.org1.1 世纪大战:阿尔法狗VS李世石

    2016年3月15日,两件大事刷爆了微信朋友圈和新浪微博:第一件事是“3·15晚会”又

    曝光了一批违法企业和厂商,第二件事则是阿尔法狗以4:1完胜李世石。

    有些人可能还不太了解,阿尔法狗并不是一只狗,而是人们对谷歌发明的一款围棋人

    工智能的音译,它的英文名是AlphaGo,但是经过网友们的不断“翻译”,AlphaGo最终变

    成了一条让人感到亲切的狗。那么,与这条狗对战的李世石又是何方神圣?

    李世石,1983年3月2日生于韩国全罗南道,1995年入段,1998年二段,1999年三段,2003年因获LG杯冠军直接升为六段,2003年4月因获得韩国最大棋战KT杯亚军而升为七

    段,2003年7月获第16届富士通杯冠军后直接升为九段。2002年至2012年,共获得14个世

    界级围棋比赛冠军。

    2016年3月9日,这场人机“世纪大战”在韩国四季酒店拉开序幕,在第一场比赛中,手

    握14个冠军头衔的李世石败北。网友纷纷惊呼:难道人类智慧的堡垒就这样轻易被人工智

    能攻克了吗?

    2016年3月10日,对于第一场比赛结果明显不服的李世石再度与阿尔法狗交手。在这

    场比赛中,李世石显然收起了之前的轻视,认真迎战,但是仍然在211手的时候输给了人

    工智能。3月12日,阿尔法狗以3:0的成绩完胜李世石,举世哗然。比赛总共五场,李世石

    已经输掉了比赛,接下来的两场比赛是李世石或者是人类智慧捍卫荣誉之战争。

    2016年3月14日,李世石在局面不利的情况下弈出石破天惊的一招,阿尔法狗受惊不

    小直接“短路”,人类智慧依靠“神之一手”战胜了人工智能。不过,令人遗憾的是,胜利并

    没有持续下去。3月15日的终极一战,李世石再度因为大局观不足输给了阿尔法狗,这一

    历史性的时刻被总比分牌上的4∶1锁定(见图1-1)。

    图1-1 李世石与AlphaGo对战

    人机“世纪大战”以人类落败的结局落下帷幕,相比赛前李世石豪言AlphaGo不过是初

    级棋手的“嚣张”,赛后的李世石显得有些“落魄”。人们可能不禁会问,AlphaGo究竟是什

    么,能把一个世界冠军逼成这样?根据AlphaGo“生父”DeepMind的团队描述,AlphaGo已经不再是一台传统意义上的围

    棋机器,而是一种能够自我学习、更新的围棋人工智能。DeepMind的团队之所以选择围

    棋,正是因为围棋运算十分复杂,用他们自己的话说就是,围棋的“分支因子”无穷无尽,走法堪比全宇宙的原子数量。

    传统的计算机程序在下围棋时往往会优先选择最“暴力”的计算方法,根据数学和逻辑

    推理的方法,将每一种可以形成的路径都模拟一遍后,从中选择出最优的走法。比如,1997年赢了世界国际象棋冠军的“深蓝”便是这种计算机(见图1-2)。但是对于围棋来

    说,这种推演方式绝对可以让计算机崩溃,因为围棋棋盘有361个点,可能的走法有太多

    种,普林斯顿的研究人员对围棋盘19×19的方格进行所有可能性的推演,最终推演出了一

    个171位数的结果。请注意,是171位数,这个数据比现已查明的宇宙中的原子数量还要

    多。运算量如此巨大的推演就连巨型数据处理器都要运算许多年才能计算完成。

    除此之外,围棋中的每一颗棋子大小形状都相同,这又增添了许多“随机”因素,逻辑

    推理貌似并不那么管用,所以围棋一直被认为是人工智能领域难以攻克的堡垒之一。

    图1-2 “深蓝”计算机

    比赛之前,李世石之所以放出豪言并不是没有道理。在AlphaGo出现之前,计算机的

    围棋水平确实还只停留在业余水平。但是, AlphaGo的出现打破了这种局面。当下,人们

    正在享受人机“世纪大战”带来的科技盛宴。其实,这场比赛哪怕人工智能只赢一场,也将

    成为科技界的“登月事件”,因为AlphaGo的这种自我强化学习技术,将不仅仅用于围棋。

    而在人机“世纪大战”以人类智慧败北的结局告终之后,全世界网友依旧发出“这不是人工

    智能战胜了人类智慧,而是人类智慧控制了人工智能”以及“人工智能只是战胜了李世石,并没有战胜全人类”的声音,也从侧面反映出人类对人工智能依旧抱有乐观、接受的态

    更多电子书资料请搜索「雅书」:http:www.yabook.org度。

    随着科技的不断发展,人工智能势必不会只应用在围棋上。虽然比赛已经有了结果,但是李世石与AlphaGo的大战将成为人工智能发展史上不可抹去的一笔。1.2 到底什么是人工智能

    早在2004年,好莱坞大片《我,机器人》的上映就已经让人们体会到了人工智能的强

    大。到了2016年,阿尔法狗与李世石的人机“世纪大战”再一次将人工智能推向了各大媒体

    的头条位置。在百度上搜索“人工智能”,得到的相关链接有近7000万条,人工智能已经从

    只有科学家才会讨论的话题,变成了大街小巷饭后的谈资。那么,人工智能究竟是什么

    呢?

    人工智能(Artificial Intelligence)简称AI,从科学的角度来说,人工智能是研究、开

    发用于模拟、延伸和扩展人的智能的理论、方法、技术应用系统的一门科学。这门学科的

    研究范围包括语言识别、图像识别、专家系统和我们最熟悉的机器人等(见图1-3)。

    图1-3 电影《我,机器人》中的人工智能机器人

    人工智能是一种对人的意识、思维的模拟,虽然它不是人类的智能,但却能像人类那

    样思考甚至超过人类的智能。从字面上,我们可以把人工智能分为“人工”和“智能”两个部

    分,其中“人工”其实并不难理解。在科学界,虽然表达的方式有所不同,但是“人工”的意

    思却相差无几:系统内的个体根据人为的、预先编排好的规则或计划好的方向运作,以实

    现或完成系统内各个体不能单独实现的功能、性能与结果。简单来说,就是由人工安排好

    了一切。虽然“人工”好解释,但是“智能”这个问题却激起了无数科学家激烈的辩论,什么

    是智能?有没有超越人类的智能存在?由于我们对自身智能的理解也非常有限,因此就非

    常难定义什么是人工制造的“智能”。所以,通常认为:人工智能除了研究人类本身的智

    更多电子书资料请搜索「雅书」:http:www.yabook.org能,也研究其他人造系统或者动物的智能(见图1-4)。

    图1-4 FESTO机器袋鼠

    很多人工智能的专家都希望能够对“人工智能”这一概念做出构建性的阐释,但是以目

    前的技术水平还很难做到这一点。我们并不是科学家,也没有超越现代技术的智慧,因此

    不如暂且用一种坊间的说法来理解人工智能:“人工智能就是看起来好像拥有自己的思

    维。”比如内置人工智能的洗衣机,我们将衣物放进洗衣机内,洗衣机就能“自主”判断出

    应该加多少水、加多少洗衣液、洗多久等,而我们只需要坐着看会电视,等着衣服洗好就

    可以了。

    虽然我们暂时没有办法对整个“智能”做出系统性的阐述,但是我们却可以在已知的范

    围内对“智能”进行概括。在已知的人工智能技术领域,人们普遍认为人工智能可以被分为

    五个等级(见图1-5)。图1-5 人工智能的五个等级

    1.无法与人类进行交互的人工智能

    “交互”一词可以简单理解为交流、互动。一些物体或许有自己的思维,但是无法与人

    类进行交互,因此我们也无法窥探它们的思维。比如, 17世纪的“泛灵论”认为石头是具

    有思维的,只是我们无法获知。或许石头之间会每天问候“早上好”,但是我们无法获知。

    所以不能与人类进行交互的智能也就被归类到了最初级的人工智能之中。

    2.可以与人类进行交互的人工智能

    很多家电都有与人类交互的功能,比如上文中提到的人工智能洗衣机。但是,现在所

    谓的“智能家电”内部一般都有控制系统,它们无法自动升级,更不会主动去学习新的技

    能。人们选择按下什么键,这类电器就启动什么功能。这类从“出生”就自带知识库,但是

    到“死”都不会再发生变化的人工智能被归为人工智能的第二等级。

    3.可以通过外接设备进行升级的人工智能

    家用的电子设备,比如手机、个人计算机等都可以被归为人工智能的第三等级。这类

    人工智能可以被动升级,功能会变得越来越强大,场景设置也会越来越多,就像把

    Windows 7升级到Windows 10一样。这类人工智能显然要比第二等级的人工智能高级得

    多。

    4.可以通过云端共享信息的人工智能

    以往的电子设备或者机器人都需要借助人类处理过的信息进行升级,如果没有相关的

    程序支持,就无法升级。进化到第四等级的人工智能突破了这一障碍,这类人工智能可以

    通过互联网云端共享信息。除了机器人,我们最常用到的搜索引擎也属于这一等级的人工

    智能,用户只需要下载一个浏览器就能完成对信息的搜索、处理,第四等级的人工智能也

    是现在离我们生活最近的一种。

    5.能够自主学习、创新的人工智能

    更多电子书资料请搜索「雅书」:http:www.yabook.org我们人类本身其实就可以被看成是人工智能的圆满境界。人工智能最高等级与其他四

    个等级最大的不同就是能够自主学习、创新。比如,人类发现了万有引力,发现了元素周

    期表,正是这种不断创新、创造并识别创新、创造的能力,让人类占据了地球生态环境下

    智力的制高点。所以,人工智能的最高级别可以总结为:能够与人类交互信息,可以通过

    各种信息载体甚至在云端中搜集信息,并且可以创新、创造,形成新的知识的人工智能。

    以目前的技术来看,要想达到人工智能的圆满境界还需要一定的时间,但这并不影响

    我们对未来充满人工智能的生活的想象。也许未来10年或者20年之后,我们的生活就会变

    得像好莱坞科幻片一样处处都是高科技元素。也许某一天早上,你只要轻轻对手机说句

    话,就会有一个人工智能机器人来敲你的门并询问:“您好,早餐还是老样子吗?”1.3 汽车会改变,机器人也会改变

    18世纪,蒸汽机的出现推动了一次工业革命。1769年,法国人N.J.居纽利用蒸汽机制

    造出了世界上第一辆三轮汽车。116年后,也就是1885年,德国人卡尔·本茨通过对柴油机

    的进一步加工,制造出了世界上第一辆真正意义上的燃油汽车。之后又经过近20年的时

    间,汽车不断更新换代,直到1903年亨利·福特建立了福特汽车厂,汽车开始批量生产,逐步成为人们日常生活中最重要的是交通工具之一(见图1-6)。

    图1-6 福特T型汽车

    虽然早期汽车的发动机已经十分先进,并且能够进行批量生产,但是其外形却单调、呆板,多以棱角分明的多边形为主。虽然说德国人发明了汽车,不过却是美国人将整个汽

    车行业带进了艺术圣殿。1938年,通用汽车的哈利厄尔设计出了世界上第一款概念车——

    别克Y job(见图1-7)。复杂的曲造构建使别克Y job的车身流线感更强。自此之后的几十

    年里,这种流线设计都是各大汽车厂商竞相模仿的对象。值得一提的是,Y job还第一次

    引入了黏土模型技术。直到今天,虽然3D技术已经高度发展,但是一部分设计师还是会

    采用黏土模型技术。

    更多电子书资料请搜索「雅书」:http:www.yabook.org图1-7 别克Y job

    随着汽车的不断发展,人们逐渐从改变汽车的单一性能转变为改变汽车的整体性能。

    20世纪80年代以后,汽车也逐渐步入电子化、智能化,不断更新的电子技术开始取代原本

    单纯的机电液操纵控制等简单技术,汽车的安全性、排放量发生了质的飞跃。20世纪90年

    代以后,汽车引入了智能化自动控制系统,车载音响、视频数字多媒体娱乐系统等技术的

    出现大幅度提高了驾乘者的舒适度,汽车也成为了人们日常生活中的不可分割的一部分。

    汽车从一种简单的代步工具,发展成了纯电动力车、互联网汽车,甚至就连乐视这样

    的视频行业巨头也要跨行做汽车。种种现象让我们不得不承认科技真的能改变世界,而能

    够让汽车发生如此巨大改变的就是智能的不断升级。在这种变革中,除了汽车其实还有另

    外一种事物也在悄然进化,那就是机器人。

    机器人最早出现时是为了满足工业生产需求,而最早应用机器人的行业就是上面所说

    的汽车制造业。1954年,乔治·德沃尔发明了世界第一台可编程机器人“尤尼梅特”,这台

    机器人曾为通用汽车立下了汗马功劳。直到1993年,一台名为“但丁”的机器人对南极洲的

    埃里伯斯火山进行了探索,彻底撕下了机器人身上“工业专属”的标签。“但丁”的出现,不

    但让机器人承担了代替人类探索危险区域的新使命,也为后来的太空探索奠定了基础(见

    图1-8)。图1-8 八脚机器人“但丁”

    2000年,本田汽车制造的人形机器人再次刷新了人们对机器人的认知。这台名叫“阿

    西莫”的机器人身高1.3米,能够以类似人的姿势走路和奔跑(见图1-9)。

    图1-9 机器人“阿西莫”

    2014年,一条重磅新闻袭来——谷歌研发出无人驾驶汽车原型。这条新闻又一次刷新

    了人们的认知,同时也让人们怀疑自己是不是提前进入到了未来世界中。以往只能在好莱

    坞科幻片中见到的无人驾驶汽车居然真的成为了现实(见图1-10)!

    更多电子书资料请搜索「雅书」:http:www.yabook.org图1-10 谷歌研制的无人驾驶汽车原型

    虽然我们称之为无人驾驶汽车,但是从专业角度来说,它应该称作轮式移动机器人。

    无人驾驶汽车的出现也再一次将机器人与人们的日常生活紧密地联系在了一起。到了2016

    年,世界上最先进的无人驾驶汽车已经连续行驶了15万公里,其中8万公里是在完全没有

    人为干预的情况下完成的。

    不管是机器人还是汽车,随着科学技术的不断发展,都在悄然改变,而它们改变的方

    向就是给人们提供更加便捷、舒适的体验。前文中提到的乐视也在致力打造一部拥有乐视

    生态系统的无人驾驶汽车。从这一点来看,机器人已经不再是一种工业工具。未来,机器

    人的发展趋势会变得和汽车一样,从一种单一的工具变成能够给人们带来更加舒适体验的

    必不可少的“伴侣”。或许正如无人驾驶汽车生产商说的:“相比无人驾驶汽车来说,人类

    才是最不可靠的。”1.4 超高速运算的威力

    互联网已经成为了人们获取知识的宝库,我们用各种各样的搜索引擎来找自己想要的

    东西,查天气、看新闻、找答案……甚至我们明知道网址,也会在搜索引擎上输入网站的

    中文名称来搜索。虽然我们几乎每天都在接触这个宝库,但是我们其实并不了解这个宝库

    真正意味着什么。

    如今,互联网上的搜索引擎其实也属于人工智能,因为它依托的就是一种名为“机器

    学习”(Machine Learning,ML)的人工智能技术。这种技术专门用于研究计算机应该怎

    样模拟人类的学习行为,以便能够自主获取更多的知识或者能力,通过不断重新组织自己

    的结构来让自己变得更为完善,拥有更高的性能。

    比如我们经常用到的搜索引擎,就是通过用户输入的某一个或者多个关键词来搜寻相

    关信息。当这些词被计算机识别后,计算机就可以通过“机器学习”这种技术来对照网页的

    内容,筛选出用户所需的信息。与此同时,计算机还可以通过自主学习后将一些有害的内

    容,或者一些小弹窗等关联性十分低的内容剔除。

    也许很多人会有一个疑问:从输入关键词到显示相关信息,往往只有几秒钟的时间,拿百度来说,如果我们在信息搜索栏里输入“学习”两个字,短短一秒之内就能够检索出1

    亿条信息,并且还能显示相关网站信息,这么大的数据量如何在这么短时间内处理完呢?

    其中的玄机其实就是“机器学习”以及超高速运算(见图1-11)。

    图1-11 百度搜索引擎

    经常使用邮箱的人都知道,一般邮箱中都有自动检索垃圾邮件的功能(见图1-12),被认定为垃圾邮件的信息通常不会显示到收件箱中,这就是典型的“机器学习”。通过对大

    量邮箱数据的分析和学习,人工智能具备了将垃圾邮件另行分类的能力。同样的道理,在

    众多新闻信息中,通过“机器学习”技术,人工智能可以通过之前的学习内容以及分类方

    更多电子书资料请搜索「雅书」:http:www.yabook.org法,在极短的时间内将数量极其庞大的新闻信息分类、归纳,最终引导用户找到合适的信

    息。

    图1-12 新浪邮箱垃圾邮件拦截功能

    “机器学习”技术可以解释为什么人工智能可以在大量的信息中筛选出有用的信息,那

    么,又是什么支撑着它在极短的时间里将这部分信息检索出来呢?人工智能之所以能够快

    速完成检索是因为它具有超强的高速运算能力,这种高速达到了什么样的地步呢?

    我们再来举个例子。随着技术的发展,人工智能已经涉及人类生活的各个方面。一种

    名为AD Technology的技术迅速横扫整个广告业。每一位广告主都希望自己的广告内容可

    以放在网络上上排名第12位。闻名世界的达特茅斯会议便是在这里举行的(见图2-

    6)。

    图2-6 达特茅斯学院外景图

    提到人工智能,稍对其有所研究的人不会不知道1956年的达特茅斯会议,因为正是这

    场会议提出了“人工智能”的概念。

    1955年的时候,在洛杉矶召开的美国西部计算机联合大会有这样一个小插曲。在会议

    上塞弗里奇发表了一篇关于模式识别的文章,而纽厄尔则对计算机下棋的事情发表了自己

    的观点。两个人发完言后,当时正在研究神经网络的皮茨主持会议时将这个过程总结为:

    一个企图模拟神经系统,另一个企图模拟心智,方向不同但是殊途同归。这两位发言者也

    是达特茅斯会议中极其重要的两个人物。

    相比于图灵等人,塞弗里奇在人工智能的历史中并没有多大的名头,但他也是人工智

    能科学的先驱。他是模式识别的奠基人,也是第一个写出可以工作的人工智能程序的人。

    后来塞弗里奇又到麻省理工学院参与并领导了MAC项目,这个项目就是现在著名的MIT

    CSAIL,其中文名称是“麻省理工学院计算科学与人工智能实验室”。利用3D打印制造人工

    心脏的技术就是这个实验室研发出来的(见图2-7)。

    更多电子书资料请搜索「雅书」:http:www.yabook.org图2-7 3D打印心脏

    相比塞弗里奇,纽厄尔(见图2-8)的名气要大的多。1951年,在普林斯顿大学研究

    生院攻读数学的纽厄尔辍学到RAND公司工作。在这里,他对“人如何思维”这个问题产生

    了极大的兴趣。随后,他与卡内基·梅隆大学的希尔伯特·西蒙(见图2-9)建立起了合作关

    系,两人合作提出了“中间结局分析法”。这种方法能够大幅度缩小差异并最终达到目标,他们根据这种方法成功开发出了“逻辑理论家”和“通用问题求解器”。这两款设计衍生出了

    表处理语言IPL,它是所有表处理语言的始祖。

    图2-8 艾伦·纽厄尔图2-9 希尔伯特·西蒙

    除了塞弗里奇、纽厄尔和西蒙外,参加达特茅斯会议的还有发起者约翰·麦卡锡(见

    图2-10),致力神经网络研究的麦卡洛克,以及英国的控制论代表人物阿什比等人。会议

    开始时,参与会议的各界重量级人物对“人工智能”一词并没有取得共识,很多人都认为一

    旦加上“人工”两个字,这门科学就变味儿了。其中,纽厄尔和西蒙主张用“复杂信息处

    理”这个词。因为从某种意义上说,他们两个人更注重这种技术的功能性。而发起会议的

    麦卡锡则认为应该使用“人工智能”这个词。

    图2-10 年轻时的约翰·麦卡锡

    除了确定“人工智能”这个词之外,与会的科技界“大腕”们还将自己的研究成果拿出来

    分享、讨论。但是,这次会议最主要的成果还是确定下“人工智能”这个概念。虽然只是简

    简单单的一个术语,但是其中包含了用机器人承载人类思维的设想。

    达特茅斯会议结束之后的第一个月,也就是1956年9月,IRE(电气和电子工程师协

    会)在麻省理工学院召开了信息论年会,在这次会议上,参与达特茅斯会议的“大腕”们再

    一次将自己的著作拿出来分享。直到这时,这些理论才开始真正震惊世人。除了“逻辑理

    更多电子书资料请搜索「雅书」:http:www.yabook.org论家”这样的“作品”外,像《人类记忆和对信息的储存》《语言描述的三种模型》等为后

    世人工智能发展打下基础的著作也被公布出来。从参与者的角度来说,这次会议的重大意

    义甚至超过了达特茅斯会议。

    对于人工智能领域,上面提到的这些会议其实都是具有划时代意义的历史性会议。

    2016年是达特茅斯会议60周年,当人工智能占据了各大媒体头条的时候,很多人也在怀念

    这些会议上奉献出自己智慧的伟人。2.4 用搜索树探寻迷宫

    1956年的达特茅斯会议定义了人工智能,真正意义上的人工智能浪潮第一次席卷了整

    个世界。当时人们对人工智能的发展前景持非常乐观的态度,甚至有研究者认为在20年

    内,机器就能胜任所有人类可以完成的工作,全世界都在开展关于人工智能的研究。

    达特茅斯会议之后的十几年,可以算是人工智能的黄金时代。人们用推理和搜索这两

    个主要的工具来解决不断出现的难题。从处理方法上看,其实推理和搜索是两种相似的方

    法,因为它们都是将人的思维符号化、机械化,然后试图找到使这些符号能够运作的方

    式。

    早期的人工智能研究者将这种推理和搜索的思维运用到了研发中,这一点与“人工智

    能”一词的含义相辅相成,人工智能更像是人类思维的载体或者表达方式。在前文中我们

    提到过,早期人工智能依赖的是一种“暴力”计算方法。这种“暴力”计算方法奠定了现代人

    工智能系统处理信息的基础,它还有一个更有文艺气息的名字——搜索树。

    搜索树是一种比较抽象的搜索方式,相比于人类思维来说,这种搜索方法并不是一种

    完美的处理信息的方式。但是,对于早期的人工智能科学来说,这种方法却奠定了未来整

    个人工智能科学的基础。

    我们可以拿一幅迷宫图来进行说明。假设我们面前有一幅迷宫图,通常我们会用一根

    笔或者直接用手向着出口的方向移动。当我们发现这条路无法走到出口时,就会回到起点

    或者是交叉口的位置寻找另外一条通向出口的路。如果迷宫图比较简单,那么我们可能一

    眼就能看到出口的位置,并找出合适的路线(见图2-11)。

    图2-11 简单的迷宫图

    在人工智能发展早期,要想让计算机直接具备像人一样的思维显然是不现实的,于是

    更多电子书资料请搜索「雅书」:http:www.yabook.org研究者们退而求其次,将计算机的处理方式变成一种既简单又复杂的方法:将迷宫的每一

    个分叉截点都标上一个记号,例如A、B、C,将这些记号设置为节点(见图2-12)。

    图2-12 字母标记的迷宫图

    当计算机系统从入口位置,也就是S出发后,可以选择通过C或者M两条路。通过M

    后,又可以选择通过D或者是E,到达D后发现不能通过,于是选择E……通过这种方法将

    所有可能的路全部列举出来就能够得到一张路径图(见图2-13)。

    图2-13 搜索树图

    计算机通过不断的搜索和重复,最终判断出“S→C→B→L”是找到出口的正确路径。

    通常来说,越复杂的迷宫,搜索树的分支就越多,扩展的面也就越大。其实,对于我们人

    类来说,这种搜索方式就是情景区分,就如当我们迷路时分析往北面走是什么样的,往南

    面走又是什么样的,等到了北面后根据现有的情形继续分析。这样不停地分析,迟早会找

    到最终的目的地。计算机就是这样不厌其烦地试错,然后根据指示找到正确的目标。

    著名的梵塔问题就可以通过搜索树这种方法来解决。梵塔问题源自印度的一个古老传

    说:相传印度神梵天开天辟地创造这个世界后,在印度北部的神庙中的树立了三根由金刚

    石打造的石棒,并且在第一根棒子上留下了半径由小到大的64个黄金圆片,其中最大的一

    个在最下边,由大到小叠放。随后梵天又告诫庙中的僧侣,将这些黄金圆片全部挪移到另

    外一根石棒上,但是一次只能移动一片,并且不管在什么样的情况下黄金圆片的大小顺序

    不能变,比较小的圆片永远只能在比较大的圆片上面。如果有一天这64个黄金圆片全都挪动到另一根金刚石棒上,那么世界将崩塌、毁灭。

    实际操作起来,这个过程将极为复杂,我们姑且通过三个圆片来进行推演(见图2-

    14)。

    图2-14 3层梵塔问题的解决方案

    从图片中我们可以看到,仅仅是3层的梵塔就需要7次操作才能完成,每多一层塔,操

    作的次数就会以几何级数增加。我们可以回到传说中,如果传说真的属实,完全依靠人力

    来完成64层“梵塔”的堆放,即便是一秒就能搬动一个圆片,夜以继日地不停搬动,最终也

    需要5800亿年才能将梵塔移动完成。而有了搜索树思维的计算机之后,完成这些动作可能

    只需要几秒钟时间。

    不过,早期的人工智能对这种搜索方式也有不同的处理方法,一种方式是通过不断深

    挖来找到目标,也就是在迷宫中一条路走到底,如果这条路走不通的话,就选择另外一条

    路继续走,也就是深度搜索模式;另一种方式是将所有路径分层,将同一层中的所有可能

    性全部试过一遍后再进入到下一层中,这种方式称为分层搜索模式(见图2-15)。

    图2-15 深度搜索与分层搜索的区别

    更多电子书资料请搜索「雅书」:http:www.yabook.org由于深度搜索是深入探索每一条路径,找到目标后就无需继续探索,因此这种方式不

    需要占用太多的储存空间。而分层搜索需要记住每一层的所有路径,因此这种模式需要巨

    大的存储空间。如果计算机遇到的迷宫属于超大型又极其复杂,那么就可能会导致计算机

    的储存容量不够用。在第1章中,我们提到的阿尔法狗如果运用这种模式记录所有的围棋

    路径,先不说需要的储存容量是多少,仅仅是下一步棋就需要很长的处理时间。反之,深

    度搜索只会退回到上一个节点继续寻找目标,如果运气足够好的话,可能只需要在一条路

    径上走到底就能找到出口。但是,如果计算机遇到的不是迷宫问题而是数学推理问题,就

    必须将所有的可能性都列举出来,这时就必须采用分层搜索。所以,不管是哪种搜索方

    式,都有自己的优势和缺点。

    实际上,这两种搜索方式一直被沿用到了今天,如何能够将这两种方式结合起来,依

    然是科学家们需要攻克的难题。2.5 机器人行动过程规划

    虽然搜索树只是计算机解决问题的一种方法,但它的实际意义却不仅仅局限于此。搜

    索树的推演思维,可以看成是一步一步推导出结果。在传统意义的计算机中,搜索树能够

    正确推导出目标位置。而在人工智能领域,搜索树可以制订出机器人的行动计划,这种技

    术在人工智能1.0时代被称为规划。

    人工智能1.0时代中得出的很多结论都仅仅停留在理论阶段,虽然并没有实例的验

    证,但是这些理论却为后来人工智能的发展奠定了基础,早期的机器人就是根据搜索树来

    制定行动规划的。

    如果我们想让机器人去餐厅取一杯已经泡好的茶水,我们就可以对机器人下达这样的

    指令:“去餐厅把茶水拿来。”机器人接收到这样的指令后,会在机体内部进行如下的信息

    处理:

    1.离开机器人所在的位置(前提条件);

    2.如果打开餐厅的门(行动);

    3.门会由关闭状态转变为开着的状态(结果)。

    当这种具有前提条件的行动被完成时,会直接进行下一步处理:

    1.在门开着的状态下(前提条件);

    2.移动到餐厅内(行动);

    3.将由餐厅外的位置变成餐厅内的位置(结果);……

    将这种事先设定好的行动纲领传输给机器人后,机器人就能够按照这些纲领来行动,人类只要将所有具有“前提条件”的“行动”和“结果”事先教授给机器人,那么机器人就能顺

    利地将餐厅内的茶水取出来。对于这个过程,在人工智能1.0时代有一项非常著名的研

    究,这个研究将所有的“前提条件”“行动”和“结果”这三个机器人运作的要素组合在了一

    起,它就是STRIPS。

    虽然以当时的技术还不能将这个研究成果真正运用到机器人身上,只停留在模拟阶

    段,但是这项研究对机器人的发展作出了极大的贡献。在那之后的近20年里,对于机器人

    的研究几乎都借鉴了STRIPS的思想。

    值得一提的是,在研究机器人行动规划的过程中,另一位杰出的科学家——斯坦福大

    学的T.维诺格拉德研发出了一套SHRDLU系统,这个系统中也借鉴了逻辑推理的思想。通

    过之后不断的实验和研发,这套系统成功实现了将理论直接运用到机器人身上的设想。经

    更多电子书资料请搜索「雅书」:http:www.yabook.org过这套系统改造的机器人可以根据人类的指令辨别出一些形状简单的积木,并且能够执行

    一些简单的命令。比如,我们说“将这个三角形积木放到那个长方形积木上”,这个机器人

    就能根据指令完成这些动作。虽然现在看来,这样的技术只能属于“玩具”范畴,但正是这

    种将搜索树与自然语言相结合的产物,掀起了人工智能的第二次发展浪潮,推动人工智能

    科学进入到了2.0时代。第3章 人工智能2.0时代:知识,让计算机更聪明

    人机对话的出现使人工智能从1.0时代跨越到2.0时代。尽管在2.0时代里,人工智能经

    历了野蛮生长,但是“过度繁荣”的背后却未必就是顺利的发展。尽管人工智能已经有了极

    强的理论基础,但是要解决一个又一个的现实问题还是要一步一个脚印地向前走。

    更多电子书资料请搜索「雅书」:http:www.yabook.org3.1 人机对话

    在人工智能1.0时代,人工智能已经能够解决一些诸如迷宫、梵塔问题等所谓的“玩具

    问题”。但是在解决这些问题的同时,人工智能的很多局限性也逐渐显现出来。对人类来

    说,如果人工智能只能解决“玩具问题”,那么它的价值也就不那么大了,因此人工智能研

    究在20世纪70年代一度变得极为萧条、冷寂。到了20世纪80年代,由于一款程序的出现,人类的目光再次被吸引到了人工智能上,人工智能也因此得以卷土重来,这位功臣就是我

    们前文中提到的Eliza。

    在人工智能1.0时代里,人工智能主要是通过推理和搜索等简单的规则来处理问题,但是到了2.0时代,人工智能已经进化到了利用知识来武装自己。我们将知识的载体从图

    书转变成人工智能,这样它所能解决的就不再是“玩具问题”,并且看上去好像也变得更加

    聪明、实用。比如,如果我们想让人工智能取代厨师,只需要输入大量的菜品知识即可;

    如果我们想让人工智能取代医生,只需要输入大量的病理知识即可(见图3-1和图3-2)。

    图3-1 人工智能厨师图3-2 人工智能医生

    Eliza是由系统工程师约瑟夫·魏泽堡和精神病学家肯尼斯·科尔比在20 世纪60 年代共

    同编写的。在当时自然语言技术还没有突破性进展的前提下,Eliza的出现是一件让人“费

    解”的事情。

    由于Eliza的血液中流淌着精神病学的血统,因此它首先被应用于精神类疾病的治

    疗。令人惊讶的是,在Eliza与病患聊天的时候,它不仅能够听懂病人的话,而且还富有

    同情心,会像知心朋友那样给予人安慰。很多心理学家和医生都想让Eliza为病人进行心

    理治疗,甚至有些病人与它谈话后,对它的信任程度已经远远超过了人类医生。它虽然不

    懂人类的喜怒哀乐,却能够让人类和它进行友好、亲密的交谈(见图3-3)。

    更多电子书资料请搜索「雅书」:http:www.yabook.org图3-3 Eliza与人类的聊天记录

    如果我们仔细分析Eliza与人聊天的内容,就不难发现它的逻辑原理是非常简单的,甚至可以说其中并没有逻辑,它只是颠倒了对方所说的话的语序,然后回应给对话人。在

    Eliza运行过程中,它会扫描一些对方所说的话的关键词,然后根据系统内的“对应词”重新

    组织语言,最终成功与人类进行对话。当然,这种语序的重新组织、编排非常巧妙,不容

    易被人看出来。比如,你说“我很难过”,它会问你“为什么难过”;你说“我想大笑”,它会

    问你“为什么想笑”。不同的日常生活关键词会被划分成不同的等级,Eliza通过这些等级可

    以快速从数据库中检索出相应的关键词,看这个词代表的意思是什么,应该怎么应对。如

    果Eliza遇到了一句完全陌生的话,那么它会用一种特殊的模式拖延时间或诱导你说出其

    他关键词。比如,它会问“你指的是什么”或“你能举个例子吗”,甚至有时候它还会说一些

    像“这很有意思,请你继续”等“废话”来避免自己出洋相。

    从技术角度来说,Eliza与人类的对话并不是在理解句子意思的基础上进行的,但人

    类却对这个系统青睐有加,甚至很多人为此着迷。据说,当时有人想查阅Eliza的对话记

    录时,它还会“生气”地说:“你这是在侵犯别人隐私!”这实在是太有意思了。

    虽然Eliza的运行原理没那么高深,但是人们却产生了兴趣,即使它只是利用单纯规

    则展开对话,也不影响人们在使用时的乐趣。人工智能从一种只有科学家之间才聊的话题

    变成了一种人们茶余饭后的谈资。直到现在,在微博或网络游戏中,有很多被称为BOT的

    账号,这些账号可以说是Eliza的进化体,它们通过一定的计算规则不断地进行对话。iPhone中有一个叫做Siri的手机助手,很多人会在闲暇时与Siri聊天或在困惑时寻求

    Siri的帮助。使用Siri成为了一种潮流,甚至有些人已经离不开Siri,并将它当成生活的一

    部分。然而,如果没有50年前Eliza的出现,不知道这种潮流又会被推迟到哪一年。

    更多电子书资料请搜索「雅书」:http:www.yabook.org3.2 堪比专家的专家系统

    在人工智能2.0时代里出现的专家系统堪称“明星选手”。专家系统是指一种人工智能

    系统,其中包含着某个领域大量专家水平的知识和经验。通过已经编程好的知识,专家系

    统能够处理这个领域中普通甚至是棘手的问题。也就是说,专家系统可以根据某一个领域

    已有的知识和经验进行推理和判断,最终作出模拟人类专家的决策,以此解决需要人工判

    断的问题。

    1968年,“专家系统”的大师级人物爱德华·费根鲍姆开发出了一个极具代表性,也是

    业界第一个专家系统——DENDRAL,它能够对未知的有机化合物进行判别。DENDRAL

    利用的原始数据是物质的质谱数据,整个系统按照功能可以分成三个部分:第一个部分是

    利用已有的质谱数据和化学经验知识对可能的分子结构形成若干约束;第二个部分是通过

    J.莱德伯格的算法计算出一些可能的分子结构,并对根据第一个部分的约束控制这种可能

    性的展开,最终得到一个或多个可能的结构;第三个部分是利用化学家的知识对第二个部

    分得出的结论进行验证、排列,最终得出分子结构图(见图3-4)。

    图3-4 DENDRAL的三个部分

    20世纪70年代末期研发出来的MYCIN系统也是人工智能2.0时代中“专家系统”的典型

    代表。MYCIN系统是一种能够帮助医生对血液感染患者进行诊断,并且提供抗菌素类药

    物选择的人工智能。

    20世纪70年代初期,美国斯坦福大学的科研人员利用人工智能1.0时代的研究理论

    ——LISP语言编写了“专家系统”。这个系统从控制结构上可以分为两个部分:第一个部分是通过患者的病史、病症和化验结果等原始数据,利用数据库中的专业医疗知识进行推

    断,找出导致感染的病菌。如果是因为多种病菌感染,就用0到1的数字表示出每种可能导

    致感染的病菌的出现概率;第二个部分是在第一个部分的基础上,结合数据库中的药理数

    据提供针对这些病菌的治疗药方(见图3-5)。

    图3-5 MYCIN系统组成示意图

    专业医师根据患者描述的病情和化验结果等信息进行判断时,主要是结合自己的临床

    经验作出决策,这与MYCIN系统的推导过程相似。因此在某种程度上,MYCIN系统在感

    染学上已经可以替代一部分人工治疗(见图3-6)。

    图3-6 MYCIN系统进行诊断

    经过多次实验之后,统计结果显示MYCIN系统开出正确处方的概率为69%,非细菌

    感染专业的医师成绩并不比MYCIN系统好,但是如果与细菌感染专业的医师80%的正确

    率相比,MYCIN系统还是差一些。除此之外,“专家系统”在处理特定领域专业知识时的

    可信度比较高,但是一旦领域知识有所扩展,那么它就很难作出正确的判断。比如,我们

    更多电子书资料请搜索「雅书」:http:www.yabook.org可能会在看病时说头像针扎一样疼,并且伴有恶心的症状,这时医生可以根据临床经验进

    一步询问后作出判断。如果我们在计算机中输入头疼、恶心等症状,那么相对应的病理可

    能有成千上万种,这时就很难进行进一步诊断。正因如此,“专家系统”很少应用于医学领

    域中。

    除此之外,虽然“专家系统”有很多成功的案例,但是也存在一些必须面对的问题:如

    果需要人类将知识传输给人工智能,那么研究者就必须倾听一个或多个领域多位专家的所

    有讲解,从他们那里获取知识后,再输入到人工智能系统中,这样做会产生非常高的成

    本,实际操作起来也有一定的难度。与此同时,如果知识数量不断地增加,那么在实际运

    行的规则多达成千上万条后,有些规则之间就可能发生矛盾或冲突,所以对这种系统还需

    要进行维护和管理(见图3-7)。

    图3-7 “专家系统”的缺陷

    虽然“专家系统”具有一定的缺陷,但是俗话说“人无完人”,我们又怎能去苛求一台机

    器。以当时的技术水平来说,“专家系统”在处理特定领域的知识上有着得天独厚的优势。

    除了医疗,“专家系统”还被应用于生产、人事、金融、会计等领域。比如,银行采用

    的“专家系统”可以通过信用卡申请人提交的申请材料判断该申请人是否具备相应资质,以

    便减少流程,节约成本。

    据统计,到了20世纪80年代,美国100强企业中,有23的大型企业都在日常工作中使

    用了“专家系统”。我们不难想象,人工智能发展到2.0的时候,将会掀起多大的波澜。3.3 本体研究:如何正确描述知识

    对于人类来说,相互之间传达知识时,只要能够进行语言交流,就是一件非常简单的

    事情。那么,我们如何才能将知识传输给人工智能呢?这种针对人工智能传输知识的研究

    被业界称为“知识表达”。

    在人工智能发展初期有一项非常有名的研究,这项研究的目的就是探索如何向人工智

    能描述知识,它就是“语义网络”。“语义网络”与Web 3.0时代的“语义网”有着异曲同工之

    妙,“语义网络”能够将人类的语义结构转化成网络化结构的表达方式。在这种表达方式

    中,“概念”可以用节点表示,通过节点之间的连接就能将各个语义串联起来,最终形成知

    识库。

    比如,我们要将“一个桌子是我的”的信息传输给人工智能,这时就需要我们具体描述

    桌子的颜色、所有者、材质等相关信息,并将每一个特征设定为一个节点。当所有节点串

    联起来后,人工智能就能通过这些信息分辨出属于我们的桌子(见图3-8)。

    图3-8 语义网络示意图

    研究者对“语义网络”的研究越深入就越会惊叹人类所拥有的知识量是多么巨大,要想

    将这些知识全部按照一定的形式进行描述,显然是一件近乎不可能完成的事情。科学就是

    这样,总会遇到一个又一个困难,而人类也是在不断解决新困难的过程中不断进步。当人

    们碰到新问题的时候,便会尝试用另外一种方式研究,直到人们将“本体论”融合人工智能

    的研究后,事情有了新的进展。

    17世纪,德国经院学者郭克兰纽首先使用了“本体论”(Ontology)这个词。本体论是

    探究世界本源或基质的社会学理论。从广义来说,本体论研究的是一切事物的最终本性;

    更多电子书资料请搜索「雅书」:http:www.yabook.org而从狭义上来说,本体论则是研究宇宙的本性。不管是从广义来说还是从狭义来说,本体

    论好像都是一种哲学问题。那么,它与人工智能有何联系呢?

    从知识输入的角度来说,如果我们能从事物的本源出发,再通过分级处理信息,就能

    比较容易地向计算机描述出我们所要表达的信息。我们先来看看图3-9。

    图3-9 “哺乳类”与“阳性植物”特征示意图

    图3-9中的箭头代表的是“属于”关系。也就是说,人属于哺乳类,哺乳类属于动物。

    如果反向推导,可以推导出一层包含的关系,如人包含手与脚、向日葵包含花与叶等(见

    图3-10)。图3-10 包含关系示意图

    从图3-9和图3-10中可以看出,如果是简单且单一的过程,不管是正向推导还是反向

    推导都是可以的,这样将知识传输给计算机就能实现既定目标。但是这种推导过程真的万

    无一失吗?比如,我们反向推导出一家公司有一位经理(公司包含经理),一位经理有两

    只胳膊(经理包含两只胳膊),就会得出经理的两只胳膊属于公司的结论,这显然不正

    确。

    其实,即便是看起来相同的“属于”关系,实际上也包含着很多不同的关系在其中。对

    于一架飞机来说,如果没有了机翼,它就不能称为“飞机”,但是不管有没有机身的存在,机翼始终被称为“机翼”。

    森林与树木的关系是包含关系,即使森林中的树木被砍掉了一百棵,森林依旧还是森

    林,树木也还是树木。根据语境的不同,即便是同样的“属于”或“包含”关系也可能会出现

    不同的意思。在经理的那个例子中,其实经理与胳膊处于两个不同的语境中,因此作为经

    理身体的一部分,胳膊是不应该出现在公司的语境中的。

    对于人类来说,关于本体的研究是一件非常困难的事情,尽管人类能够自如转变语

    境,并且很轻松地理解语义,但是对于人工智能2.0时代的研究者来说,要把同样的思维

    用在人工智能身上,其难度可想而知。

    更多电子书资料请搜索「雅书」:http:www.yabook.org3.4 重量级本体论与轻量级本体论

    随着对本体研究逐步深入,研究者逐渐发现如果想要将知识灌输给人工智能,就必须

    恰当描述出整个知识系统。在描述的过程中,研究者分为了两个派别:一个是重量级本体

    论,另一个是轻量级本体论。

    本体研究产生了两个派系,二者的研究方向完全不同,重量级本体论的研究者认为研

    究重点应该是怎么描述知识,并根据这个方向进行试验;而轻量级本体论的研究者则认为

    应该将数据输入计算机后,让计算机找出这些数据之间的关联。从技术角度来说,人工智

    能的发展方向应该倾向于轻量级本体论。

    简单来说,轻量级本体论并不是非常严谨的论证方法,因为这种思维与重量级本体论

    截然不同的地方就是它认为即便有些东西不是完全正确,但只要能有效利用就可以,也就

    是俗话所说的“凑合着用”。从表面上说,这种方法过于随意、简单,但实际上这是一种非

    常有效并且是可实现的想法。这种理论与现在的云端和大数据思维不谋而合,因此绝大多

    数人工智能研究者是以这种方法进行研究的。

    对于轻量级本体论的研究,在21世纪有一个典型的例子,虽然这个案例是超越人工智

    能2.0时代的产物,但是它却是轻量级本体论极具代表性的“人物”,它就是“沃森”。

    “沃森”是由IBM公司和美国得克萨斯大学共同打造的一台超级计算机,“沃森”的“大

    脑”里储存了海量数据,“沃森”能够利用这些海量数据推理出最正确的答案。IBM公司之

    所以会创造出一台超级计算机就是为了建造能与人类回答问题能力相匹敌的计算系统,并

    且这个系统不需要联网,只需数据库中的内容来推导出正确答案。这种思维就是我们所谓

    的轻量级本体论(见图3-11)。图3-11 超级计算机“沃森”

    比如,我们提问:“中国最北端的县在哪里?”“沃森”就会对数据库中的大量信息进行

    整合归类,首先挑选出与中国有关的关键词,然后再进一步推导出关于“北方的县”的信

    息。在这个过程中,“英国的”“美国的”“景观”等无用关键词都会被排除,经过多次筛选

    后,最终将答案锁定于“漠河县”(见图3-12)。

    图3-12 轻量级本体论示意图

    就技术本身而言,“沃森”并不是真正的人工智能,因为它在回答问题时并不是建立在

    理解问题的基础上,而是通过对问题中关键词进行筛选,快速从数据库中推导出符合条件

    的答案。这种技术符合轻量级本体论的特征,即将知识输入到计算机中,让计算机自行处

    理问题。值得一提的是,IBM公司研发的“沃森”虽然没有在技术上突破人工智能领域的关

    键问题,但在提高人工智能精确度上作出了杰出的贡献。

    距离MYCIN系统出现的时间已经过去了近50年,人类对轻量级本体论的研究不断深

    入,人工智能回答问题已经不仅仅局限于参加智力问答比赛,这种技术在其他各个领域也

    逐渐变得耀眼起来。据韩国媒体报道,谷歌Deep mind首席执行官德米斯·哈萨比斯宣

    布“要将阿尔法狗和医疗、机器人等结合”。为了实现这一计划,哈萨比斯为英国的公

    更多电子书资料请搜索「雅书」:http:www.yabook.org司“巴比伦”投资了2 500万美元,如果这种技术得以研发与实现,那么在未来病患者只要

    对着计算机说出症状,计算机就能以网络信息以及自身数据库为基础,推导出正确的治疗

    方式和处方。将阿尔法狗的技术融入到这一计划中将会极大地提高人工智能诊断的准确

    度。3.5 机器翻译难在何处

    人工智能进入2.0时代的标志是人类从赋予人工智能搜索和推导能力升级到了向人工

    智能输入知识,以此提升其综合性能。比如,“沃森”“深蓝”等计算机的出现,以轻量级本

    体论为基础,教会了计算机如何利用知识回答问题或战胜对手。看起来计算机的性能提高

    了,但对于计算机而言,这样的过程中始终是建立在已有规则基础上。一旦脱离这些规

    则,计算机就不能解决任何问题,因为它并不能理解这些问题的本义。那么,为什么研究

    人员不尝试解决这个问题,让计算机能够理解语义呢?研究者不是没有去尝试,而是这个

    问题过于复杂,在整个人工智能2.0时代都没有人能成功的攻克这个难题。

    在人工智能1.0时代,机器翻译已经成为研究内容之一,但是由于当时其他理论并不

    完备,因此这个方向的研究一再被搁浅。到了各项技术有所发展的人工智能2.0时代,关

    于语言的研究依旧没有突破性的进展,因为这个问题非常难。那么,机器翻译难在何处?

    如果要让机器翻译完全达到人类的水平,就必须克服自然语言中有关歧义的问题,因

    为这是自然语言中普遍存在的问题。这里,我们姑且将歧义理解为多义性。即便对于人类

    来说,识别一些特殊的多义词语或语句也是比较困难的事情,何况是人工智能。有一则笑

    话可以反映出多义性是多么复杂的一件事。

    有一位在中国学习了10年中文的外国人,去参加一场普通话考试。他在看到考题后哭

    晕在考场里,考题的内容是下面这样的。

    请翻译下列语句中重复词语或语句的意思。

    1.冬天:能穿多少穿多少;夏天:能穿多少穿多少。

    2.“剩女”产生的原因有两个:一是谁都看不上,另一个是谁都看不上。

    3.女孩给男朋友打电话说:“如果你到了,我还没到,你就等着吧;如果我到了,你

    还没到,你就等着吧。”

    4.单身的原因:原来是喜欢一个人,现在是喜欢一个人。

    在第二句话中,第一个“谁都看不上”的主语是“剩女”,意思是说“剩女”的眼光很高,谁都看不上;而第二个“谁都看不上”的主语则是其他人或相亲者,也就是说其他人或相亲

    者看不上“剩女”。从表面上看,这两个短句似乎还是比较容易分辨的,但对于机器来说,要想达到这种类似于人的精确翻译程度,必须先具备活跃的逻辑思维,因为如果我们在百

    度中搜索“多义词”,就有近1600万个结果(见图3-13)。再加上多义句、语种的数量,我

    们需要传输给计算机的知识数量将是一个天文数字。

    更多电子书资料请搜索「雅书」:http:www.yabook.org图3-13 百度中“多义词”的搜索结果

    正如前文所说,除了语句的多义性,跨语种翻译也是机器翻译的难点之一。比如,在

    翻译“he saw a women in the forest with a telescope”这句时,人类会自动翻译成“他用望远镜

    看到了森林里有一个女人”,但是通过翻译软件翻译的结果如图3-14所示。

    图3-14 翻译软件的翻译结果

    翻译软件将这句话翻译成了“他在森林里看到一个女人用望远镜看”,这句话从语义上

    就存在歧义,究竟是“他”用望远镜,还是那个“女人”用望远镜?当我们看到这句话的时

    候,想象出的情景是“他”在远处用望远镜看到了一个女人,否则“他”又是如何看到森林里

    的女人的,因此必须是“他”用望远镜看。

    为什么人类可以作出这样的判断呢?这是因为我们在看到有多义性的语句时,可以通

    过当时所处的情景以及以往的经验判断如何进行翻译。而在人工智能2.0时代,向人工智

    能灌输知识是主导方式,这样的情景设置显然是不切实际的。

    很简单的一件事或一句话,如果没有常识作为基础,那么翻译、理解起来必然非常困难,这也是机器翻译的困难之一。如果机器想要像人一样翻译,就必须掌握所有常识,并

    且懂得合理设置情景,即便是在今天,也没出现能够支撑如此复杂内容的技术。即便你给

    机器一本“百科全书”,你还要教会它怎样应用于日常生活,这对于人工智能2.0时代的研

    究者来说,就像是进入到了知识获取的瓶颈中,这间接导致了人工智能的快速退潮。

    更多电子书资料请搜索「雅书」:http:www.yabook.org3.6 生不逢时的第五代计算机

    虽然人工智能2.0时代的研究者没有在自然语言领域取得突破性的进展,但是也不能

    否认他们在其他方面取得的进展。在以知识为主导的2.0时代,人工智能对知识的处理和

    形式化推理得到了极大的发展,尤其是以第五代计算机为代表的产物。从技术设想来看,这类研发项目已经融入了很多现代人工智能的元素。

    1981年10月,日本向世界宣布将开始研制第五代计算机,并在1982年4月制订了“第五

    代计算机技术开发计划”,日本政府将为这个为期10年的计划投入1000亿日元(约合人民

    币58亿元)。第五代计算机是指能够将信息采集、处理、储存、通信等功能与人工智能结

    合在一起的智能计算机。按照设想,第五代计算机能够主动对知识进行处理,并且能够自

    主学习,对收集到的信息进行形式化推理,最终帮助人类进行判断、决策或获取未知知识

    等。听起来第五代计算机是一种非常高端的科学技术,其实它的研发初衷确实是为了适应

    未来社会信息化的要求而提出的,因为当时的前四代计算机存在很多缺陷。

    1.智能水平较低

    虽然当时的计算机已经有一定的智能,但是如果要以现在的科技水平形容这些智能,只能冠以诸如“幼稚”“不成熟”等形容词。因为当时研发出来的人工智能不具备联想、自主

    学习、推论等功能,也就是说,它们不会自主学习,并且也不能将学习到的某一个知识与

    其他已有知识相关联。比如,当提到“卵生动物”的时候,人类不仅能够想到龟、鸭等具体

    代表生物,还能联想到“哺乳动物”以及逆向推导的“生物”(见图3-15)。图3-15 人类思维认知图

    如果给计算机灌输相关知识,我们描述完卵生动物是什么样的之后,还需要说明龟是

    卵生动物,而且计算机也不会同时联想到“哺乳动物”(见图3-16)。

    图3-16 计算机联想图

    2.无法直接交流

    更多电子书资料请搜索「雅书」:http:www.yabook.org虽然当时的计算机已经能够帮助人类处理一些问题,但是它依旧不能听懂人类的语

    言,人类要想跟计算机交流,还是需要专家使用“特殊的语言”向计算机解释。

    3.功能尚不完善

    计算机确实能够比人以更快的速度完成一些工作,如快速处理数学问题等。但在某些

    特殊领域,计算机还无法完全满足正常项目的需求,如核反应模拟实验、天气预报、地震

    预测等。

    正因如此,研究者才迫切希望研制出第五代计算机以突破瓶颈,将人工智能推向新的

    巅峰。令人遗憾的是,虽然当时日本拥有极高的抱负和雄心壮志,但是在20世纪80年代,日本正值经济泡沫的巅峰时期,日美贸易摩擦的加剧使得日本财政赤字越来越严重。与此

    同时,数据的缺乏也使得第五代计算机项目被迫搁浅。开放式数据被极大化利用是在20世

    纪90年代末期,互联网出现之后发生的事情。在此之前,可利用的数据获取难度大,所以

    人工智能只得以强化推理的方式发展,但是这种“老套”的方法并没有创造出令人满意的成

    果。

    1982年至1992年这10年的时间里,日本政府对第五代计算机研发投入了近570亿日元

    (约合人民币33亿元),虽然最终因为种种原因没有取得预期成果,但是第五代计算机的

    设想和研发思维却对后来的人工智能发展起到了一定的影响作用。我们可以想象一下,如

    果不是第五代计算机生不逢时,也许今天的人工智能发展水平还会迈上一个新台阶。3.7 第二次人工智能浪潮消退

    第五代计算机的相关研究不仅重塑了人们对人工智能的看法,也将人工智能发展所要

    面临的困难都展现了出来。凡事都有两面性,虽然知识导入使人工智能发展到了一个新高

    度,但也将知识描述的困难和复杂性展现得淋漓尽致。当时,人们面临的一个最大问题就

    是:如果人工智能的所有知识都需要人类输入,那么需要输入的内容将是无穷无尽的。

    虽然需要输入的知识是无穷无尽的,但是如果有足够的人力和经费完成这件事,那么

    这件事并非不可能完成。但是,结合当时整个社会的经济环境,这样的投入并不能带来相

    匹配的回报。

    让我们回顾一下当时的经济环境:20世纪90年代初期,日本的房地产和股票市场在持

    续数年的过度增长后,开始出现灾难性下跌,到了90年代中期,日本经济增长停滞,进

    入“零增长阶段”。正如前文所说,第五代计算机正是在这样的背景下被迫搁浅(见图3-17

    和图3-18)。

    图3-17 1955年至2015年日本土地价格走势图

    更多电子书资料请搜索「雅书」:http:www.yabook.org图3-18 1985年至2015年日经225指数走势图

    日本经济泡沫崩溃后,到了90年代末期,整个亚洲笼罩在“亚洲金融危机”的阴霾中。

    就是在这样一次又一次的冲击之下,人工智能很难独善其身。

    早在1987年,人工智能硬件市场的表现就已经预示这次浪潮即将退去。当年人工智能

    硬件需求突然开始下跌,而苹果公司和IBM生产的台式机性能大幅度提升,并且逐步超过

    了当时其他厂家生产的昂贵的LISP机。这样一来,在新产品的不断打压上,一夜之间一

    个价值5亿美元的产业开始土崩瓦解。

    与此同时,一些已经获得成功的专家系统也不得不面临维护费用昂贵的问题,在巨大

    的经济压力下,多数专家系统难以升级,不能升级就意味着它们已经失去了时效性,变得

    非常容易出错,并暴露出这样或那样的问题。因此,专家系统最终沦为了只能解决某些特

    殊情景中问题的“处理机”。

    迫于经济形势,人工智能始终难以在技术上有大的突破,对人工智能赞助的“东

    家”——战略计算促进会开始大幅削减对人工智能项目的资助。该协会的新任领导不再将

    人工智能当作主要发展目标,并将削减的经费用于更加容易出成果的项目。

    日本人工智能理事、《人工智能狂潮》作者松尾丰提到过,在他学习人工智能的学生

    时代,正值第五代计算机计划刚刚搁浅。当时的日本因为人工智能的过度狂热导致浪潮退

    去后的“寒冬”变得极为寒冷。“人工智能”这个词几乎成了禁忌语,社会对于人工智能的评

    论也从赞美与畅想转变成了讽刺和贬低。

    迫于大势,当时很多人工智能的研究人员不得不面对一个事实——也许,人工智能只

    不过是一个美梦。在现实面前,很多人忍不住摇头叹息,甚至连一些人工智能理论的奠基

    者也开始灰心丧气。于是,人工智能开始从极盛时代逐渐进入“寒冬”。其实,科学的发展

    道路上势必充满了坎坷,如果不是因为这一次“寒冬”的到来,人们也许还会沉浸在过度狂热中。历史就是这样,经过野蛮生长的阶段之后,人工智能势必要经历“寒冬”的侵袭,才

    能在冷静中寻找真正持久的发展之道。

    更多电子书资料请搜索「雅书」:http:www.yabook.org第4章 人工智能3.0时代:悄然兴起的“机器学习”

    1989年3月,英国的蒂姆·伯纳斯·李博士正式提出了万维网的设想。次年12月25日,他又在日内瓦的欧洲粒子物理实验室开发出了世界上第一个网页浏览器。在随后的10年

    里,互联网得到了快速发展,并且逐渐成为了人们日常生活不可分割的一部分。在人工智

    能2.0时代的“寒冬”里,人工智能最大的发展障碍就是缺乏快速获取知识的途径,互联网

    的出现正好解决了这一大难题。人工智能终于从“寒冬”中走出来,进入了一个新的发展时

    代。4.1 数据激增与机器学习的兴起

    在以知识为主导的人工智能2.0时代,我们只要为计算机灌输一定的知识,这些机器

    就能为我们做一些事情,如工业生产、数学计算等,但是,这些机器仅仅能够完成这些知

    识范围之内的事情。从某种角度来说,当时的人工智能只能为人们节省一些时间或体力

    (见图4-1和图4-2)。如果我们想要扩展人工智能的用途,就需要不断地向它灌输知识,除此之外,将人类的自然语言输送给计算机本省就是一件比较复杂的事情,让计算机掌握

    人类的语言更是难上加难,因此人工智能进入了发展瓶颈期。

    图4-1 20世纪90年代的工业人工智能

    更多电子书资料请搜索「雅书」:http:www.yabook.org图4-2 20世纪90年代的个人计算机

    虽然人工智能进入到了发展瓶颈期,但另外一项技术却得到了快速发展——互联网。

    1990年,“互联网之父”——蒂姆·伯纳斯·李开发出了世界上第一个网页浏览器。1993

    年,伊利诺伊大学美国国家超级计算机应用中心的学生马克·安德里森又开发出了Mosaic

    浏览器(见图4-3和图4-4)。后来这款浏览器被推向市场,互联网从此进入爆发性发展阶

    段。

    图4-3 Mosaic浏览器图标

    图4-4 Mosaic浏览器界面

    到了1998年,随着谷歌搜索引擎的出现(见图4-5),人们开始重视对数据的搜集和

    利用,而这种重视在无形中解决了人工智能所面临的一大难题——知识的积累。除此之

    外,受互联网技术的影响,人工智能研究者也开始逐步对自然语言的处理有了新的认识,人工智能终于再度从“寒冬”中走出来,得以继续发展。图4-5 谷歌搜索页面

    在互联网的影响下,统计自然语言处理这门技术得到了快速的发展,这种方法在一定

    程度上解决了人工智能如何理解自然语言的难题。运用统计自然语言处理技术处理语言

    时,不会刻意寻找句子的语义,仅仅是机械地将翻译概率比较高的词语,组成一个完整的

    句子。在互联网技术的支持下,人工智能有了海量数据的来源,知识也比以前更加丰富。

    虽然同样是不考虑句子的语义,但是相比人工智能2.0时代的翻译,这种处理方式已经完

    善了很多。我们在搜索某一个单词的时候,计算机会自动从网络中检索出被翻译概率最高

    的词汇。比如,当我们搜索“饕餮盛宴”的翻译时,根据海量数据中的知识,人工智能会将

    它翻译成“Gluttonous feast”,也就是“暴食的”与“宴会”两个词组合起来。虽然在语境上还

    差着一些情景,但是基本意思已经十分符合(见图4-6)。

    图4-6 利用翻译软件翻译“饕餮盛宴”

    在激增数据的支持下,人工智能从推理、搜索升华到知识获取阶段后,又一次进化到

    了机器学习阶段。早在1996年,人们就已经定义了机器学习,它是人工智能的一个研究领

    域,其主要研究对象是人工智能,特别是在经验学习中如何改进具体算法的性能。到了

    1997年,随着互联网的发展,机器学习被进一步定义为“一种能够通过经验自动改进计算

    机算法的研究”。

    在充分利用数据的基础上,人工智能的相关研究取得了巨大的进展,从谷歌的发展历

    程中我们能够窥见人工智能发展的影子。谷歌这个统计自然语言处理学领域的探索者和权

    威代表经过16年的发展,在完成各项人工智能项目开发的同时,还成为了世界500强企

    业,市值超过了5 000亿美元。正是这样一位先驱者,让人工智能2.0时代中已经濒临绝望

    的人们再度燃起了对人工智能的热情。

    更多电子书资料请搜索「雅书」:http:www.yabook.org4.2 学习即区分

    当人们将机器学习归纳为人工智能发展的下一个阶段时,也对人工智能的发展方向有

    了新的看法。早期人工智能以推理、演绎为主要目的,但是随着研究的深入和方向的改

    变,人们发现人工智能的核心应该是使计算机具有智能,使其学会归纳和综合总结,而不

    仅仅是演绎出已有的知识。

    学习是人类智能的一个重要表现,但是究竟什么是学习?长期以来众说纷纭,它包含

    了心理学、生物学、数学、计算机科学等各方面的内容。就连人类的学习都如此难以定

    义,更不要说给人工智能的学习下一个准确的定义了。但是为了研究方便,又必须给人工

    智能的这种行为下一个定义,即便这种定义是不充分或不完全的。于是,人们将人工智能

    的学习定义为模拟人类学习的过程,严格一点的话,可以解释为:机器学习是一门研究机

    器获取新知识和新技能,并识别现有知识的学问。

    在人工智能3.0时代,结合各种学习方法,通过取长补短等方式集成的学习系统逐步

    兴起,特别是一些链接学习符号可以很好地处理知识与技能之间的断点,这样就可以使计

    算机获得更好的性能。因此,机器学习越来越受到人们的重视。

    机器学习的基本结构可以总结为:环境向学习系统提供信息,而学习系统利用这些信

    息修改知识库(见图4-7)。

    图4-7 由环境向计算机提供信息

    在具体应用中,学习系统利用这些信息修改知识库后,执行系统就能提高完成任务的

    范围和效能,执行系统根据知识库完成任务之后,还能把在执行任务过程中获得的信息反馈给学习系统,让学习系统得到进一步扩充(见图4-8)。

    图4-8 机器学习信息循环示意图

    从图4-8不难看出,最终先影响到机器学习的是学习系统,而最能影响学习系统的是

    环境信息,更确切地说是从环境中流入的信息的质量。因为在知识库中的引导规则往往是

    一般原则,且比较单一,但是环境向学习系统提供的信息是多种多样的。如果信息质量比

    较高,与引导规则相匹配或者说两者能够融合,那么学习系统就能轻易处理这部分信息。

    但是在实际环境中,不可能所有的信息都适用于现有的规则,大多数时候学习系统提供的

    信息都是杂乱无章的具体信息。当学习系统获得这样的信息时,就需要足够的数据支撑才

    能作出判断,简单来说就是进行信息区分。

    学习的本质便是对某一事物进行判断和识别,如果人工智能能够进行学习,那么就必

    须对已有的信息进行区分,然后根据区分后的信息进行判断,最终采取相应的行动。在心

    理学领域有一个非常著名的研究理论——微表情。一个人的下意识行为虽然只会持续极短

    的时间,但却能反映出人们真实的情感,微表情能够区分人们说的、做的是否和真实的情

    感一致。《别对我说谎》(Lie To Me)就是一部关于微表情研究的电视剧集(见图4-

    9)。

    图4-9 《别对我说谎》海报

    更多电子书资料请搜索「雅书」:http:www.yabook.org微表情是关于区分的一个比较极端的例子,对于人工智能来说,更多的区分是建立在

    简单的“是”与“否”基础上的,就像人们判断一种食物是“能吃”还是“不能吃”一样。人类因

    为拥有高度的智能,所以对于很多事情的区分都很细致,有时甚至细致到了极端的地步,有点类似于“强迫症”。但是对于人工智能来说,一旦拥有了海量的数据作基础,这种细致

    的区分或许正是发展的必经之路。从这一点来看,人工智能确实已经有了人类思维的影

    子。

    现在回过头来看机器学习,因为学习系统获得的信息往往是不完全的,所以根据这些

    信息推理出的规则既可能是正确的,也可能是不正确的,这就需要通过执行效果加以验

    证。若执行效果反馈成功,并验证某一条规则是正确的时候,系统就会将其区分为“是”,而对不正确的规则就会反馈为“否”,并对这部分规则进行修改或直接从数据库中删除。机

    器学习就是在这种对海量数据进行处理的过程中,自动学习区分方法,以此不断消化新知

    识。4.3 有监督学习与无监督学习

    在人工智能3.0时代,机器懂得了学习,但是这种学习行为完全是由人类教授给它们

    的吗?从这一角度来看,我们可以将机器学习分为两大类(见图4-10):一类是有监督学

    习;另一类是无监督学习。

    图4-10 机器学习的两大类

    所谓有监督学习,就是我们常说的分类,也就是通过已有的信息获得一个最优的处理

    模式,再利用这个模式将所有输入的信息处理成输出信息,计算机通过对输出信息的简单

    判断将已有信息分成不同的种类,这样人工智能就有了对未知数据进行分类的能力。比

    如,家长经常教育孩子香蕉是能吃的,石头是不能吃的。“香蕉”“石头”就是输入信息,而

    家长所下的判断,即“能吃”与“不能吃”就是相应的输出信息。当孩子的认知能力达到一定

    的水平时,就会逐步形成一种通用或泛化的模式,这种模式就是通过有监督学习训练出来

    的。当孩子遇到与石头相同的事物时,就知道这是不能吃的。邻近算法就是理论比较成熟

    的有监督学习的应用。

    邻近算法是最简单的机器学习算法之一。其总体思路如下:如果一个样本在特定的空

    间内有K个最相似的样本,并且这些样本大多数属于某一类别,那么这个样本就属于这个

    类别。由于邻近算法主要是靠周围有限的邻近样本判断目标样本所属的类别,因此在判断

    之前要确认所选择的邻近样本都是正确的分类对象,这就是所谓的“监督”(见图4-11)。

    更多电子书资料请搜索「雅书」:http:www.yabook.org图4-11 邻近算法示意图

    那么,什么是无监督学习呢?在研究者眼中,无监督学习更具有探索价值。它与有监

    督学习的不同之处在于:在机器学习的时候,我们并没有放置任何可以参考的样本或者已

    经分类的参考目标,机器需要直接对已有数据建立模型。我们不禁会问,没有样本的话,计算机如何自己建立模型?在人类运用思维的过程中,无监督学习时常发生。比如,我们

    对音乐完全不懂,但是能听出来哪些音乐比较欢快,哪些音乐比较哀伤。尽管我们不知道

    什么是轻音乐,什么是摇滚音乐,但我们能自发地将其进行分类,这就是无监督学习。并

    没有人给予我们模型将听到的音乐进行分类,但是我们依然能够将不同风格的音乐区分

    开。当我们根据某些事物的特性将其归为一类时,使用的就是无监督学习中的聚类分析

    法。

    聚类分析是无监督学习的典型案例。俗话说:“物以类聚,人以群分。”所谓的类就是

    具有相似元素的事物的集合。

    聚类分析的目的是在相似的基础上收集数据进行分类。很多领域都会使用到聚类分

    析,包括计算机科学、统计学、生物学和数学等。聚类分析的对象被称为描述数据,通过

    衡量它和不同数据源之间的相似性,就能把不同的数据源归到不同的类别。比如,我们找

    到了一种植物,并且发现它具有白菜的特性,只是颜色不一样,那么我们就可以将其归类

    到蔬菜中(见图4-12)。图4-12 聚类分析

    从实际应用的角度来看,聚类分析是数据挖掘的主要任务之一。聚类能够作为一个独

    立的工具获得数据的分布状况,观察每一簇数据的特征,集中对特定的聚簇集合作进一步

    的分析。另外,聚类分析还可作为其他算法(如分类和定性归纳算法)的预处理步骤。

    当有足够的数据支撑时,无监督学习中的聚合能力就会被无限放大,特别是当一个聚

    类分析中的目标具有附加数据时。这些附加数据能不断构建出一个又一个新模型,所产生

    的结果也会以几何级数增加。

    当然,这并不是说有了无监督学习,有监督学习就完全没有存在的意义了。恰当地使

    用分类系统,机器学习也会变得非常强大。在一定程度上,机器学习的这种分类可以打破

    语义难以被理解的障碍,通过不断地将有监督学习与无监督学习相融合,语义也会变成可

    分类的目标之一。如果没有这种方法促进机器去学习,那么语义的理解也将变成一件非常

    困难的事情。

    更多电子书资料请搜索「雅书」:http:www.yabook.org4.4 各式各样的分类方法

    在前一节中我们分析了机器学习的有监督学习和无监督学习,其中非常关键的一个词

    就是“分类”,本节将深入探讨分类的方法。

    机器学习的分类方法不止一种,这是因为当环境信息不确定的时候,势必不会满足一

    种规则的运行,像前文提到的邻近算法,它只能满足一些简单的计算。如果我们要向课本

    中注入内容,那么对不同科目所要注入的内容在输入之前就应该分好类。向计算机注入内

    容时,我们就需要将出现频率最高的词语输入作为模型。如果有三个词出现,那我们就设

    定三个维度,每一个维度都是独立的空间,每一个科目的内容也处于这个独立空间中。我

    们假设这三个科目分别为英语、政治和数学(见图4-13)。

    图4-13 依据科目建立的三个维度

    建立好维度以后,我们就可以导入新的数据进行测试。比如,测试数据为“国家”,那

    么它就应该被归类到“政治”的维度中,这就是所谓的区分;如果出现“三角函数”,就应将

    它归类到“数学”维度中(见图4-14)。图4-14 测试数据归类

    分类的方法有很多种,也就是说,图4-14里黑色分界线的画法有很多种。它们的基础

    理论有所不同,邻近算法只是其中的一种,与邻近算法相似的经典算法还有以下四种。

    1.决策树

    决策树是通过设定一个范围区间,通过目标物属性是否符合范围区间内包含的值进行

    分类。比如,“国家”和“政党”这两个词大多数出现在政治领域中,如果出现了某个目标

    物,可以将数据区分为含有“国家”这个词的集合和不含这个词的集合,含“政党”这个词的

    集合和不含这个词的集合;如果目标物既含有“国家”也含有“政党”,那么自然会被归类

    到“政治”维度中。决策树通过不断生成问题逐步缩减范围,最终通过询问是否含有某一个

    关键词就能知道目标物大概属于的类别。

    一般来说,企业更倾向于使用这种分类方法,通过对已录用员工的特点进行整合,生

    成决策树后,就能筛选出适合企业的面试者(见图4-15)。但是,这种分类方法一旦遇到

    多属性的复合条件,就很容易发生多重分类,因此其精度不是很高。

    更多电子书资料请搜索「雅书」:http:www.yabook.org图4-15 决策树示意图

    2.正则化法

    正则化法可以看作是决策树或其他算法的延展算法,它根据算法的复杂程度对现有的

    算法进行优化、调整,也就是我们经常说的反问题化。一般来说,正则化法对其他算法建

    立的简单模型进行奖励,对复杂模型进行惩罚(见图4-16)。

    图4-16 不断延伸的归类算法

    3.朴素贝叶斯算法

    与决策树划定区间的方法截然不同,朴素贝叶斯算法是有关概率的最终分类方法,它

    可以将数据的每种特征可能被划入的类别概率加总,最终根据加总结果判断数据应属的类

    别。比如,在“政治”里,“国家”出现的总概率是110,而在“数学”里“国家”出现的概率则

    是130,那么“国家”被纳入“政治”类别的可能性就更高。听上去这是一种非常简单的算

    法,但是在海量数据面前,朴素贝叶斯算法需要处理的数据量也十分巨大,并且概率加总

    后也许只有细微的差别,因此实际计算起来非常复杂(见图4-17)。

    图4-17 朴素贝叶斯算法4.人工神经网络

    相比于决策树和朴素贝叶斯算法,人工神经网络是一种更加“高大上”的算法。从技术

    角度来说,人工神经网络更像是真正意义上的人工智能的计算方式,因为它是通过模仿人

    类的脑神经回路进行分类的。

    人的大脑通过神经元传输信息,数量巨大的神经元构成了神经网络(见图4-18)。当

    某一个神经元接收到刺激信号后,就会传输给另一个神经元,这样逐层传递到大脑进行处

    理后就形成了感知。就好比传感器,当刺激达到某一个值的时候,传感器会形成反应;如

    果没到达到这个值,就不会形成反应(见图4-18和图4-19)。

    图4-18 神经元示意图

    图4-19 神经元信息传递示意图

    更多电子书资料请搜索「雅书」:http:www.yabook.org人工神经网络就是仿照神经元传递信息的方法来对数据进行分类的,我们可以在传递

    的过程中设置权重,如果数据小于这个权重,那么就不能传递到下一个“神经元”中;反

    之,如果数据大于这个权重,则继续往下传递,在这样不断传递的过程中,数据就会被分

    类到各个维度中。4.5 用人工神经网络识别手写文字

    在上一节中,我们介绍了人工智能的分类方法,其中一种方法是人工神经网络。在这

    一节中我们将重点说明这种分类方法,因为在未来它将成为整个人工智能领域的重要支柱

    之一。

    人工神经网络是对人脑神经元的抽象表述,它从信息处理的角度来建立简单的模型,按照不同的连接方式组成各种各样的“神经网络”(见图4-20)。不过,人工智能中的神经

    网络并不是真的由神经元组成的,这种神经网络由大量的节点相互连接而成。每个节点都

    可以看成是一个独立的输出系统,而两个节点之间能够进行数据传输的框架被称为权重。

    当信息在节点之间传输的时候,根据权重值的不同,信息所经过的节点也会有所不同,最

    终整个神经网络会在不断筛选和传输的过程中逐步逼近自然界中存在的某种算法或者逻辑

    思维,从而实现语言的转换,完成机器学习。

    图4-20 人工神经网络示意图

    早期人们将主要精力都放在了如何运用机器学习来让计算机处理自然语言以及如何将

    其应用于工业生产等问题上。但在互联网出现之后,自然语言处理已经得到了很大进展,如果机器学习还局限在这个方面的话,就显得过于狭隘。随着人们对机器学习研究的不断

    深入,以及人工神经网络的出现,人们开始将目光锁定在了如何让计算机通过机器学习进

    更多电子书资料请搜索「雅书」:http:www.yabook.org行图像识别上面。

    什么是机器学习中的图像识别呢?举一个简单的例子:我们现在使用的手机中都有输

    入法,而大部分输入法中都有一种非常人性化的功能——手写文字。只要在屏幕上手写出

    正确的文字,手机就能识别出你写的是什么文字(见图4-21和图4-22)。

    图4-21 手写文字示例1

    图4-22 手写文字示例2也许人们会说:“这样的识别并不是什么难事,只要笔画清晰、字迹工整,那么只要

    将汉字数据提前输入数据库中,通过对号入座的方式就能找到相应的文字。”没错,在笔

    画清晰、字迹工整的前提下,这种识别似乎很简单,但是手写输入毕竟不是在“田字格”上

    完成书写作业,在实际的写字过程中,模糊、连笔等问题都会出现。如果手机一遇到这种

    问题就要求你重新输入,那指定会引起很多人的不满。比如我们在书写“3”的时候,如果

    笔画不是十分工整、清晰,那么计算机如何能准确识别出是“3”而不是“5”或“9”呢?在人

    工智能1.0或2.0时代,这是一个难题,但在3.0时代,有了人工神经网络的帮助,这样的难

    题就迎刃而解了。

    MNIST数据集是一个专门针对数字研发的数据库,这个数据库包含了从0到9这10个

    数字的手写图像内容。如果将这个数据库导入计算机中,再与人工神经网络相结合,就能

    完成对数字图像的识别,因此MNIST也是图像识别中的标准数据。

    虽然从0到9只有10个数字,但是为了能够将各种各样的写法都囊括进MNIST数据集

    中,这10个数字的图片数量高达7万张。这7万张图片中的每一张都标明了其对应的数字,我们假设在人工神经网络中的权重为1,那么针对这10个数字对应的10个“神经元”的每一

    层权重就都为1。当某一个图片进入人工神经网络系统后,数据通过一个节点后会传输到

    下一个节点中;如果权重不足,则不能进入。比如我们手写的数字“2”有些模糊,当这个

    数字出现后,依据MNIST数据集的模型标准,在隐层中“2”的权重为0.6,而“3”的权重为

    0.3,于是传输到输出层节点的数据就是“2”(见图4-23)。

    图4-23 人工神经网络模拟手写输入

    值得一提的是,人工神经网络的一大优势就在于权重可以根据需要进行调整,每两个

    神经元之间都存在四种“权重通道”,通过调节“权重通道”的宽度,不同的数据分类的精确

    度就可以达到一个让人满意的程度。举个简单的例子,如果我们有100个节点,那么经过

    计算,能够构造出的“权重通道”就有8万条。也就是说,仅仅是这100个节点就能筛选8万

    条信息。如果节点数量达到千万或者亿万级别,那么就能分类海量数据(见图4-24)。

    更多电子书资料请搜索「雅书」:http:www.yabook.org图4-24 人工神经网络“权重通道”数量逐层增加示意图

    一旦输出端的最终答案是错误的,我们只需调整权重就能提高分类的精确度。相比于

    其他分类方法,人工神经网络是从答案入手来调整过程中出现的偏差的,而不是从头重新

    来过,寻找一条新的通道来得出最后的答案。就好像在企业运作中,当企业发展方向出现

    偏差时,我们需要寻找的是领导层、决策层的失误,而不是找基层员工是否出了错,只有

    这样才能适时作出调整。对于识别手写文字这个问题,人工神经网络在新语言或语种出现

    的时候,能够以最快的速度重新进行分类。对于整个人工智能领域来说,人工神经网络把

    很多不可能的事情变为了可能,这也在一定程度上决定了人工智能真正走上了“类人”的发

    展轨道。4.6 机器学习的难点

    基于互联网技术的快速发展,机器学习也得到了充分发展的空间。有了机器学习,早

    期面临的最大难题——自然语言处理问题也迎刃而解。计算机利用各种各样的分类方法和

    人工神经网络,已经能够对很多未知事物进行判断,人工智能也不再只是满足科学家的求

    知欲和工业生产需求,它开始步入人类的日常生活。

    虽然人工神经网络的出现让人工智能突破了发展瓶颈,也加快了其发展的速度,但是

    这并不意味着发展人工智能已经完全没有障碍。

    其实可以说,在机器学习这个概念产生的时候,它本身就有一个明显的弱点,只不过

    这个弱点一直没有获得重视。随着人们在机器学习领域的成果越来越多,这一弱点才被充

    分暴露出来——特征工程。

    我们从小时候认东西开始,基本上就是通过一个又一个特征来记住某一个或某一类事

    物。比如,我们根据没有脚、爬行这两个特征来记住蛇,没有脚、爬行就是蛇的特征。另

    外一个比较有意思的例子是瑞士军刀(见图4-25)。瑞士军刀是一种十分方便的工具,我

    们通过零件的外形特征就能分辨出每一个部件有什么样的用途。当然,对工具一窍不通的

    人可能只会认为这是一个有很多装饰品的水果刀。

    图4-25 瑞士军刀

    以上就是特征的重要性,通过特征人们甚至能够辨识出一些之前没有见到过的东西。

    对于一位成年人来说,记住某些特征是非常容易的事情,因为人的听觉、视觉、触觉都在

    帮助大脑来记录一些特征并长久保存。但是如何让一台计算机记住特征呢?它没有各种感

    更多电子书资料请搜索「雅书」:http:www.yabook.org觉,要想让它记住特征就教授它一些有用的特征量(我们姑且称这些特征为特征量)。那

    么,对于一件事物,我们应该选择什么样的特征量来让计算机记住呢?

    如果我们要想让计算机记住豹子,就需要教授它“有斑点”“猫科动物”等特征量。如果

    我们仅仅教它记住“有斑点”这个特征量,当计算机遇斑点狗的时候就会错误地判断其为豹

    子(见图4-26)。因此,斑点狗和豹子之间的区别特征量在于“犬科”和“猫科”的差别。

    图4-26 区别特征量

    从这一点来看,选取什么样的特征量决定了整个运算过程的精确度。就像前文所说的

    手写识别系统,为什么10个数字的图片资料要准备7万张?原因就在这里。我们再来看一

    个非常直观的例子,如果我们想要统计某一地区人们开什么品牌的汽车与收入呈什么样的

    关系(见图4-27),就需要统计数据。

    图4-27 某地区人们喜好汽车品牌与收入的关系

    我们简单看一眼就能发现,该地区人们喜好的汽车品牌跟性别和月收入有关系。或许

    青年人和中年人对于品牌的看法不同,也会导致他们选择与自己收入不符的汽车品牌,但是这似乎和“喜好颜色”没有关系。没错,问题就出现在这里,喜好颜色与需要统计的数据

    并没有关系,但是我们如何告诉计算机这样的特点呢?

    虽然机器学习已经有了比较大的进展,但是这个问题始终无法得到彻底解决。继自然

    语言处理之后,如何让计算机自己去选择合适的特征量成为了人工智能发展需要克服的又

    一道难题。

    松尾丰先生曾在其创作的《人工智能狂潮》一书中提到,他在听取黑桥祯夫教授的课

    程时听到了关于机器学习的事情。当时黑桥祯夫教授说:“方法有各种各样的,但是制作

    好的特征量是难度最大的工作,而这件事情只能靠人来完成。”可见,对机器学习来说,如果无法突破自我选取特征量这个关键点,那么人工智能可能永远只能是人类的一个美

    梦。当梦醒来的时候,机器依旧是机器,人工智能的难题仍然等待着被攻克。

    更多电子书资料请搜索「雅书」:http:www.yabook.org第5章 人工智能4.0时代:“深度学习”打破沉寂

    自从人工智能领域迎来了机器学习之后,真正的人工智能已经从“人类的美好梦想”变

    成了“通过努力可以实现的理想”,至少通过“图灵测试”已经变得不是那么可望而不可及

    了。从1.0到3.0,在人工智能发展的道路上,我们克服了一个又一个难题,就在即将看到

    曙光的时候,又一条鸿沟横在了我们与理想之间,人工智能的发展再度陷入沉寂。直

    到“深度学习”的出现,这种沉寂再次被打破。5.1 深度学习开创新时代

    21世纪,人工智能领域发生了两件大事,一件事发生在2006年,而另外一件事发生在

    2012年。

    2006年,杰弗里·希尔顿等人提出了“深度学习”(Deep Learning)概念。什么是深度

    学习?其实它是机器学习这门学科的一个分支,属于无监督学习(前文已介绍相关概念)

    的一种。通过教授计算机深度学习,就有可能解决深层机构优化的问题。与此同时,燕乐

    存等人还提出了卷积神经网络,这种多层结构学习算法与深度学习相结合就能利用空间的

    相对关系减少参数的数量,以此来提高计算机的训练性能。放到现在,有一个网络流行语

    可以将这种“学习”简单地形容出来:“我生活在二次元,你生活在三次元,所以你不懂

    我。”就好比虽然圆形这种平面图形与圆柱体这种立体图形有交集,但是圆柱体也有属于

    自己的结构。深度学习就是通过这种区分来缩减计算机需要参考的参数数量(见图5-

    1)。

    图5-1 圆形与圆柱体

    深度学习建立在模拟人脑进行分析学习的神经网络基础上,虽然它本身属于无监督学

    习的一种,但是它自身也具有监督学习和无监督学习之分。这并不矛盾,就像人类属于高

    级智慧生物一样,我们并不是超脱自然而存在的。在不同的学习框架之下,深度学习需要

    建立的学习系统是不同的,卷积神经网络只是其中的一种,从这点也不难看出,虽然它只

    是机器学习的一个分支,但是它的内涵是十分丰富的。

    深度学习的重点在于深度,什么是深度?机器学习的过程是数据从一个输入端经过节

    更多电子书资料请搜索「雅书」:http:www.yabook.org点进入到输出端,这个计算过程可以用图像来表示(见图5-2)。其中每一个节点都会有

    一个相应的算法和得出的数值,当数据最终从输出端输出后,这一整条路径就构成了一个

    函数,也可以看作一个分类区间。而深度学习比机器学习更看重纵向传输,也就是在某一

    个节点进行深度计算,找到从一个输入点到输出点的最长路径,这正是它与其他计算方法

    找捷径有所不同的地方(见图5-3)。

    图5-2 机器学习流向图图5-3 深度学习流向

    有了深度学习理论的基础之后,研究人员开始不断挖掘深度学习的价值,并且尝试将

    其实现,但是这种努力似乎始终看不到回报。于是,大家也从对于深度学习的狂热状态中

    走了出来,重新开始冷静思考深度学习的实际价值。

    直到2012年,在国际性的图像识别大赛ILSVRC(Large Scale Visual Recognition

    Challenge)上,由多伦多大学开发的Super Vision系统再度燃起了人们对深度学习的热

    情。图像识别已经超越了机器学习时代“老掉牙”的研究领域,但在实际应用上,通过机器

    学习,也就是人工输入特征量这种方法,即便是高端的技术系统,其错误率也在26%左

    右。但是,Super Vision系统的错误率仅仅为15%左右。该系统之所以能将错误率降低

    10%,就是因为它采取了深度学习,使计算机能够自动识别特征量。要知道,在过去很多

    研究者聚在一起,花一年的时间也许只能将这种错误率降低1%。

    除了Super Vision系统,同年6月,《纽约时报》披露了Google Brain项目。这个项目

    由人工智能界的顶尖技术专家共同主导,其主要内容就是尝试用包含16 000个CPU的并行

    计算平台来训练计算机的深度神经网络。后来,这个项目在语音、图像识别领域都创造了

    惊人的成果。

    互联网将全世界连接到了一起,与此同时也让海量的数据连接到了一起,而深度学习

    正是依托这些海量数据才能实现自我寻找特征量、建立新的学习模型。虽然我们在不断发

    展中发现的问题可能只是需要换一个方法去解决,但是如果没有一次又一次的冷静思考以

    更多电子书资料请搜索「雅书」:http:www.yabook.org及计算性能的不断提高,那么实现深度学习也就无从谈起。我们姑且认为现在已经进入人

    工智能4.0时代,而在这个时代,深度学习很有可能会让人工智能再度崛起并真正超越人

    类。5.2 自动编码器:输入与输出相同

    以目前的技术来看,人工神经网络无疑是机器学习十分有效的算法之一。这种算法不

    但具有非常强的非线性拟合能力,而且还具有极高的容错能力,能从自然环境的不确定因

    素里提取数据,并整理出符合条件的规则。但是在实际使用过程中,如果想要不断提高人

    工神经网络的这种泛化性,就要不断增加神经网络的层级数量,也就是我们在前文中提到

    的隐层。隐层的数量越多,人工神经网路能够处理的数据就越多。这就像人类的大脑一

    样,大脑开发越完全,脑沟就越多,而我们能够记忆、处理的信息就越多(见图5-4)。

    图5-4 亿万级数据处理与千万级数据处理对比图

    隐层数量越多,人工神经网络的自由度就越大,所能表示的函数也就越多,那么多层

    级的人工神经网络肯定会比一层或两层的神经网络的效果好,但事实真的是这样吗?在实

    际的测试结果中,多层神经网络的实效并不高,这是因为一旦层级变多,就无法保证内容

    的精准度。

    如果神经网络层级过多,那么误差反向传播就无法抵达下面的层级,或者可以说,无

    法准确将错误内容传达给下级进行修正(见图5-5)。公司颁布了重要消息后,都会一个

    部门一个部门地逐层传播下去,误差反向传播就是在处理这些重要消息,保证信息能够逐

    层传播下去。但是,如果消息传递是以口口相传的方式进行,就难免会导致信息失真。因

    此,公司在宣布重要通知时,多是以文字或会议形式传达给员工。神经网络无法在进行数

    更多电子书资料请搜索「雅书」:http:www.yabook.org据分类时将这些信息实体化,所以层级越多,产生误差的概率就越高。

    图5-5 三层神经网络与四层神经网络精确性比较图

    随着技术的不断发展和优化,人工神经网络确实实现了多层级的结构,这种结构是如

    何确保误差反向传播时的精准性的呢?

    有“加拿大诺贝尔奖”之称的“基廉奖”得主、人工智能杰出研究者、深度学习概念提出

    者杰弗里·希尔顿进一步优化了神经网络层级增加技术,继而产生了一种解决方案——自

    动编码器。

    其实,早在1986年就已经有了自动编码器的概念,但当时这种技术只用在了高维复杂

    数据处理上。随着深度学习概念的提出以及层级问题的出现,希尔顿等人在2006 年对自

    动编码器进行了改进。他们先用无监督逐层训练完成对隐层的测试,然后用误差反向传播

    对整个神经网络进行优化、调整,这种改良后的新型算法能够有效解决局部数据失真的问

    题。

    简单来说,自动编码器的功能就是为计算机学习的过程提供一个学习正解的机会。以

    前文中我们提到的手写识别来说明:应用了自动编码器后,我们手写输入的数据会在输入

    层就将正确的内容提供给计算机。例如,我们在手动输入汉字“冬”时,自动编码程序会将

    整个手写体“冬”字同时传输到输入层与输出层(见图5-6)。图5-6 自动编码器运作示意图

    自动编码器的这种功能看起来像是多此一举,实业家杰夫·霍金斯在其创作的《人工

    智能的未来》一书中预测了自动编码器的处理方式,并将其比作“就好像去蔬菜店买新香

    蕉时用旧香蕉来进行支付”。

    自动编码器真的是在做无用功吗?其实只要仔细分析,就能发现其中绝妙的细节处

    理。就像霍金斯先生提到的“用旧香蕉换取新香蕉”,从表面上看好像就是香蕉与香蕉交换

    的无用功,但实际上却是“旧”与“新”的交换。这就像我们在逐步用新版100元人民币替换

    旧版100元人民币一样,虽然是等值交换,但是如果不进行交换,那么所有旧版100元人民

    币就无法退出流通,而新版100元人民币就如同废纸一样。

    自动编码器的功能就是在现有的数据中将这些“旧香蕉”进行归类综合,从而缩减神经

    网络之间需要传递的信息量,以此来减少口口相传的中间过程,并保证信息的精准度。我

    们可以通过一个简单的例子来了解这个过程:我们每天都能看到天气预报,有些天气预报

    的覆盖范围甚至可以达到方圆几公里,那么天气预报是如何将预报范围精准到这样的程度

    的呢?其中的奥妙其实很简单——归类。如果北京是晴天,那么北京的东部和西部基本上

    也会是晴天,这样就不需要在每一个地方都安装监测天气变化的装置了。

    在天气预测中,预测系统能够随意生成范围的概念,例如东北部地区、西南部地区

    等,通过对这些范围内标志性天气的预报,就能预测出周围的天气,这样用较少的数据就

    能准确地将天气预测出来。

    人工神经网络虽然能提高信息处理能力,但是在处理的过程中会将同类信息分开处

    更多电子书资料请搜索「雅书」:http:www.yabook.org理。例如,有两个阈值都代表紫色,但处理过程中依据不同的算法,可能会得出两个答

    案:红色加蓝色或紫色。自动编码器通过归类将这两个信息都归纳为紫色,最终输出的结

    果也就只有紫色一种(见图5-7)。

    图5-7 自动编码器处理示意图

    哪些数据经过归类综合处理之后不会产生偏差?或者说哪些数据经过归类综合处理后

    会产生较大的偏差?在加入自动编码器后,这正是计算机需要学习的内容。当这些内容被

    计算机掌握后,误差率会变得越来越小。具有这些功能的人工智能可以进行多层级的操

    作,而最终结果也必然是人工智能采用的特征量越来越精准。对人工智能的发展来说,这

    是一个成长的必经阶段,而在成长之后究竟能够拥有什么样的智能,或许还需要时间来印

    证。5.3 多层架构深度挖掘

    深度学习能够帮助计算机分辨出自然界中混乱信息的特征量,而自动编码器能让这些

    特征量变得更为工整。那么这两者究竟是如何协同工作的呢?人工智能4.0时代的深度学

    习又是怎么让人工智能变得更加智能的呢?

    在深度学习中,多层级架构是一个需要重点攻克的领域。在这个领域里,当自然界中

    的数据被计算机接受后,自动编码器会在一定程度上取代原有的输入层,因此我们可以将

    隐层作为第一层,并将输出层作为第二层。隐层的作用就是将正确分类的数据输出给计算

    机,让其进行自我学习。如果我们假定神经网络接收到的信息有100个维度,那么经过带

    有自动编码器的隐层处理后,这个100维度将变成10个维度,随后这10个维度将作为下一

    个隐层(也可以被认为是下一层的输入层)并再度处理(见图5-8)。

    图5-8 深度学习与自动编码器结合示意图

    在图5-9中的第二个隐层中,数据在压缩后得到了质量更高的特征量,在进入下一节

    点或者说另一层节点的时候,这个数据在自动编码器的调节下,将被再一次还原为100个

    更多电子书资料请搜索「雅书」:http:www.yabook.org维度的信息,也就是说数据被反向还原了。在进入另一个层级后,这些数据将再度被分成

    不同维度的信息,最终在多个节点的共同作用下,数据被分成众多输出端的“已学习”内容

    (见图5-9)。

    图5-9 自动编码器工作示意图

    数据被一层一层分类学习后,最终成为一个一个的独立信息。对计算机来说,学习这

    样的独立信息所需花费的时间比集合学习某一些自然信息要少得多。当分层数量为无数层

    的时候,特征量也将变得极度清晰。也就是说,在第一层的时候计算机学习的是“脚”;而

    到了第二层就变成了“人类的脚”;第三层则是“五个脚趾的脚”……一旦计算机能够识

    别“特征1、2、3”这样的不变量,那么我们只要将这些概念的名称交给它就可以了,在有

    监督学习的系统中,这样的概念传授是一件十分简单的事。

    将一些有关联的东西结合在一起,组成一个具体的特征量,再从这些特征量中提取更

    多的高级特征量,最后给这些高级特征量标注一个概念,这就是深度学习与自动编码器协

    同工作的最终目的。这就像是人类在欣赏风景的时候,虽然我们只是漫无目的去观察各种

    各样的事物,但当我们一眼扫过的时候却可以在大脑中处理完这些信息,产生许多概念,例如“枫叶变红了”“野果已经熟透了”等。

    其实,我们的大脑在观察一些事情的时候也进行着分层结构处理,尤其是在我们刚刚

    认知事物的时候:桌子与凳子的关联是什么?区别是什么?可以吃的食物有什么特征?如

    何区别食物和桌子?我们从这些海量信息中寻找到特定的特征量,进而通过这些特征量提

    取出更高级的高级特征量,最终分辨出桌子是不能吃的、食物不会是木头做的……随着特

    征量的积累和淬炼,我们开始越来越了解周围的世界。从这个角度来看,也许深度学习和

    自动编码器的结合正是在模拟大脑的运作过程。那么,这个过程会不会一直支撑人工智能

    发展下去,直到它替代人类大脑进行思考的那一天呢?5.4 情绪识别里的“深度学习”

    深度学习虽然是人工智能4.0时代才出现的新生事物,但它却成为了人工智能像人脑

    一样处理数据的关键技术。目前,谷歌、Facebook、亚马逊等互联网巨头都在乐此不疲地

    投入大量的人力和资金研究这种技术。在第1章中我们已经介绍了谷歌的猫脸识别系统,这种充分运用深度学习的系统能够自主学习并分析出特征量,以此来分辨出哪一张脸是猫

    脸,让人工智能轻松告别“脸盲”。不过,由于媒体对猫脸识别争相报道,却使另外一项看

    起来更加符合深度学习特点的技术被埋没了。

    对人类来说,表达情绪是一件非常简单的事。对于旁人来说,只要你没有刻意隐藏自

    己的情绪,那么识别你的情绪也是极为容易的一件事,就连咿呀学语的婴儿也能感受到抱

    着他的人是高兴还是愤怒,我们经常可以看到刚刚还在笑的小孩突然因为大人的严厉话语

    而哭泣,这就是人类对情绪的识别。谷歌的猫脸识别技术虽然能够区分猫脸和狗脸,但是

    无法分析出来哪些是开心的脸哪些是生气的脸。而一些静态的图片表情就连人类也难以识

    别,更不要说一台机器了(见图5-10)。

    这些表情你都知道是什么意思吗

    图5-10 表情图谱

    一说到机器人,我们首先联想到的是机器而不是人,原因可能是没有一台机器能正做

    到拟人化,情绪识别就是其中一个难题,而这也是阻碍人工智能更加“类人”的原因之一。

    很多互联网巨头都在尝试攻克这一难题,不是因为谁有了这项技术就能垄断市场,而是因

    为这项技术能让人工智能看起来更加智能。

    2015年5月,IBM宣布其已经开发出了一种能够感知人类情绪的在线客服系统,并在

    原有在线客服系统的代码上加入了这种新的情感识别代码。这种人工智能能够在与客户对

    话的过程中感知客户的情绪,以便提供更加贴心的服务。

    IBM之所以能够做到这点,除了有巨大的数据库作支撑,还因为IBM在深度学习上有

    更多电子书资料请搜索「雅书」:http:www.yabook.org着非凡的造诣。这两者的密切结合才让在线客服识别客户的情绪。

    也许有人会说,这样的人工智能简直是多此一举,因为人工客服也能通过客户的语气

    来识别客户的情绪。但是,计算机的处理速度是人类的数倍,一台计算机也许能在同一时

    间内接待几十位甚至几百位客户,这是人类做不到的事情。试想,如果我们因为对服务感

    到不满而希望通过客服来解决问题,但是我们听到的只是没有情感的机器在回答“您好,请稍等”或“对不起,请返回主菜单重新选择您的问题种类”,这样的回答只会让我们的情

    绪越来越糟糕。但是,如果此时我们听到是劝解和一些适合的话题,那么客户的体验和反

    响又会是什么样的呢?

    在前文中我们提过,计算机要想对自然界的数据进行处理,依赖的是海量的数据。情

    绪识别也是这样,只不过这种识别除了要依赖海量数据以外,还需要深度学习的辅助。以

    Affdex系统为例,它能够对人类的情绪作出精准的判断。它将面部表情转换成为46种“动

    作单元”,而通过深度学习计算机可以将这46个“动作单元”组合成2.83亿种表情(见图5-

    11)。

    图5-11 情绪识别分级

    在表达高兴的情绪时,嘴唇、下巴和眉眼会发生相应的变化,所处的位置级别也有所

    不同(如高兴时,嘴角是13B级别,下巴是17B级别,眉眼是25D级别)。通过这样的分

    级,计算机经过深度学习的处理后,就能将不同级别的组合归类,最终得出结论,并分析

    出情绪的种类(见图5-12)。图5-12 高兴表情

    装载了这种识别技术后,计算机就能实时捕捉到人的表情。通过数据库的反应和回

    馈,人工智能甚至能够识别各种伪装出来的表情。例如,虽然主要数据显示的都是高兴的

    表情,但是你的眉眼或下巴的数据并不是“高兴”应该对应的数据,而是隐藏着一些愤怒或

    伤心的数据,那么计算机就能判断出你露出的表情是一种“假笑”。当然,在真实的面部表

    情中也有一些支点的数据是不会发生变化的,比如我们鼻子上的支点,即便是“假笑”也不

    会发生变化。如此一来,人工智能就需要自动编码器的帮助,通过深度学习和自动编码器

    的相互配合,相应的表情数据也会变得丰富,而一些细微和复杂的表情也不会干扰计算机

    的正常判断。

    2016年1月,苹果公司宣布收购人工智能公司Emotient。Emotient是一家专门研究人工

    智能如何识别人类情绪的公司,Emotient可以通过摄像头来捕捉人类面部肌肉的运动,以

    此作为人类情绪变化的数据。虽然Emotient与Affdex的分析方法有所不同,但是本质上都

    是依靠深度学习来进行情绪识别。

    深度学习能够使人工智能体会到人类的喜怒哀乐等多种情绪。如果有一天人工智能能

    够读懂任何人的真伪表情,那对人类来说也就没有什么“面具”可言了。人类将回归到“百

    分之百诚实”的时代,这对人类来说究竟是好事还是坏事呢?

    更多电子书资料请搜索「雅书」:http:www.yabook.org5.5 鲁棒性:飞跃发展的关键

    深度学习和自动编码器是人工智能得以深入发展的契机。换句话说,两者是人工智能

    发展的必备软件,只有人工智能的“软实力”不断提高,才能真正有机会拥有“类人”的智

    慧。提到“软实力”,就不得不说支持人工智能的另外一大“软件”——鲁棒(见图5-13)。

    图5-13 支撑人工智能的三大“软实力”

    鲁棒是英文Robust的音译(即强壮、健壮的意思)。在计算机运行过程中,鲁棒决定

    了计算机能否在危险环境或异常情况下继续“存活”下去。例如,在计算机被恶意攻击、过

    载或输入错误的时候,鲁棒性的好坏决定了计算机是否会死机、崩溃。如果鲁棒性好,那

    么计算机就能在“恶劣的环境”中继续完成自己的工作;反之,则会随着环境的恶化而逐

    渐“死去”。

    具体来说,鲁棒性指的是控制系统在一定的参数摄动下,维持某些性能的特性。根据

    这些维持性能来区分,鲁棒性还可以细分成稳定鲁棒性和性能鲁棒性(见图5-14)。图5-14 鲁棒性的分类

    鲁棒性早在20世纪70年代就已经在统计学中被提及,早期它流行于控制理论的研究过

    程中。由于鲁棒性在中文里面并不容易理解,因此当时鲁棒性还有一个更为容易被人理解

    的名称——抗变换性。

    为什么我们要在这里提到“鲁棒性”这一专业术语呢?其实这个看似晦涩难懂的词语正

    是人工智能飞跃发展的关键点所在。在计算机解决实际问题的过程中,系统的特性和参数

    的摄动几乎是不可避免的。这是因为计算机在处理海量数据时,尤其是在深度学习过程中

    处理错误数据的时候,这些数据值往往会取代原本的标准值,这是研究人工智能的过程中

    必须要考虑的基本问题,而计算机具有的鲁棒性就是处理这些数据时的重要保障(见图5-

    15)。

    图5-15 鲁棒性支撑人工智能

    当系统中存在模型摄动或随机干扰等不确定性因素时,能够保持其满意功能品质的控

    制理论和方法称为鲁棒性控制。早期的鲁棒性控制只是研究单回路系统频率特性的某些特

    征,或者分析小型摄动出现时的灵敏度问题。但是随着人们对深度学习的研究不断深入,现在对于鲁棒性控制还要着重研究控制系统中非微有界摄动下的分析与设计的理论和方

    法。这是因为如果鲁棒性控制能够调节系统在处理某种信息时的抗干扰性(其中包括自身

    模型的干扰),那么在某个性能指标不发生变化的时候,就能调节其他的数据处理能力。

    例如,如果我们能够保证电视机遥控器的电量充足,那么就能在运动的过程中换台,而要

    想保证电视机从关闭状态调节成开机状态,也需要遥控器的配合。除此之外,在研究人工

    智能的时候,还要保证在鲁棒性足够稳定的情况下,目标的品质能够保持在一个比较高的

    水平,也就是经过处理的数据品质要高。就像工厂生产的机械臂一样,我们不但要保证机

    械臂能够稳定工作,还要保证机械臂所制造的产品质量合格。鲁棒性的进一步发展和应用

    决定了关于人工智能的种种设想能否成为现实。

    在实际应用中,一般会假设一个系统运行过程中的动态特性以及这个特性的变化范

    围。通常情况下,我们用这个范围的极端值来测试在鲁棒性控制下系统建立模型的情况,这个极端值通常会是最差极端值。这很好理解,因为我们在测试某个事物的性能时,一般

    更多电子书资料请搜索「雅书」:http:www.yabook.org不会选择最好的环境,否则测试的结果将可能无法适应实际情况(见图5-16)。

    图5-16 鲁棒性测试的环境选择

    通常这种极端环境下的鲁棒性都需要由专家设计,一旦设计能够进行测试就不需要人

    为干预,这与深度学习的思维相辅相成。上文中提到的情绪识别就是基于优质鲁棒性而研

    究成型的技术。在计算机识别人类情绪的时候,好的鲁棒性才能保证计算机在识别细微表

    情变化时的精准度。如果鲁棒性不达标,那么在人类情绪波动比较大的时候,自然界提供

    的数据就会以几何级数增加,如同让一个年迈的老人去背负几百斤的货物,其结果可想而

    知。

    目前,已经经过测试的鲁棒性控制方法,大多数都依赖于对系统数学模型进行的精确

    数学分析,这就导致了虽然我们在线性系统方面取得了较好的成绩,但是对于非线性系统

    的研究有所欠缺。我们要想在人工智能的深度学习上取得更多的成果,就必须摆脱对数学

    模型的依赖。作为人工智能领域的前沿课题,鲁棒性研究还需要更好地向非线性系统扩

    展。当这个关键点被突破的时候,或许人工智能就能产生质的飞跃,突破4.0时代的束

    缚,人工智能也将能够真正升华成“类人智能”。第6章 正在展开的未来:人工智能对人类社会的影响

    智能化是信息技术的发展趋势,也是当今社会的重要特征。人工智能技术的发展日新

    月异,人工智能的普及为产业带来模式变革的同时,也将使人类的生活变得更加舒适便

    捷。毋庸置疑,人工智能必定会在未来的社会中留下浓墨重彩的一笔。

    更多电子书资料请搜索「雅书」:http:www.yabook.org6.1 人工智能对人类社会的影响

    “好雨知时节,当春乃发生,随风潜入夜,润物细无声。”这首诗用来形容人工智能之

    于人类社会再形象不过,它正悄悄融入人们的日常生活。

    打开iPhone,我们可以把自己的需求告诉“虚拟个人助理”Siri(见图6-1)。Siri可以听

    懂我们的语言,根据我们的语音指令调用系统自带的天气预报、日程安排、资料搜索等应

    用,满足我们的需求。不但如此,它还能够不断学习新的声音和语调,与我们进行对话式

    的应答,与Siri说话仿佛跟朋友聊天一样。

    图6-1 苹果语音助手Siri

    我们的生活中到处都是人工智能,而随着相关科学技术的发展,人工智能将会对人类

    社会产生更大、更多的影响。

    1.让生活更便利

    说到智能家居,大家可能并不陌生,它是物联网的一个典型代表。但是智能家居目前

    仍然只是一个概念,并未真正走进人们的生活,为什么呢?因为以目前的技术来说,智能

    终端还不能让所有智能设备同时联通。而人工智能技术恰好可以解决这一难题,为人们打

    造真正的智能家居。

    2016年3月8日,海尔U+智慧生活平台在上海发布了U+智慧生活2.0战略,以“U+智慧

    生活大脑”为基础,以人工智能自然交互、用户定制解决方案、生态圈场景商务模式为支撑点,打造令用户信任的智慧生活平台,以此在智能家居行业抢占先机(见图6-2)。海

    尔U+智慧生活平台是一个开放透明的平台,它的开放接口协议可以实现各种不同家电服

    务系统互联互通的接入。而“U+智慧生活大脑”是海尔U+智慧生活平台的思考决策中心,它是海尔与微软合作推出的人工智能设备。它采用了语音识别和图像识别等自然交互技

    术,可以理解人们的要求,感知用户的生活习惯和行为喜好,并依此控制家电,实现智能

    服务。

    图6-2 海尔U+智慧生活上海世博宣传海报

    科技发展如此迅速,想想以后拥有各种智能设备的生活,实在让人心动不已。早上醒

    来,智能机器人已经为你做好早餐,你可以在多赖一会床而不必担心家人是否有饭吃;出

    门上班时,车辆启动自动驾驶,已经为你选好最近、最快捷的路线,而不必担心疲劳驾驶

    的危险;去商店买衣服有智能设备为你服务,为你推荐适合你的尺码和款式;出差几天后

    的家里已经脏乱得不像样子了吧,不用担心,房屋内的智能设备会自动清扫,还会为你调

    节最适宜居住的温度……拥有了智能化的生活设备,我们仿佛都变身为王室贵族,从此不

    必再为琐碎的家务而烦恼(见图6-3)。

    更多电子书资料请搜索「雅书」:http:www.yabook.org图6-3 智能化家居

    2.人工智能影响就业

    《纽约时报》的机器人编辑Blossom可以对社交网络上的海量文章进行大数据分析,从而预测出更具社交推广效应的内容;新华社在其成立84年之际,开发写稿机器人“快笔

    小新”,为通讯社编辑体育赛事和财经信息稿件;继《纽约时报》与新华社之后,韩国的

    《金融新闻》也正式启用了一名人工智能编辑,记者、编辑这类职业大有被人工智能取代

    之势。

    2015年,李彦宏在世界互联网大会上表示:在不久的将来,人工智能将取代所有简单

    重复的脑力劳动,事实上甚至连需要思考的人类工作也将被取代。在2016年的美国科学促

    进年会上,有科学家发出警告:人工智能发展迅速,在未来30年可能将导致千千万万的人

    失业,影响各行各业。

    人工智能可以进行简单的智力和劳力工作,这意味着某些行业以后可能会成为人工智

    能的天下,原有劳动力必须大量转移,而转移过程中就会不可避免地产生失业。也许考虑

    人工智能是否会有一天统治人类社会还为时尚早,但在服务行业,人工智能设备的大量运

    用着实会令一部分人隐隐担忧。我们的工作是否会被人工智能所取代?如果大部分的工作

    都可以依赖不会疲劳、不会抱怨的人工智能机器,那么人类该置于何处?工作是人生价值

    和意义的一部分,如果有一天许多工作岗位都换上了人工智能机器,是否会有足够的、更

    高级的职位空间来安排“闲散”的人类?人工智能使人类从低级的劳务工作中获得解放,但

    也同样让人们陷入失业困扰。

    在美剧《真实的人类》中,智能机器人可以代替人做保姆、司机、秘书、私人护士、健身教练、工厂工人,甚至可以替代人成为理想的伴侣。人类感到恐慌,纷纷示威游行,宣告“我们才是人,我们需要工作”。如果真有这么一天,大部分工作都可以由人工智能来

    进行,可能是一件很可怕的事情。这种可怕不仅来自于失业的烦恼,更是在于人们被剥夺

    工作后存在感的缺失。

    3.人工智能调整产业结构

    在“中国制造2025”“互联网+”等一系列战略指导下,转型与创新成为时下中国的关键

    词。人工智能技术及产品不但符合了国人的新需求,还能让国内很多传统企业通过人工智

    能进行转型。除此之外,人工智能还有助于推动新一轮创新热潮。新兴科技和新兴产业的

    深度融合将会引发新一轮信息技术革命,并成为中国经济结构转型升级的新支点。

    中国科学院副院长谭铁牛说:“人工智能技术的发展将对传统行业产生重大颠覆性影

    响,‘智能+X’将成为创新时尚。人工智能将在国防、医疗、工业、农业、金融、商业、教

    育、公共安全等领域得到广泛应用,催生新的业态和商业模式,引发产业结构的深刻变

    革。”

    人工智能必定会在未来的社会中留下浓墨重彩的一笔。智能化是信息技术的发展趋

    势,也是当今社会的重要特征。人工智能的普及为产业带来模式变革的同时,也将使人类

    的生活变得更加舒适、便捷。

    更多电子书资料请搜索「雅书」:http:www.yabook.org6.2 将要消失的职业与被保留的职业

    坐在计算机前的你正醉心于工作,敲击键盘,把时间转换成文字,再把文字转换为薪

    资,这份工作还算令人满意。

    但你有没有想过,有一天你的工作会被人工智能所取代?而你要么另谋高就,要么只

    能失业!“怎么可能?”你说,“我又不是在工厂工作!”可是,现在的人工智能不只是工厂

    里的机械手臂,它还能像记者、编辑一样写稿子!如果记者都有被人工智能取代的可能,那么坐在办公室打字的你还能高枕无忧吗?

    人工智能融入人类生活曾经是科幻电影中的场景,而如今它们正从荧幕走向现实。其

    实,现在有很多工作正在或已经被人工智能设备所取代。

    1.智能机器代替工人从事劳力作业

    开矿采石、装货运货、工厂车间等这些在以前需要大量人力的工作已经越来越多地被

    智能化设备所取代,繁重的工作大多交给了机器,而只有少量的工人负责机器的运行和维

    修。现在,许多汽车公司的生产线上需要的工人越来越少,自动焊接机器人、自动组装智

    能机器、自动喷漆设备已经逐渐取代了焊接工人、组装工人及喷漆工人(见图6-4)。随

    着人工智能技术的发展,工业自动化程度会越来越高,而相关的岗位也将越来越少。

    图6-4 自动化焊装车间

    2.人形智能机器接手服务行业

    也许你见过餐馆的自动清洗设备,也许你也听过机器人为店里的顾客送餐,可是你想

    到过酒店的前台招待也将变成人工智能机器人吗?甚至连演员、导游这一类的职业都有可能被兼具情商与智商的人工智能机器人所取代!

    日本的Henn-na机器人服务酒店目前是全球唯一一家靠机器人为客人提供服务的酒

    店。店中的机器人精通日文、中文、英文三种语言,可以与人进行交流,甚至能读懂人类

    的肢体语言。该酒店之所以特殊,是因为从办理入住到行李搬运、从调制咖啡到打扫卫

    生,这类服务工作都由机器人完成!该酒店店主表示机器人服务员承担了店内约70%的工

    作,既节约了运营成本,又提高了工作效率,同时还以这一前卫的服务为本店做了有效宣

    传,大量游客慕名而来(见图6-5)。

    图6-5 服务机器人

    2016年世界经济论坛上发布的报告称:未来五年,人工智能技术的发展将使全球劳动

    力市场出现颠覆性变革,全球15个主要国家的就业岗位将会减少710万个,上千万人将会

    面临失业。人工智能技术发展迅猛,工作中可以自动化、计算机化的任务越多,智能机器

    设备就越容易上手。世界经济论坛报告称,办公岗位和行政岗位更容易被人工智能技术所

    取代。此外,司机、建筑工人、裁缝、快递员、保安、家政保姆等职业也有可能在不久的

    将来被人工智能技术所取代。另外,一些有危险性的工作也可以由人工智能设备代替人类

    承担。

    如果这么多工作都可以由人工智能来代劳,人类将位于何处?在人工智能的浪潮下,还有哪些职业可以安枕无忧?其实我们也不必过于担心,即便是人工智能发展到了能够模

    拟人类智慧的地步,一些职业也不会被其替代。

    日本野村综合研究所称,那些依赖计算机、分析数据和系统化的职业,以及不需要特

    殊技能与知识的职业,在未来很可能被人工智能所取代。但是,那些需要跟他人的合作、理解、说服、谈判的职业,以及要求整理和创作一些抽象概念的职业(如艺术学、历史

    学、哲学等)则很难被人工智能取代。

    智能设备也许可以让我们获得更多的知识,但是它无法取代我们的老师;它们也许可

    以更快速、更标准地画图,但无法取代艺术家的灵感;它们也许能够跟人类进行简单交

    更多电子书资料请搜索「雅书」:http:www.yabook.org流,但无法替代心理医生对感情、心理的掌控;它们也许可以参演电影,但无法超越导演

    的创作。人工智能可以应用到医疗手术,但是如果没有医生,谁会放心把自己的性命交于

    机器手中?人工智能可以辅助警察搜集证据、追踪嫌疑人,但大概没有哪个国家会把执法

    权完全交付给机器。将来,也许记者、编辑,甚至播音主持都可以由人工智能来替代,但

    是策划、领导之权仍会掌握在人类手中;而作为科学技术的产物,人工智能也毫无取代人

    类科学家的可能(见图6-6)。

    图6-6 职业发展趋势

    人工智能技术的发展对人类的工作起着一定的优化作用,虽然它淘汰了某些工作,但

    同时又催生了新的职业。例如,计算机取代了以前的人工计算,而后产生了各种以计算机

    为依托的工作。人工智能的发展也将会如此,它将带来新的职位。

    2015年,美国科学杂志《新科学家》表示,依托于人工智能热潮的一种新的职业正在

    兴起——机器人助手。机器人助手负责在机器人无法确定指令时为其提供帮助,同时加强

    机器人的学习能力。例如,Clara Labs、Facebook等专注于人工智能研究的公司已经有了

    类似电话机器人的语音虚拟助手。Facebook发言人阿里·安丁说:“我们创造了这种职

    业。”

    与其担忧我们的工作会不会被人工智能抢走,不如思索如何才能更好地发展自己。谁

    也不想去做低级的工作,具备前瞻性的眼光,培养创新意识,你的才华终有用武之地!6.3 人工智能催生新业务

    如果说移动互联网时代的关键是连接一切,那么在人工智能时代,则是将一切智能

    化。人工智能技术与互联网技术的结合有利于引导新一轮创新热潮,催生新业务。

    无论在学术界还是产业界,人工智能都得到了前所未有的关注。产业资本趋之若鹜,各大产业巨头纷纷布局人工智能,以开拓新业务。Facebook在人工智能领域的布局主要围

    绕用户的社交关系和社交信息展开,它的面部识别软件的精准度可以达到97%。扎克伯格

    曾透露,2016年的新目标是打造一个人工智能助手,它可以理解主人的声音,帮助主人控

    制家里的智能设备。IBM基本是围绕Watson和SYNAPSE在人工智能领域进行布局,同时

    秉持开放平台的理念,并打算建造一个真正的人工智能系统。谷歌秉承“将全世界的信息

    联系起来并给出最佳处理结果”的理念,从传统业务覆盖的移动互联网、互联网等领域布

    局人工智能,甚至有些已经延伸到了细分后的智能家居、自动驾驶、机器人等领域。同

    时,谷歌还大力研发人工智能技术,增强设备的语音识别能力和深度学习能力,计划将人

    工智能渗透到人们生活的各个方面。

    2014年年初,谷歌以4亿美元收购了深度学习算法公司Deep Mind。此后,Deep Mind

    在10月发布了一种新的模拟神经网络。该网络可以模仿人类大脑工作记忆原理,以提高任

    务处理速度。这种深度学习算法可运用于语音识别领域。

    谷歌前瞻性地意识到智能家居领域将会是人工智能应用领域的一个重要市场,因此谷

    歌以32亿美元收购了智能家居制造商Nest,并在5个月后以5.55亿美元收购基于云端的家

    庭监控公司Dropcam,着力打造智能家居生态系统。

    2015年5月,谷歌推出Google Photos这一图片搜索系统,并称输入特定人物的词条,则会检索出对方从婴儿到现阶段的所有照片。之后,谷歌以Tensor Flow平台的形式开源

    了Google Photos的人工主题部分,实现更为智能、更为强大的图片搜索功能。

    从2009年开始研发到现在,谷歌的无人驾驶汽车已经累计在路上行驶了140万公里之

    多。今年3月,谷歌表示计划增加对美国国会的游说 ......

您现在查看是摘要介绍页, 详见PDF附件(5869KB,153页)