本书分为四个部分。
第1部分简单概述人工智能。
第2部分对概述进行扩展,并加深读者对机器学习的理解。
第3部分涉及神经网络,即计算机通过使用相互连接的多层人工神经元层来模拟人脑的结构和功能。
第4部分介绍一些使用人工智能辅助商业的常用工具。
本书通俗地介绍人工智能(AI)和机器学习(ML):它们是如何工作的,能做什么,不能做什么,如何借助它们获利。这本书为非技术高管和非专业人士撰写。罗斯基于多年的教学和咨询经验,以直观的类比和解释揭开了AI/ML技术的神秘面纱,解释了从早期的专家系统到先进的深度学习网络的发展。
首先,罗斯解释了人工智能和机器学习是如何出现的,探索了早期持续影响该领域的关键思想。接下来介绍机器学习的关键概念来加深你的理解,并展示机器智能如何创建策略并从错误中学习。接着,介绍了目前强大的神经网络一个受人脑结构和功能启发而形成的系统。后介绍了领先的AI应用程序。在整个过程中,罗斯始终专注于业务,介绍如何应用这些技术来探索新的机会,解决实际问题。
通过阅读本书,你将学会:
比较机器学习的不同方式,并探索当前领先的机器学习算法。
从正确的问题开始,避免人工智能/机器学习项目中可能出现的常见错误。
使用神经网络自动决策并识别意外模式。
学会帮助神经网络更快、更有效地学习。
梳理AI聊天机器人、虚拟助手、虚拟代理和会话AI等商业应用。
几千年来,人们对人工智能情有独钟。在古代神话中,古希腊神赫菲斯托斯通过娴熟的技法,使用锤子制造了巨型青铜机器人,名为塔罗斯,目的是保护克里特岛的欧罗巴免受海盗侵害。1817年,玛丽·雪莱撰写《科学怪人》之时也在深入思考人工智能的相关问题。1927年,经典的未来主义电影《大都会》推出名为玛丽亚的机器人,它的使命本是照顾孩子,但终让城市陷入了混乱。
神话和科幻小说激发了人们的想象力,让人们考虑人工智能可能带来的灾难,哲学家们仍在努力定义人类智慧的本质。17世纪初,托马斯·霍布斯有一句名言推理就是计算(Reason is nothing but reckoning)。他得出结论:人只不过是记忆之和,或许人类的记忆可能通过编码变成机器智能。
20世纪60年代,哲学家休伯特·德雷福斯批评了机器智能的这一观点,并就此写了几本书,其中著名的作品是于1972年首次出版的What Computers Cant Do: A Critique of Artificial Reason,他的主要论点是,人类的本能永远无法用正式的规则来捕捉。
电影《终结者》暗示着创建像天网这样的智能网络也许很容易,但是也可能由于简单的二进制计算错误而导致人类毁灭。硅谷名人一直在争论人工智能是人类的成就还是会使人类灭绝的终原因。
神话、科幻小说和哲学使人工智能这一主题引人入胜。但当我们开始研究人工智能机器的工作方式时,很难确定这是惊艳之举还是乏善可陈。一方面,人工智能的一些功能是卓尔不群的,比如,乘坐自动驾驶汽车是一种非常惊艳的体验。另一方面,现代人工智能大多专注于解决分类问题。智能机器能够对数以百万的照片、视频或音频文件进行分类。但这不是那种能促使你建造地下掩体或者开始粉碎机器人的技术。
当然,人工智能具有无限潜力,但是我们倾向于根据事物的表现而不是潜力来进行判断。到目前为止,人工智能表现良好。近年来由于可以使用大规模的数据集,机器获得了足够的输入,终对人类和人类生活的世界有了更深入的认知。机器能够识别人类无法识别或者根本想不到的数据模式,即使在识别数据模式这一维度,人工智能性能水平与人类智能之间仍然存在巨大差距。
来自人工智能的威胁与源自人性的威胁也存在巨大差距,人工智能带来了实际的和伦理上的挑战。轮挑战主要不是关于创造众生的伦理方面的影响,而是关于彼此之间的责任。不要把人工智能想象成电影《终结者》中毁灭人类的存在,它更像1981年的小众经典电影《纽约大逃亡》中所呈现的。这部电影上映时,16岁至24岁男性的失业率高达84%。影片中把纽约想象成一个无情的、无法无天的城市丛林,不得不被改建成监狱。在流氓机器人造成生存威胁之前,人类和人工智能彼此之间的道德义务将会困扰我们很久。
人工智能带来的个挑战必然是如何援助那些失业的人,因为他们掌握的技能将会被自动化淘汰。如何安置成千上万被人工智能替代的卡车司机、出租车司机、零售工人、机器操作员和会计师?他们不可能都转行去当程序员、瑜伽教练、私人教练、YouTuber和艺术家。
自动化带来的社会经济挑战很可能会掩盖机器胜过人类这一担忧。我们担忧的不应该是超级计算机控制机器人军队来对抗人类,而应该担忧自动化汉堡机取代你侄子在快餐店中工作,毕竟,他可能依赖这份工作来支付大学学费。
当你在思考人工智能可能造成的影响时,就应该意识到这些挑战。但是本书并不涉及如何应对社会经济挑战,只讨论机会,具体来说,只涉及商业机会。为了找到商机,你应该对人工智能这一工具有一个全面了解。
细想下来,企业并没有因为率先进入市场而成功。苹果公司并不是个制造音乐播放器的公司,谷歌也不是个搜索引擎。这些公司能够成功,是因为它们了解工具和技术的适用范围,并知道如何将它们应用于当前和未来的业务中。
这本书就是一本带你成功应用人工智能的书。你将对人工智能行业中的各种技术有一个高屋建瓴的认识。在本书中,你将了解将这些技术应用于商业的案例。一旦你弄懂了这些工具,就将占据先机,具备为新业务或现有业务制定长期战略的能力。
商业机会太多,不能一一列举,这还不包括有待发现的机会。我希望读者能够理解技术的适用范围并能将它们应用于自身的组织中,甚至能创造新的商业机会。
本书分为四个部分。部分概述人工智能。第二部分对概述进行扩展,并加深读者对机器学习的理解。第三部分涉及神经网络,即计算机通过使用多层相互连接的人工神经元层来模拟人脑的结构和功能。后,第四部分介绍了一些使用人工智能来辅助商业的常用工具。近年来由于计算机存储、处理技术的可用性不断提高,成本不断下降,以及可以获得海量数据,人工智能领域变得备受关注。
在部分,你将了解推动批智能机器的设计的早期理论。这些理论大多是从理解人类智能开始的。智能意味着什么?是将符号与概念相联系的能力吗?是我们的创造力吗?
你会看到早期计算机科学家在尝试创建代智能程序时所付出的努力。初,许多计算机科学家专注于符号推理。他们认为,如果能够让计算机识别人类符号,这将有助于它们更好地了解人类世界。因此,他们构建了用于识别字母表中的字母、数字和不同图形(如停车标志、问号)的智能系统。
这些早期想法至今仍影响人工智能的发展。符号推理方法演变成了后来的专家系统,专家系统通过运行数不清的if-then判断语句进行思考和决策。例如,如果看到A,则发出ah的声音,如果看到停止标志,就停下来。每一个决策点都必须缜密地事先编程到计算机中。
20世纪90年代,专家系统是人工智能的主要形式。公司使用专家系统进行医疗诊断,批准或拒绝贷款申请,选择股票,等等。计算机是通过长长的if-then语句来实现这些功能的。用于贷款的专家系统会运行预定义好的判断列表,例如:如果有信用记录,是否有逾期付款?如果有逾期付款,在过去一年有几次逾期记录?如果过去一年拖欠还款超过十次,则拒绝这项贷款申请。
可想而知,所运行的判断列表会很长,需要人们去思考所有可能的判断规则。这是一项非常复杂的任务,终会导致组合爆炸有太多的可能性,人类很难考虑到所有不同的组合。
当程序员遇到这些限制时,他们开始重新审视机器学习思想。机器学习早在20世纪50年代早期就已存在,它被用于编写可击败人类玩家的西洋跳棋比赛程序。跳棋程序很有创新性,机器可以执行自己的策略并从错误中学习。即使是这些早期的计算机也足够先进,能学会如何击败人类玩家。
机器学习是基于编程指令和仅模拟了人类思考和决策过程的if-then语句的一次巨大飞跃。本书的第二部分深入讲解机器学习,揭示它如何改变传统软件的开发规则。
使用机器学习技术完成某项任务,无须对机器进行显式编程,机器可以直接利用大量数据集并构建自己的决策逻辑。机器学习技术可以从数据中学习并构建模型可以生成解释数据之间关系的规则,并根据这些规则得出结论,做出决策和预测。
通过机器学习,你可以给智能机器提供制造汽车所需的所有数据以及制造好的汽车原型,智能机器通过全面学习数据,开始理解什么是汽车,它知道汽车需要轮子、门和挡风玻璃。也许有数千种不同类型的汽车,但是智能机器会创建一个模型来识别所有汽车。
为了使机器能够创建模型,程序员开发了许多高级机器学习算法。机器学习算法是一种数学函数,可使机器识别输入和输出之间的关系。程序员的工作已经从编写明确的指令转变为创造和选择正确的算法。
为了将机器学习提升到更高的水平,计算机科学家提出了人工神经网络的概念,这就是本书第三部分的主题。人工神经网络将大脑的结构和功能作为模板,它包含一个相互连接的人工神经元网络,每个神经元都包含一个机器学习算法。这些神经元依据其他神经元的输入、与其他神经元的连接强度、决定性神经元的算法和内部偏差来做出决策。
人工神经网络的灵感来自生物神经元在人脑中的工作方式。人类会通过增加神经细胞之间的连接强度来进行学习和记忆。
现代人工神经网络可以形成由数十亿个神经元组成的机器学习系统。这么复杂的神经网络具备从海量数据集中挖掘出隐藏模式的能力。通过将数据输入神经网络,神经网络系统将创建模型来更好地识别更多的模式。例如,可以将数百万幅狗图像输入神经网络中,并使其进行自我学习、建模,让系统具备识别狗的能力。这种模式可能与人类识别狗的模式不尽相同。它可能无法通过观察狗的形状、颜色、耳朵和鼻子来识别狗,而是通过识别狗图像中不同点的统计模式来获得对狗的认知。从某种意义上说,神经网络形成了自己的一套独特的认知狗的方式。这种认知方式可以让神经网络系统做到即使从未见过狗,也能够学会正确识别狗。
你应该想象得到,神经网络的预测能力具有广泛的实际应用价值和巨大的商业潜力。在金融行业,神经网络可以用于发现市场趋势,指导人们进行交易。在制药行业,神经网络可用于发现现有药物的特征,并将其与新化合物进行比较。在零售行业,神经网络能够帮助从业者挖掘出客户购买商品的模式,预测顾客下一次的购买意向。
许多大公司已经将神经网络用于语音识别、转录和个人数字助理。例如,如果你订阅了Netflix,则系统会根据你过去观看的内容为你推荐电影和节目。亚马逊使用神经网络进行有针对性的产品推荐,并为其个人数字助理(如Alexa)提供技术支持。
但享受神经网络的价值并不需要你付出巨大努力,想想你所在组织的数据,并从中挖掘出潜在的价值。如果你可以快速发现有价值的模式,那么人工智能可能对你的组织有用。
如果你不熟悉人工智能,好通读本书,部分机器学习的基础知识可以让你更好地理解后面更复杂的主题。如果你已经熟悉人工智能,可直接从第二部分开始阅读。
当你阅读本书时,请记住本书的目的是让你思考在你的业务或者专业领域中可能存在的问题以及面临的挑战,这些是可以运用人工智能和机器学习技术来解决的。想想你有哪些数据,思考你能够从数据中提取出什么有价值的信息,用于面对特别的挑战,回答或解决特定的问题。毕竟,如果没有人类提出问题,思考可能的机会,人工智能和机器学习将毫无用处,它们价值的发挥是人类的创造力与工具的完美结合。
道格·罗斯(Doug Rose)
有超过25年为各种组织提供技术、培训和流程优化变革的经验。他是美国项目管理协会(PMI)关于敏捷框架的本主要出版物Leading Agile Teams的作者,还是Data Science: Create Teams That Ask the Right Questions and Deliver Real Value和Enterprise Agility for Dummies两本书的作者。
Doug拥有雪城大学信息管理学硕士学位、法学学位和威斯康星大学麦迪逊分校的文学学士学位。他还是规模化敏捷框架项目顾问(SPC)、认证技术培训师(CTT )、Scrum认证专家(CSP-SM)、认证Scrum Master(CSM)、PMI敏捷管理专业人士(PMI-ACP)、项目管理专业人士资格认证(PMP)和Apache Hadoop认证开发人员(CCDH)。
你可以通过LinkedIn Learning来学习Doug在芝加哥大学或网上的生动有趣的商业和项目管理课程。
Doug在Doug Enterprises工作,在他居住过的所有城市都有Doug Enterprises的办公室。目前他在佐治亚州的亚特兰大市暂住,他喜欢的休闲方式是骑一辆固定的卧式自行车或者向儿子解释漫威宇宙。
译者简介
刘强
2009年硕士毕业于中国科学技术大学数学系,有12年大数据与推荐系统相关实战经验,是电视猫大数据与人工智能团队的负责人。他带领团队从零开始搭建公司的大数据平台,将数据分析、数据可视化、推荐系统、搜索等大数据及AI能力应用于公司业务中。目前,公司近30%的流量来源于推荐和搜索。他还创建了数据与智能社区(包括同名的微信公众号、视频号、知乎、B站等自媒体平台号),聚焦于数据分析、大数据、推荐系统、机器学习、人工智能等领域知识的分享与传播。目前已出版推荐系统专著一部《构建企业级推荐系统:算法、工程实现与案例分析》。
译者序
序
前言
致谢
部分 思考的机器:人工智能概述
第1章 什么是人工智能 2
1.1 什么是智能 3
1.2 测试机器的智能 5
1.3 解决问题的一般方法 7
1.4 强人工智能与弱人工智能 10
1.5 人工智能规划 12
1.6 学习胜过记忆 14
1.7 本章小结 16
第2章 机器学习的兴起 18
2.1 机器学习的实际应用 21
2.2 人工神经网络 23
2.3 感知机的兴衰 26
2.4 大数据时代来临 29
2.5 本章小结 32
第3章 聚焦方法 33
3.1 专家系统与机器学习 33
3.2 监督学习与无监督学习 35
3.3 误差反向传播 37
3.4 回归分析 39
3.5 本章小结 41
第4章 通用人工智能应用 42
4.1 智能机器人 43
4.2 自然语言处理 45
4.3 物联网 47
4.4 本章小结 48
第5章 让大数据插上人工智能的翅膀 50
5.1 理解大数据的基本概念 51
5.2 与数据科学家合作 52
5.3 机器学习与数据挖掘的区别 52
5.4 从数据挖掘到机器学习的飞跃 53
5.5 采用正确的方法 54
5.6 本章小结 56
第6章 权衡你的选择 58
第二部分 机器学习
第7章 什么是机器学习 64
7.1 机器怎么学习 68
7.2 处理数据 70
7.3 应用机器学习技术 73
7.4 学习的类型介绍 75
7.5 本章小结 78
第8章 机器学习的范式 79
8.1 监督机器学习 79
8.2 无监督机器学习 82
8.3 半监督机器学习 84
8.4 强化学习 86
8.5 本章小结 88
第9章 主流机器学习算法 89
9.1 决策树 93
9.2 k近邻算法 95
9.3 k均值聚类 98
9.4 回归分析 101
9.5 朴素贝叶斯 103
9.6 本章小结 106
第10章 机器学习算法应用 107
10.1 利用算法模型拟合数据 110
10.2 选择算法 112
10.3 集成建模 112
10.4 决定机器学习范式 115
10.5 本章小结 115
第11章 几个建议 117
11.1 开始提问 117
11.2 不要混用训练数据和测试数据 119
11.3 不要夸大模型的精度 119
11.4 了解你的算法 120
11.5 本章小结 120
第三部分 人工神经网络
第12章 什么是人工神经网络 124
12.1 为什么与大脑类比 126
12.2 只是另外一个惊人的算法 126
12.3 了解感知机 128
12.4 采用sigmoid神经元 131
12.5 添加偏置项 133
12.6 本章小结 134
第13章 人工神经网络实战 136
13.1 将数据输入神经网络 136
13.2 隐藏层到底发生了什么 138
13.3 理解激活函数 141
13.4 添加权重 144
13.5 添加偏置项 145
13.6 本章小结 146
第14章 让神经网络开始学习 147
14.1 从随机权重和随机偏置项开始 148
14.2 让神经网络为错误买单:损失函数 149
14.3 结合损失函数和梯度下降法 150
14.4 利用反向传播纠正误差 152
14.5 调优神经网络 156
14.6 使用链式法则 156
14.7 利用随机梯度下降法对训练集批处理 158
14.8 本章小结 159
第15章 利用神经网络进行聚类和分类 160
15.1 求解分类问题 161
15.2 求解聚类问题 163
15.3 本章小结 165
第16章 关键挑战 166
16.1 获取足够多的高质量数据 166
16.2 隔离训练数据与测试数据 168
16.3 谨慎选择你的训练数据集 168
16.4 采取探索性的方法 169
16.5 选择正确的工具解决问题 169
16.6 本章小结 169
第四部分 人工智能实践
第17章 利用自然语言处理的威力 172
17.1 利用自然语言理解技术从文本和语音中提取线索 174
17.2 利用自然语言生成技术提供合理的反馈 175
17.3 客户服务的自动化 177
17.4 梳理主流的自然语言处理工具和资源 179
17.4.1 自然语言理解工具 180
17.4.2 自然语言生成工具 181
17.5 本章小结 183
第18章 客户互动自动化 184
18.1 选择自然语言技术 186
18.2 梳理构建聊天机器人及虚拟代理的主流工具 187
18.3 本章小结 189
第19章 提升基于数据的决策 190
19.1 在自动化决策和基于直觉的决策中做出选择 192
19.2 从物联网设备实时收集数据 193
19.3 梳理自动化决策工具 194
19.4 本章小结 196
第20章 利用机器学习预测事件及结果 197
20.1 机器学习是关于数据标记的技术 198
20.2 看看机器学习能够做什么 200
20.2.1 预测客户会购买什么 200
20.2.2 在被问之前回答问题 200
20.2.3 让决策更好更快 202
20.2.4 在商业中复制专业知识 203
20.3 利用你的能力做好事而不是作恶:机器学习伦理 204
20.4 梳理主流的机器学习工具 206
20.5 本章小结 208
第21章 构建人工智能系统 210
21.1 区分智能化和自动化 212
21.2 在深度学习中增加层 213
21.3 人工神经网络应用 214
21.3.1 将优质客户分类 215
21.3.2 商店布局推荐 216
21.3.3 分析及跟踪生物特征 217
21.4 梳理主流深度学习工具 218
21.5 本章小结 220