人工智能技术作为数字时代的一项基本技术,如何迎接它带来的挑战与机遇,定位我们所处的时代,适应未来人工智能给我们带来的深刻影响?要正确认知这个问题,我们的参照系要足够大,视野才能足够开阔,目光才能足够长远,未来才能足够清晰。
《人工智能极简史》旨在引领读者以长远深邃的历史眼光来审视人工智能的发展,从人类最初对智能的幻想出发,从古代的跳舞机器人(偃师造人)开始,讲述古人对人工智能的追求,到人工智能的萌芽、人工智能的初创期、成长期,再到目前的第三次热潮。
通过一些关键的技术、应用的突破和重要事件的表述,让读者全方位的了解人工智能的兴衰,优势和不足,以及一些基本规则。帮助读者厘清人工智能技术的发展脉络,看清人工智能发展的本质,从中总结规律,对人工智能未来发展趋势有客观、科学的认知。
全书无公式和代码,而是以故事和漫画来讲述人工智能发展过程中的人物、技术和轶事,以及作为科研一线人员,对人工智能近年来研究思路上的思考,对未来人工智能发展的研判。
前言
历史的天空群星灿烂
继不久前《爱犯错的智能体》一书走红书坛、荣获科普金奖之后,现又推出新著《人工智能极简史》, 书中收集了大量的资料,从人工智能思想的萌芽谈起,介绍了这门学科的兴起与波折、寒冬与阳春、数代人的努力与艰辛,当然还有辉煌与沧桑。虽然在回首历史的同时掩盖不了激动与兴奋,但在展望未来时又微微露出丝许迷茫。娓娓道来的故事配上了漫画,使古老的传说活跃纸上。
然而,在活泼的文字后面,却有着一系列严肃的问题值得我们思考。人工智能既然给人类文明带来了那么大的贡献,又为何在发展过程中一波三折,屡次让专家们措手不及?那些曾经被钉在十字架上的人工智能批判者,真的就是犯下了人工智能寒冬制造罪吗?在今后前进的路上,寒冬还能否避免?还有,人工智能只是一些玩弄小聪明的技巧吗,它有没有严格的科学基础?人类有智能,人造机器有智能,某些动物据说也有智能,这些不同形式
智能的共同本质是什么?发展人工智能已成为我们的国策和世人共识,那么进一步发展的核心驱动力是什么?主要困难在哪里?最后,有一个曾经使很多人关心的问题:人工智能会不会是一个潘多拉盒子,有朝一日会危害到人类自身?
借此作序的机会,我想就其中的部分问题谈谈自己的看法。
批判是成功之母。人们常说失败是成功之母。但是我们今天要说批判(也) 是成功之母。如果在科研领域出现了一部不够成熟、甚至可能含有错误的作品,但没有人指出来,作者本人又没有发现,错误就会一直继续下去, 改进的版本就不会产生。最坏的情况下会影响有关研究方向的发展。反之,如果有人及时站出来鲜明地指出问题,端正方向,则对推动相关研究是大好事。 本书介绍的感知机模型的浴火重生就是一个正面的例子。我相信罗森布拉特完全不会怨恨明斯基和佩帕特新书对他的感知机的批评。后来的人工智能专家们大多也不会为此而讨伐明斯基扼杀了早期神经网络研究的发展,尤其是不能责怪他引来了人工智能的冬天,因为事件的逻辑正好相反。正是明斯基他们的狠狠一击捅开了通向真理之门。要是没有明斯基他们指出感知机存在的问题,哪有后来神经网络的迅速和健康的发展?英国诗人雪莱曾赋诗曰:既然冬天来了,春天还会远吗?这就是历史的辩证法。所以我觉得如果要说吸取冬天教训的话,应该是想一想怎样才能从科学的批判中更快地找到出路, 让春天早些到来。如果把思路更加开拓一点,我们不妨说:有志的科学斗士在遇到难过的坎时,第一个想法应该是:机会来了!。
人工智能是科学。人工智能是科学吗?提这个问题可能会使很多人惊讶:人工智能当然是科学呀,怎么会有这样的问题呢? 但事实是社会上可能对这个问题并未形成共识。我就看到过人工智能与科学结合的说法。如果这个说法成立,那就是把人工智能排除在科学之外了。联系到本书提到的历史上一些疑似人工智能的传说、神话,它们让人听起来还蛮有兴趣,但读者都会知道这些传说只不过是反映了我们的祖先对制造能够自动执行某些动作的工具的渴望,都知道传说毕竟是传说。从本书的介绍可以看出,人工智能,特别是现代人工智能,建立在严格的逻辑和数学基础之上。不幸的是,社会上总会有一些人对人工智能抱有偏见,认为人工智能只不过是一些碰运气的技巧,入不了严肃科学的大堂。再加上国内向来有一种把科学和技术分开的传统,更加助长了这种想法。所以我认为,尽管人工智能的重要性已经得到了国家层面的肯定,但是人工智能是科学的客观事实还需要更深地在人们观念上扎根。
不确定性是人工智能的终身伴侣。前面我们说到人工智能是科学。那它究竟是一种什么样的科学呢?从中国科学院学部的分类来说,应该属于信息科学。本书介绍了上世纪中叶两位信息科学大师维纳和香农。他们都提到了信息在消除不确定性中的作用,几乎在同时提出和回答了一个问题:从数学的观点看,信息是什么?。他们认为信息是用来消除不确定性的(一个物理量)。 换句话说,不确定性是由于信息不完全与/或人们信息处理能力有限而带来的认知局限。两位大师在此基础上发展出的一整套信息科学理论至今还在指导人们从事有关研究。这和人工智能息息相关。人工智能面对的最大的科学问题就是不确定信息的处理。什么是智能?智能就是在信息(包括知识)不充分的前提下做出最有可能是正确的判断和尽可能最优决策的能力。说它最有可能正确表示我们承认人类决策永远存在失误的可能。这也就是尽管当今社会人工智能的应用已经遍地开花,无孔不入,但在关键问题、关键时刻,还是要人来把关的原因。为此可以说人工智能是一门处理信息(数据、知识) 不确定性的科学。从这个观点出发,凡是有确定方法可以解决的问题都不是人工智能难题。即使曾经是人工智能难题,也会随着人工智能理论和技术的发展而逐渐变成非难题。例如在人工智能初创时期,能够进行逻辑推理或是能够解一个微分方程的程序都可以算是有智能的了。而现在这些问题都属于常规编程。
在大数据时代,信息不完全的概念还应该扩大到:信息是存在的,但是由于信息量过于浩大或过于难提取,以至于人或计算机在有限时间和有限处理能力内无法穷尽其提取和处理,所以只好就能够在允许时间内和条件下获取和处理的信息做出决策。由此可见,人们掌握信息的完备性只是相对的,不是绝对的。更不用说在掌握充分信息的基础上做出合理的判断和决策了。人对真理的认识是无止境的,所以无论人工智能如何发达,不确定性都将如影随身,伴随人工智能终身。
模型还是算法? 这是一个问题。本书提到了一个著名的历史事件:日本的五代机开发计划没有成功。这件事在国际上影响很大。当时计算机界又称规划中的五代机为Prolog机器,因为该五代机的硬件体系结构是按照Prolog程序的推理机制设计的。也就是说五代机原则上是硬件化的Prolog程序解释器Prolog是一个逻辑推理语言,在第一个Prolog系统于 1972年问世以后,该语言深受计算机界欢迎,成为能在国际上与Lisp语言分庭抗礼的新一代人工智能语言。日本的Prolog硬件化计划由此产生。它的失败也不是偶然的。一位德
国计算机专家曾经对我说:他们以为把Prolog硬件化了就可以提高效率。实际上提高效率的关键在软件,即Prolog程序的优化,不在硬件。那么五代机的设计者当初究竟是怎么想的呢?我认为还是受了传统的人工智能语言设计理念的影响。早期的人工智能语言基本上都是建立在某个人类认知模型基础上的,例如Lisp的模型是递归函数,Prolog的模型是Hoare逻辑。 现代社会要求人工智能处理的任务越来越复杂,往往不是单个的认知模型可以解决的。如果只是坚持在某一种模型上,就会使程序越来越复杂。所以人们往往很容易看到:现代人工智能发挥威力的关键应该是算法,而不是单个的模型。即使要用模型,它的核心因素也是算法。本书提到的AlphaGo击败人类顶级围棋手和不久前字节跳动公司表态要严格遵守《中华人民共和国技术进出口管理条例》和《中国禁止出口限制出口技术目录》 就是显示人工智能算法重要性的两个突出例子。前者是人工智能算法的胜利, 后者是对人工智能算法的保护(出口限制)。
如果承认算法已经成了人工智能的关键因素,我们就得到了一个进一步的结论:人工智能威力再大,也要受有关计算理论的节制。可计算性和计算复杂性理论也是人工智能的大限。人工智能理论和技术的一切进步都无法绕过这个大限。
人类智能与人工智能是命运共同体。本书的最后一章提到了人工智能的一些根本问题,其中一些有着深刻的哲学背景。例如,机器会有智能吗?(7.9节),人类智能和机器智能可以组合在一起吗?(7.8节), 人工智能有局限性吗?(7.12节)。还有更深刻的问题: 机器有自我意识吗?(7.7节)。这类问题常常使许多人感兴趣,包括专家和一般老百姓。 针对此类问题,我觉得美国作家爱德华·阿什福德·李的观点很有见地,在一定程度上可以回答此类问题。 这位李先生在他的《协同进化:人类与机器融合的未来》 一书中描述了一幅人类和机器彼此促进,共生共长的图景。他在书中阐述了一系列观点,我无法一一评述。确切说来,我支持李 先生在书名中表达的观点:协同进化:人类与机器融合的未来。如果换成我自己的话,则可以表达为协同进化: 人类智能与人工智能融合的未来。自从人工智能诞生以来,人类智能与人工智能的关系就一直是人们关心的问题。人工智能会比人更聪明吗?,人工智能会反过来控制人类吗?,甚至人
工智能会毁灭世界吗?,等等不一而足。李先生的协同进化论表明,人工智能既不会永远臣服于人类智能,也不可能反过来损害人类智能。双方都在实践和交互中学习对方的智慧,充实自己的才干。魔高一尺, 道高一丈。双方都既是魔,又是道。这个前景或许会使一些人工智能恐惧论者摆脱人工智能威胁阴影。
陆汝钤
作者
张军平,人工智能领域知名专家,中国自动化学会普及工作委员会主任,复旦大学计算机科学技术学院教授、博士生导师,获典赞·2022科普中国年度科普人物提名。主要研究方向包括人工智能、机器学习、图像处理、生物认证及智能交通。其科普著作《爱犯错的智能体》,获得 2020年中国科普作家协会第六届优秀作品奖金奖。
绘者
张毅,温州人,闲时写字,忙时画画。
毅绘堂工作室创始人,推崇以笔绘意。
引言
我国古代人工智能传说 偃师造人,唯难于心 ... 002
故弄玄虚的土耳其机器人 本是真人象棋大师 ... 004
人工智能的逻辑 古代科学家和思想家的思考 ... 007
薛定谔的思考 生命是什么? ... 010
第 1 章 人工智能的萌芽期(1936-1955)
图灵机 电子计算机的雏形 ... 014
图灵测试 人工智能跨不过的槛 ... 018
塞尔的中文屋子 反问图灵测试 ... 021
颅相学与 MP 神经元模型 伪科学到科学 ... 023
人工智能的硬件基础 电子计算机的诞生 ... 026
控制论与信息论 神童与独轮车 ... 029
第 2 章 人工智能的初创期(1956-1980)
人工智能的由来 达特茅斯会议 ... 034
跳子棋国际象棋 挑战人类智能 ... 037
数学定理证明 计算机居然能做证明题 ... 040
几何定理自动证明 年龄最大的程序员 ... 042
海战悖论背后的多值逻辑 逻辑不止 0 与 1 ... 046
框架理论与情感机 明斯基理解的智能 ... 049
物理符号系统假设 早期人工智能的重要假设 ... 052
机器翻译 人类自由交流的保障 ... 055
SHRDLU 和 SHAKEY 积木世界与机器人 ... 057
感知机 神经网络的雏形 ... 060
神经元细胞的方向性 探索猫脑 ... 062
视网膜的启示和新认知机 学习视觉里的智能 ... 064
第一次人工智能寒冬 明斯基对感知机的否定 ... 067
海市蜃楼的人工智能 莱特希尔报告 ... 069
专家系统 学习人类智能 ... 072
第 3 章 人工智能的分支流派
遗传算法 从自然界学来的人工智能 ... 078
蚁群算法 死亡旋涡 ... 081
仿生智能 万物有灵 ... 083
关联规则 啤酒与尿布 ... 086
逻辑的自指 理发师悖论 ... 089
模糊数学 伯克利教授的创新 ... 092
第 4 章 人工智能的成长期(1981-2011)
第五代计算机 日本的赌博 ... 096
反向传播算法 人工智能的第二次复兴 ... 099
卷积神经网络 时运不济 ... 102
邮政编码识别 古老的回忆 ... 105
统计机器学习 一统江山 ... 108
支持向量机 万能学习算法 ... 111
非线性与核技巧 人工智能里的审美疲劳 ... 113
第 5 章 人工智能里的原则、直觉与反直觉
奥卡姆剃刀 简单有效原理 ... 118
稀疏学习与压缩传感 反直觉的采样 ... 122
词典学习 人工智能需要新华词典 ... 126
最小描述长度 一行代码胜过千言万语 ... 129
流形学习 数据空间不是平坦的,是非欧几何 ... 132
神经流形 离散和连续的原型说 ... 136
非负矩阵分解 光线是正能量 ... 138
视觉理论与大范围首先理论 局部先,还是整体优先? ... 140
第 6 章 人工智能的第三次热潮(2011- 至今)
深度学习 神经网络卷土重来 ... 144
大数据集 ImageNet 土耳其机器人立功 ... 147
AlexNet 深度模型 神经网络的翻身仗 ... 150
谷歌大脑计划 机器能自己认识猫了 ... 153
谷歌的无人驾驶汽车 自动驾驶时代的来临 ... 155
人机大战 AlphaGo 战胜世界围棋冠军 ... 158
波士顿的大狗 现代版的木牛流马 ... 161
深度学习的端到端 拉近学术产业你我他 ... 163
生成对抗网 左右互博的周伯通 ... 166
强化学习 从狗的条件反射学来 ... 168
知识图谱 包罗万象的知识库 ... 171
第 7 章 人工智能的未解难题与未来
莫拉维克悖论 复杂却简单,简单却复杂 ... 176
偏见与风险 人工智能并不公平 ... 179
快思维与慢思维 思维不一定都缜密 ... 182
没有表示的智能 感知不处理,何谈智能 ... 185
因果推断与反事实推断 门票越贵,游客越多? ... 188
数字孪生 人工智能也需要平行世界 ... 191
自我意识 庄周梦蝶与缸中脑 ... 194
人机融合与协作 各有利弊,相互弥补 ... 196
机器会拥有智能吗 智叟与愚公之争 ... 198
NovelAI 与 ChatGPT 与 GPT-4 造飞机还是设计鸟? ... 201
人工智能科幻影视 前瞻性还是没道理 ... 205
时空尺度 人工智能的局限性 ... 209
后记 ... 212
参考文献 ... 216