本书从数学优化的角度对目前人工智能的代表技术机器学习进行分析,解决了目前这一领域偏向应用,数学理论较弱的问题,从原理、数学解析两个方面对特征提取、分类、聚类、神经网络等进行了全面系统的剖析。解决了目前人工智能领域偏向应用,数学理论较弱的问题,从原理解析、数学解析两个方面对机器学习进行剖析。
本书尝试从计算流和信息流相结合的角度,从自组织网络的角度,对计算科学与信息科学结合的原理、方法和意义进行阐述,从而形成一套融合数学思维和信息思维的理论体系。
人类对世界的认识是理论来源于实践又服务于实践的过程。作为对人类认知行为的近似,机器学习、深度学习和强化学习的过程也是认知来源于世界又服务于世界的过程。当离开人类的参与,这一行为完全由计算机自主实现时,这一过程表现为建立在机器学习、深度学习、强化学习(为表达方便,除非特别指出,采用机器学习代表三种学习形式,下同)基础之上的自组织过程。
交换是经济社会中一种常见的基本的经济形式。现代交换经济中,物理世界的产品流通过与信息流结合,将现实世界映射到数字的世界。机器学习又将这个数字的世界映射到有限维或无限维的空间中,局部的或整体的空间中,呈现出结构与结构之间的关系。
人类最重要的两个智能行为是学习和解决问题的能力。机器学习是让计算机模拟和实现人类的学习,以获取解决问题的知识。专家系统是基于经验的学习,也是机器学习的初级方式。专家系统利用专家的知识来解决实际问题,解决问题的能力达到了专家水平。但是专家系统在发展过程中遇到了不少的困难。一方面,从专家那里获取知识是一项既费时又费力的困难工作。专家能在实际中有效地解决问题,但要专家整理出自己的知识和经验,他往往无从下手。这为知识获取带来了困难,形成了知识获取的瓶颈现象。另一方面,基于经验的学习虽然在解决问题上具有一定功效,但是却难以反映问题以及解决方法的本质特征。机器学习是基于数据或样本的学习,为解决知识获取的问题提供了有效的途径。它使得计算机可以从大量实例中自动归纳,产生描述和抽象这些实例的一般规则知识,从而在反复学习中不断逼近问题以及解决方案的本质。
机器学习被列为人工智能的核心技术,它以知识处理为主体,利用知识进行推理,完成人类定性分析的部分智能行为。人工智能技术融入决策支持系统后,使决策支持系统在模型技术和数据处理技术的基础上,增加了知识推理技术,使决策支持系统的定量分析和AI的定性分析结合起来,从而提高辅助决策和支持决策的能力。
林强,北京信息科技大学教师,副研究员。在人工智能领域有着多年的实践和教学经验,以第一作者身份发表科研论文15篇,其中SCI1篇,EI9篇,ISTP2篇;以第一发明人身份申请国内外专利15项;其中13项已获得授权,包括中国专利7项,美国专利4项,欧洲专利2项。
第一章
数据、数学与机器学习001
1.1 概述 / 003
1.2 数学与机器学习 / 005
1.3 数据与机器学习 / 008
1.4 深度学习与强化学习 / 014
1.5 本章小结 / 019
第二章
分类与回归021
2.1 常用的分类方法 / 024
2.2 分类的数学解释 / 032
2.3 回归分析 / 038
2.4 回归分析的数学解释 / 041
2.5 本章小结 / 046
第三章
特征选取047
3.1 数据预处理的步骤 / 050
3.2 数据预处理与特征提取 / 057
3.3 主成分分析 / 059
3.4 因子分析 / 063
3.5 特征提取问题的数学解析 / 067
3.6 本章小结 / 072
第四章
聚 类075
4.1 基本概念 / 078
4.2 聚类的过程 / 082
4.3 分析方法 / 083
4.4 基于K-means算法的聚类规则 / 088
4.5 聚类问题的数学解释 / 091
4.6 本章小结 / 094
第五章
深度学习097
5.1 概述 / 099
5.2 神经网络模型 / 101
5.3 神经网络学习方法 / 103
5.4 神经网络的数学解释 / 106
5.5 本章小结 / 111
第六章
强化学习113
6.1 朴素贝叶斯 / 115
6.2 贝叶斯信念网 / 118
6.3 动态贝叶斯网络 / 120
6.4 一般时序模型 / 121
6.5 马尔可夫模型 / 131
6.6 本章小结 / 138
第七章
计算流与自组织141
7.1 信息流与计算流的结合 / 143
7.2 学习中的自组织行为 / 144
7.3 神经动力学与自组织 / 153
参考文献157卷