本书图文并茂、深入浅出地介绍了机器学习算法所需的数学、Python语言编程基础知识,以及回归模型、K 近邻、K 均值、决策树、弱学习器集成、人工神经网络、深度学习等常用的机器学习算法。全书共10 章,每章习题中都配套了实验练习环节,实验内容包括Python 开发环境配置、机器学习算法的实际应用等,所有实验都配有Jupyter 的Python 代码,从而使读者既能掌握算法理论原理,又能进行实际应用。
本书适合作为普通高等院校本科或研究生阶段的人工智能、机器学习、数据挖掘等课程的教材,也适合作为自学的参考书。
本书遵循教指委相关指导文件和高等院校学生学习规律编写而成。践行四新理念,融入思政元素,注重理论与实践相结合。
前言
2023年伊始,OpenAI研发的聊天机器人程序ChatGPT迅速走红,它能够像真人一样理解人类的语言,并与人类进行交流,甚至能完成邮件、代码、文案的撰写以及专业文献的翻译等任务,继2016年3月AlphaGo以4∶1的成绩战胜当时的围棋世界冠军、职业九段棋手李世石之后,人工智能又一次引起了人们的广泛关注。街头巷尾都在谈论人工智能,更多的人开始笃信人工智能最终会在各个领域超越人类智能。对于人工智能是否能超越甚至取代人类智能这一问题,我们无法给出准确预测,但毋庸置疑的是人工智能将会在各个领域承担越来越重要的角色。
人工智能时代已经来临,而智能时代的弄潮儿属于少数能熟练掌握机器学习技术的人。因此,在各类本科、研究生层次的各专业中增设机器学习课程已成为众多高校教学管理人员的共识。
在此背景下,本书作者根据多年的工作和学习经验,融合各种公开发表的参考资料,将机器学习中基础的、常用的一些常识、算法、工程实践经验归纳整理、编写成本书。
本书共10章,第1章首先通过一个电影推荐的案例引导读者开启对机器学习的理解,然后介绍机器学习的相关概念。此外,本章还概要介绍了机器学习应用于生产场景中的一般流程,使读者在后续的算法学习过程中思考对应的应用场景;最后介绍了本书所用到的Python编程开发环境的配置。
第2章概要地介绍机器学习中常用的一些数学基础知识、Python编程语言基础知识,内容包括线性代数、概率与统计的基础知识,以及Python编程语言及其常用工具包的基础知识。
第3章介绍回归模型。首先介绍模型的一般概念,然后分别介绍线性回归和逻辑回归。回归模型是机器学习模型的基础,简单易用且易于解释。
第4章介绍基于距离的算法,包括K近邻的分类算法和K均值的聚类算法。本章首先从距离的一般概念讲起,然后讲述常用的数值向量距离和布尔向量距离,并很自然地过渡到基于距离的K近邻算法和K均值算法。
第5章介绍决策树算法。从决策树的一般概念切入,然后介绍信息熵、信息增益的概念,以此引出决策树的一般生长过程。在此基础上,引入实际中常用的ID3、C4.5、CART算法。
第6章讲解弱学习器集成算法。首先从思想、原理层面讲解3种常用的弱学习器集成方法:装袋法、提升法、堆叠法。然后引出本章重点,即在各种数据处理大赛中大放异彩的XGBoost算法。
第7章介绍支持向量机。本章内容包括线性支持向量机、非线性支持向量机等。
第8章讲解人工神经网络。本章重点介绍神经元模型的算法原理、多层神经网络的模型求解算法(梯度下降法)原理。
第9章在第8章的基础上介绍卷积神经网络。本章内容包括人类视觉系统对卷积神经网络的启发,卷积、池化的运算过程,以及几种常用卷积网络架构。
第10章介绍了用于处理时间序列的网络。本章以序列信号为引子,引出循环神经网络如何让神经网络有了“记忆”,在此基础上详细介绍了长短时记忆网络的原理和应用方法。
本书在多数章都配有对应的应用案例来加深读者的理解,案例源码可以从本书二维码或配套的电子资源中获得。案例代码使用Python作为开发语言、在VS Code中使用Jupyter进行编码,代码中加入了详细注释。
本书由嘉应学院的高延增、侯跃恩、罗志坚共同编著完成,编著工作受到嘉应学院2022年度校级质量工程和2023年广东省教改课题建设项目的资助。本书编写的过程中还得到了很多朋友和同事的帮助,在此表示感谢。此外,除书中注明的参考文献外,还引用了很多网上公开发布的视频和文字资料,如吴恩达、李沐、李宏毅等众多人工智能领域专家在网络平台上发布的各种详尽的学习资料,为本书的编写提供了很大的帮助,在此对资料的发布者表示衷心感谢。
由于作者水平有限,书中难免有疏漏、错误之处,恳请读者批评指正。读者在使用本书的过程中遇到的任何问题可以通过作者的微信个人公众号(genbotter)和作者联系。
作者
高等院校教师
目录
前言
第1章概述
1.1理解机器学习
1.2一些相关的概念
1.3机器学习的发展
1.4机器学习开发的准备工作
1.5本章小结
1.6习题
第2章基础知识
2.1线性代数
2.2概率与统计
2.3优化
2.4Python编程基础
2.5本章小结
2.6习题
第3章回归分析
3.1模型
3.2线性回归模型应用
3.3逻辑回归
3.4本章小结
3.5习题
第4章基于距离的算法
4.1分类与聚类的区别
4.2距离度量问题
4.3K近邻算法
4.4K均值聚类算法
4.5本章小结
4.6习题
第5章决策树
5.1初识决策树
5.2信息熵与信息增益
5.3决策树
5.4CART
5.5本章小结
5.6习题
第6章弱学习器集成算法
6.13种常用的弱学习器集成方法
6.2AdaBoost算法与GBDT算法
6.3XGBoost算法
6.4本章小结
6.5习题
第7章支持向量机
7.1支持向量机的相关概念
7.2线性支持向量机
7.3非线性支持向量机
7.4软间隔
7.5应用案例
7.6本章小结
7.7习题
第8章人工神经网络
8.1人工智能的概念
8.2神经元模型
8.3多层神经网络
8.4应用案例
8.5本章小结
8.6习题
第9章卷积神经网络
9.1人类视觉系统的启发
9.2CNN算法原理
9.3CNN应用
9.4本章小结
9.5习题
第10章用于处理时间序列的网络
10.1序列
10.2循环神经网络
10.3长短时记忆网络
10.4本章小结
10.5习题
参考文献