本书讲述基于人工智能的控制技术,主要介绍了神经网络控制、模糊
逻辑控制和进化算法控制。全书分为两部分,共10 章。第1 部分为基础
篇,包括第1~6 章,讲述基础理论。第1 章绪论讲述人工智能和控制论的
基础;第2~4 章是神经网络控制部分,主要讲述神经网络理论基础、典型
神经网络、神经网络自适应控制、强化学习和深度强化学习的内容;第5
章讲述模糊控制;第6 章讲述进化算法。第2 部分是实用篇,包括第7~10
章,以机械臂、无人机、五子棋和图像优化处理等为例,具体说明了第1
部分内容的应用。书中每章均附有习题。
为加快推进党的二十大精神进教材,本书深入挖掘科学研究和科学成
果取得过程背后的“两弹一星”精神、载人航天精神、科学家精神等,并
以二维码的形式进行教学指引。
本书可作为人工智能、自动化、电气工程及其自动化、智能控制等相
关专业的本科课程教材,也可以作为相关工程技术人员的专业参考书。
本书遵循教指委相关指导文件和高等院校学生学习规律编写而成。践行四新理念,融入思政元素,注重理论与实践相结合。
前言
随着人工智能技术的发展,其适用范围越来越广,并逐步渗透到生活中的方方面面,从而改变人类现有的生活方式。在人工智能的发展中,智能控制是非常重要的内容且具有不可或缺的作用,例如机器人的动作、无人机的飞行、无人汽车的驾驶等都离不开智能控制,因此人工智能控制技术是人工智能、自动化、电气工程及其自动化等专业的重要课程。
传统的控制建立在反馈的基础上,研究系统的传递函数模型或状态空间模型,从而设计控制器将系统控制在期望的情况下。随着控制研究的进展,最优控制、自适应控制、自抗扰控制、滑模控制、自校正控制、预测控制等逐渐成为主体,研究对象系统也不仅仅局限于线性系统,非线性系统逐渐成为研究的主要对象。神经网络、模糊逻辑的发展为控制研究提供了新的活力,非线性系统自适应模糊控制、自适应神经网络控制、自适应动态规划等是目前研究的主要内容。模糊控制、神经网络控制已经是智能控制的范畴,同时智能控制还包括基于遗传算法、粒子群算法等进化算法的内容。人工智能的快速发展使得强化学习、深度强化学习得到了极大发展,这些都是建立在神经网络的基础上的,可以归结到神经网络控制(本书第1章对学习与控制术语做了说明)的内容。因此从总体来看,人工智能控制技术可以分为三个部分:神经网络控制、模糊逻辑控制和进化算法控制。
根据以上内容,全书分为两部分,共10章。第1部分为基础篇,共6章,第1章绪论,介绍人工智能和控制论的基础;第2~4章属于神经网络控制部分,介绍了神经网络理论基础、典型神经网络、神经网络自适应控制、强化学习和深度强化学习的内容;第5章模糊控制,介绍了模糊控制数学原理、模糊控制原理及设计和自适应模糊控制等内容;第6章进化算法,介绍了遗传算法、粒子群算法和蚁群算法三种典型进化算法。第2部分是实用篇,第7章机械臂控制实例,介绍了神经网络和自适应模糊控制机械臂实例;第8章无人机三维最优路径规划实例,介绍了采用强化学习规划无人机最优路径的实例;第9章五子棋自动对弈实例,介绍了深度强化学习实现五子棋自动对弈的例子;第10章图像优化处理实例,介绍了粒子群和遗传算法实现图像分割的实例。全书章节逻辑关系如图所示(点画线框内内容可根据学时选学)。
为加快推进党的二十大精神进教材,本书相应内容融合了“两弹一星”精神、载人航天精神、科学家精神等,以二维码的形式进行教学指引。在融入过程中注重内容和方法的统一,避免了浮于表面,流于形式,硬融入的问题。在第1章讲述控制系统的发展历史时融入了自动控制的奠基人之一我国科学家钱学森的事迹;在第2章神经网络控制中融入了我国科学家坚忍不拔、努力奋斗的例子;在第3章强化学习中融入了在奇异摄动控制中做出重大贡献的我国科学家郭永怀的事迹;在第7章机械臂控制实例中融入了我国空间站机械臂的例子等。这些内容切实落实了党的二十大报告中“实施科教兴国战略”的精神,为培育创新文化、弘扬科学家精神、涵养优良学风、营造创新氛围做出贡献。
本书由山东科技大学高学辉副教授、昆明理工大学王树波教授、浙江工业大学陈强教授和山东科技大学白星振教授编著,全书由高学辉统稿。昆明理工大学的那靖教授审阅了全书并给出了宝贵意见,在此表示感谢。感谢万裕、刘震、王剑昊、吕昊、岳文龙等研究生在文字录入、校正和图片编辑等方面所给予的帮助。由于编著者水平有限,书中难免存在缺点和错误,欢迎读者批评指正。
编著者
高等院校教师
目录
前言
第1部分基础篇
第1章绪论
1.1人工智能控制技术概述
1.1.1人工智能的定义及智能控制
1.1.2人工智能控制技术的发展历史
1.1.3人工智能控制发展面临的难题
1.1.4人工智能控制的主要内容
1.2学习算法概述
1.2.1无监督学习
1.2.2监督学习
1.2.3强化学习
1.3自动控制基础
1.3.1控制系统的发展历史
1.3.2控制系统模型
1.3.3控制方法概述
1.3.4控制系统的稳定性
1.4学习与控制术语说明
习题
参考文献
第2章神经网络控制
2.1神经网络理论基础
2.1.1神经网络发展历史
2.1.2神经网络原理
2.1.3神经网络学习算法
2.2典型神经网络
2.2.1单神经元网络
2.2.2BP神经网络
2.2.3RBF神经网络
2.2.4Hopfield神经网络
2.2.5卷积神经网络
2.3神经网络自适应控制
2.3.1系统描述
2.3.2自适应控制器设计
2.3.3稳定性证明
2.3.4仿真实例
习题
参考文献
第3章强化学习
3.1强化学习概述
3.1.1强化学习的历史背景
3.1.2强化学习的分类
3.1.3强化学习的重点概念
3.2马尔可夫决策过程
3.2.1马尔可夫链与马尔可夫决策过程
3.2.2贝尔曼方程
3.2.3最优控制与最优策略
3.3动态规划
3.3.1动态规划简介
3.3.2最优控制中的动态规划
3.3.3强化学习中的动态规划
3.4基本强化学习
3.4.1策略迭代算法
3.4.2值迭代算法
3.4.3蒙特卡洛法
3.4.4时序差分法
3.4.5其他类型强化学习
习题
参考文献
第4章深度强化学习
4.1深度强化学习概述
4.1.1深度强化学习发展历程
4.1.2深度强化学习基本学习思想
4.2深度卷积神经网络
4.2.1基本网络类型
4.2.2改进网络类型
4.3深度循环神经网络
4.3.1网络结构与计算
4.3.2深度循环神经网络变体和改进
4.4深度价值和策略学习
4.4.1深度Q网络
4.4.2基于策略梯度算法
习题
参考文献
第5章模糊控制
5.1模糊控制数学原理
5.1.1模糊集合
5.1.2隶属函数的种类
5.1.3模糊集合的运算
5.1.4模糊关系与推理
5.2模糊控制原理及设计
5.2.1基本原理和组成
5.2.2模糊控制器的结构和分类
5.2.3模糊控制的工作原理和设计步骤
5.3自适应模糊控制
5.3.1模糊逼近和万能逼近定理
5.3.2系统描述
5.3.3模糊控制器设计
5.3.4仿真实例
习题
参考文献
第6章进化算法
6.1进化算法概述
6.2遗传算法
6.2.1遗传算法的发展历史
6.2.2遗传算法的基本原理
6.3粒子群算法
6.3.1粒子群算法的发展历史
6.3.2粒子群算法的原理
6.4蚁群算法
6.4.1蚁群算法的发展历史
6.4.2蚁群算法的原理
习题
参考文献
第2部分实用篇
第7章机械臂控制实例
7.1机械臂神经网络控制
7.1.1问题的提出
7.1.2神经网络设计
7.1.3控制器设计
7.1.4稳定性证明
7.1.5仿真实例
7.2机械臂自适应模糊控制
7.2.1系统描述
7.2.2模糊控制器设计
7.2.3仿真实例
习题
参考文献
第8章无人机三维最优路径规划实例
8.1无人机路径规划简介
8.2无人机路径规划Q-Learning算法原理
8.3无人机三维路径规划实现过程
8.3.1基于Q-Learning的三维模型创建
8.3.2训练过程
8.3.3路径规划实现结果
8.4仿真程序
习题
参考文献
第9章五子棋自动对弈实例
9.1五子棋自动对弈实现原理
9.2蒙特卡洛树搜索
9.2.1选择
9.2.2拓展与评估
9.2.3反向传播
9.2.4演绎
9.3五子棋自对弈训练
9.4仿真程序
习题
参考文献
第10章图像优化处理实例
10.1数字图像处理技术简介
10.1.1基本概念
10.1.2研究内容
10.1.3应用领域
10.2图像分割
10.2.1技术介绍
10.2.2图像分割的定义
10.2.3基于阈值的分割方法
10.2.4其他分割方法
10.3基于进化算法的图像分割方法实例
10.3.1基于遗传算法的图像分割
10.3.2基于粒子群算法的图像分割
习题
参考文献