本书是一本全面介绍人工智能领域的专业教材。分为八章,人工智能概述、人工智能数学基础、人工智能基础模型、人工智能编程框架、视觉智能处理技术、语言智能处理技术、语音智能处理技术和人工智能的未来发展趋势。首先介绍人工智能的相关基础知识,包括人工智能相关概念、人工智能的数学基础、人工智能的模型基础以及相关编程基础,然后分别介绍视觉、语音、语言三个领域中的人工智能原理、方法以及技术应用,最后对人工智能的发展趋势做出了总结、思考和前瞻。本书除了提供全面的人工智能基础知识外,还通过丰富的实践案例和具体的应用介绍,帮助读者更深刻地理解和应用所学知识。
更多科学出版社服务,请扫码获取。
目录
第1章 人工智能概述 1
1.1 人工智能的概念 1
1.2 人工智能的意义和目标 2
1.2.1 人工智能的意义 2
1.2.2 人工智能的目标 2
1.3 人工智能的起源和发展 2
1.4 人工智能的方向和内容 6
1.4.1 机器学习 6
1.4.2 视觉信息处理 7
1.4.3 自然语言处理 8
1.4.4 语音信号处理 9
1.4.5 多模态信息处理 9
1.4.6 人工智能自动生成内容 10
习题 10
第2章 人工智能数学基础 11
2.1 线性代数 11
2.1.1 基本数学对象 11
2.1.2 向量运算 13
2.1.3 矩阵乘法 13
2.1.4 矩阵运算 14
2.1.5 向量组与向量空间 15
2.1.6 特征分解 17
2.1.7 奇异值分解 18
2.1.8 特殊的矩阵 19
2.1.9 范数 20
2.2 微积分 20
2.2.1 导数与微分 21
2.2.2 链式法则 22
2.2.3 函数极值 23
2.2.4 积分 23
2.2.5 矩阵微积分 24
2.2.6 泰勒公式 26
2.2.7 常用函数及其导数 26
2.3 概率与信息论 28
2.3.1 随机变量 28
2.3.2 概率分布 28
2.3.3 期望和方差 30
2.3.4 条件概率 32
2.3.5 贝叶斯定理 33
2.3.6 信息论与熵 33
2.3.7 交叉熵与散度 34
2.4 数值计算 35
2.4.1 最优化问题的基础模型 35
2.4.2 最优化问题分类 36
2.4.3 最小二乘法 37
2.4.4 梯度下降法 38
2.4.5 共轭梯度法 40
2.4.6 深度学习中常用的优化方法 42
习题 47
第3章 人工智能基础模型 48
3.1 卷积神经网络 48
3.1.1 卷积神经网络的背景介绍 49
3.1.2 卷积神经网络的基础结构 49
3.1.3 卷积神经网络的计算 51
3.1.4 典型卷积神经网络的应用 56
3.2 循环神经网络 58
3.2.1 循环神经网络的背景介绍 58
3.2.2 循环神经网络的基础结构 58
3.2.3 循环神经网络的计算 61
3.2.4 典型循环神经网络的应用 64
3.3 生成对抗网络 64
3.3.1 生成对抗网络的背景介绍 65
3.3.2 生成对抗网络的基础结构 65
3.3.3 生成对抗网络的计算 68
3.3.4 典型生成对抗网络的应用 69
3.4 扩散模型 71
3.4.1 扩散模型的背景介绍 71
3.4.2 扩散模型的基础结构 72
3.4.3 扩散模型的计算 73
3.4.4 典型扩散模型的应用 81
3.5 图神经网络 83
3.5.1 图神经网络的背景介绍 84
3.5.2 图神经网络的基础结构 86
3.5.3 图神经网络的计算 88
3.5.4 典型图神经网络的应用 91
3.6 Transformer 92
3.6.1 Transformer的背景介绍 92
3.6.2 Transformer的基础结构 94
3.6.3 Transformer的计算 98
3.6.4 典型Transformer的应用 99
习题 101
第4章 人工智能编程框架 102
4.1 Python基础 102
4.1.1 Python简介 102
4.1.2 Python基本语法 107
4.1.3 Python数据类型 108
4.1.4 Python程序结构 119
4.1.5 Python函数 123
4.1.6 Python类 124
4.1.7 Python库 125
4.2 PyTorch框架 130
4.2.1 环境配置 131
4.2.2 模型实现示例 135
4.3 其他人工智能框架 140
习题 141
第5章 视觉智能处理技术 142
5.1 视觉智能处理基础知识 142
5.1.1 图像表示与处理 142
5.1.2 特征提取与描述 146
5.1.3 视觉智能处理基本任务 149
5.2 目标检测与图像分割技术 151
5.2.1 目标检测与图像分割中的基础知识 152
5.2.2 基于CNN的目标检测与图像分割 157
5.2.3 结合Transformer的目标检测与图像分割 161
5.3 三维视觉技术 166
5.3.1 点云数据的表示 166
5.3.2 点云物体分类与分割 167
5.3.3 基于点云的生成技术 174
5.4 视频理解和处理技术 180
5.4.1 基本概念 180
5.4.2 视频对象分割 186
5.4.3 视频增强 193
习题 201
第6章 语言智能处理技术 202
6.1 语言智能处理基础知识 202
6.1.1 文本表示与嵌入 202
6.1.2 句法分析 207
6.1.3 关键词提取 210
6.2 神经机器翻译 212
6.2.1 神经机器翻译介绍 213
6.2.2 基于深度神经网络的神经机器翻译模型 216
6.2.3 BERT-fused模型 220
6.2.4 mRASP模型 224
6.3 共指解析技术 226
6.3.1 共指解析的基本概念 228
6.3.2 共指解析的评估标准 229
6.3.3 端到端的共指解析模型 232
6.4 智能问答技术 237
6.4.1 智能问答系统发展历程 238
6.4.2 智能问答系统架构 238
6.4.3 智能问答基础 239
6.4.4 大语言模型 244
6.4.5 智能问答系统 247
习题 248
第7章 语音智能处理技术 249
7.1 语音信号处理技术 249
7.1.1 语音信号的特性与数字化表示 249
7.1.2 语音信号的预处理 251
7.1.3 语音信号的特征提取 254
7.2 语音识别技术 257
7.2.1 传统的语音识别技术 258
7.2.2 端到端的语音识别技术 258
7.3 语音合成及转换技术 265
7.3.1 语音合成技术 265
7.3.2 语音转换技术 273
7.4 语音增强技术 276
7.4.1 语音增强介绍 276
7.4.2 冗余卷积编码器-解码器 279
7.4.3 语音增强生成对抗网络 281
7.4.4 用于语音增强的条件扩散模型 283
习题 286
第8章 人工智能的未来发展趋势 287
8.1 生成式人工智能技术 287
8.1.1 小波扩散模型 288
8.1.2 偏移扩散模型 290
8.1.3 对未来技术的思考和展望 294
8.2 可解释人工智能技术 294
8.2.1 PIP-Net模型 295
8.2.2 LaBo模型 298
8.2.3 对未来技术的思考和展望 301
8.3 多模态人工智能技术 302
8.3.1 Lynx模型 302
8.3.2 BLIP-2模型 304
8.3.3 对未来技术的思考和展望 307
8.4 具身智能技术 307
8.4.1 PaLM-E模型 308
8.4.2 EmbodiedGPT模型 311
8.4.3 对未来技术的思考和展望 314
习题 315
参考文献 316