本书是一本基于机器人平台的实践类教程,重点瞄准人工智能技术在机器人中的应用开发。本书以树莓派智能车为载体,从智能车的组成入手,帮助读者熟悉智能车软硬件资源,然后一步步引导读者搭建TensorFlow的开发框架,结合视频传输实现机器视觉,再结合语音输入及手机APP实现语音识别,并介绍了脑机接口方面的简单应用。在此基础上,读者可自行开发更加智能的各类应用,如无人驾驶、物体识别、语音控制驾驶等。本书通俗易懂、实用性强,既可作为计算机类、自动化类或机电类本科高年级学生的课程设计或实训类课程的教材使用,又可供相关专业人员尤其是初入门的人员参考,同时,本书也可作为机器人或人工智能相关比赛的参考用书。
人工智能技术经过60多年的发展,已经在很多领域得到广泛应用,并逐渐引领新一轮产业的变革,推动人类社会进入智能化时代。党的二十大报告提出构建新一代信息技术、人工智能……等一批新的增长引擎,指出了发展人工智能的重要性,为人工智能领域的创新发展提供了重要指导。机器人作为人工智能技术的最佳载体,已逐步成为学习人工智能应用开发的最佳平台,并逐步融入大学的课程体系中。
2014 年,笔者有幸参加了美国亚利桑那州立大学陈以农教授关于计算机导论课程中应用机器人平台的相关培训,并对机器人平台在教学中的应用产生了浓厚兴趣。青岛科技大学信息科学技术学院在院长刘国柱教授的组织下,成立了机器人教学团队,进行了机器人设备的研发、教材教学资源的开发等工作。
团队积极学习贯彻党的二十大精神,深入推进新时代人才培养,不断创新教学模式,培养具有创新意识和实践能力的高素质人才。2017 年,团队将机器人教学平台融入软件工程专业的人才培养方案中,将智能车、机械臂、人形机器人等设备与专业课程相结合,构建了创新型课程体系,为学生创新能力的培养奠定了基础。
本书由笔者带领青岛科技大学机器人教学团队根据近几年的教学及创新比赛经验编写而成。首先,团队自主设计了基于树莓派的智能车,开发了中间件软件,与VIPLE 图形化编程工具集成在一起,为大一学生学习机器人编程奠定了基础。而且,团队在智能车的基础上,使用C/C 及Python 等编程语言开发了更多的人工智能应用,积累了大量的教学资源。本书对这些教学资源进行了梳理。第1章介绍了人工智能相关基础知识,让读者对最新的人工智能技术有一个清晰的概要了解;第2章介绍了智能车的软硬件组成,为后续开发奠定基础;第3章介绍了人工智能相关开发框架,以TensorFlow 框架为主;第4 章则主要介绍机器视觉方面的实现;第5 章以语音处理的实现为主;最后一章则介绍了脑机接口方面的简单应用,为读者拓展思路,提供更多人工智能开发的方向。
本书第1、2 章由马兴录编写;第3章由刘扬编写;第4章由孙振负责编写;第5章由李德奎负责编写;第6章由陶冶编写;王剑峰负责书中代码的整理与验证。全书由马兴录统稿,学校图书馆的赵孝芬进行了文字校对。部分研究生参与了书稿编写与校对工作,在此一并表示感谢!
马兴录
2023 年8 月
第1章 人工智能应用开发概述 001
1.1 人工智能技术的发展 002
1.2 新一代人工智能技术体系 003
1.3 人工智能技术的应用 004
1.3.1 大数据应用 005
1.3.2 机器视觉 005
1.3.3 语音处理 005
1.3.4 自然语言处理 006
1.4 嵌入式人工智能 007
1.5 人工智能对社会的影响 007
第2章 智能车平台 009
2.1 智能车硬件组成 010
2.1.1 嵌入式树莓派微型电脑 011
2.1.2 直流电机及控制 013
2.1.3 超声波测距 014
2.1.4 红外避障模块 016
2.1.5 循迹模块 017
2.1.6 摄像头 018
2.1.7 语音处理设备 018
2.2 智能车应用开发入门 019
2.2.1 树莓派开发环境 019
2.2.2 基于Python的智能车控制 022
2.2.3 基于C/C 的智能车控制 025
第3章 人工智能应用开发框架 029
3.1 TensorFlow开发环境介绍 030
3.2 TensorFlow开发环境搭建 030
3.2.1 在树莓派上安装TensorFlow 031
3.2.2 在Ubuntu上安装TensorFlow 031
3.3 TensorFlow编程 037
3.3.1 TensorFlow的编程模型 038
3.3.2 TensorFlow的神经网络模型 040
3.3.3 卷积神经网络及应用 046
3.3.4 TensorFlow的高层封装 054
第4章 机器视觉应用开发 060
4.1 OpenCV开源视觉库编程 061
4.1.1 OpenCV开发环境的搭建 062
4.1.2 实践项目 068
4.2 基于Dlib库的人脸识别 077
4.2.1 Dlib库的安装 077
4.2.2 实践项目 078
4.3 基于YOLO V3的实时目标检测 092
4.3.1 深度学习和YOLO V3简介 093
4.3.2 训练自己的数据集 093
第5章 语音识别应用开发 111
5.1 语音识别应用框架 112
5.1.1 语音识别常用算法 113
5.1.2 语音识别设备 117
5.1.3 本地语音识别与云端语音识别 118
5.2 基于Sphinx的本地语音识别 119
5.2.1 Sphinx软件包的安装 119
5.2.2 语料库的训练 121
5.2.3 声卡安装使用 123
5.2.4 源码示例 127
5.3 基于科大讯飞的语音识别 134
5.3.1 科大讯飞的语音识别框架及产品分类 134
5.3.2 用科大讯飞API实现本地语音文件识别 135
5.3.3 用科大讯飞实现离线语音识别 138
5.4 基于百度智能云的语音识别 142
5.4.1 基于百度云平台的语音识别方案 142
5.4.2 百度云语音识别的系统设计 142
5.4.3 百度云语音识别算法调用 144
5.4.4 云语音算法模型的训练 145
5.4.5 云语音应用 146
5.5 应用实例智能车的语音控制 150
5.5.1 语音识别应用框架系统分析 150
5.5.2 机客户端功能及模块化分 151
5.5.3 树莓派智能车服务端功能及模块划分 152
5.5.4 TCP传输协议 153
5.5.5 语音识别应用开发环境的搭建 156
5.5.6 语音识别应用开发实例 180
第6章 基于脑机接口的智能车控制 184
6.1 脑机接口简介 185
6.1.1 脑机接口的用途 185
6.1.2 脑机接口的原理 186
6.2 脑机接口硬件设计 187
6.2.1 信号采集 188
6.2.2 信号传输与处理 189
6.3 基于脑机接口的智能车控制 192
6.4 脑机接口应用拓展 199
参考文献 200