本书分为四个部分,第一部分为图像采集及操作实战,主要介绍计算机视觉开发工具的安装、OpenCV开发环境的配置、摄像头的访问及保存图片等操作,让读者能够理解常见的图像类型并完成图像和视频的采集任务;第二部分为图像增强实战,主要介绍图像增强的一般方法,包括图像平滑、边缘锐化、边缘提取、图像轮廓提取等内容,并带领读者完成了图像增强在工业场景下的实际任务;第三部分为图像分析实战,主要介绍图像分析的常用方法,包括阈值分割、图像轮廓提取、图像形态学操作、交互式图形分割、特征提取,并通过实战形式,完成目标检测和目标追踪等计算机视觉任务;第四部分为机器学习实战,主要介绍了OpenCV的神经网络和深度学习模块,以及常见的深度学习库在OpenCV下的使用方法,给出了商业级文字识别、车牌识别和智能交通检测等项目实战案例。
本书针对高等职业院校人工智能技术等专业教学要求,以实际项目为案例,以工程代码实现为主线,介绍利用OpenCV进行数字图像处理的基本方法,让读者对未来的人工智能工作场景有深刻的认知,从而让理论性强、内容抽象、算法较多的数字图像处理知识与岗位任务紧密融合。
宋桂岭,博士,无锡科技职业学院教师。研究方向为计算机视觉、计算机图形学和自主移动机器人,毕业于北京邮电大学计算机学院。二十余年来坚持奋斗在科学技术攻关一线,积累了丰富的产品研发经验。研发成果包括工业CT算法库平台(合作单位:日联科技)、计算摄影相关国际标准(传音股份)、电力装备智能制造工业互联网平台(森蓝智能)、自主移动机器人底盘(无锡科技职业学院)、好护家智慧医养平台(苏州福星集团)、智能交通集成管控平台(中国智能交通集团)、 “智慧眼”系列智能安防系统、感知工地系统、违章停车全自动抓拍系统,以及博物馆AR虚拟漫游系统等。
第1部分 图像采集及操作实战第1章 OpenCV环境配置21.1 计算机视觉概述21.1.1 计算机视觉的概念21.1.2 计算机视觉的任务31.1.3 计算机视觉的应用61.2 OpenCV概述71.3 OpenCV-Python环境配置71.3.1 Python环境的安装71.3.2 OpenCV-Python安装111.3.3 PyCharm安装及配置14小结18第2章 数字图像基本操作192.1 数字图像的读取与显示192.2 数字图像在计算机中的表示212.3 视频采集与存储262.4 图像基本操作272.4.1 图像像素操作272.4.2 图像兴趣区域选取282.4.3 图像通道操作292.4.4 颜色空间转换302.4.5 图像边框的填充312.5 图像的几何变换332.5.1 图像的缩放332.5.2 图像的平移342.5.3 图像的旋转352.5.4 图像的透视变换36项目实战 基于颜色的目标追踪37小结38第2部分 图像增强实战第3章 数字滤波操作403.1 图像噪声403.2 图像滤波433.3 邻域平滑滤波443.4 频域低通滤波及高通滤波493.5 图像梯度及边缘滤波51项目实战 图像清晰度评价54小结57第4章 图像亮度及对比度操作584.1 图像直方图概念及可视化584.2 直方图均衡化与图像对比度增强594.3 直方图的掩模操作624.4 图像亮度调整634.5 图像对比度调整64项目实战 交互式图像增强65小结68第3部分 图像分析实战第5章 图像分割705.1 图像分割概述705.2 图像阈值分割715.3 图形形态学操作745.4 图像轮廓提取765.5 分水岭图像分割78项目实战1 利用图割(GrabCut)实现交互式抠图84项目实战2 锡球轮廓提取及面积计算90小结93第6章 目标检测946.1 目标检测概述946.2 模板匹配956.3 特征匹配976.3.1 图像特征理解976.3.2 图像特征描述996.3.3 基于特征匹配的目标检测104项目实战 疲劳驾驶检测107小结115第7章 目标跟踪1167.1 目标跟踪概述1167.2 目标跟踪实现1177.2.1 数据集下载1177.2.2 视频合成1187.2.3 OpenCV目标跟踪实现1207.3 背景差分124项目实战 手势跟踪127小结130第4部分 机器学习实战第8章 文字识别1328.1 手写数字识别1328.1.1 OpenCV人工神经网络概述1328.1.2 手写数字识别1338.2 Paddle文字识别 136项目实战1 车牌识别140项目实战2 镜头规格识别148小结152第9章 深度学习1539.1 OpenCV DNN模块概述1539.2 第三方深度学习库与OpenCV集成154小结159参考文献 160