本书着重机器机视觉的基本理论和技术,介绍各种智能图像处理与机器视觉技术的相关应用;具备解决智能化检测与识别、控制等应用问题的初步能力,为以后从事模式识别与智能控制、机器人技术、智能制造等领域的研究与开发工作打下扎实的基础。
机器视觉是一项综合技术,其内容涉及数字信号处理、机械工程技术、控制与光源照明技术、传感器技术、计算机软件技术和人机接口技术等。典型的机器视觉应用系统包括图像捕捉模块、光源模块、图像数字化模块、数字图像处理模块、智能判断决策模块和机械控制执行模块。因此,机器视觉就是为智能设备安装的眼睛。机器视觉系统的鲁棒性、实时性、高速度和高精度是其实用性的重要指标。近年来,计算机的运算速度逐年提高,人们的生活消费方式、生产制造方式有了很大的变化,这给机器视觉应用技术带来了新的需求和挑战。
上海交通大学的机器视觉与应用课程开始于2001年,早是面向该校机械工程学院机械电子工程专业研究生开设的选修课,是作为机器人学配套课程出现的。该课程主要在图像处理的基础上重点介绍机器视觉理论与算法,如图像预处理、立体视觉建模、运动视觉(或称为序列图像分析)、由图像灰度恢复三维物体形状、物体建模与识别方法,以及距离图像分析方法等。本书规避了图像处理涉及的大量数学公式,而是从应用案例入手,帮助读者掌握机器视觉技术并解决实际问题。
20年来,机器视觉应用技术一直在向更深、更高层次发展,特别是2010年以来深度学习解决了图像识别的一系列瓶颈问题,机器视觉应用也从单一视觉检测走向视觉定位、环境建模和对象识别的实用化方向。由于非电类专业出身的工程技术人员迫切希望掌握机器视觉技术并期待能灵活应用该项技术提高机器人和装备的智能化性能,因此,本书在系统地描述机器视觉的基本理论与方法时,重点介绍机器视觉应用系统涉及的新技术、新方法、新器件以及机器视觉的典型应用实例。本书内容包含计算机视觉与机器视觉的基本概念、光源技术、镜头技术、摄像机技术和典型接口技术,以及构成机器视觉系统的标定技术。同时,结合Matlab图像处理工具和OpenCV开源代码平台,绕开了烦琐的公式,介绍了机器视觉涉及的图像处理和模式识别技术。书中的主要应用案例分别来自作者指导过的张昊若、林敏捷、杨理欣几位研究生的学位论文,研究生倪培远和张悦也参与了本书的整理和编辑工作,在此表示感谢!
由于作者的水平有限,书中难免存在不足之处,请大家就如何完善本书提出宝贵意见,我们的联系方式是:qxcao@sjtu.edu.cn。
曹其新,上海交通大学机械与动力工程学院教授,博士生导师。主要研究方向为机器视觉、机器人控制技术。曾发表EI&SCI论文150多篇,获得国家发明专利90多项、国家科技进步二等奖1项、吴文俊人工智能科学技术奖一等奖1项、省部级科技奖项5项。
庄春刚,上海交通大学机械与动力工程学院副研究员,博士生导师。主要研究方向为机器视觉与控制。曾发表EI&SCI论文30多篇,获得国家发明专利10多项、上海市技术发明一等奖1项。
前言
第1章绪论1
11机器视觉的发展及系统构成1
111机器视觉的发展1
112机器视觉系统的构成2
12Marr的视觉理论框架4
121视觉系统研究的3个层次4
122视觉信息处理的3个阶段5
13机器视觉任务和机器视觉与其他领域的关系7
131机器视觉任务7
132机器视觉与其他领域的关系8
14参考文献9
第2章成像与图像采集10
21亮度与成像10
211光度学10
212亮度成像模型12
22镜头13
221针孔成像模型13
222镜头畸变16
223远心与景深17
23摄像机19
231CCD传感器19
232CMOS传感器20
233彩色成像22
234摄像机性能28
235深度摄像机30
24摄像机计算机接口31
25参考文献32
第3章图像预处理基础33
31数据结构33
311传统的图像数据结构33
312分层数据结构38
32图像预处理41
321灰度值变换41
322几何变换44
323图像滤波器53
324形态学操作65
33参考文献70
第4章图像分割和特征匹配71
41图像分割71
411阈值分割71
412连通域与边缘提取77
413亚像素精度阈值分割86
414基于区域的分割87
415基于3D图的图像分割98
42特征匹配103
421区域特征103
422几何元素的提取110
423轮廓特征112
424特征检测子115
425特征描述子122
426匹配优化算法125
427模板匹配132
43参考文献136
第5章立体视觉与三维重建140
51立体视觉概述140
52立体视觉的基本原理142
53三维重建146
531摄像机标定146
532机器人手眼标定150
533射影几何152
534多视图重建场景158
535双目摄像机与多目摄像机164
536深度图168
54参考文献169
第6章模式识别算法171
61支持向量机171
62贝叶斯分类器173
63聚类算法175
64神经网络基础177
641感知机与神经网络基础177
642参数学习方法179
643GPU并行技术179
65深度卷积神经网络181
651LeNet182
652GoogLeNet183
653ResNet185
66参考文献187
第7章机器视觉在物体识别与测量中的应用188
71检测物体的特征提取188
711区域特征188
712灰度值特征189
713轮廓特征191
72模式分类与识别191
73机器视觉中形状大小的测量194
731长度测量194
732线段测量196
733面积测量196
734圆测量197
74机器视觉表面缺陷检测198
741印刷检测199
742封装检测200
743锯齿检测201
75参考文献203
第8章视觉伺服的基础205
81视觉伺服控制简介205
82概念说明与标定技术206
821坐标变换与刚体运动206
822摄像机模型与标定208
823手眼标定技术212
83视觉伺服控制理论213
831基于位置的视觉伺服213
832基于图像的视觉伺服215
84应用案例232
85参考文献238
第9章机器视觉从容器中抓取零件的应用240
91散乱零件识别的基本方法240
92抓取操作的机器人技术243
93散乱零件的识别与操作应用246
94参考文献251
第10章机器视觉在无源导航与定位中的应用255
101移动机器人与导航255
102定位与地图构建256
103各类传感器的初始化与预处理263
104即时定位与地图构建272
1041使用鱼眼摄像机的视觉SLAM系统277
1042基于多摄像机系统的视觉SLAM系统277
105参考文献278