本书选择计算机视觉领域的相关滤波跟踪和图像质量评价两大部分作为研究内容。第一部分,通过视频目标检测确定需要跟踪的初始目标,研究了基于多峰响应的抗遮挡相关滤波跟踪、自适应特征选择的相关滤波跟踪、基于孪生网络的抗形变相关滤波跟踪等方法。第二部分,将图像质量评价方法分为主观和客观两种,将人的视觉感知融入客观评价方法中,分别介绍了全参考图像质量评价方法、半参考图像质量评价方法和无参考图像质量评价方法,实现了主观评价和客观评价的统一。
本书可供自动控制、图像处理及航天航空等电子、计算机相关专业的本科生、研究生及相关技术人员参考。
本书可作为从事计算机视觉的科研人员了解视频目标检测、相关滤波跟踪、图像质量评价等知识的参考书,也可作为有关技术编程开发人员自学和参考的资料书。
近年来,随着深度学习的发展,计算机在图像及视频目标检测任务上的能力已经有了很大的提高。在实际应用中,目标检测模型可以通过大规模人工标记的训练数据、学习目标的不同形变,来提升目标检测精度。目标跟踪是计算机视觉中重要的研究方向之一,在视频监控、目标检测和无人驾驶等领域有着非常广泛的应用。对目标进行动态实时跟踪定位在智能化交通系统、智能监控系统、军事目标检测及医学导航手术中手术器械定位等方面具有广泛的应用价值。图像质量评价通过对图像的特性进行分析和研究,然后评估出图像失真程度,它是图像处理的一种基本方法。视频目标检测的精度直接决定了需要跟踪的初始目标,目标跟踪的结果反过来有助于提高检测的精度,图像质量评价可用于评估视频的清晰度和失真度,辅助视频目标检测和跟踪。
本书共分9章。
第1章介绍了视频目标检测、相关滤波跟踪、图像质量评价的研究背景和研究现状,并基于各自的问题提供了合理的建模思路和方法。
第2章介绍了域自适应算法及渐进自学习框架。为了解决域移位现象,本章讲解了两个经典的域自适应的方法,都运用了生成对抗的思想,这也为本章的算法提供了一个可行的思路。本章详细讲解了循环语义转移网络,在此基础上,总结了整个渐进自学习算法框架,通过一个已标注样本集对待检测目标进行学习,将学习到的知识无监督地迁移到不同的场景中,使不同场景的目标检测系统无须任何人工干预,就能获得极佳的目标检测性能。
第3章介绍了基于域自适应学习的视频目标检测。本章介绍了视频目标检测的研究现状;介绍了神经网络的基本组成,并说明了卷积神经网络的运行过程;讲解了*简单的滑窗法及一些经典的目标检测方法;详细阐述了循环语义转移网络架构细节,运用域自适应算法得到视频目标检测结果;*后,介绍了能够验证本章算法性能的国际通用数据集,以及算法性能评价指标,通过指标的高低评判性能优劣。
第4章介绍了基于多峰响应的抗遮挡相关滤波跟踪。大量实验表明:当目标存在遮挡时,跟踪算法得到的当前帧置信图会出现多峰响应,研究利用多峰响应值来判断当前帧是否存在遮挡,增加遮挡之后的处理机制;当判定当前帧存在遮挡时,停止当前帧模板的更新,同时利用上一帧的目标点来生成高斯矩阵与当前帧的置信图进行点乘,获得当前帧相对正确的目标点。
第5章介绍了自适应特征选择的相关滤波跟踪。内容包括:传统特征和深度特征在跟踪不同场景中的优势和不同特征的可视化;计算深度,方向梯度的直方图、颜色名特征;计算跟踪时的匹配率;初始几帧分别计算三种特征的平均匹配率,若某一特征的匹配率超过给定阈值,则下一帧只用该特征进行跟踪,不使用剩下特征,提高跟踪速度;计算这一帧匹配率,若继续超过阈值,则接下来的帧继续使用该特征,否则重新计算剩下的两种特征; 在跟踪过程中不断自适应选择特征跟踪。
第6章介绍了基于孪生神经网络的抗形变相关滤波跟踪。本章介绍了孪生神经网络的网络结构及对应算法;介绍了算法的模型结构,在此孪生神经网络结构基础之上,引出对全卷积孪生神经网络跟踪算法的改进,通过改变主干网络结构和其中添加相关滤波层,利用相关滤波计算的高效性,进行深度学习训练,将孪生神经网络输出的特征融合成一个置信图响应;*后,在实验部分介绍了相关实验设置并进行分析。
第7章介绍了一种基于视觉感知的全参考图像质量评价方法。首先,通过局部尺度不变估计方法,将重构图像调整到与参考图像相同的尺寸;其次,通过比较这两幅图像来计算梯度幅度相似度图;再次,用视觉注意机制的方法得到参考图像的显著性特征图谱。*后,运用相似度图和显著性特征图谱融合的策略,得到全参考图像的整体质量评分。
第8章介绍了一种半参考图像的重构图像质量评价方法。本章介绍了传统的推土机距离算法,并提出一种改进的基于权重距离算法;根据尺度不变算法找到参考图像与重构图像对应的匹配点,计算对应图像块的距离,得到局部图像质量评价方法;根据视觉注意机制得到参考图像与重构图像的视觉显著性特征,计算对应特征的距离,得到全局图像质量评价方法;融合局部和全局的图像质量评价方法,得到重构图像的整体质量评分。半参考图像质量评价方法可应用于视频传输中的数字水印验证、利用辅助通道进行视频质量监控与码流率控制等。
第9章介绍了一种融合尺度不变性关键点的无参考图像质量评价方法。自然图像在视觉内容上具有很强的统计特性,如前缘、高维奇异性、尺度不变性等。图像的失真会影响这些特征的强度。尺度不变特征变换算法可以测量出这些特征的强度变化,但会忽略某些低对比度区域的点和边缘光滑的点,这些点可以通过曲波变换来识别。本章通过尺度不变算法和曲波变换提取图像中边缘、高维奇异性、尺度不变性等特征;对特征进行降维与融合;*后,利用现有数据库对模糊神经网络分类器进行训练,并对融合特征向量进行测试,得到无参考图像质量评价。
本书是在中国地质大学(武汉)相关专业历届研究生毕业论文的基础上编写、完善、扩充而成的。编写过程中,牟泉政、孙加乐、闫晴晴等研究生做了大量工作,在此表示感谢。本书编写过程中还参阅了大量资料,吸收了同行们辛勤劳动的成果,在此一并表示感谢。
本书可作为从事计算机视觉的科研人员了解视频目标检测、相关滤波跟踪、图像质量评价等知识的参考书,也可作为有关技术编程开发人员自学和参考的资料书。
由于编者水平有限,时间仓促,书中难免出现错误和疏漏,希望广大读者提出宝贵意见,甚为感谢。
魏龙生,安徽安庆人,2005年7月毕业于安徽大学信息与计算科学专业,获理学学士学位;2007年7月毕业于华中科技大学概率论与数理统计专业,获理学硕士学位;2011年7月毕业于华中科技大学控制科学与工程专业,获工学博士学位;2016年10月至2017年11月国家公派美国哈佛大学访问学者。
第1章绪论(1)
1.1视频目标检测(1)
1.1.1域自适应算法和渐进自学习框架(2)
1.1.2基于域自适应学习的目标检测(2)
1.2相关滤波跟踪(3)
1.2.1基于多峰响应的抗遮挡相关滤波跟踪方法(5)
1.2.2自适应特征选择的相关滤波跟踪方法(5)
1.2.3基于孪生神经网络的抗形变相关滤波目标跟踪方法(6)
1.3图像质量评价(7)
1.3.1全参考图像质量评价方法简介(7)
1.3.2半参考图像质量评价方法简介(8)
1.3.3无参考图像质量评价方法简介(9)
1.4本章小结(10)
第2章域自适应算法及渐进自学习框架(11)
2.1引言(11)
2.2基于语义对齐的域自适应算法(12)
2.2.1域自适应方法(12)
2.2.2基于深度学习的图像语义提取(15)
2.3视觉域适应中的语义一致性约束(17)
2.3.1CSTN网络结构(17)
2.3.2CSTN损失函数(18)
2.4基于CSTN的渐进自学习框架(20)
2.4.1背景建模算法(21)
2.4.2双边界YOLO检测模型(23)
2.4.3在线渐进优化算法(25)
2.5本章小结(26)
第3章基于域自适应学习的视频目标检测(28)
3.1引言(28)
3.2视频目标检测研究现状(29)
3.2.1经典视频目标检测(29)
3.2.2特定场景目标检测(31)
3.2.3迁移学习(32)
3.2.4域自适应(33)
3.3神经网络和机器学习(33)
3.3.1神经网络的基本组成(33)
3.3.2损失函数与反向传播(35)
3.3.3深度模型中的优化(36)
3.4基于卷积神经网络的目标检测框架(37)
3.4.1卷积神经网络的基本原理(37)
3.4.2目标检测算法(39)
3.4.3YOLO(41)
3.5网络架构细节(43)
3.5.1网络架构(43)
3.5.2cycleGAN预训练(43)
3.5.3超参数设置(43)
3.6实验结果与分析(44)
3.6.1数据集与评价指标(44)
3.6.2行人检测实验(46)
3.7本章小结(55)
第4章基于多峰响应的抗遮挡相关滤波跟踪(57)
4.1引言(57)
4.2目标跟踪算法概述(59)
4.2.1基于传统相关滤波框架跟踪(60)
4.2.2基于尺度自适应的相关滤波跟踪(61)
4.2.3基于深度学习的相关滤波跟踪(62)
4.3核化相关滤波跟踪算法(62)
4.3.1一维岭回归(63)
4.3.2循环矩阵(63)
4.3.3核相关滤波(65)
4.3.4目标快速检测(67)
4.3.5尺度更新策略(67)
4.3.6模型更新(68)
4.4遮挡处理(69)
4.5数据集与评价指标(72)
4.5.1精度(72)
4.5.2成功率(72)
4.5.3一次通过性评估和鲁棒性评估(73)
4.6实验结果与实验分析(73)
4.6.1实验环境(74)
4.6.2实验分析(74)
4.7本章小结(79)
第5章自适应特征选择的相关滤波跟踪(80)
5.1引言(80)
5.2传统特征目标描述(82)
5.2.1颜色特征(82)
5.2.2梯度统计直方图特征(83)
5.3深度特征目标描述(85)
5.3.1卷积核与卷积操作(85)
5.3.2卷积神经网络模型(86)
5.3.3深度特征提取(87)
5.3.4融合深度特征(88)
5.4自适应特征选择分析(90)
5.4.1传统特征和深度特征跟踪性能分析(90)
5.4.2自适应选择特征(91)
5.5实验结果分析(93)
5.5.1与单特征相关滤波跟踪算法比较(93)
5.5.2与其他优秀相关滤波跟踪算法比较(94)
5.6本章小结(101)
第6章基于孪生神经网络的抗形变相关滤波跟踪(102)
6.1引言(102)
6.2孪生神经网络结构(104)
6.2.1相似度(104)
6.2.2孪生神经网络(105)
6.2.3损失函数计算(107)
6.3改进的孪生神经网络结构(108)
6.3.1改进的方法(108)
6.3.2滤波层设计(109)
6.3.3反向传播(110)
6.4孪生神经网络训练(111)
6.5融合多核特征(112)
6.6实验结果与分析(113)
6.7本章小结(119)
第7章全参考图像质量评价方法(120)
7.1引言(120)
7.2图像质量评价概述(121)
7.2.1图像质量评价应用(121)
7.2.2图像质量评价方法框架(122)
7.2.3全参考图像质量评价方法发展概况(126)
7.3基于结构相似度的图像质量评价方法(126)
7.3.1基于误差敏感度的图像质量评价方法(127)
7.3.2结构相似度理论(128)
7.3.3结构相似度特征图谱(130)
7.4显著性特征图谱与结构相似度相结合的评价方法(131)
7.4.1显著性特征图谱的定义(131)
7.4.2视觉显著性特征图谱与结构相似度结合算法描述(132)
7.5实验结果总结与分析(135)
7.5.1TID2008图像数据库简介(135)
7.5.2KRCC和SRCC(135)
7.5.3实验结果与说明(136)
7.6本章小结(147)
第8章半参考图像质量评价方法(149)
8.1引言(149)
8.1.1分类(150)
8.1.2研究重点(151)
8.1.3缺点(152)
8.2直方图之间的EMD(152)
8.2.1传统的EMD(152)
8.2.2基于权重的EMD(153)
8.3使用EMD的图像质量评价(154)
8.3.1基于SIFT特征局部EMD的图像质量评价(154)
8.3.2基于显著性特征全局EMD的图像质量评价(155)
8.3.3图像质量的整体评价(156)
8.4实验结果及评价(156)
8.5本章小结(159)
第9章无参考图像质量评价方法(161)
9.1引言(161)
9.2图像质量评价特征表示(163)
9.2.1尺度不变性特征变换(163)
9.2.2曲波变换(166)
9.2.3融合特征度量的实现(167)
9.3无参考图像质量预测(169)
9.3.1模糊化(170)
9.3.2分类(171)
9.3.3去模糊化(174)
9.4实验结果与分析(174)
9.4.1数据库介绍(174)
9.4.2评价指标(176)
9.4.3实验结果与分析(177)
9.5本章小结(179)
参考文献(181)