本书是你了解计算机视觉的一站式指南。利用Python、TensorFlow、Keras和OpenCV的功能执行图像处理、对象检测、特征检测等项目。通过对卷积神经网络的介绍,你将学习如何使用Keras构建深度神经网络,以及如何使用它对Fashion-MNIST数据集进行分类。关于对象检测,你将学习到使用TensorFlow实现简单的面部检测器,以及复杂的基于深度学习的对象检测器(例如Faster R-CNN和SSD)的工作原理。你也将学会使用FCN模型进行语义分割,并使用DeepSORT跟踪对象。不仅如此,你还将学习到在标准数据集上使用视觉SLAM(vSLAM)技术,例如ORB-SLAM。
本书适合希望以*实际的方式理解和实现与计算机视觉和图像处理相关的各种任务的机器学习从业人员和深度学习学习者阅读。
第1章 计算机视觉快速入门
1.1 什么是计算机视觉
1.2 计算机视觉无处不在
1.3 入门
1.3.1 读取图像
1.3.2 图像颜色转换
1.4 计算机视觉研究的相关会议
1.5 小结
第2章 库、开发平台和数据集
2.1 库及其安装方法
2.1.1 安装Anaconda
2.1.2 安装OpenCV
2.1.3 用于深度学习的TensorFlow
2.1.4 用于深度学习的Keras
2.2 数据集
2.2.1 ImageNet
2.2.2 MNIST
2.2.3 CIFAR-10
2.2.4 Pascal VOC
2.2.5 MSCOCO
2.2.6 TUM RGB-D数据集
2.3 小结
参考文献
第3章 OpenCV中的图像滤波和变换
3.1 数据集和库
3.2 图像处理
3.3 滤波器概述
3.3.1 线性滤波器
3.3.2 非线性滤波器
3.3.3 图像梯度
3.4 图像变换
3.4.1 平移
3.4.2 旋转
3.4.3 仿射变换
3.5 图像金字塔
3.6 小结
第4章 什么是特征
4.1 特征用例
4.1.1 数据集和库
4.1.2 为何特征如此重要
4.2 Harris角点检测
4.2.1 FAST特征
4.2.2 ORB特征
4.2.3 黑箱特征
4.2.4 应用—在图像中检测目标对象
4.2.5 应用—是否相似
4.3 小结
参考文献
第5章 卷积神经网络
5.1 数据集和库
5.2 神经网络简介
5.2.1 一个简单的神经网络
5.3 重温卷积运算
5.4 卷积神经网络
5.4.1 卷积层
5.4.2 激活层
5.4.3 池化层
5.4.4 全连接层
5.4.5 批归一化
5.4.6 退出
5.5 CNN 实践
5.5.1 Fashion-MNIST 分类器训练代码
5.5.2 CNN 分析
5.5.3 迁移学习
5.6 小结
第6章 基于特征的目标检测
6.1 目标检测概述
6.2 目标检测挑战
6.3 数据集和库
6.4 目标检测方法
6.4.1 基于深度学习的目标检测
6.5 小结
参考文献
第7章 分割和跟踪
7.1 数据集和库
7.2 分割
7.2.1 分割挑战
7.2.2 用于分割的CNN
7.2.3 FCN的实现
7.3 跟踪
7.3.1 跟踪挑战
7.3.2 目标跟踪方法
7.4 小结
参考文献
第8章 三维计算机视觉
8.1 数据集和库
8.2 应用
8.3 成像原理
8.4 图像对齐
8.5 视觉里程计
8.6 视觉SLAM
8.7 小结
参考文献
第9章 计算机视觉中的数学
9.1 数据集和库
9.2 线性代数
9.2.1 向量
9.2.2 矩阵
9.2.3 Hessian矩阵
9.2.4 奇异值分解
9.3 概率论简述
9.3.1 什么是随机变量
9.3.2 期望
9.3.3 方差
9.3.4 概率分布
9.3.5 联合分布
9.3.6 边缘分布
9.3.7 条件分布
9.3.8 贝叶斯定理
9.4 小结
第10章 计算机视觉中的机器学习
10.1 什么是机器学习
10.2 机器学习技术分类
10.2.1 监督式学习
10.2.2 无监督式学习
10.3 维度灾难
10.4 机器学习的滚球视角
10.5 常用工具
10.5.1 预处理
10.5.2 后处理
10.6 评估
10.6.1 准确率
10.6.2 召回率
10.6.3 F-分数
10.7 小结