《机器视觉的开发实践》着力于介绍机器视觉的基本理论、架构和主要技术等,利用深度学习常见框架TensorFlow等,创建强大的图像处理应用程序,并给出了具体的开发实践。
《机器视觉的开发实践》主要内容包括机器视觉基础,神经网络与机器视觉,机器学习开发实践环境,图像分类、分割、生成和目标检测等,给出了机器视觉高级概念和新前沿,为机器视觉研究领域提供了良好的理论指导和技术支撑。
《机器视觉的开发实践》可供从事机器视觉方面的工程技术人员参考阅读。
本书从机器视觉和深度学习的基础概念入手,以流行的深度学习框架PyTorch为基础,展示深度学习在计算机视觉方面的应用。作为机器视觉的入门和实战教程,本书以简洁易懂的语言和示例介绍相关机器视觉和深度学习的理论知识,并介绍如何更好地使用PyTorch深度学习框架来处理机器视觉方面的问题。
本书共7章,主要内容如下:
第1章机器视觉基础。本章介绍了有关机器视觉的基础知识,包括机器视觉的概念、发展和应用,分析了机器视觉的任务,研究了机器视觉的构成及各组成部分的主要功能,并从图像噪声、图像滤波、几何变换和图像特征四个方面深入分析了机器视觉的原理,为后续相关内容的研究奠定了基础。
第2章神经网络与机器视觉。本章介绍了神经网络基础、卷积神经网络、典型CNN架构模型及常见深度学习框架。其中,典型CNN架构模型包括LeNet-5、AlexNet、GoogleNet、VGGNet、ResNet等;常见的深度学习框架包括TensorFlow、PyTorch、Keras、Caffe、CNTK、MXNet等。
第3章机器学习开发实践环境。本章首先介绍了机器学习开发所用到的实践环境,包括Anaconda开发平台的基础知识及其安装方法,以及嵌入式机器视觉开发平台及其相关技术;其次介绍了如何安装Anaconda,以及在Anaconda环境下安装TensorFlow和PyTorch框架的方法;最后介绍了机器视觉开发常用的几种数据集,并给出了示例。
第4章图像分类开发实践。本章主要介绍了图像分类基本概念及原理、典型分类模型和图像分类的软硬件开发环境,并通过实战的方式对图像分类进行了介绍,包括数据预处理、模型搭建、训练及最后的验证。
第5章目标检测开发实践。本章首先从目标检测任务的需求出发,对目标检测的性能指标做了介绍;其次介绍了传统的基于特征的目标检测算法模型及利用卷积神经网络进行目标检测算法模型,着重介绍了YOLO模型及原理,特别是算法的训练与预测中的具体细节;最后给出了如何使用PyTorch实现YOLOv5算法。
第6章图像分割开发实践。本章首先介绍了图像分割的基本概念,包括图像分割的内容、类别及目的;其次介绍了基于阈值、区域、边缘检测等的常见传统图像分割方法,包括基本思想和具体程序实现;最后介绍了当前基于深度学习的核心思想和常用数据集,分析了经典分割框架FCN的基本原理,在此基础上介绍其改进后提出的UNet方法,并在介绍相关算法基本原理的基础上,给出了主要实验过程和关键代码以供参考。
第7章图像生成技术。图像生成领域内主流的图像生成技术有三类,分别是PixelCNN像素卷积网络、VAE变分自编码器和GAN生成对抗网络。本章选择了最近热门的GAN生成对抗网络作为主要内容,重点介绍了生成对抗网络思想及算法推导,利用PyTorch实现了WGAN算法,并利用不同的数据集来生成图像。
本书可为机器视觉研究领域提供良好的理论指导和技术支撑,进一步地,读者可结合典型应用场景,依据本书提供的经典案例和代码,开展具体实践验证。编者结合多年在机器视觉方面的科研与教学经验,参考国内外最新研究成果,总结并编写本书,希望对读者有所帮助。
第1章 机器视觉基础
1.1 机器视觉概述
1.2 机器视觉系统的任务
1.3 机器视觉系统的构成
1.4 机器视觉原理
第2章 神经网络与机器视觉
2.1 神经网络基础
2.2 卷积神经网络
2.3 典型CNN架构模型
2.4 常见深度学习框架
第3章 机器学习开发实践环境
3.1 Anaconda开发平台
3.2 嵌入式机器视觉开发平台
3.3 常用数据集
第4章 图像分类开发实践
4.1 图像分类基本概念及原理
4.2 典型分类模型
4.3 软硬件开发环境
4.4 图像分类实战
第5章 目标检测开发实践
5.1 目标检测的任务
5.2 目标检测的性能指标
5.3 目标检测的算法模型
5.4 YOLOv5目标检测训练模型
5.5 YOLOv5实战
第6章 图像分割开发实践
6.1 图像分割基本概念
6.2 传统图像分割方法
6.3 基于深度学习的图像分割方法
第7章 图像生成技术
7.1 图像生成的基本思想
7.2 图像生成网络理论
7.3 生成对抗网络算法推导
7.4 WGAN的原理
7.5 WGAN的实现
7.6 WGAN图像生成实战
参考文献