关于我们
书单推荐
新书推荐
|
视觉:对人类如何表示和处理视觉信息的计算研究 读者对象:本书可供计算机科学、人工智能、计算机视觉等相关专业的研究人员、研究生及高年级本科生等学习使用或作为研究参考。
本书研究了人类对视觉信息的表示和处理,并对视觉计算处理过程提出了全面的计算理论。全书立足于计算机科学的进展,是跨学科交叉研究的经典教科书,并对多个学科的研究都有深刻启发作用。特别值得一提的是,在近年深度学习的热潮之中,了解掌握本书介绍的视觉计算理论对于在人工智能和计算机视觉领域内开展进一步探索是至关重要的。
David Courtnay Marr是计算神经科学领域的创始人之一,曾任麻省理工学院心理学教授。Shimon Ullman是位于以色列雷霍沃特的魏茨曼科学研究所的计算机科学Samy和Ruth Cohn讲席教授。Tomaso Poggio是麻省理工学院脑和认知科学系的Eugene McDermott讲席教授。Ullman和Poggio都曾在麻省理工学院与David Marr共事。
吴佳俊,斯坦福大学计算机科学系助理教授,研究方向是计算机视觉、机器学习和计算认知科学。 加入斯坦福大学之前,曾是谷歌研究院的访问研究员,并分别在清华大学和麻省理工学院获得了学士和博士学位。 他的研究曾获ACM博士学位论文荣誉提名奖、AAAI/ACM SIGAI博士学位论文奖、麻省理工学院George M. Sprowls人工智能与决策博士学位论文奖,以及2020年三星人工智能年度研究人员奖。
第Ⅰ部分 引言和哲学基础
总述........................................................................................................................... 3 第1章 哲学原理和方法.......................................................................................... 7 1.1 背景知识 ...................................................................................................... 7 1.2 理解复杂的信息处理系统......................................................................... 16 表示和描述 ................................................................................................ 16 处理............................................................................................................ 17 信息处理的三个层次 ................................................................................ 19 计算理论的重要性 .................................................................................... 21 J. J. Gibson 的方法..................................................................................... 22 1.3 视觉的表示框架 ........................................................................................ 24 视觉的目的 ................................................................................................ 25 高级视觉 .................................................................................................... 26 目标与可行性 ............................................................................................ 28 第Ⅱ部分 视觉 第 2 章 图像的表示............................................................................................... 33 2.1 早期视觉的物理背景................................................................................. 33 图像的表示 ................................................................................................ 35 基本物理假设 ............................................................................................ 35 图像表示的一般性质 ................................................................................ 40 2.2 过零点和原初草图..................................................................................... 42 过零点........................................................................................................ 42 生物学的意义 ............................................................................................ 48 原初草图 .................................................................................................... 54 哲学私语 .................................................................................................... 59 2.3 图像的空间排布 ........................................................................................ 62 2.4 光源和透明度 ............................................................................................ 68 其他光源效果 ............................................................................................ 70 透明度........................................................................................................ 70 结论............................................................................................................ 71 2.5 聚合过程和全初草图................................................................................. 71 主要论点 .................................................................................................... 75 纹理辨别的计算方法及其心理物理学意义............................................. 76 第 3 章 从图像到表面 ........................................................................................... 78 3.1 人类视觉处理的模块化组织..................................................................... 78 3.2 图像的处理、约束和可用表示................................................................. 81 3.3 立体视觉 .................................................................................................... 87 测量立体视差 ............................................................................................ 87 从视差中计算距离和表面朝向 .............................................................. 121 3.4 方向选择性 .............................................................................................. 124 视觉运动引言 .......................................................................................... 124 利用方向选择性来分离独立运动的表面............................................... 136 渐进.......................................................................................................... 141 3.5 似动 .......................................................................................................... 141 为什么要研究似动 .................................................................................. 142 把问题一分为二 ...................................................................................... 143 对应问题 .................................................................................................. 146 从运动中恢复结构 .................................................................................. 158 光流.......................................................................................................... 164 3.6 形状轮廓 .................................................................................................. 166 一些例子 .................................................................................................. 167 遮挡轮廓 .................................................................................................. 168 表面朝向的不连续 .................................................................................. 173 表面轮廓 .................................................................................................. 175 3.7 表面纹理 .................................................................................................. 180 分离纹理元素 .......................................................................................... 180 小结.......................................................................................................... 184 3.8 明暗和光度立体视觉............................................................................... 184 梯度空间 .................................................................................................. 185 表面光照、表面反射和图像强度 .......................................................... 188 反射率图 .................................................................................................. 189 从明暗中恢复形状 .................................................................................. 191 光度立体视觉 .......................................................................................... 192 3.9 明度、亮度和色彩................................................................................... 194 Helson-Judd 方法..................................................................................... 195 关于亮度和色彩的视网膜—皮层理论................................................... 196 同时对比的重要性的物理依据 .............................................................. 200 对强度非线性变化的表层起源的假设................................................... 202 测量三色图像的意义 .............................................................................. 203 本方法小结 .............................................................................................. 204 3.10 本章小结 ................................................................................................ 205 第 4 章 可见表面的直接表示............................................................................... 208 4.1 引言 .......................................................................................................... 208 4.2 图像分割 .................................................................................................. 209 4.3 对问题的重新建模................................................................................... 211 4.4 需要表示的信息 ...................................................................................... 213 4.5 2.5 维草图的一般形式............................................................................. 215 4.6 表示的可能形式 ...................................................................................... 216 4.7 可能的坐标系 .......................................................................................... 220 4.8 插值、延续性和不连续性....................................................................... 221 4.9 插值问题的计算 ...................................................................................... 224 不连续...................................................................................................... 224 插值方法 .................................................................................................. 226 4.10 其他内部计算 ........................................................................................ 228 第 5 章 用于识别的形状表示............................................................................... 230 5.1 引言 .......................................................................................................... 230 5.2 形状表示引起的问题............................................................................... 231 评判形状表示的有效性的标准 .............................................................. 232 形状表示的设计选择 .............................................................................. 233 5.3 三维模型表示 .......................................................................................... 235 自然坐标系 .............................................................................................. 236 基于坐标轴的描述 .................................................................................. 236 三维模型表示的模块化组织 .................................................................. 237 三维模型的坐标系 .................................................................................. 239 5.4 自然推广 .................................................................................................. 241 5.5 推导和使用三维模型表示....................................................................... 244 三维模型描述的推导 .............................................................................. 244 以观察者为中心的坐标系和以物体为中心的坐标系的关系............... 247 三维模型的索引和目录 .......................................................................... 247 推导和识别的交互 .................................................................................. 250 5.6 心理学的考量 .......................................................................................... 253 第 6 章 总结........................................................................................................ 256 第Ⅲ部分 尾声 第 7 章 对计算方法的辩护 .................................................................................. 261 7.1 引言 .......................................................................................................... 261 7.2 一段对话 .................................................................................................. 261 原书第 2 版后记 Marr 的《视觉》和计算神经科学............................................. 284 中文版后记 从 Marr 的《视觉》到人类智能问题................................................ 288 术语表................................................................................................................... 292 参考文献 ............................................................................................................... 298
你还可能感兴趣
我要评论
|