《不确定条件下的决策:理论和应用》共12章,分为理论与应用两大部分,围绕设计决策智能体的两种主要方法(规划和强化学习)展开。对不确定条件下的决策理论与应用的新研究进行了系统且全面的介绍,从计算的角度介绍了在不确定条件下进行决策的挑战,包括决策模型和算法背后的理论,以及从语音识别到飞机避碰的一系列应用。
《不确定条件下的决策:理论和应用》既可作为计算机科学、航空航天、电子与电气工程以及管理科学等专业高年级本科生和研究生的教材,也可作为相关领域研究人员的参考资料。
本书从计算的角度介绍了不确定条件下的决策问题及方法。书中第一部分介绍了概率模型和决策理论的基础,第二部分讨论了上述理论在各种任务领域中的应用。不确定条件下的决策起源于几个不同领域,其应用范围相当广泛。本书旨在尽可能简单且广泛地提供与应用相关的材料,以供读者参考。
本书的目标读者包括在先进工程领域进行学习和研究的本科生、研究生以及相关专业人士,尤其是计算机科学、航空航天、电子与电气工程和管理科学等学科。全书旨在介绍问题的本质,概述了算法,但省略了证明过程。本书的学习需要一些数学基础,并且假定读者先行学习过概率论和微积分。前5章可用作本科生或研究生课程的基础读物;第6章和第7章更适合研究生阅读学习;第8-12章给出了前述理论的部分应用实例。
本书是作者在林肯实验室工作期间历时两年完成的。林肯实验室是麻省理工学院(MIT)下受联邦资助的研发中心。作者在教授“不确定条件下的决策”这门课时,被“林肯实验室系列丛书”的成员邀请出版该书。书中大部分材料来自于该课程。课程的后半部分还包括林肯实验室及MIT校内研究人员的讲稿,目的是向读者展示如何应用课程第一部分讨论的原理和技术解决涉及国家利益的问题。
第1章 绪论
1.1 决策
1.2 应用实例
1.3 设计决策智能体的方法
1.4 结构安排
1.5 扩展阅读
参考文献
第一部分 理论
第2章 概率模型
2.1 表示
2.2 推理
2.3 参数学习
2.4 结构学习
2.5 小结
2.6 扩展阅读
参考文献
第3章 决策问题
3.1 效用理论
3.2 决策网络
3.3 博弈问题
3.4 小结
3.5 扩展阅读
参考文献
第4章 序贯问题
4.1 构想
4.2 动态规划
4.3 结构化表示
4.4 线性表示
4.5 近似动态规划
4.6 在线方法
4.7 直接策略搜索
4.8 小结
4.9 扩展阅读
参考文献
第5章 模型的不确定性
5.1 探索和利用
5.2 基于最大似然模型的方法
5.3 基于模型的贝叶斯方法
5.4 无模型方法
5.5 泛化
5.6 小结
5.7 扩展阅读
参考文献
第6章 状态的不确定性
6.1 数学表达
6.2 状态更新
6.3 精确求解方法
6.4 离线方法
6.5 在线方法
6.6 小结
6.7 扩展阅读
参考文献
第7章 协同决策
7.1 数学表达
7.2 性质
7.3 代表性子类
7.4 求精确解的方法
7.5 求近似解的方法
7.6 通信
7.7 小结
7.8 扩展阅读
参考文献
第二部分 应用
第8章 基于概率的视频检测
8.1 基于特征的人员搜索
8.2 概率式的外表模型
8.3 学习和推断技术
8.4 性能
8.5 交互式搜索工具
8.6 小结
参考文献
第9章 语音应用的动态模型
9.1 语音信号建模
9.2 语音识别
9.3 主题识别
9.4 语言识别
9.5 说话者识别
9.6 机器翻译
9.7 小结
参考文献
第10章 机载防撞优化系统
10.1 机载防撞系统
10.2 防撞问题的表达
10.3 状态估计
10.4 实时执行
10.5 评价
10.6 小结
参考文献
第11章 持续监测的多智能体规划
11.1 任务描述
11.2 集中问题的表达
11.3 分散问题的近似表达
11.4 模型学习
11.5 飞行测试
11.6 小结
参考文献
第12章 人机自动化集成
12.1 人的能力及其应对
12.2 设计中人为因素的考量
12.3 实现的系统级视角
12.4 小结
参考文献
名词索引
附录 部分彩图