本书从概率论的基础开始,带领学生学习如计算机模拟、蒙特卡罗方法、随机过程、马尔可夫链、排队系统、统计推断和回归等广泛应用于现代计算机科学、计算机工程、软件工程以及相关领域的重要内容.第一部分介绍概率和随机变量,第二部分讲解随机过程,第三部分引入统计学的基础知识,附录部分给出了必要的微积分内容.另外,R和MATLAB的使用贯穿本书.本书适合计算机相关专业的高年级本科生和低年级研究生使用,也可以用作概率论和统计学的方法、模拟与建模工具的参考书.
本书可作为计算机专业、软件工程、信息与通信、数据科学等专业的概率统计教材,也可以作为相关专业研究人员的自学用书。
前 言
本书从概率论的基础部分开始,引导读者学习计算机模拟、蒙特卡罗方法、随机过程、马尔可夫链、排队系统、统计推断和回归.这些概念广泛应用于现代计算机科学、计算机工程、软件工程以及相关领域.
读者对象
本书主要供计算机相关专业(如计算机科学、软件工程、信息系统、数据科学、信息技术和电信技术等)的高年级本科生和低年级研究生使用.同时,它也可以用作电气工程、数学、统计学等自然科学以及其他专业的基于微积分的标准入门统计学课程教材.有关概率论和统计学的主题,请分别参见第1~4章、第8章和第9章.
研究生可以将本书用于准备基于概率论的课程,例如排队理论(QT)、人工神经网络(ANN)、计算机性能(CP)等.
本书还可以用作学习概率论以及统计方法、模拟和建模工具的标准参考书.
课程建议
本书提供了一些开放式可选章节,建议作为一个学期的课程.同时,在第2版和第3版添加了新内容之后,本书可以完整地用作两个学期的概率论与数理统计课程的教材.
在第1~4章介绍概率与分布之后,教师可以选择图1中的剩余部分.
图1 章节流程图
以概率论为导向的课程.在学完概率论核心内容之后,继续学习第6章和第7章的随机过程、马尔可夫链和排队理论.计算机模拟和蒙特卡罗方法等补充内容吸引了计算机科学专业的学生,他们可以学习并练习第5章中的通用模拟技术,然后进入6.4节和7.6节,进一步学习随机过程的模拟和相当复杂的排队系统的模拟.学习这部分时,强烈建议学生学习第5章,但其余内容对第5章并没有要求.
以统计学为导向的课程.在学完概率论核心内容之后,继续学习第8章和第9章,紧接着便是从第10章和第11章中选择统计学中的其他主题.这样课程更加标准化,适合众多专业.第5章仍然是可选的,但是建议学习,它讨论了基于计算机模拟的统计学方法.10.3节中的现代自助法将继续关于这个问题的讨论.
除去可以跳过的部分内容,第1~11章涵盖了两学期的课程内容.本书展现的内容主要分为两大部分:第一学期的概率论主题(第1~7章),第二学期的统计学主题(第8~11章).
VI
先决条件和附录使用
从第4章开始,你需要熟悉微分和积分.这些知识只要在大学上过一个学期的微积分课程就够了.
作为回顾,附录对阅读本书所需要具备的微积分技巧做了非常简短的总结(见A.4节).当然,这一部分不能从头开始讲微积分,仅可作为参考为学生提供帮助.
第6章、第7章、11.3节和11.4节依赖于非常基本的矩阵计算.因此,读者应该能够对矩阵进行乘法运算、求解线性方程组(第6章和第7章),以及计算逆矩阵(11.3节).附录A.5节通过一些示例对这些技能进行了基本的复习.
风格和动机
本书写作风格生动形象,言简意赅,易读易懂.阅读本书,学生仿佛在倾听一位经验丰富且富有热情的教师讲课.
除了计算机科学应用和多个激励性示例,本书还包含了有趣的事实、矛盾的陈述以及在其他领域的广泛应用等.我期望学生可以喜欢这门课并从中受益,找到它的魅力所在,并希望书中知识能让你的职业生涯受益.
每章都包含多个有明确解决方案的例子,其中许多解决方案都离不开计算机科学应用.每章都有一个简短的归纳总结,以及许多可用作家庭作业和自我训练的练习题.本书有超过270个问题可供选择.
计算机、数据、演示、插图、R以及MATLAB
丰富而简明易懂的图表数据可以帮助读者理解本书内容,并将概念、公式甚至一些证明可视化.此外,教师和学生可以使用书中的短程序来进行计算机演示.随机性、不确定性、随机变量的行为以及随机过程、收敛性结果(例如中心极限定理),尤其是蒙特卡罗模拟,可以通过动画图形得到不错的可视化结果.
这些用R语言和MATLAB编写的简短的计算机代码,包含非常基本和简单的指令.这些语言的基础知识并非必须了解的.读者还可以选择使用其他编译软件,在其中逐行复制给定的代码,或者将它们用作流程图.
教师可以选择用R语言、MATLAB或者同时使用两者来教授课程,使用其他软件甚至不使用软件也是可以的.
在理解了书中的计算机化示例后,学生可以使用相似的代码来完成书中提出的项目和小型项目.
VII
出于教学目的,本书所使用的数据集并不大,很多书中都有这些内容.它们也被放在我们的数据清单中(参见网址http://fs2.american.edu/baron/www/Book/).学生可以将它们添加到自己的计算机程序中,也可以下载文中给出的数据文件和CSV文件.所有的数据集都列在A.1节中,在该节我们也介绍如何在R语言和MATLAB中读入它们.
第2版和高级统计学主题
来自不同国家的教授在他们的课程中使用了本书,并给予了大量的反馈,这激励我继续完善第2版.因此,统计推断一章得到了扩展并分成了第9章和第10章.补充的内容以新节的方式出现,具体参见表0.1.
表0.1
译者序
前言
第1章 简介与概述1
1.1 在不确定性下做出决策1
1.2 本书概览2
归纳总结4
练习题4
第一部分 概率与随机变量
第2章 概率6
2.1 事件及其概率6
2.1.1 结果、事件和样本空间6
2.1.2 集合运算7
2.2 概率的规则9
2.2.1 概率的公理9
2.2.2 计算事件的概率10
2.2.3 可靠性的应用12
2.3 组合学13
2.3.1 等可能的结果13
2.3.2 排列组合15
2.4 条件概率和独立性18
归纳总结22
练习题22
第3章 离散随机变量及其分布27
3.1 随机变量的分布27
3.1.1 主要概念27
3.1.2 随机变量类型30
3.2 随机向量的分布31
3.2.1 联合分布和边缘分布31
3.2.2 随机变量的独立性31
3.3 期望和方差33
3.3.1 期望33
3.3.2 期望函数34
3.3.3 性质34
3.3.4 方差和标准差35
3.3.5 协方差和相关性36
3.3.6 性质37
3.3.7 切比雪夫不等式39
3.3.8 金融应用39
3.4 离散分布族41
3.4.1 伯努利分布41
3.4.2 二项分布42
3.4.3 几何分布44
3.4.4 负二项分布46
3.4.5 泊松分布47
3.4.6 二项分布的泊松近似48
归纳总结49
练习题50
第4章 连续分布55
4.1 概率密度55
4.2 连续分布族58
4.2.1 均匀分布59
4.2.2 指数分布60
4.2.3 伽马分布62
4.2.4 正态分布66
4.3 中心极限定理68
归纳总结71
练习题72
第5章 计算机模拟和
蒙特卡罗方法77
5.1 简介77
5.2 随机变量的模拟78
5.2.1 随机数生成器79
5.2.2 离散方法79
5.2.3 逆变换法82
5.2.4 舍选法84
5.2.5 生成随机向量86
5.2.6 特殊方法87
5.3 用蒙特卡罗方法解决问题88
5.3.1 概率估算88
5.3.2 均值和标准差估算91
5.3.3 预测91
5.3.4 长度、面积、体积估算93
5.3.5 蒙特卡罗积分法95
归纳总结97
练习题97
第二部分 随机过程
第6章 随机过程102
6.1 定义和分类102
6.2 马尔可夫过程和马尔可夫链103
6.2.1 马尔可夫链104
6.2.2 矩阵方法106
6.2.3 稳态分布110
6.3 计数过程114
6.3.1 二项过程115
6.3.2 泊松过程118
6.4 随机过程模拟122
归纳总结125
练习题125
第7章 排队系统129
7.1 排队系统的主要组件129
7.2 利特尔法则131
7.3 伯努利单个服务器排队过程133
7.3.1 容量有限的系统136
7.4 M/M/1系统137
7.4.1 评估系统的性能140
7.5 多服务器排队系统143
7.5.1 伯努利k个服务器
排队过程143
7.5.2 M/M/k系统146
7.5.3 无限数量的服务器和
M/M/148
7.6 排队系统的模拟150
归纳总结154
练习题154
X
第三部分 统计学
第8章 统计概论160
8.1 总体与样本、参数与统计160
8.2 统计描述162
8.2.1 均值163
8.2.2 中位数164
8.2.3 分位数、百分位数和
四分位数167
8.2.4 方差和标准差169
8.2.5 估算标准误差170
8.2.6 四分位数范围171
8.3 统计图形172
8.3.1 直方图172
8.3.2 茎叶图175
8.3.3 箱线图177
8.3.4 散点图和时间图178
归纳总结180
练习题181
第9章 统计推断Ⅰ183
9.1 参数估计183
9.1.1 矩量法184
9.1.2 最大似然法186
9.1.3 标准误差估计189
9.2 置信区间191
9.2.1 建立置信区间:
一般方法192
9.2.2 总