多元统计分析是统计学中内容十分丰富、应用范围极为广泛的一个分支。在自然科学和社会科学的许多学科中,研究者都有可能需要分析处理有多个变量的数据问题。从表面上看起来杂乱无章的数据中发现和提炼出规律性的结论,不仅需要对所研究的专业领域有很好的训练,而且要掌握必要的统计分析工具。 对研究者来说,本书是学习掌握多元统计分析的各种模型和方法的一本有价值的参考书:首先,它做到了浅入深出,既可供初学者入门,又能使有较深基础的人受益;其次,它既侧重于应用,又兼顾必要的推理论证,使学习者既能学到“如何”做,而且在一定程度上了解“为什么”这样做;最后,它内涵丰富、全面,不仅基本包括各种在实际中常用的多元统计分析方法,而且对现代统计学的最新思想和进展有所介绍。值得一提的是,本书中有大量来自实际问题的数据实例,通过对这些实例的分析,读者可以学到如何将一个实际问题转化为恰当的统计问题,进而选择恰当的方法来进行分析。
多元统计分析是统计学中内容十分丰富、应用范围极为广泛的一个分支.在自然科学和社会科学的许多学科中,研究者都有可能需要分析处理有多个变量的数据的问题.从表面上看起来杂乱无章的数据中发现和提炼出规律性的结论,不仅需要对所研究的专业领域有很好的训练,而且需要掌握必要的统计分析工具.对实际领域中的研究者和高等院校的研究生来说,要学习掌握多元统计分析的各种模型和方法,手头有一本好的,有长久价值的参考书是非常必要的.这样一本书应该满足以下条件: 首先,它应该是“浅入深出”的,也就是说,既可供初学者入门,又能使有较深基础的人受益.其次,它应该是既侧重于应用,又兼顾必要的推理论证,使学习者既能学到“如何”做,而且在一定程度上了解“为什么”这样做.最后,它应该是内涵丰富、全面的,不仅要基本包括各种在实际中常用的多元统计分析方法,而且还要对现代统计学的最新思想和进展有所介绍、交代.
我们认为R.A.约翰逊(R.A.Johnson)和D.W.威克恩(D.W.Wichern)合著的《实用多元统计分析》(第6版)(Applied Multivariate Statistical Analysis,6th Ed)就是这样一本有长久价值的多元统计分析参考书.本书的内容十分丰富,涵盖了多元统计分析的各种有广泛应用的、经典和现代的模型和方法.为便于学习者对方法的理解,本书对各种方法的计算过程介绍得很详细,从简单的数据出发,将计算过程一步一步、不厌其烦地展开,使学习者对计算方法获得感性认识.在此基础上,对实际数据用计算机软件进行分析,并给出输入方法的说明和输出结果的解释,使得学习者能够掌握统计软件的操作步骤,并读懂输出结果的含义.书中有大量来自实际问题的案例,通过对这些案例的分析,学习者可以学到如何将实际问题转化为恰当的统计问题,进而选择恰当的模型与方法来分析.
由清华大学出版社出版的本书第4版的中文译本(2000年)在我国拥有广泛的读者群,并且已经被选为许多高校本科或研究生相关课程的教科书.作为第4版的中文译者,我们又有幸翻译了本书的第6版.第6版对第4版有所修改与补充,在作者原序中已经作了较为具体的说明.我们在这里再强调一下第6版新增加的两个内容.首先是在第11章中增加了逻辑斯蒂回归(Logistic regression).平行于经典的线性回归,逻辑斯蒂回归处理对二值响应变量的预测(分类)问题.其次是在第12章中增加了一节补充材料,介绍近年来非常热门并得到广泛应用的数据分析领域——数据挖掘(data mining),以及多元统计分析方法在数据挖掘中的应用.
本书由叶俊翻译第1章至第6章,由陆璇翻译第7章至第12章并统稿; 研究生冯汉杰、向红旭、新国和郑灿亮也参与了翻译工作。由于我们的水平有限,因此在翻译中难免有错误或不妥之处.希望各位专家和读者发现问题后及时告知我们,以便以后有机会时予以更正.
译者
2008年7月于清华园
实用多元统计分析Applied Multivariate Statistical Analysis
第1章多元分析概述
1.1引言
1.2多元方法的应用
1.3数据的组织
1.4数据的展示及图表示
1.5距离
1.6最终评注
练习
参考文献
第2章矩阵代数与随机向量
2.1引言
2.2矩阵和向量代数基础
2.3正定矩阵
2.4平方根矩阵
2.5随机向量和矩阵
2.6均值向量和协方差矩阵
2.7矩阵不等式和极大化
补充2A向量与矩阵: 基本概念
练习
参考文献
第3章样本几何与随机抽样
3.1引言
3.2样本几何
3.3随机样本以及样本均值和协方差矩阵的期望值
3.4广义方差
3.5作为矩阵运算的样本均值、协方差与相关系数
3.6变量的线性组合的样本值
练习
参考文献
第4章多元正态分布
4.1引言
4.2多元正态密度及其性质
4.3从多元正态分布抽样与极大似然估计
4.4和S的抽样分布
4.5和S的大样本特性
4.6评估正态性假定
4.7搜寻离群值及“清洁”数据
4.8变换到接近正态性
练习
参考文献
目录
实用多元统计分析
第5章关于均值向量的推断
5.1引言
5.2μ0作为正态总体均值的似真性
5.3霍特林T2与似然比检验
5.4置信域和均值分量的联合比较
5.5总体均值向量的大样本推断
5.6多元质量控制图
5.7观测值缺损时均值向量的推断
5.8多元观测中由时间相依性造成的困难
补充5A作为p维椭球投影的联合置信区间与置信椭圆
练习
参考文献
第6章多个多元均值向量的比较
6.1引言
6.2成对比较与重复测量设计
6.3两总体均值向量的比较
6.4多个多元总体均值向量的比较(单因子多元方差分析)
6.5处理效应的联合置信区间
6.6协方差矩阵相等性的检验
6.7双因子多元方差分析
6.8轮廓分析
6.9重复测量设计和生长曲线
6.10对分析多元模型的展望和建议
练习
参考文献
第7章多元线性回归模型
7.1引言
7.2经典线性回归模型
7.3最小二乘估计
7.4回归模型的推断
7.5由估计的回归函数作推断
7.6模型检查及回归中的其他问题
7.7多元多重回归
7.8线性回归的概念
7.9比较回归模型的两种表达方式
7.10有时间相关误差的多重回归模型
补充7A多元多重回归模型的似然比的分布
练习
参考文献
第8章主成分
8.1引言
8.2总体主成分
8.3综合主成分的样本变差
8.4主成分的图形表示
8.5大样本推断
8.6用主成分监控质量
补充8A样本主成分近似的几何意义
练习
参考文献
第9章因子分析与对结构性协方差矩阵的推断
9.1引言
9.2正交因子模型
9.3估计方法
9.4因子旋转
9.5因子得分
9.6因子分析的展望和建议
补充9A极大似然估计的某些计算细节
练习
参考文献
第10章典型相关分析
10.1引言
10.2典型变量和典型相关系数
10.3总体典型变量的解释
10.4样本典型变量和样本典型相关系数
10.5其他样本描述性度量
10.6大样本推断
练习
参考文献
第11章判别与分类
11.1引言
11.2两个总体的分离与分类
11.3两个多元正态总体的分类
11.4评估分类函数
11.5多个总体的分类
11.6对多个总体进行判别的费希尔方法
11.7逻辑斯蒂回归与分类
11.8最后的评述
练习
参考文献
第12章聚类、距离方法与多维标度变换
12.1引言
12.2相似性量度
12.3分层聚类方法
12.4非分层聚类方法
12.5基于统计模型的聚类
12.6多维标度变换
12.7对应分析
12.8用于观察抽样单元和变量的双重信息图
12.9普罗克鲁斯特斯分析: 一种比较点结构的方法
补充12A数据挖掘
练习
参考文献
附录