全书共由12章组成,在介绍多元统计分析的有关概念、相关背景的基础上,突出统计思想,着重讲解常用方法及其应用。主要内容包括多元数据的表示及可视化、线性回归分析、逐步回归与回归诊断、广义线性模型与非线性模型、方差分析、聚类分析、判别分析、主成分分析、因子分析、对应分析、典型相关分析,《多元统计分析:从数据到结论》图文并茂,注重可读性,着重于多元统计分析方法在各个领域中的应用,将应用案例贯穿始终,并给出了R软件、MATLAB的相关程序。
《多元统计分析:从数据到结论》可以作为高等院校有关专业本科生、研究生“多元统计分析”课程的教材或参考书,也可作为全国大学生(研究生)“数学建模竞赛”、全国大学生“统计建模大赛”的培训教材或参考书,还可以供有关专业的教师、研究人员和工程技术人员以及广大自学者参考。
“多元统计分析”课程已经被越来越多的将来需要与数据打交道的本科生和研究生的相关专业列为必修课或选修课。随着我国高等教育进一步“大众化”,特别是相关软件的普及,学习“多元统计分析”的人越来越多,人们不再只满足于学习一些理论知识,大家更希望将此作为工具,借助计算机和相关软件进行数据处理和分析。
作者结合多年来的教学实践,深感一本内容简练但又实用的“多元统计分析”教材的重要性,在已有的相关教材中,有的侧重理论的讲述,读者需要具备较深厚的数学基础;有的则注重模型的应用,理论和技术细节不是重点。本书在介绍多元统计分析的有关概念、背景的基础上,突出统计思想,着重讲解常用方法及其应用,并侧重于应用。本书书名为《多元统计分析:从数据到结论》(Multivariate Statistical Analysis:From Data to Conclusions),意在“应用”,书中将一些严格的数学推导过程略去而只列出结论(降低了对数学基础的要求),读者学习时关键是理解这些结果,清楚它们的意义和背景,对一些被略去的推理论证部分,感兴趣者可参考书后列出的有关文献。
本书汲取了国内外相关教材中流行的直观、灵活的教学方式,以及通过图表和应用案例进行教学这些长处。本书中的例题可以分为两类:一类是为了说明有关理论或方法的简单问题(这类问题一般不需要借助软件);另一类是为了应用有关理论或方法解决一些比较复杂的问题(应用案例),这类问题的解决一般需要借助软件才能实现。
考虑到作为一款免费软件,R软件具有丰富的资源、良好的扩展性和完备的帮助系统,并且考虑到MATLAB在工程等领域中应用的广泛性、在国内外各高等院校中使用的普及性,本书的应用案例采用R软件和MATLAB,并给出了相应的程序。
感谢王家宝教授在作者写作本书过程中给予的指导和鼓励,本书的编写得到宁波工程学院理学院的支持,在此表示感谢。
作者结合多年的教学实践,把一些教学经验、教学研究成果和教学心得体会等写进了本书,希望能和广大读者一起分享,虽然作者努力使本书成为一本既有特色又便于教学(或自学)的教材,但由于水平所限,书中难免还存在一些疏漏甚至是错误,恳请专家和读者批评和指正。
前言
第1章 绪论
1.1 多元统计分析概述
1.2 多元统计分析的应用
1.3 有关软件介绍
1.4 本书的基本框架和内容安排
1.5 思考与练习题
第2章 多元数据的表示及可视化
2.1 多元数据的矩阵表示
2.1.1 多元数据的一般格式
2.1.2 多元数据的数字特征
2.2 多元数据的展示及可视化
2.2.1 用R语言展示和描述多元数据
2.2.2 用R语言对多元数据进行可视化
2.3 思考与练习题
第3章 线性回归分析
3.1 一元线性回归的回顾
3.1.1 一个例子
3.1.2 数学模型
3.1.3 回归参数的估计
3.1.4 回归方程的显著性检验
3.1.5 预测
3.2 多元线性回归
3.2.1 多元线性回归模型
3.2.2 回归参数的估计
3.2.3 回归方程的显著性检验
3.2.4 预测
3.2.5 血压、年龄和体质指数问题
3.2.6 电力市场的输电阻塞管理问题
3.3 多项式回归
3.4 思考与练习题
第4章 逐步回归与回归诊断
4.1 逐步回归
4.1.1 变量的选择
4.1.2 逐步回归的计算
4.2 回归诊断
4.2.1 什么是回归诊断
4.2.2 儿童智力测试问题
4.3 Box-Cox变换
4.4 思考与练习题
第5章 广义线性模型与非线性模型
5.1 广义线性模型
5.1.1 广义线性模型概述
5,1.2 Logistic模型
5.1.3 对数线性模型
5.2 一元非线性回归模型
5.3 多元非线性回归模型
5.3.1 R软件中非线性拟合函数及其应用
5.3.2 MATLAB中非线性回归函数及其应用
5.4 思考与练习题
第6章 方差分析
6.1 单因素方差分析
6.1.1 数学模型
6.1.2 方差分析
6.1.3 用R软件作单因素方差分析
6.1.4 用MATLAB作单因素方差分析
6.1.5 均值的多重比较
6.2 双因素方差分析
6.2.1 不考虑交互作用
6.2.2 考虑交互作用
6.3 多元方差分析
6.3.1 多个正态总体均值向量的检验
6.3.2 多个正态总体协方差矩阵的检验
6.4 本章附录
6.5 思考与练习题
第7章 聚类分析
7.1 聚类分析的基本思想与意义
7.2 Q型聚类分析
7.2.1 两点之间的距离
7.2.2 两类之间的距离
7.2.3 用MATLAB进行聚类分析
7.2.4 用R软件进行聚类分析
7.3 R型聚类分析
7.3.1 变量相似性度量
7.3.2 变量聚类法
7.4 我国高等教育发展状况的聚类分析
7.4.1 问题的提出
7.4.2 问题的分析与建模
7.4.3 问题的求解
7.4.4 问题的研究结果
7.5 聚类分析要注意的问题
7.6 思考与练习题
第8章 判别分析
8.1 距离判别
8.1.1 马氏距离
8.1.2 判别准则与判别函数
8.1.3 多总体情形
8.1.4 R软件中的判别函数介绍与应用
8.2 Fisher判别
8.2.1 判别准则
8.2.2 判别函数中系数的确定
8.2.3 确定判别函数
8.3 Bayes判别
8.3.1 误判概率与误判损失
8.3.2 两总体的Bayes判别
8.3.3 某气象站有无春旱的判别问题
8.3.4 有关MATLAB程序和计算结果
8.4 蠓虫分类问题
8.4.1 问题的提出
8.4.2 问题的分析与模型的建立
8.4.3 模型求解
8.5 3种鸢尾花分类问题
8.6 判别分析中需要注意的几个问题
8.7 思考与练习题
第9章 主成分分析
9.1 主成分分析的基本思想和方法
9.2 特征值因子的筛选
9.3 主成分回归分析
9.4 成年男子16项身体指标的主成分分析
9.5 学生4项身体指标的主成分分析
9.6 我国部分地区人均消费水平的主成分分析
9.7 我周高等教育发展情况的主成分分析
9.7.1 计算特征值和特征向量
9.7.2 选择主成分与计算综合评价值
9.7.3 问题的求解
9.7.4 问题的研究结果
9.8 主成分分析中需要注意的几个问题
9.9 思考与练习题
……
第10章 因子分析
第11章 对应分析
第12章 典型相关分析
参考文献