统计学是一门关于数据的科学,它在多个学科领域有着广泛的应用.本书内容涉及常用统计数据分析与统计方法的应用,包括统计与数据、R语言基础、统计数据的描述性分析、总量指标和相对指标、概率论基础、样本与抽样分布、参数估计、假设检验、方差分析、相关与回归分析、多元回归分析、时间序列分析等.另外,对R软件的基本内容以及与以上内容有关的R语言实现过程做了简介,以便于各种统计方法的实际应用.各章均有大量的有实际应用背景的例子的详解和R代码的实现过程,希望这些例子能使读者对统计和R软件产生兴趣,当你用R软件来学习统计时,你一定会爱上统计,也会爱上R软件.
本书可作为理科、工科、经济、管理、农林、医学以及人文社会科学专业读者的统计学入门教材,也可供实业界和从事经济商务分析的各类人员参考.
统计学是研究不确定现象数量规律性的方法论科学,它在多个学科领域有着广泛的应用.随着大数据时代的到来,理科、工科、经济、管理、农林、医学以及人文社会科学对数据分析的需求在持续增长,相关行业需要处理大量的数据信息.将统计学的思想和方法应用于各个领域,并和强大的R软件相结合,成为解决各领域实际问题的最有效的手段之一.
本书作为一本统计学的入门教材,主要讲述数据分析与统计方法的应用.每一种统计方法的介绍都以一项实际应用来表述,并用统计结果给出决策的过程和问题的解答.
本书的一个特色是应用性强.书中主要介绍统计学的思想、方法在实际中的应用,以解决实际中存在的数据分析问题.本书介绍了大量以实际数据为基础的例子,每一种统计方法的介绍都与一个实例相关联,并在每一章配套大量的有实际应用背景的例题和练习,以便读者熟练掌握相应的统计方法.
本书的另一个特色是通俗易懂.借助强大的R软件,本书舍弃了烦琐的数学推导和统计计算,采用深入浅出、循序渐进的方法系统地介绍了统计学的思想和方法,通过实例的介绍,帮助读者理解并且能够很容易地利用R软件完成各种统计分析的计算.虽然R软件是编程语言,但由于其简单易懂,即使从未使用过R软件的人也可以毫不费力地通过复制、粘贴书上的代码重新实现书上的所有例题的计算.本书还穿插了历史上的统计学家的生平、成就以及他们的贡献的介绍,扩展读者的视野,使读者了解统计学发展和应用的历史背景,既使得统计学的学习不再枯燥,又使得读者能更全面地了解统计这个学科.
R软件是伴随着统计学的发展而兴起的一种计算工具,具有自由、免费和开源的特点,自诞生以来,得到越来越多的统计学家和工程技术人员的使用.R软件中内置了多种统计学及数值分析功能,其功能还可以通过安装不断更新的程序包得以扩展.国际上统计学术期刊最新发表的论文中介绍的高被引(高频次被引用)统计方法绝大多数都可以从CRAN上自由下载,因此,R软件被国外大量的学术科研机构使用,国外大学的统计系许多都将R软件作为学生的必修课程,R软件在国际上已经成为统计学教学与科研的主要软件,其应用范围涵盖了几乎所有的统计分支方向和许多交叉学科(如计量金融学、统计遗传学、统计物理学等),统计学课程的教学与R软件的紧密结合已成为发达国家统计教学的主流.
本书内容共12章,其中第1~3章及5~12章由朱彬编写,第4章由薛文娟编写,郭念枝和沈群也参与了本书习题部分的编写工作中,最后由朱彬负责统稿.
本书编写过程中,得到福建师范大学经济学院的各位领导和同事的关心、鼓励和支持,在此表示深深的谢意.本书的编写得到福建师范大学经济学院的资助,在此表示感谢.
希望本书能使读者对统计和R软件产生兴趣,当你用R软件来学习统计时,你一定会爱上统计,也会爱上R软件.
由于编者水平有限,书中疏漏和错误之处在所难免,恳请读者批评指正,以便再版时修改完善.
编者
前言
第1章统计与数据
1.1什么是统计
1.2统计学的基本概念
1.2.1总体与个体
1.2.2变量
1.2.3样本
1.2.4参数与统计量
1.3数据的类型
1.3.1分类数据、顺序数据、数值型
数据
1.3.2截面数据和时间序列数据
1.4统计数据的来源
1.4.1统计直接调查
1.4.2观察与实验
1.4.3间接获取数据
1.5统计数据的质量
1.6统计学与R软件
1.7初识R软件
习题1
第2章R语言基础
2.1向量
2.1.1基本运算
2.1.2赋值
2.1.3向量赋值
2.1.4向量运算
2.1.5作图
2.1.6产生有规律的向量
2.1.7向量的类型
2.1.8向量的下标
2.2因子
2.3矩阵和数组
2.3.1生成矩阵
2.3.2矩阵下标
2.3.3矩阵的合并
2.3.4定义矩阵的行名和列名
2.3.5矩阵转化为向量
2.3.6矩阵的维运算
2.3.7数组的生成
2.3.8数组下标
2.4列表
2.5数据框
2.5.1数据框的生成
2.5.2数据框的引用
2.5.3定义数据框的变量名
2.6创建R数据
2.6.1在R中录入数据
2.6.2数据的使用和编辑
2.7生成随机数和随机样本
2.7.1随机数
2.7.2随机样本
2.8编写自定义函数
2.8.1编写函数
2.8.2循环函数
2.9绘制多图
2.10脚本
2.11输入数据与读写数据
习题2
第3章统计数据的描述性分析
3.1统计数据的整理与显示
3.1.1统计数据的分组
3.1.2次数分配与频数分布图
3.1.3条形图和饼图
3.1.4Pareto图
3.1.5直方图
3.1.6茎叶图
3.2集中趋势的度量
3.3离中趋势的度量
3.4分布形状的度量
3.5数据分布的正态性检验和分布拟合
检验
3.6多元数据的可视化
习题3
第4章总量指标和相对指标
4.1总量指标
4.2相对指标
4.2.1相对指标的种类和计算方法
4.2.2运用相对数指标的原则
习题4
第5章概率论基础
5.1随机事件与概率
5.1.1随机试验与随机事件
5.1.2概率
5.1.3古典概型
5.1.4几何概型
5.1.5条件概率
5.1.6乘法公式、全概率公式、贝叶斯
公式
5.1.7事件的独立性
5.2随机变量及其分布
5.2.1随机变量的定义及分布函数
5.2.2离散型随机变量
5.3连续型随机变量
5.4常用随机变量分布的R实现
习题5
第6章样本与抽样分布
6.1样本与统计量
6.1.1总体与样本
6.1.2统计量
6.1.3经验分布函数
6.2大数定律与中心极限定理
6.2.1大数定律
6.2.2中心极限定理
6.3中心极限定理在抽样分布中的应用
6.3.1样本均值的抽样分布
6.3.2样本比例p的抽样分布
6.4常用统计量的抽样分布
6.4.1三种常用统计分布
6.4.2正态总体下常用统计量的分布
6.4.3样本比例的抽样分布
习题6
第7章参数估计
7.1点估计
7.2估计量的评价标准
7.3区间估计
7.3.1单个正态总体的情况
7.3.2两个正态总体参数的区间估计
7.4总体比例的区间估计
7.5样本容量的确定
习题7
第8章假设检验
8.1假设检验的基本概念
8.2单个正态总体参数的假设检验
8.3两个正态总体参数的假设检验
8.4总体比例的假设检验
8.5拟合优度检验
习题8
第9章方差分析
9.1单因素方差分析
9.2双因素方差分析
习题9
第10章相关与回归分析
10.1相关分析
10.2一元线性回归分析
10.3利用回归方程进行预测
10.4非线性回归分析
习题10
第11章多元回归分析
11.1数学模型
11.2多元回归模型的拟合优度
11.3多元回归模型的显著性检验
11.4回归诊断
11.5利用回归模型进行预测
11.6定性变量的回归模型
习题11
第12章时间序列分析
12.1时间序列的成分
12.2移动平均法与指数平滑法
12.3回归预测分析
12.4时间序列的平稳性
习题12
参考文献