本书是为初学者学习R语言数据分析与可视化技术及它们在数据科学中的应用而编写的。全书共7章,可分为3个部分。第1部分(第1~3章)介绍R语言数据分析的基础知识,第2部分(第4~5章)介绍R语言基础绘图方法,第3部分(第6~7章)介绍较为重要的R语言可视化扩展包的具体应用。读者可以通过本书了解和体验R语言数据分析与可视化技术的特点、功能和应用。本书的所有示例代码均已在R 4.2.1环境下调试通过。
本书既可作为高等院校相关专业的教材,又可作为科技工作者使用R语言绘制图形的参考用书。
(1)在知识内容的选择与理论深度的把握上,同时考虑了初学者的需要和R语言的最新进展。内容安排力求循序渐进,可以助力初学者快速入门。
(2)在技能实训与知识应用方面,本书配有大量的程序示例和使用R语言绘制的图形,通过可以重现的程序示例来引导初学者动手实践,锤炼初学者利用R语言进行数据分析与可视化的实战能力;同时,本书所有代码均在R 4.2.1环境下调试通过。
(3)本书提供PPT课件、教学大纲、教案、习题答案、源代码和微课视频等教辅资源,读者可以登录人邮教育社区(www.ryjiaoyu.com)下载使用,部分教辅资源仅供院校教师下载使用。
沈刚:
博士,华中科技大学教授,毕业于清华大学自动化系,曾先后到加拿大McGill大学和多伦多大学访问学习;1999年起,在加拿大Kerr Vayne Systems及美国Motorola公司工作,从事自动化系统和移动通讯系统的研究与开发;2003年起,在华中科技大学软件学院任教,主要讲授数据结构、嵌入式系统、软件过程管理等课程,主编《R语言基础与数据科学应用》、《R语言数据分析与可视化(微课版)》等教材,并被多所院校选用。
【章名目录】
第 1部分
第 1章 概述
第 2章 R语言数据操作
第3章 R语言数据分析
第 2部分
第4章 R语言基础绘图系统
第5章 常用图形类型
第3部分
第6章 ggplot2绘图
第7章 plotly绘图
【详细目录】
第 1部分
第 1章 概述
1.1 数据分析的意义 2
1.1.1 数据分析的重要性 2
1.1.2 数据分析技术 3
1.2 数据分析流程 5
1.2.1 数据分析的主要步骤 5
1.2.2 影响数据可视化的因素 6
1.3 可视化对象的结构 9
1.3.1 数据可视化的要素 9
1.3.2 核心视觉元素 11
1.4 R语言环境配置 12
1.4.1 R系统下载与安装 12
1.4.2 R系统基础 13
1.4.3 R语言中的扩展包 18
1.5 本章小结 20
习题1 20
第 2章 R语言数据操作
2.1 数据类型 22
2.1.1 基本数据类型 22
2.1.2 数据类型转换 27
2.2 数据结构 28
2.2.1 向量、矩阵和数组 29
2.2.2 数据框 34
2.2.3 列表 38
2.2.4 因子 39
2.3 向量化运算 40
2.3.1 向量化运算的基本概念及实现方法 40
2.3.2 自定义函数的向量化 43
2.3.3 apply函数族 43
2.4 随机数与抽样 45
2.4.1 概率分布与随机数生成 45
2.4.2 抽样 47
2.5 数据导入与导出 49
2.5.1 工作空间 49
2.5.2 数据导入 50
2.5.3 数据导出 52
2.6 本章小结 54
习题2 54
第3章 R语言数据分析
3.1 数据预处理 56
3.1.1 数据查看 56
3.1.2 数据清洗 59
3.1.3 数据转换 63
3.2 数据统计描述 67
3.2.1 统计矩 67
3.2.2 相关性分析与方差分析 70
3.2.3 参数估计 74
3.3 数据降维 76
3.3.1 主成分分析 76
3.3.2 因子分析 77
3.4 聚类分析 81
3.4.1 基于中心的聚类 82
3.4.2 基于密度的聚类 86
3.4.3 层次聚类 89
3.5 回归分析 90
3.5.1 简单线性回归 91
3.5.2 广义线性回归 95
3.5.3 非线性回归 97
3.6 本章小结 100
习题3 100
第 2部分
第4章 R语言基础绘图系统
4.1 基本绘图函数和参数访问函数 103
4.1.1 plot ( )函数 103
4.1.2 参数查询与设置函数——par( )函数 107
4.2 绘图布局 110
4.2.1 绘图窗口及绘图区域 110
4.2.2 子图 111
4.2.3 数轴 112
4.3 视觉属性调整 114
4.3.1 颜色 114
4.3.2 点 116
4.3.3 线 117
4.3.4 文字 119
4.4 文字标注 120
4.4.1 字符型标注 120
4.4.2 数学表达式 122
4.4.3 图例 124
4.5 导出图形 127
4.5.1 直接输出绘图文件 127
4.5.2 保存屏幕绘图 129
4.6 本章小结 129
习题4 129
第5章 常用图形类型
5.1 散点图 131
5.1.1 基础散点图 131
5.1.2 回归模型 133
5.1.3 遮挡的处理 137
5.1.4 高维数据的处理 138
5.2 序列图 141
5.2.1 时间序列图 141
5.2.2 日期表示 143
5.2.3 多变量序列 144
5.2.4 模型与趋势 145
5.3 描述统计图 146
5.3.1 直方图 146
5.3.2 箱形图 150
5.3.3 柱状图 154
5.3.4 热图 159
5.3.5 马赛克图 163
5.3.6 饼图 165
5.4 本章小结 168
习题5 168
第3部分
第6章 ggplot2绘图
6.1 图形语法 171
6.1.1 图形的组成 172
6.1.2 绘图的步骤 173
6.2 图形要素 176
6.2.1 图层 176
6.2.2 比例尺 180
6.2.3 坐标系 187
6.2.4 分面 189
6.2.5 主题 192
6.3 美学映射 196
6.3.1 轮廓颜色与填充颜色 196
6.3.2 形状与线型 197
6.3.3 标注与位置 200
6.4 图形绘制方法 202
6.4.1 数据加载方式 202
6.4.2 快速绘图函数 203
6.4.3 分组绘图 205
6.4.4 定制绘图函数 207
6.4.5 极坐标变换 210
6.5 本章小结 212
习题6 213
第7章 plotly绘图
7.1 plotly对象创建 215
7.1.1 plotly对象 216
7.1.2 plot_ly ( )函数 218
7.1.3 ggplotly ( )函数 222
7.2 图形绘制 226
7.2.1 add_* ( )函数 226
7.2.2 绘图形式 231
7.3 图形布局 242
7.3.1 图例 242
7.3.2 数轴与刻度 243
7.3.3 子图与插图 246
7.4 交互方式 249
7.4.1 配置修改 250
7.4.2 modebar修改 251
7.4.3 hoverinfo修改 251
7.5 静态图保存 252
7.5.1 webshot( ) 252
7.5.2 orca( ) 253
7.6 本章小结 255
习题7 255