R语言数据挖掘(第3版)(基于R应用的统计学丛书)
定 价:59 元
丛书名:基于R应用的统计学丛书
- 作者:薛薇
- 出版时间:2023/1/1
- ISBN:9787300310381
- 出 版 社:中国人民大学出版社
- 中图法分类:TP312
- 页码:388
- 纸张:
- 版次:3
- 开本:16
全书分为12章,第1章数据挖掘与R语言概述,第2章R的数据组织和整理,第3章R的数据可视化,第4章R的近邻分析:数据预测,第5章R的决策树:数据预测,第6章R的人工神经网络:数据预测,第7章R的支持向量机:数据预测,第8章R的一般聚类:揭示数据内在结构,第9章R的特色聚类:揭示数据内在结构,第10章R的关联分析:揭示数据关联性,第11章R的模式甄别:诊断异常数据,第12章R的网络分析初步。
第1章 数据挖掘与R语言概述
1.1 什么是数据挖掘
1.2 数据挖掘的结果
1.2.1 数据挖掘结果的呈现方式
1.2.2 数据挖掘结果的基本特征
1.3 数据挖掘能做什么
1.3.1 数据预测
1.3.2 发现数据的内在结构
1.3.3 发现关联性
1.3.4 模式诊断
1.4 数据挖掘方法的特点
1.4.1 对目标契合度不高的数据,怎样的建模策略能够更好地迎合分析的需要 1.4.2 对于海量、高维数据,怎样的建模策略能够更好地揭示数据特征,提高分析效率
1.4.3 对于复杂类型和关系数据,怎样的建模策略能够清晰地揭示数据的特征 1.5 数据挖掘的典型应用
1.5.1 数据挖掘在客户细分研究中的应用
1.5.2 数据挖掘在客户流失分析中的应用
1.5.3 数据挖掘在营销响应分析中的应用
1.5.4 数据挖掘在交叉销售中的应用
1.5.5 数据挖掘在欺诈甄别中的应用
1.6 R语言入门必备
1.6.1 R的包
1.6.2 R的下载安装
1.6.3 R起步
1.6.4 R的运行方式和其他
1.7 RStudio简介
1.8 本章函数列表
第2章 R的数据组织和整理
2.1 R的数据对象
2.1.1 从存储角度划分R对象
2.1.2 从结构角度划分R对象
2.1.3 创建和访问R的数据对象
2.2 向量的创建和访问
2.2.1 创建只包含一个元素的向量
2.2.2 创建包含多个元素的向量
2.2.3 访问向量中的元素
2.3 矩阵的创建和访问
2.3.1 创建矩阵
2.3.2 访问矩阵中的元素
2.4 数据框的创建和访问
2.4.1 创建数据框
2.4.2 访问数据框
2.5 数组和列表的创建和访问
2.5.1 创建和访问数组
2.5.2 创建和访问列表
2.6 数据对象的相互转换
2.6.1 不同存储类型之间的转换
2.6.2 不同结构类型之间的转换
2.7 导入外部数据和保存数据
2.7.1 导入文本数据
2.7.2 导入SPSS数据
2.7.3 利用ODBC导入数据库数据和Excel表数据
2.7.4 共享R自带的数据包
2.7.5 数据保存
2.8 R语言程序设计基础
2.8.1 R程序设计基本概念
2.8.2 R的系统函数
2.8.3 用户自定义函数
2.8.4 R程序的控制结构
2.9 R语言数据整理和程序设计综合应用
2.9.1 数据整理基础综合应用
2.9.2 利用流程控制还原汇总数据
2.10 本章函数列表
第3章 R的数据可视化
3.1 绘图基础
3.1.1 图形设备和图形文件
3.1.2 图形组成和图形参数
3.2 单变量分布特征的可视化
3.2.1 核密度图
3.2.2 小提琴图
3.2.3 克利夫兰点图
3.3 多变量联合分布特征的可视化
3.3.1 曲面图和等高线图
3.3.2 二元核密度曲面图
3.3.3 雷达图
3.4 变量间相关性的可视化
3.4.1 马赛克图
3.4.2 散点图
3.4.3 相关系数图
3.5 本章函数列表
第4章 R的近邻分析:数据预测
4.1 近邻分析: K近邻法
4.1.1 K近邻法中的距离
4.1.2 K近邻法中的近邻个数
4.2 K近邻法的R函数和应用示例
4.2.1 R的K近邻法函数
4.2.2 R的K近邻法示例
4.3 K近邻法的适用性及特征选择
4.3.1 K近邻法的适用性
4.3.2 特征选择
4.4 本章函数列表
第5章 R的决策树:数据预测
5.1 决策树算法概述
5.1.1 什么是决策树
5.1.2 决策树的几何理解
5.1.3 决策树的核心问题
5.2 分类回归树的生长过程
5.2.1 分类树的生长过程
5.2.2 回归树的生长过程
5.2.3 损失矩阵对分类树的影响
5.3 分类回归树的剪枝
5.3.1 最小代价复杂度的测度
5.3.2 分类回归树后剪枝过程
5.3.3 分类回归树的交叉验证剪枝
5.4 分类回归树的R函数和应用示例
5.4.1 分类回归树的R函数
5.4.2 分类回归树的应用示例
5.5 建立分类回归树的组合预测模型
5.5.1 袋装技术
5.5.2 袋装技术的R函数及应用示例
5.5.3 提升技术
5.5.4 提升技术的R函数及应用示例
5.6 随机森林
5.6.1 随机森林概述
5.6.2 随机森林的R函数和应用示例
5.7 本章函数列表
第6章 R的人工神经网络:数据预测
6.1 人工神经网络概述
6.1.1 人工神经网络的概念和种类
6.1.2 人工神经网络中的节点和意义
6.1.3 人工神经网络建立的一般步骤
6.1.4 感知机模型
6.2 B-P反向传播网络
6.2.1 B-P反向传播网络的特点
6.2.2 B-P反向传播算法
6.2.3 B-P反向传播网络中的学习率
6.3 B-P反向传播网络的R函数和应用示例
6.3.1 neuralnet包中的neuralnet函数
6.3.2 neuralnet函数的应用示例
6.3.3 利用ROC曲线确定概率分割值
6.3.4 nnet包中的nnet函数
6.4 本章函数列表
第7章 R的支持向量机:数据预测
7.1 支持向量分类概述
7.1.1 支持向量分类的基本思路
7.1.2 支持向量分类的三种情况
7.2 线性可分问题下的支持向量分类
7.2.1 如何求解超平面
7.2.2 如何利用超平面进行预测
7.3 广义线性可分问题下的支持向量分类
7.3.1 如何求解超平面
7.3.2 可调参数的意义
7.4 线性不可分问题下的支持向量分类
7.4.1 线性不可分问题的一般解决方式
7.4.2 支持向量分类克服维灾难的途径
7.5 多分类的支持向量分类
7.6 支持向量回归
7.6.1 支持向量回归与一般线性回归
7.6.2 支持向量回归的基本思路
7.7 R的支持向量机及应用示例
7.7.1 R的支持向量机函数
7.7.2 利用R模拟线性可分下的支持向量分类
7.7.3 利用R模拟线性不可分下的支持向量分类
7.7.4 利用R模拟多分类的支持向量分类
7.8 本章函数列表
第8章 R的一般聚类:揭示数据内在结构
8.1 聚类分析概述
8.1.1 聚类分析的目的
8.1.2 聚类算法概述
8.2 基于质心的聚类模型:K-Means聚类
8.2.1 K-Means聚类中的距离测度
8.2.2 K-Means聚类过程
8.2.3 R的K-Means聚类函数
8.2.4 K-Means聚类的R模拟和应用示例
8.3 基于质心的聚类模型:PAM聚类
8.3.1 PAM聚类过程
8.3.2 R的PAM聚类函数和应用示例
8.4 基于联通性的聚类模型:层次聚类
8.4.1 层次聚类的基本过程
8.4.2 层次聚类中距离的联通性测度
8.4.3 层次聚类的R函数和应用示例
8.5 基于统计分布的聚类模型:EM聚类
8.5.1 基于统计分布的聚类模型的出发点:有限混合分布
8.5.2 EM聚类
8.5.3 R的EM聚类函数和应用示例
8.6 本章函数列表
第9章 R的特色聚类:揭示数据内在结构
9.1 BIRCH聚类
9.1.1 BRICH聚类的特点
9.1.2 BIRCH算法中的聚类特征和聚类特征树
9.1.3 BIRCH的聚类过程
9.1.4 BRICH聚类的R函数和应用示例
9.2 SOM网络聚类
9.2.1 SOM网络聚类设计的出发点
9.2.2 SOM网络的拓扑结构和聚类原理
9.2.3 SOM网络聚类的R函数和应用示例
9.2.4 SOM网络聚类应用:手写邮政编码识别
9.2.5 拓展SOM网络:数据预测
9.3 基于密度的聚类模型:DBSCAN聚类
9.3.1 DBSCAN聚类原理
9.3.2 DBSCAN聚类的R函数和应用示例
9.4 本章函数列表
第10章 R的关联分析:揭示数据关联性
10.1 简单关联规则及其测度
10.1.1 什么是简单关联规则
10.1.2 简单关联规则的有效性和实用性
10.2 Apriori算法及应用示例
10.2.1 搜索频繁项集
10.2.2 依据频繁项集产生简单关联规则
10.2.3 Apriori算法的R函数和应用示例
10.2.4 简单关联规则的可视化R函数和应用示例
10.3 简单关联分析的应用示例
10.3.1 发现连带销售商品
10.3.2 顾客选择性倾向对比
10.4 本章函数列表
第11章 R的模式甄别:诊断异常数据
11.1 模式甄别方法和评价概述
11.1.1 模式甄别方法
11.1.2 模式甄别结果及评价
11.2 模式甄别的无监督侦测方法及应用示例
11.2.1 依概率侦测模式及R应用示例
11.2.2 依距离侦测模式:DB方法及 R应用示例
11.2.3 依密度侦测模式:LOF方法及 R应用示例
11.3 模式甄别的有监督侦测方法及应用示例
11.3.1 朴素贝叶斯分类法
11.3.2 Logistic回归及示例
11.3.3 非平衡数据集的SMOTE处理
11.4 模式甄别的半监督侦测方法及应用示例
11.4.1 半监督分类:自训练分类模型
11.4.2 自训练分类模型的R函数及应用示例
11.5 本章函数列表
第12章 R的网络分析初步
12.1 网络的定义、表示及构建
12.1.1 网络的图论定义及R函数
12.1.2 网络的矩阵表示方式及 R函数
12.1.3 R的网络数据文件和建立网络对象
12.1.4 R的网络可视化
12.2 网络节点重要性的测度
12.2.1 度和测地线距离
12.2.2 节点“中心”作用的测度:点度中心度和接近中心度
12.2.3 节点“枢纽”作用的测度:中间中心度
12.2.4 节点重要性的其他方面:结构洞和关节点、特征向量中心度和 PageRank得分
12.3 网络子群构成特征研究
12.3.1 二元关系和三元关系及 R函数
12.3.2 派系和 k核及R函数
12.3.3 社区和组件及R函数
12.4 网络整体特征刻画
12.4.1 网络整体特征的测度
12.4.2 网络特征的各种分布和度量
12.5 主要网络类型及特点
12.5.1 规则网络
12.5.2 随机网络
12.5.3 小世界网络
12.5.4 无标度网络
12.6 本章函数列表