《大数据技术与应用基础》全面讲述了大数据技术与应用相关的基础概念和知识,着重介绍了大数据的国内外发展状况、技术架构以及大数据分析的基本知识、数据分析、挖掘的流程、方法、工具等,并选择了一个数据分析、挖掘软件作为实例进行了重点说明。
全书分四个部分共18章,第一部分包括第1章至第4章,介绍大数据基础知识;第二部分包括第5章至第7章,介绍大数据初级应用基础知识;第三部分包括第8章至第16章,介绍数据分析挖掘模型和方法;第四部分包括第17章和第18章,介绍大数据关联工作说明。
《大数据技术与应用基础》既适合于开展国家职业技能培训的各类培训机构作为大数据基础分析师,以及大数据技术与应用基础的教材使用,也适合于已经掌握大数据基础知识,但希望使用数据挖掘软件进行数据分析实践的读者自学参考。
第一部分 基础知识
第1章 大数据的基本概念、特征与作用
1.1 背景和概要说明
1.2 大数据的基本概念和内涵
1.3 大数据的特征
1.4 大数据的重要作用
1.5 章节汇总
第2章 大数据发展状况
2.1 背景和概要说明
2.2 国外大数据发展状况
2.3 国内大数据现状
2.4 大数据发展趋势
2.5 章节汇总
第3章 大数据技术体系
3.1 背景和概要说明
3.2 NIST提出的大数据参考架构
3.3 国际标准化机构提出的大数据概念模型
3.4 大数据生命周期
3.5 大数据技术体系
3.6 大数据核心技术
3.7 章节汇总
第4章 大数据标准化之路
4.1 背景和概要说明
4.2 SC32大数据标准化情况
4.3 SG2大数据标准化工作情况
4.4 ITU大数据标准化工作情况
4.5 NIST标准化工作情况
4.6 国内标准化工作情况
4.7 大数据标准体系架构
4.8 章节汇总
第二部分 初级应用
第5章 相关工具简介
5.1 背景和概要说明
5.2 工具说明
5.3 数据分析、挖掘流程
5.4 数据分析、挖掘
5.5 章节汇总
第6章 了解数据
6.1 背景和概要说明
6.2 数据分析、挖掘的目的和局限
6.3 相关概念
6.4 数据的类型
6.5 与隐私和安全有关的说明
6.6 章节汇总
第7章 准备数据
7.1 背景和概要说明
7.2 应用CRISP数据分析、挖掘模型
7.3 数据收集
7.4 数据清理
7.5 动手练习
7.6 准备系统、导入数据
7.7 数据约简
7.8 处理不一致的数据
7.9 属性约简
第三部分 数据分析、挖掘模型和方法
第8章 相关知识
8.1 背景和概要说明
8.2 了解组织
8.3 了解数据
8.4 数据准备
8.5 建模
8.6 评估
8.7 部署
8.8 章节汇总
第9章 关联规则
9.1 背景和概要说明
9.2 了解组织
9.3 了解数据
9.4 数据准备
9.5 建模
9.6 评估
9.7 部署
9.8 章节汇总
第10章 K均值聚类
10.1 背景和概要说明
10.2 了解组织
10.3 了解数据
10.4 数据准备
10.5 建模
10.6 评估
10.7 部署
10.8 章节汇总
第11章 判别分析
11.1 背景和概要说明
11.2 了解组织
11.3 了解数据
11.4 数据准备
11.5 建模
11.6 评估
11.7 部署
11.8 章节汇总
第12章 线性回归
12.1 背景和概要说明
12.2 了解组织
12.3 了解数据
12.4 数据准备
12.5 建模
12.6 评估
12.7 部署
12.8 章节汇总
第13章 逻辑回归
13.1 背景和概要说明
13.2 了解组织
13.3 了解数据
13.4 数据准备
13.5 建模
13.6 评估
13.7 部署
13.8 章节汇总
第14章 决策树
14.1 背景和概要说明
14.2 了解组织
14.3 了解数据
14.4 数据准备
14.5 建模
14.6 评估
14.7 部署
14.8 章节汇总
第15章 神经网络
15.1 背景和概要说明
15.2 了解组织
15.3 了解数据
15.4 数据准备
15.5 建模
15.6 评估
15.7 部署
15.8 章节汇总
第16章 文本挖掘
16.1 背景和概要说明
16.2 了解组织
16.3 了解数据
16.4 数据准备
16.5 建模
16.6 评估
16.7 部署
16.8 章节汇总
第四部分 关联工作说明
第17章 评估和部署
17.1 背景和概要说明
17.2 交叉验证
17.3 章节汇总
第18章 数据分析、挖掘道德规范
18.1 背景和概要说明
18.2 道德框架和建议
18.3 总结