大数据作为继云计算、物联网之后 IT行业又一颠覆性的技术,备受人们关注。大数据无处不在,包括金融、汽车、零售、餐饮、电信、能源、政务、医疗、体育、娱乐等在内的各行各业,都融入了大数据的印迹,大数据对人类的社会生产和生活必将产生重大而深远的影响。本书为了让读者更好地了解大数据技术应用,从大数据的概念开始介绍大数据技术的应用过程,包括大数据概述、大数据技术平台、大数据预处理技术、大数据存储技术、大数据处理与分析和数据可视化。这些内容可以让读者系统地学习大数据技术涉及的关键技术及其基本概念和原理。
本书可作为各类职业院校大数据技术及相关专业的教材,也可以作为计算机爱好者的自学参考用书。
本书配有电子课件,读者可登录机械工业出版社教育服务网( www.cmpedu. com)以教师身份注册后免费下载或联系编辑( 010-88379807)咨询。本书还配有微课视频,读者可扫描二维码观看学习,方便教师进行混合教学。
前 言二维码索引
第1章 大数据概述 ............................................ 1
1.1 大数据的概念 .................................................................................. 3
1.2 大数据关键技术............................................................................. 22
1.3 大数据产业.................................................................................... 25
1.4 大数据与云计算、物联网之间的关系 .............................................. 30
1.5 大数据技术应用案例 ...................................................................... 40
本章小结................................................................................................ 43
本章习题................................................................................................ 43
第2章 大数据技术平台 .................................... 45
2.1 大数据处理框架Hadoop................................................................ 47
2.2 阿里云大数据平台.......................................................................... 52
本章小结................................................................................................ 62
本章习题................................................................................................ 62
第3章 大数据预处理技术..................................63
3.1 大数据获取手段............................................................................. 65
3.2 数据预处理技术............................................................................. 77
本章小结................................................................................................ 84
本章习题 ................................................................................................ 84
第4章 大数据存储技术 .................................... 87
4.1 分布式文件系统............................................................................. 89
4.2 分布式数据库HBase ................................................................... 103
4.3 NoSQL数据库 ............................................................................ 119
4.4 云数据库 ..................................................................................... 130
本章小结..............................................................................................144
本章习题 ..............................................................................................144
5.1 MapReduce .............................................................................. 149
5.2 Spark......................................................................................... 161
5.3 机器学习入门 .............................................................................. 178
本章小结.............................................................................................. 191
本章习题 .............................................................................................. 191
6.1 数据可视化概述........................................................................... 195
6.2 利用Python进行数据可视化 ........................................................ 204
本章小结.............................................................................................. 220
本章习题 .............................................................................................. 220