本书采用知识理论与实验案例相结合的方式展开讲述。在相应知识点阐述过程中,以人们在日常工作、学习中经常碰到的具体问题作为案例,结合大数据挖掘和处理的基本理论与知识,展示解决问题的思路和基本方法,从而加强读者对大数据的理解和感性认知,找到大数据应用背后的基本原理和逻辑路径。本书内容主要包括:大数据概述、大数据思维、大数据支撑技术、大数据采集与预处理、大数据分析与挖掘、深度学习与人工智能、大数据可视化。
郭清溥,教授,现任河南财经政法大学现代教育技术中心主任兼计算机实验教学中心主任。近五年来,共承担本科生《大学计算机》、《Visual Basic程序设计》、《Excel数据分析与应用》等课程的教学任务。发表教改论文、主持和参加省、学校教改项目8项,出版国家级规划教材3部、河南省统编教材6部,在国际学术会议、全国性学术会议和多类科技期刊上发表学术论文20余篇,主持和参与河南省科技攻关计划项目、河南省软科学计划项目等各类科研项目9项。担任全国高等学校计算机基础教育研究会常务理事,财经管理专业委员会委员, 文科专业委员会委员兼文史分委会副主任。河南省高等学校计算机教育研究会常务理事,基础教育委员会主任。中国大学生计算机设计大赛组织委员会委员。中国大学生计算机设计大赛河南省级赛组织委员会秘书长等社会兼职
第1章 大数据概述
1.1 大数据时代
1.1.1 大数据时代的数据特征
1.1.2 大数据时代的大数据服务
1.2 大数据相关概念
1.2.1 大数据定义
1.2.2 大数据空间
1.2.3 大数据处理
1.2.4 大数据系统
1.3 大数据应用现状
1.3.1 金融与财务大数据应用案例
1.3.2 其他领域的大数据应用案例
1.4 大数据相关技术
1.4.1 物联网技术
1.4.2 云技术
1.4.3 移动互联网技术
1.4.4 人工智能技术
1.5 大数据解决方案
1.6 大数据与企业数字化转型
1.6.1 财务智能化转型的机遇与挑战
1.6.2 数字化转型案例
1.7 大数据面临的挑战与发展展望
第2章 大数据思维
2.1 大数据思维的重要意义
2.2 数据核心思维
2.3 数据决策思维
2.4 数据全样思维
2.5 数据容错思维
2.6 数据关联思维
2.7 数据传递思维
2.8 数据乘法思维
第3章 大数据支撑技术
3.1 虚拟化技术
3.1.1 虚拟化技术概述
3.1.2 虚拟化技术的发展与分类
3.1.3 虚拟化包含的组件与方法
3.1.4 虚拟化的优势
3.1.5 虚拟化的应用
3.1.6 虚拟化与云计算
3.1.7 存储虚拟化
3.1.8 系统虚拟化
3.1.9 桌面虚拟化
3.1.10 应用虚拟化
3.1.11 典型虚拟化产品
3.1.12 虚拟化实现案例
3.2 云计算
3.2.1 云计算概述
3.2.2 云计算产业链发展
3.2.3 云计算架构与模式
3.2.4 云计算的关键技术
3.3 存储技术
3.3.1 存储介质的发展
3.3.2 存储体系架构的发展
3.3.3 云存储技术
3.4 开源大数据生态系统
3.4.1 Linux
3.4.2 Hadoop
3.4.3 基于Linux+Hadoop的大数据云系统构建
3.5 Spark
3.6 数据库与数据仓库技术
3.6.1 大数据与数据库的关系
3.6.2 数据库技术概述
3.6.3 数据仓库技术概述
第4章 大数据采集与预处理
4.1 数据爬取
4.1.1 数据爬取概述
4.1.2 数据爬取案例
4.2 数据变换与集成
4.2.1 数据变换与集成概述
4.2.2 数据变换案例
4.3 数据规约
4.3.1 数据规约概述
4.3.2 数据规约案例
4.4 数据清洗
4.4.1 数据清洗概述
4.4.2 数据清洗案例
4.5 数据管理平台
第5章 大数据分析与挖掘
5.1 数据挖掘概述
5.1.1 数据挖掘起源
5.1.2 数据挖掘定义
5.1.3 数据挖掘技术与应用
5.1.4 数据挖掘流程与模型
5.2 数据挖掘工具
5.2.1 Sklearn
5.2.2 Spark MLlib
5.3 数据挖掘算法
5.3.1 关联
5.3.2 分类
5.3.3 聚类
第6章 深度学习与人工智能
6.1 深度学习概述
6.1.1 深度学习定义
6.1.2 深度学习应用领域
6.2 人工智能与大数据
6.2.1 人工智能与大数据的区别
6.2.2 人工智能与大数据的关联
6.3 深度学习工具
6.3.1 TensorFlow
6.3.2 PyTorch
6.4 深度学习案例
6.4.1 手写数字识别案例
6.4.2 语音识别案例
6.4.3 人工智能与企业运营数字化
6.4.4 人工智能在企业财务工作中的应用
第7章 大数据可视化
7.1 数据可视化概述
7.1.1 数据可视化的概念
7.1.2 数据可视化市场与发展
7.1.3 数据可视化的特征与趋势
7.2 可视化工具与应用案例
7.2.1 Excel
7.2.2 Matplotlib
7.2.3 Highcharts
7.2.4 可视化平台—— 浪潮BA