本书共8章,具体内容包括:数据与大数据、大数据感知与获取、大数据处理、大数据分析、大数治理、大数据安全与隐私及大数据行业应用。本书既可共高校相关专业教学使用,也可供大数据领域工程师或者有志于大数据领域工作或研究的科技人员使用。
《大数据导论/大数据教材系列丛书》是计算机学会大数据专业委员会大数据教材编委会编著的大数据系列教材中的第1本,其目的是从技术角度,为大数据相关专业本科生、研究生及科研人员,提供一本全面介绍大数据相关技术的专业通识教材。《大数据导论/大数据教材系列丛书》系统地介绍大数据涵盖的内容,包括数据与大数据概述、大数据感知与获取、大数据存储与管理、大数据智能分析、大数据架构与处理技术、大数据分析计算平台、大数据治理、大数据安全与隐私等。除了介绍大数据的技术内容,《大数据导论/大数据教材系列丛书》还介绍了部分行业中大数据的典型应用案例,反映了大数据在社会经济生活中的重要价值。
《大数据导论/大数据教材系列丛书》既可作为普通高等学校大数据相关专业的教材使用,也可供有关技术人员参考。
梅宏,中国科学院院士,发展中国家科学院院士,欧洲科学院外籍院士,电气和电子工程师学会会士(IEEE Fellow)。曾任北京大学信息科学技术学院院长,上海交通大学党委常委、副校长。现任北京理工大学党委常委、副校长。
主要从事软件工程和系统软件领域的研究,发表学术论文150余篇,科研成果曾获国家自然科学二等奖、国家技术发明二等奖、国家科技进步二等奖等,获国家技术发明专利授权30余项。2015年获电气和电子工程师学会计算机分会技术成就奖(IEEE Computer Society Technical Achievement Award)。
历任国家863计划专家组组长,国家“核高基”科技重大专项专家组成员,全国信息技术标准化技术委员会大数据标准工作组组长,国家重点科技研发专项“云计算和大数据”实施方案编制组组长、总体组组长,国家“科技创新2030-重大项目”大数据重大项目立项建议和实施方案编制组组长。
第一章 数据与大数据
1.1 引言
1.2 从数据到大数据
1.3 大数据多边定义
1.4 大数据价值期望
1.5 大数据价值实现
1.6 大数据技术图谱
1.7 本章小结
第二章 大数据感知与获取
2.1 引言
2.2 数据渠道
2.3 内部数据及获取方法
2.4 外部数据及获取方法
2.5 深网数据及获取方法
2.6 本章小结
第三章 大数据存储与管理
3.1 引言
3.2 分布式文件系统
3.3 分布式数据库
3.4 非关系型数据库
3.5 云数据库
3.6 大数据的SQL查询引擎
3.7 本章小结
第四章 大数据分析
4.1 引言
4.2 数据理解和特征提取
4.3 数据建模
4.4 高级数据建模技术
4.5 数据可视化分析
4.6 本章小结
第五章 大数据处理
5.1 引言
5.2 集中式计算架构
5.3 分布式计算架构
5.4 处理加速技术(GPU/TPU/FPGA)
5.5 本章小结
第六章 大数据治理
6.1 引言
6.2 大数据治理基本概念
6.3 数据架构管理
6.4 元数据管理
6.5 主数据管理
6.6 数据质量管理
6.7 数据标准化
6.8 数据资产化
6.9 本章小结
第七章 大数据安全与隐私保护
7.1 引言
7.2 大数据安全
7.3 大数据隐私保护
7.4 大数据技术在安全中的应用
7.5 大数据安全技术发展
7.6 本章小结
第八章 大数据行业应用
8.1 引言
8.2 企业营销大数据应用
8.3 交通旅游大数据应用
8.4 物流供应大数据应用
8.5 教育教学大数据应用
8.6 本章小结