本书基于作者近几年来的研究开发成果及应用实践,对物联网大数据技术体系进行了系统归纳,阐述了物联网环境下感知数据的特性、数据模型、事务模型以及调度处理方法等核心概念及关键技术,并对物联网大数据存储、管理、计算与分析的基本概念和关键技术进行了剖析。本书还介绍了自行研发的面向物联网的ChinDB实时感知数据库系统以及针对云计算环境下物联网大数据管理与应用的DeCloud云平台,介绍了它们在智能交通、智能电厂、教育、安全监控等多个行业的应用。书中所有实例,均来自作者所在团队的实际应用,大部分在物联网项目中得到了实践应用。本书对物联网应用的开发以及两化融合、工业4.0环境下的大数据处理分析具有重要参考价值。
王桂玲,女,1978年生。2007年7月于清华大学计算机科学与技术系获计算机科学与技术工学博士学位。2007年7月至2012年1月先后在中国科学院计算技术研究所从事博士后、助理研究员工作。2012年1月起在北方工业大学信息工程学院云计算中心工作。目前研究领域为服务计算、云计算等。曾承担或参与多项国家自然基金(含重点基金)、973课题、核高基、以及业界合作项目。目前在JCST、计算机学报、WWW、SCC等高水平国内外学术会议及刊物上发表论文30余篇,专著2本,获得软件登记4项,专利授权1项,受理专利3项。曾获中科院计算所优秀研究人员称号、中科院计算所网络重点实验室优秀员工称号等奖励。担任SOCA'10、SOCA'09、SCDI'12等国际会议PC Member,担任国内多家学术刊物论文评审。
第1篇 缘起与发展趋势篇
第1章 物联网与产业发展 3
1.1 物联网产业的发展 3
1.1.1 传感器与智能硬件 4
1.1.2 物联网服务平台 5
1.1.3 工业4.0与CPS 5
1.2 物联网与大数据 7
1.3 物联网产业的机遇与挑战 9
1.3.1 物联网产业面临的挑战 9
1.3.2 物联网操作系统与数据库 10
1.3.3 物联网大数据处理与应用 11
第2章 大数据处理技术的发展 12
2.1 大数据存储和管理技术 12
2.1.1 面向大数据的文件系统 13
2.1.2 面向大数据的数据库系统 15
2.2 大数据计算技术 19
2.2.1 批处理计算模式 19
2.2.2 交互式查询计算模式 20
2.2.3 流处理计算模式 21
2.2.4 大数据实时处理的架构:Lamda架构 23
2.3 大数据分析技术 24
2.3.1 传统结构化数据分析 26
2.3.2 文本数据分析 26
2.3.3 多媒体数据分析 27
2.3.4 社交网络数据分析 27
2.3.5 物联网传感数据分析 28
2.3.6 大数据分析技术的发展趋势 28
第2篇 技术解析篇
第3章 物联网大数据技术体系 31
3.1 物联网中的大数据挑战 31
3.1.1 互联网大数据的特征 31
3.1.2 物联网大数据的特征 34
3.2 技术体系 37
3.2.1 感知数据采集与传输 38
3.2.2 感知数据管理与实时计算 41
3.2.3 物联网平台与大数据中心 42
第4章 感知数据特性与模型 44
4.1 感知数据的特性分析 44
4.1.1 常用的感知数据类型 44
4.1.2 感知数据的主要特征 46
4.2 感知数据的表示与组织 49
4.2.1 物联网数据模型 49
4.2.2 时态对象模型 51
4.3 感知数据库的定位 52
4.3.1 感知数据库的定位 52
4.3.2 感知数据库的特征 53
4.4 感知数据库与传统数据库 53
4.4.1 感知数据库与关系数据库 53
4.4.2 感知数据库与实时数据库系统 54
4.4.3 感知数据库与工厂数据库系统 55
4.4.4 感知数据库与流数据处理系统 55
第5章 感知数据库管理系统 57
5.1 感知数据库的总体设计 57
5.1.1 总体设计的主要原则 57
5.1.2 感知数据库的设计框架 58
5.2 感知数据库的分布部署体系 62
5.2.1 系统的集群部署模式 62
5.2.2 多层级的系统部署体系 64
5.2.3 服务分布的部署体系 66
5.3 感知数据库中的关键技术 67
5.3.1 智能设备及传感器接口技术 67
5.3.2 流数据实时在线处理技术 68
5.3.3 事件驱动的高效处理机制 69
5.3.4 感知数据的压缩存储技术 75
第6章 实时事务调度处理技术 79
6.1 常见事务特性分析 79
6.1.1 感知事务 80
6.1.2 触发事务 80
6.1.3 用户事务 81
6.2 事务调度与并发控制 81
6.2.1 事务的调度方法 81
6.2.2 并发控制策略 82
6.3 服务器与操作系统 83
6.3.1 服务器体系结构与发展 83
6.3.2 操作系统的多任务机制 87
6.4 事务的执行框架与模式 90
6.4.1 通用系统模型与调度方法 91
6.4.2 事务处理框架的设计模式 91
6.5 系统框架的分析与性能优化 94
第7章 物联网大数据存储与管理 97
7.1 云文件系统的关键技术 99
7.1.1 HDFS的目标和基本假设条件 99
7.1.2 HDFS体系架构 100
7.1.3 性能保障 102
7.2 NoSQL数据库关键技术 106
7.2.1 NoSQL数据库概述 106
7.2.2 基于NoSQL数据库的物联网大数据存储与管理 118
第8章 物联网大数据计算与分析 123
8.1 物联网大数据批处理计算 123
8.1.1 MapReduce的设计思想 124
8.1.2 MapReduce的工作机制 126
8.1.3 MapReduce在物联网大数据中的应用 128
8.2 物联网大数据交互式查询 130
8.2.1 原生SQL on HBase 131
8.2.2 SQL on Hadoop 132
8.2.3 基于HBase的交互式查询 133
8.3 物联网大数据流式计算 134
8.3.1 流式计算的需求特点 134
8.3.2 流数据基本概念 135
8.3.3 流数据查询操作 140
8.3.4 流数据定制化服务 142
8.3.5 评测基准 145
8.3.6 Spark Streaming及其在物联网大数据中的应用 146
8.4 物联网大数据分析 150
8.4.1 物联网大数据OLAP多维分析 151
8.4.2 物联网大数据深层次分析 157
第3篇 产品研发篇
第9章 物联网网关CubeOne 175
9.1 工业物联网网关 175
9.1.1 CubeOne产品概述 175
9.1.2 CubeOne功能特点 176
9.1.3 CubeOne的应用领域 178
9.2 无线传感器网络网关 178
9.2.1 无线传感器网络概述 178
9.2.2 ZigBee-WiFi网关 180
9.2.3 ZigBee网络应用案例 182
第10章 ChinDB感知数据库系统 185
10.1 ChinDB系统概述 185
10.2 ChinDB组成与功能特点 186
10.3 ChinDB数据组织管理 188
10.3.1 标签点及其属性 188
10.3.2 标签点的组织方式 189
10.3.3 关系数据管理 190
10.3.4 历史数据管理 190
10.4 ECA规则与实时计算 191
10.5 ChinDB的HA方案 192
10.5.1 HA概述及模式分类 192
10.5.2 ChinDB HA的部署模式 193
10.6 物联网应用平台 195
10.6.1 物联网平台概述 195
10.6.2 平台主要特点 196
10.6.3 应用领域与应用案例 198
第11章 DeCloud物联大数据云平台 202
11.1 DeCloud组成 202
11.1.1 软件概述 202
11.1.2 通信服务 204
11.1.3 计算服务 206
11.1.4 存储服务 207
11.1.5 数据发布/订阅服务 208
11.2 DeCloud在智能交通领域的应用 209
11.3 DeCloud在教育物联网云服务平台中的应用 215
11.4 DeCloud在电厂设备故障预警的应用 218
11.5 DeCloud在电梯安全监控中的应用 222
11.6 DeCloud在高精度位置服务中的应用 225
总结与展望