本书分为4个部分,第1部分为数据库技术概述,第2部分介绍关系型数据库(包括MySQL、Oracle、SQL Server和PostgreSQL)技术应用,第3部分介绍NoSQL数据库(包括Redis、MongoDB、HBase、Hive、Cassandra和Elasticsearch)技术应用,第4部分介绍其他类型数据库(包括SQLite、Neo4j和TDengine)技术应用。本书按照统一的目录结构对每种数据库进行介绍:先介绍数据库的业务应用场景,再介绍安装配置步骤,接着讲解架构设计和业务应用开发,最后介绍Python操作示例。由于4种关系型数据库中的一些数据对象在使用上有类似之处,因此本书只在一种数据库中进行介绍。例如,触发器和自定义函数只在Oracle中介绍,存储过程和游标只在SQL Server中介绍。各种非关系型数据库之间没有横向可比性,因此主要介绍其独特用法。
张粤磊河南机电职业学院大数据学院院长,中国教育发展战略学会产教融合专委会理事,CCF(中国计算机学会)大数据专家委员会委员,毕业于中国科技大学,原平安壹钱包大数据架构师。业内知名大数据专家,多部大数据畅销书作者。2016年以来每年都以高级专家和咨询顾问身份深入参与大数据,人工智能技术在行业的落地应用。已交付企业培训数百场,培训学员数万名,在数字应用人才实战型场景型培训培养方面具有丰富的实践经验。刘未昕具备十多年IT研发和项目管理工作经验。使用多种程序设计语言,参与过金融、外汇行业数据仓库和大数据应用研发,曾在高校担任外聘讲师,与他人合著大数据、少儿编程、Python人工智能等方面的书籍。胡振兴计算机应用技术专业硕士学位。已从事十多年IT行业项目研发,曾参与安徽省科技厅软科学项目、安徽电信、山东联通等多个大型项目的研发工作。现从事IT行业的培训与教学工作。杜艺含硕士毕业于香港城市大学商业及数据分析专业,本科毕业于南开大学信息管理与信息系统专业,目前在互联网行业从事数据分析工作。
第1部分 数据库技术概述
第1章 数据库技术的时代背景和发展历史 2
1.1 基本概念 2
1.2 数据存储发展历史 3
1.3 技术与时代业务 4
1.4 非关系型数据库 5
1.5 小结 5
第2章 数据库核心原理和架构设计 7
2.1 数据库模型 7
2.2 数据库模式 8
2.3 数据库存储设计 9
2.4 数据库计算引擎 10
2.5 数据库安全设计 10
2.6 数据库管理 11
2.7 数据库设计及上线 12
2.8 小结 15
第2部分 关系型数据库技术应用
第3章 MySQL数据库实战 18
3.1 业务应用场景 18
3.1.1 MySQL的商业应用环境 18
3.1.2 MySQL在个人技能知识体系中的作用 18
3.1.3 MySQL基础定义 19
3.2 安装配置 20
3.2.1 在Windows平台上的安装和配置 20
3.2.2 在Linux平台上的安装和配置 25
3.3 架构设计 26
3.3.1 数据库架构体系 26
3.3.2 数据库存储引擎 26
3.3.3 安全可用性架构体系 29
3.3.4 可扩展性架构体系 30
3.4 业务应用开发 31
3.4.1 创建数据库和表 31
3.4.2 新增和修改字段 37
3.4.3 数据类型及数据操作 41
3.4.4 数据函数定义及操作 54
3.4.5 数据库备份和恢复 59
3.5 Python操作示例 60
3.6 小结 62
第4章 Oracle数据库实战 63
4.1 业务应用场景 63
4.2 安装配置 63
4.2.1 在Windows平台上安装和配置Oracle 64
4.2.2 登录Oracle 68
4.2.3 在Linux平台上安装Oracle 70
4.3 架构设计 70
4.3.1 安装目录结构和系统用户 70
4.3.2 应用结构 71
4.3.3 物理存储结构 72
4.3.4 逻辑存储结构 72
4.3.5 内存结构和后台进程 73
4.4 业务应用开发 74
4.4.1 数据库模式对象 74
4.4.2 PL/SQL编程 77
4.4.3 安全管理 81
4.4.4 全文检索 82
4.4.5 数据备份和恢复 84
4.5 Python操作示例 86
4.6 小结 88
第5章 SQL Server数据库实战 89
5.1 业务应用场景 89
5.2 安装配置 90
5.2.1 在Windows Server环境下安装和配置SQL Server 90
5.2.2 安装SSMS模块 93
5.2.3 启动和关闭服务 94
5.3 架构设计 95
5.3.1 系统数据库及数据库文件 95
5.3.2 对BI及JSON格式的支持 97
5.3.3 AlwaysOn高可用性设计 97
5.3.4 数据虚拟化 98
5.3.5 SQL Server大数据集群 100
5.4 业务应用开发 101
5.4.1 创建数据库和表 101
5.4.2 定义数据约束 102
5.4.3 T-SQL语句及数据库对象 103
5.4.4 事务处理、数据运维 111
5.4.5 安全性管理 117
5.4.6 CLR与全文检索 120
5.4.7 云端数据库Azure SQL简介 121
5.5 Python操作示例 121
5.6 小结 124
第6章 PostgreSQL数据库实战 125
6.1 业务应用场景 125
6.2 安装配置 126
6.2.1 在Windows平台上安装和配置PostgreSQL 126
6.2.2 启动及验证数据库服务 127
6.2.3 在Linux平台上安装PostgreSQL 129
6.3 架构设计 130
6.3.1 物理结构和逻辑结构 130
6.3.2 进程和内存组织 132
6.3.3 数据库高可用方案 132
6.4 业务应用开发 134
6.4.1 数据类型 134
6.4.2 psql工具使用简介 139
6.4.3 数据库、表、视图和模式 140
6.4.4 索引和序列 144
6.4.5 表复制、继承及分区表 148
6.4.6 SQL高级特性 151
6.4.7 函数、过程和触发器 154
6.4.8 安全管理 159
6.4.9 数据备份与还原 162
6.5 Python操作示例 164
6.6 小结 166
第3部分 NoSQL数据库技术应用
第7章 Redis数据库实战 168
7.1 业务应用场景 168
7.2 安装配置 168
7.2.1 在Windows平台上安装并启动Redis 168
7.2.2 在Linux平台上安装并启动Redis 170
7.3 架构设计 171
7.3.1 冗余存储 171
7.3.2 故障恢复 171
7.3.3 集群 171
7.3.4 核心组件 172
7.4 业务应用开发 173
7.4.1 字符串类型 173
7.4.2 列表类型 174
7.4.3 哈希类型 176
7.4.4 集合类型 177
7.4.5 有序集合类型 179
7.4.6 数据持久化、数据生命周期及事务操作 180
7.4.7 消息队列和订阅/发布模式 182
7.5 Python操作示例 183
7.6 小结 185
第8章 MongoDB数据库实战 186
8.1 业务应用场景 186
8.2 安装配置 186
8.2.1 在Windows平台上安装、配置并启动MongoDB 187
8.2.2 在Linux平台上安装并启动MongoDB 189
8.2.3 关闭MongoDB服务 189
8.3 架构设计 190
8.4 业务应用开发 191
8.4.1 基本概念 191
8.4.2 数据的创建、删除和修改 193
8.4.3 数据查询和索引 198
8.4.4 聚合 201
8.5 Python操作示例 202
8.6 小结 204
第9章 HBase数据库实战 205
9.1 业务应用场景 205
9.2 安装配置 205
9.2.1 Hadoop的安装、配置和验证 205
9.2.2 ZooKeeper的安装、配置和验证 208
9.2.3 HBase的安装和配置 209
9.3 架构设计 210
9.3.1 Hadoop数据存储格式及计算框架 210
9.3.2 HBase分布式设计 211
9.3.3 HBase的核心概念 211
9.4 业务应用开发 212
9.4.1 创建表及插入数据 212
9.4.2 按照行键值检索 214
9.4.3 扫描检索 214
9.4.4 删除表数据 217
9.5 Python操作示例 218
9.6 小结 220
第10章 Hive数据库实战 221
10.1 业务应用场景 221
10.2 安装配置 221
10.2.1 Hive的安装和配置 221
10.2.2 Hive的使用 224
10.3 架构设计 225
10.4 业务应用开发 226
10.4.1 数据类型、创建表 226
10.4.2 对表数据的基本操作 229
10.4.3 加载数据 230
10.4.4 数据清洗和数据转换 231
10.4.5 系统函数和自定义函数 234
10.4.6 Hive/HBase数据转换 236
10.5 Python操作示例 237
10.6 小结 238
第11章 Cassandra数据库实战 240
11.1 业务应用场景 240
11.2 安装配置 240
11.2.1 在Windows平台上安装、配置并启动Cassandra 240
11.2.2 在Linux平台上安装并启动Cassandra 243
11.2.3 客户端工具 243
11.3 架构设计 244
11.3.1 架构组件 244
11.3.2 逻辑模型 245
11.4 业务应用开发 246
11.4.1 基本数据类型 246
11.4.2 数据定义语句 247
11.4.3 数据操作语句 247
11.4.4 数据检索、索引、视图 248
11.4.5 操作集合类型 249
11.4.6 操作自定义类型 249
11.5 Python操作示例 250
11.6 小结 252
第12章 Elasticsearch数据库实战 253
12.1 业务应用场景 253
12.2 安装配置 253
12.2.1 在Windows平台上安装并启动Elasticsearch 253
12.2.2 集成IK中文分词器 254
12.2.3 安装Kibana可视化管理工具 255
12.3 架构设计 256
12.3.1 几个核心概念 256
12.3.2 分布式设计 257
12.4 业务应用开发 258
12.4.1 创建索引 258
12.4.2 添加文档 261
12.4.3 更新和删除文档 264
12.4.4 查询文档 266
12.4.5 索引管理 271
12.4.6 分析和中文分词 273
12.5 Python操作示例 276
12.6 小结 279
第4部分 其他类型数据库技术应用
第13章 移动端数据库SQLite实战 282
13.1 业务应用场景 282
13.2 安装配置 282
13.2.1 在Windows平台上安装并启动SQLite 282
13.2.2 创建数据库和附加、分离数据库 283
13.3 架构设计 284
13.4 业务应用开发 285
13.4.1 数据类型和运算符 285
13.4.2 创建表及数据的增、删、改 287
13.4.3 检索、索引、排序和分组 289
13.4.4 视图、触发器和事务处理 291
13.4.5 导出/导入及备份/恢复数据 293
13.5 Python操作示例 295
13.6 小结 296
第14章 图数据库Neo4j实战 297
14.1 业务应用场景 297
14.2 安装配置 297
14.2.1 Neo4j产品线简介 297
14.2.2 在Windows平台上安装和配置Neo4j社区版 298
14.2.3 使用数据浏览器创建第一个节点 300
14.3 架构设计 302
14.3.1 图的几个核心概念 302
14.3.2 存储模型 303
14.4 业务应用开发 304
14.4.1 数据类型、运算符及函数 304
14.4.2 Cypher语言 306
14.4.3 创建节点、关系 306
14.4.4 更新节点、关系的属性 308
14.4.5 删除节点、关系的属性 308
14.4.6 检索节点及寻路 309
14.4.7 索引和约束 314
14.4.8 数据备份和恢复 316
14.5 Python操作示例 321
14.6 小结 323
第15章 时序数据库TDengine实战 324
15.1 业务应用场景 324
15.2 安装配置 325
15.2.1 TDengine产品线简介 325
15.2.2 在Windows平台上安装TDengine社区版 325
15.3 架构设计 326
15.3.1 时序数据库设计的几个核心概念 326
15.3.2 TDengine的架构设计原理 327
15.3.3 TDengine的数据存储模型 328
15.4 业务应用开发 328
15.5 Python操作示例 329
15.6 小结 331