本书系统地讲解了Tableau Prep Builder和Tableau Desktop的原理与实践应用。全书以可视化分析、Tableau计算为重点,详细介绍了如何理解数据的层次、如何使用Tableau Prep Builder整理和准备数据、如何使用Tableau Desktop开展敏捷数据分析、Tableau高级互动,特别是深入介绍了Tableau的各种计算,从而以有限的数据实现无限的业务场景分析。全书贯穿数据与问题的层次分析方法,并用实例加以说明,不仅适合希望系统学习Tableau的初学者,而且适合Tableau的中高级分析师。
山东大学政治学本科、教育学硕士,Tableau Desktop QA、Server QA官方技术认证,Tableau官方合作伙伴。多年央企、民企、创业经历,历经人资行政经理、董事长助理、业务经理、项目经理等职,热爱读书,特别是技术、心理学,用心写好一本书,全心全意为客户服务。“喜乐君”(yupengwu.com)博客作者。
第1篇 从数据到图形:Tableau可视化
第1章 可视化分析:进入大数据时代的理性与直觉之门 2
1.1 数据金字塔:从数据到决策有多远? 2
1.2 直觉先于理性:可视化的心理学 5
1.3 Tableau:大数据时代的“梵高” 8
1.4 Tableau快速学习路线图 11
第2章 数据可视化:理念与基础 13
2.1 从Excel到Tableau:不同的视角与层次思维 13
2.1.1 IT分析师和业务人员看待数据的不同视角 14
2.1.2 数据分析的层次模型 16
2.1.3 层次、聚合度和颗粒度 18
2.2 数据基础概念:字段、图形与拖曳逻辑 20
2.2.1 编码:从真实世界到虚拟世界 20
2.2.2 数据分析的两种表达方式:数据交叉表与可视化图表 21
2.2.3 字段的两种分类:维度和度量 21
2.2.4 字段的两种特征:连续和离散 23
2.2.5 从字段到图形:Tableau Desktop的设计逻辑 25
2.3 Tableau Desktop初级可视化:过程与方法 27
2.3.1 数据连接:建立连接和基本整理 28
2.3.2 数据可视化:基本方法与基本图形 30
2.3.3 数据洞察:组合与互动 37
2.3.4 分享数据见解 39
第3章 数据准备:用Prep Builder进行数据整理与结构调整 41
3.1 Prep Builder基础操作 41
3.2 初级字段整理:数据清理和筛选 44
3.2.1 数据拆分 47
3.2.2 数据分组 49
3.2.3 筛选器 51
3.2.4 字符串清理 53
3.3 中级结构整理:数据转置 53
3.3.1 Prep Builder和Desktop的列至行转置 54
3.3.2 Prep Builder的行至列转置 55
3.4 高级结构整理:数据聚合 56
3.4.1 聚合的必要性和用法——单一层次聚合 56
3.4.2 FIXED LOD——独立层次聚合 59
3.4.3 Prep Builder聚合的注意事项 63
3.5 高级计算:在Prep Builder中计算排名 63
3.5.1 单一维度的排名计算 63
3.5.2 具有分区字段的排名计算 64
3.5.3 行级别排名与密集排名 65
第4章 数据准备:数据合并与数据建模 68
4.1 行级别合并:并集、连接与Desktop方法 68
4.1.1 数据并集 69
4.1.2 数据连接 72
4.1.3 并集与连接的异同点 76
4.2 视图级别合并:数据混合与Desktop方法 78
4.2.1 使用Desktop进行数据混合 79
4.2.2 数据混合的逻辑及其与连接的差异 84
4.3 使用Prep Builder做数据合并 86
4.3.1 使用Prep Builder 完成数据并集 86
4.3.2 使用Prep Builder做数据连接 92
4.3.3 使用Prep Builder完成“数据混合”:聚合+连接 95
4.4 如何选择数据合并方式 97
4.5 数据模型:数据关系 99
4.5.1 从物理表到逻辑表:数据关系的背景与特殊性 99
4.5.2 数据模型(上):以数据关系实现数据连接 101
4.5.3 数据模型(下):建立物理层和逻辑层的多层关系 103
4.5.4 改善数据模型的性能(上):关系类型 107
4.5.5 改善数据模型的性能(下):引用完整性 110
4.5.6 从数据合并迈向数据建模 111
4.6 数据准备综合应用 112
4.6.1 使用Prep Builder快速合并和整理Excel数据 112
4.6.2 使用Prep Builder匹配和整合SAP HANA多表数据 117
4.7 为什么Prep Builder是数据整理的首选 121
4.8 如何优雅地使用Prep Builder 124
4.8.1 思考和问题先于数据 125
4.8.2 层次思维是关键 125
4.8.3 各有所长:与其他工具的匹配和合作 125
4.8.4 Prep Builder与Desktop的最佳结合 127
第5章 可视化分析与探索 128
5.1 Tableau报表可视化的三步骤 128
5.1.1 整理字段:理解数据表中的独立层次结构 128
5.1.2 工作表:依据字段的层次结构完成数据可视化 131
5.1.3 仪表板:探索不同数据之间的关联关系 137
5.2 Tableau复杂业务问题中的关联分析 138
5.2.1 多数据分析:每个数据表行级别的唯一性 138
5.2.2 即席计算:通过计算字段完善分析模型 140
5.2.3 数据解释:AI驱动的智能关联分析 141
5.3 如何选择可视化图表框架 142
5.3.1 常见的问题类型与图表 142
5.3.2 从简单可视化到复杂可视化 152
5.4 高级可视化功能 163
5.4.1 度量名称与度量值:并排比较多个度量 163
5.4.2 条形图双轴:各个子类别的销售额和利润 166
5.4.3 堆叠度量与重叠度量:重叠比较多个度量 166
5.4.4 聚合度量与解聚度量 169
5.5 可视化增强分析技术 170
5.5.1 常用筛选器及其优先级 170
5.5.2 集 177
5.5.3 参数 181
5.5.4 分组和分层结构 182
5.5.5 排序:对数据按照规则排序 183
5.5.6 参考线、参考区间、分布区间和盒须图 185
5.6 格式设置 194
5.6.1 通过标签设置突出度量值 195
5.6.2 工具提示的高级设置 196
5.6.3 其他常见设置 199
第6章 地理位置可视化 201
6.1 Tableau地理分析简介 201
6.2 符号地图和填充地图 203
6.3 点图和热力图 206
6.4 路径地图 207
6.5 空间函数 212
6.6 地图与形状的结合:自定义图形与HEX函数 217
第7章 与数据对话:信息呈现与高级交互 220
7.1 比“数据”更多:从工作簿到仪表板 220
7.1.1 仪表板:可视化七巧板 221
7.1.2 精确设计和布局 223
7.1.3 更节省空间的折叠工具栏 225
7.1.4 多设备设计和大屏设计 226
7.2 故事:构建你的DataPoint 227
7.3 可视化交互:与数据对话 228
7.3.1 多重筛选和共用筛选器 229
7.3.2 页面与动画 231
7.3.3 突出显示 234
7.4 高级互动:动态参数和参数动作 235
7.4.1 实例:使用参数更新度量 237
7.4.2 实例:使用操作动态更新度量 239
7.4.3 实例:使用参数动作动态控制参考线 240
7.4.4 实例:使用参数展开指定的类别 243
7.5 高级互动的巅峰:集动作 244
7.5.1 实例:指定省份的销售额占比 245
7.5.2 实例:查看所选省份在各商品类别的销售占比 247
7.5.3 实例:各省份相对于指定省份的销售额差异 248
7.5.4 实例:指定省份随着日期的销售趋势 251
7.5.5 关键原理:Tableau多种操作的优先级 254
7.5.6 高级实例:多个集动作构建的自定义矩阵 254
7.5.7 技巧:集与分层结构、工具提示的结合 258
7.6 让集动作更强大:增量更新与集控制 258
7.6.1 集动作增减 259
7.6.2 集控制——“集”真正变身“多值参数” 260
7.7 高级互动的使用建议 261
第2篇 从有限到无限:Tableau计算
第8章 Tableau基本计算:原理与入门 264
8.1 数据的层次与两类基本的计算类型 264
8.1.1 借助Excel学大数据:行级别计算和聚合计算 265
8.1.2 从Excel数据透视表到Tableau视图计算 268
8.2 行级别函数及其作用 272
8.2.1 行级别函数的使用场景 272
8.2.2 字符串函数 274
8.2.3 日期函数 278
8.2.4 数字函数 285
8.2.5 类型转换函数 286
8.2.6 高级字符串函数之“正则函数” 287
8.3 聚合函数 290
8.4 逻辑函数及行级别与聚合计算的差异 291
8.4.1 IF函数 292
8.4.2 IIF函数 293
8.4.3 CASE WHEN函数 294
8.4.4 其他简化逻辑判断 294
8.4.5 高级实例:各类别的盈利分层与盈利结构分析 295
8.4.6 高级说明:两类逻辑表达式的差异 298
第9章 Tableau高级计算:表计算 302
9.1 多层次分析与高级计算原理简介 302
9.1.1 表计算函数代表:WINDOW_SUM函数 303
9.1.2 狭义LOD表达式代表:FIXED LOD 306
9.1.3 广义LOD表达式的分类及区别 310
9.2 表计算的独特性与原理 311
9.2.1 表计算的独特性原理 312
9.2.2 表计算的独特性:维度如何参与计算过程 313
9.2.3 两种指定方向的方法 316
9.3 表计算函数及实例 318
9.3.1 最具代表性的函数: LOOKUP函数和差异计算 319
9.3.2 RUNNING_SUM函数:移动汇总计算 320
9.3.3 实例:LOOKUP和RUNNING_SUM表计算(TC5) 321
9.3.4 WINDOW_SUM函数:窗口汇总函数 326
9.3.5 WINDOW_SUM函数初级实例:加权计算与合计百分比(TC6) 329
9.3.6 WINDOW_SUM函数中级实例:相对于任意选定子类别的相对差异 332
9.3.7 高级实例:相对于任意日期的百分比差异(TC1) 335
9.3.8 参数类表计算 338
9.3.9 INDEX与RANK函数:排序表计算 340
9.3.10 实例:基于公共日期基准的销售增长(INDEX函数)(TC2) 341
9.3.11 实例:随日期变化的RANK函数(TC4) 343
9.3.12 统计类表计算和第三方表计算 346
9.3.13 快速表计算 347
9.4 高级表计算设置 348
9.4.1 实例:多遍聚合的嵌套表计算(TC3) 348
9.4.2 实例:多个方向字段的深度优先原则 349
9.5 综合实例:帕累托分布图制作方法 351
9.6 综合实例:作为筛选器的表计算 356
9.7 Tableau 2020新功能:Prep Builder计算特定层次的排名 359
第10章 高级计算:狭义LOD表达式 362
10.1 LOD表达式的独特性和原理 362
10.2 LOD表达式的语法 365
10.3 FIXED LOD表达式的3种类型 367
10.3.1 聚合度高于视图的详细级别 368
10.3.2 聚合度低于视图的详细级别 372
10.3.3 独立于视图的聚合 375
10.3.4 3种语法的原理说明 376
10.4 INCLUDE/EXCLUDE LOD表达式 377
10.4.1 EXCLUDE LOD实现更高层次的聚合 377
10.4.2 INCLUDE LOD实现更低层次的聚合 378
10.4.3 FIXED、EXCLUDE、表计算的计算逻辑与优先级 379
10.5 如何选择高级计算类型——层次分析 381
10.5.1 高级分析的4个步骤 381
10.5.2 高级分析4个步骤的简要示例 386
10.6 高级应用:嵌套LOD表达式(NESTED LOD) 389
10.6.1 实例:使用4步分析完成嵌套LOD 390
10.6.2 嵌套LOD表达式的变化 395
10.7 高级分析模型:会员RFM分析模型 396
10.7.1 会员RFM-L指标体系 396
10.7.2 会员分析的常见视角 399
10.7.3 会员客户频率分析 (LOD15-1) 400
10.7.4 矩阵分析 (LOD15-2) 401
10.7.5 新客户争取率 (LOD15-5) 402
10.7.6 各时间段不同复购间隔的客户数量(LOD15-10) 402
10.7.7 各个客户矩阵的年度购买频率(LOD15-15) 403
10.8 商品的交叉购买和购物篮分析 408
10.8.1 实例:不同交叉购买次数的客户数量 408
10.8.2 超级实例:基于订单中的购物篮交叉购买分析 410
10.9 高级计算的最佳实践 416
10.9.1 视图中哪些位置决定详细级别 416
10.9.2 各类计算如何构成视图的组成部分 417
10.9.3 如何选择计算类型及其优先级 418
第3篇 从可视化到大数据分析平台
第11章 Tableau Server数据平台 422
11.1 敏捷BI加速从数据资产到价值决策的流动 422
11.2 从Desktop发布到服务器:分析模型自动化 423
11.3 从Prep Builder发布到服务器:数据流程自动化 425
11.4 Data Management:从复杂数据准备到深度业务分析 427
第12章 保证数据安全:Tableau Server的安全体系 430
12.1 推荐的Tableau Server权限机制 430
12.1.1 基于群组和项目设置权限 431
12.1.2 在项目中锁定权限(必要时) 435
12.2 行级别数据安全管理:用户筛选器与用户函数 435
12.3 Tableau Server权限评估规则 437
写在最后 439