业务可视化分析: 从问题到图形的Tableau方法(全彩)
定 价:139 元
- 作者:喜乐君
- 出版时间:2021/8/1
- ISBN:9787121417641
- 出 版 社:电子工业出版社
- 中图法分类:TP317.3
- 页码:356
- 纸张:
- 版次:01
- 开本:16开
对广大的业务分析师而言,业务分析(或者称为商业分析)应该从业务和问题出发,可视化是实现的方法,辅助决策是最终的目的。本书以业务分析为起点,介绍了“样本范围、问题描述和问题答案”的解析方法,以及聚合过程、连续与离散的字段分类,共同作为业务分析、可视化分析的理论基础。本书借助敏捷BI工具Tableau,详细介绍了7种基本问题类型(排序、时序、占比、文本、分布、相关性、地理)及其对应的基本图形,并介绍了基于标记、坐标轴、参考线、计算的增强分析方法。本书的目的是让读者从“三图一表”的结果分析,经由分布和相关性的特征分析,走向业务分析中的关键领域——多个问题的结构化分析。
Tableau Zen Master,Tableau Desktop & Server CA Certification,Tableau培训师和咨询顾问;山东大学法学学士、教育学硕士,首届研究生国家奖学金获得者(2013);多次创业者、知识工作者,忠于分享,全心全意服务客户。
第1 篇 从业务和问题出发的可视化体系
第1 章 我的故事:业务分析需要可视化 2
1.1 生活/工作面前,我们都一样 . 2
1.2 带着问题启程 6
第2 章 奠基:业务可视化分析的价值 . 7
2.1 古往今来,分析的终极目的是辅助决策 7
2.2 决策:获得信息、做出判断 10
2.3 简单可视化:帮助领导更快地获得信息 11
2.4 交互可视化:可视化是假设验证的工具 14
2.5 高级可视化:分布、相关性分析与结构化分析 16
2.6 Tableau:敏捷BI 助力决策分析 18
第3 章 地平线:问题分析的方法与数据基础 . 20
3.1 问题的结构化分析与“第一字段分类” 21
3.2 分析的动态过程:聚合是本质 23
3.2.1 Excel 数据透视表:拖曳即聚合 23
3.2.2 SQL 的聚合查询:窗口式查询 24
3.2.3 Tableau VizQL 可视化聚合查询 . 26
3.3 行级别明细数据是聚合的起点,是分析的原料 27
3.3.1 数据表中包含的数据常识:数据类型与分类 . 27
3.3.2 理解数据表行级别的业务逻辑及其唯一性 . 34
3.3.3 聚合度是以数据表行级别为基准点的、衡量问题层次高低的尺度 . 37
3.4 直接聚合:基于行级别的直接聚合类型 40
3.4.1 描述规模:总和、平均值、计数 . 40
3.4.2 描述数据的波动程度:方差和标准差 . 41
3.4.3 关注个体、走向分布:百分位函数及最大值、最小值、中位数 . 44
3.5 从数据到问题的关键:“第三字段分类” 47
3.5.1 第三字段分类:行级别计算与聚合计算 . 47
3.5.2 理解聚合计算中的典型代表:“比值聚合” . 49
3.6 间接聚合:基于视图聚合的二次聚合 50
3.6.1 “复杂问题”的两个方向特征 . 50
3.6.2 基于直接聚合的二次聚合:大数据的OLAP 分析 51
3.7 从问题分析视角看数据分析的发展阶段 57
3.7.1 小数据时代的多角度明细展示 . 57
3.7.2 数据统计时代的聚合汇总 57
3.7.3 大数据时代的结构化分析 58
第4 章 启程:可视化构建方法与扩展路径 60
4.1 从聚合到图形:第二字段分类与图形构成要素 60
4.1.1 可视化坐标空间:坐标系与坐标轴 . 62
4.1.2 “第二字段分类”与坐标轴. 63
4.1.3 可视化视觉模式与图形类型. 70
4.1.4 可视化的意义描述 74
4.2 7 种主要的问题类型及其主要图形 . 75
4.2.1 传统三大图及其局限性 76
4.2.2 文本表:侧重度量指标的高密度展现 . 78
4.2.3 分布分析的三大典型图形 78
4.2.4 相关性:散点图与双轴折线图 . 82
4.2.5 地理位置可视化 83
4.3 从基本问题类型到复杂图形的延伸方法综述 85
4.3.1 从问题分析到图形增强分析的完整路径 . 85
4.3.2 基于行列的空间扩展:分区与矩阵 . 86
4.3.3 基于标记的增强分析:分层绘制方法 . 89
4.3.4 基于坐标轴的扩展:双轴、同步与多轴的合并处理 . 96
4.3.5 基于参考线的扩展:增加视图聚合的二次聚合 . 97
第2 篇 问题的7 种基本类型与可视化方法
第5 章 从问题到图形的可视化逻辑 . 102
5.1 从问题到图形的启蒙与进化 102
5.1.1 《用图表说话》中的三步走方法 . 102
5.1.2 “问题的字段解析方法”与基本问题类型 . 103
5.2 可视化图形分类方法与可视化过程 105
5.2.1 FT 可视化词典 . 105
5.2.2 Data Points 中的数据可视化过程 107
5.2.3 Abela 的“图形推荐”逻辑 108
5.2.4 面向IT 的Echarts 分类与Tableau . 109
第6 章 排序与对比(部分与部分) . 111
6.1 基本条形图与多个离散维度条形图 111
6.1.1 并排条形图(side-by-side bar):离散字段并排构成分区 . 112
6.1.2 条形图矩阵:离散字段交叉构成矩阵 . 113
6.1.3 矩阵实例:日历矩阵条形图. 114
6.1.4 堆叠条形图:你喜欢喝什么咖啡 . 116
6.1.5 比例条形图:把堆叠条形图转化为占比分析 . 118
6.2 包含多个度量坐标轴的条形图 119
6.2.1 字段重要性递减的多种布局方式 . 119
6.2.2 考虑字段关系的双轴布局方式 . 120
6.2.3 并排条形图:多个绝对值度量字段的对比 . 122
6.2.4 重叠条形图:多个绝对值度量字段的包含关系 . 124
6.3 字段类型和属性对可视化的影响 125
6.3.1 字段类型和属性对颜色的影响 . 125
6.3.2 “绝对值”与比值:字段属性对标记选择的影响 . 127
6.4 坐标轴的调整与组合 128
6.4.1 默认零点:除非必要,谨慎更改 . 129
6.4.2 坐标轴“倒序”:有些数据越大越差 . 129
6.4.3 绝对值刻度与百分位刻度 130
6.4.4 从“等距坐标轴”到“不等距坐标轴” . 131
6.4.5 棒棒糖图:虚拟双轴 132
6.5 以条形图为底色的进阶与高级图形 133
6.5.1 靶心图:在排序基础上增加对比关系 . 133
6.5.2 “进度条”:展示单一对比关系的条形图变种 . 135
6.5.3 结构化分析实例:条形图的“高级化” . 138
第7 章 时间序列与序列相关性 140
7.1 时间序列的构成 140
7.2 折线图的多种延伸形式 141
7.2.1 时间的层次与连续/离散属性 . 141
7.2.2 并排折线图和矩阵折线图 143
7.2.4 多维度折线图、堆叠面积图、百分比堆叠面积图 . 144
7.2.3 包含时序的柱状图与结构化分析 . 147
7.3 包含多个度量的时间序列 149
7.3.1 时间序列中的双轴与柱状图. 149
7.3.2 双轴的改变:柱状图与折线图的结合 . 150
7.3.3 基于公共基准的多轴合并 151
7.4 时间序列与条形图的结合:甘特图及其变种 152
7.4.1 标准甘特图:沿着连续日期延伸 . 152
7.4.2 股票蜡烛图:两个甘特图的重叠 . 154
7.4.3 跨度图:“伪装的甘特图样式” . 155
7.4.4 阶梯图:以阶梯方式表达“跨度” . 157
7.5 日期的高级转化:绝对日期与相对日期 159
7.5.1 原理:何为绝对和相对时间轴 . 159
7.5.2 “公共基准”案例:产品在不同时间段的业绩对比 . 160
7.5.3 “公共基准”案例:客户复购分析 . 163
7.6 时序分析中度量的处理与高级图形 166
7.6.1 聚合度量的累计汇总处理 166
7.6.2 绝对值与同比双轴图:同比或环比的比率 . 167
7.6.3 排序图:绝对值转化为相对排序 . 168
7.6.4 高级案例:地平线图——借助高级计算处理度量 . 170
7.7 坡面图:次序字段的前后变化 174
7.8 在趋势中增加对比关系:双折线增加阴影区 175
第8 章 占比(部分与总体占比) . 179
8.1 占比问题类型与饼图 179
8.2 树状图:占比与层次关系 181
8.3 初级:饼图作为辅助图形查看结构 184
8.4 中级:结合计算自定义分组及其占比 186
8.4.1 行级别分组:使用组和行级别计算自定义分组 . 186
8.4.2 特定层次的分组:使用集和高级计算动态分组 . 187
8.5 中级:使用多种方法展示类别的占比 189
8.5.1 方法一:使用“隐藏”功能分析单一类别占比 . 189
8.5.2 方法二:使用“行级别计算”分析单一类别占比 . 190
8.5.3 方法三:使用“筛选和高级计算”分析单一类别占比 . 191
8.6 高级图形:环形图、旭日图、南丁格尔玫瑰图 192
8.6.1 环形图:最简单的双层次结构 . 192
8.6.2 旭日图:双层占比 193
8.6.3 南丁格尔玫瑰图及个人建议. 194
第9 章 文本表及其延伸形式 196
9.1 文本表的关键场景:最高聚合与“总分结构” 196
9.2 交叉表的优势与推荐场景 198
9.3 让交叉表更实用:增加可视化修饰的方法 200
9.3.1 典型交叉表的样式与说明 200
9.3.2 简易法:基于度量名称的颜色修饰 . 201
9.3.3 简易法:基于单一度量的突出显示表 . 203
9.3.4 高级法:基于坐标轴和标记的“文本自定义” . 204
9.3.5 高级法:使用自定义字段逻辑控制形状或其他 . 208
9.4 让简单丰富起来:善用工具提示与仪表板互动 209
9.5 文字云与气泡图:不常使用和不推荐的图形 211
9.6 总结:用好“三图一表”,展开业务面纱 212
第10 章 大数据的关键:超越个体、走向分布 . 214
10.1 从个体分析到分布分析 214
10.2 直方图:分布分析第一图 215
10.2.1 简单直方图:使用数据桶(bin)在数据表行级别创建直方图 216
10.2.2 高级直方图:使用高级聚合计算和数据桶生成直方图区间 . 217
10.2.3 基于RFM 模型的客户分布分析 219
10.3 箱线图:离散分布与异常发现 221
10.4 帕累托图:特殊的头部集中分布 222
10.4.1 横轴百分位处理:将离散维度序列转化为连续百分位坐标轴 . 224
10.4.2 纵轴累计百分比处理:连续度量的百分位转化 . 224
10.4.3 空间分类处理:帕累托图的颜色分类和互动筛选 . 225
10.5 自定义分布分析:参考线与参考分布模型 227
10.5.1 使用多条“百分比”参考线构建区间 . 228
10.5.2 自定义百分位分布区间 229
10.5.3 分位数分布区间 230
10.5.4 标准差分布与“质量控制图”和“六西格玛区间” . 230
第11 章 超越经验,走向探索:广义相关性分析 . 234
11.1 散点图与参考分区:波士顿矩阵 234
11.2 中级:散点图矩阵和“散点图松散化” 237
11.3 高级:用皮尔逊系数生成相关值矩阵 241
11.4 层次关系:多个维度字段之间的结构关系. 244
11.5 次序字段的流向分析:漏斗图和桑基图 247
11.5.1 漏斗图(上):基于次序字段的变化 . 247
11.5.2 漏斗图(下):基于度量值的变化 . 250
11.5.3 桑基图:多阶段的流向变化(简要) . 252
11.6 瀑布图:多个数值的依赖关系 253
11.7 雷达图:多角度的综合关系 256
11.8 相关性或因果关系:基于空间的流行病学案例 . 259
第12 章 特殊的分布:地理空间分析 . 264
12.1 地理空间和地理图层 264
12.2 点图与热力图:地理空间分布 265
12.3 符号地图与填充地图 267
12.4 自定义地理空间与空间矩阵 270
12.4.1 为数据点增加缓冲区 270
12.4.2 自定义地理空间:“化学元素周期表” . 271
12.4.3 高级案例:使用表计算自定义空间矩阵 . 272
12.5 路径地图:两种数据结构,两种绘制方式 274
12.6 地理空间图形的说明 275
第3 篇 超越:从可视化分析走向结构化洞察
第13 章 样本控制与假设验证:交互 . 279
13.1 在Excel、SQL、Tableau 中构建分析样本 . 279
13.1.1 Excel 与SQL 中的静态筛选 . 279
13.1.2 在Tableau 中创建筛选的基本方法 281
13.2 样本控制的形式与归类 282
13.2.1 快速筛选器的常见形式与优先级 . 282
13.2.2 关联筛选器和共用筛选器 285
13.3 基于中间变量的高级样本控制 286
13.4 样本控制的高级形式:指定层次的条件筛选 289
13.4.1 指定层次条件筛选的3 种方式 . 289
13.4.2 购物篮关联分析的样本解读——量化筛选条件 . 290
13.5 性能:逻辑计算位置对筛选的影响 293
13.5.1 筛选的本质与筛选的标准位置 . 293
13.5.2 在聚合过程中间接筛选的“非标准操作”及其代价 . 295
13.5.3 不同筛选方法的高级分类与适用场景 . 296
第14 章 从表象到本质:结构化分析是业务可视化分析的灵魂 . 299
14.1 结构化分析是通往业务探索的必由之路 299
14.1.1 结构化分析是业务复杂性的要求 . 300
14.1.2 结构化分析的基本形式 301
14.2 可视化分析中常见的层次及其组合关系 303
14.2.1 行级别层次、问题层次及聚合度 . 303
14.2.2 结构化分析的基本类型 305
14.3 结构化分析的几种典型场景和案例 305
14.3.1 交易的利润结构分析:主视图引入行级别层次的聚合 . 305
14.3.2 客户的利润结构分析:主视图引入更低层次的聚合 . 307
14.3.3 客户矩阵分析:当前视图层次引入独立层次的聚合 . 309
14.3.4 环形图:当前视图层次引入更高聚合度层次的聚合 . 310
14.4 结构化分析的高级形式:嵌套LOD 的多遍聚合 313
14.4.1 客户购买力:使用嵌套LOD 完成多遍聚合 . 313
14.5 通用的层次分析方法 316
14.5.1 结构化分析与“问题结构” . 316
14.5.2 层次分析的4 个步骤 317
14.6 和结构化分析相反的“努力”方法 318
14.6.1 “形式大于内容”的图形 318
14.6.2 缺乏代表性和意义的指标 321
14.6.3 缺乏互动性的图表 321
14.6.4 不符合直觉的设计 322
第15 章 归来:成为优秀的业务分析师的个人建议 . 323
15.1 好奇、探索和持续学习的欲望,是前进的源泉 323
15.2 学习理解原理,方能举一反三、事半功倍 324
15.3 深入理解业务,方能立于不败之地 325
15.4 分析要从明细开始,过度整理会远离真相 326
15.6 循序渐进,不要好高骛远 328
后记&参考资料 . 330