面对大数据这一势不可挡的时代潮流,所有企业都需要思考如何在实际工作中挖掘数据,充分发挥数据分析师的才能,进而有效地利用数据完成商业决策。本书首先讲解数据本身,重点介绍如何选择正确的数据源,确保数据的质量和可靠性,然后讨论数据分析,组织需要获取拥有必备技术和工具并能洞察数据变化的人才。接下来几章介绍具体的分析工作,包括性能分析、设计指标、A/B测试和原型讲解等,随之深入到分析价值链的下一环节 :利用分析结果和数据见解做出决策。
1.本书通过丰富的案例展示如何打造完整的分析价值链:收集正确、可靠的数据,合理分析,获得见解,并将见解融入决策过程;
2.前华为中国区CIO杨通鹏、EXIN亚太区总经理孙振鹏联合推荐;
3.一线案例分析,助力数字化转型。
在数字化转型如火如荼的当下,企业必须努力打造数据驱动型文化。这不只意味着拥有数据分析精英团队--如果缺乏前瞻性分析,即使生成再多的报表,也不是数据驱动组织。
- 理解数据驱动的真正含义
- 学习评估数据质量的各个指标
- 收集和分析可靠的数据
- 用数据讲故事
- 用A/B测试进行数据驱动决策
- 打造数据驱动型文化
卡尔.安德森(Carl Anderson),数据科学家,擅长利用统计学和机器学习技术解决商业问题。纽约WW公司数据副总裁,领导数据科学团队构建数据产品和制定数据策略。曾任纽约Warby Parker公司数据科学总监,在创建数据驱动组织方面拥有丰富的经验。
版权声明
O'Reilly Media, Inc.介绍
前言 xi
第 1章 数据驱动意味着什么 1
1.1 数据收集 1
1.2 数据访问 2
1.3 报表 3
1.4 报警 4
1.5 从报表和报警到分析 5
1.6 数据驱动的特征 7
1.7 分析成熟度 8
1.8 小结 12
第 2章 数据质量 13
2.1 数据质量的各个方面 14
2.2 脏数据 15
2.2.1 数据生成 16
2.2.2 数据录入 16
2.2.3 缺失数据 22
2.2.4 多重记录 24
2.2.5 截尾数据 24
2.2.6 计量单位 25
2.2.7 默认值 25
2.3 数据世系 26
2.4 数据质量是共同承担的责任 26
第3章 数据收集 29
3.1 全量收集 29
3.2 数据源的优先级 31
3.3 关联数据 33
3.4 数据收集 34
3.5 购买数据 36
3.6 数据留存 39
第4章 分析组织 41
4.1 分析师类型 41
4.1.1 数据分析师 42
4.1.2 数据工程师和分析工程师 42
4.1.3 商业分析师 43
4.1.4 数据科学家 43
4.1.5 统计学家 43
4.1.6 金融工程师 44
4.1.7 会计和财务分析师 44
4.1.8 数据可视化专家 45
4.2 分析需要团队协作 45
4.3 技能和素质 48
4.4 辅助工具 50
4.4.1 探索性数据分析和统计建模 50
4.4.2 数据库查询 51
4.4.3 文件审查和操作 52
4.5 分析组织结构 54
4.5.1 集中型 54
4.5.2 分散型 55
第5章 数据分析 58
5.1 什么是分析 59
5.2 分析的类型 60
5.2.1 描述性分析 63
5.2.2 探索性分析 65
5.2.3 推断分析 71
5.2.4 预测分析 73
5.2.5 因果分析 76
第6章 指标设计 78
6.1 指标设计 79
6.1.1 简单 79
6.1.2 标准化 79
6.1.3 准确 80
6.1.4 精确 81
6.1.5 相对和绝对 81
6.1.6 稳健 82
6.1.7 直接 83
6.2 KPI 84
6.2.1 KPI案例 85
6.2.2 多少个KPI 86
6.2.3 KPI的定义和目标 87
第7章 用数据讲故事 89
7.1 讲故事 89
7.2 第 一步 92
7.2.1 想达到什么目的 92
7.2.2 受众是谁 92
7.2.3 使用什么媒介 93
7.3 大力推销 93
7.4 数据可视化 94
7.4.1 选择图表 94
7.4.2 设计图表元素 97
7.5 传达 101
7.5.1 信息图 101
7.5.2 仪表板 103
7.6 小结 106
第8章 A/B测试 108
8.1 为何要做A/B测试 111
8.2 怎么做:A/B测试中的最佳实践 112
8.2.1 实验之前 112
8.2.2 运行实验 117
8.3 其他方法 119
8.3.1 多变量测试 119
8.3.2 贝叶斯定理的“强盗” 120
8.4 文化内涵 121
第9章 决策 123
9.1 决策制定得如何 124
9.2 是什么让决策变得困难 127
9.2.1 数据 128
9.2.2 文化 129
9.2.3 认知障碍 130
9.2.4 直觉会在何处奏效 133
9.3 解决方案 134
9.3.1 动机 135
9.3.2 能力 136
9.3.3 触发器 139
9.4 小结 139
第 10章 数据驱动型文化 141
10.1 开放、信任的文化 142
10.2 广泛的数据通识 144
10.3 目标优先的文化 145
10.4 求知好问的文化 146
10.5 迭代、学习型的文化 147
10.6 反HiPPO文化 149
10.7 数据领导 149
第 11章 数据驱动型的首席高管 151
11.1 首席数据官 152
11.1.1 首席数据官的职责 153
11.1.2 成功的秘密 155
11.1.3 首席数据官的未来 158
11.2 首席分析官 159
11.3 小结 162
第 12章 隐私、道德和风险 164
12.1 尊重隐私 165
12.2 要有同理心 168
12.3 数据质量 172
12.4 安全 173
12.5 执行 174
12.6 小结 174
第 13章 结论 176
扩展阅读 181
附录A 关于数据不合理的有效性:为什么数据越多越好 183
附录B 愿景声明 189
关于作者 192
关于封面 192