本书是创新性系统讲述数据故事化的理论与实践的教材,特别注重相关理论的继承和创新,不仅吸收全球一流大学及国外相关领域的标志性成果及最新进展,还充分体现了我国传统文化及人才培养的需要及未来社会的人才需求,系统讲解数据故事化的理论、方法、技术、工具与代表性实践。全书分为三篇:基础篇主要讲解数据故事与文学故事的联系及区别,以及数据故事的定义、特征、认知和应用;理论篇主要分析数据故事化的核心理论、数据故事化的理论基础及数据故事化的方法与技术;实战篇主要讲解Tableau的数据故事化功能和基于Tableau的数据故事化实践。 本书既可以满足数据科学与大数据技术、大数据管理与应用、计算机科学与技术、管理工程、工商管理、数据统计、数据分析、信息管理与信息系统、商业分析、数据新闻、数字人文等专业的教学需求,还可以满足数据科学领域紧缺人才培养和职业能力提升的需求。
朝乐门,男,1979年生,中国人民大学信息资源管理学院、数据工程与知识工程教育部重点实验室副教授,博士生导师。中国计算机学会信息系统专委员会委员、ACM高级会员、国际知识管理协会正式委员、全国高校大数据教育联盟大数据教材专家指导委员会委员、清华大学博士后校友会IT分会副秘书长;主持完成国家自然科学基金、国家社会科学基金等重要科学研究项目10余项;参与完成核高基、973、863、国家自然科学基金重点项目、国家社会科学基金重大项目等国家重大科研项目10余项;发表SCI/SSCI/EI/CSCI论文30余篇,软件著作权5个、发明专利3项、出版学术专著3部;获得北京市中青年骨干教师称号、国际知识管理与智力资本杰出成就奖、IBM全球卓越教师奖、Emerald/EFMD国际杰出博士论文奖、国家自然科学基金项目优秀项目、中国大数据学术创新奖、中国大数据创新百人榜单、全国大数据教育行业杰出贡献奖等多种奖励30余项。
目 录
第一篇 基础篇
第1章 故事 3
1.1 故事的定义和特征 4
1.1.1 故事的定义 4
1.1.2 故事的特征 7
1.2 故事的发展史 8
1.2.1 视觉/口述讲故事(约公元前700年之前) 8
1.2.2 书面讲故事(约公元前700年至20世纪) 11
1.2.3 数字化讲故事(20世纪至今) 11
1.3 故事的要素 12
1.3.1 意图——为什么要讲故事 13
1.3.2 内容——要讲什么故事 13
1.3.3 方式——如何讲故事 14
1.3.4 受众——给谁讲故事 14
1.3.5 冲突——故事的关键在哪里 15
1.4 故事的情节 16
1.4.1 金字塔结构 16
1.4.2 英雄之旅结构 17
1.4.3 “男孩追到女孩”结构 19
1.5 故事的叙述 19
1.5.1 故事的创作与叙述的区别 19
1.5.2 故事的叙述方法 20
1.5.3 故事的叙述原则 22
1.6 故事的生成 26
1.6.1 Storytelling Alice和Looking Glass 26
1.6.2 BeemGee作者工具 27
1.6.3 Worldbuilding 28
小结 29
思考题 30
第2章 数据故事 31
2.1 数据故事的定义 32
2.1.1 数据与故事的联系 32
2.1.2 数据故事及数据故事化 34
2.1.3 数据故事的金字塔模型 35
2.1.4 数据故事化的相关术语 36
2.1.5 数据故事的作用——EEE作用 36
2.2 数据故事的特征 37
2.3 数据故事的认知模型 40
2.3.1 数据故事的感知 41
2.3.2 数据故事的认知 41
2.3.3 数据故事的行动 42
2.4 数据故事的应用 42
2.4.1 解决数据科学的“最后一英里”问题 42
2.4.2 提升数据的可认知和可记忆能力 43
2.4.3 推动“数据—洞见—行动”的转换 47
2.4.4 数据新闻及数据产品开发 47
小结 49
思考题 50
第二篇 理论篇
第3章 数据故事化的基础理论 53
3.1 数据故事的要素 54
3.2 数据故事化的原则 55
3.3 数据故事化的流程 58
3.3.1 数据理解 58
3.3.2 明确目的 61
3.3.3 了解受众 62
3.3.4 识别关键数据 63
3.3.5 数据故事的建模 63
3.3.6 叙述准备 64
3.3.7 叙述设计及二度创作 65
3.3.8 叙述与互动 65
3.4 数据故事化的模型 66
3.4.1 分析模型 67
3.4.2 故事模型 67
3.4.3 叙述模型 70
3.5 数据故事的叙述 71
3.5.1 叙述者驱动型叙述 71
3.5.2 受众驱动型叙述 72
小结 72
思考题 73
第4章 数据故事化的理论基础 74
4.1 数据科学 76
4.1.1 与数据故事化的联系 76
4.1.2 数据科学的理论与方法 77
4.1.3 数据科学的应用 85
4.2 认知科学 90
4.2.1 与数据故事化的联系 91
4.2.2 认知科学的理论与方法 92
4.2.3 认知科学的应用 95
4.3 数据可视化 96
4.3.1 与数据故事的联系 96
4.3.2 可视化的理论与方法 97
4.3.3 数据可视化的应用 109
4.4 可解释性机器学习 111
4.4.1 与数据故事化的联系 112
4.4.2 可解释性机器学习的理论与方法 113
4.4.3 可解释性机器学习的应用 116
4.5 自然语言处理 117
4.5.1 自然语言处理与数据故事化的联系 117
4.5.2 自然语言处理的理论与方法 118
4.5.3 自然语言处理的应用 123
小结 124
思考题 126
第5章 数据故事化的方法与技术 127
5.1 可视故事化 128
5.1.1 可视故事化的定义 128
5.1.2 可视故事化的特征 129
5.1.3 可视故事化的方法 130
5.2 SHAP 137
5.2.1 SHAP的定义 137
5.2.2 SHAP的方法 138
5.2.3 SHAP的特征 139
5.2.4 SHAP的应用 140
5.3 Facet 140
5.3.1 Facet的定义 140
5.3.2 Facet的方法 141
5.3.3 Facet的特征 142
5.3.4 Facet的应用 142
5.4 反事实解释 144
5.4.1 反事实解释的定义 144
5.4.2 反事实解释的特征 144
5.4.3 反事实解释的方法 144
5.4.4 反事实解释的应用 145
5.5 LIME 146
5.5.1 LIME的定义 146
5.5.2 LIME的特征 147
5.5.3 LIME的方法 147
5.5.4 LIME的应用 150
5.6 Anchors 150
5.6.1 Anchors的定义 150
5.6.2 Anchors的方法 151
5.6.3 Anchors的特征 151
5.6.4 Anchors的应用 151
5.7 对比解释法 153
5.7.1 对比解释法的定义 153
5.7.2 对比解释法的特征 154
5.7.3 对比解释法的方法 155
5.7.4 对比解释法的应用 156
5.8 A/B测试 157
5.8.1 A/B测试的定义 157
5.8.2 A/B测试的方法 157
5.8.3 A/B测试的特征 158
5.9 混淆矩阵 159
5.9.1 混淆矩阵的定义 159
5.9.2 混淆矩阵的特征 160
5.9.3 混淆矩阵的方法 160
5.9.4 混淆矩阵的应用 160
小结 163
思考题 163
第三篇 实战篇
第6章 Tableau及其数据故事化功能 167
6.1 Tableau概述 168
6.2 Tableau的安装 173
6.3 Tableau的界面 174
6.3.1 菜单及工具栏区域 175
6.3.2 数据源、工作表、仪表板和故事标签及状态栏 177
6.3.3 侧栏及窗格区域 178
6.3.4 画布及视图区域 180
6.3.5 卡和功能架区域 180
6.3.6 智能推荐区域 184
6.4 Tableau的术语 184
6.4.1 数据来源(Data Source) 184
6.4.2 工作簿及其组成 185
6.4.3 窗格及其类型 186
6.4.4 功能架及其类型 188
6.4.5 视图及其智能推荐 189
6.4.6 仪表板 189
6.4.7 故事 192
6.4.8 参数 192
6.4.9 维度和度量 194
6.4.10 连续字段和离散字段 196
6.5 Tableau的关键技术 198
6.5.1 VizQL 198
6.5.2 HyPer 201
6.6 Tableau的操作方法 203
6.6.1 连接到数据来源 203
6.6.2 工作表及视图的编辑 205
6.6.3 仪表板的编辑 207
6.6.4 故事的编辑 210
6.6.5 数据的分析 211
6.6.6 在线发布 216
6.7 Tableau的故事化功能 217
小结 223
思考题 224
第7章 数据故事化实战 225
7.1 Tableau数据故事化的流程 226
7.2 地震数据故事的需求分析 228
7.2.1 业务背景 228
7.2.2 数据分析 229
7.2.3 数据故事化的目的 230
7.3 地震数据故事的设计 231
7.3.1 数据故事的类型 231
7.3.2 数据故事的要素 232
7.3.3 数据化故事的模型 233
7.3.4 数据故事的叙述 234
7.4 地震数据故事的生成 235
7.4.1 连接数据源 235
7.4.2 设计工作表 237
7.4.3 设计仪表板 247
7.4.4 设计故事 252
7.5 地震数据故事的发布 265
7.6 地震数据故事的评价与改进 266
小结 267
思考题 268
附录A 数据故事化的重要文献 269
附录B 数据故事化相关工具软件 273
附录C 数据故事化相关课程资源 276
参考文献 279