关于我们
书单推荐
新书推荐
|
大数据实践之路:数据中台+数据分析+产品应用 读者对象:本书主要面向数据产品经理,数据分析师、数据运营人员等数据行业从业者也可以在本书中找到一些思路和方法,如了解数据的应用、掌握分析方法等。本书也可以为想转行做数据产品经理的读者提供帮助。
本书共13 章,汇集了7 位作者(来自各大互联网企业)的知识总结和经验分享。本书借助老汤姆、小风、阿北、小诺在某电商企业数据部门工作的故事,通过大量案例深入浅出地介绍了数据中台建设与应用之路。本书以Why-What-How 的思路展开,从0 到1 介绍知识点,并重点讲述How 的过程,同时结合某个场景下的具体案例,以使读者更好地理解实操过程。每个企业都会面临各种各样的数据问题,有数据质量的问题、数据获取效率的问题、数据应用价值的问题等。本书首先介绍数据中台的建设,确保数据的质量,为企业的数据质量体系建设提供坚实的基础;然后,进行偏向深入业务的分析探索,介绍如何从数据分析角度更好地赋能业务发展;最后,介绍数据应用,解决数据获取效率的问题,并把一些分析思路和业务策略沉淀为数据产品,从而更好地将数据应用于业务。本书结合各大互联网企业的实际项目案例,让读者真正掌握数据产品经理这个新兴职业的必备技能和核心能力。
林泽丰,笔名小风,某国有企业的数据中台产品负责人。UBDC全域大数据峰会“灯塔人物”,“友盟杯”数据大赛三等奖获得者,公众号“一个数据人的自留地”的课程讲师。在电商、社交、交通、直播等领域担任过产品、运营、数据等部门的负责人,有7年多的互联网从业经验。跨领域、跨部门实战经验丰富,曾从0到1搭建过企业数据中台、大数据平台、智能营销平台,擅长埋点模型设计、指标质量治理、数仓架构、数据运营等。许秋贵,笔名阿北,贝壳找房的高级数据分析师,毕业于东北农业大学。在校期间主导开发了校园拼车等应用,帮助大学生拼车省钱出行。曾就职于百度、滴滴等互联网“大厂”,有多年数据分析经验。陈斌,笔名小诺,某互联网“大厂”的策略产品经理,毕业于大连东软信息学院。人人都是产品经理网站的“20年度热文作者”,公众号“一个数据人的自留地”的联合创办人。先后就职于百度、小米,在搜索引擎、资讯、电商等领域从事过搜索、推荐、BI、画像、反作弊、消息触达等产品工作,涉猎范围较广,经验丰富。陈丽媛,笔名草帽小子,自如画像数据产品经理,拥有两项发明专利。人人都是产品经理网站的专栏作家,公众号“一个数据人的自留地”联合创办人。在用户画像、数据埋点、指标体系、BI等方面具有丰富的实战经验,所著系列文章深受广大读者喜爱。
第1 章 那些困扰我们的数据问题 ??????????????????????????????????????????????????????????1
1.1 数据质量的问题 ....................................................................................... 1 1.2 数据获取效率的问题 ............................................................................... 5 1.3 数据应用价值的问题 ............................................................................... 8 数据中台篇 第2 章 元数据中心 ?????????????????????????????????????????????????????????????????????????? 15 2.1 元数据中心概述 ..................................................................................... 16 2.2 元数据中心的核心功能 ......................................................................... 17 2.2.1 数据整合 ..................................................................................... 17 2.2.2 数据管理 ..................................................................................... 19 2.2.3 数据地图 ..................................................................................... 25 第3 章 数据指标中心 ??????????????????????????????????????????????????????????????????????? 29 3.1 数据指标中心概述 ................................................................................. 30 3.2 数据指标中心的设计思路 ..................................................................... 30 3.2.1 定义指标并将其归集到对应的主题域 ....................................... 30 3.2.2 拆分原子指标与派生指标 .......................................................... 31 3.2.3 定义原子指标与派生指标的生产逻辑 ....................................... 32 3.2.4 通过指标管理平台对指标进行规范生产 ................................... 33 第4 章 数仓模型中心 ??????????????????????????????????????????????????????????????????????? 37 4.1 数仓模型中心概述 ................................................................................. 38 4.2 数仓模型中心的设计思路 ..................................................................... 39 4.2.1 控制数据源 ................................................................................. 39 4.2.2 划分主题域 ................................................................................. 39 4.2.3 构建一致性维度 ......................................................................... 41 4.2.4 构建总线矩阵 ............................................................................. 42 4.2.5 数仓分层建设 ............................................................................. 42 4.2.6 数仓效果评估 ............................................................................. 43 第5 章 数据资产中心 ??????????????????????????????????????????????????????????????????????? 47 5.1 数据资产中心概述 ................................................................................. 48 5.2 数据资产中心的治理流程 ..................................................................... 49 5.2.1 数据资产定级 ............................................................................. 49 5.2.2 数据资产质量治理 ..................................................................... 52 5.2.3 数据资产成本治理 ..................................................................... 56 第6 章 数据服务中心 ??????????????????????????????????????????????????????????????????????? 61 6.1 数据服务中心概述 ................................................................................. 62 6.2 数据服务中心的设计思路 ..................................................................... 62 6.2.1 将数据写入查询库 ..................................................................... 62 6.2.2 搭建元数据模型 ......................................................................... 63 6.2.3 按主题归类 ................................................................................. 65 6.2.4 缓存优化 ..................................................................................... 65 6.2.5 数据接口化 ................................................................................. 67 6.2.6 构建API 集市 ............................................................................. 68 6.2.7 统一数据服务 ............................................................................. 68 数据分析篇 第7 章 数据分析理论 ??????????????????????????????????????????????????????????????????????? 73 7.1 业务和数据 ............................................................................................ 73 7.1.1 业务和数据的闭环 ..................................................................... 74 7.1.2 不同岗位的职责边界与合作 ...................................................... 75 7.1.3 数据、信息和知识 ..................................................................... 75 7.1.4 业务策略的闭环 ......................................................................... 77 7.1.5 人人都会数据分析的趋势 .......................................................... 78 7.2 数据分析师的全貌 ................................................................................. 79 7.2.1 数据分析的定义与流程 .............................................................. 79 7.2.2 数据分析的3 种场景 .................................................................. 82 7.2.3 数据分析师的核心能力 .............................................................. 84 7.2.4 数据分析师的职业素养 .............................................................. 85 7.2.5 数据分析师的工作内容 .............................................................. 86 7.2.6 数据分析师的考核 ..................................................................... 86 7.3 数据分析团队的组织架构及其对应的工作模式 ................................... 88 7.3.1 数据分析团队的组织架构 .......................................................... 88 7.3.2 不同组织架构的工作模式 .......................................................... 89 7.4 数据分析师的工作方式 ......................................................................... 90 7.4.1 工作象限图 ................................................................................. 91 7.4.2 1+N 的工作内容 ......................................................................... 91 7.4.3 与业务方的合作模式 .................................................................. 92 7.4.4 有关工作方式常见问题的解法思考 ........................................... 94 第8 章 数据分析实操 ??????????????????????????????????????????????????????????????????????? 97 8.1 预测性分析 ............................................................................................ 97 8.1.1 预测性分析的目的 ..................................................................... 98 8.1.2 分析思路与方法 ......................................................................... 99 8.1.3 预测性分析案例 ......................................................................... 99 8.2 描述性分析 .......................................................................................... 101 8.2.1 描述性分析的目的 ................................................................... 101 8.2.2 分析思路与方法 ....................................................................... 102 8.2.3 描述性分析案例 ....................................................................... 103 8.3 诊断性分析 .......................................................................................... 104 8.3.1 诊断性分析的目的 ................................................................... 105 8.3.2 分析思路与方法 ....................................................................... 105 8.4 数据分析报告 ...................................................................................... 110 8.4.1 数据分析报告的定位 ................................................................ 110 8.4.2 预测性分析报告的结构 ............................................................ 111 8.4.3 描述性分析报告的结构 ............................................................ 111 8.4.4 诊断性分析报告的结构 ............................................................ 112 数据应用篇 第9 章 BI 系统 ??????????????????????????????????????????????????????????????????????????????? 117 9.1 让人头疼的看板需求 ........................................................................... 117 9.2 BI 系统介绍 ......................................................................................... 119 9.2.1 什么是BI 系统 ......................................................................... 119 9.2.2 BI 系统有哪些 .......................................................................... 119 9.2.3 BI 系统的相关人员................................................................... 120 9.2.4 BI 系统的特点 .......................................................................... 121 9.3 BI 系统的关键技术 .............................................................................. 122 9.4 BI 系统实践 ......................................................................................... 124 9.4.1 数据接入 ................................................................................... 125 9.4.2 数据集加工 ............................................................................... 127 9.4.3 数据集权限控制 ....................................................................... 129 9.4.4 可视化报表配置 ....................................................................... 130 9.4.5 可视化结果展示 ....................................................................... 136 9.4.6 数据分析OLAP ........................................................................ 137 9.4.7 如何衡量BI 系统是否成功 ...................................................... 142 第10 章 用户画像 ?????????????????????????????????????????????????????????????????????????? 143 10.1 用户画像的全貌 ................................................................................. 143 10.1.1 初识用户画像 ......................................................................... 144 10.1.2 基本概念 ................................................................................. 145 10.1.3 用户画像体系建设 .................................................................. 146 10.1.4 人员配合流程 ......................................................................... 149 10.2 用户画像的需求 ................................................................................. 150 10.2.1 对内需求盘点 ......................................................................... 151 10.2.2 对外竞品调研 ......................................................................... 156 10.3 用户画像的规划 ................................................................................. 158 10.3.1 用户画像的业务架构 .............................................................. 158 10.3.2 用户画像的产品架构 .............................................................. 159 10.3.3 用户画像的版本计划 .............................................................. 162 10.3.4 用户画像的项目执行计划 ...................................................... 163 10.4 用户ID 体系 ...................................................................................... 164 10.4.1 方法 ........................................................................................ 164 10.4.2 实施过程 ................................................................................. 166 10.5 标签体系 ............................................................................................ 167 10.5.1 标签分类 ................................................................................. 168 10.5.2 标签分级 ................................................................................. 175 10.6 用户画像系统..................................................................................... 177 10.6.1 概述 ........................................................................................ 177 10.6.2 首页 ........................................................................................ 178 10.6.3 洞察 ........................................................................................ 179 10.6.4 标签广场 ................................................................................. 180 10.6.5 人群 ........................................................................................ 181 10.6.6 系统管理 ................................................................................. 183 10.6.7 总结 ........................................................................................ 183 10.7 用户画像的应用 ................................................................................. 183 第11 章 电商反作弊体系 ????????????????????????????????????????????????????????????????? 189 11.1 “网络黑产”的现状 ......................................................................... 189 11.1.1 “网络黑产薅羊毛”事件 ...................................................... 189 11.1.2 “网络黑产”的类型 .............................................................. 190 11.1.3 电商“薅羊毛”场景 .............................................................. 191 11.1.4 “网络黑产”的发展趋势 ...................................................... 192 11.1.5 “网络黑产”的作弊工具 ...................................................... 192 11.2 “网络黑产”的防控方案 .................................................................. 194 11.2.1 活动的损失评估...................................................................... 194 11.2.2 反“网络黑产”作弊案例 ...................................................... 194 第12 章 内容个性化推荐 ????????????????????????????????????????????????????????????????? 201 12.1 资讯的内容处理 ................................................................................. 201 12.1.1 资讯的内容来源 ..................................................................... 202 12.1.2 资讯的分类体系 ..................................................................... 203 12.1.3 常见的分类问题及内容分类原则 ........................................... 205 12.1.4 分类体系的构建 ..................................................................... 206 12.1.5 内容的标注与机器学习 .......................................................... 208 12.2 资讯用户的画像和特征 ..................................................................... 209 12.2.1 资讯用户的画像 ..................................................................... 209 12.2.2 资讯用户的特征 ..................................................................... 209 12.3 资讯的推荐算法 ................................................................................. 211 12.3.1 资讯的信息抽取 ..................................................................... 211 12.3.2 资讯的分词方法 ..................................................................... 212 12.3.3 资讯的过滤排重 ..................................................................... 213 12.3.4 资讯的召回模型 ..................................................................... 214 12.3.5 资讯的算法排序 ..................................................................... 216 12.4 资讯的重排策略及案例 ..................................................................... 216 12.4.1 常见的重排策略及策略的目标 ............................................... 216 12.4.2 资讯的重排策略案例 .............................................................. 217 第13 章 电商个性化推送 ????????????????????????????????????????????????????????????????? 221 13.1 push 的衡量 ........................................................................................ 222 13.1.1 push 的目标与本质 ................................................................. 222 13.1.2 push 的衡量指标 ..................................................................... 222 13.2 push 的优化方向 ................................................................................ 223 13.2.1 效率高 .................................................................................... 223 13.2.2 算法准 .................................................................................... 224 13.2.3 推荐好 .................................................................................... 226 13.2.4 展示靓 .................................................................................... 227 13.3 push 的推荐案例 ................................................................................ 228 13.3.1 新用户推荐方案 ..................................................................... 228 13.3.2 推荐的效果评测 ..................................................................... 232
你还可能感兴趣
我要评论
|