数据科学与商业分析 用机器学习与统计学优化商业决策
定 价:99 元
- 作者:[美] 马特·塔迪(Matt Taddy)
- 出版时间:2021/3/1
- ISBN:9787115559135
- 出 版 社:人民邮电出版社
- 中图法分类:TP274
- 页码:251
- 纸张:
- 版次:01
- 开本:16开
大数据和机器学习等的兴起使得商业分析领域越来越倚重数据科学。本书详细介绍了商业数据科学中的关键元素,汇集了机器学习、经济学以及统计学领域的核心原则和最佳实践,内容涵盖识别商业政策中的重要变量、通过实验测量这些变量,以及挖掘社交媒体以了解公众对于政策修改的反应,为从事商业数据科学的数据科学家和商业人士提供了必备工具。书中通过大量数据分析示例讲解如何利用R语言编写脚本来解决复杂的数据科学问题。
1.亚马逊北美首席经济学家,前芝加哥大学统计学教授带你解决从数据到业务实操的最后一公里问题;
2.书中通过大量数据分析示例讲解如何利用R语言编写脚本来解决复杂的数据科学问题;
3.本书是解决数据业务问题的实践指南,旨在通过大量真实的一线案例,介绍如何将业务问题和数据联系起来;
4.本书详细展示应用统计学+机器学习+经济学进行数据分析,进而驱动和优化商业决策的过程。
5.基于R语言。
Matt Taddy,美国经济学家、数据科学家。现任亚马逊北美首席经济学家、大名鼎鼎的亚马逊经济学家团队Central Economics Team VP。曾任芝加哥大学布斯商学院计量经济学和统计学教授,明星教师,开创了数据科学课程。曾任微软商务人工智能首席研究员、eBay研究员。
对本书的赞誉
献词
前言
常见符号的标准用法
第0章 引言 1
从两张图说起 1
大数据与机器学习 4
计算 6
第 1章 不确定性 14
1.1 频率不确定性和bootstrap方法 14
1.2 假设检验和错误发现率控制 25
1.3 贝叶斯推断 33
第 2章 回归 37
2.1 线性模型 37
2.2 逻辑回归 46
2.3 偏差与似然 49
2.4 ◆回归不确定性 53
2.5 空间和时间 56
第3章 正则化 64
3.1 样本外预测效果 64
3.2 正则化方法 68
3.3 模型选择 77
3.4 ◆lasso的不确定性量化 87
第4章 分类 94
4.1 最近邻 94
4.2 概率、成本和分类 97
4.3 多元逻辑回归 102
4.4 分布式多元回归 106
4.5 分布式与大数据 110
第5章 实验 114
5.1 随机控制试验 115
5.2 近似实验设计 125
5.3 ◆工具变量 135
第6章 控制 143
6.1 条件可忽略性与线性处理效果 143
6.2 高维混淆变量调整 146
6.3 ◆样本分割与正交机器学习 148
6.4 异质性处理效果 152
6.5 合成控制法 164
第7章 分解 167
7.1 聚类 167
7.2 因子模型和主成分分析 173
7.3 主成分回归 180
7.4 偏最小二乘法 184
第8章 文本作为数据 189
8.1 分词 190
8.2 文本回归 194
8.3 主题模型 194
8.4 多元逆回归 200
8.5 协同过滤 204
8.6 词嵌入技术 206
第9章 非参数方法 209
9.1 决策树 210
9.2 随机森林 216
9.3 因果关系树 224
9.4 半参数方法与高斯过程 228
第 10章 人工智能 233
10.1 什么是人工智能 233
10.2 通用机器学习 237
10.3 深度学习 240
10.4 ◆SGD 244
10.5 强化学习 248
10.6 商业环境中的人工智能 251