本书以小说的形式展开,讲述了主人公俵太从大学文科专业毕业后进入征信所,从零开始学习数据分析的故事。书中以主人公就职的征信所所在的商业街为舞台,选取贴近生活的案例,将平均值、t检验、卡方检验、相关、回归分析、文本挖掘以及时间序列分析等数据分析的基础知识融入到了生动有趣的侦探故事中,讲解由浅入深、寓教于乐,没有深奥的理论和晦涩的术语,同时提供了大量实际数据,使用免费自由软件RStudio引领读者进一步体验数据分析,实践性非常强。本书适合所有对数据分析感兴趣但又苦于无从下手的读者阅读。
数学菜鸟也能搞懂数据分析!
从零学起:没有深奥的理论和晦涩的知识
实际体验:免费软件RStudio 提供模拟数据
应用R语言轻松学统计:
平均值/直方图/t检验/卡方检验/相关/回归分析/逻辑回归分析/文本挖掘……
商家的抽奖促销有猫腻?
面包店的面包缺金少两?
调查问卷的结果该怎么分析?
曾经的热销商品为什么不好卖了?
网络上的匿名中伤者找得出来吗?
坏事的发生是否能预测?
让数据告诉你答案!
石田基广
生于1962年。德岛大学研究生院Socio-Arts and Sciences研究部教授。著作有《便当店统计师2:因子分析大作战》《R语言逆序手册(第2次修订版)》《R语言数据挖掘入门》,译著有《最短路径读本:蕾娜的神奇数学之旅》等。
序 故事就这样开始了 1
00-01 遭贼的概率 1
00-02 两把钥匙都选对的概率 5
01 事件簿 是欺诈还是巧合?开业纪念抽奖促销 9
01-01 征信所这个地方 10
01-02 商业街会长的委托 13
01-03 案件的梗概 15
01-04 骰子没有记忆吗 18
01-05 逸子小姐的讲解 20
01-06 模拟实验与直方图 23
01-07 直方图与概率 28
01-08 浅尝RStudio 32
01-09 用RStudio求总和的方法 35
01-10 骰子的模拟实验 38
01-11 用RStudio生成直方图 42
01-12 平均值·期望值 45
◎天羽总经理的统计学指南 50
◎本章出现的R代码 52
02 事件簿 从白胡子老师的牢骚中拯救祖传面包店 57
02-01 RStudio基础练习 58
02-02 面包店老店主的烦恼 61
02-03 拜访白胡子老师 64
02-04 以数据服人 67
02-05 从输入数据做起 68
02-06 标准差的概念 71
02-07 总体与样本 73
02-08 正态分布 75
02-09 检验平均值的差异 77
02-10 在RStudio上做均值差异检验 79
◎天羽总经理的统计学指南 85
◎本章出现的R代码 88
03 事件簿 关于搞活商业街的调查问卷,这东西该怎么做 91
03-01 传统吉祥物还是萌系美少女 92
03-02 调查问卷 93
03-03 输入调查问卷的数据 97
03-04 将数据制成列联表 99
03-05 独立性检验 103
03-06 独立性检验的意义 106
03-07 这是搞啥 111
天羽总经理的统计学指南 115
本章出现的R代码 117
04 事件簿 酒馆的热销菜品之饭团,探究其销售额下滑的原因 121
04-01 樱田先生的酒馆 122
04-02 酒馆的销售额 124
04-03 伪相关 129
04-04 饭团与牛奶的关联性 132
04-05 相关与相关系数 136
04-06 预测冰激凌的销售量 141
天羽总经理的统计学指南 153
本章出现的R代码 155
05 事件簿 圈定网络上的恶意中伤者 163
05-01 对抗中伤者 164
05-02 文本挖掘 167
05-03 写文章时的习惯 174
05-04 圈定恶意中伤者 181
05-05 口碑信息 185
◎天羽总经理的统计学指南 199
◎本章出现的R代码 202
06 事件簿 杂货店屡遭贼!预测小偷的行为 207
06-01 初次周末上班 208
06-02 杂货店的小太郎 209
06-03 用图来表示失窃数额 211
06-04 时间序列分析 215
06-05 逻辑回归分析 220
06-06 优势比 223
06-07 用RStudio作逻辑回归分析 226
◎天羽总经理的统计学指南 234
◎本章出现的R代码 235
番外篇 进行数据分析前的RStudio环境搭建 237
参考文献简介 247