本书由新零售数据分析项目贯穿始终,以项目为导向,全面地介绍了数据分析的流程和Python数据分析库的应用,详细地讲解了利用Python解决企业实际问题的方法。本书共7个项目,项目1~6介绍了如何使用Python实现新零售智能销售项目,涵盖项目的背景、项目所使用的Python数据分析工具的安装与操作方法、Python基础及其常用的数据分析库,以及使用数据可视化分析新零售智能销售库存结构、用户行为、销售情况,并较为全面地阐述了如何使用Python进行企业综合案例数据分析。项目7基于大数据挖掘建模平台和可视化平台实现新零售智能销售用户分析。项目1~6都包含技能拓展,该环节补充了Python在数据分析中的应用。此外,项目2~6都包含知识测试、技能测试,通过练习和操作实践,帮助读者巩固所学的内容。本书可以作为职业院校数据分析相关专业的教材,也可以作为数据分析爱好者的自学用书。
胡志齐,北京市信息管理学校信息技术系主任,工信行指委中职分委会委员,全国中职信息技术类专业目录和标准研制专家,全国中职实训基地标准研制专家,主编十四五规划教材一本,副主编十四五规划教材一本,主编出版教材累计10本,获首届国家教材成果奖二等奖,电子工业出版社优秀作者等荣誉。
项目1 分析新零售智能销售项目背景 1
1.1 了解项目背景与目标 2
1.2 了解数据 2
1.2.1 了解订单数据 3
1.2.2 了解商品数据 3
1.3 熟悉项目流程 4
项目2 熟悉与安装Python数据分析工具 8
2.1 熟悉Python数据分析工具 9
2.1.1 了解常用的数据分析工具 9
2.1.2 了解Python数据分析的优势 10
2.2 安装Python的Anaconda发行版 11
2.2.1 系统准备 11
2.2.2 下载与安装Anaconda发行版 12
2.3 使用Jupyter Notebook 15
2.3.1 了解Jupyter Notebook 15
2.3.2 Jupyter Notebook的基本功能 16
2.3.3 Jupyter Notebook的高级功能 19
项目3 Python基础及其常用的数据分析库 25
3.1 了解Python的基础知识 26
3.1.1 了解Python基本语法 26
3.1.2 熟悉Python基本数据类型 30
3.1.3 熟悉Python常用运算符 44
3.2 了解Python标准库os模块 46
3.2.1 导入Python库 46
3.2.2 掌握os模块的常用方法 46
3.3 了解常用的数据分析库pandas 47
3.3.1 了解pandas库 47
3.3.2 读/写文件 48
3.3.3 查看DataFrame的基本属性 51
3.3.4 掌握DataFrame的查、改、增、删方法 52
3.3.5 了解DataFrame的描述性统计 60
项目4 数据可视化——分析新零售智能销售库存结构 67
4.1 技能与知识准备 68
4.1.1 了解Python第三方绘图库 68
4.1.2 理解Matplotlib的基础绘图语法 69
4.1.3 配置Matplotlib的rc动态参数 72
4.1.4 掌握Matplotlib的绘图风格及中文显示 74
4.1.5 分组聚合DataFrame 76
4.2 读取与清洗商品数据 83
4.2.1 读取商品数据 83
4.2.2 清洗商品数据 84
4.3 绘制图形,分析库存结构 85
4.3.1 绘制折线图,分析售罄率 85
4.3.2 绘制点线图,分析库存成本 87
4.3.3 绘制折线图,分析进货数量、库存数量和销售数量 88
4.3.4 撰写库存结构分析报告 89
项目5 数据可视化——分析新零售智能销售用户行为 95
5.1 技能与知识准备 96
5.1.1 排序 96
5.1.2 合并数据 101
5.2 读取与处理订单数据 112
5.2.1 读取订单数据 113
5.2.2 清洗订单数据 113
5.2.3 归约订单数据 116
5.3 绘制图形,分析用户行为 119
5.3.1 绘制饼图,分析用户支付方式 119
5.3.2 绘制散点图,分析客单价 123
5.3.3 绘制饼图,分析用户数 124
5.3.4 绘制折线图,分析用户的消费时间 127
5.3.5 绘制环形图,分析用户的消费时段 129
5.3.6 撰写用户行为分析报告 131
项目6 数据可视化——分析新零售智能销售情况 143
6.1 技能与知识准备 144
6.1.1 简单统计法 145
6.1.2 3σ原则分析法 145
6.1.3 箱形图分析法 147
6.1.4 缺失值检查法 149
6.2 统计并查看新零售智能销售数据 149
6.3 绘制图形,分析整体销售情况 150
6.3.1 绘制柱形图,分析畅销排名前10的商品 151
6.3.2 绘制条形图,分析滞销排名前10的商品 152
6.3.3 绘制折线图,分析销售金额 154
6.3.4 绘制柱形图,分析销售金额排名前10的设备 155
6.3.5 撰写总体销售情况分析报告 156
6.4 绘制图形,分析区域销售情况 159
6.4.1 绘制柱形图,分析各区域销售金额 159
6.4.2 绘制饼图,分析各市销售金额排名前5的商品占比 160
6.4.3 撰写区域销售情况分析报告 164
6.5 绘制图形,分析各月销售情况 168
6.5.1 绘制折线图,分析订单数量与设备数量的关系 168
6.5.2 绘制折线图,分析各月利润 170
6.5.3 绘制柱形图,分析各月销售金额排名前10的商品及其利润 171
6.5.4 撰写各月销售情况分析报告 174
项目7 基于大数据挖掘建模平台和可视化平台实现新零售智能销售用户分析 182
7.1 知识准备 184
7.1.1 初识大数据挖掘建模平台 184
7.1.2 初识大数据可视化平台 188
7.2 配置数据源 193
7.3 探索订单数据 195
7.4 清洗订单数据 196
7.4.1 处理缺失值 196
7.4.2 添加“市”字段 197
7.4.3 处理“商品详情”字段 198
7.4.4 去除无意义数据 199
7.4.5 提取月份 200
7.5 统计订单数据 201
7.6 绘制图形,分析用户行为 205
7.6.1 用户支付方式占比饼图 205
7.6.2 用户消费金额与消费次数折线图 207
7.6.3 各城市用户数占比饼图 209
7.6.4 每月用户数占比饼图 211
7.6.5 首次和最后一次消费时间的用户消费次数折线图 213
7.6.6 配置用户分析可视化仪表盘与大屏 215