本书从Python数据分析的基础知识入手,通过大量案例,系统介绍数据分析的流程与数据可视化的方法,提高读者应用数据来解决实际问题的能力。全书共8章,第1章主要介绍数据分析与可视化基本概念等相关知识;第2章主要介绍使用Python语言编程常用的知识点;第3章主要介绍Python数据分析常用的两个库NumPy和Pandas;第4章主要介绍如何使用Pandas导入CSV、XLSX和JSON等类型数据;第5章和第6章主要介绍多个数据分析案例实战项目;第7章以《红楼梦》为例介绍整本书的文本处理与分析方法;第8章主要介绍电商订单数据处理与客户价值分析。本书秉承“实践为主、理论够用、注重实用”原则,将实验环节及实操内容融入各章节知识点与课程教学中。本书既可以作为高职高专院校大数据技术、人工智能技术应用等计算机相关专业学生的教材,又可以作为Python数据分析初学者、爱好者及从事相关技术人员的参考用书。
谢志明,软件工程硕士,汕尾职业技术学院教师,人工智能教研室主任,计算机应用副教授,汕尾市优秀科技工作者,汕尾市高层次人才。从事计算机教学工作23年,先后承担了云计算专业、大数据专业、人工智能专业等多门专业核心课程的教学。指导学生参加省级及以上职业技能类竞赛获奖30余次,其中,获国赛二等奖3次。作为项目负责人获校级教学成果奖二等奖1次。主持及参与省级、市厅级、校级课题20余项,公开发表论文20余篇(其中,北大核心2篇,EI收录3篇),申请专利6项及软著2项,作为主编或副主编编写云计算和大数据系列规划教材6本,参编4本。
第1章 数据分析与可视化概述 1
学习目标 1
1.1 数据分析 1
1.2 数据可视化 2
1.3 数据分析的流程 3
1.4 数据分析与可视化常用工具 5
1.5 Python数据分析与可视化常用类库 6
1.6 为何选用Python进行数据分析与可视化 7
1.7 安装和使用面向科学计算的Anaconda 8
1.8 掌握Jupyter Notebook的基本功能 10
1.9 掌握Jupyter Notebook的高级功能 14
本章小结 18
本章习题 18
第2章 Python语言编程基础 21
学习目标 21
2.1 Python基本语法 21
2.2 Python基本数据类型 23
2.3 Python组合数据类型 26
2.3.1 列表 26
2.3.2 元组 28
2.3.3 字典 29
2.3.4 集合 30
2.4 Python推导式 31
2.4.1 列表推导式 31
2.4.2 元组推导式 32
2.4.3 字典推导式 33
2.4.4 集合推导式 33
2.5 函数 34
2.5.1 函数的定义 34
2.5.2 匿名函数 35
本章小结 35
本章习题 36
第3章 NumPy和Pandas的基础知识 37
学习目标 37
3.1 NumPy数值计算基础 38
3.1.1 NumPy多维数组 38
3.1.2 NumPy数组切片和运算 40
3.2 Pandas统计分析基础 42
3.2.1 Pandas的数据结构 42
3.2.2 Series的语法格式及其基本操作 43
3.2.3 DataFrame的语法格式及其基本操作 47
3.2.4 DataFrame的合并、拼接和组合 52
3.3 分组与聚合 55
3.3.1 数据分组 55
3.3.2 数据聚合 58
本章小结 61
本章习题 61
第4章 使用Pandas导入数据 65
学习目标 65
4.1 读/写文本文件 65
4.1.1 读/写TXT文本文件 65
4.1.2 读/写CSV文件 66
4.2 读/写Excel文件 70
4.3 读/写HTML文件中的表格数据 77
4.4 读/写JSON格式文件 79
4.5 读取MySQL数据库文件 82
4.5.1 将数据导入MySQL数据库 83
4.5.2 访问MySQL数据库 88
本章小结 91
本章习题 91
第5章 数据清理案例实战 93
学习目标 93
5.1 数据清理概述 93
5.2 案例实战之成都锦江区二手房数据清理 94
5.3 案例实战之数据分析岗位需求分析 100
5.4 案例实战之年度销售数据分析 109
本章小结 117
本章习题 117
第6章 HTML表格数据及JSON数据处理与分析案例实战 120
学习目标 120
6.1 案例实战之2022年软科中国大学排名数据处理与分析 120
6.2 案例实战之气象数据处理与分析 127
6.3 案例实战之某疾病感染人群数据处理与分析 132
本章小结 138
本章习题 139
第7章 整本书文本处理与分析——以《红楼梦》为例 141
学习目标 141
7.1 绘制《红楼梦》整本书的词云 142
7.2 《红楼梦》各章节词云图及柱形图的展示 147
7.3 文本聚类分析 156
本章小结 167
本章习题 168
第8章 电商订单数据处理与客户价值分析 171
学习目标 171
8.1 电商订单数据处理与分析 172
8.2 电商订单客户价值分析 184
本章小结 192
本章习题 192
参考文献 196