智能分析:ChatGPT+Excel+Python超强组合玩转数据分析
定 价:89 元
- 作者:童大谦
- 出版时间:2023/12/1
- ISBN:9787121466205
- 出 版 社:电子工业出版社
写作本书的目的是希望让不懂编程的读者也能使用ChatGPT生成代码,轻松实现Excel数据处理自动化,让读者从零基础成为高手;让懂编程的读者也能收获良多,快速提升工作效率。书中用ChatGPT自动生成代码,实现了Excel数据处理自动化的绝大部分内容,包括数据导入和导出、数据整理、数据预处理、数据统计分析、数据可视化和与Excel工作表交互等。书中针对数据处理的每个问题都提供了示例,结合示例实践了提示词的编写技巧,并对与表达、数据、输出、效率和语言等相关的主题进行了探讨和总结。书中的代码是使用pandas、xlwings和OpenPyXL编写的,这也是目前通过编程方式处理Excel数据最优的工具组合。本书适合任何对ChatGPT和Excel数据处理感兴趣的读者阅读,包括职场办公人员、数据分析人员、大学生、科研人员和程序员等。
童大谦,具有15年以上VB、VBA、.NET开发经验,开发了多个数学、数据分析与可视化方面的软件,以及与科研院所合作开发了若干个软件系统。对Python、MATLAB、SPSS、R等数据分析软件非常熟悉,出版多本相关图书。曾在高校执教,CSDN高级讲师,全网学员目前近30万人。
第1章 概述1
1.1 Excel和Python数据处理简介1
1.1.1 Excel数据处理1
1.1.2 使用Python处理数据2
1.1.3 pandas、xlwings和OpenPyXL组合的优势2
1.1.4 DataFrame和Series3
1.1.5 Python及各种包的安装4
1.1.6 Python IDLE编程环境5
1.2 ChatGPT及其操作基础7
1.2.1 ChatGPT简介7
1.2.2 得到想要的答案:提示词简介7
1.2.3 使用ChatGPT生成代码9
1.2.4 面向问题重构与提示词模板11
1.2.5 使用ChatGPT进行数据分析的主要思想和步骤小结11
1.3 提示词的编写技巧12
1.3.1 基本技巧12
1.3.2 数据相关12
1.3.3 表达相关13
1.3.4 输出相关14
1.3.5 效率相关14
1.3.6 语言相关15
1.4 怎样使用本书16
1.4.1 不同读者怎样使用本书16
1.4.2 在使用提示词时可能遇到的问题及解决办法16
第2章 使用ChatGPT+pandas实现数据导入和导出18
2.1 使用ChatGPT+pandas导入Excel文件中的数据18
2.1.1 导入Excel文件中的全部数据18
2.1.2 导入Excel文件中的部分数据20
2.2 使用ChatGPT+pandas将数据写入Excel文件中21
2.3 使用ChatGPT+pandas实现CSV文件中数据的导入和导出23
2.4 将数据保存到新工作簿的工作表中25
2.5 将数据保存到同一工作簿的新工作表中27
2.6 局部区域数据的导入和导出(与xlwings交互)31
2.7 局部区域数据的导入和导出(与OpenPyXL交互)33
第3章 使用ChatGPT+pandas实现单个文件数据的整理36
3.1 使用ChatGPT+pandas实现列操作36
3.1.1 直接添加一个新列36
3.1.2 利用已有列数据通过简单计算得到新列38
3.1.3 利用已有列数据通过转换得到新列39
3.1.4 利用已有列数据通过统计得到新列42
3.1.5 根据简单条件得到新列45
3.1.6 根据多级条件得到新列46
3.1.7 根据多列数据组成的条件得到新列48
3.1.8 根据条件得到新列(mask方法)50
3.1.9 根据条件得到新列(where方法)51
3.1.10 插入列53
3.1.11 修改单个列的列名54
3.1.12 修改多个列的列名56
3.1.13 给所有列名添加前缀和后缀57
3.1.14 修改列数据的数据类型59
3.1.15 修改列数据61
3.1.16 修改列数据的格式63
3.1.17 将列中的字符串数据修改为数字65
3.1.18 根据条件修改数据67
3.1.19 删除列68
3.2 使用ChatGPT+pandas实现行操作70
3.2.1 直接添加一个新行70
3.2.2 利用已有行数据通过计算得到新行72
3.2.3 插入行74
3.2.4 修改行名76
3.2.5 修改行数据78
3.2.6 删除行79
3.3 使用ChatGPT+pandas实现值操作81
3.3.1 修改单个值81
3.3.2 修改局部区域中的值82
3.3.3 修改所有值84
3.4 使用ChatGPT+pandas实现数据查询86
3.4.1 单条件查询86
3.4.2 多条件查询88
3.5 使用ChatGPT+pandas实现数据排序89
3.5.1 单条件排序89
3.5.2 多条件排序91
3.5.3 提取前3名数据92
3.6 使用ChatGPT+pandas实现数据筛选94
3.6.1 单条件筛选94
3.6.2 多条件筛选96
3.7 使用ChatGPT+pandas实现数据排名97
3.7.1 中国式排名97
3.7.2 美国式排名99
第4章 使用ChatGPT+pandas实现多个文件数据的整理102
4.1 使用ChatGPT+pandas拆分数据102
4.1.1 简单拆分——垂直102
4.1.2 简单拆分——水平104
4.1.3 根据变量的值将数据拆分到不同工作簿中105
4.2 使用ChatGPT+pandas合并数据107
4.2.1 合并不同工作表中的数据107
4.2.2 合并不同工作簿中的数据112
4.3 使用ChatGPT+pandas拼接数据114
4.4 使用ChatGPT+pandas连接数据116
4.5 使用ChatGPT+pandas追加数据118
第5章 使用ChatGPT+pandas实现文本数据的整理120
5.1 使用ChatGPT+pandas提取子文本120
5.2 使用ChatGPT+pandas改变文本大小写122
5.3 使用ChatGPT+pandas实现分列124
5.3.1 使用单一分隔符进行分列124
5.3.2 使用多种分隔符进行分列126
5.3.3 按照固定宽度进行分列128
5.4 使用ChatGPT+pandas合并文本129
5.5 使用ChatGPT+pandas查找和替换子文本132
5.6 使用ChatGPT+pandas输出文本的格式133
第6章 使用ChatGPT+pandas实现日期时间数据的整理136
6.1 使用ChatGPT+pandas实现时间点数据的整理136
6.1.1 从给定的日期时间中提取单位对应的数字136
6.1.2 计算给定日期是星期几138
6.2 使用ChatGPT+pandas实现时间段数据的整理140
6.2.1 计算两个日期之间的间隔天数140
6.2.2 已知起始日期和间隔天数计算终止日期142
第7章 使用ChatGPT+pandas实现时间序列数据的整理144
7.1 时间序列数据144
7.1.1 创建时间序列数据144
7.1.2 从文件中导入时间序列数据146
7.2 使用ChatGPT+pandas实现时间序列数据的常见处理148
7.2.1 数据查询148
7.2.2 数据筛选149
7.2.3 数据转换150
7.2.4 数据汇总152
7.3 使用ChatGPT+pandas实现时间序列数据偏移153
7.3.1 日期时间偏移153
7.3.2 工作日偏移154
7.4 使用ChatGPT+pandas实现时间序列数据平滑156
7.5 使用ChatGPT+pandas实现时间序列数据重采样158
第8章 使用ChatGPT+pandas实现分类数据的整理160
8.1 分类数据160
8.1.1 创建分类数据160
8.1.2 设置分类值162
8.1.3 对分类数据进行排序163
8.2 使用ChatGPT+pandas处理分类数据164
8.2.1 查询分类165
8.2.2 增加分类值166
8.2.3 修改分类值167
8.2.4 删除分类值168
第9章 使用ChatGPT+pandas实现数据预处理170
9.1 使用ChatGPT+pandas处理重复数据170
9.1.1 整行数据重复的处理170
9.1.2 指定数据重复的处理172
9.2 使用ChatGPT+pandas处理缺失值173
9.2.1 发现缺失值174
9.2.2 删除缺失值176
9.2.3 填充缺失值177
9.3 使用ChatGPT+pandas处理异常值179
9.3.1 发现异常值179
9.3.2 删除异常值182
9.3.3 替换异常值184
9.4 使用ChatGPT+pandas实现数据转换185
9.4.1 数据标准化186
9.4.2 数据归一化187
?
第10章 使用ChatGPT+pandas实现统计分析190
10.1 使用ChatGPT+pandas实现描述性统计190
10.1.1 描述数据集中趋势190
10.1.2 描述数据离中趋势192
10.1.3 描述数据分布形状194
10.2 使用ChatGPT+pandas实现分组统计195
10.2.1 分组描述性统计195
10.2.2 分组提取首次数据和末次数据197
10.2.3 多条件汇总199
10.2.4 分组按条件统计201
10.3 使用ChatGPT+pandas实现频数分析202
10.4 使用ChatGPT+pandas实现数据透视表204
10.4.1 创建数据透视表204
10.4.2 设置数据透视表中值的输出格式206
10.4.3 处理数据透视表中的缺失值208
10.4.4 设置数据透视表的聚合函数210
10.4.5 为数据透视表添加行汇总和列汇总213
10.4.6 设置数据透视表中数据的显示方式215
10.4.7 对数据透视表中的数据进行排序217
10.4.8 聚合函数为连接字符串219
第11章 使用ChatGPT实现与Excel工作表相关的设置223
11.1 使用ChatGPT+xlwings设置Excel工作表223
11.1.1 设置边框223
11.1.2 设置背景色227
11.1.3 设置字体229
11.1.4 设置对齐方式231
11.1.5 单元格合并和取消合并233
11.2 使用ChatGPT+OpenPyXL设置Excel工作表235
11.2.1 设置边框235
11.2.2 设置背景色238
11.2.3 设置字体239
11.2.4 设置对齐方式241
11.2.5 单元格合并和取消合并242
第12章 使用ChatGPT实现数据可视化244
12.1 使用ChatGPT+xlwings实现数据可视化244
12.1.1 条形图244
12.1.2 饼图247
12.2 使用ChatGPT+OpenPyXL实现数据可 视化249
12.2.1 条形图249
12.2.2 饼图251
12.3 使用ChatGPT+Matplotlib实现数据可视化252
12.3.1 条形图253
12.3.2 饼图254
第13章 Python语法基础256
13.1 常量和变量256
13.1.1 常量256
13.1.2 变量及其声明、赋值和删除256
13.1.3 变量的数据类型257
13.2 数字257
13.2.1 整型数字257
13.2.2 浮点型数字258
13.3 字符串258
13.3.1 创建字符串258
13.3.2 索引和切片258
13.3.3 字符串的长度和大小写259
13.3.4 字符串的分割、连接和删除259
13.4 列表260
13.4.1 创建列表260
13.4.2 添加列表元素261
13.4.3 索引和切片261
13.4.4 删除列表元素262
13.5 元组 262
13.5.1 元组的创建和删除263
13.5.2 索引和切片263
13.6 字典263
13.6.1 字典的创建263
13.6.2 字典元素的增、删、改、查264
13.7 表达式265
13.7.1 算术运算符265
13.7.2 关系运算符265
13.7.3 逻辑运算符266
13.8 流程控制266
13.8.1 判断结构266
13.8.2 循环结构——for循环268
13.8.3 循环结构——while循环268
13.9 函数269
13.9.1 内部函数269
13.9.2 标准模块函数和第三方模块 函数269
13.9.3 自定义函数269
第14章 pandas基础271
14.1 NumPy数组271