Power Query实战:Excel智能化数据清洗神器应用精讲
定 价:79 元
- 作者:陈平
- 出版时间:2022/12/1
- ISBN:9787121445682
- 出 版 社:电子工业出版社
- 中图法分类:TP391.13
- 页码:284
- 纸张:
- 版次:01
- 开本:16开
本书从Power Query 中M 语言的基础语法讲起,从清洗各种类型数据逐步深入到实现与外部AI 功能对接,每一章基本都配有项目实战案例,突出了函数的使用方法拆解了计算过程,让读者不仅可以系统地学习编程的相关知识,还能够对Power Query 应用开发有更加深入的理解。 本书从Power Query 的M 语言的基础语法讲起,从清洗各种类型数据逐步深入到实现与外部AI 功能对接,每一章基本上都配有项目实战案例,突出了函数的使用方法,拆解了计算过程,让读者不仅可以系统地学习编程的相关知识,还能够对Power Query 应用开发有更加深入的理解。 本书共15 章,涵盖的主要内容有Power Query 的简介及基础语法,Power Query 中从多种数据源导入数据的方法,自制文件管理器案例,在Power Query 中实现条件计算、数据去重、匹配扩展、分隔提取字符等,在Power Query 中模拟Excel 的绝对引用和相对引用,以电商平台批量上传产品数据表为例,介绍Power Query 中的数据自动化处理功能,商品库存管理,根据指定规则分隔数据,多行多列数据的清洗方法,在Power Query 中进行有关时间的计算,提取代码中的数据,Power Query中自定义函数的编写基础,使用Power Query 对接人工智能API 处理数据。 本书从基础入手,通过丰富的案例对函数的计算过程进行详细解释,不仅适合入门读者和进阶读者阅读,也适合经常使用Excel 的办公人员阅读。另外,本书还适合作为相关培训机构的教材。
陈平,具有20年的境内外供应链物流经验,曾有过多个跨境物流产品的设计,并和多家上市企业及独角兽公司进行合作,善于电商市场物流及渠道分析。微信公众号“数据技巧”创建人,原创文章累计近300篇,并在简书、今日头条等平台进行分享,深得读者认可。
第1章 Power Query简介
1.1 Power Query的作用
1.2 Power Query的打开方式
1.3 Power Query主界面功能介绍
1.4 Power Query中的数据类型
1.4.1 数据结构的类型
1.4.2 数据结构的创建
1.4.3 数据值的类型
1.5 Power Query中的函数概况
1.5.1 函数功能分类
1.5.2 主要函数的分布
1.5.3 函数的使用方法
1.6 Power Query中的基础语法
1.6.1 let…in…语句
1.6.2 if…then…else…语句
1.6.3 try…otherwise…语句
1.7 Power Query中数据的引用方式
1.7.1 引用查询表的整表数据
1.7.2 引用查询表中的单列数据
1.7.3 引用查询表中的单行数据
1.7.4 引用查询表中的值数据
1.7.5 引用查询表中的部分列数据
1.7.6 引用查询表中的部分行数据
1.7.7 引用查询记录中的数据
1.7.8 引用查询列表中的数据
第2章 汇总多个数据来源
2.1 从Excel的超级表及自定义的名称中导入数据
2.1.1 Excel中的超级表及名称的生成
2.1.2 如何快速分辨超级表
2.1.3 “数据”选项卡中的“从表格”选项
2.1.4 从表格导入数据涉及的Power Query函数
2.2 从Excel的工作表及工作簿中导入数据
2.3 从文本文件中导入数据
2.3.1 按规则分隔的文本文件
2.3.2 无分隔符的文本文件
2.4 从文件夹中导入数据
2.4.1 获取文件夹下的文件信息
2.4.2 提取文件内容
2.5 从MySQL数据库中导入数据
2.5.1 从MySQL数据库中提取函数
2.5.2 身份的验证
2.5.3 提取数据库中的表格内容
2.5.4 指定SQL语句进行提取
2.6 从Web页面中导入数据
2.7 从其他数据源中导入数据
2.7.1 从HTML文件中导入数据
2.7.2 从PDF文件中导入数据
第3章 自制文件管理器案例
3.1 从文件夹中获取所需要的数据
3.1.1 设置文件匹配信息的参数表格
3.1.2 获取指定文件夹下的数据
3.2 数据判断及筛选
3.2.1 提取默认文件路径
3.2.2 判断是否使用默认文件路径
3.2.3 提取文件大小信息
3.2.4 判断是否包含子文件夹
3.2.5 筛选文件类型
3.2.6 筛选文件大小
3.2.7 筛选修改日期
3.2.8 筛选文件名
3.3 利用Excel函数进行文件跳转
3.4 利用批处理文件批量移动、复制、删除和重命名文件
3.4.1 移动
3.4.2 复制
3.4.3 删除
3.4.4 重命名
第4章 根据指定条件进行数据统计
4.1 Excel中SUMIF函数的语法及功能介绍
4.1.1 SUMIF函数
4.1.2 条件区域(range)
4.1.3 求和条件(criteria)
4.1.4 求和区域(sum_range)
4.2 Excel中SUMIFS函数的语法及功能介绍
4.2.1 SUMIFS函数
4.2.2 求和区域(sum_range)
4.2.3 条件1的区域(criteria_range1)
4.2.4 求和条件1(criteria1)
4.2.5 条件2的区域(criteria_range2)
4.2.6 求和条件2(criteria2)
4.3 Power Query中实现的方法
4.3.1 通过分组计算
4.3.2 通过筛选表聚合求值
4.3.3 通过列计算求值
4.3.4 对含有通配符的条件进行匹配求值
4.3.5 多条件数据统计
第5章 数据的去重及匹配扩展
5.1 Excel中的数据去重方法
5.1.1 使用数据透视表去重
5.1.2 使用“删除重复值”按钮去重
5.1.3 使用条件格式去重
5.2 Power Query中的数据去重方法
5.2.1 Power Query中的单列数据去重
5.2.2 Power Query中的多列数据去重
5.3 Excel中的匹配扩展
5.3.1 VLOOKUP函数的绝对匹配
5.3.2 VLOOKUP函数的模糊匹配
5.3.3 使用INDEX和MATCH函数组合进行查找和匹配
5.4 Power Query中的匹配扩展
5.4.1 Power Query中的绝对匹配扩展
5.4.2 Power Query合并查询中的联接种类
5.4.3 Power Query中的模糊匹配扩展
5.4.4 Power Query使用阈值进行匹配扩展
5.4.5 Power Query多列条件的匹配扩展
第6章 提取复杂字符串中的任意字符
6.1 提取简单文本中的数字
6.1.1 使用Excel公式提取数据
6.1.2 使用“分列”功能提取数据
6.2 提取复杂文本中的数字
6.2.1 使用Excel数组公式提取数据
6.2.2 使用Excel快捷键提取数据
6.2.3 使用Excel插件中的自定义函数提取数据
6.3 使用Power Query提取任意数据
6.3.1 提取文本中的数字
6.3.2 提取文本中的英文字符和中文字符
6.3.3 提取文本中的他国语言字符
6.3.4 通过排除法提取字符
第7章 模拟Excel中的绝对引用和相对引用
7.1 Excel中的绝对引用和相对引用的介绍
7.1.1 Excel中的绝对引用拖曳
7.1.2 Excel中的相对引用拖曳
7.1.3 Excel中的混合引用拖曳
7.2 Power Query中的引用方法
7.2.1 Power Query中的绝对引用
7.2.2 Power Query中的相对引用
7.2.3 Power Query中错行的相对引用
7.2.4 Power Query中错列的相对引用
7.3 Power Query中的累计方法
7.3.1 Excel中的累计方法
7.3.2 使用类似Excel中的混合引用区域进行累计
7.3.3 引用上期累计结果
第8章 电商平台批量上传产品数据表
8.1 分析现有数据格式及目标表格式
8.1.1 分析目标表和源数据之间的差异
8.1.2 分析数据来源
8.2 导入现有的数据
8.2.1 导入当前表中的数据
8.2.2 导入Excel文件中的数据
8.2.3 导入文件夹中的数据
8.3 合并需要计算的字段
8.3.1 匹配目录ID字段
8.3.2 计算并匹配库存数量
8.3.3 生成产品标题列
8.3.4 合并不需要计算的字段
8.3.5 批量添加自定义列
8.4 按照上传要求修改表格格式
8.4.1 批量修改标题内容
8.4.2 批量选择目标标题列
8.4.3 根据目标表的列排序
第9章 判断是否断码缺货
9.1 定义断码缺货的情况
9.1.1 库存数据源的分析
9.1.2 断码的判断依据
9.2 判断断码缺货的步骤
9.2.1 二维库存表转换成一维表
9.2.2 判断是否符合最小库存数要求
9.2.3 根据要求进行分组计算
9.2.4 判断是否断码的依据
9.2.5 根据条件判断是否缺货
9.2.6 调整数据并加载
9.3 补货需求表的创建
9.3.1 生成补货产品尺码表
9.3.2 获取目前库存数
9.3.3 匹配对应款式要求的最小库存数
9.3.4 计算补货数量
9.3.5 筛选需要补货的尺码明细
第10章 根据指定规则来分隔数据
10.1 Excel中的“分列”功能的使用
10.1.1 批量统一格式
10.1.2 通过分隔符号进行分列
10.1.3 通过固定宽度进行分列
10.2 Power Query中的“拆分列”功能
10.2.1 按分隔符拆分列
10.2.2 按字符数拆分列
10.2.3 按位置拆分列
10.2.4 按照既有规则转换拆分列
10.3 自定义规则转换拆分列
10.3.1 分列函数介绍
10.3.2 自定义字符转换条件
10.3.3 多字符作为分隔符
10.3.4 其他自定义分隔条件
第11章 多行多列数据的清洗方法
11.1 简单重复标题的清洗
11.1.1 多个重复行标题
11.1.2 多个重复列标题
11.2 不一致标题的清洗
11.2.1 左上角标题的处理
11.2.2 不同标题相似格式数据的处理
11.3 带有合并单元格数据的整理
11.3.1 处理上下合并的单元格
11.3.2 处理左右合并的单元格
11.3.3 处理多重标题
11.3.4 多维数据转一维数据
11.3.5 拆分属性标题列
11.3.6 调整最终的格式
第12章 在Power Query中进行时间的计算
12.1 日期和时间类函数的基本介绍
12.1.1 日期和时间类函数之间的计算
12.1.2 日期和时间类函数的主要分类
12.1.3 日期格式的互相转换
12.2 日期和时间类函数的应用
12.2.1 日期格式的转换
12.2.2 按连续日期汇总
12.2.3 针对日期划分排班表
12.3 计算到期日账单
12.3.1 账期的解释
12.3.2 匹配账期
12.3.3 计算到期日
12.3.4 汇总到期日金额
12.3.5 已到期账单及未到期账单
第13章 提取代码中的数据
13.1 带table标签的代码
13.1.1 网页代码的基础知识
13.1.2 源代码结构分析
13.1.3 提取table标签中的数据
13.2 对JSON格式的数据进行清洗
13.2.1 JSON格式的数据简介
13.2.2 JSON格式的转换
13.3 提取代码中的指定数据
13.3.1 导入源代码文件
13.3.2 分析数据所在位置
13.3.3 提取所需数据
第14章 Power Query中的自定义函数
14.1 Power Query中的函数概念
14.1.1 函数的结构
14.1.2 调用查询中的步骤
14.1.3 调用全部查询
14.2 自定义函数的备注
14.2.1 代码的编写格式
14.2.2 代码中的备注
14.2.3 使用元数据进行备注
14.2.4 错误值的备注
14.3 自定义函数实战
14.3.1 函数的目标
14.3.2 完成基本功能
14.3.3 完成多条件需求
14.3.4 设置函数错误提示
14.3.5 函数界面中的说明
第15章 对接人工智能API处理数据
15.1 高德开放平台的API对接
15.1.1 准备阶段
15.1.2 了解对应API的开发文档
15.1.3 创建应用
15.1.4 编写代码
15.2 百度智能云的API对接
15.2.1 准备阶段
15.2.2 了解对应API的开发文档
15.2.3 创建应用
15.2.4 编写代码