《Pandas数据处理》是Python数据分析入门书,每个概念都通过简单实例来阐述,便于读者理解与上手。具体内容包括:Python及Pandas基础知识,加载和查看数据集,Pandas的DataFrame对象和Series对象,使用matplotlib、seaborn和Pandas提供的绘图方法为探索性数据分析作图,连接与合并数据集,处理缺失数据,清理数据,转换数据类型,处理字符串,应用函数,分组操作,拟合及评估模型,正则化方法与聚类技术,等等。
项目一 处理单个数据框
任务一 统计数据框中的数据
活动一 创建学生成绩表
活动二 统计各学科的得分信息
活动三 查价高的10个订单
任务二 查询和筛选数据框中的数据
活动一 筛选出计算机老师
活动二 查找联考专业成绩在350分以上的计算机专业男生
任务三 处理数据框中的字符串
活动一 找出姓张的同学
活动二 计算老师的上课时间
项目二 清洗数据
任务一 处理数据中的缺失值和重复值
活动一 处理订单数据中的缺失值
活动二 处理销售数据中的重复值
任务二 转换数据
活动一 规范化学生考试成绩
活动二 为学生评奖
活动三 规范化成绩表标题
项目三 分组统计数据
任务一 使用内置函数对数行分组统计
活动一 为各类同学准备奖金
活动二 找出销量少的产品
活动三 统计各行业每年的上市公司数量
任务二 使用自定义函数对数行分组统计
活动一 统计职位信息
活动二 清洗网店销售数据
活动三 统计各班的成绩结构
项目四 从多个数据框获取信息
任务一 合并多个数据框
活动一 去掉停用词
活动二 选取男喜欢的电影
任务二 拼接多个数据框
活动一 统计各竞赛项目的人数
活动二 统计各年新生儿的男女比例
项目五 改变数据框结构
任务一 展开和收折数据列
活动一 按年级统计各参赛项目的男女生人数
活动二 查询学生成绩
任务二 创建数据透视表和交叉表
活动一 按班级分析成绩结构
活动二 统计各地区不同风格的电影数量
项目六 绘制图表
任务一 绘制单个图表
活动一 绘制各班专业均成绩柱状图
活动二 绘制股票收益率折线图
任务二 绘制多个图表
活动一 在不同子图绘制各班的成绩统计图
活动二 按分数段绘制各班的人数占比
项目七 处理时间序列
任务一 对时间序列采样
活动一 统计上证指数月度收益率
活动二 按季度统计股均交易量和交易额
任务二 处理移动窗口
活动一 制作股票的移均线
活动二 制作股票价格与上证指数间的收益相关图
项目八 综合应用
任务一 使用数据透视表统计数据
活动一 统均录取分数高的前10所学校
活动二 统计文理科历均录取分数和高录取分数
任务二 使用分组统计数据
活动一 统计各专业历均录取分数
活动二 统计各地区高录取分数均值