(教)Python在数据分析中的应用:统计分析方法与计量模型实践
定 价:38 元
丛书名:“金课工程”系列教材·通用基础系列,上海财经大学会计信息化研究中心项目,上海市浦江人才计划项目成果
- 作者:饶艳超,张周编
- 出版时间:2022/2/1
- ISBN:9787542969989
- 出 版 社:立信会计出版社
- 中图法分类:TP311.561
- 页码:185
- 纸张:胶版纸
- 版次:1
- 开本:16开
《Python在数据分析中的应用:统计分析方法与计量模型实践》基于Python学习在进行数据分析时常用的统计分析方法,具体包括多元线性回归模型拟合、多元非线性回归模型拟合、多元统计分析推断、模型变量的异方差性处理、处理面板数据的固定效应方法和随机效应方法、时间序列数据处理的有限分布滞后模型等。
《Python在数据分析中的应用:统计分析方法与计量模型实践》学习内容略过数据的获取过程,不关注Python的爬虫应用,仅关注在数据获取之后应用Python实现利用不同的统计分析方法构建模型进行数据挖掘和发现数据规律。《Python在数据分析中的应用:统计分析方法与计量模型实践》共十一章的学习内容建立在对Python应用已有一定程度了解和掌握的基础之上。如果学习者对Python了解不多,可以通过附录部分,先学习应用Python进行数据分析的基础,学习如何搭建Python数据分析环境,了解掌握Python数据处理和分析的常用算法库和工具包。
人类社会发展进程中,通过数据来研究规律并发现规律贯穿了始终。从进入信息化时代开始,人类社会的各类信息系统就开始积累大量的业务数据,为了有效、充分利用这些数据支持日常管理和决策,数据分析成为越来越多岗位人员每天的基本工作。进入数字化时代后,不仅数据量越来越大,数据类型和数据形式也越来越多,各行各业对数据分析的需求也越来越强烈。
可以说,数据分析正在改变传统岗位的工作方式,数据分析正成为最受人们青睐的工作岗位,数据分析能力是数字化时代各类人才的必备能力。为了增强学生在人才市场的竞争力,越来越多高校在基础课程或专业必修、专业选修课程中加入了数据分析课程,或是至少在相关课程中加入了数据分析的教学内容。
数据分析是指将某一主题相关的数据收集整合,然后利用特定的方法分析这些主题数据,从中发现规律或是得到结论。社会和经济领域中针对不同主题的决策场景进行数据分析有着不同的分析目的,分析目的不同,分析所基于的数据、方法和工具也会不同。因此,进行数据分析首先需要确定数据分析目标。例如,企业产品运营部门进行数据分析的目的之一是了解产品存在的问题并分析原因,然后在分析的基础上思考优化的运营方案。再如,投资部门进行数据分析的目的之一是深入分析备选投资方案的成本、收益和风险,以及分析哪些因素会怎样影响投资成本、投资收益和投资风险,以支持投资决策。
就数据而言,数据分析所基于的数据有简单的数据,也有复杂的数据;有数值数据,也有文本数据;有连续数值数据,也有断点数值数据;有结构化数据,也有非结构化数据。就方法而言,统计学是数据分析的灵魂,统计分析方法是常用数据分析方法。就经济领域的数据分析而言,计量经济模型是常用的分析模型。
很多编程语言都可以实现数据分析,Python是当前在实务应用和课堂教学中的首选语言。这不仅因为Python语法简单,代码可读性高,容易入门,有利于初学者学习,还因为Python在数据处理、分析和交互、探索性计算以及数据可视化等方面都有非常成熟的科学计算库和工具。例如,在数据处理和分析方面,Python拥有NumPY、Pandas、Matplotlib、Scikit-learn、IPython等一系列非常优秀的库和工具。此外Python在爬虫、Web、自动化运维甚至游戏等诸多领域也有广泛应用。
本教材基于Python学习在进行数据分析时常用的统计分析方法,具体包括多元线性回归模型拟合、多元非线性回归模型拟合、多元统计分析推断、模型变量的异方差性处理、处理面板数据的固定效应方法和随机效应方法、时间序列数据处理的有限分布滞后模型等。本教材学习内容略过数据的获取过程,不关注Python的爬虫应用,仅关注在数据获取之后应用Python实现利用不同的统计分析方法构建模型进行数据挖掘和发现数据规律。本教材共十一章的学习内容建立在对Python应用已有一定程度了解和掌握的基础之上。如果学习者对Python了解不多,可以通过附录部分,先学习应用Python进行数据分析的基础,学习如何搭建Python数据分析环境,了解掌握Python数据处理和分析的常用算法库和工具包。
第一章 应用Python拟合多元线性回归模型
第一节 多元线性回归模型
第二节 普通最小二乘法的Python实现
第二章 应用Python进行多元统计分析推断
第一节 多元统计分析推断的基本原理
第二节 单个总体参数的假设检验的Python实现
第三节 置信区间
第四节 线性组合假设检验
第三章 应用Python拟合多元非线性回归模型
第一节 标准化回归模型
第二节 含有其他形式的回归模型
第三节 将回归模型用于预测
第四章 应用Python检验模型设定和数据问题
第一节 模型误设
第二节 代理变量
第三节 异常观测值
第五章 应用Python处理含虚拟变量的多元回归模型
第一节 自变量为二值虚拟变量的情形
第二节 自变量为多类别虚拟变量的情形
第三节 自变量为虚拟变量时的交互作用
第四节 因变量为二值虚拟变量的情形
第六章 应用Python处理异方差性
第一节 异方差性及其影响
第二节 异方差性检验
第三节 异方差性处理
第七章 应用Python处理简单面板数据
第一节 独立混合横截面数据分析
第二节 两期面板数据分析
第八章 应用Python估计工具变量
第一节 遗漏变量和工具变量
第二节 工具变量相关检验
第三节 其他条件下的2SLS应用
第九章 应用Python处理多期面板数据
第一节 面板数据处理的固定效应和随机效应方法
第二节 使用Python工具包linearmodels处理面板数据
第十章 应用Python处理联立方程组
第一节 联立方程组的关键概念
第二节 方程组参数估计方法的Python实现
第十一章 应用Python处理时间序列数据
第一节 时间序列数据分析的基本模型
第二节 不同特征的时间序列数据分析
附录 应用Python进行数据分析的基础
第一节 Python概述
第二节 Python数据处理和计算
第三节 Python绘图
第四节 常用Python统计分析语法