本书内容包括:(1)经济金融数据分析及其环境;(2)Python数据分析程序包应用基础;(3)Python数据分析的存取;(4)Python图形的绘制和可视化;(5)概率统计分布的Python应用;(6)描述性统计的Python应用;(7)参数估计的Python应用;(8)假设检验的Python应用;(9)一元回归数据分析Python应用;(10)多元回归数据分析的Python应用;(11)机器学习数据分析的Python应用;(12)时间序列数据分析的Python应用;(13)量化金融数据分析的Python应用。(14)期货市场及其交易策略的Python应用。(15)期权市场及其交易策略的Python应用。
本书紧跟大数据分析时代,内容新颖、全面,实用性强,融理论、方法、应用于一体,是一部供大数据管理与应用、数据科学与大数据技术、统计学、数量经济学、管理科学与工程、应用数学、计算数学、概率统计、金融工程、投资学、金融专业硕士、金融学、经济学、财务管理、会计学、工商管理等专业的本科高年级学生与研究生学习《统计学》或《数据分析》等课程使用的教材或实验参考书。
本书介绍经济金融各种数据分析的Python应用,紧跟大数据与人工智能时代,融理论、方法、应用于一体,实用性强。
当前,数据已成为与土地、资本、劳动力同等重要的生产要素。发展好大数据产业,是发挥我国海量数据规模和丰富应用场景优势,激活数据要素潜能的时代要求,是加快经济发展变革,构建现代化产业体系的必然选择。据测算,2022年我国大数据产业规模达1.57万亿元,同比增长18%,成为推动数字经济发展的重要力量。2023年3月国家发改委成立了国家数据局。党的二十大报告总结了过去五年的历史成就,擘画了未来中国经济和社会发展前进的方向,凸显了中国高质量发展的要求和趋势,为中国数字经济发展指明了方向。数字经济是构建现代化经济体系的重要引擎,未来数字经济的重要发展方向是实现数字经济助力实体经济发展。经济高质量发展的一个重要方面是建立现代化经济体系,现代化经济体系建立离不开实体经济发展。党的二十大报告提出,坚持把发展经济的着力点放在实体经济上。数字经济主要包括数字产业化和产业数字化。发展数字经济,能够推动5G网络、工业互联网、大数据、人工智能、基础软件等数字产业发展。数字技术发展又能进一步推动数实融合,通过运用数字技术对传统产业进行全方位、全链条改造,可以有效提高全要素生产率,促进传统产业数字化、网络化、智能化发展。发展数字经济,促进数字经济和实体经济深度融合,打造具有国际竞争力的数字产业集群,将是未来数字经济发展的着力点。
数字经济与数据科学的高速发展,推动数据分析教育教学改革进入了一个全新的阶段。《经济金融数据分析及其Python应用》(第2版)重点介绍Python3.X的数据存取、数据的可视化、数据统计分析、机器学习、时间序列分析和金融量化分析的Python3.X应用,同时结合大量的实例,对Python3.X的重要程序包进行科学、准确和全面的介绍,以便使读者能深刻理解Python3.X的精髓和灵活、高效的使用技巧。
本书之所以采用Python3.X软件,是因为它具有强大的图形展示、统计分析、机器学习功能,拥有可免费使用及功能强大的Pandas(基本数据分析工具)、NumPy(数值计算工具)、SciPy(科学计算工具)、Matplotlib(基础绘图工具)、Seaborn(扩展绘图工具)、Sklearn(机器学习工具)等众多程序包,而Matlab、SAS、SPSS、Eviews、Stata、Splus等都是收费软件。因此,Python越来越受到广大用户的欢迎和喜爱。
本书的内容是这样安排的: 第1章介绍经济金融数据分析及其环境; 第2章介绍Python数据分析包应用基础; 第3章介绍Python数据分析的存取; 第4章介绍Python图形的绘制和可视化; 第5章介绍概率统计分布的Python应用; 第6章介绍描述性统计的Python应用; 第7章介绍参数估计的Python应用; 第8章介绍假设检验的Python应用; 第9章介绍一元回归数据分析的Python应用; 第10章介绍多元回归数据分析的Python应用; 第11章介绍机器学习数据分析的Python应用; 第12章介绍时间序列数据分析的Python应用; 第13章介绍量化金融投资数据分析的Python应用; 第14章介绍期货及其交易策略的Python应用; 第15章介绍期权及其交易策略的Python应用。
本书实例和内容丰富,针对性强,书中各章结合实例详细地介绍Python3.X的具体操作过程,读者只需按照书中介绍的步骤一步一步地实际操作,就能掌握全书的内容。为了帮助读者更加直观地学习本书,我们将书中实例的全部数据文件作为附加的数据资源提供给读者。读者在自己的电脑中建立一个data目录(其他目录名也可以),将所有数据文件复制到此目录,即可进行操作。
本书的特点是: 以问题为导向,通过问题来介绍Python3.X的使用方法。因此,读者通过本书不仅能掌握Python3.X及相关的程序包的使用方法,而且能学会如何从实际问题分析入手,应用Python3.X来解决经济金融领域中的各种数据分析问题。
本书适合作为统计学、金融学、经济学、管理学、大数据管理与应用等相关专业的本科生或研究生学习经济金融数据分析、统计学、时间序列分析、量化金融等课程的教材或实验参考用书,同时对从事数据分析的实际工作者也大有裨益。
本书由朱顺泉和吴云华编著。朱顺泉撰写本书的第1章到第13章,吴云华撰写本书的第14章和第15章以及各章的练习题。本书是2020年投资学专业国家级一流本科专业建设项目、2022年投资学广东省一流本科课程建设项目、2022年广东省研究生教育创新计划项目(金融专硕量化金融投资案例库建设)、2021年广州华商学院一流专业金融工程建设项目、2022年广东财经大学本科生教材建设项目、2022年广东财经大学研究生教材建设项目等阶段性成果。
本书的出版,得到清华大学出版社编辑的大力支持、帮助。由于时间和水平的限制,书中难免存在一些纰漏,恳请读者谅解并提出宝贵意见。
编著者2023年10月于广州
朱顺泉, 2001年于中南大学管理科学与工程专业金融工程方向研究生毕业,获管理学博士学位,2004年于上海财经大学应用经济学专业金融计量与统计方向博士后研究出站,2006年评为教授。曾先后工作于湖南财经学院、湖南大学、暨南大学等,指导各类硕士生一百余人,现为广东财经大学金融学院教授,长期从事本科生与研究生的投资学、金融工程、公司金融、金融市场、金融计量学、经济博弈论、数据模型与决策等课程的教学和科研工作,一直致力于财经与科技相结合的交叉应用研究。出版著作50余部,发表学术论文一百余篇,主持完成国家社会科学项目、国家级一流专业建设点项目、社会科学项目、广东省一流专业建设点项目、广东省科技计划项目、广东省哲学社会科学项目等共十余项。
第1章经济金融数据分析及其环境
1.1经济金融数据类型
1.2经济金融数据来源
1.3经济金融数据分析工具简介
1.4Python数据分析工具的下载
1.5Python数据分析工具的安装
1.6Python的启动和退出
1.7Python数据分析相关的程序包
1.8Python数据分析快速入门
练习题
第2章Python数据分析程序包应用基础
2.1Python数据分析的NumPy应用基础
2.2Python数据分析的SciPy应用基础
2.3Python数据分析的Pandas应用基础
练习题
第3章Python数据分析的数据存取
3.1PythonNumPy数据存取
3.2PythonSciPy数据存取
3.3PythonPandas的csv格式数据文件存取
3.4PythonPandas的Excel格式数据文件存取
3.5读取并查看数据表列
3.6读取挖地兔财经网站数据
3.7挖地兔Tushare财经网站数据保存与读取
3.8数据获取的Baostock模块
3.9数据获取的Akshare模块
3.10pandas_datareader获取数据
3.11quandl财经数据接口
练习题
第4章Python图形的绘制和可视化
4.1Matplotlib绘图应用基础
4.2直方图的绘制
4.3散点图的绘制
4.4气泡图的绘制
4.5箱图的绘制
4.6饼图的绘制
4.7条形图的绘制
4.8折线图的绘制
4.9曲线标绘图的绘制
4.10连线标绘图的绘制
4.11复杂图形的绘制
4.12关于绘图中显示中文的问题处理
练习题
第5章概率统计分布的Python应用
5.1二项分布
5.2泊松分布
5.3正态分布
5.4分布
5.5均匀分布
5.6指数分布
5.7t分布
5.8卡方分布
5.9F分布
练习题
第6章描述性统计的Python应用
6.1描述性统计的Python工具
6.2数据集中趋势度量的Python应用
6.3数据离散状况度量的Python应用
6.4峰度、偏度与正态性检验的Python应用
6.5异常数据处理的Python应用
练习题
第7章参数估计的Python应用
7.1参数估计与置信区间的含义
7.2点估计的Python应用
7.3单正态总体均值区间估计的Python应用
7.4单正态总体方差区间估计的Python应用
7.5双正态总体均值差区间估计的Python应用
7.6双正态总体方差比区间估计的Python应用
练习题
第8章参数假设检验的Python应用
8.1参数假设检验的基本理论
8.2单个样本t检验的Python应用
8.3两个独立样本t检验的Python应用
8.4配对样本t检验的Python应用
8.5单样本方差假设检验的Python应用
8.6双样本方差假设检验的Python应用
练习题
第9章相关分析与一元回归数据分析的Python应用
9.1相关分析基本理论
9.2相关分析的Python应用
9.3一元线性回归分析基本理论
9.4一元线性回归数据分析的Python应用
9.5自相关性诊断的Python应用
练习题
第10章多元回归数据分析的Python应用
10.1多元线性回归分析基本理论
10.2多元线性回归数据分析的Python应用
10.3多元回归分析的Scikitlearn工具应用
10.4稳健线性回归分析Python应用
10.5逻辑Logistic回归分析Python应用
10.6广义线性回归分析Python应用
练习题
第11章机器学习数据分析的Python应用
11.1机器学习算法分类
11.2常见的机器学习算法
11.3线性回归及其Python应用
11.4逻辑回归及其Python应用
11.5决策树及其Python应用
11.6支持向量机分类及其Python应用
11.7朴素贝叶斯分类及其Python应用
11.8KNN分类(K最近邻算法)及其Python应用
11.9K均值算法及其Python应用
11.10随机森林算法及其Python应用
11.11降维算法代码及其Python应用
11.12Gradient Boosting和AdaBoost 算法及其Python应用
练习题
第12章时间序列数据分析的Python应用
12.1时间序列分析相关基本概念
12.2时间序列分析数据的可视化图形
12.3时间序列分析的平稳性检验原理
12.4沪深300时间序列分析的平稳性检验实例
12.5时间序列分析的波动率模型GARCH原理
12.6时间序列分析的波动率模型GARCH应用
练习题
第13章量化金融投资数据分析的Python应用
13.1资产组合标准均值方差模型及其Python应用
13.2资产组合有效边界的Python绘制
13.3Markowitz投资组合优化的Python应用
13.4蒙特卡洛模拟股票期权定价的Python应用
13.5蒙特卡洛模拟期权价格稳定性的Python应用
13.6期望损失ES的Python应用
练习题
第14章期货及其交易策略的Python应用
14.1期货基本概念和理论
14.2远期和期货
14.3远期和期货定价
14.4CTA及其Python实现
练习题
第15章期权及其交易策略的Python应用
15.1期权市场
15.2期权价格分析
15.3期权定价模型
15.4期权交易策略及其Python应用
练习题
附录数据资源