本书系统介绍Python基础知识以及数据采集、分析、可视化的流程与应用,实例丰富,实战性强。全书共14个项目,其中前10个项目以Python基础知识的理解和应用为主,项目11~项目14分别讲解网络爬虫以及NumPy、Pandas和Matplotlib的应用。书中全部代码适用于Python 3.6/3.7/3.8/3.9/3.10/3.11以及更高版本。
本书可以作为专科、高职院校程序设计课程的教材,以及Python爱好者的自学用书。
★畅销经典全新升级:配备100个微课视频,融入思政教学元素。
★全部代码适用于Python 3.6/3.7/3.8/3.9/3.10/3.11以及更高版本。
★配套资源:微课视频、PPT、程序源代码、教学大纲、习题及习题答案、在线练习软件。
Python语言由Guido van Rossum于1991年推出了第一个公开发行版本,之后迅速得到了各行业人士的青睐。经过30多年的发展,Python语言已经渗透到统计分析、移动终端开发、科学计算可视化、系统安全、逆向工程、软件测试与软件分析、图形图像处理、人工智能、机器学习、深度学习等几乎所有专业和领域。与此同时,Python语言在各大编程语言排行榜上的位次也是逐年上升的,被TIOBE网站评为2007、2010、2018、2020、2021年年度语言;在IEEE Spectrum编程语言排行榜上自2017年开始每年都名列榜首。
Python是一门免费、开源、跨平台的高级动态编程语言,支持命令式编程、函数式编程,完全支持面向对象程序设计,拥有大量功能强大的内置对象、标准库,以及涉及各行业领域的扩展库,使得各领域的工程师、科研人员、策划人员和管理人员能够快速实现和验证自己的思路、创意或者推测,还有更多人喜欢用Python编写脚本来完成工作中的一些小任务。在有些编程语言中需要编写大量代码才能实现的功能,在Python中只需要几行代码,大幅度减少了代码量,更加容易维护。Python用户只需要把主要精力放在业务逻辑的设计与实现上,在开发速度和运行效率之间达到了完美的平衡,其精妙之处令人击节赞叹。
一个好的Python程序不仅是正确的,更应该是简洁、直观、漂亮、优雅、方便人们阅读的,整个代码处处体现着美,让人赏心悦目。Python代码对布局要求非常严格,尤其是使用缩进来体现代码的逻辑关系,这一硬性要求非常有利于学习者和程序员养成一个良好、严谨的习惯。除了能够快速解决问题之外,代码布局要求严格也是Python被广泛选作教学语言的重要原因。
为推进党的二十大精神进教材、进课堂、进头脑,编者紧跟行业理念、技术发展和社会对人才的实际需求,本次改版除优化内容外,还在每章的培养目标中增加了素养目标的内容,以Python程序设计与应用为载体,旨在培养学生的家国情怀、民族自豪感,增强文化自信,提高创新思维、动手实践能力,优化代码与安全编码的意识,培养精益求精的工匠精神,遵守大数据伦理学与相关职业道德等。
内容组织与阅读建议
本书共14个项目和若干子任务,主要包括Python编程基础、网络爬虫、数据分析和数据可视化四大部分内容,全部代码适用于Python 3.6/3.7/3.8/3.9/3.10/3.11以及更高版本。
项目 1 搭建和使用Python开发环境。简单介绍Python语言与版本、安装与配置Python开发环境、Python编码规范、扩展库安装方法,以及标准库对象与扩展库对象的导入。
项目 2 使用内置对象和运算符。讲解Python常用内置对象、运算符、常用内置函数、Python关键字。
项目 3 使用列表、元组、字典、集合。讲解列表、元组与生成器表达式、字典、集合、序列解包。
项目 4 使用程序控制结构。讲解条件表达式的常见形式,单分支、双分支、多分支选择结构及嵌套的选择结构;循环结构,包括for循环与while循环,break与continue语句;以及异常处理结构。
项目 5 设计和使用自定义函数。讲解函数定义与调用语法、不同类型的函数参数、参数传递的序列解包、变量作用域、lambda表达式、生成器函数。
项目 6 面向对象程序设计。讲解类的定义与使用、数据成员与成员方法、继承、特殊方法。
项目 7 使用字符串。讲解字符串编码格式、转义字符与原始字符串、字符串格式化的不同形式、字符串常用方法、字符串常量、中英文分词、汉字到拼音的转换。
项目 8 使用正则表达式。讲解正则表达式语法、正则表达式模块re的用法。
项目 9 读写文件内容。讲解文件操作基本知识、文本文件内容操作,以及Excel与Word等常见类型文件的操作。
项目 10 文件与文件夹操作。讲解os、os.path与shutil等模块的用法,以及递归遍历文件夹和按广度优先遍历文件夹的原理。
项目 11 网络爬虫入门与应用。讲解HTML与JavaScript基础,以及urllib、ScraPy、beautifulsoup4、requests、Selenium在网络爬虫程序中的应用。
项目 12 使用NumPy实现数组与矩阵运算。讲解NumPy的数组和矩阵运算。
项目 13 使用Pandas分析与处理数据。讲解Pandas常用操作、Pandas结合Matplotlib进行数据可视化、Pandas的应用。
项目 14 使用Matplotlib进行数据可视化。介绍使用Python扩展库Matplotlib进行数据可视化相关的技术,包括折线图、散点图、饼状图、柱状图、三维图的绘制,以及切分绘图区域、设置坐标轴和图例等内容。
本书适用读者
本书是机械工业出版社组织出版的高等职业教育系列教材之一。本书可以作为(但不限于)专科、高职院校程序设计课程的教材,也可作为Python爱好者的自学用书。
配套资源
本书提供教学PPT、源代码、大纲、习题答案、微课视频等全套教学资源,可通过微信公众号Python小屋获取,或发送邮件至dongfuguo2005@126.com与作者联系获取;也可通过机械工业出版社相应渠道获取(见版权页内容简介)。另外,本书还提供了课程思政讲解视频,可扫描下面的二维码观看。
致谢
首先感谢父母的养育之恩,在当年那么艰苦的条件下还坚决支持我读书,没有让我像有些同龄的孩子一样辍学。感谢姐姐、姐夫多年来对我的爱护,以及在老家对父母的照顾,感谢善良的弟弟、弟媳在老家对父母的照顾。当然,最应该感谢的是妻子和孩子对我这个工作狂人的理解和体谅。
感谢每一位读者,感谢您在茫茫书海中选择了本书,衷心祝愿您能够从本书中受益,学到真正需要的知识。同时也期待每一位读者的热心反馈,随时欢迎您指出书中的不足,并通过微信公众号Python小屋或电子邮箱dongfuguo2005@126.com与作者沟通和交流。
董付国,山东省一流本科课程Python应 用开发(线上线下混合)、Python程序设 计基础(线上)负责人,华为技术有限公司 独立顾问,山东省高等教育教材作者,机 械工业出版社计算机分社成立20周年金牌作 者,机械工业出版社高等教育教材专家咨询 委员会委员,机械工业出版社面向新工科高 等院校大数据专业系列教材编审委员会委 员,全国高等院校计算机基础教育研究会教 育信息化专业委员会委员。出版的《Python 程序设计基础与应用》《Python程序设计实例 教程》等多部教材被国内近千所高校选用,累 计印刷超过140次;拥有国家发明专利1项,软 件著作权1项;两次入选中国大数据创新百人 榜单;长期维护微信公众号Python小屋 并免费分享1200多篇Python技术文章和超过 600节微课视频,智慧树慕课被评为平台 TOP100,腾讯云 社区作者。
前言
二维码资源清单
项目1 搭建和使用Python开发环境1
任务1.1 了解Python语言特点、应用场景和版本1
任务1.2 安装与配置Python开发环境2
1.2.1 安装与使用IDLE3
1.2.2 安装与使用Anaconda 34
任务1.3 了解Python编程规范5
任务1.4 安装扩展库6
任务1.5 词频统计 导入与使用标准库、扩展库中的对象7
习题9
项目2 使用内置对象和运算符10
任务2.1 了解Python常用内置对象10
2.1.1 常量与变量11
2.1.2 数字类型12
2.1.3 字符串13
2.1.4 列表、元组、字典、集合13
2.1.5 函数14
任务2.2 掌握Python运算符14
2.2.1 算术运算符16
2.2.2 关系运算符17
2.2.3 元素测试运算符17
2.2.4 集合运算符17
2.2.5 逻辑运算符18
2.2.6 赋值分隔符18
任务2.3 打字练习程序 使用Python内置函数19
2.3.1 类型转换与判断22
2.3.2 最值与求和24
2.3.3 基本输入/输出25
2.3.4 排序与逆序26
2.3.5 枚举与迭代26
2.3.6 map()函数、reduce()函数、filter()函数27
2.3.7 range()函数28
2.3.8 zip()函数29
2.3.9 任务实施打字练习程序29
任务2.4 了解Python关键字30
习题31
项目3 使用列表、元组、字典、集合33
任务3.1 了解Python容器对象33
任务3.2 查询学生成绩 使用列表33
3.2.1 列表创建与删除34
3.2.2 访问列表元素34
3.2.3 列表常用方法35
3.2.4 列表对象支持的运算符36
3.2.5 内置函数对列表的操作37
3.2.6 列表推导式38
3.2.7 切片40
3.2.8 任务实施查询学生成绩40
任务3.3 使用元组与生成器表达式41
3.3.1 元组创建与元素访问41
3.3.2 元组与列表的异同点42
3.3.3 生成器表达式42
任务3.4 词频统计 使用字典43
3.4.1 字典的创建与删除44
3.4.2 字典元素的访问44
3.4.3 元素的添加、修改与删除45
3.4.4 任务实施词频统计46
任务3.5 电影推荐与无效评论过滤 使用集合47
3.5.1 集合对象的创建与删除47
3.5.2 集合的操作与运算47
3.5.3 集合应用案例48
任务3.6 小明爬楼梯 理解序列解包51
习题53
项目4 使用程序控制结构55
任务4.1 理解条件表达式的值与True/False的等价关系55
任务4.2 使用选择结构57
4.2.1 程序员买包子使用单分支选择结构57
4.2.2 鸡兔同笼问题使用双分支选择结构58
4.2.3 成绩转换使用多分支选择结构58
4.2.4 成绩转换使用嵌套的选择结构59
任务4.3 使用循环结构60
4.3.1 斐波那契数列与九九乘法表使用while循环与for循环60
4.3.2 求100以内的最大素数使用break与continue语句61
任务4.4 计算平均分 使用异常处理结构62
任务4.5 程序控制结构应用案例63
习题67
项目5 设计和使用自定义函数69
任务5.1 定义与调用函数69
5.1.1 斐波那契数列基本语法69
5.1.2 计算列表元素之和定义和使用递归函数70
任务5.2 理解函数参数71
5.2.1 位置参数71
5.2.2 默认值参数71
5.2.3 关键参数72
5.2.4 可变长度参数72
5.2.5 传递参数时的序列解包73
任务5.3 统计小写字母个数 理解局部变量和全局变量74
任务5.4 自定义排序规则 使用lambda表达式75
任务5.5 斐波那契数列 理解生成器函数76
任务5.6 函数应用案例76
习题85
项目6 面向对象程序设计86
任务6.1 自定义栈 定义与使用类86
任务6.2 自定义三维向量类 理解数据成员与成员方法89
6.2.1 私有成员与公有成员89
6.2.2 数据成员90
6.2.3 成员方法90
6.2.4 属性91
6.2.5 任务实施三维向量类93
任务6.3 定义Teacher类 理解和使用继承95
任务6.4 模拟双端队列 理解特殊方法工作原理97
习题101
项目7 使用字符串102
任务7.1 认识字符串102
7.1.1 字符串编码格式102
7.1.2 实现进度条使用转义字符与原始字符串103
任务7.2 理解字符串格式化104
7.2.1 使用%符号进行格式化104
7.2.2 使用format()方法进行格式化106
7.2.3 格式化的字符串常量106
任务7.3 考试系统客观题自动判卷 熟悉字符串常用方法与操作107
7.3.1 find()、rfind()、index()、rindex()、count()107
7.3.2 split()、rsplit()108
7.3.3 join()108
7.3.4 lower()、upper()、capitalize()、title()、swapcase()109
7.3.5 replace()、maketrans()、translate()109
7.3.6 strip()、rstrip()、lstrip()110
7.3.7 startswith()、endswith()110
7.3.8 isalnum()、isalpha()、isdigit()、isspace()、isupper()、islower()110
7.3.9 center()、ljust()、rjust()111
7.3.10 字符串支持的运算符111
7.3.11 适用于字符串的内置函数112
7.3.12 字符串切片112
7.3.13 任务实施考试系统客观题自动判卷113
任务7.4 生成随机密码与密码安全性检查 使用字符串常量114
任务7.5 垃圾邮件过滤机制对抗 中英文分词与中文拼音处理115
任务7.6 汉字到拼音的转换116
习题117
项目8 使用正则表达式118
任务8.1 理解正则表达式语法118
任务8.2