关于我们
书单推荐
新书推荐
|
网络爬虫技术 读者对象:软件工具程序设计人员
本书内容主要包含6部分,第1部分认识网页的构造及爬虫的原理,第2部分实现静态网页的爬取,第3部分实现数据存储到文件、数据库,第4部分实现动态网页的爬取,第5部分针对不同反爬限制技术实现数据爬取,第6部分使用Scrapy爬虫框架进行爬取。内容较好地涵盖了企业爬虫岗位所需要掌握得requests、httpx、BeautifulSoup、lxml、parsel、Selenium等第三方库及正则,数据的文本、CSV、JSON文件存储,MySQL、MongoDB数据库存储,中间件集成中的Redis、Kafka等使用,Scrapy框架以及解决如图片验证码、账号限制、IP限制等问题。本书以企业级的项目为主线进行讲解,每个部分通过“项目-任务-案例”展开,对所需的知识点进行全面的介绍,并给出了任务实现的详细操作步骤和相应的实战练习题。全书由浅入深、实例生动、易学易用,可以满足不同层次读者的需求。
你还可能感兴趣
我要评论
|