关于我们
书单推荐
新书推荐

Python网络爬虫

Python网络爬虫

定  价:49 元

        

  • 作者:龚卫,郭嗣鑫主编
  • 出版时间:2023/9/1
  • ISBN:9787121468513
  • 出 版 社:电子工业出版社
  • 中图法分类:TP311.561 
  • 页码:209页
  • 纸张:
  • 版次:1
  • 开本:26cm
9
7
4
8
6
7
8
1
5
2
1
1
3

读者对象:高校软件工程专业师生

本教材是一门基于工作过程开发出来的学习领域教材,主要讲解了爬取静态网页、爬取动态网页、爬取APP数据、反爬虫策略及解决办法、爬虫优化策略,面向不同工作场景,划分为若干个学习情境,内容由浅入深,囊括了目前行业爬取数据的全部主流技术。第一部分是爬取静态网页,由三个学习情境讲述:使用Requests+BeautifulSoup4+CSV,使用Mechanize+BeautifulSoup4+CSV,使用Scrapy+XPath+MySQL爬取数据。第二部分是爬取动态网页,使用两个学习情境描述:使用Scrapy+JSON+MySQL使用Selenium+PhantomJS爬取数据。第三部分是爬取APP数据由使用Fiddler+Requests爬取新闻类APP接口数据描述。第四部分反爬虫策略及解决办法。由常见反爬虫策略及解决办法,处理输入式验证码校验讲述。第五部分是爬虫优化策略,讲述了Scrapy+Redis分布式爬取数据。
 你还可能感兴趣
 我要评论
您的姓名   验证码: 图片看不清?点击重新得到验证码
留言内容