当前位置:首页 > 文化 - 网络爬虫技术 pdf电子版图书
网络爬虫技术 简介
本书内容主要包含6部分,第1部分认识网页的构造及爬虫的原理,第2部分实现静态网页的爬取,第3部分实现数据存储到文件、数据库,第4部分实现动态网页的爬取,第5部分针对不同反爬限制技术实现数据爬取,第6部分使用Scrapy爬虫框架进行爬取。内容较好地涵盖了企业爬虫岗位所需要掌握得requests、httpx、BeautifulSoup、lxml、parsel、Selenium等第三方库及正则,数据的文本、CSV、JSON文件存储,MySQL、MongoDB数据库存储,中间件集成中的Redis、Kafka等使用,Scrapy框架以及解决如图片验证码、账号限制、IP限制等问题。本书以企业级的项目为主线进行讲解,每个部分通过“项目-任务-案例”展开,对所需的知识点进行全面的介绍,并给出了任务实现的详细操作步骤和相应的实战练习题。全书由浅入深、实例生动、易学易用,可以满足不同层次读者的需求。
关于我们 - 网站帮助 - 版权声明 - 友情连接 - 网站地图
本站所收录作品、社区话题、书库评论及本站所做之广告均属其个人行为,与本站立场无关
本站所有的作品,图书,资料均为网友更新,如果侵犯了您的权利,请与本站联系,本站将立刻删除(E-MAIL:847151540@qq.com)
Copyright © 2005-2016 www.gbook.cc All Rights Reserved.备案号

