本书讲解了Python 爬虫的基础知识和**技能,帮助零基础的读者快速入门并熟练使用爬虫。本书囊括了媒体热点采集、金融数据爬取、网络文件下载、电商数据研究等四大类42个爬虫实战案例,共计3000余行代码,涉及17个网站的数据与文件获取,详解了Requests 库、Selenium 库、正则表达式、BeautifulSoup 库、多线程多进程爬虫、IP 反爬机制应对等知识。
在大数据时代的今天,无论是产品开始还是精准化营销越来越离不开大数据的支持,如何从浩瀚的网络中获取自己想要的大数据?这就需要网络爬虫,而是世界上80%的爬虫都是基于Python开发出来的,所以python爬虫技术是大数据挖掘、分析与可视化的基础。本书面向零基础读者,从如何合法使用爬虫和Python编辑环境的安装开始到不同类型爬虫程序的开发都进行了详尽的讲解,从Python基础语法到Requests库、正则表达式、Scrapy框架、Beautiful Soup一个都不少。同时在相关地方也讲解了部分数据挖掘和数据分析的基础内容。