之前在网上也写了不少关于爬虫爬取网页的代码,最近还是想把写的爬虫记录一下,方便大家使用吧! 代码一共分为4部分: 第一部分:找一个网站。 我这里还是找了一个比较简单的网
之前在网上也写了不少关于爬虫爬取网页的代码,最近还是想把写的爬虫记录一下,方便大家使用吧!
代码一共分为4部分:
第一部分:找一个网站。
我这里还是找了一个比较简单的网站,就是大家都知道的https://movie.douban.com/top250?start= 大家可以登录里面看一下。
这里大家可能会有一些库没有进行安装,先上图让大家安装完爬取网页所需要的库,其中我本次用到的库有:bs4,urllib,xlwt, re。
(免费学习