当前位置 : 主页 > 编程语言 > python >

# yyds干货盘点 # 盘点一个Python网络爬虫的问题(抓知乎)

来源:互联网 收集:自由互联 发布时间:2022-10-26
前几天在Python钻石交流群【此类生物】问了一个​​Python​​网络爬虫的问题,提问截图如下: 其实这个就是在抓知乎,知乎上是有反爬的,而且是那种JS加密的,属于有点难度的了。

前几天在Python钻石交流群【此类生物】问了一个​​Python​​网络爬虫的问题,提问截图如下:

# yyds干货盘点 # 盘点一个Python网络爬虫的问题(抓知乎)_Python网络爬虫

其实这个就是在抓知乎,知乎上是有反爬的,而且是那种JS加密的,属于有点难度的了。

二、实现过程

他需要爬这个小说所有章节名,​​id​​号。# yyds干货盘点 # 盘点一个Python网络爬虫的问题(抓知乎)_Python基础_02

这里【甯同学】给了一个代码,后来发现是粉丝自己在请求的时候参数不全,导致没拿到数据。

# yyds干货盘点 # 盘点一个Python网络爬虫的问题(抓知乎)_Python网络爬虫_03

知乎的请求参数中确实是有一个参数是加密的了。

# yyds干货盘点 # 盘点一个Python网络爬虫的问题(抓知乎)_python_04

关于知乎抓取,一般我推荐使用八爪鱼,另外就是使用补环境的方法,把加密的JS文件单独放本地,然后去发起请求。这个代码网上倒是挺多的,应该还是可以用的。

三、总结

大家好,我是皮皮。这篇文章主要盘点了一个​​Python​​网络爬虫的问题,文中针对该问题,给出了具体的解析和代码实现,帮助粉丝顺利解决了问题。

最后感谢粉丝【此类生物】提问,感谢【漁滒】、【甯同学】给出的思路和代码解析,感谢【逸 】、【dcpeng】、【产后修复】、【Engineer】等人参与学习交流。

网友评论