当前位置 : 主页 > 编程语言 > python >

超热门表情包app爬虫

来源:互联网 收集:自由互联 发布时间:2022-06-18
最近和同事和朋友斗图斗得厉害,心想哪里来的这么多表情包,于是乎想着去表情包网站爬一波图片下来,便有了今天这篇文章。 -----难度指数 ✩ ----- 阅读 本文 大概需要12分 爬虫案例


最近和同事和朋友斗图斗得厉害,心想哪里来的这么多表情包,于是乎想着去表情包网站爬一波图片下来,便有了今天这篇文章。

-----难度指数 ✩

-----阅读本文大概需要12分

爬虫案例100篇栏目的第一篇

由于app爬虫网上的例子较少,今后的爬虫以手机包为主。

选择表情包软件

超热门表情包app

超热门表情包app爬虫_app爬虫

开发环境

python3.6

ios13

mac os

pycharm

charler

抓包

抓包工具使用的是charler软件,手机配置好代理后打开抓包工具,不会配置的可以参考我之前的文章也可以网上搜。

超热门表情包app爬虫_表情包_02

打开软件我就看最热的图黄,就抓这个栏目,耶稣也拦不住了。

找呀找呀找

咦?jpg超热门表情包app爬虫_app爬虫_03

找到了,复制链接浏览器打开。woc居然连反爬都没有直接返回json。

代码:

import requests
from multiprocessing.dummy import Pool as mp
import os
from urllib.request import urlretrieve


def down_img(path, url):
f_path = './img/'
if not os.path.exists(f_path):
os.makedirs(f_path)

urlretrieve(url, f_path + path)


def get_json(page):
res = requests.get("http://service.aemoji.adesk.com/v1/resource?limit=60&order=hot&skip={}".format(page))
for data in (res.json()['res']['data']):
down_img(data['uid']+'.jpg', data['static_url'])


if __name__ == '__main__':
pool = mp(16)

for page in range(0, 1000, 60):
pool.apply_async(get_json, args=(page,))

pool.close()
pool.join()

现在,一个简单抓斗图app的爬就结束了。

超热门表情包app爬虫_app爬虫_04



上一篇:python词云 wordcloud 简单实例 入门
下一篇:没有了
网友评论