超热门表情包app爬虫

来源：互联网收集：自由互联发布时间：2022-06-18

最近和同事和朋友斗图斗得厉害，心想哪里来的这么多表情包，于是乎想着去表情包网站爬一波图片下来，便有了今天这篇文章。 -----难度指数 ✩ ----- 阅读本文大概需要12分爬虫案例

最近和同事和朋友斗图斗得厉害，心想哪里来的这么多表情包，于是乎想着去表情包网站爬一波图片下来，便有了今天这篇文章。

-----难度指数 ✩

-----阅读本文大概需要12分

爬虫案例100篇栏目的第一篇

由于app爬虫网上的例子较少，今后的爬虫以手机包为主。

选择表情包软件

超热门表情包app

超热门表情包app爬虫_app爬虫

开发环境

python3.6

ios13

mac os

pycharm

charler

抓包

抓包工具使用的是charler软件，手机配置好代理后打开抓包工具，不会配置的可以参考我之前的文章也可以网上搜。

超热门表情包app爬虫_表情包_02

打开软件我就看最热的图黄，就抓这个栏目，耶稣也拦不住了。

找呀找呀找

咦？jpg 超热门表情包app爬虫_app爬虫_03

找到了，复制链接浏览器打开。woc居然连反爬都没有直接返回json。

代码：

import requests
from multiprocessing.dummy import Pool as mp
import os
from urllib.request import urlretrieve

def down_img(path, url):
f_path = './img/'
if not os.path.exists(f_path):
os.makedirs(f_path)

urlretrieve(url, f_path + path)

def get_json(page):
res = requests.get("http://service.aemoji.adesk.com/v1/resource?limit=60&order=hot&skip={}".format(page))
for data in (res.json()['res']['data']):
down_img(data['uid']+'.jpg', data['static_url'])

if __name__ == '__main__':
pool = mp(16)

for page in range(0, 1000, 60):
pool.apply_async(get_json, args=(page,))

pool.close()
pool.join()

现在，一个简单抓斗图app的爬就结束了。

超热门表情包app爬虫_app爬虫_04

上一篇：python词云 wordcloud 简单实例入门
下一篇：没有了

超热门表情包app爬虫

选择表情包软件

开发环境

抓包

相关文章