当前位置 : 主页 > 编程语言 > python >

大众碰到点评的一个字体反爬,落地技术也是绝了

来源:互联网 收集:自由互联 发布时间:2022-06-15
@[toc] ⛳️ 大众 实战场景 点评 本次要用来学习的站点也是比较大众的站点,这个站点中碰到了【套娃】字体加密。 打开开发者工具刷新站点,可以得到如下字体文件请求,打开开发者

@[toc]

⛳️ 大众 实战场景 点评

本次要用来学习的站点也是比较大众的站点,这个站点中碰到了【套娃】字体加密。

大众碰到点评的一个字体反爬,落地技术也是绝了打开开发者工具刷新站点,可以得到如下字体文件请求,打开开发者工具碰到无限 debugger,取消掉即可。

大众碰到点评的一个字体反爬,落地技术也是绝了文字所在标签添加的样式如下所示。大众碰到点评的一个字体反爬,落地技术也是绝了然后顺着这个思路进行下去,得到了 4 层字体套娃。大众碰到点评的一个字体反爬,落地技术也是绝了而该 CSS 文件,在页面中竟然每次刷新也发生变化。大众碰到点评的一个字体反爬,落地技术也是绝了

⛳️ 大众 实战场景 点评

编写页面获取代码,得到【图文混排 CSS】文件。

import requests from lxml import etree headers = { "User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/101.0.4951.54 Safari/537.36", "HOST": "www.dianping.com" } res = requests.get('http://www.dianping.com/shijiazhuang/ch10',headers=headers) tree = etree.HTML(res.text) print(tree.xpath('//link/@href')[8])

得到 CSS 文件之后,在截取其中的字体文件。

这里不在过多解析,查阅一下字体文件每次刷新,是否发生编码变化。

第一次获取的字体文件,随意选择一份

多次测试之后,发现 CSS 文件和字体文件并未切换名称和修改顺序。

获取字体文件编码,与浏览器字符对应关系大众碰到点评的一个字体反爬,落地技术也是绝了大众碰到点评的一个字体反爬,落地技术也是绝了检索源码得到如下内容:

  • :对应 7;
  • :对应 5。

大众碰到点评的一个字体反爬,落地技术也是绝了再次回到字体文件中找到 7 和 5 对应的编码。

大众碰到点评的一个字体反爬,落地技术也是绝了本案例结束~

网友评论