当前位置 : 主页 > 编程语言 > python >

某众点评爬虫采集-剧本杀市场分析-Python

来源:互联网 收集:自由互联 发布时间:2022-06-18
本站所有数据均由作者定制的爬虫程序采集于互联网(类似于搜索引擎的爬虫),所有数据均为网站公开的非隐私数据,任何人均可看到。 本作者没有采用任何非法手段(例如黑客技术



  • 本站所有数据均由作者定制的爬虫程序采集于互联网(类似于搜索引擎的爬虫),所有数据均为网站公开的非隐私数据,任何人均可看到。
  • 本作者没有采用任何非法手段(例如黑客技术)盗取网站的非公开数据。
  • 如果您觉得作者侵犯了您的合法权益,请联系作者予以处理


背景介绍

伴随着《明星大侦探》等推理综艺走红,剧本杀游戏也成功出圈,成为年轻消费者偏好的休闲娱乐活动之一。同时随着体验经济的发展,人们对剧本杀这种新消费业态接受度比较高,从而推动其在国内的快速发展。

数据采集:

这节主要是讲解如何爬取数据。

由于大众点评反爬非常非常非常非常非常严格,因此使用了cookie池、ip代理等诸多防ban手段。

某点评反爬策略是字体反爬,需要解析评论、销量等字体才能拿到数据,我们通过在页面信息中解析出字体css文件,对加密字体进行映射从而拿到数据。

数据展示:

某众点评爬虫采集-剧本杀市场分析-Python_搜索引擎

数据分析:

采集了全国不同地区剧本杀商家,进行地图分布统计。

某众点评爬虫采集-剧本杀市场分析-Python_开发语言_02

可以看到排名前十的商家是北京、上海、武汉、成都、杭州、天津、深圳、沈阳、西安、重庆;

某众点评爬虫采集-剧本杀市场分析-Python_数据_03

分别拿用户对剧本、对主持人、对环境的打分做了占比分析;

某众点评爬虫采集-剧本杀市场分析-Python_数据_04

某众点评爬虫采集-剧本杀市场分析-Python_数据_05

某众点评爬虫采集-剧本杀市场分析-Python_爬虫_06

对广州剧本杀评价进行了词云统计,可以看到DM是剧本杀灵魂,带玩家穿越体验不同人生,用户对环境氛围、服务等方面比较注重;

某众点评爬虫采集-剧本杀市场分析-Python_python_07

这次的分享到这里就结束了,感谢观看,下期再见!



网友评论