当前位置 : 主页 > 编程语言 > python >

# yyds干货盘点 # 盘点一个正则表达式在Python网络爬虫中的应用案例

来源:互联网 收集:自由互联 发布时间:2022-09-02
大家好,我是皮皮。 一、前言 前几天在Python钻石交流群【海南菜同学】问了一个​​Python​​网络爬虫的问题,后来【瑜亮老师】在解答过程中给了一个代码,代码如下: url = "http:

大家好,我是皮皮。

一、前言

前几天在Python钻石交流群【海南菜同学】问了一个​​Python​​网络爬虫的问题,后来【瑜亮老师】在解答过程中给了一个代码,代码如下:

url = "http://zw.hainan.gov.cn/wssc/ec/jlyhnkj.html"
resp = requests.get(url)
text = resp.text
parse = etree.HTML(text)
price = parse.xpath("//div[@class='productlist']/ul/li/div[4]/text()")
# 直接使用列表推导式,去掉冗余数据
price = [i.strip() for i in price if i.strip()]
print(price)
# 为了方便统计,再去掉¥符号,再转换成数字
# price = [int(float(i.replace('¥', '').replace(',', ''))) for i in price]
# 或者用re.sub去掉多余符号,再转换成数字,上下两种方法,选一个就行
# 需要import re
# price = [int(float(re.sub(r'[¥,]', '', i))) for i in price]
print(price)

大家针对这个代码,提出了一个正则表达式处理的问题,这里给大家一起分享下。

# yyds干货盘点 # 盘点一个正则表达式在Python网络爬虫中的应用案例_Python学习

二、实现过程

这里【瑜亮老师】写了一个例子,比如“身高180.3cm”这种,取180.3?如下所示:

# yyds干货盘点 # 盘点一个正则表达式在Python网络爬虫中的应用案例_Python基础_02

这里【

上一篇:机器学习(八):模型选择与调优
下一篇:没有了
网友评论