特色栏目： python 批处理 net编程 Javascript Php Asp Css Html5 Android seo centos

当前位置 : 主页 > 编程语言 > python >

Python 正则表达式和re模块

来源：互联网收集：自由互联发布时间：2022-06-15

正则表达式语法位置正向预查比如说我们有一个文本叫做abcd，现在我们希望匹配"a后面的bcd"，但是“又不希望匹配到a”，那么可以用正向预查这么写： (?=a)bcd 这里的(?=a)即为正向预

正则表达式语法

Python 正则表达式和re模块_子模式

位置

Python 正则表达式和re模块_字符串_02

正向预查

比如说我们有一个文本叫做abcd，现在我们希望匹配"a后面的bcd"，但是“又不希望匹配到a”，那么可以用正向预查这么写：

(?<=a)bcd

这里的(?<=a)即为正向预查的写法，它代表的含义就是匹配a后面的内容，但是又不包含a本身

负向预查

接下来再来看负向预查的写法，还是拿abcd来举例子，假设这里我们要匹配"d前面的abc"，但是“又不希望匹配到d”，那么使用负向预查可以这么写

abc(?=d)

这里的(?=d)即为负向预查的写法，它代表的含义就是匹配d前面的内容，但是又不包含d本身

正则表达式关卡

关卡1-固定字符串

要求：找出字符串中是否含有123456

import re
text = '身高：178，体重：168，学号123456，密码9527，学号123456'
print(re.findall(r'123456',text)) #re是python正则表达式模块，findall是里面函数，找出所有意思，r代表原始字符串

Python 正则表达式和re模块_正则表达式_03

关卡2-预定义字符集

要求：找出所有单个的数字

import re
text = '身高：178，体重：168，学号123456，密码9527，学号123456'
print(re.findall(r'\d',text))

Python 正则表达式和re模块_正则表达式_04

关卡3-重复某一类字符

要求：找出所有数字或者长度

import re
text = '身高：178，体重：168，学号123456，密码9527，学号123456'

Python 正则表达式和re模块_子模式_05

Python 正则表达式和re模块_子模式_06

Python 正则表达式和re模块_子模式_07

关卡4-组合{}（）[]

要求：找出座机号码

数量词{}中间代入数值代表前面应该是几位长，可以用逗号分隔代表区间
（）代表一个整体
[]代表里面多个参数，只要有一个匹配上即可

text = '我的电话号码是18512345678，另外一个号码是18612345678，座机号码是021-12345678，另外一个座机是0211-12345678'

Python 正则表达式和re模块_子模式_08

将最终前后匹配一致的数据分组，最终得到后面那组数据

Python 正则表达式和re模块_子模式_09

Python 正则表达式和re模块_字符串_10

关卡5-逻辑或|

要求：找出手机号码和座机号码

Python 正则表达式和re模块_字符串_11

关卡6-边界匹配^&

要求：找出手机号

text = '18512345678是我的电话号码，另外一个号码是18612345678，座机号码是021-12345678，另外一个座机是0211-12345678'

Python 正则表达式和re模块_子模式_12

关卡7-内部约束

要求，找出barbar前后三个字母重复的字符串

text = 'barbar, barpar, parparp'

Python 正则表达式和re模块_字符串_13

关卡8-正反向结合

Python 正则表达式和re模块_正则表达式_14

写正则表达式步骤

例如：021-12345678-120

确定模式包含几个子模式，案例分为3个子模式用固定字符串连接，这里有3个子模式021、12345678、120

各个部分的字符串分类是什么，\d(数字)还是\D（非数字）

各个部分如何重复，子模式1重复几~几次、子模式2重复几~几次、子模式3重复几~几次

是否有外部位置限制

是否有内部位置限制

Python的re模块

Python 正则表达式和re模块_子模式_15

查找

search 部分匹配，只要在字符串中找到字符存在即可
match 从头开始匹配
findall 返回字符串
finditer 返回match迭代器

替换

匹配替换返回数量

import re

# 去掉电话号码中的-
num = re.subn(r'\D', '', '188-1926-8053')
print(num)
# (18819268053, 2)

分割字符串

按照正则表达式的规则来分割字符串，并返回列表

可以规定分割的次数

import re

print(re.split('a*', 'hello world'))
# ['', 'h', 'e', 'l', 'l', 'o', ' ', 'w', 'o', 'r', 'l', 'd', '']

print(re.split('a*', 'hello world', 1))
# ['', 'hello world']

修饰符

re.I：忽略大小写

re.L：本地化识别匹配

re.M：多行匹配

re.S：使.匹配包括换行在内的所有字符

re.U：根据unicode字符解析字符

re.X：给予灵活的格式以便理解

import re

content = "Cats are smarter than dogs"
print(re.search(r'DOGS', content, re.M | re.I))

上一篇：# yyds干货盘点 # 一篇文章带你搞定JavaScript 性能调优
下一篇：没有了