当前位置 : 主页 > 编程语言 > python >

python中的正则表达式的使用

来源:互联网 收集:自由互联 发布时间:2021-06-25
一、正则表达式简介 正则表达式的官方文档 :https://www.runoob.com/regexp/regexp-tutorial.html 正则表达式:又称正规表示式、正规表示法、正规表达式、规则表示式、常规表示法(英语:Regula

一、正则表达式简介

正则表达式的官方文档:https://www.runoob.com/regexp/regexp-tutorial.html

         正则表达式:又称正规表示式、正规表示法、正规表达式、规则表示式、常规表示法(英语:Regular Expression,在代码中常简写为regex、regexp或者是RE),是计算机科学的一个概念。正则表达式使用单个字符串来描述、匹配一系列某个句法规则的字符串。在很多文本编辑器里,正则表达式通常来检索、替换那些匹配某个模式的文本。

  按某种规则匹配的表达式。

二、正则介绍

  正则表达式是一个工具,用于匹配字符串,或用来提取字符串。

1、判断一个字符串是否匹配给定的格式(判断用户账号是否满足格式)

2、从字符串中,按指定格式提取信息(抓取手机号)

import re
str1 = fijiooe18814726275iufdrrrrdf18814726275fsdssa
# 定义一个查找的规则
# 已知需要查找的手机号
p = 18814726275
# search(): 从前往后查找数据,默认返回找到的第一个数据,不会再继续往后面找
res = re.search(p,str1).group()
print(res)

三、元字符

表示单字符

字符 功能 . 匹配任意一个字符(除了\n) [] 匹配[]中列举的字符 \d 匹配数字,即0-9 \D 匹配非数字,即不是数字 \s 匹配空白,即空格,tab键 \S 匹配非空白 \w 匹配单词字符,即a-z、A-Z、0-9、_ \W 匹配非单词字符

表示数量

匹配多个字符的相关格式。

字符 功能 * 匹配前一个字符出现0次或者无限次,即可有可无 + 匹配前一个字符出现1次或者无限次,即至少有1次 ? 匹配前一个字符出现1次或者0次,即要么有1次,要么没有 {m} 匹配前一个字符出现m次 {m,} 匹配前一个字符至少出现m次 {m,n} 匹配前一个字符至少出现m~n次

 表示边界

字符 功能 ^ 匹配字符串开头 $ 匹配字符串结尾 \b 匹配一个单词的边界 \B 匹配非单词边界

匹配分组

字符 功能 | 匹配左右任意一个表达式 (ab) 将括号中字符作为一个分组 \num 引用分组num匹配到的字符串 (?P<name>) 分组起别名 (?P=name) 引用别名为name分组匹配到的字符串

四、re模块

  • re.match函数

  re.match函数尝试从字符串的起始位置匹配一个模式,匹配成功,返回的是一个匹配对象(这个对象包含了我IM恩匹配的信息,如果不是起始位置匹配成功的话,match()就会返回None。)

  • re.search方法

  re.search()扫描整个字符串并返回第一个成功匹配到的字符。

  • re.match与re.search的区别

  re.match只匹配字符串的开始,如果字符串开始不符合正则表达式,则匹配失败,函数返回为None;而re.search匹配整个字符串,直到找到一个匹配

  • findall方法

  在字符串中找到正则表达式所匹配的所有子串,并以列表的形式进行返回,如果没有找到匹配的。则返回来一个空列表。

  • 注意:match和search 是匹配一次;而findall是匹配所有。

  • sub方法

  替换字符串中的某些字符,可以用正则表达式来匹配被选子串。

  re.sub(pattern,repl,string,count=0)

    • pattern :表示正则表达式中的模式子串;
    • repl:被替换的字符串(既可以是字符串,也可以是函数)
    • string:要被处理的字符串,要替换的字符串
    • count:替换的次数

五、贪婪模式

  python中数量词默认是贪婪模式,总是尝试匹配尽可能多的字符;非贪婪模式相反,总是尝试匹配尽可能少的字符。

  在 *、?、+、{m,}、{m,n}后面加上?,可以使贪婪模式变成非贪婪模式。

上一篇:Django-Form
下一篇:python反射
网友评论