一、正则表达式
1.概念 正则表达式(Regular Expression)是用于描述一组字符串特征的模式,用来匹配特定的字符串。通过特殊字符+普通字符来进行模式描述,从而达到文本匹配目的工具。
2.应用场景 (1)验证:表单提交时,进行用户名密码的验证。 (2)查找:从大量信息中快速提取指定内容,在一批url中,查找指定url。 (3)替换:将指定格式的文本进行正则匹配查找,找到之后进行特定替换。
3.网址: 正则在线测试工具:https://regexr-cn.com/ 正则练习:https://codejiaonang.com/
二、元字符
1.元字符(matacharacter):具有特定含义的字符(一个字符是否是元字符取决于应用的具体情况) 常用的元字符 代码 说明 . 匹配除换行符以外的任意字符 \w 匹配字母或数字或下划线或汉字 \s 匹配任意的空白符 \d 匹配数字 \b 匹配单词的开始或结束 [] 字符组,匹配单个列出的字符 ^ 匹配字符串的开始(在集合字符里[^a]表示非(不匹配)的意思 $ 匹配字符串的结束
2.反义字符:多用于查找除某个字符以外其他任意字符均可以的情况 常用的反义字符 代码/语法 说明 \W 匹配任意不是字母,数字,下划线,汉字的字符 \S 匹配任意不是空白符的字符 \D 匹配任意非数字的字符 \B 匹配不是单词开头或结束的位置 [^x] 匹配除了x以外的任意字符 [^aeiou] 匹配除了aeiou这几个字母以外的任意字符
3.限定字符:多用于重复匹配次数 常用的限定符 代码/语法 说明 * 重复零次或更多次 + 重复一次或更多次 ? 容许匹配一次,但非必须 {min,max} 区间量词,至少min次,最多max次 例如: {n,m} 重复n到m次
4.转义字符(\) 在实际的开发中,可能会遇到要比配元字符的情况,这个时候就需要进行字符转义,如元字符 . * \ 需要转换为\. \* \\ 5.多选结构(|) 多用于满足不同情况的选择,用“|”将不同的条件分割开来 6.括号 限定多选结构的范围,标注量词作用的元素,为反向应用“捕获”文本 7.反向引用(\1,\2) 匹配之前的第一,第二组括号内的字表达式匹配的文本。
【文章原创作者:美国服务器 http://www.558idc.com/mg.html提供,感恩】