python中的正则表达式的使用
一、正则表达式简介正则表达式的官方文档:https://www.runoob.com/regexp/regexp-tutorial.html? ? ? ? ?正则表达式:又称正规表示式、正规表示法、正规表达式、规则表示式、常规表示法(英语:Regular Expression,在代码中常简写为regex、regexp或者是RE),是计算机科学的一个概念。正则表达式使用单个字符串来描述、匹配一系列某个句法规则的字符串。在很多文本编辑器里,正则表达式通常来检索、替换那些匹配某个模式的文本。 按某种规则匹配的表达式。 二、正则介绍正则表达式是一个工具,用于匹配字符串,或用来提取字符串。1、判断一个字符串是否匹配给定的格式(判断用户账号是否满足格式) 2、从字符串中,按指定格式提取信息(抓取手机号) import re str1 = ‘fijiooe18814726275iufdrrrrdf18814726275fsdssa‘ # 定义一个查找的规则 # 已知需要查找的手机号 p = ‘18814726275‘ # search(): 从前往后查找数据,默认返回找到的第一个数据,不会再继续往后面找 res = re.search(p,str1).group() print(res) 三、元字符表示单字符
表示数量匹配多个字符的相关格式。
?表示边界
匹配分组
四、re模块
re.match函数尝试从字符串的起始位置匹配一个模式,匹配成功,返回的是一个匹配对象(这个对象包含了我IM恩匹配的信息,如果不是起始位置匹配成功的话,match()就会返回None。)
re.search()扫描整个字符串并返回第一个成功匹配到的字符。
re.match只匹配字符串的开始,如果字符串开始不符合正则表达式,则匹配失败,函数返回为None;而re.search匹配整个字符串,直到找到一个匹配
在字符串中找到正则表达式所匹配的所有子串,并以列表的形式进行返回,如果没有找到匹配的。则返回来一个空列表。
替换字符串中的某些字符,可以用正则表达式来匹配被选子串。 re.sub(pattern,repl,string,count=0)
五、贪婪模式python中数量词默认是贪婪模式,总是尝试匹配尽可能多的字符;非贪婪模式相反,总是尝试匹配尽可能少的字符。 在 *、?、+、{m,}、{m,n}后面加上?,可以使贪婪模式变成非贪婪模式。 (编辑:李大同) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |