加入收藏 | 设为首页 | 会员中心 | 我要投稿 李大同 (https://www.lidatong.com.cn/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 百科 > 正文

关于正则的一些笔记(长期更新)

发布时间:2020-12-14 01:56:13 所属栏目:百科 来源:网络整理
导读:正则表达式,应该都不陌生,但能真正用的熟的估计也没几个了,以下我的一些笔记 以python为主 #!/usr/bin/python# -*- coding:GBK -*-import re#1,获取字符串中的某一段,注意有些字符需要转义s = 'title测试标题/title'print re.findall(r'title(.*?)/tit

正则表达式,应该都不陌生,但能真正用的熟的估计也没几个了,以下我的一些笔记

以python为主


#!/usr/bin/python
# -*- coding:GBK -*-
import re


#1,获取字符串中的某一段,注意有些字符需要转义
s = '<title>测试标题</title>'
print re.findall(r'&;title>(.*?)&;/title>',s)


#2,获取字符串中的数字,会将一行字符串中的分成数组
s='测试标题12,测试标题34测试标题7223'
print re.findall('d+',s)

#3,获取字符串中匹配且包含自身的
s = '<title>测试标题</title>'
print re.findall("<title.*?/title>",s);

#4获取Html中的A标签,且target=“_blank”和Href以href="/showcase/开始
s='<a target="_blank" href="/showcase/2263.shtml"></a>'
print re.findall('<a[s]+target="_blank"[s]+href="/showcase/.*?/a>',s)

#获取名字为下一页的a标签
s='下一页'
print re.findall('<a.*?下一页',s)

#获取页面所有img标签
print re.findall('<imgs+src="([^"]*)".*?>',s)

(编辑:李大同)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

    推荐文章
      热点阅读