加入收藏 | 设为首页 | 会员中心 | 我要投稿 李大同 (https://www.lidatong.com.cn/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 编程开发 > Python > 正文

用于域名的python正则表达式

发布时间:2020-12-20 12:25:49 所属栏目:Python 来源:网络整理
导读:我正在尝试使用以下正则表达式从文本中提取域名,但它只是产生什么,它有什么问题?我不知道这是否适合问这个“修复代码”问题,也许我应该阅读更多.我只想节省一些时间. 谢谢 pat_url = re.compile(r''' (?:https?://)* (?:[w]+[-w]+[.])* (?Pdomain[w-]*
我正在尝试使用以下正则表达式从文本中提取域名,但它只是产生什么,它有什么问题?我不知道这是否适合问这个“修复代码”问题,也许我应该阅读更多.我只想节省一些时间.
谢谢

pat_url = re.compile(r'''

            (?:https?://)*

            (?:[w]+[-w]+[.])*

            (?P<domain>[w-]*[w.](com|net)([.](cn|jp|us))*[/]*)

            ''')

print re.findall(pat_url,"http://www.google.com/abcde")

我希望输出为google.com

解决方法

不要使用正则表达式.请改用urlparse标准库.它更直接,更容易阅读/维护.

http://docs.python.org/library/urlparse.html

(编辑:李大同)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

    推荐文章
      热点阅读