用于域名的python正则表达式

发布时间：2020-12-20 12:25:49 所属栏目：Python 来源：网络整理

导读：我正在尝试使用以下正则表达式从文本中提取域名,但它只是产生什么,它有什么问题？我不知道这是否适合问这个“修复代码”问题,也许我应该阅读更多.我只想节省一些时间. 谢谢 pat_url = re.compile(r''' (?:https?://)* (?:[w]+[-w]+[.])* (?Pdomain[w-]*

我正在尝试使用以下正则表达式从文本中提取域名,但它只是产生什么,它有什么问题？我不知道这是否适合问这个“修复代码”问题,也许我应该阅读更多.我只想节省一些时间.
谢谢

pat_url = re.compile(r'''

            (?:https?://)*

            (?:[w]+[-w]+[.])*

            (?P<domain>[w-]*[w.](com|net)([.](cn|jp|us))*[/]*)

            ''')

print re.findall(pat_url,"http://www.google.com/abcde")

我希望输出为google.com

解决方法

不要使用正则表达式.请改用urlparse标准库.它更直接,更容易阅读/维护.

http://docs.python.org/library/urlparse.html

（编辑：李大同）

【声明】本站内容均来自网络，其相关言论仅代表作者个人观点，不代表本站立场。若无意侵犯到您的权利，请及时与联系站长删除相关内容!