用于域名的python正则表达式
发布时间:2020-12-20 12:25:49 所属栏目:Python 来源:网络整理
导读:我正在尝试使用以下正则表达式从文本中提取域名,但它只是产生什么,它有什么问题?我不知道这是否适合问这个“修复代码”问题,也许我应该阅读更多.我只想节省一些时间. 谢谢 pat_url = re.compile(r''' (?:https?://)* (?:[w]+[-w]+[.])* (?Pdomain[w-]*
我正在尝试使用以下正则表达式从文本中提取域名,但它只是产生什么,它有什么问题?我不知道这是否适合问这个“修复代码”问题,也许我应该阅读更多.我只想节省一些时间.
谢谢 pat_url = re.compile(r''' (?:https?://)* (?:[w]+[-w]+[.])* (?P<domain>[w-]*[w.](com|net)([.](cn|jp|us))*[/]*) ''') print re.findall(pat_url,"http://www.google.com/abcde") 我希望输出为google.com 解决方法
不要使用正则表达式.请改用urlparse标准库.它更直接,更容易阅读/维护.
http://docs.python.org/library/urlparse.html (编辑:李大同) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |