如何从正则表达式类中获取可匹配字符列表
发布时间:2020-12-13 21:53:03 所属栏目:百科 来源:网络整理
导读:给定一个正则表达式字符类/集,如何获得所有匹配字符的列表(在 python 3中).例如.: [dA-C] 应该给 ['0','1','2','3','4','5','6','7','8','9','A','B','C'] 我认为你要找的是 string.printable ,它返回Python中所有可打印的字符.例如: import string strin
给定一个正则表达式字符类/集,如何获得所有匹配字符的列表(在
python 3中).例如.:
[dA-C] 应该给 ['0','1','2','3','4','5','6','7','8','9','A','B','C']
我认为你要找的是
string.printable ,它返回Python中所有可打印的字符.例如:
>>> import string >>> string.printable '0123456789abcdefghijklmnopqrstuvwxyzABCDEFGHIJKLMNOPQRSTUVWXYZ!"#$%&'()*+,-./?1;<=>?@[]^_`{|}~ tnrx0bx0c' 现在要查看正则表达式满足的内容,您可以: >>> import re >>> x = string.printable >>> pattern = r'[dA-C]' >>> print(re.findall(pattern,x)) ['0','C'] string.printable是数字,字母,标点符号和空格的组合.另请查看String Constants以获取string模块可用常量的完整列表. 如果您需要所有unicode字符的列表,您可以: import sys unicode_list = [chr(i) for i in range(sys.maxunicode)] 注意:这将是一个巨大的列表,并且控制台可能会卡住一段时间以给出结果作为sys.maxunicode的值是: >>> sys.maxunicode 1114111 如果您正在处理某些特定的unicode格式,请参阅Unicode Character Ranges以限制您感兴趣的范围. (编辑:李大同) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |