加入收藏 | 设为首页 | 会员中心 | 我要投稿 李大同 (https://www.lidatong.com.cn/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 百科 > 正文

如何从正则表达式类中获取可匹配字符列表

发布时间:2020-12-13 21:53:03 所属栏目:百科 来源:网络整理
导读:给定一个正则表达式字符类/集,如何获得所有匹配字符的列表(在 python 3中).例如.: [dA-C] 应该给 ['0','1','2','3','4','5','6','7','8','9','A','B','C'] 我认为你要找的是 string.printable ,它返回Python中所有可打印的字符.例如: import string strin
给定一个正则表达式字符类/集,如何获得所有匹配字符的列表(在 python 3中).例如.:
[dA-C]

应该给

['0','1','2','3','4','5','6','7','8','9','A','B','C']
我认为你要找的是 string.printable,它返回Python中所有可打印的字符.例如:
>>> import string
>>> string.printable
'0123456789abcdefghijklmnopqrstuvwxyzABCDEFGHIJKLMNOPQRSTUVWXYZ!"#$%&'()*+,-./?1;<=>?@[]^_`{|}~ tnrx0bx0c'

现在要查看正则表达式满足的内容,您可以:

>>> import re
>>> x = string.printable
>>> pattern = r'[dA-C]'
>>> print(re.findall(pattern,x))
['0','C']

string.printable是数字,字母,标点符号和空格的组合.另请查看String Constants以获取string模块可用常量的完整列表.

如果您需要所有unicode字符的列表,您可以:

import sys
unicode_list = [chr(i) for i in range(sys.maxunicode)]

注意:这将是一个巨大的列表,并且控制台可能会卡住一段时间以给出结果作为sys.maxunicode的值是:

>>> sys.maxunicode
1114111

如果您正在处理某些特定的unicode格式,请参阅Unicode Character Ranges以限制您感兴趣的范围.

(编辑:李大同)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

    推荐文章
      热点阅读