正则表达式 – 匹配Unicode控制字符,除了三个正则表达式
发布时间:2020-12-14 05:58:51 所属栏目:百科 来源:网络整理
导读:我需要得到一个正则表达式,它匹配除回车符(0x0d),换行符(0x0a)和制表符(0x09)之外的所有Unicode控制字符.目前,我的正则表达式如下所示: /p{C}/u 我现在只需要定义这三个例外. 解决方法 我认为你可以在这里使用负面预测,结合角色类. /(?![x{000d}x{000a}
我需要得到一个正则表达式,它匹配除回车符(0x0d),换行符(0x0a)和制表符(0x09)之外的所有Unicode控制字符.目前,我的正则表达式如下所示:
/p{C}/u 我现在只需要定义这三个例外. 解决方法
我认为你可以在这里使用负面预测,结合角色类.
/(?![x{000d}x{000a}x{0009}])p{C}/u 这样做是使用负向前瞻来断言该字符不是字符类中指定的字符之一.然后它再次遍历角色以使其与任何控制角色相匹配. 我使用perl语法指定单个unicode点. 关于外观here的更多讨论 (请注意,这尚未经过测试,但我认为这个概念是正确的.) (编辑:李大同) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |