加入收藏 | 设为首页 | 会员中心 | 我要投稿 李大同 (https://www.lidatong.com.cn/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 百科 > 正文

(grep)正则表达式匹配非ASCII字符?

发布时间:2020-12-14 00:37:14 所属栏目:百科 来源:网络整理
导读:在Linux上,我有一个包含大量文件的目录。其中一些有非ASCII字符,但它们都是有效的 UTF-8.一个程序有一个错误,阻止它使用非ASCII文件名,我必须找出有多少受到影响。我将这样做与find,然后做一个 grep打印非ASCII字符,然后做一个wc -l来找到该数字。它不
在Linux上,我有一个包含大量文件的目录。其中一些有非ASCII字符,但它们都是有效的 UTF-8.一个程序有一个错误,阻止它使用非ASCII文件名,我必须找出有多少受到影响。我将这样做与find,然后做一个 grep打印非ASCII字符,然后做一个wc -l来找到该数字。它不必是grep;我可以使用任何标准的Unix regular expression,如 Perl, sed, AWK等。

但是,是否有一个正则表达式“任何字符不是ASCII字符”?

这将匹配单个非ASCII字符:
[^x00-x7F]

这是一个有效的PCRE(Perl兼容的正则表达式)。

你也可以使用POSIX shorthands:

> [[:ascii:]] – 匹配单个ASCII字符
> [^ [:ascii:]] – 匹配单个非ASCII字符

[^ [:print:]]可能就足够了。**

(编辑:李大同)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

    推荐文章
      热点阅读