加入收藏 | 设为首页 | 会员中心 | 我要投稿 李大同 (https://www.lidatong.com.cn/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 百科 > 正文

如何使用正则表达式删除Java中的SUB(HEX:1A)控制字符?

发布时间:2020-12-14 05:47:06 所属栏目:百科 来源:网络整理
导读:我有一个包含错误数据的文件(一些随机的SUB控制字符本身……它们不是字形的一部分)我试图使用正则表达式搜索模式删除它们: Text to Find: x1aReplace with: 这删除了我的SUB字符,但它也搞乱了我的其他具有重音符号的字符(具体为é和í). 是否有正则表达式
我有一个包含错误数据的文件(一些随机的SUB控制字符本身……它们不是字形的一部分)我试图使用正则表达式搜索模式删除它们:

Text to Find: x1a
Replace with:

这删除了我的SUB字符,但它也搞乱了我的其他具有重音符号的字符(具体为é和í).

是否有正则表达式将删除SUB控制字符(代码点),如果它本身? (例如,不是字形的一部分)

样本数据(用SUB控制字符替换你看到“?”的任何地方:

A,André,Fernandez
A,Daniel,O?Shea
A,Ibhlín,Flanders
A,Donny,O?'Donnell
A,Spencer,O'Maley

示例数据输出如果我使用我当前的正则表达式:

A,Andr?,OShea
A,Ibhl?n,O'Donnell
A,O'Maley

期望的数据输出

A,O'Maley

解决方法

Position        Decimal        Name                     Appearance   
 0x241A          9242           SYMBOL FOR SUBSTITUTE    ?

unicode chart

也许这可以帮到你.

随之而来.

Regex Unicode

(编辑:李大同)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

    推荐文章
      热点阅读