用于文本归一化的Java库
发布时间:2020-12-14 16:34:46 所属栏目:Java 来源:网络整理
导读:我正在寻找允许文本“归一化”的 java库.类似于 Normalizer,但更宽(像 utf8proc LUMP这样的东西). 它应该将所有类型的特殊字符替换为ASCII等价物(如果可能的话).所有变体的空间代码32,所有变体的minuses(长,短,薄等)到代码45等等. 解决方法 你应该看看 CLDR
我正在寻找允许文本“归一化”的
java库.类似于
Normalizer,但更宽(像
utf8proc LUMP这样的东西).
它应该将所有类型的特殊字符替换为ASCII等价物(如果可能的话).所有变体的空间代码32,所有变体的minuses(长,短,薄等)到代码45等等. 解决方法
你应该看看
CLDR
Latin-ASCII变形,它将在
ICU 4.6
(编辑:李大同) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |