加入收藏 | 设为首页 | 会员中心 | 我要投稿 李大同 (https://www.lidatong.com.cn/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 编程开发 > Java > 正文

用于文本归一化的Java库

发布时间:2020-12-14 16:34:46 所属栏目:Java 来源:网络整理
导读:我正在寻找允许文本“归一化”的 java库.类似于 Normalizer,但更宽(像 utf8proc LUMP这样的东西). 它应该将所有类型的特殊字符替换为ASCII等价物(如果可能的话).所有变体的空间代码32,所有变体的minuses(长,短,薄等)到代码45等等. 解决方法 你应该看看 CLDR
我正在寻找允许文本“归一化”的 java库.类似于 Normalizer,但更宽(像 utf8proc LUMP这样的东西).

它应该将所有类型的特殊字符替换为ASCII等价物(如果可能的话).所有变体的空间代码32,所有变体的minuses(长,短,薄等)到代码45等等.

解决方法

你应该看看 CLDR Latin-ASCII变形,它将在 ICU 4.6

(编辑:李大同)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

    推荐文章
      热点阅读