Java UTF-8到ASCII转换与补充
发布时间:2020-12-14 05:06:39 所属栏目:Java 来源:网络整理
导读:我们接受UTF-8字符串中的各种国家字符输入,我们需要将它们转换成输出的ASCII字符串以供一些遗留使用. (我们不接受中国和日本的字符,只有欧洲语言) 我们有一个小的实用程序来摆脱所有的变音符号: public static final String toBaseCharacters(final String
我们接受UTF-8字符串中的各种国家字符输入,我们需要将它们转换成输出的ASCII字符串以供一些遗留使用. (我们不接受中国和日本的字符,只有欧洲语言)
我们有一个小的实用程序来摆脱所有的变音符号: public static final String toBaseCharacters(final String sText) { if (sText == null || sText.length() == 0) return sText; final char[] chars = sText.toCharArray(); final int iSize = chars.length; final StringBuilder sb = new StringBuilder(iSize); for (int i = 0; i < iSize; i++) { String sLetter = new String(new char[] { chars[i] }); sLetter = Normalizer.normalize(sLetter,Normalizer.Form.NFC); try { byte[] bLetter = sLetter.getBytes("UTF-8"); sb.append((char) bLetter[0]); } catch (UnsupportedEncodingException e) { } } return sb.toString(); } 问题是如何替代所有德国锋利(?,?,?)和其他通过上述标准化方法的字符,其补充(在?的情况下,补充可能是“ss”,如果od?补充将是“D”或“Dj”). 有没有一些简单的方法来做,没有百万的.replaceAll()调用? 所以例如:?onardan= Djonardan,Bla?= Blass等等. 我们可以用空格替换所有“有问题的”字符,但是要避免这样做,使输出与输入尽可能相似. 谢谢你的答案, 博佐 解决方法
如果你只是支持欧洲,拉丁语的语言,大约100左右就够了这绝对可行:抓住Latin-1 Supplement和Latin Extended-A的Unicode charts,并开始String.replace派对. (编辑:李大同) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |
相关内容
- java – JProgressBar上的自定义画家
- java – 是否存在Abstract类优于Interface的情况
- 基于Netty和SpringBoot实现一个轻量级RPC框架-Client端请求
- java – Maven不生成“persistence.xml”文件
- java – 如何从XML Spring调度配置到注释/代码配置?
- java – lambda表达式如何与Predicate一起使用?
- LeetCode 66. 加一(java)
- JAVA – 返回接口列表
- java – 哪个更快,equalsIgnoreCase或compareToIgnoreCase
- Java concurrency之AtomicLongFieldUpdater原子类_动力节点