Java实现将任何编码方式的txt文件以UTF-8编码方式转存
发布时间:2020-12-14 06:32:29 所属栏目:Java 来源:网络整理
导读:本文利用JDK中的BufferedReader和BufferedWriter实现将任何编码方式的txt文件以UTF-8编码方式转存。 UTF-8(8-bit Unicode Transformation Format)是一种针对Unicode的可变长度字符编码,又称万国码,由Ken Thompson于1992年创建。现在已经标准化为RFC 3629
本文利用JDK中的BufferedReader和BufferedWriter实现将任何编码方式的txt文件以UTF-8编码方式转存。 UTF-8(8-bit Unicode Transformation Format)是一种针对Unicode的可变长度字符编码,又称万国码,由Ken Thompson于1992年创建。现在已经标准化为RFC 3629。UTF-8用1到6个字节编码Unicode字符。用在网页上可以统一页面显示中文简体繁体及其它语言(如英文,日文,韩文)。UTF-8最大的优势是可以避免乱码问题。 本方法首先判断txt文件的编码方式,然后按照其编码方式按行读取,再按行以UTF-8的编码写入。其中借助EncodingDetect类检测txt文件的编码方式。
saveAsUTF8(String inputFileUrl,String outputFileUrl) ="inputFileEncode===" += InputStreamReader(= OutputStreamWriter( FileOutputStream(outputFileUrl),"UTF-8" ((line = bufferedReader.readLine()) != + "rn"="outputFileEncode===" +"txt文件格式转换完成"
?测试代码: String inputFileUrl = "C:UsersAdministratorDesktop傲慢与偏见.txt"= "C:UsersAdministratorDesktoputf8傲慢与偏见.txt"
(编辑:李大同) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |