perl – 如何检测格式错误的UTF字符
发布时间:2020-12-15 22:00:35 所属栏目:大数据 来源:网络整理
导读:我想使用SQL * Loader加载数据时,使用Perl脚本检测并替换格式不正确的UTF-8字符空格.我该怎么做? 解决方法 考虑 Python它允许使用用户定义的错误处理程序来扩展编解码器,因此您可以用任何您想要的代码替换不可编码的字节. import codecscodecs.register_err
我想使用SQL * Loader加载数据时,使用Perl脚本检测并替换格式不正确的UTF-8字符空格.我该怎么做?
解决方法
考虑
Python它允许使用用户定义的错误处理程序来扩展编解码器,因此您可以用任何您想要的代码替换不可编码的字节.
import codecs codecs.register_error('spacer',lambda ex: (u' ',ex.start + 1)) s = 'spamxb0xc0eggsxd0bacon'.decode('utf8','spacer') print s.encode('utf8') 打印: spam eggs bacon (编辑:李大同) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |