加入收藏 | 设为首页 | 会员中心 | 我要投稿 李大同 (https://www.lidatong.com.cn/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 大数据 > 正文

perl – 如何检测格式错误的UTF字符

发布时间:2020-12-15 22:00:35 所属栏目:大数据 来源:网络整理
导读:我想使用SQL * Loader加载数据时,使用Perl脚本检测并替换格式不正确的UTF-8字符空格.我该怎么做? 解决方法 考虑 Python它允许使用用户定义的错误处理程序来扩展编解码器,因此您可以用任何您想要的代码替换不可编码的字节. import codecscodecs.register_err
我想使用SQL * Loader加载数据时,使用Perl脚本检测并替换格式不正确的UTF-8字符空格.我该怎么做?

解决方法

考虑 Python它允许使用用户定义的错误处理程序来扩展编解码器,因此您可以用任何您想要的代码替换不可编码的字节.
import codecs
codecs.register_error('spacer',lambda ex: (u' ',ex.start + 1))
s = 'spamxb0xc0eggsxd0bacon'.decode('utf8','spacer')
print s.encode('utf8')

打印:

spam  eggs bacon

(编辑:李大同)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

    推荐文章
      热点阅读