正则提取编码解码问题

发布时间：2020-12-14 00:57:01 所属栏目：百科来源：网络整理

导读：p = re.compile(u'《(.*?)》') # 使用unicode编码 vid_drama_list = p.findall(info_util.get_id_field(vid,"name_cn").decode("utf8")) # utf8解码为unicode vid_drama_list = [x.encode("utf8") for x in vid_drama_list] # unicode再编码为utf8，防止输出

p = re.compile(u'《(.*?)》') # 使用unicode编码

vid_drama_list = p.findall(info_util.get_id_field(vid,"name_cn").decode("utf8")) # utf8解码为unicode

vid_drama_list = [x.encode("utf8") for x in vid_drama_list] # unicode再编码为utf8，防止输出乱码。

注意：

pattern和string中，都需要使用unicode，否则编码不同，结果有误（如：《推拿》，《一切都好》等）。

（编辑：李大同）

【声明】本站内容均来自网络，其相关言论仅代表作者个人观点，不代表本站立场。若无意侵犯到您的权利，请及时与联系站长删除相关内容!