正则提取编码解码问题
发布时间:2020-12-14 00:57:01 所属栏目:百科 来源:网络整理
导读:p = re.compile(u'《(.*?)》') # 使用unicode编码 vid_drama_list = p.findall(info_util.get_id_field(vid,"name_cn").decode("utf8")) # utf8解码为unicode vid_drama_list = [x.encode("utf8") for x in vid_drama_list] # unicode再编码为utf8,防止输出
p = re.compile(u'《(.*?)》') # 使用unicode编码 vid_drama_list = p.findall(info_util.get_id_field(vid,"name_cn").decode("utf8")) # utf8解码为unicode vid_drama_list = [x.encode("utf8") for x in vid_drama_list] # unicode再编码为utf8,防止输出乱码。 注意: pattern和string中,都需要使用unicode,否则编码不同,结果有误(如:《推拿》,《一切都好》等)。 (编辑:李大同) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |