正则提取html网页中字符串
发布时间:2020-12-14 06:39:30 所属栏目:百科 来源:网络整理
导读:方式一: RULES = [ [ r'style[sS]*?/style' , '' ],[ r'script[sS]*?/script' ,128);"> r'/(div|h|p)' ,128);"> ' n ' ],128);"> r'br.*?' ,128);"> r'[^]+?' ,128);"> r'nbsp;' ,128);"> ' ' ],128);"> r'amp;' ,128);"> '' ],128);"> r'lt;' ,128);"
方式一: RULES = [ [r'<style[sS]*?</style>',''],[r'<script[sS]*?</script>',128);">r'</(div|h|p)>',128);">'n'],128);">r'<br.*?>',128);">r'<[^>]+?>',128);">r' ',128);">' '],128);">r'&',128);">'&'],128);">r'<',128);">'<'],128);">r'>',128);">'>'],128);">r'"',128);">'"'],128);">r'^[ns]*',128);">r'^s+',128);">r'^[sS]*?Description',128);">r'Payment[sS]*$',] result = reduce(lambda desc,rule: re.sub(rule[0],rule[1],desc,flags=re.I | re.M),RULES,description).strip() print(result) 方式二: result = description result = re.sub('',result,153);">flags=re.I | re.M) ',128);">' ',128);">'&',128);">'<',128);">'>',128);">'"',128);">r'Payment.*?$',255);">result = result.strip() print(result) (编辑:李大同) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |