正则提取html网页中字符串

发布时间：2020-12-14 06:39:30 所属栏目：百科来源：网络整理

导读：方式一： RULES = [ [ r'style[sS]*?/style' , '' ],[ r'script[sS]*?/script' ,128);"> r'/(div|h|p)' ,128);"> ' n ' ],128);"> r'br.*?' ,128);"> r'[^]+?' ,128);"> r'nbsp;' ,128);"> ' ' ],128);"> r'amp;' ,128);"> '' ],128);"> r'lt;' ,128);"

方式一：

RULES = [
    [r'<style[sS]*?</style>',''],[r'<script[sS]*?</script>',128);">r'</(div|h|p)>',128);">'n'],128);">r'<br.*?>',128);">r'<[^>]+?>',128);">r'&nbsp;',128);">' '],128);">r'&amp;',128);">'&'],128);">r'&lt;',128);">'<'],128);">r'&gt;',128);">'>'],128);">r'&quot;',128);">'"'],128);">r'^[ns]*',128);">r'^s+',128);">r'^[sS]*?Description',128);">r'Payment[sS]*$',]
result = reduce(lambda desc,rule: re.sub(rule[0],rule[1],desc,flags=re.I | re.M),RULES,description).strip()
print(result)

方式二：

result = description
result = re.sub('',result,153);">flags=re.I | re.M)
',128);">' ',128);">'&',128);">'<',128);">'>',128);">'"',128);">r'Payment.*?$',255);">result = result.strip()

print(result)

（编辑：李大同）

【声明】本站内容均来自网络，其相关言论仅代表作者个人观点，不代表本站立场。若无意侵犯到您的权利，请及时与联系站长删除相关内容!