加入收藏 | 设为首页 | 会员中心 | 我要投稿 李大同 (https://www.lidatong.com.cn/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 百科 > 正文

正则提取html网页中字符串

发布时间:2020-12-14 06:39:30 所属栏目:百科 来源:网络整理
导读:方式一: RULES = [ [ r'style[sS]*?/style' , '' ],[ r'script[sS]*?/script' ,128);"> r'/(div|h|p)' ,128);"> ' n ' ],128);"> r'br.*?' ,128);"> r'[^]+?' ,128);"> r'nbsp;' ,128);"> ' ' ],128);"> r'amp;' ,128);"> '' ],128);"> r'lt;' ,128);"

方式一:

RULES = [
    [r'<style[sS]*?</style>',''],[r'<script[sS]*?</script>',128);">r'</(div|h|p)>',128);">'n'],128);">r'<br.*?>',128);">r'<[^>]+?>',128);">r'&nbsp;',128);">' '],128);">r'&amp;',128);">'&'],128);">r'&lt;',128);">'<'],128);">r'&gt;',128);">'>'],128);">r'&quot;',128);">'"'],128);">r'^[ns]*',128);">r'^s+',128);">r'^[sS]*?Description',128);">r'Payment[sS]*$',]
result = reduce(lambda desc,rule: re.sub(rule[0],rule[1],desc,flags=re.I | re.M),RULES,description).strip()
print(result)

方式二:

result = description
result = re.sub('',result,153);">flags=re.I | re.M)
',128);">' ',128);">'&',128);">'<',128);">'>',128);">'"',128);">r'Payment.*?$',255);">result = result.strip()

print(result)

(编辑:李大同)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

    推荐文章
      热点阅读