加入收藏 | 设为首页 | 会员中心 | 我要投稿 李大同 (https://www.lidatong.com.cn/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 百科 > 正文

使用Ruby删除某些HTML标记

发布时间:2020-12-17 01:30:16 所属栏目:百科 来源:网络整理
导读:如何在 Ruby中按名称删除某些HTML标记? 例如: string = "!DOCTYPE htmlhtmlbodyh1My First Heading/h1pMy first paragraph./p/body/html"string.magic_method("h1") #= "!DOCTYPE htmlhtmlbodypMy first paragraph./p/body/html" 我写了一些正则表达式,但
如何在 Ruby中按名称删除某些HTML标记?

例如:

string = "<!DOCTYPE html><html><body><h1>My First Heading</h1><p>My first paragraph.</p></body></html>"

string.magic_method("h1") #=> "<!DOCTYPE html><html><body><p>My first paragraph.</p></body></html>"

我写了一些正则表达式,但想知道是否有一个库或本机方法可以做同样的事情.

解决方法

使用 Nokogiri

require 'nokogiri'

doc = Nokogiri::HTML <<-_HTML_
<!DOCTYPE html><html><body><h1>My First Heading</h1><p>My first paragraph.</p></body></html>
_HTML_

doc.at('h1')
# => #(Element:0x4d2f006 {
#      name = "h1",#      children = [ #(Text "My First Heading")]
#      })

doc.at('h1').unlink
puts doc.to_html
# >> <!DOCTYPE html>
# >> <html><body><p>My first paragraph.</p></body></html>

(编辑:李大同)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

    推荐文章
      热点阅读