如何在Nokogiri Ruby中浏览HTML,所以&仍然&而不是&
发布时间:2020-12-17 03:26:01 所属栏目:百科 来源:网络整理
导读:我有一个标题doc.at(‘head / title’).inner_html出来 amp;它应该是amp ;. 我的原始文件是: headtitleFoo Bar/title/head 但是如下所示: doc = Nokogiri::HTML.parse(file,nil,"UTF-8") doc.at('head/title')= #Nokogiri::XML::Element:0x..fdb851bea nam
我有一个标题doc.at(‘head / title’).inner_html出来& amp;它应该是& ;.
我的原始文件是: <head><title>Foo & Bar</title></head> 但是如下所示: >> doc = Nokogiri::HTML.parse(file,nil,"UTF-8") >> doc.at('head/title') => #<Nokogiri::XML::Element:0x..fdb851bea name="title" children=#<Nokogiri::XML::Text:0x..fdb850808 "Foo & Bar">> >> doc.at('head/title').inner_html => "Foo & Bar" 我不想使用Iconv或CGI: >> require 'cgi' >> CGI.unescapeHTML(doc.at('head/title').inner_html) => "Foo & Bar" 这是丑陋和不方便的. 解决方法
使用内容而不是inner_html将内容作为纯文本而不是(X)HTML.
irb(main):011:0> doc.at('head/title').content => "Foo & Bar" (编辑:李大同) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |