加入收藏 | 设为首页 | 会员中心 | 我要投稿 李大同 (https://www.lidatong.com.cn/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 编程开发 > Java > 正文

java过滤html标签获取纯文本信息的实例

发布时间:2020-12-14 19:45:48 所属栏目:Java 来源:网络整理
导读:如下所示: package com.lyt.base.util;import java.util.regex.Pattern;public class FilterHtmlUtil {public static String Html2Text(String inputString){ String htmlStr = inputString; //含html标签的字符串 String textStr =""; java.util.regex.Pat

如下所示:

package com.lyt.base.util;

import java.util.regex.Pattern;

public class FilterHtmlUtil {
public static String Html2Text(String inputString){
  String htmlStr = inputString; //含html标签的字符串
  String textStr ="";
  java.util.regex.Pattern p_script;
  java.util.regex.Matcher m_script;
  java.util.regex.Pattern p_style;
  java.util.regex.Matcher m_style;
  java.util.regex.Pattern p_html;
  java.util.regex.Matcher m_html;
  try{
     String regEx_script = "<[s]*?script[^>]*?>[sS]*?<[s]*?/[s]*?script[s]*?>"; //定义script的正则表达式{或<script[^>]*?>[sS]*?</script> }
     String regEx_style = "<[s]*?style[^>]*?>[sS]*?<[s]*?/[s]*?style[s]*?>"; //定义style的正则表达式{或<style[^>]*?>[sS]*?</style> }
     String regEx_html = "<[^>]+>"; //定义HTML标签的正则表达式
     p_script = Pattern.compile(regEx_script,Pattern.CASE_INSENSITIVE);
     m_script = p_script.matcher(htmlStr);
     htmlStr = m_script.replaceAll(""); //过滤script标签
     p_style = Pattern.compile(regEx_style,Pattern.CASE_INSENSITIVE);
     m_style = p_style.matcher(htmlStr);
     htmlStr = m_style.replaceAll(""); //过滤style标签
     p_html = Pattern.compile(regEx_html,Pattern.CASE_INSENSITIVE);
     m_html = p_html.matcher(htmlStr);
     htmlStr = m_html.replaceAll(""); //过滤html标签
     textStr = htmlStr;
  }catch(Exception e){
  e.printStackTrace();
  }
  return textStr;//返回文本字符串
} 
}

以上这篇java过滤html标签获取纯文本信息的实例就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持编程小技巧。

您可能感兴趣的文章:

  • Java实现简单文件过滤器功能
  • Java编程实现基于用户的协同过滤推荐算法代码示例
  • Java实现DFA算法对敏感词、广告词过滤功能示例
  • Java Web实现session过期后自动跳转到登陆页功能【基于过滤器】
  • 基于java servlet过滤器和监听器(详解)
  • JavaWeb Servlet中Filter过滤器的详解
  • java并发访问重复请求过滤问题

(编辑:李大同)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

    推荐文章
      热点阅读