java过滤html标签获取纯文本信息的实例

发布时间：2020-12-14 19:45:48 所属栏目：Java 来源：网络整理

导读：如下所示： package com.lyt.base.util;import java.util.regex.Pattern;public class FilterHtmlUtil {public static String Html2Text(String inputString){ String htmlStr = inputString; //含html标签的字符串 String textStr =""; java.util.regex.Pat

如下所示：

package com.lyt.base.util;

import java.util.regex.Pattern;

public class FilterHtmlUtil {
public static String Html2Text(String inputString){
  String htmlStr = inputString; //含html标签的字符串
  String textStr ="";
  java.util.regex.Pattern p_script;
  java.util.regex.Matcher m_script;
  java.util.regex.Pattern p_style;
  java.util.regex.Matcher m_style;
  java.util.regex.Pattern p_html;
  java.util.regex.Matcher m_html;
  try{
     String regEx_script = "<[s]*?script[^>]*?>[sS]*?<[s]*?/[s]*?script[s]*?>"; //定义script的正则表达式{或<script[^>]*?>[sS]*?</script> }
     String regEx_style = "<[s]*?style[^>]*?>[sS]*?<[s]*?/[s]*?style[s]*?>"; //定义style的正则表达式{或<style[^>]*?>[sS]*?</style> }
     String regEx_html = "<[^>]+>"; //定义HTML标签的正则表达式
     p_script = Pattern.compile(regEx_script,Pattern.CASE_INSENSITIVE);
     m_script = p_script.matcher(htmlStr);
     htmlStr = m_script.replaceAll(""); //过滤script标签
     p_style = Pattern.compile(regEx_style,Pattern.CASE_INSENSITIVE);
     m_style = p_style.matcher(htmlStr);
     htmlStr = m_style.replaceAll(""); //过滤style标签
     p_html = Pattern.compile(regEx_html,Pattern.CASE_INSENSITIVE);
     m_html = p_html.matcher(htmlStr);
     htmlStr = m_html.replaceAll(""); //过滤html标签
     textStr = htmlStr;
  }catch(Exception e){
  e.printStackTrace();
  }
  return textStr;//返回文本字符串
} 
}

以上这篇java过滤html标签获取纯文本信息的实例就是小编分享给大家的全部内容了，希望能给大家一个参考，也希望大家多多支持编程小技巧。

您可能感兴趣的文章:

Java实现简单文件过滤器功能
Java编程实现基于用户的协同过滤推荐算法代码示例
Java实现DFA算法对敏感词、广告词过滤功能示例
Java Web实现session过期后自动跳转到登陆页功能【基于过滤器】
基于java servlet过滤器和监听器(详解)
JavaWeb Servlet中Filter过滤器的详解
java并发访问重复请求过滤问题

（编辑：李大同）

【声明】本站内容均来自网络，其相关言论仅代表作者个人观点，不代表本站立场。若无意侵犯到您的权利，请及时与联系站长删除相关内容!