package cn.java;
import java.util.regex.Pattern;
public class HTMLUtils {
??? ???? /**
??? ????? * @param str :
??? ????? *??????????? source string
??? ????? * @param width :
??? ????? *??????????? string's byte width
??? ????? * @param ellipsis :
??? ????? *??????????? a string added to abbreviate string bottom
??? ????? * @return String Object
??? ????? *?
??? ????? */?
??? ???? public static String Html2Text(String inputString) {?
??? ???????? String htmlStr = inputString; // 含html标签的字符串?
??? ???????? String textStr = "";?
??? ???????? java.util.regex.Pattern p_script;?
??? ???????? java.util.regex.Matcher m_script;?
??? ???????? java.util.regex.Pattern p_style;?
??? ???????? java.util.regex.Matcher m_style;?
??? ???????? java.util.regex.Pattern p_html;?
??? ???????? java.util.regex.Matcher m_html;?
??? ??
??? ???????? java.util.regex.Pattern p_html1;?
??? ???????? java.util.regex.Matcher m_html1;?
??? ??
??? ???????? try {?
??? ???????????? String regEx_script = "<[\\s]*?script[^>]*?>[\\s\\S]*?<[\\s]*?\\/[\\s]*?script[\\s]*?>"; // 定义script的正则表达式{或<script[^>]*?>[\\s\\S]*?<\\/script>?
??? ???????????? // }?
??? ???????????? String regEx_style = "<[\\s]*?style[^>]*?>[\\s\\S]*?<[\\s]*?\\/[\\s]*?style[\\s]*?>"; // 定义style的正则表达式{或<style[^>]*?>[\\s\\S]*?<\\/style>?
??? ???????????? // }?
??? ???????????? String regEx_html = "<[^>]+>"; // 定义HTML标签的正则表达式?
??? ???????????? String regEx_html1 = "<[^>]+";?
??? ???????????? p_script = Pattern.compile(regEx_script, Pattern.CASE_INSENSITIVE);?
??? ???????????? m_script = p_script.matcher(htmlStr);?
??? ???????????? htmlStr = m_script.replaceAll(""); // 过滤script标签?
??? ??
??? ???????????? p_style = Pattern.compile(regEx_style, Pattern.CASE_INSENSITIVE);?
??? ???????????? m_style = p_style.matcher(htmlStr);?
??? ???????????? htmlStr = m_style.replaceAll(""); // 过滤style标签?
??? ??
??? ???????????? p_html = Pattern.compile(regEx_html, Pattern.CASE_INSENSITIVE);?
??? ???????????? m_html = p_html.matcher(htmlStr);?
??? ???????????? htmlStr = m_html.replaceAll(""); // 过滤html标签?
??? ??
??? ???????????? p_html1 = Pattern.compile(regEx_html1, Pattern.CASE_INSENSITIVE);?
??? ???????????? m_html1 = p_html1.matcher(htmlStr);?
??? ???????????? htmlStr = m_html1.replaceAll(""); // 过滤html标签?
??? ??
??? ???????????? textStr = htmlStr;?
??? ??
??? ???????? } catch (Exception e) {?
??? ???????????? System.err.println("Html2Text: " + e.getMessage());?
??? ???????? }?
??? ??
??? ???????? return textStr;// 返回文本字符串?
??? ???? }
??? ????
??? ??? public static void main(String[] args){
??? ??? ??? String s = "<p>你好</p><script>alert(\"ok\");</script>";
??? ??? ??? System.out.println(Html2Text(s));
??? ??? }????
}
详细解决方案
过滤html标签_走走转
热度:149 发布时间:2012-12-20 09:53:21.0
相关解决方案
- 访问Tomcat的url的时候如何自动调用index.html
- The requested resource (/webtest/servlet/hello.html) is not availabl 帮忙解决解决方法
- JSP 页面乱码 页面起首已设置 contentType="text/html; charset=UTF-8" pageEncoding="UTF-8"
- html js不运行有关问题
- 办公自动化系统——议程管理(用jsp+servlet+js+html+jdbc)怎样实现
- <html:text>property的有关问题
- 关于<html:text>相关的有关问题
- Struts 1.2 html:form的action和form的action区别,还有如果2个都有执行哪个解决方案
- 简单计算器(html+js),该怎么解决
- HTML 小疑点,哪位高手解决 给哪位高手分
- 嵌入JSP中的CSS显示效果和在 HTML 中的不一样.为什么.该怎么解决
- struts1 中<html:checkbox>标签的value值怎么动态赋值
- 新人求问,J2EE方向,html,css,javascript,vml要学到什么程度?解决思路
- :前台和后台开发有啥区别?还有css、html、ajax、js、jquery都有什么区别
- struts <html:file> 怎么让前面的框消失,先谢过了
- =Html.TextAreaFor的文本区域大小如何设置
- 正则表达式 提取 html 标签的内容,该如何解决
- @Html.CkEditor,该怎么处理
- string msg = (string)html.ViewData["Message"];该如何处理
- html password editbox 编码有关问题
- @Html.TextBoxFor(a => a.Title 上边有红线,说异常
- 关于伪静态,怎么配置.html
- MVC中,Html.DropDownListFor怎么绑定数据
- 为何FCKeditor会在自动生成<html>标签呢
- MVC 中得 Html.ActionLink 怎么linkText显示图片标记
- <DOCTYPE html. 这个是有什么用?该如何处理
- asp.net C# 将网页变换为.html 格式
- @Html.ActionLink 基础解决办法
- 怎么引用一个 Html 控件对象
- HTML DOM setTimeout() 跟 setInterval() 的区别 ?———急——