package com.web.test;
import java.io.*;
import java.util.*;
import javax.swing.text.*;
import javax.swing.text.html.*;
import javax.swing.text.html.parser.*;
import javax.swing.text.html.HTMLEditorKit.ParserCallback;
/**
* 过滤image
* @author chenxiaobing
*
*/
public class HTMLParser extends ParserCallback
{ // 继承ParserCallback,解析结果驱动这些回调方法
protected String base;
protected boolean isImg = false;
protected boolean isParagraph = false;
protected static Vector<String> element = new Vector<String>();
protected static String paragraphText = new String();
public HTMLParser()
{
}
public static String getParagraphText()
{
return paragraphText;
}
public void handleComment(char[] data, int pos)
{
}
public void handleEndTag(HTML.Tag t, int pos)
{
if (t == HTML.Tag.P)
{
if (isParagraph)
{
isParagraph = false;
}
}
else if (t == HTML.Tag.IMG)
{
if (isImg)
{
isImg = false;
}
}
}
public void handleError(String errorMsg, int pos)
{
}
public void handleSimpleTag(HTML.Tag t, MutableAttributeSet a, int pos)
{
handleStartTag(t, a, pos);
}
public void handleStartTag(HTML.Tag t, MutableAttributeSet a, int pos)
{
if (t == HTML.Tag.P)
{
isParagraph = true;
}
else if ((t == HTML.Tag.IMG))
{
String src = (String) a.getAttribute(HTML.Attribute.SRC);
if (src != null)
{
element.addElement(src);
isImg = true;
}
}
}
public void handleText(char[] data, int pos)
{
if (isParagraph)
{
String tempParagraphText = new String(data);
if (paragraphText != null)
{
element.addElement(tempParagraphText);
;
}
}
}
private static void startParse(String sHtml)
{
try
{
ParserDelegator ps = new ParserDelegator();// 负责每次在调用其 parse
// 方法时启动一个新的
// DocumentParser
HTMLEditorKit.ParserCallback parser = new HTMLParser();// 解析结果驱动这些回调方法。
ps.parse(new StringReader(sHtml), parser, true);// 解析给定的流并通过解析的结果驱动给定的回调。
// System.out.println(getParagraphText());
Vector link = element;
for (int i = 0; i < link.size(); i++)
{
System.out.println("----haha-----");
System.out.println(link.get(i));
}
}
catch (Exception e)
{
e.printStackTrace();
}
}
public static void main(String args[])
{
try
{
String filename = "E:/HTML/html002.html";
BufferedReader brd = new BufferedReader(new FileReader(filename));
char[] str = new char[50000];
brd.read(str);
String sHtml = new String(str);
startParse(sHtml);
}
catch (Exception e)
{
e.printStackTrace();
}
}
}
详细解决方案
解析html获取imag途径
热度:165 发布时间:2012-07-20 10:38:30.0
相关解决方案
- JSP 页面乱码 页面起首已设置 contentType="text/html; charset=UTF-8" pageEncoding="UTF-8"
- html js不运行有关问题
- <html:text>property的有关问题
- 关于<html:text>相关的有关问题
- 简单计算器(html+js),该怎么解决
- HTML 小疑点,哪位高手解决 给哪位高手分
- 嵌入JSP中的CSS显示效果和在 HTML 中的不一样.为什么.该怎么解决
- struts1 中<html:checkbox>标签的value值怎么动态赋值
- 新人求问,J2EE方向,html,css,javascript,vml要学到什么程度?解决思路
- :前台和后台开发有啥区别?还有css、html、ajax、js、jquery都有什么区别
- struts <html:file> 怎么让前面的框消失,先谢过了
- =Html.TextAreaFor的文本区域大小如何设置
- 正则表达式 提取 html 标签的内容,该如何解决
- @Html.CkEditor,该怎么处理
- string msg = (string)html.ViewData["Message"];该如何处理
- html password editbox 编码有关问题
- @Html.TextBoxFor(a => a.Title 上边有红线,说异常
- 关于伪静态,怎么配置.html
- MVC中,Html.DropDownListFor怎么绑定数据
- 为何FCKeditor会在自动生成<html>标签呢
- MVC 中得 Html.ActionLink 怎么linkText显示图片标记
- HTML DOM setTimeout() 跟 setInterval() 的区别 ?———急——
- 怎么自动执行<a href="document.html" target="parent">my document</a> 呢
- MVC2 怎么实现伪静态 .html
- MVC中@Html.TextBox怎么使用
- CSDN 你是怎么做到的呢 html?xxx
- 问一个关于去除<html>标签的有关问题
- webserver的“text/html;charset=utf-8”,但应为“text/xml”异常
- mvc @using (Html.BeginForm()),该怎么处理
- @Html.TextBoxfor的有关问题