当前位置: 代码迷 >> Java Web开发 >> 怎么用正则表达式截取网页内容的有关问题
  详细解决方案

怎么用正则表达式截取网页内容的有关问题

热度:8564   发布时间:2013-02-25 21:23:03.0
如何用正则表达式截取网页内容的问题!
比如页面内容如下:


页面开始
<!-- 从这里开始截取 -->
需要被截取出来的部分
<!-- 截取到这里 -->
页面其他部分
页面结束


如何用正则表达式 截取出 "<!-- 从这里开始截取 -->" 到 "<!-- 截取到这里 -->" 之间的内容?
(页面换行因素也得考虑进去啊)
谢谢

------解决方案--------------------------------------------------------
Java code
            String str="页面开始" +                    "<!-- 从这里开始截取 -->" +                    "需要被截取出来的部分" +                    "<!-- 截取到这里 -->" +                    "页面其他部分页面结束";            Pattern p = Pattern.compile("<!-- 从这里开始截取 -->(.*?)<!-- 截取到这里 -->");            Matcher m = p.matcher(str);            while(m.find()){                System.out.println(m.group(1));            }
------解决方案--------------------------------------------------------
探讨

Java code
String str="页面开始" +
"<!-- 从这里开始截取 -->" +
"需要被截取出来的部分" +
"<!-- 截取到这里 -->" +
"页面其他部分页面结束";
……