当前位置: 代码迷 >> J2SE >> 相关网页信息抽取
  详细解决方案

相关网页信息抽取

热度:73   发布时间:2016-04-23 22:03:15.0
有关网页信息抽取
我现在有一个想法,就是通过java中的某一类传出一个搜索关键词,然后通过后台访问的形式(或者不应该这么描述,就是不跳转到浏览器去搜索)在某一个特定的网站或者随意的一个网站搜索,然后再抓取我搜索到的网页信息,这个功能可以实现么?还有就是怎么实现?给出确实可行的思路或者java源码都行

------解决方案--------------------
这不就是搜索引擎吗。写一个爬虫程序不停爬取网站信息,建立信息库,查询的时候直接在信息库里查询。
但是搜索引擎的具体技术那还是相当的复杂的,你可以看看lucene。
  相关解决方案