各位大神,本人对网络爬虫一点都不懂,求一个列子,要这样的,比如是文章的话,要获取标题,内容,然后如果有超链接,继续往下爬,深度控制在两层,求大神给一个...
------解决思路----------------------
搜索 spider java
------解决思路----------------------
Nutch :一个开源Java 实现的搜索引擎
------解决思路----------------------
简单的话,自己写一个就是了呗,你可以去看看jsoup
------解决思路----------------------
可以到网上搜,如果技术可以 可以自己写个
------解决思路----------------------
一般用Python写爬虫。代码估计只要Java的1/5就够了。
------解决思路----------------------
以前写的扫描域名的程序,思路差不多,你可以参考下,链接为源码
http://download.csdn.net/detail/weinianjie1/4972941