当前位置: 代码迷 >> .NET分析设计 >> 广域网爬虫,该如何解决
  详细解决方案

广域网爬虫,该如何解决

热度:1483   发布时间:2013-02-25 00:00:00.0
广域网爬虫
问各位大侠:给你一亿个网站URL,我要收集到所有网站关于公司信息的属性(联系人、电话等等)?
望各位给出设计思路或是代码

------解决方案--------------------------------------------------------
这个也忒猛了
这个怎么抓?
一亿个网站没有共同点,获取页面信息搜索“联系我们” or “联系电话”????

不懂,帮顶吧
------解决方案--------------------------------------------------------
探讨

这个也忒猛了
这个怎么抓?
一亿个网站没有共同点,获取页面信息搜索“联系我们” or “联系电话”????

不懂,帮顶吧
  相关解决方案