当前位置: 代码迷 >> .NET分析设计 >> 广域网爬虫解决思路
  详细解决方案

广域网爬虫解决思路

热度:3442   发布时间:2013-02-25 00:00:00.0
广域网爬虫
问各位大侠:给你一亿个网站URL,我要收集到所有网站关于公司信息的属性(联系人、电话等等)?
望各位给出设计思路或是代码
------解决方案--------------------------------------------------------
这个也忒猛了
这个怎么抓?
一亿个网站没有共同点,获取页面信息搜索“联系我们” or “联系电话”????

不懂,帮顶吧
------解决方案--------------------------------------------------------
引用:
这个也忒猛了
这个怎么抓?
一亿个网站没有共同点,获取页面信息搜索“联系我们” or “联系电话”????

不懂,帮顶吧
如果是外文网站就是"Contact Us Tel"了吧
  相关解决方案