当前位置: 代码迷 >> 综合 >> 火车头采集器 采集Ajax页面 一页自动刷新列表的 网站 xpath 标签
  详细解决方案

火车头采集器 采集Ajax页面 一页自动刷新列表的 网站 xpath 标签

热度:84   发布时间:2024-01-21 09:02:55.0

对于采用ajax技术的页面,每次刷新或者向后滚动鼠标既可以换到新的列表,而浏览器中地址没有变化。

此时采用的方法为Fiddler查看或者类似工具,找到真实的页面地址即可。

另外可以在采集中单独添加标签,与标题,内容同等重要,只是主要标签有先后顺序之分,有些内容地址复杂的可用xpath工具自动提取

采集到的标签,作为属性之一,在后面的文件命名等极为重要

  相关解决方案