问题描述
您好我想使用python脚本比较两个网页。 我怎么能实现它? 提前致谢!
1楼
首先,您要检索两个网页。
你可以使用wget,urlretrieve等:
其次,你想“比较”页面。 Chinmay指出,您可以使用“差异”工具。 您还可以对这两个页面进行关键字分析:
- 解析页面中的所有关键字。 例如,
-
可选择使用以下内容的词语“词干”:
- 使用一些数学来比较两个页面的关键词,例如术语频率 - 逆文档频率: : ,其中包含一些python工具: :
2楼
比较是什么意思? 如果您只是想找到两个文件之间的差异,请尝试 ,它是标准Python库的一部分。