摘抄: http://www.google.com/support/webmasters/bin/topic.py?topic=8476
?
1. 了解有关站点地图的详情
?
在以下情况下,站点地图特别有用:
- 网站含动态内容。
- 您的网站中包含在 Googlebot 抓取过程中不易发现的网页,例如含有富 AJAX 或图片内容的网页。
- 网站为新网站且指向该网站的链接不多。(Googlebot 会跟随链接从一个网页到另一个网页抓取网页,因此,如果您的网站没有很好地链接,我们可能很难发现它。)
- 网站有大量内容页存档,这些内容页彼此之间没有很好地链接,或根本就没有链接。
2. 创建站点地图
????? 站点点地图所含网址的一般指南
- 一个站点地图可以包含一个网址列表或站点地图列表。
- 如果您的站点地图包含另一组站点地图,您应将自己的站点地图另存为站点地图索引文件,并使用该文件类型专用的 XML 格式。每个站点地图索引文件最多可以列出 50,000 个站点地图。
- 一个站点地图文件包含的网址不得超过 50,000 个,且未压缩时不得大于 10MB。如果您的站点地图超过了这些限值,请将其拆分为几个小的站点地图。这些限制条件有助于确保您的网络服务器不会因向 Google 提供大文件而超载。
- 使用相同的语法指定所有网址。例如,如果您指定网站的位置为 http://www.example.com/,则网址列表中不应包含以 http://example.com/ 开头的网址。如果您指定网站的位置为 http://example.com/,则网址列表中不应包含以 http://www.example.com/ 开头的网址。
- 请不要在网址中包含会话 ID。
- 请不要在站点地图中包含直接图片网址。Google 不会将图片直接编入索引中,而是将显示图片的网页编入索引。站点地图中包含的直接图片网址不会编入索引。
- 站点地图网址必须进行编码,以便于所在的网络服务器进行读取。另外,它只可以包含 ASCII 字符,不能包含大写 ASCII 字符、某些控制码或特殊字符(如 * 和 {} 等)。如果您的站点地图网址包含这些字符,在您试图添加该网址时就会显示错误消息。
??? 根据 Sitemap 协议创建站点地图
??????? Google 可支持多种格式的站点地图,但我们建议您根据 Sitemap 协议来创建站点地图,这是因为相同的文件也可能提交给其他搜索引擎,例如 MSN 和 Yahoo!,这些搜索引擎都是 sitemaps.org 的成员。
?????? 您可通过以下多种方式创建站点地图:
- 根据 Sitemap 协议手动创建站点地图?http://www.google.com/support/webmasters/bin/answer.py?answer=34657
- 使用站点地图生成器。如果您可以访问您的网络服务器,且网络服务器上安装有 Python,那么,您可以使用我们的脚本来创建使用 Sitemap 协议的站点地图。Google 站点地图生成器是一种 Python 脚本,可利用 Sitemap 协议为您的网站创建站点地图。此脚本可通过网址列表、网络服务器目录或访问日志来创建站点地图。
- 使用第三方工具。很多第三方都提供了可用于创建有效的站点地图的工具。
??? 根据文本文件创建站点地图
?
??? 您可以向 Google 提供一个简单的文本文件,文件中的每行只包含一个网址。例如:
http://www.example.com/file1.htmlhttp://www.example.com/file2.html
??? 要获得最佳效果,请按照以下指南操作:
- 由于 Google 会完全按照您所提供的网址来尝试进行抓取,因此,您必须指定完整的网址。
- 每个文本文件最多可包含 50,000 个网址。如果您的网站所含的网址数量超过 50,000 个,那么,您可将列表分成多个文本文件,然后分别添加每个文件。
- 文本文件必须使用 UTF-8 编码。您可在保存文件时设置此项(例如,在记事本中,此项会在"另存为"对话框的"编码"菜单中列出)。
- 文本文件不应包含网址列表以外的任何信息。 文本文件不应包含任何页眉或页脚信息。
- 您可以对文本文件任意命名。Google 建议您将文件的扩展名设置为 .txt,以表明该文件为文本文件(例如 sitemap.txt)。
???? 您应将此文本文件上传到您的服务器。创建此文件后,您可将其作为站点地图来进行提交。此过程虽然需要手动执行,但如果您对编写网络服务器的脚本或管理网络服务器还不熟悉,那么,此过程是最简单同时也可能是最有效的方法。
?
3. 提交站点地图或更新已提交的站点地图
????? 如果您用支持的格式创建了一个站点地图,可以通过 Google 网站管理员工具将它提交给 Google。这样可以让 Google 向您提供实用的状态信息和统计信息。
????? 通过 Google 网站管理员工具提交站点地图
?????
???? 在开始之前,请确保您已在自己的网站管理员工具帐户中添加并验证了以下网站:
- 站点地图所在的网站
- 站点地图中引用其网址的网站
- 将站点地图上传到您的网站。
- 在网站管理员工具主页上,点击所需的网站。
- 在网站配置下,点击站点地图。
- 在文本框中填写指向站点地图的路径(例如,如果您的站点地图位于 http://www.example.com/sitemap.xml,请键入 sitemap.xml)。
- 点击提交站点地图。
??? 通过 robots.txt 文件提交站点地图
???
??? 您可通过向 robots.txt 文件添加以下行(将示例网址更新为自己的站点地图的完整路径)的方式通知 Google 以及其他搜索引擎有关您站点地图的信息:
Sitemap: http://example.com/Sitemap 位置.xml
?? 此指令不受 User-agent 行的影响,因此,您可将其放置在您文件中的任意位置。如果您有站点地图索引文件,可以加入该文件的位置。您无需一一列出索引文件中所列的各个站点地图。
???