了解XML站点地图

  • 网站地图不是您网站上页面的列表。
  • 不必在站点地图中包含每个页面。
  • 忽略“优先级”和“更改频率”标签。

XML站点地图可以说是搜索引擎优化的简单技术元素之一,并且常常被误解。 为了更好地理解和有效使用XML站点地图,了解它们是什么和不什么是有帮助的。

什么是XML网站地图?

站点地图以最简单的形式充当搜索引擎的路线图,以发现您网站上最重要的内容并获得有关网站整体结构的更广泛的背景信息。 站点地图不仅为搜索引擎提供了URL列表,而且还可以帮助搜索引擎找到更新的内容或网站体系结构中的深层内容。 这有助于内部链接结构不良的网站。

站点地图告诉Google要编制索引的内容。

关于XML Sitemap的常见误解:

网站地图不是您网站上页面的列表。 不必在站点地图中包含每个页面。 大多数网站包含敏感内容,例如投资者信息或无法通过搜索提供良好用户体验的内容(例如登录页面或帐户页面),以及位于付费专栏或返回非200响应代码的页面之后的内容。 这些是网页示例,不应该提供给搜索引擎,也不能包含在站点地图中。

如果我的网站布局合理,则不需要Sitemap。 尽管良好的基础结构始终很重要,但是XML网站地图旨在用作您要爬网并考虑建立索引的最重要内容的指示器。 如果您有企业级站点,则仅依靠基础结构来确保爬网和索引编制可能不是最安全的选择。 设置站点地图以包含最重要的页面将有助于搜索引擎了解您认为最重要的内容。 由于搜索引擎的预算有限,因此这对于大型网站可能是一种有益的方法。 如果您的网站有超过50,000个包含重要内容的URL,则可能需要创建一个包含多个站点地图的站点地图索引。

站点地图告诉Google要编制索引的内容。 XML站点地图不保证页面将被索引,仅保证将其视为索引。

另请访问: 拉合尔的SEO公司

使用XML站点地图使您受益

忽略“优先级”和“更改频率”标签:

XML站点地图中两个流行的标记元素是优先级标签和更改频率标签。 许多网站管理员使用此标记来提高抓取效率并突出显示网站的主要内容。 Google的John Mueller表示Google忽略了这两个信号。 但是,他表示在Google分析站点地图时会使用lastmod标记。 如果您专注于该标记,并确保提供正确的URL,则可以确保有效地对站点地图进行爬网并产生最大的影响。

使您的站点地图可用于搜索引擎:

确保发现最重要的内容的重要第一步是学习如何创建站点地图和 将其放置在服务器的根目录中.

接下来,请确保您在robots.txt文件中提供了指向XML网站地图的链接。 该文件是搜索引擎机器人访问网站时最先访问的文件之一。 在那里,您将找到有关要爬网哪些内容以及避免什么内容的说明。 通过包含指向站点地图的链接,可以确保搜索引擎识别并抓取您的内容。

最后一步是将您的站点地图实际提交到Google Search Console和Bing网站管理员工具。 根据Google的网站站长论坛的说法,他们不会在每次更新您的站点地图时都会检查它,只有在他们第一次注意到它时才检查它。 之后,请在通知他们更改其站点地图之前,不要对其进行检查。 可以使用Google Search Console的站点地图工具并使用ping功能来完成此操作,它会提示Google通过发送HTTP GET请求来抓取您的站点地图:

举个例子.

仅包含有效的网址:

您的站点地图必须基于可索引的URL,并返回200 OK响应代码。 网站管理员,SEO或开发团队应定期检查其网站的站点地图,以删除返回404错误,300响应代码和500级服务器错误的页面。 可以通过对站点地图进行爬网或使用Google Search Console XML站点地图报告来识别无效的网址来手动完成此操作。 请记住,搜索引擎在抓取预算上运行,因此任何不可索引的URL都会增加有效URL不会被抓取的可能性。

另请访问: 拉合尔的SEO服务

您的站点地图必须基于可索引的URL,并返回200 OK响应代码。

使用一致的合格URL:

一致性对于格式正确的XML网站地图很重要。 确保您使用一致的协议。 如果您的网站是安全网站(使用HTTPS),请确保站点地图和所有网址均使用安全协议。 否则,您的站点地图将包含可能影响抓取效率和索引编制的重定向。

使用一致的子域。 由于XML网站地图可洞悉网站的架构和组织,因此每个子域都应拥有自己的网站地图。 这也有助于保持站点地图尽可能压缩。

添加唯一的网址:

确保仅包含规范版本的URL。 包含参数或会话ID的URL可被视为重复的,应排除在外。 否则,爬网效率和整体索引可能会受到影响。 在进行常规站点地图审核时,请确保查找非规范的URL并将其删除。 使用Google Search Console网站地图报告可以帮助您轻松识别非规范网址。 最佳做法是定期查看此报告。 除了通过搜索控制台使用Google工具之外,SEO和网站管理员还可以用来识别返回非200响应代码的非规范URL和页面,以进一步检查XML网站地图。

不要插入非字母数字字符:

网站地图必须采用UTF-8编码。 URL必须使用实体转义码来表示字符,例如与号(&),单引号('),双引号(“),小于(<)和大于(>)。 此外,URL仅应包含ASCII字符。

限制站点地图的大小:

XML网站地图的大小很快就会失控,尤其是在大型网站(例如电子商务网站)上。 如果站点地图太大,可能会对爬网和建立索引的URL数量产生负面影响,并且可能导致Web服务器在必须提供大文件时停止工作。 为了解决这个问题,XML网站地图应限制为50,000个URL和/或不大于50 MB。 这意味着较大的网站可能需要在站点地图索引文件中使用多个位置映射。

对于较大的站点地图,将大量内容分解为自己的站点地图可以帮助保持内容的有条理并避免站点地图膨胀。 为视频,图片和博客创建单独的站点地图可能是个好主意。

使用工具创建XML站点地图:

有许多工具可以帮助创建XML网站地图。 许多CMS都有动态的站点地图创建选项,使您可以管理站点地图文件中发布的内容。 像WordPress这样的CMS具有多个用于管理站点地图的插件。

既然您知道如何创建,格式化,设置和编辑站点地图,现在就可以准备最重要的项目列表以包括并提交给搜索引擎了。

了解更多信息

发表评论