SEO实战密码-4.13 网站地图- 高飞网

4.13 网站地图

2016-07-27 15:03:12.0

    网站无论大小,单独的网站地图页面同都是必需的。通过网站地图,不仅用户可以对网站的所有内容一目了然,搜索引擎也可以跟踪链接爬行到网站所有主要部分。

4.13.1 HTML网站地图

    网站地图有两种形式。第一种称为HTML版本的网站地图,英文是sitemap。HTML版本网站地图就是用户可以在网站上看到的,列出网站上所有主要页面链接的页面。

4.13.2 XML网站地图

    网站地图的第二种形式是XML版本的网站地图。英文Sitemap中的S大写时通常特指XML版本的网站地图。

    XML网站地图由Google于2005年首选提出,2006年微软、雅虎都宣布支持。2007年各主要搜索引擎都开始支持robots文件指定网站地图位置。百度现在也支持XML版本网站地图。

    XML版本网站地图由XML标签组成,文件本身必须是utf8编码。网站地图文件实际上是列出网站需要被收录的页面URL。最简单的网站地图可以是一个纯文本文件,文件只要列出页面URL,一行列一个URL,搜索引擎就能抓取并理解文件内容。

    标准版本的XML网站地图文件如下所示:

<?xml version="1.0" encoding="UTF-8"?>
<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9"
    xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"
    xsi:schemaLocation="http://www.sitemaps.org/schemas/sitemap/0.9 http://www.sitemaps.org/schemas/sitemap/0.9/sitemap.xsd">
    <url>
        <loc>http://www.example.com</loc>
        <lastmod>2010-01-01</lastmod>
        <changefreq>monthly</changefreq>
        <priority>0.8</priority>
    </url>
</urlset>

XML中各节点的含义如下:

节点名称必需含义
urlset声明文件使用的Sitemap协议版本
url它是下面所有网址的母标签
loc指定完整的URL
lastmod页面最后一次更新时间
changefreq

文件更新频率,标签的值包括:
always:一直变动,指的是每次访问页面内容都不同
hourly:每小时
daily:每天
weekly:每星期
monthly:每月
yearly:每年
never:从不改变

priority表示URL的相对重要程度。可选0.0到1.0之间的数值。默认值为0.5

    网站地图中声明的更新频率对搜索引擎来说只是一个提示,供搜索引擎蜘蛛参考,但搜索引擎不一定真的认为页面更新频率就是站长自己声明的那样。

    priority属性,1.0为最重要,0.0为最不重要。默认重要程度值为0.5。可以使用priority标签告诉搜索引擎这个URL的优先级,比如通常首页是1.0,分类页面可能是0.8,其他更深层页面重要性依次下降。

    XML网站地图文件最多可以列出5万个URL,文件不能超过10MB。如果网站上需要收录的URL超过5万个,可以使用网站地图索引文件,也即分成多个网站地图文件。一个网站最多可以有1000个XML网站地图文件,也就是可以列出5000万个网址。

    制作好网站地图文件后,可以有两种方式通知搜索引擎网站地图的位置,一是站长工具后台提交网站地图文件。目前Google、雅虎、必应都已经开通站长工具,所有站长可以注册。2010年4月份,百度也推出站长工具,也可以提交网站地图。

    另外一种方式是在robots.txt文件中通知搜索引擎网站地图文件位置,代码如下:

Sitemap:http://www.example.com/sitemap.xml

    所有主流搜索引擎,包括百度、Google、雅虎、必应、都支持robots文件指定网站地图文件位置。

    通过XML网站地图通知搜索引擎要收录的页面,只能让搜索引擎知道这些页面的存在,并不能保证一定被收录,搜索引擎还要看这些页面的权重是否达到收录的最低标准。所以XML网站地图只是辅助方法,不能代替良好的网站结构。