SEO实战密码-3.12 网站快速诊断- 高飞网

3.12 网站快速诊断

2016-07-19 22:45:40.0

    详细诊断网站、提出优化方案是本书要解决的问题,本节先简单介绍网站快速诊断方法。SEO服务端在刚刚与客户接触时,尤其需要对目标网站做快速检查,发现重要问题。

    快速诊断的第一步是检查上一节提到过的、研究竞争对手网站时同样的指标。唯一要加上的是计算页面收录比例,也就是搜索引擎收录页面数与网站实际总页面之比。站长一定要清楚自己网站上的实际页面总数,如果收录比例在20%~30%,说明网站结构有很大问题,需要改进。达到60%以上才是合格的。

    快速诊断的第二步是查看Google网站管理员工具中给出的信息。

    https://www.google.com/intl/zh-CN/webmasters/

    Google网管工具是非常好用、非常强大的工具,而且免费,强烈建议所有站长注册。微软必应、雅虎也都有类似工具,不过提供的数据与Google网管工具相比过于简单。百度目前也在内测网管工具。

3.12.1 robots文件检查

    整个网站不能收录或某个目录所有的页面都不能收录,经常是因为robots.txt文件差错引起的。网管工具抓取工具权限部分显示出Google所抓取的robots文件内容,如下所示:

    robots文件中的任何一个字母差错,都可能千万致命的影响。有了这个工具,站长可以确保robots文件中的每一行代码正确,不会错误禁止应该被收录的文件或目录。

3.12.2 首选域设置

    站长可以设置Google应该收录带www还是不带www的网站版本,称为首选域,如下所示:


    当然,在Google网管工具设置的首选域对百度等其他搜索引擎完全不起作用。这只是解决Google网址规范化的辅助手机,不能完全依靠这个设置,正确合理的网站结构才是解决问题的根本方法。

3.12.3 关键词排名

    在搜索查询部分,网管工具列出网站获得排名的关键词有哪些,并且列出了搜索结果显示次数、点击次数、点击率和平均排名,如下所示:


    在搜索引擎工作原理章节介绍了搜索结果前十名结果的点击率,网管工具则列出了网站真实排名及点击数字。这也为SEO人员提供了搜索结果点击分布的另一级数据,可以用于搜索流量预估。不过,要注意的是,网管工具中列出的点击率,很多时候与网站权重、知名度、页面标题标签的写作有很大关系,并不一定符合其他关键词的点击情况。

3.12.4 外部链接

    Google的link:指令非常不准确,基本不能用来查看外部中链接。网管工具中列出的外部链接则要准确得多,SEO人员可以一目了然地看到自己网站上哪些页面最受欢迎,吸引最多的外部链接。

    Google网管工具还列出了外部链接使用的锚文字,网管工具里称为“定位文字”,如下:


    这也使SEO人员可以清楚地看到自己想排名的核心关键词是否有足够的外部链接锚文字支持。

3.12.5 网站内容

    网管工具关键词部分实际上列出的是Google在网站上抓取的最常见的关键词,如下所示:显示这些最常见的关键词反映了网站的内容主题。

    从抓图中可以看到,笔者的博客主体内容大致合理,但最常出现的两个词却出人意料,一个是Reply(回复),一个是says(说)。这两个英文词是博客评论模板中出现的,每一个评论都会出现Reply和says各一次。当评论数比较多时,整个网站主体内容产生了一定的偏移。

3.12.6 内部链接

    内部链接部分列出所有页面的内部链接数,如图:

    

    站长从这里可以大致判断网站内部链接结构是否有重大缺陷。如果全站主导航中出现的分类首页内部链接数非常低,很可能导航系统有问题。

    内部链接数的另外一个作用是反映出网站收录页面数。Google的site:指令也不太准确,而且现在越来越不准确,经常不能反映出收录数字。网管工具中内部链接部分列出的首页内部链接总数,大致上就相当于Google收录的页面总数,因为网站上每一个页面都应该有到首页的链接。

3.12.7 抓取错误级统计

    抓取错误部分列出404错误(页面不存在)、被robots文件禁止而不能收录的页面等,如图:

    其中404错误对检查网站上是否存在错误链接很有用。对每个404错误,网管工具都列出到这个网上的链接,如下:

    如果到不存在页面的链接是网站内部发出的,说明这些链接上的链接地址有错误。如果链接向不存在页面是其他网站,站长可以尝试联系对方更改错误链接到正确位置。

    网管工具也列出抓取统计信息。

    如下所示,笔者的博客每天抓取页面数平均为400多页,对于一个只有只百篇帖子的博客来说很正常。如果是几十万上百万页面的大中型网站,平均每天抓取几百个页面就太糟糕了,照这个速度,要把整个网站更新一遍,恐怕得好几年时间。大中型网站每天抓取几万页面是最低标准。如果抓取频率太低,SEO人员必须在外链链接建设及网站结构上多下工夫



3.12.8 HTML建议

    查看Google的HTML建议,是寻找网站上可能出现的复制内容的最简便方法,如下图所示。


    网管工具列出了重复的元说明(也就是说明标签)及标题标签个数和具体页面。笔者的博客存在重复标题标签如下:

    标题标签重复,实际上经常意味着这些页面本身内容重复,往往是网站结构造成的。要注意的是,有时候网管工具中列出的数据并不完整,一般来说博客上标题标签重复的页面绝不止两页。

3.12.9 模拟蜘蛛抓取

    站长可以输入自己网站上的任何一个网址,网管工具会发出Google蜘蛛,实时抓取页面内容,并显示出抓取的HTML代码,包括服务器头信息和页面代码。

    显示这对站长确认转向设置和检查服务器是否正确返回内容很有帮助。

    另外,这个工具也可以用来检查页面是否被黑。有时候黑客放入的代码会检查浏览器类型,如果是用户使用的普通浏览器访问则返回正常内容,如果是搜索引擎蜘蛛访问,才返回黑客加上去的垃圾内容和垃圾链接。所以站长自己访问网站看不出异样,Google蜘蛛抓到的却不是站长自己看到的内容。这个工具可以帮助站长检查页面是否存在在安全漏洞。

3.12.10 网站性能

    网站速度现在越来越被重视,不仅可能对排名产生影响,对用户体验也有很大影响。网管工具网站性能部分显示出网页平均载入时间,如下所示:

    这个网页打开时间并不是Google蜘蛛抓取文件所要花的时间,而是Google工具条记录的普通用户打开页面要花的时间。所以网站服务端地理位置并不影响网站性能部分列出的数据。Google蜘蛛都是从美国发出的,但网站服务端放在中国不意味着比放在美国载入时间要长,因为Google记录的是普通用户访问网站的快慢。