400-685-0732

WJMonitor舆情之声

企业大数据智能舆情监测管理解决方案

全网监测海量数据按需发布监测预警

实时把握舆情动态精准追溯信息源头

获取验证码
企业采购 个人使用
当前位置: 首页 > SEO博客 > URL结构

URL结构

时间:2014-02-18 12:38:29
周四听rude讲了途牛网网站的案例分析,其中讲到了关于URL的结构上的问题,由于听得不太具体,因此特意去网上寻找了关于URL信息,突然看到以下这篇认为对自己理解有帮助的文章。

对于SEO的人来说,前期在策划建设网站的时候就需要很清晰的对于自己网站的URL结构进行优化可控设计,例如URL的命名规则,URL的层次,URL的规范化等等,都是后期搜索引擎对于网页的抓取 和收录需要注意的一些问题,特别是对于网页URL结构的可控性就需要在架构URL的时候做到一定的前瞻性,例如一个网站比较大,后期可能会考虑用栏目页面做关键词的排名,这个时候就要考虑一个阶段性的可调整性。所以网站URL的结构优化还有很多需要我们注意的地方。

1、URL的命名规则
大部分网站的URL命名规则是“根域名+栏目+文章页面”,也有一部分网站的URL命名规则是“根域名+文章页面”,其中能够产生变数的多半在于文章页面的命名规则上,有很多的朋友可能会注意到自己的命名规则是不太合理的,那么什么样的URL命名规则比较利于搜索引擎抓取呢?下面看看谷歌在《创建方便 Google 处理的网址结构 》一文中给出的一些建议:
A、网站的网址结构应尽可能简单些,并考虑网站组织的内容,让网址的构建合乎逻辑并易于理解(尽可能采用易读字词而非长的 ID 数字)。
B、建议您在网址中使用标点符号,帮助搜索引擎更好地分析网页内容,如在网址中使用连字符 (-) 而尽量避免使用下划线 (_),用连字符分开两个单词,更有利于搜索引擎蜘蛛进行语义分析。
C、尽量少使用复杂的网址,特别是那些包含多个变量参数的网址,因为其可能会产生大量不必要的网址全都指向您网站上相同或相似的内容,给抓取工具带来麻烦,消耗Googlebot 大量不必要的带宽,也可能无法为您网站的所有内容编制完整索引。
后面还具体的谈到了不合理网址结构产生的原因和解决办法,有兴趣的朋友可以查看一下。做URL命名规则分析的时候最好是在建站前,这样才能避免后期改动URL带来的大量错误页面和权重损失。

2、URL的层次深度
对于URL的层次相信大家探讨的够深入了,两层,三层,四层对于网站的要求都是不同的,选择两层结构的URL,我们更多的希望网站权重直接传递到这些页面,选择三层的URL结构,是最普通的方式,主要是为了URL在各个栏目之间做好区分,四层的URL结构多半是网站比较大,在栏目和首页之间还有频道页面,这样用四层来进行很好的区分,如果还要细分,从长远考虑那就建议给网站开二级域名。
另外,大家对于URL的层次有一个误解,就是认为URL的层次越深,越不容易抓取,其实这个是以偏概全的理解,其实搜索引擎没有抓取某个URL,是因为我们站内站外给的这个页面的蜘蛛抓取入口太少。所以要想我们网页的一些页面被收录,也可以适当的做一些外部链接来吸引蜘蛛抓取。

3、URL的规范化
对于URL的规范化,相信大家都很重视了,例如最经典的URL规范化,就是将网址中可能出现的四种形式进行301重定向,让网站的权重集中于主域名上,但是这只是最基础的URL规范化操作,我们还需要在做好了URL的命名和层次考虑之后,检测网页的收录中是否有类似网页内容的URL,特别是一些动态的网页容易产生这样的情况,例如wordpress的程序设置好了程序也容易出现多个动态重复页面的URL,所以遇到这样的情况可以在robots文件中写好抓取规则,禁止蜘蛛抓取动态的URL地址,具体操作是Disallow: /*?*。

4、URL权重的可控性
当然,URL的结构优化还涉及到其他的一些细节,其中一个重要的就是对于后期URL权重的可控性的把握,例如,在开始的时候我们需要做长远考虑,给网站设计了很多的栏目,但是这些栏目又不是第一阶段我们想投入精力的,在这个时候我们可以将这些栏目进行robots屏蔽掉蜘蛛,或者使用nofollow属性让权重不传递,到达对于网页权重的合理引导,后期如果我们有精力开始发展新的栏目,就放开搜索引擎蜘蛛的抓取权限就可以了。
分享按钮