400-685-0732

WJMonitor舆情之声

企业大数据智能舆情监测管理解决方案

全网监测海量数据按需发布监测预警

实时把握舆情动态精准追溯信息源头

获取验证码
企业采购 个人使用
当前位置: 首页 > SEO博客 > 降低页面相似度,你有答案了么?

降低页面相似度,你有答案了么?

时间:2012-09-19 18:07:36
近期在用页面相似度工具时,发现了一个奇怪的现象:Zac的博客每日一贴,其中两个页面顶端、右侧、底部完全一样,但是相似度只有1%,而我们的站点相似度却达到了50%(详情可见下图),百思不得其解。

ZAC的博客对比

SEOTcs文章对比

起初在网上查询了降低页面相似度的相关资料,并没有太多有价值的信息(其中说的增加评论功能有些道理,但是Zac的这两个页面没有评论,相对就没有价值)。观察Zac的页面特征,总结出了两点不同之处:

1、页面中内容分段很多,而且文章很少用p更多用ul与li来展示;

2、页面内容尤其是右侧部分相对紧凑。

除此之外,并无太多的异常之处。查询资料,发现谷歌还是相对给力的,搜“降低页面相似度”在谷歌的第二页找到了不同的答案。

1、内容拆分:把原有的文章,一段拆分成两段或者三段,一长篇的文章拆分成两三页来显示;

2、跟随法:把每一个段落的结尾都增加一段话,可以是有情提示,小调查,或是其他文章的推荐;

3、增加注释:在特定的文字后面增加注释,例如:并没有太多有价值的信息(其中说的增加评论功能有些道理,但是Zac的这两个页面没有评论,相对就没有价值);

4、将不必要的文字用图片来代替:将页面中特定的关键词进行隐身变成图片之后,也可以起到很好的降低相似度的作用,经过优化之后的gif图片只有十几个字节,对页面的加载速度也不会起到很大的影响。

笔者感觉上述四种方式还是有些道理的,当然,也有可能是在钻相似度算法(数学没学好,完全看不懂,哈哈)的空子。

试验了第一种方法,将同一篇文章发表了两次,发现相似度99%(日期,上一篇下一篇不同的影响)。然后将其中一篇进行了段落的拆分,发现相似度依旧是99%,失败了(难道要至少两种方法同时用?)。

降低页面相似度,你有答案了么?笔者在继续探索中……
分享按钮