去年年底,某客户找我辅佐制作了一个企业网站,斟酌到网站日后要进行搜索引擎推广,因此,网站在搜索引擎优化上必须具有搜索引擎友好性,权衡左右,最终我选择了DeDeCMS,这样可以在URL、PageTitle、TextBlock、LinkBlock、Auto Sitemap、Related Article几方面尽早进行搜索引擎优化布局。于是,在栏目打算、布局设计、模板制作阶段,我便将各类搜索引擎优化元素充分融入整个制作阶段,期望站点上线后,搜索排名权重可以快速堆集。特别是在模板代码撰写方面,有效的节制链接输出与导入,尽可能提高内链接的相关性以及关头词匹配的位置,并去除无用的网页噪音信息,使每类页面主题都特别突出。
果不其然,网站正式发布后,网站收录比例很快达到70%,绝年夜大都产品终端页被收录,部分资讯页面被收录,更重要的是:行业关头词排名与产品关头词排名前进飞速;整个网站在搜索引擎优化运转中呈良性成长趋势。客户起头接办网站并正常更新站点内容,依照设定的打算,一切本应该顺利进展。
然而就在近期,网站搜索引擎优化表示起头下滑,首当其冲的是网页收录数量,在百度统计后台显示的页面索引量与搜索框中site命令返回成果数不同明显,site命令显示只有2个页面被收录,均是首页,带www与不带www的两个版本的首页。除此之外,当资讯被正常更新后,百度很快索引了,短时间内通过site命令可以返回成果,但时间不长即又发现收录失效。综合上述情况,我认为网站已经被百度降权了。
为了找到问题所在,我研究了各个方面的影响因素,成果发现:
(1)除正常更新网站内容外,企业方也在积极运作外链,扶植外链原本是功德,但却用错了体例,参与了资源站的链轮;
(2)网上惊现模板相同、内容相同、品牌不合的仿造站,并且仿造站在百度收录也是只有首页,与客户网站"惊人的相似"。
1、关于链轮问题,还好我实时发现并制止了这种行为,由于只有几篇产品页参与了链轮,时间不长,应该不至于影响如此之年夜,何况仍是自身资源站点。
2、关于复制站点,已经很少见了,年夜部分人城市有意识的形成站点内容或组织形式上的差别化;而客户网站呈现这样的搜索引擎优化症状,生怕关头就在于仿造站点,当在我看到仿造站的一刻我完全无语了,除企业品牌名称不合,网站其他东西我都太清楚了;我很想吐槽,可回头一想现在的互联网不就风行遍地剽窃的风气吗,也许习惯了就好,可我TM实在不克不及忍受的是,模板100%仿造就算了,数据原封不动的收集曩昔也罢了,奉求,你TMD敢不把99%近似的站点整体发布出来吗!你TMD弄搜索引擎优化不知道相似站点啊!你TMD仿站还能把我写的自动更新网站地图文件sitemap.php也能仿造曩昔!做搜索引擎优化的伤不起啊。
吐槽归吐槽,问题仍是需要解决的,采取了几下的体例:
1、调剂模板数据挪用法则与新内容块安插
新内容块产生将页面主题关头词更分离一些,同时调剂数据挪用法则,让仿造站点的数据与自身页面数据产生差别性,下降复制网站搜索引擎优化问题的负面影响。
2、找到避免内容收集的体例
DeDeCMS自身有防收集混合字符串的功能,但这种防收集的体例对搜索引擎优化很晦气,你总不想让搜索蜘蛛看到网页中有很多隐藏文本吧,并且这些文本会影响蜘蛛对信息块主题的判断,影响关头词排名,其实,DeDeCMS没有根赋性的防收集的体例,道高一尺魔高一丈啊,只要你的信息通过页面的体例发布出来,总能找到收集的体例;综合网上收集的信息,我采取了两种体例,只能放置最初级的收集:
(1)体例一:复制网页正文内容时自动添加版权信息
JavaScript代码
<script language="javascript" type="text/javascript">
<!--
document.body.oncopy = function() {
setTimeout( function() {
var text = clipboardData.getData("text");
if (text) {
texttext = text + "rn(这里是你的文章版权信息,去失落括号):"+location.href;
clipboardData.setData("text", text);
}
}, 100 )
}
-->
</script>
将以上代码放置在文章页模板中正文结束后面便可。我测试了下该体例,只针对IE阅读器有效,而Firefox、遨游、谷歌 Chrome均无效。
(2)体例二:使页面代码具有唯一性