6月22日和6月28日的百度反作弊年夜更新对相当一部分站长来讲是一个恶梦,许多网站都被K失落,从官方数据来看,说是5%的流量已经被调剂,我想这个数字只多很多,我举我自身的一个例子。本人的友情链接有33个,当初挑选时都是一些排名很好,pr为3或4的企业网站,颠末28日之后,我再查抄自己的友情链接,已经有7个网站被K失落了。所幸的我比较懒,每天只更新一篇文章,并且这篇文章完全由我自己原创,所以在这次百度地动中,我的排名没有太年夜影响。
昨天,百度站长平台针对22号28号年夜量网站赏罚做出了说明,其中有两句话特别引人注目,第一句是百度更新了部分反作弊策略和特征,这些策略在6月21日逐渐生效。第二句话是对低质量文章的定义:低质量站点是指无原创, 或伪原创(很少原创内容, 年夜量收集的内容)。从这两句话可以悲观的看出,这只是一个起头,并且被K的网站也很难会被恢复了,以后只靠转载文章也很难养活网站了。
那么百度是如何判断文章是不是伪原创呢
百度蜘蛛在抓取文章之后,颠末一定措置将一些多余没有多年夜意义的字去失落,例如“因为”“的”“了”等等,把整个文章酿成众多关头字的调集。然后计较各个关头词的密度,再和他数据库里的其他文章进行对比,如果这些文章关头词数量一样,密度也一样的话。那么百度就为认为这是一篇伪原创。当这些关头词的数量和密度有百分之五十以上不一样时,百度才会认为这篇文章是原创文章。
这个原理也是从搜索原理书上看到的,我想这个法则同样适合百度作弊年夜更新之后的策略,不会产生太年夜转变。那么以后众多小我站长如何去进行高质量的原创和伪原创呢?
首先是用户体验,最根基的就是用户能读通顺这篇文章,有些东西伪原创的文章底子不克不及看,完全是为了百度制造。其次文章尽可能用手打上去,削减复制加黏贴,对发帖时间百度也能统计到,那些一分钟发好几篇文章很定有问题,只是百度以前没有过量存眷,这次百度更新之后还能不克不及允许站长这么疯狂就不得而知了,可以必定的是收集软件群发这个做法已颠末时了。
针对我以上的百度法则,我给年夜家介绍两种伪原创体例:
1 文章改写
将文章的首段和尾段删失落,然后自己撰写,搜索引擎是从上到下抓取的,第一段是百度蜘蛛最先看到的,而最后一段文字是带蜘蛛分开的。更重要的是改写的文字尽可能多一些,如果原文字首段为20个字,那么你改写的文字至少为40个字,这样才会引起蜘蛛的兴趣。
2 翻译软件的巧妙使用
选择一篇文章,最好是比较老或转载次数较少的文章,用翻译软件翻译成英文在翻译成中文,不竭转换,转换几次,原来的文章就面目全非了,然后你自己在通读一遍,把语句欠亨顺的处所改失落,满足最根基的用户体验。
过量的体例我就不介绍了,这两种体例想必年夜家都知道,用的人想必就很少了,事实成果还要自己去改写,但颠末这次百度反作弊年夜更新之后,那种一开软件就坐着数钱的日子已经不在了,站长们也要随着不竭的进化。文章原创于北京网站扶植.bygw ,转载请附带链接,谢谢。