当前位置：首页 > 搜索引擎 > 搜索引擎判断网站是否作弊的原理阐发（二）

搜索引擎判断网站是否作弊的原理阐发（二）

时间：2012-05-28 18:40:31 作者：来源：点击：

承接搜索引擎判断网站是否作弊的原理阐发(一)

广州搜索引擎优化陈永继续为年夜家阐发信任传播模型、不信任传播模型及异常发现模型3个代表算法，它们别离是TrustRank算法、BadRank算法和SpamRank算法。

我们先详细介绍TrustRank算法

TrustRank算法属于信任传播模型，根基遵循信任传播模型的流程，即算法流程如下两个步调组成。

步调一：确定值得信任的网页调集

TrustRank算法需要靠人工审核来判断某个网页应该被放入网页调集，斟酌到人工审核工作量年夜，所以提出了两种初选信任网页调集的策略，在初选调集根本上再由人工审核。

*初选策略1：高PR分值网页，即认为高PR得分的网页是可托赖的，所以可以对网页计较PR值后，提取少量高分值网页作为初选页面调集。

*初选策略2:逆PR(Inverse PR),在pr计较过程中，是按照网页入链传入权值计较的，逆PR与此相反，按照网页的出链传出的权值计较，即先将网页之间的链接指向关系反转，选取的分较高的一部分子集作为初选页面。

步调二:将信任分值从白名单网页依照一定体例传播到其他网页

在这个步调，TrustRank算法的信任传播体例基于以下两个假定。

假定1：距离可托网页越近越值得信任，这里的距离指的是通过多少步链接转可以通达。

假定2：一个高质量网页包含的出链少，那么被指向的网页的是高质量网页的可能性越小。

所谓信任衰减，即距离可托网页越远的网页，通过传播取得的信任分值越小。

所谓信任值均分策略,行将网页取得的信任值依照出链个数平均分派，如果一个网页有K个出链，则每个出链分派到1/k的信任分值，并将分值传递给出链。

通过连络以上两个传播策略可以再页面节点图之间传播信任分值，在最后的计较成果中，低于一定信任度的页面会被认为是作弊网页。

先阐发这里，搜索引擎判断网站是否作弊的原理阐发(三)将为年夜家讲授BadRank算法，具体可以到我的博客(.30ly)体会。

本文原创于广州搜索引擎优化陈永博客.30ly/?p=205

转载请加上转载地址

分享到：

站长资源综合门户