Zone Indexes算法,是一种对网页进行区域划分并别离赐与权重的搜索引擎算法。搜索引擎会连络这种算法和其他消噪手艺,如VIPS算法,对一个网站中的内容进行“消噪”,并对每一块区域付与权重,从而展现网页中真正有价值的内容。
正如在上一篇关于搜索引擎算法的文章《TF-IDF算法在搜索引擎优化中的衍生应用》所述的那样。本博是以搜索引擎优化为主题,涉及IR范畴只是为了让年夜家更好的体会搜索引擎,从而达到改良网站优化效果的目的。所以本文仍是用浅显易懂的语言来介绍Zone Indexes在搜索引擎优化范畴的衍生应用。
Zone Indexes算法搜索引擎优化定义
Zone Indexes算法,我们暂且翻译它为“分区索引”算法(IR范畴的年夜牛欢迎指正翻译毛病),是一种在网站标准化中布局层面对网站或网页进行分区划分,再对每一区域付与权重的算法。我们用一个简单的例子来理解这个算法,假定一个网页中只含有三块内容,即题目、描述、内容文本;同时假定搜索引擎对着三块区域所付与的权重为0.3、0.1和0.6分:
题目:0.3分
描述:0.1分
内容:0.6分
现在我们做为一个用户,在搜索引擎中键入“布尔 算法”,以本篇文章为例,它取得的权重为:
题目:“Zone Indexes算法与网站权重划分”,呈现“算法”1次,得0.15分
描述:Zone Indexes,是一种对网页进行区域划分并别离赐与权重的搜索引擎算法……,呈现“算法”1次,得0.01分
内容:现在我们做为一个用户,在搜索引擎中键入“布尔 算法”,以本篇文章为例……呈现“布尔 AND算法”得0.6分
总计:0.76分
即,我这篇文章是将Zone Indexes算法而非布尔算法,但因为“算法”一词适合了搜索要求,在没有其他权重因素影响的情况下,这篇文章仍然跟索引词有关,应该呈现在搜索成果中。
然而,搜索引擎对Zone Indexes算法的应用远非这么简单—它是以一个网页为单位进行区分的。我在《网站整体标准化对搜索引擎优化的影响》一文的布局层面的搜索引擎优化中曾写道:
布局层面,是指组成网站的html语言。如我们在做搜索引擎优化工作时常常会用到的h1-h4、strong、a、img标签等。搜索引擎是可以看到并阐发这些标签的。而这些标签也奉告了搜索引擎某一个网站中内容直接的关系。
我们知道,一个普通的网站,至少拥有以下区域:
header头部区域
content内容区域
footer页脚区域
再复杂一些的网站,会拥有以下区域:
nav导航区域
sidebar边栏区域
comments评论区域
link友链区域
年夜型网站的内部机关就更加复杂。与VIPS对视觉上噪音区域区分不合的是,Zone Indexes是在布局方面对网站进行消噪,比如:
content是最重要的区域,一般在div中被标为content的区域,是搜索引擎付与权重最高的区域。header其次,因为该部分拥有题目和描述,而这些内容也是对索引网站有至关重要的作用的。
nav导航、sidebar边栏一般而言则不是那么重要,而footer页脚、comments评论区域一般则是噪音区域(还有link友链和ad告白等等)。
在HTML5中,这种基于语义的网站布局被进一步增强,我们知道html5中已经直接支持article、audio、body、footer等标签。
Zone Indexes算法搜索引擎优化实例
这里我们看一个操纵Zone Indexes算法对网站进行搜索引擎优化的例子,案例来自于年夜名鼎鼎的雅虎(这个例子也是很多搜索引擎优化高手在阐发网站布局是喜欢举的例子)。
我们打开http://autos.yahoo/ 这个网站,然后查看其源代码,在接近页脚处,我们发现这么一段代码:
对搜索引擎而言,它们将网站按区域进行划分后,需要决定哪部分是重要的而那部分是不重要的,然后给相应的区域付与权重。除上文中说的通过id或class进行划额外,它们还会连络采纳“文本代码比”的体例。因为在某种情况下,即便在页脚的内容,也不见得不重要。
因为写作和法度的原因,如果在一段内容中,文字+图片远远年夜于代码,则可以认定这块内容是重要的。反之,如果代码内容年夜于文字+图片,那么这块内容就是不重要的。
这很合情公道且适合逻辑和实际,不是吗?