搜索引擎算法是保密的,并且听说每天都在调剂,具体没人知道。可是Ethan认为搜索引擎算法源自两个别例论:法度推理和用户判断,法度推理分为两个维度:相关性和重要性,用户判断别离为相关性和重要性乘上个系数。关头词相关性由网页文本域内的关头词密度和散布决定。重要性也叫权重,一个网页的权重由这个网页的血统和内容品质配合决定。由此,Ethan总结出搜索引擎算法的四个方面:关头词相关性、网页血统、网页内容品质、用户判断,无妨称之为搜索引擎算法的四年夜因素。年夜家从这四个方面思考,往往可以为被普遍认可的搜索引擎优化操作找到理论依据,培养自己的搜索引擎优化思维。有了搜索引擎优化思维,才能突破教条式的操作规定,在搜索引擎优化实战中矫捷应变。
排名不是针对网站的,而是针对网页的。当用户搜索一个关头词时,搜索引擎从以下四个方面阐发被收录的页面,算出一个总分,总分最高的,排在自然排名的第一位。
一、关头词相关性
网页文本域是Ethan创作发现的一个概念,想说明的意思是,搜索引擎在判断关头词和网页之间的相关性的时候,不但仅考查网页内的文字,还会考查网页外的文字,主要包含反向链接锚文本的文字、反向链接页面的主题文字、域名的主题文字,所有这些文字组成了这个网页的文本域。所谓主题文字,就是搜索引擎会为每个域名和每个页面付与一些文字,这些文字体现了这个域名或这个页面的主题。年夜家都知道meta标签里有keywords和description,可以这样想象,搜索引擎为页面增加了一些meta标签,包含域名的主题文字、反向链接1的锚文本、反向链接1所在页面的主题文字、反向链接1所在页面的域名的主题文字、反向链接2的锚文本、反向链接2所在页面的主题文字、反向链接2所在页面的域名的主题文字等等。这些meta标签的权重要远高于keywords和description,有的甚至高于页面可见文字。有了网页文本域的概念,我们就可以够理解外链扶植等很多搜索引擎优化操作。
注意搜索引擎会按照用户的搜索意图,把用户搜索的关头词翻译成内部实际查询的关头词。大都情况下二者是一样的,但有的时候二者不一样。比如知道了用户的ip来自哪个地区,那么那个地区的相关页面会优先显示,有种用户搜索时加进了地区性文字的效果。再比如近义词阐发,搜索引擎会把近义词的搜索成果也列出来。
关头词和一个网页的相关性由网页文本域内的关头词密度和散布决定,越相关,排名越靠前。
2、网页血统
网页血统是Ethan创作发现的一个概念,想说明的意思是,在搜索引擎看来,一个网页天生就具有一种权重,这种权重来自url。搜索引擎会阐发一个网页的url,取得两种重要信息,第一是域名的情况,域名是有权重的,会直接传递到这个页面;第二是反向链接的情况,每个反向链接所在页面也是有权重的,也会传递到这个页面。我们常常遇到的pr值,主要体现了通过反向链接传递的权重。
注意域名的权重不等于首页的权重,搜索引擎会按照首页的权重、网站整体的情况(比如网站的稳定性和渐进性、站内是否有很多定向锚文本等等)、其它因素(比如域名寿命等等)决定域名的权重。
一个网页的血统越好,权重越高,排名越靠前。
三、网页内容品质
在重要性方面,网页血统是传递性因素,纯真由外部传入;网页内容品质是布局性因素,由这个网页自身相关的各类特质决定。这方面搜索引擎虽然不敷智能,但仍是有很多手段的,其中最重要的是内容的原创性如何和内容的新鲜度如何,特别是内容的原创性。还有比如网页中是否有定向锚文本和反向链接锚文本是否定向,搜索引擎认为如果一个页面认真地写了定向锚文本或其反向链接锚文本为定向的,说明这个网页内容品质较高。细节一些的,比如页面中有个图片会更好一点,页面中适当使用list标签会更好一 点,段落的开首适当呈现“首先”、“其次”这种词汇会更好一点,等等。
一个网页的内容品质越好,权重越高,排名越靠前。
四、用户判断
相关性和权重,数据源都不是来自用户的判断,搜索引擎很清楚,最重要的是用户感觉好欠好。虽然这方面获得数据源异常艰巨,但搜索引擎仍是有些体例的,比如搜索跳出率,比如百度统计和谷歌阐发,比如社会化网络的数据,这是以后搜索引擎算法的成长标的目的,对排名的作用会越来越年夜。Ethan相信,搜索引擎为了获得用户判断的数据源,会不吝血本。