第一章 搜索引擎如何运行
搜索引擎具有四个功能:抓取、成立索引数据库、计较相关度并得出排名、以及提供索引的成果。搜索引擎抓取并索引数以亿计的网页、文件、新闻、图片、视频等内容,当搜索者提出一个搜索需求的时候,搜索引擎会把索引的成果依照相关性排列起来,提供给搜索者。
1、抓取和索引
互联网就像是一个庞年夜的城市地铁系统,网站和网站里的页面(也多是pdf文件、jpg图片等)就像地铁系统里的站点,为了让列车可以达到每一个站点,在地铁系统里就需要有不合的线路把站点毗连起来,而在互联网中毗连不合网站或网站中不合页面的线路正是链接。
办事器中的链接布局把网站里所有的页面联系到了一起,或至少包管了搜索引擎能够达到所有的页面。有了这些链接,搜索引擎机械人(或叫做"爬虫"、"蜘蛛")便可以达到网站的每一个角落了。
一旦搜索引擎找到这些页面,它们下一项工作就是阐发页面代码,选择有用的内容,把它们贮存起来,当用户提出搜索请求时,再将成果提供给用户。为了能够在最短的时间内,为用户提供适合搜索需求的内容,搜索引擎公司在全世界成立了数量繁多的年夜型数据库,用来贮存搜索引擎蜘蛛抓取到的网站(网页)内容。当用户使用搜索引擎搜索的时候,延时、即便这种延时只有3、4秒,也会造成用户很年夜的不满,所以,主流的搜索引擎公司都把快速提供成果作为自己的重中之重。
2、提供搜索成果
当用户使用搜索引擎进行查询的时候,搜索引擎会在自己的数据库中寻找用户想要的信息,在这个时候搜索引擎会做两件事情,一是,把对用户有用的、与搜索查询相关的成果提供给用户,二是,把这些成果依照重要性进行排序。这两点(相关性和重要性)恰巧就是网站在搜索引擎优化中需要重视的。
对搜索引擎来讲,相关性不但仅意味着在页面上把用户搜索的词突出显示。在互联网出世的早期,搜索引擎只是把用户搜索的内容加粗或高亮显示,随着手艺的成长和前进,精采的工程师们找到了更多更好的体例,可以向用户提供更有价值的搜索成果。如今,影响相关性的因素越来越多,在后面我们会详细地介绍。
虽然影响相关性的因素多达数百个,可是相关性仍然难以量化,而另外一个影响搜索成果排名的要素——重要性,同样是一个难以量化的指标,虽然难以量化,搜索引擎仍是要努力去做这件事情。
最近,主流的搜索引擎公司喜欢用声望、口碑来权衡一个网站或网页的重要性。网站在用户心目中的地位越高、口碑越好,提供的内容和信息越有价值,那这个网站在搜索引擎看来就越重要。从实际情况来看,用声望和口碑来判断网站的重要与否是比较成功的。
搜索引擎对网站重要性和相关性的判断其实不是依靠人工进行的,如果人工进行判断的话,工作量将会很是巨年夜。在这方面,搜索引擎有着自己的一套评分标准,我们称之为"算法",在搜索引擎算法中,包含了数百个变量,也就是我们通常所说的影响排名的因素。
原文:搜索引擎优化moz PDF版
翻译:北年夜青鸟门户(.bdqn/news/tec/id/804.html )原创颁发,转载请以链接形式注明出处,谢谢!