会员登录 | 会员注册 | 意见建议 | 网站地图

站长资源综合门户

当前位置:首页 > 搜索引擎 > 站内代码优化:谷歌蜘蛛抓取页面上的内容阐发及优化体例

站内代码优化:谷歌蜘蛛抓取页面上的内容阐发及优化体例

时间:2012-07-18 19:44:17   作者:   来源:   点击:

搜索引擎的工作原理简单的概括就是:蜘蛛爬取无数的页面,然后阐发页面的内容和链接体例,然后把这些数据存入索引库。当用用户搜索时,搜索引擎就从索引库中调出一系列搜索成果,然后按照网页的相似度和权重进行排序。即:抓取-收录-排名。

所以做搜索引擎优化最根基的几点一定要做好:

1、让蜘蛛能快速抓取网页和收录(需要一个系统的网站内链架构,和性能优化)。

2、页面内容要适合蜘蛛的喜好或是适合搜索引擎的排序依据(网页代码的优化)。

3、提升网站权重(关头词和外链的扶植)。

今天主要是阐发下谷歌蜘蛛抓取一个页面时,对哪些内容会进行阐发和提取,深入体会以后便可以对网站页面内容进行更有效的优化,对网站的排名能起到很是年夜的效果。

打开一个页面时,视觉看到的和蜘蛛看到的内容是不一样的。蜘蛛看到的是网站办事器发给阅读器的源代码,而这些源代码中蜘蛛会疏忽很多内容如:HTML标签,和一些外部文件挪用内容等。蜘蛛能看到的就是网页上的内容文本。如:

这是weiku 其中一个页面的源代码,我们能看到的很多HTML代码和JS挪用,可是蜘蛛是疏忽这些代码的,它只对页面的文字内容(即红线框起的那些内容)感兴趣。

所以代码代优化其中之一是:削减不需要的Html代码,削减布局的层级布局,CSS样式和JS尽可能外部挪用而不是直接写在页面上。这样可以削减很多冗余的垃圾代码,同时可以削减网页的下载内容提升响应速度。

除内容外,搜索引擎还读取网站的几个元标签,如下图:

其中之一就是页面的题目标签即:<title>题目</title>,此标签是影响排名最重要的因素之一,同时也是用做搜索引擎排名成果中的题目。所以题目标签的优化及其中要,适合谷歌搜索引擎的题目最优优化是:

1、题目长度最好不要年夜于70个字母,最好在搜索成果的题目中能看完整句话。

2、题目中呈现有关该页面的关头词,同时按照搜索引擎匹配关头词的原理,关头词最好呈现在题目的开首。

3、题目最好是一句完整而又精练的话,关头词用一到两个,不要呈现明显的叠加关头词。

其二就是meta标签其中有:

关头词标签即:<meta name="keywords" content="" /> 这个标签主要是奉告搜索引擎本页面的主要关头词是什么,可是这个标签因为呈现被滥用,所以这个标签对谷歌搜索引擎没有任何作用不影响排名,不优化也摆。不过作为一个搜索引擎优化er,任何细节都不克不及错过,所以这个标签没作用,但仍是要认真去填写。

描述标签即:<meta name="description" content=""/>这个标签也不影响排名,但它有着重要的意义,因为搜索引擎根基上(谷歌有些时候读取页面重要内容而不是该标签的内容)会把它用作搜索成果的说明。所以这个标签是取得点击量的很是重要的因素,该标签长度不要年夜于155个字母。

ROBOT标签即:<meta name="ROBOT NAME" content="ARGUMENTS" /> ,该标签主要是奉告搜索引擎页面的索引和跟踪的体例,该标签content 部分主要是有:noindex,nofollow,noarchive,noodp,noydir,nosnippet 征对这几个的用法将会写一篇文章伶仃阐发,建议不要轻易用robot标签。

在第一张图的代码中,还看到一个

<img src="http://upload.chinaz//" onload="DrawImage(this,122,122)" onerror="this.src='/images/Nopicture3.gif'"></a> 标签,这是个图片展示标签,该标签也是网站对图片优化的重要部分,因为搜索引擎目前识别图片的手艺还不强,所以它不克不及知道图片里是什么内容。而只能通过图片周围的文字,img 题目的alt 属性来获得文字判断。所以对图片的优化主要是在 alt属性了图片周围的文字描术上。当然为了斟酌图片有时候下载不了时得用一张默认图片取代,提升网站的用户体验。

搜索引擎还读取一个noscript标签,这个标签主要是为了避免有些内容是用JS加载进来的,而搜索引擎自己是不读取JS内容的,如果站长想让某些内容用JS挪用,而当JS被禁用时展示别的一些内容,而这部分内容又想被搜索引所抓取的话,便可以用一个noscript标签。

分享到:

网友评论