会员登录 | 会员注册 | 意见建议 | 网站地图

站长资源综合门户

当前位置:首页 > 搜索引擎 > 浅谈搜索引擎日志阐发

浅谈搜索引擎日志阐发

时间:2012-03-17 19:10:14   作者:   来源:   点击:

对网站优化来讲,搜索引擎日志阐发是必不成少的一块,无论你是收录上百的小型网站,仍是收录上百万的年夜中型网站,搜索引擎优化要想做得好,都必须进行科学的日志阐发,日志是产生在网站办事器上的所有事件的记实,包含用户拜候记实,搜索引擎抓取记实,对一些年夜型网站来讲,每天的日志都有好几个G年夜小的,我们可使用linux命令去进行分手的,在年夜型网站日志文件往往是秘密文件,一般人是看不到的,因为从日志里边可以阐发访客趋势、地区趋势等,我们做搜索引擎优化的不需要那么大都据,我们只要阐发搜索引擎的抓取记实这一块便可以了,所以再年夜的数据量,如果颠末措置后,也就不会特别年夜了,何况现在的硬盘这么便宜,存储日志文件仍是可以斟酌的。那么我们主要阐发日志的什么数据呢?

1、每个搜索引擎的总体抓取量(以及趋势)

在日志文件中,明确的记实了每个搜索引擎的抓取量,例如百度、谷歌、搜狗等搜索引擎的抓取记实,我们都可以进行记实,使用DOS命令或Linux命令都可以去实现的,搜索引擎的收录是由抓取量以及文章质量来决定的,当文章质量不变的情况下,蜘蛛抓取量越年夜,那么收录的就会越多,我们在进行日志阐发 时候,一定要清楚的知道蜘蛛每天的抓取量事实是一个什么情况,并且每天都要记实,也许绝对值说明不了什么,我们可以去看它的趋势,当某一天抓取量的趋势在下降时,我们就要去找原因了。

2、记实搜索引擎蜘蛛的不重复抓取量

上一步我们把蜘蛛的抓取量数据给阐发出来了,然后我们要进行去重,也就是搜索引擎的唯一不重复抓取量,其实对收录来讲,许多页面只要抓取一次便可以了,可是在实际操作的过程傍边,许多页面都是被重复抓取的,谷歌的手艺比较先进一些,重复抓取率也许会低一些,可是百度等搜索引擎,重复抓取率却很是高,你通过日志阐发便可以看出来了,一天如果抓取量上百万,可能好几万次都是抓取首页的,所以许大都据你一定要去阐发的,当你阐发了后,你才会知道问题的严重性。

3、每个目录、每个搜索引擎的抓取量

上边两步把总体抓取量、不重复抓取量记实下来了,然后我们要阐发出每个搜索引擎对每一个目录的抓取情况是怎么样的,这样利于进行分块优化,例如当你网站流量上升时,你可以知道是哪个目录的流量上升了,然后再往下推,看看是哪个目录的抓取量上升了,哪个目录的抓取量下降了,为什么下降,都可以进行阐发的,然后在网站中进行适当的链接布局调剂,例如使用nofollow标签等。

4、统计搜索引擎抓取的状态码

当搜索引擎抓取了你的页面后,不单抓取了你的内容,并且还会有一个抓取返回码的,这些返回码我们要记实下来,特别是一些近似301、404、500等这些状态码,我们从这些状态码中我们找出网站的一些潜在的问题,例如为什么会呈现很多404页面,是法度原因,仍是搜索引擎在抓取外链的时候提取毛病,其实我们可以在谷歌办理员东西中看到这些数据的,里边还会提示你的毛病的404页面呈现在哪里,对一些301状态码我们也要注意了,看下这些301是不是依照我们所希望的那样跳转的,网站中要尽可能的少用跳转,页面在跳转的时候,往往会延长页面的加载时间,最常见的301可能就是网页URL不带"/"的跳转到带“/”的情况了,我们在网站中,要尽可能的避免呈现这样的情况。

5、统计搜索引擎蜘蛛来的次数、来的时间

我们可使用一些日志阐发东西,设定一个标准,例如光年日志阐发东西,可以统计出每个搜索引擎蜘蛛每天来的次数,一天一共在我们网站停留了多久,有没有IP蜘蛛一天24小时都在我们网站不断的抓取,这样的蜘蛛越多越好,往往是你网站权重提升的表示。这样的数据可以每天都记实下来,在一定的时间段内,进行对比阐发,看看停留的时间是不是增加了,来的次数是不是增多了,这样可以判断出网站权重是上升仍是下降。

当然可以从日志里边看出的搜索引擎优化指导数据还有很多,这里我暂时办枚举出这么多,希望能够起到一个抛砖引玉的作用,年夜家可以往下思考,进行延申,在平时的搜索引擎优化数据阐发工作中,一定要养成阐发日志的习惯,平时如果有时间,可以多看看日志文件,例如可以去年夜概的看下搜索引擎蜘蛛在你页面上的抓取轨迹,看看有什么规律,这对你日后的搜索引擎优化工作都非常常使用帮忙的。以上内容由jieyitongcy 捷易通自动充值软件在admin5首发,转载请保存网址,谢谢!

分享到:

网友评论