会员登录 | 会员注册 | 意见建议 | 网站地图

站长资源综合门户

当前位置:首页 > 新闻资讯 > 百度站长平台--站点抓取异常东西上线通知布告

百度站长平台--站点抓取异常东西上线通知布告

时间:2012-03-27 18:45:13   作者:   来源:   点击:

百度站长平台站点抓取异常东西全新上线,新上线的抓取异常东西面向全部网站开放。网站办理员可登录百度站长平台:http://zhanzhang.百度/,直接使用,体会百度抓取过程中的异常情况,以便站长随时发现网站存在的问题。

为什么要使用站点抓取异常东西:

1.对互联网中可正常拜候的网页,百度spider抓取的应该与普通用户拜候的内容一致。除此之外,还可能会呈现百度无法抓取页面内容,或抓取内容与用户拜候内容不一致的情况,这就是抓取毛病。对年夜量网页无法正常抓取的网站,搜索引擎通常会认为网站存在用户体验上的缺陷,并下降对网站的评价,在抓取、索引、排序上都可能会受到一定水平的负面影响。

2.使用站点抓取异常东西,可以实时发现网站存在的异常情况,可以有针对性地快速措置问题,实时修复由于异常情况而致使的用户体验损失。

怎样使用站点抓取异常东西:

第一步,注册并登录百度站长平台(http://zhanzhang.百度/)

第二步,提交网站并验证归属,具体验证网站归属体例可见帮忙文档

.百度/search/sitemap_help.html

第三步,选择左侧“站点办理”

第四步,在已认证归属的站点列表中选择需要查询的站点。

第五步,选择左侧“抓取异常查询”,取得抓取异常查询东西界面如下

抓取异常查询东西功能介绍:

1.东西可展现站点中已发现的抓取异常页面(抽样统计),并显示对应的异常类型。每种异常类型最多可展现10条链接,多于10条的不会在界面中体现。

2.所有抓取异常的链接列表可以通过下载的体例获得,支持依照异常类型下载指定的异常链接。

3.目前支持识别的抓取异常种类有五种:404页面、IP封禁、UA封禁、异常重定向以及其他异常,具体如下::

3.1 404页面:

代表协议死链,用户已无法拜候该页面内容,建议通过百度站长平台--死链东西提交死链的体例进行措置,以便搜索引擎更快地发现死链,削减死链对用户以及搜索引擎造成的负面影响。

3.2 IP禁封:

限制网络的出口IP地址,制止该IP段的使用者进行内容拜候,即为IP禁封。请查抄系统办事器是否设置了针对百度spider的IP禁封法则。

3.3 UA禁封:

UA即为用户代办署理(User-Agent),办事器通过UA识别拜候者的身份,当网站针对指定UA的拜候返回异常页面(如403,500)或跳转到其他页面的情况,即为UA禁封。请查抄系统办事器是否设置了针对百度spider的UA禁封法则。

3.4 异常重定向:

将网络请求重新指向其他位置即为重定向。异常重定向指的是以下几种情况

1)当前该页面为无效页面(内容已删除、死链等),直接跳转到前一目录或首页,百度建议站长将该无效页面的入口超链接删除失落

2)重定向到出错或无效页面

3)重定向的跳转逾越3次,也为异常

注意:对长时间跳转到其他域名的情况,如网站改换域名,百度建议使用301跳转协议进行设置。

3.5、其他异常:

1)针对百度refer的异常:网页针对来自百度的refer返回不合于正常内容的行为。

2)针对百度ua的异常:网页对百度UA返回不合于页面原内容的行为。

3)JS跳转异常:网页加载了百度无法识别的JS跳转代码,使得用户通过搜索成果进入页面后产生了跳转的情况。

4)压力过年夜引起的偶然禁封:百度会按照站点的范围,拜候量等信息,自动设定一个公道的抓取压力。可是在异常情况下,如压力节制失常时,办事器会按照自身负荷进行庇护性的偶然封禁。这种情况下,请在返回码中返回503(其含义是“Service Unavailable”),这样百度spider会过段时间再来测验测验抓取这个链接,如果网站已余暇,则会被成功抓取。

对异常抓取的页面,建议站长实时查抄办事器的工作状态和参数设置,以避免由此带来的流量损失。

分享到:

网友评论

热门新闻资讯