百度站长平台站点抓取异常东西全新上线,新上线的抓取异常东西面向全部网站开放。网站办理员可登录百度站长平台:http://zhanzhang.百度/,直接使用,体会百度抓取过程中的异常情况,以便站长随时发现网站存在的问题。
为什么要使用站点抓取异常东西:
1.对互联网中可正常拜候的网页,百度spider抓取的应该与普通用户拜候的内容一致。除此之外,还可能会呈现百度无法抓取页面内容,或抓取内容与用户拜候内容不一致的情况,这就是抓取毛病。对年夜量网页无法正常抓取的网站,搜索引擎通常会认为网站存在用户体验上的缺陷,并下降对网站的评价,在抓取、索引、排序上都可能会受到一定水平的负面影响。
2.使用站点抓取异常东西,可以实时发现网站存在的异常情况,可以有针对性地快速措置问题,实时修复由于异常情况而致使的用户体验损失。
怎样使用站点抓取异常东西:
第一步,注册并登录百度站长平台(http://zhanzhang.百度/)
第二步,提交网站并验证归属,具体验证网站归属体例可见帮忙文档
.百度/search/sitemap_help.html
第三步,选择左侧“站点办理”
第四步,在已认证归属的站点列表中选择需要查询的站点。
第五步,选择左侧“抓取异常查询”,取得抓取异常查询东西界面如下
抓取异常查询东西功能介绍:
1.东西可展现站点中已发现的抓取异常页面(抽样统计),并显示对应的异常类型。每种异常类型最多可展现10条链接,多于10条的不会在界面中体现。
2.所有抓取异常的链接列表可以通过下载的体例获得,支持依照异常类型下载指定的异常链接。
3.目前支持识别的抓取异常种类有五种:404页面、IP封禁、UA封禁、异常重定向以及其他异常,具体如下::
3.1 404页面:
代表协议死链,用户已无法拜候该页面内容,建议通过百度站长平台--死链东西提交死链的体例进行措置,以便搜索引擎更快地发现死链,削减死链对用户以及搜索引擎造成的负面影响。
3.2 IP禁封:
限制网络的出口IP地址,制止该IP段的使用者进行内容拜候,即为IP禁封。请查抄系统办事器是否设置了针对百度spider的IP禁封法则。
3.3 UA禁封:
UA即为用户代办署理(User-Agent),办事器通过UA识别拜候者的身份,当网站针对指定UA的拜候返回异常页面(如403,500)或跳转到其他页面的情况,即为UA禁封。请查抄系统办事器是否设置了针对百度spider的UA禁封法则。
3.4 异常重定向:
将网络请求重新指向其他位置即为重定向。异常重定向指的是以下几种情况
1)当前该页面为无效页面(内容已删除、死链等),直接跳转到前一目录或首页,百度建议站长将该无效页面的入口超链接删除失落
2)重定向到出错或无效页面
3)重定向的跳转逾越3次,也为异常
注意:对长时间跳转到其他域名的情况,如网站改换域名,百度建议使用301跳转协议进行设置。
3.5、其他异常:
1)针对百度refer的异常:网页针对来自百度的refer返回不合于正常内容的行为。
2)针对百度ua的异常:网页对百度UA返回不合于页面原内容的行为。
3)JS跳转异常:网页加载了百度无法识别的JS跳转代码,使得用户通过搜索成果进入页面后产生了跳转的情况。
4)压力过年夜引起的偶然禁封:百度会按照站点的范围,拜候量等信息,自动设定一个公道的抓取压力。可是在异常情况下,如压力节制失常时,办事器会按照自身负荷进行庇护性的偶然封禁。这种情况下,请在返回码中返回503(其含义是“Service Unavailable”),这样百度spider会过段时间再来测验测验抓取这个链接,如果网站已余暇,则会被成功抓取。
对异常抓取的页面,建议站长实时查抄办事器的工作状态和参数设置,以避免由此带来的流量损失。