《搜索引擎蜘蛛爬行规律探秘之一蜘蛛如何抓取链接》写完距今天已经20多天了,原本想一直写下去呢,可是写完第一篇之后,突然没有了思路。今天跟朋友们说起来了外链的时效性,也就是说外链会不会失效。
本文不再讨论理论相关的内容了,而是会举一些例子来证明第一篇文章,同时也说一下链接的时效性吧。
首先,外链所在页面被删除,外链是否有效?
谜底外链所在页面删除依然是有效。证据如下:
我在博客中国的博客(多是因为流量超标在2006年被删除)早就已经被删了,可是百度依然有快照。今天看了下首页的快照已经没有了,可是文章页面还存在。看快照日期可以看到是2006年,甚至更久的。
也就是虽然页面被删除有5年之久,可是百度的快照没有删除,那么你说这里面的链接蜘蛛会不会爬呢?
我感触感染应该是会爬的,并且我在博客网的这个博客是有一个域名A的链接的,那时只是做了个跳转到博客首页。后来在我启用域名A做博客的时候,立马就取得了一个很好的权重,并且文章很容易被秒收。相信这个5年前的链接起到了很多的作用。
第二,如果外链所在页面搜索引擎没有了快照,外链是否有效呢?
谜底可能会出乎很多人的意料,外链所在页面没有了快照依然还可以有效。原因可以查看我在蜘蛛如何抓取链接这篇文章里写的,蜘蛛抓取页面之后,会把内容和链接分隔,链接也就是URL会插手一个网址索引库,而蜘蛛爬行是从这个网址索引库解缆的。
先看证据,这个证据来自于谷歌站长东西:
这个截屏来自于谷歌站长东西故障诊断的404述说,以前我在原网站下面架设了个bbs,当然早在N年前已经删除。可是这个不存在的页面,被谷歌蜘蛛抓取的来历地址竟然也是不存在的页面。而用谷歌搜索,是没有这些页面的快照的(如下图)。那是不是意味着已经404了好久的页面上的导出链接依然有效?
第三,那么外链对搜索引擎是否有时效性呢?
很明显应该是有时效性的。那么我就猜想一下外链失效的原因吧,应该会有两个原因:那就是外链所在页面被删或链接被删。
1.针对页面被删的情况,搜索引擎应该会继续爬行这个页面上的外链,直到这个页面404一按时间后,会给搜索引擎网址索引库一个命令删除这个外链。
2.而对页面更改的情况,搜索引擎应该也会爬行这个外链,直到这个含有这个外链快照在搜索引擎内部完全删除,会给网址索引库一个命令删除这个外链。因为含有外链的页面按照情况会保存N个时期的快照,这就是为什么有时候搜不合的词,网页的快照不合。
总之,外链是有时效性,可是链接修改或页面被删除其实不代表无效了。当然搜索引擎内部会有一个复杂的计较,过程不会像我说的这么简单。如果有什么不合意见请直接在本文下面留言,年夜家相互讨论。
转载请注明来自逍遥博客,本文地址:http://libo搜索引擎优化/1111.html
尊重版权,转载请注明出处和链接!
相关文章:搜索引擎蜘蛛爬行规律探秘之一蜘蛛如何抓取链接