百度在这方面做的还不是很好,但谷歌已经可以很快且很准的识别出原文的出处。这就得益于以上3条。而其中"拷贝是否链接回原始出处"这一因素,也是我在《使用301重定向将404毛病转化为网站外链》这篇文章中所阐述的目的之一,还有一个目的年夜家也看到了就是传递权重。
最后,将一个用户无法拜候的毛病URL,公道的通过301的体例重定向到正确的URL。也对用户体验有所帮忙。我们同样在谷歌办理员东西的"抓取毛病"中看到了这句话。
谷歌bot 无法抓取该网址,因为它指向的网页不存在。通常,404 不会影响您的网站在搜索成果中的排名,但您可以借助它改良用户体验。
解决404毛病的体例无非是通过robots.txt屏蔽,或通过301重定向。我不认为屏蔽后可以改良用户体验。robots.txt的体例只能改良蜘蛛体验。因为用户点击毛病URL后,拜候的仍是一个不存在的页面和看到404毛病。
辩驳第三段
"直接复制原话"如果针对不存在的网页返回 404 或 410 以外的代码(或将用户重定向至首页等其他网页,而不是返回 404),则可能会呈现问题。首先,这样就等于奉告搜索引擎通过该网址可以找到实际的网页。成果,搜索引擎可能会抓取该网址,并将其内容编入索引。因为 谷歌bot 要使用很多的时间措置不存在的网页,可能无法迅速找到您的网址或频繁拜候这些网址,也无法频繁地拜候这些网址,从而影响对您网站内容的抓取量(别的,您一定也不希望自己的网站常常呈现在 [未找到文件] 的搜索查询中)。"这是404页面的原话,如果你不依照要求继续毛病页面的跳转的话,可能呈现的情况就是你的网站上呈现年夜量的相同页面,相同题目,相同描述,相同内容,等等,然后这就是不合的URL和相同的内容之间的故事,至于以后会产生什么?这个年夜家可以自己去百度,自己去谷歌上找找就知道了。"
辩驳的朋友既然提到了谷歌办理员指南,就千万别忘记摘录别的一段文字:
一般来讲,404 毛病不会影响您的网站在 谷歌 中的排名,因此您可以安心疏忽这些毛病。这些毛病通常是由于以下原因致使的:拼写有误、配置有误(例如由内容办理系统自动生成的链接)或 谷歌 增强了识别和抓取 JavaScript 等嵌入式内容中的链接的力度。
要查看无效链接的来历,请点击相关网址。在毛病对话框中,点击链接自以下网页标签。如果相关链接来自您的网站,请修复或删除这些链接。如果这些链接来自外部网站,您可使用这些数据改良网站的用户体验。例如,如果某人本筹算链接到您的网站但却输错了网址,那么就会呈现拼写有误的正当网址(如 example/awesome 拼写成了 example/awsome)。您可以将拼写有误的网址 301 重定向到正确的网址并通过该链接获得预期流量,而不是返回 404 毛病。您也可以在将用户定向到 404 网页后,确保帮忙他们找到所需内容,而不是仅仅显示"404 未找到"。不过,我们只建议您在毛病链接可产生较高流量的情况下采纳上述办法。
来历链接:https://support.谷歌/webmasters/bin/answer.py?hl=zh-Hans&answer=2409439
很遗憾的是,这位朋友只看到了其一,却没有看到其二。我们在做搜索引擎优化时,官方的资料很是重要,很多细节都隐藏在其中,需要花年夜量的时间去仔细阅读和理解。
实际上,谷歌办理员东西中很多设置和说明文字都是有其事理的。只是我们一些搜索引擎优化不肯意去理解。就像404产生的内因和外因这种事情,在"抓取毛病"一项中将它区分隔也是有其事理的。而不是闲着没事干就那么做了。
总结:
作为搜索引擎优化,我们要吸取很多知识,同时开辟自己的思路和阐发问题的体例。但需要确保你学习的知识是先进的而不是陈腐的。不然自己的思路很容易被误导,从而产生欠好的效果。
对不雅点的争论也是搜索引擎优化工作中很是重要的一个环节。没有人可以必定的说自己的理解是正确的,我们只能拿官方透露出来的一些资料和自己通过数据阐发得出来的结论来证明自己思路和理论的正确性。