这说明了什么呢?说明百度比谷歌好吗?绝对不是的。因为百度和谷歌收录页面的标准是完全不合的。
谷歌 是依照网页级别(PageRank)来收录的,只要网站有一定的网页级别,谷歌会快速收录的,而没有网页级别的网站,谷歌则果断不去收 录。百度则很夸大,采取的是来者不拒,多多益善的原则,无休止的进行收录。百度的这种不按网页级别的收录体例其实有很年夜的恶果,最主要的恶果 是造成年夜量的垃圾网站风行,因为只要做一个垃圾站,百度就会立即收录(25000页以内),这等于变相的鼓动勉励年夜家去做垃圾站,去盲目收集。当垃圾站 横行的时候,百度再通过人工的体例封站,甚至一些百度业务员对年夜流量的网站还会要求其站长打点百度竞价排名。
这两种收录体例哪种更 好呢?我小我认为谷歌的这种收录体例是比较科学的。因为互联网上的页面是个天文数字,收录应该是有选择的收录,好的网站则多收录,新站则应该少收 录,等其慢慢知名了以后再多收录,这样也提高了效率,让用户搜索到更好的页面而不是更多的页面。如果对新站不做阐发就快速收录,那么会使得从手艺上匹敌 歹意网站作弊(搜索引擎优化)变得很是坚苦,谷歌通过赐与新站给出一定的“考查期”来阐发这个新站是否是作弊的垃圾站,而百度就只能依靠人工体例手动地 删除垃圾站。对收录网站的具体操作上,谷歌的爬虫显得较为“体贴”站长-谷歌爬虫占用办事器的资源很是少,通常是先用head来查看网 页是否更新,如果更新了再抓取整个页面,这种体例破费流量较少。而百度则不管三七二十一上来就抓整个站,有时甚至不遵守robots法则,并且其爬虫数量 很是庞年夜,对页面较多的网站通常会破费惊人的流量,并且常常造成卑劣的后果。
当然,百度这种“贪婪”爬虫抓取体例,虽然会让用户能够在百 度搜索出一些谷歌里搜索不到的页面,但这实在是损人利己。其带给网站站长很多负面效果:办事器和带宽资源过度消耗,垃圾站被变相鼓动勉励了,原创的有 特色的网站则被边沿化,MP3音乐网站则更苦不堪言-自己的MP3被百度盗链后带来年夜量文件下载却没有带来页面拜候。
因此,中国的网民也 呈现了很奇怪的现象:年夜量的新网民和菜鸟新手喜欢用百度搜索,因为百度往往搜索到很多别处搜索不到的页面,但内容的匹配度则使人质疑,而专业人士和老鸟则 更喜欢用谷歌,小我站长则普遍和百度有“小我恩仇”。因此百度在业界的Blog以及社区中口碑都不太好,但在普通的低条理的网民心中却不错,这些 年夜量的普通网民给百度带来了年夜量流量。
原文地址:http://lusongsong/info/post/90.html