会员登录 | 会员注册 | 意见建议 | 网站地图

站长资源综合门户

当前位置:首页 > 搜索引擎 > 比较准确地取得谷歌索引量的体例

比较准确地取得谷歌索引量的体例

时间:2012-03-16 18:53:39   作者:   来源:   点击:

最近担负一个年夜中型英文网站的第三方搜索引擎优化参谋,因为某些原因,网站某部分的URL需要更改,呈现几十万页面级别的301和404。怎样才能统计到新页面被谷歌索引了没?其实可以操纵谷歌办理员东西,便可以统计到这些新页面被谷歌索引了多少,并且还可以比较准确地取得网站整体在谷歌里的索引量。

以我的博客为例,直接site我的博客找到486条成果,而我的博客目前只有72篇文章,加上分类页面也相差好几百。原因是早段时间改换主机,自己 年夜头哈忘记上传robots.txt,致使一些重复内容页面也收录了,后来才上传了robots.txt。现在谷歌 "site:"就会呈现如下的收录,只有网址没有内容(过一段时间才会删除)。

网站会呈现很多的问题,造成搜索引擎索引一些站长不想索引的页面,包含常见的重复内容页面、无限循环页面(平时我们还要尽可能找出这些链接屏蔽失落和到谷歌办理员东西里删除),年夜中型网站就加倍普遍。但这些索引数据对搜索引擎优化阐发作用年夜么?不年夜,甚至等于0。

其实可以在谷歌办理员东西Sitemap模块里取得"真实"的收录数据,这个"真实"取决于你想让哪些页面被谷歌索引。现在我想知道我博客别离有多少文章和分类页面被索引,首先我制作两个网站地图文件,一个包含所有文章地址(URL),一个包含所有分类地址,然后在办理员东西提交 sitemap地址。

谷歌办理员东西后台直接提交比robots.txt写入地图地址要好,一方面加倍矫捷,一方面可以避免竞争敌手获得站点数据进行研究。

因为演示,追求简单,这里我只制作了文本地图文件,主流搜索引擎支持RSS、Atom、XML和文本等多种格局的地图文件,谷歌支持一个站点地图文件最多包含5 万个网址,压缩前体积不得逾越 50MB。

上图显示谷歌索引了博客的72个文章页面和22个分类页面。

依照需求拆分网站地图文件,可以便利取得你想要的索引数据,并且可以提交重叠的网址,例如同时提交网站最新更新产品的网页地址和某分类下产品的网页地址(存在重叠网址)。

取得收录数据,便可以有针对性地进行优化。例如优化持久不索引的页面,等谷歌蜘蛛下次爬行掉队行索引,也可以与同期其他搜索引擎优化数据进行融合,取得更多对搜索引擎优化有帮忙的数据。

其实谷歌在site的时候已经明确谷歌办理员东西这一功能,只是很多人没有进一步操纵。

操纵好谷歌办理员东西,可以抽离出更多对搜索引擎优化有用的数据,以后再慢慢探讨。Bing办理员东西也有很多实用的数据,同样不要错过哦。

原文地址:http://yihuiblog/a/299.html

分享到:

网友评论