会员登录 | 会员注册 | 意见建议 | 网站地图

站长资源综合门户

当前位置:首页 > 站长学院 > 建站经验 > WordPress搜索引擎爬行记实代码

WordPress搜索引擎爬行记实代码

时间:2012-01-19 16:17:24   作者:   来源:   点击:

写博客也有一段时间了,为什么搜索引擎迟迟不收录你的页面呢?想知道每天都有哪些蜘蛛"造访"你的网站吗?作为一名wordpress用户,有需要知道每天都有哪些蜘蛛爬行过你的网站,以便于体会各搜索引擎蜘蛛爬行频率,对网站进行针对性的搜索引擎优化优化。

其实很简单,只要添加以下代码,然后再挪用文件代码就OK了,是不是很便利呢?那就起头行动吧。

之前我也找过几个蜘蛛爬行记实东西PHP版,成果都不尽人意。并且这些PHP法度年夜多要进行安装,还要将蜘蛛爬行记实添加到MYSQL中,未免太麻烦。那就寻找一个简略单纯的蜘蛛爬行记实器吧~

谷歌bot

1.首先,在wordpress主题根目录成立一个robots.php文件,写入以下内容:

<?phpfunction get_naps_bot(){$useragent = strtolower($_SERVER['HTTP_USER_AGENT']);if (strpos($useragent, ’谷歌bot’) !== false){return ’谷歌bot’;}if (strpos($useragent, ’msnbot’) !== false){return ’MSNbot’;}if (strpos($useragent, ’slurp’) !== false){return ’Yahoobot’;}if (strpos($useragent, ’百度spider’) !== false){return ’百度spider’;}if (strpos($useragent, ’sohu-search’) !== false){return ’Sohubot’;}if (strpos($useragent, ’lycos’) !== false){return ’Lycos’;}if (strpos($useragent, ’robozilla’) !== false){return ’Robozilla’;}return false;}function nowtime(){$date=gmdate("Y-n-j H:i:s",time()+8*3600);return $date;}$searchbot = get_naps_bot();if ($searchbot) {$tlc_thispage = addslashes($_SERVER['HTTP_USER_AGENT']);$url=$_SERVER['HTTP_REFERER'];$file="robotslogs.txt";$time=nowtime();$data=fopen($file,"a");fwrite($data,"Time:$time robot:$searchbot URL:$tlc_thispage\n");fclose($data);}?>

将其上传于你的主题目录内。

2.在Footer.php或header.php的适当位置添加以下代码挪用robots.php。

<?php include(’robots.php’) ?>

法度原理:通过对蜘蛛标识符(如百度spider、谷歌bot)的判断,记实蜘蛛爬行时间,并生成日志文件robotslogs.txt于根目录。

法度缺点:无法记实蜘蛛爬行的页面,功能较为简单。

转载请注明:白开水的博客

分享到:

网友评论

热门建站经验