当我们起头展开一项搜索引擎优化工作时,第一件要做的事情是要包管我们做的任何事情都可以有数据的支撑——而不是自己的直觉。搜索引擎优化的主要数据来历来自两块:网站的办事器日志、第三方流量阐发东西。
网站办事器日志
Apache,Nginx等常常使用办事器的内置日志配置格局Combine已经可以满足年夜大都搜索引擎优化阐发需求。它看上去近似是这样的:
111.111.111.111 – - "[20/Feb/2012:18:09:25 +0800]""GET / HTTP/1.1″ 200 3121"http://***/""Mozilla/5.0 (compatible; 谷歌bot/2.1; +.谷歌/bot.html)"
必须记实的信息诸如:拜候来历IP、拜候时间、拜候页面、HTTP响应状态码、拜候来历及客户端标识等,这些在Combine日志格局里面都有。
在确保办事器日志可以满足其他部分的阐发需求下,至少要确保上面提到的几项被记实在办事器日志里面。但也不要将任何可以记实的数据都记实下来,只选择实际需要的部分,不然会使得网站日志体积很是年夜,晦气于阐发起来的效率。这些内容可能需要和运维进行沟通解决。
然后关于日志的阐发,我认为没太多固定的准备工作可做,因为它的数据来历是原始的(raw似乎听上去会更有感触感染?),所以可选择的数据维度几近是无限的。因此尤其要按实际需求进行相应的措置与阐发。
对一些要求其实不是特别高的日志阐发需求,可以测验测验使用光年日志阐发系统。虽然我小我对所有图形界面的实用类法度都不带好感,但它提供了一些很不错的数据维度的思路。
听说有一家年夜型的旅游网站是采取MongoDB连络Map/Reduce进行日志阐发的,我小我也用过MongoDB实现过前面提到的光年日志阐发的一部分重要功能。所以感触感染MongoDB是个可以斟酌的选择。
第三方流量阐发东西
谷歌 Analytics的安装
对免费流量阐发东西,谷歌 Analytics绝对是其中的佼佼者(以下简称GA)。不过如果网站的月阅读量年夜于500W的话,只有谷歌 Adwords的用户,才能继续免费使用GA进行流量的记实与阐发。下面都以它为例。
在GA添加需要追踪流量的网站以后,它会提示你添加一段JavaScript代码,到每一个你需要追踪页面的</head>标识表记标帜之前。代码的添加多是一件很轻松的工作,但也可能很是麻烦,主要取决于网站的模板层。
先提下常见开源博客法度WordPress的体例,它采取了包含的模板措置体例,比如网站首页、列表页、文章页等自身的模板,都是只有傍边一部分的。而包含网页LOGO等的网页头部,都使用WordPress的get_header体例来加载另外一个自力的模板文件(get_header体例素质上是PHP里面的include函数)。简言之,只要在header.php那个文件上面添加代码,包含它的所有网页城市随着改,很快便可以把GA代码添加好。
但情况其实不总是抱负的,尤其对使用网站框架自己进行开辟的网站,有时并没有将包含这样的体例很好的运用。这多是网站的扶植规范不完善的关系,也多是网站需求致使了确实无法使用和WordPress近似的包含体例。那么,至少要在每个网页的头部,额外包含一小段加载全局JavaScript的区块,以便利的添加全局性的JavaScript代码。
虽然未必在添加GA代码时,对可能糟糕的网站模板布局去进行更改,最多到几十个不合的模板文件里面去别离加下代码就是了(当然也要花些时间去包管没有漏过哪些页面)。但一次性弄定一些素质性的问题会带来很多日后的便当性——比如又要换一套统计代码。
相对最麻烦的事情也许是如何说吃法度员为了一些看似小的需求而修改模板布局,这边就略过了。
一些根本的谷歌 Analytics设置
对搜索引擎优化而言,一项最根本的设置,就是要把网站上对搜索引擎优化有价值的页面进行归类。对页面进行区分,并以此掌握了它们的流量现状及趋势以后,才能掌控搜索引擎优化的偏重点,及更好的阐发网站上每次搜索引擎优化修改的成效等等。
如最简单的例子,对一个网站,如果手头有1000条外链,应该给网站的栏目页仍是产品页?这主要取决于哪类页面有更高的转化率与更年夜的搜索引擎优化流量提升空间。
对每个网站而言,都存在不合的情况。比如一个书籍类的电商网站,它列表页不会有太多流量,没多少人搜索什么"计较机书籍",但会更多人搜索《乔布什自传》之类,因为用户有很明确的需求。而对一个衣饰电商,相应更多人会搜索"衬衫"之类,而非"2012年春季新款白色衬衫"等,因为用户只是想到网站上挑衣服,他们只有需求的意向,但具体需求是模糊的。