会员登录 | 会员注册 | 意见建议 | 网站地图

站长资源综合门户

当前位置:首页 > 搜索引擎 > TF-IDF框架与其可以衍生到的搜索引擎优化知识

TF-IDF框架与其可以衍生到的搜索引擎优化知识

时间:2012-03-13 18:36:21   作者:   来源:   点击:

到谷歌去别离搜索下"喷码机"和"代价"二词,"喷码机"的成果年夜约是20,600,000个,"代价"则对应年夜约1,850,000,000个搜索成果,后者的DF值年夜约高前者百倍。(之所以不到百度去搜索,因为百度显示搜索成果数量上限为1亿个)

在这种情况下,哪怕"喷码机"和"代价"二词都在一篇文档中呈现相同的次数,后者也会因为IDF因子的影响,而致使权值远远低于前者。

因此,一般情况下只有当"喷码机"这个词权值高的页面,才有机缘在"喷码机代价"这个词的排名上取得好的表示,和"代价"此词权值的关系很小。因为无论如何,"代价"此词的权值是不成能通过TF-IDF法则取得太多的。

所以至少对百度而言,想伶仃做"喷码机代价"这种词的排名的话,一般要用"喷码机"排名本就很高的着陆页来做,不然相对会难的多。

最后

限于自己的搜索引擎优化水平,无法妄论搜索引擎优化是否应该去对搜索引擎进行很深入的体会,并且至少主不雅角度上,我认为搜索引擎优化在搜索引擎原理里面钻太深是意义不年夜的事情。但前面提到的,我想只应该算是必须掌握的根本,如果连对搜索引擎最经典的根本算法都没有花过任何精力去体会的话,又谈何与搜索引擎打交道呢?

原文地址:http://semwatch/2012/03/tf-idf/

分享到:

网友评论