会员登录 | 会员注册 | 意见建议 | 网站地图

站长资源综合门户

当前位置:首页 > 搜索引擎 > 百度中文分词手艺的一点小猜想

百度中文分词手艺的一点小猜想

时间:2012-06-27 19:47:56   作者:   来源:   点击:

年夜家都知道,百度的中文分词手艺比谷歌做的好,以下引用网络上找到的一张图片说明:

从上图可以推断出,百度遇到一个关头字,应该是先不进行分词,而是先检索百度百科的词条和百度指数有指数的中文词进行匹配,无法切确匹配的话,再进行分词,前两年在百度搜索关头字“利川新闻网”时,被分为利川/新闻/网,自从这个关头字有指数以后,百度会把它当作一个完整的关头词。

当然,百度的分词手艺必定比我小我推断出来的要复杂的多,作为百度旗下的产品,百度不会抛却自己的资源,必定会参考百度百科的词条作为分词算法的一部分,所以同样做搜索的腾讯搜搜也开辟了自己的百科,可是我们以后在做搜索引擎优化的时候,遇到比较偏的长尾关头词不克不及被正确分词的情况下,可以在百度百科成立一个词条,然后在参考资料里加上自己的链接,这样还可以解决百度相关产品权重比我们的网站高的问题。

本文由利川在线原创,A5平台首发,转载请注明出处,本文来历网址:.445400/blog/610.html

分享到:

网友评论