接上一篇文章:B2C站内搜索初探一,继续斟酌以下问题:
3、让用户搜什么内容?
比较明显,一般b2c网站的内容就是商品、外加部分新闻通知布告和帮忙文章。对平台性的网站,如淘宝和京东,因为支持店中店,内容还包含店铺和品牌。内容虽然简单,一般是是会简单的对内容做“搜索分区”,分区的目的是不让用户在同一个搜索成果列表既看到商品展示、又看到文章和店铺的展示。
淘宝商城有两个区域:商品和店铺
1688有三个分区:产品、公司和求购信息
豆瓣默认搜索是不分区域的
说归说,目前主流的b2c网站搜索内容仅是商品,品牌或店铺等被归为商品的属性,搜索根基也不分区。
仅让用户搜索商品,用户常会搜索商品的哪些组件?
这里我把用户常常使用的几个搜索组件按重要水平分为3个品级:A、B、C;
序号
组件名称
权重
1
商品题目
A
2
品牌(或生产厂家)
B
3
分类
B
4
各类属性规格(如颜色尺码等)
B
5
款号(或货号)
B
6
商品详情
C
7
Keywords
C
8
Description
C
9
代价
C
1)商品题目是用户最常见的搜索组件,也是最容易记忆的组件,因此最重要。年夜部分没有采取全文检索手艺的站点,是直接是通过SQL语句模糊查询商品题目关头词的。
2)品牌、分类和各类属性规格、款号,这是用户常采取的第二种搜索类型,作为一个全文检索引擎,这几个组件必定要斟酌。
3)对商品详情、keywords、description和代价等组件,如果进行索引,对搜索引擎系统的要求将比较高。估计国内目前也唯一淘宝会斟酌对商品详情进行索引。
确定了要让用户搜索到的组件,搜索系统就要起头对这些组件进行索引,索引后保存在专门的索引数据库,提高查询效率。而采取索引机制,索引的新增速度和删除速度要斟酌好。索引内容和数据库内容不一致会让用户很失望:产品上新了一整天还不克不及搜索到? 已下架每库存的商品是否一直在前端展示着,让用户可搜索到?这些都需要好好斟酌。
4、接着下一步
搜索系统已经成立了索引,用户可以起头搜索了。用户点击搜索后,检索系统按照关头词对索引进行检索、阐发和匹配,中间的过程太复杂。这里略过,简单说说“查全率”和“查准率”两个概念,以及如安在B2C站内搜索中平衡二者。