手机版 欢迎访问人人都是自媒体网站
选择query调研微博搜索功能对用户需求满足情况,从以下两个维度对所选择query进行分类,
内容类型维度:社会、影视娱乐、时尚美妆、体育运动、旅游、美食、互联网、文娱、科普教育、生活记录;
需求理解维度:需求明确-结构简单清晰的query、需求明确-口语化的query、需求明确有额外条件、需求不明确。
因此进行case调研的query如下图所示:
在微博手机客户端搜索这些query,记录得到的结果与相应的问题,汇总case如下图所示。
由于是手机截图,粘贴到文章里会比较占地方,所以本文就没有粘贴本次调研的实际情况截图,大家感兴趣的话可以用微博自己搜一下试试看。
对以上case中,存在问题的case进行分析,如下图所示。
汇总这些case的问题原因,即需要针对性解决的问题,如下图所示。
用户以最低成本获得需要的信息。
2. 核心指标定义用户搜索成功率,即用户在搜索query后,没有后续行为(包括更改query,切换tab等),直接获得需要的结果的概率。
3. 重要指标定义query解析准确率,即query解析准确的概率;
匹配准确率,即第一结果匹配准确的概率;
前10排序准确率,即前10结果排序准确的概率;
Query前10结果相关性,即一个query前10条结果与该query相关的概率。
case以上5个指标的满足情况如下图所示:
用户搜索成功率:27.50%;
query解析准确率:50.00%;
匹配准确率:40.00%;
前10排序准确率:35.00%;
Query前10结果相关性:52.50%。
4. 项目目标用户搜索成功率提升至40.00%;
Query解析准确率提升至60.00%;
匹配准确率提升至60.00%;
前10排序准确率提升至50.00%;
Query前10结果相关性提升至70.00%。
三、需求概述针对本次项目需要解决的问题,设计相应改进方案,并根据问题影响面&预期可解决影响面与成本,排列解决方案优先级,如下图所示。
(1)改进方案一
方案:query解析增强常用口语词库与口语转义词库,提高对query的口语识别能力。
逻辑说明:对口语化query,利用常用口语词库找出query中的口语,再利用口语转义词库进行转义,获得需求明确的简要query后再进行切词工作。
Case举例:
(2)改进方案二
方案:query解析提高切词正确性,对长query允许以多种query处理结果进行搜索。
逻辑说明:当用户输入较长query时,不仅能够针对query整体对微博结果进行召回,同时能够在切词后,对query进行处理,转换为多种可能的query,去除query中一些无关紧要的词,并再次对微博结果进行召回。通过多次召回,在所有结果中,命中匹配相关性最好的微博。
Case举例:
(3)改进方案三
方案:query解析增强转义词库,提高对query额外条件的识别能力
逻辑说明:用户输入的query,在切词后,能够通过转义词库,提取出query中的额外条件,在匹配与排序的逻辑中为该标签增加权重
Case举例:
(4)改进方案四
方案:query解析增强专有名词库,提高对query需求主体识别能力。
逻辑说明:对query切词后,根据专有名词库找出query主体。
Case举例:
(1)改进方案五
方案:匹配逻辑中,根据搜索query,提高匹配阈值,增加权威性、热度、时效性、原创性、内容相关性标签权重
逻辑说明:当用户搜索query较为复杂或长度较长,同时具有额外条件时,需要提高对召回结果的匹配阈值,过滤相关性较低的微博。
除此之外根据搜索query本身的特性与提取出的额外条件,增加与额外条件对应的权威性、热度、时效性、原创性等标签的权重。
Case举例:
(2)改进方案六
Copyright © 2018 DEDE97. 织梦97 版权所有 京ICP