用户 Query
事实、教程、视频、事件、可直接回答需求
在没有大模型叙事的时候,先回答一个朴素问题:用户搜完到底解决了吗?
我的判断
搜索质量不是结果多不多,而是用户有没有少走弯路。很多时候,第一条结果就决定了这次搜索是不是成立。
搜索质量与问答式搜索 · One Page
这个项目不要硬讲成今天的大模型项目。当时更真实的问题是: 用户搜完以后,到底有没有解决问题。我的重点不是证明某个模型很先进, 而是先定义什么叫搜索满足,再把它转成内容引入、结果评估、排序调优和问答式结果命中的策略动作。
当时还没有大模型搜索叙事。更真实的问题是:用户搜完以后,到底有没有少走弯路。
当时有过语义模型探索,但收益有限。很多 bad case 最后还是回到意图、供给和评估标准。
搜索不像推荐可以慢慢纠偏。很多时候,第一条结果就决定这次搜索是不是成立。
核心口径
Query 是找事实、教程、视频、事件,还是在问一个可以被直接回答的问题。
没有好内容,排序很难救;有好内容但标准不清,也很难稳定优化。
不是结果列表看起来相关就够了,要看第一条是否真正解决用户问题。
只有适合直接回答的需求,才应该追求问答式结果、答案可信和可验证。
主线 A
供给标准 × 结果评估 × 排序调优主线 B
可回答需求 × Top1 命中 × 答案可信策略链路
Query 分型
供给补齐
评估标准
排序调优
Top1 命中
答案承接
结果与沉淀
多端视频搜索体验
问答式结果覆盖用户搜索需求
综合搜索结果准确性
项目架构图
搜索不是给一堆结果,而是让用户少走弯路。
事实、教程、视频、事件、可直接回答需求
先判断用户到底想解决什么问题
内容是否足够好、可消费、可信、时效合适
排序调优、Top1 命中、问答式答案承接
人工评估、横向对照、bad case 归因
Quick Read
用户更快找到答案或合适的视频结果,少在不相关结果里反复试错。
搜索质量不是结果多不多,而是用户有没有少走弯路。很多时候,第一条结果就决定了这次搜索是不是成立。
视频搜索体验做到行业第一,问答式结果覆盖 10%+ 搜索需求,综合搜索准确性从落后达到目标水平。
项目笔记
搜索和推荐不一样。推荐是在不确定兴趣里分发内容,搜索是用户带着明确需求来找东西,很多时候甚至是在要一个答案。当时还没有今天的大模型搜索叙事,当时也有语义模型探索,但在搜索场景里的收益并没有想象中那么高。后来我更清楚地意识到,很多搜索 bad case 不是因为模型名字不够先进,而是更基础的事情没被定义清楚:这个 Query 到底要什么,平台有没有足够好的供给,第一条结果有没有命中,直接答案是否可信。
AI 迁移
用大模型识别 Query 是找事实、找教程、找视频、找经验还是适合直接回答,并生成可解释的需求标签。
用 LLM-as-Judge 评估搜索结果是否相关、完整、可信、可消费,辅助人工评估扩量和一致性校准。
围绕 Top1 精准命中、答案可验证、引用来源和用户意图满足度,对 AI 答案进行自动评估。
让 AI 自动归因搜索不满足来自需求识别、内容供给、排序策略还是答案生成,辅助策略迭代。
方法资产