AI 专业名词百科

可搜索 · 分类 · 创建 · 编辑 · 评论

混合检索 Hybrid Search

将稀疏检索(如 BM25)与向量检索(dense retrieval)组合,提升召回覆盖与鲁棒性,是很多 RAG/AI 搜索系统的常用默认配置。

分类:rag 类型:method 别名:Hybrid Search, 混合搜索

混合检索(Hybrid Search)指把稀疏检索(BM25/关键词匹配)与向量检索(语义相似)结合起来,用两条“互补”的信号提升召回覆盖率。

为什么混合检索常有效

  • 稀疏检索擅长“精确词项”(专名、编号、代码符号)
  • 向量检索擅长“语义相近”(同义改写、概念相关)

常见融合方式

  • 并集召回:分别取 top-k,再合并去重。
  • 加权融合:对 BM25 分数与向量相似度做归一化后加权。
  • 分层检索:先 BM25 粗筛,再向量/重排精筛(或反过来)。

实践建议

  • 先用回归集确定:你的查询更偏“关键词型”还是“语义型”,再决定权重/策略。
  • 混合检索后通常更需要 reranker 来做最终精排与证据质量控制。

相关词条

打开 GitHub 界面,修改后直接生成 PR

💬 用户评论与个人笔记