检索器 · AI 专业名词百科

检索器 Retriever

RAG 系统中负责“把问题变成检索请求并召回候选证据”的模块，可基于 BM25、向量检索或混合检索实现。

分类：rag 类型：concept 别名：Retriever, 检索模块

检索器（Retriever）是 RAG 流程中的“召回层”：给定用户问题（或改写后的查询），从索引中找出 top-k 候选片段/文档作为证据，再交给后续的重排（rerank）与生成（generate）。

典型输入与输出

输入：query（可能包含改写、扩展、过滤条件）
输出：候选列表（文档/片段）+ 分数 + 元数据（来源、更新时间、权限、位置）

常见实现

稀疏检索：BM25 等
向量检索：embedding + ANN（如 HNSW）
混合检索：BM25 + 向量

实践提醒

Retriever 的“召回覆盖”与“证据质量”决定了生成上限；不要把问题都归因到 LLM。
一定要保留可回放的检索日志：query、top-k、分数、过滤条件、版本信息。

相关词条

RAG、BM25、混合检索（Hybrid Search）、Reranker

打开 GitHub 界面，修改后直接生成 PR