AI 专业名词百科

可搜索 · 分类 · 创建 · 编辑 · 评论

检索增强生成(RAG) Retrieval-Augmented Generation · RAG

结合“搜索 + 大模型”,让回答基于真实文档而非仅靠模型记忆,降低幻觉。

分类:rag 类型:concept 别名:检索增强

典型流程:

  1. 预处理:将文档切片(文档分块(Chunking)),为每段生成向量(向量(Embedding))。
  2. 存储:将向量与原文存入向量数据库(如 FAISS/Milvus)。
  3. 检索:通过检索器(Retriever)召回相似片段(可用向量检索、BM25混合检索(Hybrid Search))。
  4. 重排:用 Reranker 对候选片段做精排,提高证据质量与相关性(可选但常见)。
  5. 生成:将“问题 + 检索到的片段”作为上下文,提示大模型作答并引用来源。

优势:增强事实依据、易于按领域扩展、可控性更好;挑战包括检索召回、片段拼接与长上下文成本等。

扩展架构

  • 多路检索:结合稀疏检索(BM25)与向量检索,提高召回覆盖率(见 混合检索(Hybrid Search))。
  • 查询改写:使用自反思、HyDE 或多轮提问改善查询质量。
  • 迭代生成:ReAct-RAG、Self-RAG 等在生成过程中自我验证并追加检索。

工程关注点

  • 数据治理:需要定期更新知识库、去除重复和过期内容。
  • 评估指标:除答案准确率外,还要关注引用覆盖率、检索召回率与延迟;可参考 RAG 评测Grounding
  • 安全与合规:确保引用内容具备授权,避免泄露敏感数据。

相关词条

实践入口

参考资料

打开 GitHub 界面,修改后直接生成 PR

💬 用户评论与个人笔记