提示词工程 Prompt Engineering
通过合适的指令/示例构造,提升模型在目标任务上的表现与稳定性。
Prompt 工程包括指令措辞、上下文组织、示例选择与输出格式约束等实践,是零样本/少样本迁移的关键手段。
常见策略
- 零样本提示(Zero-shot):直接描述任务目标与约束,适合通用任务。
- 少样本提示(Few-shot):提供示例问答或输入输出对,帮助模型模仿模式。
- 思维链提示(Chain-of-Thought):要求模型逐步展示推理过程,适合复杂推理问题。
- 角色设定与上下文记忆:通过设定身份、提供背景信息提升回答一致性。
- 系统提示词(System Prompt)与模板化 Prompt:在系统层预设模型「角色」「风格」与输出格式,通过固定模板(Prompt Template)复用结构化提示。
- ReAct / Reflexion 等 Agent 风格 Prompt:将「思考-行动-反思」写入提示结构中,用于复杂工具调用与自主任务执行。
工程实践
- 结构化模板:使用 Markdown、JSON Schema、正则约束输出格式,便于解析。
- 检索增强:结合向量检索或知识库动态构建提示上下文。
- 自动化迭代:利用提示调优工具(如 Prompt Tuning、RLHF 或评估器)批量实验效果。
评估与风险
- 稳健性:注意提示对措辞敏感,需进行 A/B 测试与鲁棒性评估。
- 偏见与安全:提示可能触发敏感内容,应配合安全策略与过滤器。
- 提示注入:当系统会“读取外部内容”(网页/文档/检索结果)时,需要重点防护提示注入与间接注入风险,见 提示注入。
- 成本控制:长提示会增加上下文开销,需要平衡效果与费用。
参考资料
- Brown et al. “Language Models are Few-Shot Learners.” (2020).(提出利用提示实现零样本/少样本迁移)
- Liu et al. “Pre-train, Prompt, and Predict: A Systematic Survey of Prompting Methods in Natural Language Processing.” (2023).(综述提示方法与应用)
- OpenAI. “Best practices for prompt engineering with the OpenAI API.” (2023).(提供工程层面的提示设计建议)
打开 GitHub 界面,修改后直接生成 PR