Skip to content

Prompt 工程资源

Prompt 是与 LLM 交互的核心界面。本页汇总提示词设计技巧、优化工具、管理平台与编程式方法,帮助你系统性地提升提示词质量。

经典技巧手册

综合指南

资源作者/机构特点链接
Prompt Engineering GuideDAIR.AI最全面的开源指南,覆盖所有主流技巧promptingguide.ai
OpenAI Prompt EngineeringOpenAI官方最佳实践,策略与案例platform.openai.com
Anthropic Prompt LibraryAnthropic官方提示词模板库docs.anthropic.com
Google Prompt EngineeringGoogleGemini 优化指南ai.google.dev
Microsoft Prompt EngineeringMicrosoft系统性方法论learn.microsoft.com

高级技巧

技巧描述适用场景
Chain-of-Thought让模型逐步推理数学、逻辑、复杂问题
Few-Shot Prompting提供示例让模型学习模式分类、格式转换、风格模仿
Self-Consistency多次采样选多数答案需要高可靠性的任务
Tree of Thoughts多路径探索和评估创意、策划、搜索空间大
ReAct推理 + 行动交替工具调用、多步骤任务
Meta-Prompting让模型生成/优化提示词提示词自动化、批量生成

编程式 Prompt 优化

框架与库

工具特点最佳场景链接
DSPyStanford 开发,算法优化提示词和权重研究/生产级优化GitHub
TextGrad自动差分优化提示词自动微调GitHub
OPROGoogle 提示词优化,用 LLM 优化提示词自动发现最佳提示词Paper
PromptBreederDeepMind 自动提示词进化进化算法优化Paper

编程式框架对比

框架优化方法学习曲线生产就绪
DSPy签名优化、自动提示词中等
TextGrad梯度下降部分
OPRO迭代优化部分
手动迭代人工调试

Prompt 管理平台

生产级管理

平台功能定价链接
PromptLayer版本控制、性能追踪、协作按使用量promptlayer.com
Humanloop评估、测试、协作企业定价humanloop.com
Pezzo开源 Prompt 管理、版本控制免费/自托管GitHub
Langfuse Prompt Management开源、与追踪集成免费/自托管langfuse.com

测试与评估

工具功能开源链接
Promptfoo批量测试、红队测试、CI/CD 集成GitHub
ChainForge可视化 Prompt 测试和比较GitHub
Weave (Weights & Biases)实验跟踪和比较部分wandb.ai
PromptBench对抗性提示词测试GitHub

领域专用技巧

代码生成

技巧描述效果
详细规范提供接口定义、输入输出示例显著提升代码质量
步骤分解将复杂任务拆分为小步骤减少错误
测试驱动要求生成测试用例提高代码可靠性

创意写作

技巧描述效果
角色定义明确指定写作风格和受众一致性和适配性
框架提示提供结构化框架组织性和完整性
迭代修改逐步细化和调整精细控制输出

数据分析

技巧描述效果
结构化输出要求 JSON/XML 格式可解析、可程序化
分步执行先分析再总结减少幻觉
上下文管理提供相关背景和约束提高准确性

Prompt 设计清单

markdown
## 高质量 Prompt 设计清单

### 基础
- [ ] 明确任务目标
- [ ] 定义输出格式
- [ ] 提供背景信息
- [ ] 设定角色和语气

### 高级
- [ ] 提供示例 (Few-Shot)
- [ ] 设定约束和限制
- [ ] 添加推理请求 (CoT)
- [ ] 设计错误处理逻辑

### 优化
- [ ] 测试多个变体
- [ ] 评估输出质量
- [ ] 追踪性能指标
- [ ] 版本控制和文档化

相关页面

参考来源

  • DAIR.AI Prompt Engineering Guide
  • OpenAI Prompt Engineering 文档
  • Anthropic Prompt Library
  • DSPy 文档
  • Promptfoo 文档

AI Knowledge Base — 持续积累