Appearance
AI Agent 框架与工具
Agent 是 2024-2025 年 AI 领域最热的方向。本页汇总主流的 Agent 框架、工具与设计模式,帮助你选型并构建自己的 Agent 系统。
Agent 框架
多 Agent 协作框架
| 框架 | 开发者 | 核心特点 | 最佳场景 | 链接 |
|---|---|---|---|---|
| LangGraph | LangChain | 状态机、图结构工作流、循环/条件支持 | 复杂工作流、需要精确控制 | GitHub |
| AutoGen | Microsoft | 多 Agent 对话、人机协作、代码执行 | 研发团队、需要人工干预 | GitHub |
| CrewAI | João Moura | 角色扮演、任务委托、流程简洁 | 业务流程自动化 | GitHub |
| Semantic Kernel | Microsoft | SDK 形式、多语言支持、企业级 | .NET/Java/Python 企业应用 | GitHub |
单 Agent 与工具调用
| 框架 | 特点 | 最佳场景 | 链接 |
|---|---|---|---|
| LlamaIndex Agents | 数据驱动、检索工具、观察执行 | RAG + Agent 结合 | Docs |
| OpenAI Assistants API | 官方支持、简单上手 | 快速原型、无框架负担 | Docs |
| Pydantic AI | 类型安全、Pythonic、生产级 | Python 团队、类型驱动 | GitHub |
| Smolagents | Hugging Face 轻量框架、简洁 | 快速原型、教学 | GitHub |
| Letta | 持久化记忆 Agent、状态管理 | 长期运行、记忆重要的应用 | GitHub |
特定领域 Agent
| 框架/工具 | 领域 | 特点 | 链接 |
|---|---|---|---|
| SWE-agent | 软件工程 | 修复 GitHub Issues、类 Devin | GitHub |
| Devin (Cognition) | 软件工程 | 端到端自主开发 | cognition.ai |
| OpenHands | 软件工程 | 开源 Devin 替代 | GitHub |
| Browser-use | 网页操作 | 控制浏览器自动化 | GitHub |
| Composio | 工具集成 | 100+ 工具接入、类型安全 | composio.dev |
Agent 设计模式
常见架构模式
| 模式 | 描述 | 适用场景 | 代表框架 |
|---|---|---|---|
| ReAct | 推理 → 行动 → 观察 循环 | 工具调用、多步骤任务 | LangChain, LlamaIndex |
| Plan-and-Execute | 先规划全局步骤,再逐步执行 | 复杂任务、需要预览规划 | LangGraph, AutoGen |
| Multi-Agent | 多个专家 Agent 协作 | 复杂系统、需要多角色 | AutoGen, CrewAI |
| Reflection | Agent 自我审查和改进 | 质量要求高、迭代优化 | LangGraph |
| Tool Use | LLM 调用外部工具 | 数据查询、计算、操作 | 所有框架 |
角色设计模板
markdown
## CrewAI 角色设计模板
- **角色名称**: 清晰描述身份
- **目标**: 该角色的核心任务
- **背景故事**: 专业背景和经验
- **技能集**: 擅长的工具和方法
- **协作规则**: 与其他角色的交互方式工具与记忆管理
工具集成平台
| 平台 | 工具数量 | 特点 | 链接 |
|---|---|---|---|
| Composio | 100+ | 类型安全、自动认证、监控 | composio.dev |
| LangChain Tools | 50+ | 生态丰富、社区支持 | Docs |
| MCP (Model Context Protocol) | 增长中 | Anthropic 开标准、统一接口 | GitHub |
| Toolhouse | 20+ | 管理、版本控制、监控 | toolhouse.ai |
记忆管理方案
| 方案 | 类型 | 特点 | 实现 |
|---|---|---|---|
| 短期记忆 | 对话历史 | 窗口内上下文 | 框架内置 |
| 长期记忆 | 知识库 | 向量数据库存储 | 向量 DB + 嵌入 |
| 工作记忆 | 任务状态 | 当前任务上下文 | 状态管理器 |
| 持久化身份 | 用户模型 | 跨会话用户理解 | Letta, Mem0 |
Agent 评估与监控
评估工具
| 工具 | 功能 | 链接 |
|---|---|---|
| AgentEval | 多维度 Agent 能力评估 | GitHub |
| TrajEval | 轨迹评估 | 学术工具 |
| Arize Phoenix | Agent 可观测性 | GitHub |
监控指标
markdown
## Agent 运行监控指标
### 效率
- [ ] 任务完成率
- [ ] 平均步骤数
- [ ] 平均响应时间
- [ ] Token 消耗量
### 质量
- [ ] 输出准确性
- [ ] 工具调用正确率
- [ ] 用户满意度
### 安全
- [ ] 工具调用审计
- [ ] 敏感操作检测
- [ ] 资源使用监控框架选型指南
| 场景 | 推荐框架 | 理由 |
|---|---|---|
| 快速原型/教学 | Smolagents / OpenAI Assistants | 简单、无学习曲线 |
| 复杂工作流 | LangGraph | 状态机、精确控制 |
| 多角色协作 | CrewAI / AutoGen | 角色抽象、对话模式 |
| 企业级应用 | Semantic Kernel | 多语言、企业支持 |
| Python 生产级 | Pydantic AI | 类型安全、可维护 |
| 数据驱动 Agent | LlamaIndex | RAG 深度集成 |
| 长期运行 Agent | Letta | 持久化记忆 |
相关页面
- AI Agents — AI Agent 概念
- Function Calling / Tool Use — 函数调用与工具使用
- Model Context Protocol (MCP) — MCP 协议
- RAG 系统搭建入门指南 — RAG 系统搭建入门
- Agent 框架对比 — Agent 框架对比
- Workflow vs Agent — 工作流 vs Agent 对比
参考来源
- LangGraph 官方文档
- AutoGen 文档
- CrewAI 文档
- Semantic Kernel 文档
- Pydantic AI 文档
- Letta 文档