AI Agent 框架与工具

Agent 是 2024-2025 年 AI 领域最热的方向。本页汇总主流的 Agent 框架、工具与设计模式，帮助你选型并构建自己的 Agent 系统。

Agent 框架

多 Agent 协作框架

框架	开发者	核心特点	最佳场景	链接
LangGraph	LangChain	状态机、图结构工作流、循环/条件支持	复杂工作流、需要精确控制	GitHub
AutoGen	Microsoft	多 Agent 对话、人机协作、代码执行	研发团队、需要人工干预	GitHub
CrewAI	João Moura	角色扮演、任务委托、流程简洁	业务流程自动化	GitHub
Semantic Kernel	Microsoft	SDK 形式、多语言支持、企业级	.NET/Java/Python 企业应用	GitHub

单 Agent 与工具调用

框架	特点	最佳场景	链接
LlamaIndex Agents	数据驱动、检索工具、观察执行	RAG + Agent 结合	Docs
OpenAI Assistants API	官方支持、简单上手	快速原型、无框架负担	Docs
Pydantic AI	类型安全、Pythonic、生产级	Python 团队、类型驱动	GitHub
Smolagents	Hugging Face 轻量框架、简洁	快速原型、教学	GitHub
Letta	持久化记忆 Agent、状态管理	长期运行、记忆重要的应用	GitHub

特定领域 Agent

框架/工具	领域	特点	链接
SWE-agent	软件工程	修复 GitHub Issues、类 Devin	GitHub
Devin (Cognition)	软件工程	端到端自主开发	cognition.ai
OpenHands	软件工程	开源 Devin 替代	GitHub
Browser-use	网页操作	控制浏览器自动化	GitHub
Composio	工具集成	100+ 工具接入、类型安全	composio.dev

Agent 设计模式

常见架构模式

模式	描述	适用场景	代表框架
ReAct	推理 → 行动 → 观察循环	工具调用、多步骤任务	LangChain, LlamaIndex
Plan-and-Execute	先规划全局步骤，再逐步执行	复杂任务、需要预览规划	LangGraph, AutoGen
Multi-Agent	多个专家 Agent 协作	复杂系统、需要多角色	AutoGen, CrewAI
Reflection	Agent 自我审查和改进	质量要求高、迭代优化	LangGraph
Tool Use	LLM 调用外部工具	数据查询、计算、操作	所有框架

角色设计模板

markdown

## CrewAI 角色设计模板

- **角色名称**: 清晰描述身份
- **目标**: 该角色的核心任务
- **背景故事**: 专业背景和经验
- **技能集**: 擅长的工具和方法
- **协作规则**: 与其他角色的交互方式

工具与记忆管理

工具集成平台

平台	工具数量	特点	链接
Composio	100+	类型安全、自动认证、监控	composio.dev
LangChain Tools	50+	生态丰富、社区支持	Docs
MCP (Model Context Protocol)	增长中	Anthropic 开标准、统一接口	GitHub
Toolhouse	20+	管理、版本控制、监控	toolhouse.ai

记忆管理方案

方案	类型	特点	实现
短期记忆	对话历史	窗口内上下文	框架内置
长期记忆	知识库	向量数据库存储	向量 DB + 嵌入
工作记忆	任务状态	当前任务上下文	状态管理器
持久化身份	用户模型	跨会话用户理解	Letta, Mem0

Agent 评估与监控

评估工具

工具	功能	链接
AgentEval	多维度 Agent 能力评估	GitHub
TrajEval	轨迹评估	学术工具
Arize Phoenix	Agent 可观测性	GitHub

监控指标

markdown

## Agent 运行监控指标

### 效率
- [ ] 任务完成率
- [ ] 平均步骤数
- [ ] 平均响应时间
- [ ] Token 消耗量

### 质量
- [ ] 输出准确性
- [ ] 工具调用正确率
- [ ] 用户满意度

### 安全
- [ ] 工具调用审计
- [ ] 敏感操作检测
- [ ] 资源使用监控

框架选型指南

场景	推荐框架	理由
快速原型/教学	Smolagents / OpenAI Assistants	简单、无学习曲线
复杂工作流	LangGraph	状态机、精确控制
多角色协作	CrewAI / AutoGen	角色抽象、对话模式
企业级应用	Semantic Kernel	多语言、企业支持
Python 生产级	Pydantic AI	类型安全、可维护
数据驱动 Agent	LlamaIndex	RAG 深度集成
长期运行 Agent	Letta	持久化记忆

参考来源

LangGraph 官方文档
AutoGen 文档
CrewAI 文档
Semantic Kernel 文档
Pydantic AI 文档
Letta 文档

AI Agent 框架与工具 ​

Agent 框架 ​

多 Agent 协作框架 ​

单 Agent 与工具调用 ​

特定领域 Agent ​

Agent 设计模式 ​

常见架构模式 ​

角色设计模板 ​

工具与记忆管理 ​

工具集成平台 ​

记忆管理方案 ​

Agent 评估与监控 ​

评估工具 ​

监控指标 ​

框架选型指南 ​

相关页面 ​

参考来源 ​

AI Agent 框架与工具

Agent 框架

多 Agent 协作框架

单 Agent 与工具调用

特定领域 Agent

Agent 设计模式

常见架构模式

角色设计模板

工具与记忆管理

工具集成平台

记忆管理方案

Agent 评估与监控

评估工具

监控指标

框架选型指南

相关页面

参考来源