Agent 框架对比：LangChain、LangGraph、CrewAI、OpenAI Agents SDK、Pydantic AI_综合开发

为什么要用 Agent 框架？

直接调 LLM API 就能完成简单任务——问答、翻译、摘要。但一旦涉及复杂流程，比如"先搜索资料再写报告，写完后自我检查，发现问题重新写"，就需要 Agent 模式：让模型自主决定调用什么工具、按什么顺序执行、什么时候停止。

Agent 框架解决的核心问题是：如何可靠地管理 LLM 的决策循环。你需要处理工具调用的解析和重试、对话状态的持久化、多步流程的编排、异常情况的回退、人工介入的暂停和恢复——这些如果全部自己写，代码量很快就会失控。

选框架，本质上是在选你想承担多少复杂度。越轻量的框架，你写代码的自由度越高；越重量级的框架，内置能力越全面，但你要学的概念也越多。

下面从五个主流框架中逐一拆解，帮你找到适合你团队的那个。

一、LangChain

2022 年底推出，是最早出圈的 AI 框架。核心思路是把 Prompt 模板、链式调用、工具绑定、记忆管理、文档加载、向量检索等环节封装成独立组件，开发者按需组合。核心抽象是 Runnable，通过 LCEL（LangChain 表达式语言）用 | 操作符串起来，类似 Unix 管道。

Agent 循环：内置 AgentExecutor，支持 ReAct 等多种模式
工具调用：@tool 装饰器或 BaseTool 子类
记忆管理：Buffer、Summary、Window、向量检索等多种 Memory 类
RAG 组件：50+ 文档加载器、30+ 向量数据库集成，生态最全
部署：LangServe 包装成 FastAPI 服务
调试：依赖 LangSmith 或自定义 Callback

缺点：抽象层太多，API 稳定性差，版本升级经常 breaking change。简单需求要写很多概念。

团队反馈

好评：教程最多、社区最大、踩过的坑别人都踩过。对刚开始做 AI 应用的团队来说，LangChain 仍然是最快的起步方式。RAG 组件生态无人能及。

差评："为什么这个简单的需求要写这么多层"是最常见的抱怨。v0.x 时代 API 频繁变动，很多团队被迫重写代码。部分开发者认为它把本来简单的事情复杂化了——"我只是想调个 API，却要先学清楚 Runnable、LCEL、Chain、AgentExecutor 的区别。"不少团队在生产环境中逐步剥离 LangChain，改用更轻量的方案。

二、LangGraph

LangChain 官方出品，解决的是 Chain 线性流程的限制。Agent 经常需要循环、分支、回退、并行——LangGraph 用有向图模型来描述这些行为。

核心架构：StateGraph（共享状态）+ Nodes（处理函数）+ Edges（流向，支持条件边）
Agent 循环：通过 StateGraph 的条件边实现 LLM→工具→LLM 循环
状态持久化：内置 Checkpoint 系统，支持 SQLite/Postgres/Redis，可暂停、恢复、回滚
多 Agent 协作：原生支持 Supervisor、Hierarchical、Swarm 等模式
Human-in-loop：interrupt_before / interrupt_after 支持人工介入
部署：LangGraph Cloud 或自行部署

缺点：学习曲线陡，需要理解图论概念。简单场景用 LangGraph 代码量反而更大。

团队反馈

好评：生产环境使用率最高的框架。复杂任务成功率 62%（对比 CrewAI 的 54%）。LinkedIn 的 AI 招聘助手和 Uber 的代码助手都用它构建。v1.0（2025.10）后 API 承诺 LTS，不再 breaking change。开发者评价："确定性的图结构是交付可靠 AI 的唯一方式。"

差评：文档质量被反复吐槽，高级用例的示例代码"很难读懂"。API 在 v1.0 之前频繁变动，很多团队在升级过程中不得不重写代码。从原型到生产比 CrewAI 慢约 40%。

三、CrewAI

CrewAI 的设计哲学是"多 Agent 团队协作"。每个 Agent 扮演特定角色（研究员、作家、审核员等），组成 Crew（小组）共同完成任务。它的 API 非常直观，适合快速构建多 Agent 流程。

核心架构：Agent（角色）→ Task（任务）→ Crew（小组）→ Process（流程）
多 Agent 协作：原生支持。Sequential（顺序执行）和 Hierarchical（层级管理）两种流程
记忆管理：支持短期记忆（对话历史）和长期记忆（嵌入式向量存储）
工具调用：支持 LangChain 工具和自定义工具，也可接入 MCP 工具
Human-in-loop：支持人工审核和审批节点
部署：CrewAI Enterprise（官方托管）或自行部署

缺点：底层基于 LangChain，继承了其部分抽象问题。复杂工作流的控制力不如 LangGraph 精细。社区对"角色扮演"式设计的生产可用性有分歧。

团队反馈

好评：原型开发速度最快，3 小时内就能搭出可用的多 Agent 流程。角色隐喻让非技术团队也能理解 Agent 的分工逻辑。GitHub 4.4 万+ star，教程和课程资源丰富。

差评：CrewAI 创始人自己也承认"原型到生产之间存在巨大鸿沟"。团队反馈：部署困难、调试复杂、代码结构在规模化后变得混乱。很多团队的实际路径是"用 CrewAI 做原型验证，用 LangGraph 重写上线"。对 90% 的使用场景来说 CrewAI 偏重。

四、OpenAI Agents SDK

OpenAI 官方推出的轻量级 Agent 框架。设计思路很明确：用代码定义 Agent，不用配置文件，不用学新概念。核心概念只有 Agent、Tool、Handoff、Guardrail 几个。

核心架构：Agent 对象 + Tools + Handoffs（Agent 间转交）
Agent 间转交（Handoff）：一个 Agent 可以把控制权转交给另一个 Agent，适合"先分类再分发"的场景
Guardrails：内置输入/输出审核机制，可以做安全过滤和合规检查
追踪：内置 tracing 功能，自动记录每次调用的输入输出和耗时
工具调用：Python 函数自动注册为工具，参数从函数签名提取 schema
流式输出：支持，可以逐事件接收

缺点：模型锁定 OpenAI，不支持多模型切换。功能相对简单，复杂场景需要自己扩展。

团队反馈

好评：API 极度简洁，没有多余的抽象层。对已经在使用 OpenAI API 的团队来说几乎是零学习成本。月下载量超过 1000 万次。Guardrails 是差异化优势，很多企业因为内置审核功能选择它。

差评：模型锁定 OpenAI 是最被诟病的点——很多团队需要 Anthropic 或 Gemini 来做对比测试。功能覆盖面不如 LangGraph 和 CrewAI，复杂多 Agent 场景下显得力不从心。

五、Pydantic AI

Pydantic 团队 2024 年 11 月发布。核心卖点是：Agent 开发最大痛点是结构化输出，而结构化输出是 Pydantic 的本职工作。用 Pydantic 模型贯穿整个 Agent 生命周期。

核心架构：Agent 对象 + Tools + result_type（Pydantic 模型定义输出格式）
Agent 循环：内置循环，输出验证失败时自动重试（ModelRetry）
工具调用：@agent.tool 装饰器，支持 RunContext 依赖注入
结构化输出：result_type 指定 Pydantic 模型，框架自动验证
多模型支持：OpenAI、Anthropic、Google、Groq、Mistral、Cohere
调试：logfire 集成（Pydantic 自家可观测平台）
多 Agent：支持 Sequential、Router、Orchestrator-Workers 模式，但需手动编排，无原生调度引擎

缺点：生态尚不成熟，仅支持 Python。多 Agent 需要手动组合，不如 LangGraph/CrewAI 的原生支持方便。

团队反馈

好评：Thoughtworks 技术雷达将其标记为"值得采用"。开发者评价："文档好、抽象层级合适、上手快"——喜欢 FastAPI 风格的人会自然喜欢它。类型安全和结构化输出是最大优势，适合数据处理、API 集成等场景。

差评：多 Agent 场景支持弱，一些团队认为"功能偏少"。部分场景仍需引入 LangChain 补充能力。生态处于早期阶段，社区解决方案和 Stack Overflow 上的回答数量有限。

六、对比矩阵

	LangChain	LangGraph	CrewAI	OpenAI SDK	Pydantic AI
定位	全栈 AI 工具集	图状 Agent 引擎	多 Agent 协作	轻量 Agent SDK	轻量 Agent 框架
语言	Python + JS/TS	Python + JS/TS	Python	Python + JS/TS	Python
模型支持	多模型	多模型	多模型	OpenAI	多模型
Agent 循环	AgentExecutor	StateGraph	Crew 编排	内置	内置
多 Agent	间接	原生	原生	Handoff	手动编排
Human-in-loop	不支持	原生	支持	不支持	不支持
Guardrails	自己实现	自己实现	无	内置	无
结构化输出	OutputParser	OutputParser	prompt 指令	prompt + 类型	Pydantic 模型
记忆管理	Memory 类	State 持久化	短期 + 长期	自己管理	message_history
RAG 组件	完整（50+）	继承 LangChain	有限	无	无
学习曲线	高	很高	低	低	中
生态	最大	大	活跃	官方	起步

七、选型建议

LangChain：需要 RAG（检索增强生成）、团队刚开始做 AI 应用、需要最多的教程和社区支持。不介意多一层抽象
LangGraph：需要多步循环/分支/回退的复杂流程、需要人工介入暂停恢复、生产环境要求最高控制力
CrewAI：快速构建多 Agent 团队、角色分工明确、团队对 AI 开发经验不多。适合原型验证和内部工具
OpenAI Agents SDK：只用 OpenAI、想要最轻量框架、需要内置 Guardrails 做安全审核
Pydantic AI：项目已在用 Pydantic、重视类型安全和结构化输出、需要多模型切换

实际生产中最常见的组合：Pydantic AI 或 OpenAI Agents SDK 处理单个 Agent 流程，当复杂度超过阈值时引入 LangGraph 来管理工作流。CrewAI 适合快速原型，但生产环境中很多人最终迁移到 LangGraph 以获得更细粒度的控制。LangChain 则在需要 RAG 组件时作为底层依赖被引入。

Agent 框架对比：LangChain、LangGraph、CrewAI、OpenAI Agents SDK、Pydantic AI

为什么要用 Agent 框架？

一、LangChain

团队反馈

二、LangGraph

团队反馈

三、CrewAI

团队反馈

四、OpenAI Agents SDK

团队反馈

五、Pydantic AI

团队反馈

六、对比矩阵

七、选型建议

相关推荐