SaaS 曾经很乖。数据库、工作流、仪表盘,一切都是固定的,你按流程走就行。现在 AI 来了,像一匹野马,力气大但不服管。问题不再是"要不要用 AI",而是"怎么驯住它"。
Tomasz Tunguz 最近画了一张图,把 AI 智能体的"驾驭系统"拆成了七个部分。我觉得这个框架讲得挺清楚,值得展开聊聊——不只是对做 AI 产品的人,对普通人理解 AI 到底在干什么也有帮助。

一、上下文与记忆
通用模型的问题在于,它什么都知道一点,但不了解你的具体情况。给放射科医生用的检索系统,和给律师助理用的,根本不是一回事。
有时候需要短期记忆:这个智能体 45 秒前在干什么?有时候需要大规模图像检索,比如医学影像或者视频生成。有时候需要在十亿级文档里做关键词搜索。这些系统都得针对具体场景定制,才能拿到靠谱的结果。
比检索更难的是"上下文数据库"——说白了就是每家公司怎么运转的那套操作手册。我们脑子里都装着这些东西,每天带去上班。怎么把它固化下来,怎么随着人员和流程变化去更新它,这才是上下文数据库的核心。
二、工具与行动
光有想法不行,得能干活。工具就是智能体跟外界打交道的手段。上下文数据库里的操作手册说了"要做什么",工具就是"用什么去做"。
一个现代的驾驭系统会把工具注册到一个目录里,校验模型传过来的参数,执行调用,敏感操作还要走审批,最后把结果解析回去。MCP 协议已经成了这层连接的通用语言。驾驭系统的好坏,取决于它能安全地接入多少工具,以及处理失败时有多干净。
三、编排与循环
智能体的工作模式是:想一想、做一件事、看看结果、再想一想。规划、拆解任务、调度子智能体、重试、设定停止条件——这些决定了活儿怎么干完。
我们还希望软件越用越好。能从每次执行中学习的闭环模式,会成为不同产品之间的分水岭。
四、状态与持久化
大公司里很多人同时用一个系统,系统必须扛得住。智能体跑到第 7 步崩了,应该从第 8 步接着来,而不是从头开始。文件系统、检查点、会话线程、产物存储——这些都是防止白干的机制。
听起来像老生常谈,但真做起来坑很多。分布式系统里的状态管理从来都不简单,加上 AI 的非确定性,难度又上了一个台阶。
五、沙箱与计算
每个智能体都需要一个自己的沙箱。隔离的工作空间、受控的网络出口、凭证放在模型外面——这三样东西保证了安全性、隐私性和规模化时的性能。
你不会想让一个 AI 智能体拿着你的数据库密码到处跑。沙箱就是那道围栏。
六、可观测性与治理
看不见的东西你没法信任。追踪每一步操作,记录每次工具调用,用评估测试做回归检测,高风险决策让人类介入——这些是把 demo 变成生产系统的关键。
护栏执行策略,评估在客户发现之前先抓到问题。没有这层,你做的就不是产品,是个定时炸弹。
七、成本与工作流优化
第七个维度是架构判断力。哪些步骤该用确定性逻辑,哪些该交给模型?每一步该用什么级别的模型——最强的、中等的、小的,还是微调过的?哪些知识该做成技能,哪些该放进记忆?
这些选择没有标准答案,但选错了成本会很高。一个简单的分类任务用最贵的模型跑,一个月下来账单会让你怀疑人生。
所以呢?
这七个维度拼在一起,构成了一个新的竞争格局。
大厂优先押注的市场,他们会跑得很快,毕竟模型在自己手里。但这留下了成千上万个细分市场给创业公司。
当每家公司都能调用同样的模型时,决定胜负的就不是模型本身了。Tunguz 的原话是:"最好的骑手赢。"
我挺认同这个比喻的。AI 是马,驾驭系统是鞍和缰绳,骑手是你对业务的理解。马都差不多,但骑手之间的差距可以很大。