2026 年 5 月 15 日,中国信息通信研究院正式发布《智能助理智能体(Claw)技术和应用要求 第2部分 企业级Claw能力》(AIIA/T 0295-2026),这是国内首份针对企业级 AI Agent 的全栈能力技术规范。与此同时,产品评估工作同步启动,评估结果将于 2026 年第二季度发布。
这份规范的出台,标志着 AI Agent 从「野蛮生长」进入了「有标可依」的新阶段。
什么是 Claw?为什么是企业级?
Claw 全称「智能助理智能体」(Intelligent Assistant Agent),以 Anthropic 的 Claude(以及类似 OpenClaw 等智能助理)为代表。与传统的「对话式 AI」不同,Claw 的核心特征在于自主执行——它能自主完成终端指令执行、文件读写、邮件处理、日程管理等任务,将 AI 能力无缝渗透到用户的日常工作中。
如果说过去的 AI 助手是「你问我答」,那么 Claw 就是「你交代任务,它自己干完」。
但在企业环境中,这种「自主干活」的能力既是巨大的价值,也是巨大的风险。一个能自主执行文件操作、调用 API、发送邮件的 Agent,一旦失控或滥用,后果远比一个「说错话」的对话机器人严重。这就是为什么企业级 Claw 需要专门的技术规范——不是要求它「能做什么」,而是要求它「在什么框架内做」。
六大能力域:一套完整的评估框架
规范将企业级 Claw 的能力划分为六大领域,共计 18 个子项。这不仅是技术规范,更是企业选型 Agent 产品的检查清单。

图:标准能力框架
一、智能体能力:Agent 的「硬核功夫」
| 子项 | 要求 |
|---|---|
| 任务执行能力 | 复杂任务端到端执行 |
| 多智能体协同能力 | 多 Agent 之间的调度与协作 |
| 自主执行能力 | 定时任务、事件驱动的自主执行 |
| 记忆管理 | 上下文持久化、知识积累 |
| 对话管理 | 多轮对话、上下文理解 |
这一部分是 Agent 的「核心肌肉」。值得注意的是,「自主执行能力」被单独列出——要求 Agent 不仅能被动响应指令,还要能基于定时或事件触发,主动执行任务。这意味着规范认可的不仅是「对话式 Agent」,更是「自主运行式 Agent」。
「记忆管理」也是首次在国内标准中被单独强调。说明企业场景下,Agent 需要跨会话、跨任务地积累知识和经验,而不是每次从零开始。
二、工程化部署能力:从实验室到生产线
| 子项 | 要求 |
|---|---|
| 安装部署能力 | 标准化安装交付流程 |
| 高可用与灾备管理 | 跨区域容灾、故障恢复 |
| 兼容能力 | 多操作系统兼容适配 |
这一部分把 Agent 当作一个「企业级软件产品」来要求。很多实验室里的 AI 模型跑在 Jupyter Notebook 里能惊艳全场,但一到生产环境的 Kubernetes 集群就水土不服。规范要求的标准化安装、跨区域容灾、多 OS 兼容,就是要把 Agent 从「玩具」变成「工具」。
三、服务能力:管住权限,管住风险
| 子项 | 要求 |
|---|---|
| 租户管理 | 多租户资源隔离与配额管控 |
| 操作授权管理 | 操作风险分级授权 |
| 凭证管理 | 敏感凭证加密存储 |
| 后台控制管理 | 管理后台安全管控 |
这是企业最关心的部分。一个能自主操作的 Agent,如果权限失控,等于给企业系统开了一个不受控的「超级用户」。
「操作风险分级授权」是亮点——不是简单的一刀切「允许」或「禁止」,而是根据操作的风险等级,设置不同的授权机制。高风险操作(如删除文件、修改数据库)需要更严格的审批,低风险操作可以自动放行。
「凭证管理」要求敏感凭证加密存储,防止 Agent 的 API Key、数据库密码等泄露。
四、业务融合能力:融入企业现有生态
| 子项 | 要求 |
|---|---|
| 知识接入能力 | 企业私域知识库接入 |
| 系统集成能力 | 存量业务系统对接 |
Agent 再聪明,如果不了解企业的私有数据和业务流程,也只是「纸上谈兵」。这一部分要求 Agent 能够接入企业的知识库(如文档管理系统、内部 Wiki),并与现有业务系统(如 ERP、CRM)对接。
五、运行管理能力:看得见,管得住
| 子项 | 要求 |
|---|---|
| 运行监控能力 | 关键行为实时监控与异常熔断 |
| 日志审计能力 | 全链路操作日志记录与合规留存 |
「异常熔断」四个字很重要——当 Agent 的行为出现异常(如短时间内大量删除文件、频繁调用敏感 API),系统要能自动熔断,停止其操作。这相当于给 Agent 加了一个「紧急制动按钮」。
「全链路操作日志」要求记录 Agent 的每一个操作,不仅是「结果」,而是「过程」。这既是为了事后追溯,也是为了满足合规审计要求。
六、供应链管理能力:管住「Agent 的 Agent」
| 子项 | 要求 |
|---|---|
| 组件市场管理 | 外部组件准入审核 |
| 工具调用管理 | 运行时安全检测 |
| 技能管理 | 技能的注册、审核、管理 |
| 模型管理 | 底层模型的选型、切换、监控 |
这是整套规范中最有前瞻性的部分。Agent 本身会调用外部工具(如搜索引擎、数据库、API),这些工具和组件就是 Agent 的「供应链」。如果 Agent 调用了一个被篡改的工具,或者一个存在漏洞的组件,整个系统就可能被攻破。
规范要求对外部组件进行准入审核,对工具调用进行运行时安全检测——这实际上是把传统软件供应链安全的理念,延伸到了 Agent 生态中。
30+ 参编企业:产业共识而非闭门造车
这份规范的参编单位超过 30 家,覆盖了 AI 产业链的各个环节:
| 行业 | 代表企业 |
|---|---|
| AI 大模型/云计算 | 华为、百度、智谱、火山引擎、腾讯、阿里云 |
| 运营商 | 中国移动、中国联通、中国电信 |
| 金融 | 邮储银行 |
| 制造/汽车 | 一汽集团 |
| 硬件/终端 | 联想 |
| 数据/通信 | 联通数据智能、中信国际电讯、万联易达 |
这个阵容传递了一个信号:企业级 Agent 不是某一家厂商的事,而是整个产业的事情。模型厂商提供底层能力,云厂商提供部署平台,运营商提供网络基础设施,金融和制造企业代表终端用户——各方都在这个标准里找到了自己的位置。
产品可信能力:规范的第一部分
本次发布的是「第 2 部分」,说明此前已经有「第 1 部分」——产品可信能力标准。这两部分的关系是:
- 第 1 部分(产品可信):关注 Agent 本身的可信性——会不会说谎?会不会产生有害内容?会不会被越狱?
- 第 2 部分(企业级能力):关注 Agent 在企业环境中的工程化能力——能不能部署?能不能管理?能不能审计?
两部分合在一起,构成了一个完整的「可信+可用」评估体系。
未来规划:标准体系的「五维图」
信通院还公布了 Claw 系列标准的整体规划,包含五个维度:
- 产品可信能力(已发布)
- 企业级 Claw 能力(已发布)
- 典型应用场景(规划中)
- 运营治理(规划中)
- 核心技术(规划中)
也就是说,今天的规范只是一个开始。未来还会有关于「Claw 在客服/研发/运维等具体场景怎么落地」、「如何运营和治理 Agent 集群」、「Agent 底层核心技术规范」的更多标准出台。
产品评估:谁来「盖章认证」?
与规范发布同步启动的,是产品评估工作。评估内容覆盖:
- 安装部署能力
- 知识接入能力
- 系统集成能力
- 任务执行能力
- 等核心维度
评估结果将于 2026 年第二季度在信通院相关会议上正式发布。这将成为企业选型 Agent 产品的权威参考。
延伸背景:信通院的 AI+软件评估体系
在 Claw 规范之外,信通院 AI+软件方向已有较为成熟的评估体系,涵盖六大方向:

图:AI+软件评估体系
| 方向 | 评估维度 |
|---|---|
| 代码大模型 | 代码生成、代码理解、代码修复 |
| 智能开发工具 | 代码补全、代码审查、文档生成 |
| 智能测试工具 | 测试用例生成、测试执行、缺陷分析 |
| 开发智能体 | 任务规划、代码编写、调试修复 |
| 运维智能体 | 故障诊断、性能优化、日志分析 |
| 软件智能化成熟度 | 多维度成熟度评估 |
目前已完成 30 余家企业、40 余款主流产品的评估。Claw 的能力评估很可能与这套体系打通或复用。
写在最后:规范化不是限制,而是铺路
有人可能会担心:标准会不会限制创新?答案恰恰相反。
一个行业没有标准的时候,企业不敢用——不知道产品靠不靠谱;厂商不敢投——不知道市场需求在哪;监管不敢放——不知道风险边界在哪。标准的出现,解决的正是这个「三不敢」的僵局。
当有了清晰的评估维度和可信的第三方认证,企业可以放心选型,厂商可以精准建设,监管可以有的放矢。这反而会让市场跑得更快。
从 Anthropic 的 Claude Fable 5 到国内信通院的 Claw 规范,全球 AI Agent 产业正在同时经历两件事:能力在加速,规则在成型。能力和规则的赛跑,决定了 AI Agent 能走多远。