Gemini 3.5 Flash 发布:Google 打的是速度牌

Google I/O 2026 最大的发布不是 AI 搜索,不是硬件,甚至不是 Gemini App 的升级。是 Gemini 3.5 Flash。而且它不是"即将发布"——今天就能用。

我去翻了一下官方文档和几家媒体的评测,整理了一些信息。写下来,也给自己备忘。

Gemini 3.5 Flash 发布:Google 打的是速度牌

数字

Gemini 3.5 Flash 的输出速度是 284 tokens/秒。Google 的说法是"比其他前沿模型快 4 倍"。这不是"更快了一点"的程度,是换了发动机。

Context window 是 1M tokens,跟 Pro 一样。输入支持文本、图片、语音、视频,输出只有文本。

智能排名

速度快不代表智能低。在 Artificial Analysis 的智能排行榜上,Gemini 3.5 Flash 排第 7 名(55.32 分)。排在它前面的只有这几个:

模型 分数
GPT-5.5 60.24
Claude Opus 4.7 57.28
Gemini 3.1 Pro 57.18
GPT-5.4 56.80
GPT-5.5 (medium) 56.71
Gemini 3.5 Flash 55.33

一个 Flash 版本打到了旗舰级,这个排位确实不低。

具体 Benchmark 数据:

测试 得分
Agent 能力(Terminal-Bench 2.1) 76.2%
编码能力(GDPval-AA) 1656 Elo
MCP 工具调用(MCP Atlas) 83.6%
多模态推理(CharXiv Reasoning) 84.2%

定价

这部分我比较在意。输入 $1.50/1M tokens,输出 $9.00/1M tokens。

输出价格比 GPT-4.1 的 $8.00 还贵。速度快,但单价高。如果你的场景对延迟敏感、需要快速响应,它可能是个好选择。但如果你要批量处理大量数据,成本会是个问题。

缓存读取有优惠,低至 $0.15(-90%),这个倒是友好。

Agentic 能力

Google 在官方博客里展示了一些 Demo,配合 Antigravity 平台的效果:

6 小时从 AlphaZero 论文到可玩游戏。60 秒生成多个 UX 设计方案。自动把 legacy 代码库迁移到 Next.js。用两个 agent(builder + player)在自改进循环中开发游戏。

Demo 看着很猛。实际效果如何,等开发者上手用一段时间再说。

还没来的部分

有两个细节需要注意。

3.5 Pro 还没发布。Google 说下个月(6 月)推出,目前只有 Flash 版本可用。所以如果你需要更深的推理能力,得等。

输出只支持文本,不支持图片、音频等多模态输出。Google 把资源全押在了 agentic 和编码上。

我的判断

Gemini 3.5 Flash 不是来抢"最智能"头衔的。它的定位很明确:最快能干活的那个。

如果你需要 Agent 快速跑多步任务、写代码、调工具,它可能是现在性价比最高的选择。如果你需要深度推理,等下个月的 Pro。

Google 打的是速度牌,这个策略对不对,市场会给出答案。