Gemini 3.5 Flash 发布：Google 打的是速度牌_AI资讯

Google I/O 2026 最大的发布不是 AI 搜索，不是硬件，甚至不是 Gemini App 的升级。是 Gemini 3.5 Flash。而且它不是"即将发布"——今天就能用。

我去翻了一下官方文档和几家媒体的评测，整理了一些信息。写下来，也给自己备忘。

Gemini 3.5 Flash 发布：Google 打的是速度牌

数字

Gemini 3.5 Flash 的输出速度是 284 tokens/秒。Google 的说法是"比其他前沿模型快 4 倍"。这不是"更快了一点"的程度，是换了发动机。

Context window 是 1M tokens，跟 Pro 一样。输入支持文本、图片、语音、视频，输出只有文本。

速度快不代表智能低。在 Artificial Analysis 的智能排行榜上，Gemini 3.5 Flash 排第 7 名（55.32 分）。排在它前面的只有这几个：

一个 Flash 版本打到了旗舰级，这个排位确实不低。

具体 Benchmark 数据：

这部分我比较在意。输入 $1.50/1M tokens，输出 $9.00/1M tokens。

输出价格比 GPT-4.1 的 $8.00 还贵。速度快，但单价高。如果你的场景对延迟敏感、需要快速响应，它可能是个好选择。但如果你要批量处理大量数据，成本会是个问题。

缓存读取有优惠，低至 $0.15（-90%），这个倒是友好。

Google 在官方博客里展示了一些 Demo，配合 Antigravity 平台的效果：

6 小时从 AlphaZero 论文到可玩游戏。60 秒生成多个 UX 设计方案。自动把 legacy 代码库迁移到 Next.js。用两个 agent（builder + player）在自改进循环中开发游戏。

Demo 看着很猛。实际效果如何，等开发者上手用一段时间再说。

有两个细节需要注意。

3.5 Pro 还没发布。Google 说下个月（6 月）推出，目前只有 Flash 版本可用。所以如果你需要更深的推理能力，得等。

输出只支持文本，不支持图片、音频等多模态输出。Google 把资源全押在了 agentic 和编码上。

Gemini 3.5 Flash 不是来抢"最智能"头衔的。它的定位很明确：最快能干活的那个。

如果你需要 Agent 快速跑多步任务、写代码、调工具，它可能是现在性价比最高的选择。如果你需要深度推理，等下个月的 Pro。

Google 打的是速度牌，这个策略对不对，市场会给出答案。