Google Nano Banana 2 来了,价格只有 GPT Image 的三分之一

Google 今天宣布 Nano Banana 2(Gemini 3.1 Flash Image)和 Nano Banana Pro(Gemini 3 Pro Image)正式开放,通过 Gemini Enterprise Agent Platform 对企业用户可用。GA 是 General Availability 的缩写,意思就是结束测试阶段,正式开放,所有用户都可以用,而且有完整的技术支持保障。

两个模型从预览走到正式开放,有几个值得看的点:能读视频输入了、ELO 排名上去了、几个大客户已经在实际业务里跑起来了。

能读视频了

Nano Banana 2 新增了一个预览功能:支持把视频文件当作输入。以前只能接受文字、PDF 或图片,现在模型能看懂视频里的画面、主体和动作,然后生成对应的图像。Google 举的例子是自动生成视频缩略图和信息图。

用视频做输入来生成图片,在文生图模型里还不多见。大多数模型还停留在"文字生成图片"或"用图片改图片"的阶段,直接把视频喂进去让模型理解并生成对应图像,是往前走了一步。

Google Nano Banana 2 来了,价格只有 GPT Image 的三分之一

输出方面,1K 和 2K 分辨率对两个模型都已经正式开放,4K 还在预览阶段。通俗说就是现在你能稳定拿到最高 2K 的图,4K 需要等后续更新。

榜单排名第三

根据 Artificial Analysis 的文生图排行榜(一万多个样本评测),Nano Banana 2 的 ELO 分数是 1,261,排第三。ELO 是围棋和棋类游戏里常用的打分系统,分数越高质量越好。它前面是 OpenAI 的 GPT Image 2(1,338)和 GPT Image 1.5(1,267)。

人工智能分析文本到图像和图像编辑排行榜
图:人工智能分析文本到图像和图像编辑排行榜(2026-05-29 数据)

Nano Banana Pro 排第四,ELO 1,219。两个 Google 模型都在前五。

排名 模型 ELO 样本数 发布时间 API 价格
1 GPT Image 2 (high) 1,338 10,215 Apr 2026 $211 /1k imgs
2-3 GPT Image 1.5 (high) 1,267 5,589 Dec 2025 $133 /1k imgs
3 Nano Banana 2 1,261 7,378 Feb 2026 $67 /1k imgs
4 Nano Banana Pro 1,219 4,848 Nov 2025 $134 /1k imgs
5-8 grok-imagine-image-quality 1,204 3,107 Apr 2026 $50 /1k imgs

这里有个性价比问题值得聊。GPT Image 2 一张图 $0.211,Nano Banana 2 一张图 $0.067,价格差了超过三倍,但 ELO 只差 77 分。对于大多数商业场景来说,这 77 分的差距肉眼很难察觉,但成本差是实打实的。

xAI 的 grok-imagine 排在中游,ELO 1,204,价格 $0.05,夹在中间。ByteDance 的 Seedream 4.0 和微软的 MAI-Image-2 都在 1,195,价格 $0.03,但测试样本量比头部模型少,评测覆盖可能没那么全面。

客户案例:已经有人在用了

Adobe Firefly:把 Google 的模型嵌进自己的工具

Adobe 是这次公告里最重磅的合作方。Nano Banana 模型已经直接嵌入 Adobe Firefly Enterprise 和 Adobe GenStudio 里,给企业营销团队提供图像生成能力。这意味着用 Adobe 工具的设计师,可以直接在 Firefly 界面里调用 Google 的 Nano Banana 生成图片,不需要额外接 API。

Adobe 的产品营销负责人 Aaron Mitchell Finegold 的原话是,营销团队现在面临"既要质量高又要出得快"的压力,Nano Banana 已经帮他们把这个现实落地了。从实验到大规模执行,这一步跨出去了。

WPP:给 L'Oreal、Verizon、Unilever 做内容

WPP 是全球最大的广告集团,旗下服务 L'Oreal、Verizon、Unilever 这些大客户。他们通过自己的营销平台 WPP Open 接入了 Nano Banana 2 和 Pro 两个版本,用在大规模内容生产上。

具体怎么用?比如 L'Oreal 要为一个新产品线做多国市场的社交媒体素材,以前需要找多个摄影团队在不同地区拍,现在可以用 Nano Banana 快速生成不同风格的产品图,人工只需要做后期微调。WPP 的创新总监 Elav Horwitz 说这两个模型在"一致性和可控性"上提升明显,这恰恰是大客户最关心的——生成的图不能每次都不一样,品牌调性得统一。

Shopify:帮商家做产品图和社交素材

Shopify 的商家很多是小团队甚至个体户,拍不起专业产品图。Nano Banana 帮他们把现有的产品照片扩展成不同场景的素材——比如一件衣服,生成穿在模特身上、放在居家环境、户外运动等不同场景的图。还能直接生成适合社交媒体尺寸的版本。

Shopify 的产品经理 Matthew Koenig 说这个功能帮商家"扩展了现有的产品摄影",说白了就是花一份钱拍出 N 种效果。

URBN(Urban Outfitters):压缩从趋势到上架的时间

Urban Outfitters 做早期产品开发时,用图像生成快速验证设计方向。比如一个季度的主题是复古风,设计师用 Nano Banana 快速生成几十种复古风格的服装效果图,挑出方向对了的再去做实物打样。URBN 的测试显示这个流程能显著压缩"趋势发现到产品上架"的时间。

这相当于用 AI 做了一个快速的市场调研——先看图选方向,再投入生产成本。

Magnopus/Nodey:在 3D 管线里用 AI 生成

Magnopus 做的是 3D 空间平台,他们在自家工具 Nodey 里整合了 Nano Banana 和 Google 的视频生成模型 Veo。场景是影视和娱乐制作,创作者在 3D 空间环境里用 AI 生成视觉元素,每一步都可控。CEO Ben Grossmann 说他们用这套方案"替代了反复试错的提示词操作",把 AI 从"碰运气"变成了"可控的生产工具"。

怎么用?价格多少?

Nano Banana 2 和 Pro 通过两条路开放:

  • 企业平台:有完整的技术支持协议(SLA),适合需要稳定性和数据安全的企业。走这条路可以拿到企业级的服务保障。
  • 开发者 API:个人开发者或者小团队可以直接调,但没有企业级的技术支持。

价格上,Nano Banana 2 是 $67/千张图,也就是每张 6.7 美分。Nano Banana Pro 是 $134/千张图,每张 13.4 美分。Pro 比 2 贵一倍,但 ELO 分数反而低了 42 分。这个差价不在图像质量上,可能在企业功能、一致性控制或者调用速度上。

怎么看这次发布

有几个角度值得聊。

视频做输入这个功能,如果后续做好,会改变一部分工作流。以前做视频缩略图需要人去看视频、选帧、再修图,现在 AI 可以直接理解视频内容生成匹配的缩略图。这一步跨出去之后,类似的场景还有视频自动配图、长视频分段信息图等等。

性价比是 Nano Banana 2 最大的卖点。$0.067 一张图配上第三名的质量,在头部模型里是最划算的选择。如果你不是做那种"必须完美"的图,而是需要大量生成、快速迭代,这个价格很有吸引力。

客户落地方面,Adobe 和 WPP 这两家的接入最有说服力。Adobe 是直接嵌进产品里,WPP 是服务全球最大的一批品牌客户,这两家愿意在生产环境用,说明 Nano Banana 在企业级场景里已经跑通了。

不过也有几个问题值得跟进。Pro 版比 2 贵一倍但分数更低,溢价到底体现在哪里?4K 输出还在预览阶段,而 GPT Image 2 已经支持更高分辨率。还有 "Nano Banana" 这个名字——Google 起名的水平一直是个谜,这次也没让人失望。

整体看,这是一次"产品到位了"的发布。不是概念性的东西,是已经有人在用的东西。Adobe 嵌进去了,WPP 在跑了,Shopify 的商家也在用了。接下来就看 4K 什么时候 GA,以及 Pro 版的溢价能不能给出一个合理的解释。