谷歌把 AI 能力分散到了很多产品里,有些在 Gemini 网页版里,有些在独立工具里。下面是我整理的一份清单,列了 11 个目前可以免费用的工具,附上入口链接和简单说明。
创意与媒体生成
Veo 3(视频生成)
谷歌目前的视频生成模型,支持生成带同步音效的视频片段。还在开发者预览阶段。
入口:Google AI Studio - Veo 3(开发者预览),或直接在 Gemini 网页版 中使用。
Media Generation(Imagen / Nano Banana 2,图像生成)
基于 Nano Banana 2 架构的图像生成,可以在图片中嵌入文字——这一点比很多同类工具做得好。
入口:Gemini 图像生成
Nano Banana(图像编辑)
专门做局部重绘和风格迁移,集成在 Gemini App 里。
入口:Gemini App,在图像编辑功能中找到。
生产力与办公
Gemini Live(实时语音交互)
支持语音对话和屏幕共享,2026 年版本加入了多模态摄像头实时分析。手机端体验比较好。
入口:Gemini 移动端 App(Android / iOS)
Gemini in Google Sheets(表格 AI)
在 Google Sheets 侧边栏直接调用 Gemini,可以生成公式、做数据分析。不用记复杂的函数语法了。
入口:Google Sheets,点击工具栏的 Gemini 图标。
Gemini Ask on YouTube(视频问答)
看 YouTube 视频时,在视频下方直接点 "Ask" 按钮就能对视频内容提问,AI 会基于视频内容回答。
入口:YouTube,视频播放页面下方。
开发与技术构建
Google App Builder(零代码应用构建)
通过文字描述快速搭建轻量级应用。AppSheet AI 适合业务应用,AI Studio 模板库适合快速原型。
入口:Google AppSheet AI 或 Google AI Studio 模板库
Firebase Studio(全栈 AI 开发环境)
2026 年推出的开发环境,可以从 Prompt 直接部署到全栈 Web 应用。对新项目快速起步比较有用。
Google AI Studio(模型测试平台)
免费测试 Gemini 3 全系列模型的地方,开发者用得比较多。
智能分析与知识库
NotebookLM(个人知识库)
上传 PDF 或文档,AI 会基于这些资料回答问题,并且给出引用来源。学习、写论文、做研究的时候挺好用的。这是我个人用得最多的工具之一。
入口:NotebookLM
Google Cloud Vision API(视觉识别)
企业级的图像识别 API,支持 OCR 文字提取和物体检测。有免费额度,用量大了才需要付费。
工具速查表
| 工具 | 功能 | 入口 |
|---|---|---|
| Veo 3 | 视频生成 | AI Studio / Gemini |
| Media Generation | 图像生成 | Gemini |
| Nano Banana | 图像编辑 | Gemini App |
| Gemini Live | 语音交互 | Gemini App |
| Gemini in Sheets | 表格 AI | Google Sheets |
| Gemini Ask on YouTube | 视频问答 | YouTube |
| Google App Builder | 零代码应用 | AppSheet / AI Studio |
| Firebase Studio | 全栈开发 | Firebase Studio |
| Google AI Studio | 模型测试 | AI Studio |
| NotebookLM | 知识库 | NotebookLM |
| Cloud Vision API | 图像识别 | Cloud Vision |
几个使用建议
Google AI Studio 和 NotebookLM 值得收藏。前者是测试新模型最快的途径,后者做资料整理确实好用——上传论文后可以直接问"这篇文章的主要结论是什么",还能定位到原文段落。
Veo 3 目前还是开发者预览阶段,生成效果在进步,但复杂场景的处理能力还有差距。Firebase Studio 适合新项目快速搭建原型,大项目可能还是需要传统工作流。