导读:本文内容来源于谷歌官方,由谷歌云钻石合作伙伴、谷歌地图一级代理商 CloudAce 深圳云一进行翻译发布。

Google 近日正式发布了 Nano Banana 2(Gemini 3.1 Flash Image) 。这一全新模型为 Flash 系列注入了高保真图像生成能力以及更先进、更快速的编辑功能 。其核心优势在于能够以卓越的性价比,支持开发者大规模部署复杂的视觉创作任务 。目前,开发者可通过 Google AI StudioGemini API 调用这些新功能(在 Google AI Studio 上使用需持有付费 API 密钥)。

深度视觉落地:基于全球知识的创作

Nano Banana 2 充分利用了 Gemini 模型丰富的全球知识,能够结合网络搜索结果生成增强的视觉效果 。这使得开发者可以生成基于现实参考、细节更为丰富的图像描述 。

为了展示这种视觉基础的实际应用能力,谷歌官方构建了名为 “ Window Seat ” 的示例应用 。它能结合 Nano Banana 2 的知识库与实时天气数据,创作出受全球真实地点启发的写实窗外景观 。

“ Window Seat ”应用演示

高级文本渲染与多语言本地化

在构建动态 UI 生成器或创意工具时,文本的清晰度与准确性至关重要 。Nano Banana 2 在此领域较前代 Flash 图像模型实现了显著升级 。

  • 高精度渲染:生成的图像文字清晰、精准,可满足大规模图像生产或创意应用的需求 。

  • 图像内本地化(In-image Localization):支持直接在图像中生成或翻译多种语言的文本内容 。

为了展示这些功能,谷歌开发了一款名为“全球广告本地化器 (Global Ad Localizer)”的演示应用,该应用可将广告自动翻译并适配至不同国际市场 。它不仅展示了模型在文本翻译上的先进性,更体现了其对视觉元素进行同步理解与本地化处理的能力 。

全球广告本地化器 ”应用演示

卓越的创意控制力与产出一致性

Nano Banana 2 在保持极速的同时,提供了极高的视觉保真度,包括鲜艳的光影效果、丰富的纹理及锐利的细节 。此外,模型还赋予了开发者更灵活的控制权:

  • 原生宽高比支持:除了现有比例外,新增了 4:1、1:4、8:1 和 1:8 的原生支持,无缝适配各种项目需求

  • 全新 512px 分辨率层级:在原有的 1K、2K 和 4K 基础上新增 512px 选项,旨在最大限度降低延迟,适用于快速迭代和重型生产线 。

  • 强化的指令遵循:该模型能够更严谨地执行复杂的、多层级的开发人员提示词(Prompts),确保输出结果精准符合预期 。

  • 可配置的“思考层级”:开发者可调节模型的推理程度(默认 Minimal 或 High/Dynamic) 。这允许模型在渲染前对复杂提示词进行深度思考,从而提升输出质量与逻辑性 。

为了展示以上能力,谷歌开发了“ 宠物护照 ”演示版,只需拍摄宠物的一张照片,即可带领它开启环球旅行,游览世界各地著名地标。它能确保宠物在不同的目的地保持相同的形象。为了实现真正个性化的效果,谷歌还提供了多种创意控制设置。

“ 宠物护照 ”演示版

立即使用:专为生产环境设计

谷歌众多合作伙伴已将 Nano Banana 2 整合进生产流中,以实现视觉功能的规模化扩展 :

“通过集成 Nano Banana 2,Whering 成功将用户拍摄的低质量照片转化为专业级资产,同时完美保留了真实纹理。其结构化、可预测的输出能力让我们的团队在快速构建应用的同时,依然能维持用户所需的复杂图像分类功能。” —— Bianca Rangecroft, Whering CEO

Nano Banana 2 现已通过多种渠道开放接入,助力企业加速 AI 落地:

  • 接入方式:开发者可通过 Google AI Studio 的 Gemini API 接入(需付费 API 密钥),或在 Vertex AI 上进行企业级部署 。

  • 生态支持:该模型同步支持在 Google AntigravityFirebase 中使用 。

  • 联系 Cloud Ace ,获取定制化 AI 部署方案与技术支持

Logo

AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念,把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起,为开发者提供从开发、训练到部署的一站式体验。

更多推荐