根据《壹苹新闻网》实测,只要输入提示词「请生成如何在没有实体Suica的情况下,由iPhone加入Suica与储值的步骤图,风格使用日式童书绘本、说明文字使用繁体中文」下去,画面在短时间内就生出来,速度相当惊人。
Gemini 3 Pro Image由Google全新一代Gemini 3 Pro驱动,具备更强推理与世界知识,能更懂使用者语意、生成内容也更贴近真实需求。
Gemini 3 Pro Image是什么
这是Google最新的影像生成与编辑模型,Nano Banana Pro建立在Gemini3 Pro模型架构上,结合强化推理引擎与Google Search资料库,能将食谱、天气资讯、植物资料等现实资讯即时转成资讯图表与教学示意。Google表示,新模型可协助使用者从原型设计、笔记转图、流程图生成到产品草稿视觉化,都可直接以影像输出,提升内容呈现效率。
新版本最受瞩目的是大幅提升的「文字渲染能力」。Nano Banana Pro能在图片中生成更清晰、正确的文字,包含长段落、标语、海报字体,并能依语境生成多国语言与本地化翻译。官方强调,在Gemini 3的语言推理加持下,不论是英韩对照、创意字体、漫画分镜文字到城市建筑字母化,都能更准确呈现。
在创意合成能力上,新模型支援一次输入最多14张图片,并维持最多5个人物的一致外观,能将人物、场景与物件整合成连贯的照片或时尚大片。使用者也能透过局部编辑调整构图,例如改变光线、景深、镜位、色调,甚至把白天变成夜景或强调脸部明暗,解析度最高可输出至4K。
风格切换超自由 角色换成猫咪、改成日杂风都行
实测也发现,如果用户对初版画面不满意,只要接著输入「把柴犬换成猫咪」、「改成更复古的日式杂志风」、「文字改用中文」…不仅速度快,连模型都能直接承接前面的画面设定,重新生成后依然维持相同构图与风格一致性,不会发生图像风格重头描述。
这点对想要微调素材的设计师、创作者来说特别友善,几乎变成「你讲我画」,调整零阻力。
Gemini 3 Pro的安全与使用方式
Google表示,影像标记方面,Google延续SynthID隐形浮水印,并在免费与Google AI Pro使用者输出的图片加入「Gemini Sparkle」可见水印,以协助辨识AI生成内容;Ultra订阅者与AI Studio开发者则可输出无可见水印图片,方便专业用途。除此之外,使用者现在也能将图片上传至Gemini App,询问该影像是否由Google AI生成,这也是SynthID技术首次开放给一般消费者使用。官方预告,未来将扩展至音讯与影片。
使用上只需打开 Gemini,切换至 Gemini 3 Pro(Thinking / Pro Image)模型,即可开始文字生成图像,也支援指令式编辑与局部修改。
多种创作方式:一句话生成、补充指令调整、照片重混皆可
🟡 文字生成图像:输入提示词即可产生插画、流程图、视觉构图
🟡 角色替换:生成后可直接要求「主角换成猫咪」「衣服改成蓝色」
🟡 风格修改:可切换「童书绘本」「日式杂志」「极简设计」等
🟡 语言切换:说明文字可改繁中、日文、英文等
🟡 维持风格:改内容时可保持前一张的画面风格与人物比例
Google同步公布模型将陆续上线各平台,一般用户可在Gemini App的「Create images」并切换「Thinking」模型后使用,免费用户有额度限制;Google AI Plus、Pro与Ultra订阅者则享有更高配额。Workspace将在Slides与Vids导入新版影像生成,Google Ads也会直接升级至Nano Banana Pro。开发者部分,Gemini API、AI Studio与Vertex AI均将开始支援。
點擊閱讀下一則新聞