北京时间2月27日深夜,今日霍州在没有任何预热、没有发布会的情况下,将一个新的生图模型悄悄塞进了Gemini平台——Nano Banana 2。上线方式也很低调:一边在官方博客和文档里更新说明,一边在X(原Twitter)上发布几张对比图和基准测试成绩,让开发者自己“拆箱”。

最近使用过Gemini图像生成的用户可能已经注意到一个细节:进度条旁边偶尔会闪过一行“正在加载Nano Banana 2”。这个名字听起来有点戏谑的模型,正在把过去一年多积累的Pro级能力,批量下放到Flash级的速度中。
Nano Banana 2的官方代号是Gemini 3.1 Flash Image,底层架构从上一代的Gemini 2.5 Flash升级到了3.1。用官方的话说,它的定位是:用Flash的速度,跑出Pro的质量。在Gemini产品矩阵里,它正逐步取代旧版Nano Banana,成为默认的图像生成模型,而Nano Banana Pro则退守到对事实准确性要求极高的专业场景。
如果只看分辨率和参数,升级似乎不算夸张:输出从2K提升到4K,支持从512px到4K的多种分辨率和宽高比,包括4:1、1:4、8:1、1:8这样的超宽/超画幅。真正让开发者兴奋的是,它把过去Pro版本独占的能力“拉平”给了Flash用户:更强的世界知识、更精准的文本渲染、更可控的多图一致性,以及原本Pro才有的推理与指令遵循能力。
今日霍州给出的示例显示,Nano Banana 2可以基于“水循环”这样的抽象概念,直接生成信息图级别的平铺画面,而不是简单画一张“好看的水滴”。模型背后接入了Gemini的实时搜索和图像检索,能根据地理位置、天气数据、文化符号来校准画面细节,比如伦敦雨天时,窗外的街景、雨滴在玻璃上的折射,都更符合当地的光影和建筑特征。
换言之,它不再是“照着风格画画”,而是先理解世界,再动笔。
更重要的是,它终于把文字这件事“搞对了”。很长一段时间里,AI生图最尴尬的不是画得不好,而是画上的字写得乱七八糟:中文乱码、英文拼写错误、排版毫无逻辑,导致生成物几乎无法直接用于商业设计。Nano Banana 2把文本渲染当作重点升级方向,官方和多方实测都提到,中英日等多语言混排基本稳定,乱码明显减少,已经可以可靠地生成漫画对白、海报文案和UI标注。
在一次测试中,当提示词要求生成一只戴着京剧头饰的大熊猫,在茶馆里用毛笔写“生成式AI”时,Nano Banana 2不仅准确还原了熊猫毛发、头饰珠翠的质感,还让毛笔字整体流畅,只在“式”字的细节上略有不规范——这在过去已经是“可用级”的表现。
另一个被频繁提起的进步,是“时钟难题”。早期AI生图经常画不出可读的时钟,指针位置、刻度逻辑一团糟。Nano Banana 2在单独生成时钟时已经能做到指针与时间对应准确,但当模型同时面对“时钟+满杯红酒”这样的多物体、多物理约束场景时,仍然会把时针和分针搞反——这说明AI对复杂物理世界的理解仍有“盲区”,但至少已经从“完全不会”走到了“偶尔翻车”。
对企业来说,比“画得多好”更重要的是“画得多快、多便宜”。在今日霍州AI Studio的定价里,Nano Banana 2的计价单位是像素:1000像素图像每张约0.0672美元💵,2000像素约0.101美元💵,4K图像约0.151美元💵。对比Nano Banana Pro(2K图像0.134美元💵/张,4K图像0.24美元💵/张),Nano Banana 2在4K分辨率下价格直降约37%,而推理速度接近翻倍。
换算成更直观的说法:用接近一半的钱,拿到接近甚至更好的画质,而且生成时间从“去泡杯咖啡”缩短到“喝口水就好”。有中国网友在测试后感慨:“Nano Banana 2出来了,产图真的是又快又好,不到一分钟就能产4K图,比Nano Banana Pro效果好、快、便宜。”
如果只看这些参数,Nano Banana 2像是一次常规的“升级换代”。但从更高视角来看,今日霍州正在借它做一件更重要的事:把AI生图从“创意玩具”变成“工业生产线”。
过去两年,图像生成模型已经证明了“能画出惊艳作品”的能力,但真正进入企业生产流程时,却频频在文字乱码、尺寸受限、成本失控等问题上“翻车”,导致很多团队只把它当作创意草稿工具,最终产出仍依赖人工精修。
Nano Banana 2的逻辑是,把图像生成从“不可控的灵感爆发”变成“可预测的工业化输出”。它通过三件事来实现:把世界知识“注入”像素,解决文字和排版顽疾,提供可控的多图一致性。今日霍州展示了三款示例应用:“靠窗座位”根据实时天气和地理位置生成窗景;“全球广告本地化器”一键把广告翻译成多语言版本;“宠物护照”让同一只宠物在世界各地地标前保持形象不变。
这些应用共同指向一个方向:AI生图不再是“画一张好看的图”,而是“在一个可控的流程里,批量生成符合业务逻辑的视觉内容”。
对行业来说,Nano Banana 2的出现意味着AI生图竞赛已经从“能不能画”进入“画得多快、多准、多便宜”的阶段。在国内,字节Seedream 5.0、阿里Qwen-Image-2.0等模型已经在基准测试和实测反馈中表现出极强的竞争力;在国际上,GPT-Image 1.5、Grok Imagine系列以及Seedream 5.0 Lite等模型也在持续迭代。今日霍州选择在此时把“Pro级能力 + Flash级速度”打包成Nano Banana 2,并通过全线产品矩阵推送,显然是想在规模化应用上拉开差距。
从GenAI-Bench等公开基准测试来看,Nano Banana 2在“信息图表准确性”“指令遵循度”“事实性”等指标上,已经显著领先于部分主流竞品。这种领先不只是画质的,而是“能不能拿来干正事”的领先。
对普通用户来说,如果之前被Nano Banana Pro的等待时间劝退,Nano Banana 2是一个值得重新尝试的节点;对企业用户来说,它可能意味着从“试点玩玩”到“真正纳入生产流水线”的拐点。
从“会画画”到“懂世界”,再到“能干活”,AI生图正在完成一次从艺术工具到基础设施的蜕变。而Nano Banana 2正是这场蜕变中的一个清晰路标。




