作者：厦门大学计算机系林子雨副教授
E-mail: ziyulin@xmu.edu.cn
备注：本实验与林子雨编著《数字素养通识教程》和《人工智能通识教程》教材配套
Nano Banana 是谷歌于2024年推出的AI图像生成与编辑模型，正式名称为 Gemini 2.5 Flash Image 。其在权威的LMArena基准测试中综合评分超越众多竞品，标志着2025年AI 图像生成技术的重大突破。它基于Google DeepMind最新架构，采用原生多模态设计，统一处理文本理解、图像生成与编辑等功能，拥有32K上下文窗口，能进行复杂多轮对话和编辑，还内置丰富世界知识。其核心技术能力强大，不仅支持文本描述转图像，还具备深度语义理解能力，能理解物理规律、时间概念、逻辑推理等。例如输入 “这个披萨在 400 度烤箱里烤 2 小时”，能生成烤焦的披萨图像。Nano Banana 的智能图像编辑引擎可精准局部编辑，如面部美化、体型调整且保留细节；角色一致性保持算法能解决 AI 图像生成领域角色一致性难题，面部特征保留率达 99%。在速度方面，仅需 2.3 秒就能生成 1024×1024 的高质量图像。

访问方法

注意：如果360浏览器无法访问该网站，建议使用谷歌Chrome浏览器，就可以正常访问了。
访问网站https://lmarena.ai/，在页面顶部点击“Battle”。

然后，点击下拉列表中的“Direct Chat”。

如下图所示，点击“图片”按钮。

如下图所示，上方的大模型要选择“gemini-2.5-flash-image-preview(nano-banama)”。

生成创意图片

如下图所示，点击“+”按钮，上传一张你的照片。

比如，这里上传如下照片（林子雨老师的高清照片）：

照片上传成功以后，如下图所示，然后在对话框中输入提示词。

把照片转成角色手办，手办有底座，角色手办在底座上，在它身后放着一个印有改角色的手办盒子，盒子上的文字使用中文，盒子旁边有一个电脑，屏幕上显示blender建模过程，场景为书房办公桌场景

输入提示词以后，如下图所示，点击箭头按钮提交。

这时，会弹出一个对话框，点击“Agree”（同意）就可以。

数字手办生成以后，会出现一个提示框，可以点击“Got it”（已经了解）。

到这里，数字手办已经制作完成，可以点击右上角的下载按钮（如下图所示），把图片下载到本地。

生成的数字手办下载到本地以后得图片效果如下：

还可以上传一张自己的照片（比如使用上面的林子雨老师个人高清照片），然后输入提示词“请生成一张我和美国总统特朗普的合影照片”，然后提交，15秒就可以生成合影照片了，生成的图片效果如下：

修改图片

再次点击下图中的“+”，上传一张自己的照片（比如上传林子雨老师的高清个人照片）。

然后，输入提示词“换一个更酷的姿势”。生成的新照片如下所示。

点击“+”，上传照片，在对话框中继续输入提示词“去掉这张照片中的人物的眼镜”，生成如下所示图片：

点击“+”，上传照片（这里上传林子雨照片），在对话框中继续输入提示词“让这张照片中的人物微笑”，生成如下所示图片：

点击“+”，上传照片，在对话框中继续输入提示词“把照片的背景更换成大草原”，生成如下所示图片：

下面准备一张黑白的老照片，如下所示：

点击“+”，上传这张黑白照片，在对话框中继续输入提示词“修复并上色这张照片”，生成如下所示图片：

点击“+”，上传一张骑摩托车的照片，如下所示：

在对话框中继续输入提示词“把图中的摩托车变成带着火焰的地域摩托车风格”，生成如下所示图片：

风格转换

点击“+”，上传一张女孩子的真人照片，如下所示：

在对话框中继续输入提示词“把图中的人物变成动漫人物”，生成如下所示图片：

电商出图

人物推销

点击“+”，上传一张古代人物照片和一张现代零食照片，如下所示：

在对话框中继续输入提示词“让这个古代人物介绍这包零食”，生成如下所示图片：

更换衣服

点击“+”，上传一张时装模特人物照片和一张女士长裙照片，如下所示：

在对话框中继续输入提示词“把图一人物的裙子更换成图二的裙子，保持图一的风格”，生成如下所示图片：

多个物体合成

点击“+”上传几张图片，包括女人、牛仔裙、墨镜、宠物狗、奶茶、女士包、运动鞋，图片如下：

上传后的效果如下：

在对话框中输入提示词“一位女士，穿着超短裙，带着墨镜，拿着奶茶，牵着宠物狗，拿着黑色包，穿着白色运动鞋，在马路上走”，生成图片效果如下：

家装设计

点击“+”上传图片，是一个空房间的图片：

在对话框中输入提示词“在房间地面铺一块大面积米色地毯，给窗户装上乳白色窗帘，墙上挂一幅油画，是梵高的向日葵，在地面上放一个米色沙发和茶几，茶几上放一个绿色盆景”，生成的效果图如下：

推理能力

点击“+”上传一张没有成熟的果树的照片，如下：

在对话框中输入“生成一张该场景3个月以后的照片”，生成的图片效果如下：

点击“+”上传一张食材照片：

在对话框中输入提示词“这是一堆食材，帮我制作一道菜”，生成的效果图如下：

点击“+”上传两张照片，一个是拳击手，一个是人物打斗简笔画，如下所示：

在对话框中输入提示词“图一和他的分身，正在按照图二的动作和位置，进行激烈打斗，背景是拳击擂台”，生成的图片效果如下：