Google的“香蕉”很有名! “用嘴巴”的影响爆炸
栏目:专题报道 发布时间:2025-09-22 10:41
最近几天,人工智能(AI)级别的另一个工具级别出现了 - 一个名为“ Nano Banana”的模型图像代码,该代码迅速在对实际试验中的惊人效果而迅速受到欢迎。在社交媒体上,技术迷,设计师和内容创作者都在屏幕上疯狂,连接和发布自己的经验,实用教程和游戏收藏。在测试了这一点之后,许多网民直接将其命名为“负责P图片的上帝”,“新的AI传记之王”和“开始启动的最强大的图像模型”……这个“香蕉”实际上是AI图像生成的新一代和Google启动的模型编辑模型的新一代。 Gemini 2.5 Flash图像不仅可以结合许多图片来拼接新图片,还可以理解地理学,建筑和物理结构,并将二维图转换为三维景观。 Google宣布,在发布后的一周内完成了MO重新超过2亿张图像编辑。这个“香蕉”有多快乐?记者发现,使用“纳米巴纳那”时,网民有很多想法,而不同的游戏方式正在彼此相处。 Some want to take pictures throughout the time and space without any feeling of stiffness, some are happy to change their hairstyles, and some use maps to produce three-dimensional landscapes ... Of course, one often is to use pictures to customize figure models, whether it's a real person, a two-dimensional character, or a small pet, naEverything can be done ", and large number of netizens. AI Generation Figure Ms. Cai is an AI fan. Whenever there is a在大型模型中,她会在“纳米纳纳那样进行实际的测试”。米林图片,图片很自然。我觉得AI模型理解图片的能力有了显着改善。第二,照片一代的运作“疯狂呼唤”。在凯伊女士上传自己穿着拉丁舞蹈制服的图片之后,他在几分钟内开发了图形的图片。整个裙子中的各种复杂细节都恢复到充满活力的充满活力的情况下,已经恢复到了充满活力的情况下,三维效果是非常出色的,他想拥有的东西很杰出。隐藏在著名的“香蕉”中?它对makabuo具有8个表达式,或更改角度,背景,甚至将它们转换为三维图像,因此字符不会降低。在连续的20个编辑操作中,角色托运的准确性仍超过95%。上海人工智能研究所技术主任Fang Shuai认为,许多令人惊叹的“纳米巴纳斯人”表演来自提高理解能力。 Google团队介绍了我自己的产品,还指出,当模型在理解图像方面变得更强大时,某些功能可以移动图像生成。 “ Nanobanana”使用Google的Google的Gemini Mockup知识储备来制作和编辑图像。索拉(Sora)因一年前对身体政策的理解而受到批评。例如,在吹蜡烛的老太太的视频中,蜡烛没有在空中杀死。在从空中掉下玻璃的视频中,玻璃没有破碎,水中的水侧流。但是,将气球图像插入“纳米巴纳那”中的仙人掌,并要求猜测下一张图片,显示气球爆炸,仙人掌完好无损。 “纳米巴纳那”了解物理世界的政策,并知道气球撞到仙人掌时会爆炸。更重要的是,“纳米巴纳那”的交互模式与AI应用程序在人们的想象中的外观非常一致。它可以准确地研究编辑自然语言指令,以100多种语言支持即时单词的需求,并准确地识别92%。例如,如果您输入角色图像并说“在他身上戴上帽子”,则该模型是一个讨厌的图片。还有一个流行的“ Stickman”游戏玩法。输入几张图片后,使用Stickman绘制动作,模型可以制作逻辑图,这些图表是持续的动作图,例如一个人踢和攻击的人,以及蹲下的人进行防御。其他令人不安的AI应用程序许可总是会激发人们对AI未来的更多猜测,并且发生的变化正在悄悄地加速。在Xiaohongshu,一些网民将他们的创造性想法转换为物理产品,例如婴儿服装,配件,手机盒,明信片等,以及通过软件提供的商店完成的销售封闭循环。以前由设计师设计的这项工作现在可以参与。以15元人民币为例的摩托车手机的描述的收购案例为例,每月出售100件零件可以创造可观的收入。 AI还为生产和销售模式带来了变化。设计师经常首先使用巨大的图片,使用流量来确定哪个是著名的,然后生产物理产品。让STEP1X-EDIT模型使用声音来改变女孩的外观。 Xiaohongshu的AI Master视频屏幕截图“播放'Nanobanana'图片转换为数字的方式非常有趣,但是只希望2d Figuce公司Apex-Toy的创始人Ma Li告诉记者,主要原因是数字有很多详细信息。目前,2d数字的平均配件数量约为150,有些数量超过300,并且有些超过300。 STEP YUEXINGCHEN的副总裁Li Jing说,早在今年5月,Step Yuexingchen的开源图像编辑模型Step1x-Edit的能力与“ Nanobanana”相同,并且可以在更改区域的情况下进行更改。发型,改变衣服的颜色,在月亮蛋糕中盒子里饺子饺子,甚至是M发出问题,使其成为30岁的老人角色。 “ step1x-edit使用语音来使盒子和计算机的桌面在盒子中更换月饼的大型模型。准确性;它希望创建一个AI,可以理解用户的深刻意图,甚至比人更好。 特别声明:上面的内容(包括照片或视频(如果有))已由“ NetEase”自助媒体平台的用户上传和发布。该平台仅提供信息存储服务。 注意:上面的内容(包括照片和视频(如果有))已由NetEase Hao用户上传和发布,该用户是社交媒体平台,仅提供信息存储服务。
服务热线
400-123-4567