google空间软件

关注公众号【真智AI】
AI模型尖端应用解析:智能问答、绘图、识图与文件分析
每日分享AI教程、实用技巧与行业前沿资讯!
Google Gemini用户现已全面接入Google最新的人工智能图像模式——Imagen 3,该功能已全面升级并面向所有用户开放,无论您是通过网页、应用还是Android系统集成,都可以轻松使用。在此之前,只有订阅了Gemini Advanced的用户才能在网页版AI中享受到图像生成功能。
Imagen 3由Google旗下的DeepMind研究实验室开发,并在今年的I/O上发布。它能够生成具有写实效果的方形图像,与Midjourney或Flux的效果相抗衡。对于免费用户而言,虽然存在一些限制,如无法生物图像(除非订阅Gemini Advanced),但即使如此,其生成图像的能力仍受限于无法生成真实人物的图像。
Gemini的图像生成功能真正强大的地方在于,它能够通过简单的文本描述轻松适应或完全改变图像。若想体验这一功能,可能需要更新您的应用程序。
Imagen 3有哪些新特性?
Imagen 3相较于前代的Imagen 2在视觉表现上有了显著的进步。其生成的图像更为丰富、细节更加精致,同时模型也更能精准地遵循用户通过Gemini提供的指令。此前,Google曾暂时移除Gemini的图像生成功能,原因是其在渲染人物图像时表现过于保守,且早期模型有使物体看起来像塑料制品的倾向。
新模型将Google的图像生成能力提升至与OpenAI的DALL-E 3相抗衡的水平,尽管目前它只能生成方形图像,但已经显示出强大的潜力。在我的测试中,我发现它在处理日常场景时表现非常出色,但在应对更复杂请求时仍有一定限制,例如描绘一个人在月球基地咖啡馆坐着的场景。
随着Google对图像创建功能的恢复,另一个值得关注的更新是向Gemini发送图像进行分析的功能变得更加便捷。这一功能被称为AI视觉,它允许模型描述图片内容,例如帮助发现房间里缺失的物品,或根据食材创建食谱。
如何试用Imagen 3?
1. 更新应用程序:确保您使用的是最新版本的Gemini应用,以访问Imagen 3的图像生成功能。
2. 文本提示生成图像:通过简单的文本描述来生成图像,体验全新的视觉细节和增强的指令响应能力。
3. 订阅高级功能:如果您希望解锁更多高级功能(如生物图像),可以考虑每月支付19美元订阅Gemini Advanced。
Imagen 3展示了Google在AI图像生成方面的强大潜力。尽管仍有改进空间,特别是在处理复杂和细腻的请求方面,但随着功能的不断更新,Gemini有望成为一个强大的创意工具。关注我们的公众号【真智AI】,获取更多关于AI的教程、实用技巧和行业前沿资讯!
