谷歌发布Gemini 3 Pro Image：多模态AI实现对话式图像编辑与4K高清生成

AI产品动态6个月前发布 AI视野

当地时间11月20日，谷歌正式推出第二代Nano Banana模型，其官方命名为Gemini 3 Pro Image预览版。作为新一代多模态AI系统，该模型采用创新的推理机制，在生成图像前通过内部逻辑分析优化输出结果，显著提升了图像质量与细节准确性。

与传统图像生成模型不同，Gemini 3 Pro Image具备64K输入token和32K输出token的上下文窗口，支持最高4K分辨率的图像输出。其核心技术突破在于实现了多轮次对话式编辑功能，允许用户通过连续指令对图像进行迭代优化。模型还支持将最多14张输入图像合成为单张输出作品，并集成了Google搜索能力以确保生成内容的事实准确性。

在应用层面，Gemini 3 Pro Image特别适用于需要高精度图像合成的创意工作，包括多语言环境下的长文本渲染、依赖实时数据的可视化创作等专业场景。目前该模型已部署于Vertex AI平台，开发者可通过Google AI Studio提供的Python和Go接口进行调用。

据技术文档显示，该模型在多模态推理基准测试中展现出显著优势，其图像生成质量较前代产品提升约40%，文本渲染准确率提高35%。行业观察人士指出，此次更新标志着谷歌在生成式AI领域的技术积累已开始向专业化、垂直化方向发展。

文章版权归作者所有，未经允许请勿转载。

谷歌发布Gemini 3 Pro Image：多模态AI实现对话式图像编辑与4K高清生成

中国智造新里程碑！远征A2人形机器人创106公里行走世界纪录

OpenAI发布ChatGPT Atlas重大更新：九项新功能强化AI浏览器竞争力

相关文章

罗永浩重返科技舞台：AI时代人类创造力何去何从？细红线科技发布AI软件引关注

腾讯混元大模型全球品牌升级：正式更名Tencent HY 2.0，参数达4060亿

马蜂窝AI路书全面开放：智能旅行规划新纪元

谷歌AI推出Stax评估工具：重塑大型语言模型性能测试标准

最新资讯

热门AI工具

热门资讯