当地时间11月20日,谷歌正式推出第二代Nano Banana模型,其官方命名为Gemini 3 Pro Image预览版。作为新一代多模态AI系统,该模型采用创新的推理机制,在生成图像前通过内部逻辑分析优化输出结果,显著提升了图像质量与细节准确性。
与传统图像生成模型不同,Gemini 3 Pro Image具备64K输入token和32K输出token的上下文窗口,支持最高4K分辨率的图像输出。其核心技术突破在于实现了多轮次对话式编辑功能,允许用户通过连续指令对图像进行迭代优化。模型还支持将最多14张输入图像合成为单张输出作品,并集成了Google搜索能力以确保生成内容的事实准确性。
在应用层面,Gemini 3 Pro Image特别适用于需要高精度图像合成的创意工作,包括多语言环境下的长文本渲染、依赖实时数据的可视化创作等专业场景。目前该模型已部署于Vertex AI平台,开发者可通过Google AI Studio提供的Python和Go接口进行调用。
据技术文档显示,该模型在多模态推理基准测试中展现出显著优势,其图像生成质量较前代产品提升约40%,文本渲染准确率提高35%。行业观察人士指出,此次更新标志着谷歌在生成式AI领域的技术积累已开始向专业化、垂直化方向发展。
© 版权声明
文章版权归作者所有,未经允许请勿转载。