阿里云通义千问发布多模态模型Qwen VLo，实现图像与文本高质量协同创作

AI产品动态11个月前发布 AI视野

阿里云通义千问于6月27日正式发布新一代多模态统一理解与生成模型Qwen VLo，标志着其在人工智能领域的技术突破从感知延伸至生成阶段。该模型已通过Qwen Chat平台开放体验，其核心创新在于采用渐进式生成机制，通过从左到右、从上到下的动态优化过程实现图像与文本的高质量协同创作。

技术特性方面，Qwen VLo支持动态分辨率训练与生成，突破传统模型固定格式限制，可适配海报、网页Banner等多样化场景需求。在文本生成领域，模型通过分阶段清晰化处理机制显著提升长段落内容的逻辑连贯性，特别适用于法律文书、学术论文等需高精度控制的专业场景。与现有主流大模型相比，其在中文语境处理及文化适配方面展现出差异化竞争优势。

作为通义千问模型家族的最新成员，Qwen VLo延续了该系列在多模态技术上的积累，其动态交互能力为内容创作平台提供了更灵活的AI工具支持。行业观察指出，该模型的推出将进一步推动多模态技术在具身智能、自动驾驶等前沿领域的应用探索，加速AI与产业场景的深度融合进程。

AI产品动态 # AI # QwenVLo # 多模态模型 # 通义千问 # 阿里云

文章版权归作者所有，未经允许请勿转载。

阿里云通义千问发布多模态模型Qwen VLo，实现图像与文本高质量协同创作

腾讯混元开源首款混合推理MoE模型Hunyuan-A13B，性能超越主流AI模型

特斯拉全球首次Model Y全自动驾驶交付完成，全程无人干预

相关文章

优必选斩获2.64亿人形机器人超级订单 Walker S2刷新全球纪录

京东科技联合Rokid发布全球首款智能眼镜购物应用JoyGlance，实现“所见即购”

吉利发布Flyme Auto 2 AI座舱与超拟人情感智能体Eva，领克/银河首批搭载

腾讯混元团队开源3D世界模型1.0及Hunyuan-GameCraft框架，革新游戏开发

最新资讯

热门AI工具

热门资讯