腾讯混元开源轻量级视频生成模型HunyuanVideo 1.5,8.3B参数支持高清视频生成

腾讯混元团队于2025年11月20日正式开源了轻量级视频生成模型HunyuanVideo 1.5(HYVideo-1.5),该模型基于Diffusion Transformer(DiT)架构,参数量为8.3B,支持生成5至10秒的高清视频。这一开源项目已在GitHub和Hugging Face上发布,包含完整的模型权重和推理代码。

HunyuanVideo 1.5的核心优势在于其轻量化设计和高性能表现。与上一代旗舰模型相比,该模型在参数量大幅减少的情况下,仍能保持高质量的视频生成能力。其创新的SSTA稀疏注意力机制(选择性滑动分块注意力)显著提升了推理效率,配合多阶段渐进式训练策略,使得生成视频在运动连贯性、语义遵循等关键维度达到商用水平。

该模型支持中英文输入,具备文生视频与图生视频的双重功能。用户可通过简单的文字描述或上传静态图片配合提示词,快速生成动态视频。生成的视频原生支持480p和720p分辨率,并可通过超分模型提升至1080p电影级画质。此外,模型还支持多种风格生成,包括写实、动画及积木风格,并能在视频中嵌入中英文文字。

在硬件需求方面,HunyuanVideo 1.5的轻量化设计使其能够在14G显存的消费级显卡上流畅运行,大幅降低了视频生成技术的使用门槛。这一特性使其成为开发者和创作者的理想工具,为短视频创作、教育内容制作等领域提供了新的可能性。

目前,腾讯元宝App已集成该模型功能,用户可通过官方渠道直接体验。这一开源项目的发布,标志着视频生成技术在轻量化和普及化方面迈出了重要一步。

© 版权声明

相关文章