腾讯混元开源轻量级视频生成模型HunyuanVideo 1.5，8.3B参数支持高清视频生成

AI产品动态6个月前发布 AI视野

腾讯混元团队于2025年11月20日正式开源了轻量级视频生成模型 HunyuanVideo 1.5（HYVideo-1.5），该模型基于Diffusion Transformer（DiT）架构，参数量为8.3B，支持生成5至10秒的高清视频。这一开源项目已在GitHub和Hugging Face上发布，包含完整的模型权重和推理代码。

HunyuanVideo 1.5的核心优势在于其轻量化设计和高性能表现。与上一代旗舰模型相比，该模型在参数量大幅减少的情况下，仍能保持高质量的视频生成能力。其创新的SSTA稀疏注意力机制（选择性滑动分块注意力）显著提升了推理效率，配合多阶段渐进式训练策略，使得生成视频在运动连贯性、语义遵循等关键维度达到商用水平。

该模型支持中英文输入，具备文生视频与图生视频的双重功能。用户可通过简单的文字描述或上传静态图片配合提示词，快速生成动态视频。生成的视频原生支持480p和720p分辨率，并可通过超分模型提升至1080p电影级画质。此外，模型还支持多种风格生成，包括写实、动画及积木风格，并能在视频中嵌入中英文文字。

在硬件需求方面，HunyuanVideo 1.5的轻量化设计使其能够在14G显存的消费级显卡上流畅运行，大幅降低了视频生成技术的使用门槛。这一特性使其成为开发者和创作者的理想工具，为短视频创作、教育内容制作等领域提供了新的可能性。

目前，腾讯元宝App已集成该模型功能，用户可通过官方渠道直接体验。这一开源项目的发布，标志着视频生成技术在轻量化和普及化方面迈出了重要一步。

文章版权归作者所有，未经允许请勿转载。

腾讯混元开源轻量级视频生成模型HunyuanVideo 1.5，8.3B参数支持高清视频生成

OpenAI开放ChatGPT群聊功能：支持20人协作，基于GPT-5.1构建

Meta发布WorldGen突破性技术：文本提示生成50米×50米可交互3D虚拟世界

相关文章

蚂蚁数科发布多语种多模态大模型训练框架，突破小语种AI理解瓶颈

xAI开源Grok 2.5大模型：代码/数据全面开放，同步预告Grok 3突破性能力

Windows 11画图应用重磅更新：支持.paint工程文件与透明度调节，迈向专业图像编辑

iOS 26 Beta 4重新启用智能通知摘要功能，AI优化新闻娱乐通知管理

最新资讯

热门AI工具

热门资讯