快手开源Keye-VL-1.5多模态大模型：80亿参数支持128k上下文，视频理解能力行业领先

AI产品动态9个月前发布 AI视野

近日，快手正式开源其最新多模态大模型Keye-VL-1.5，该模型凭借80亿参数规模与128k tokens的超长上下文支持能力，在视频理解、图像解析及复杂逻辑推理任务中展现出行业领先水平。此次开源标志着短视频平台在AI核心技术领域的重大突破。

在权威基准测试中，Keye-VL-1.5表现尤为突出。Video-MME、Video-MMMU和TempCompass等视频理解评估中，其性能超越阿里Qwen2.5-VL 8B、小米MiMo-VL 7B-RL等同规模竞品，其中在Video-MMMU测试集上实现6.5%的绝对性能提升。值得注意的是，该模型对长视频的时序逻辑捕捉能力显著增强，可精准解析视频中的细节关联与语义层次，这为智能剪辑、内容推荐等场景提供了更精准的底层技术支持。

在数学推理专项测试中，Keye-VL-1.5于WeMath、MathVerse等评估集同样表现优异。实测显示，该模型处理数分钟视频内容仅需约10秒，响应速度达到工业级应用标准。快手内部基准测试进一步验证，其综合得分较前代模型提升0.51，在事实准确性指标上以0.19的优势领先同类产品。

技术特性方面，Keye-VL-1.5突破了传统模型仅能识别片段标签的局限，实现了对视频内容的时空维度深度理解。这一能力可延伸应用于内容创作全链路，包括自动标题生成、智能互动解说等场景。目前模型已通过开源社区发布，开发者可基于其架构探索短视频生态的智能化创新应用。

文章版权归作者所有，未经允许请勿转载。

快手开源Keye-VL-1.5多模态大模型：80亿参数支持128k上下文，视频理解能力行业领先

微软Copilot推出虚拟形象功能Copilot Appearance，AI助手交互体验全面升级

魅族Flyme 12.2稳定版推送：AI驱动智能家居与系统全面进化

相关文章

联想IFA2025推出全球首款垂直旋转屏AI PC与智能支架，重新定义未来办公

OpenAI发布开源安全推理模型：GPT-OSS-Safeguard-120B/20B，构建AI安全新防线

蚂蚁集团与北医三院共建AI医疗实验室，推动辅助诊疗与智能陪诊创新

华为启动10亿“天工计划”，全面加速鸿蒙AI生态创新

最新资讯

热门AI工具

热门资讯