荣耀发布开源多模态感知大模型MagicGUI,引领手机AI交互新阶段

在2025世界人工智能大会(WAIC)期间,荣耀正式发布自研多模态感知大模型MagicGUI,并宣布将其全面开源。该模型作为荣耀首个GUI开源大模型,以70亿参数规模为核心,支撑底层AI智能体的多模态感知与自动化任务规划能力,首发搭载于折叠屏旗舰Magic V5,标志着手机AI交互进入新阶段。

技术层面,MagicGUI采用“继续预训练+强化微调”两阶段训练方案,结合空间增强复合奖励函数、DF-GRPO强化学习算法等创新方法,在数据工程中构建高效采集框架,形成高质量多模态训练数据集。实际测试显示,其在Magic V5常用场景操控准确率达91.5%,较行业顶级开源模型提升16.4%,尤其在移动端视觉定位、页面理解问答等四类任务中全面领先。

功能实现上,该模型使YOYO智能助手实现从单任务执行到多智能体协同的跨越。以出行场景为例,用户仅需语音指令,YOYO即可自主调度高德、滴滴等应用完成全流程操作,包括地址修改、车型选择及订单管理。这种跨应用闭环执行能力,将复杂任务拆解为自动化动作序列,显著提升交互效率。

作为阿尔法战略的关键节点,荣耀此次开源决策旨在推动AI终端生态建设。公司已联合复旦大学等机构共同研发,并参与《智能体协议共建共享联合倡议》,牵头10余项AI终端标准立项。业界分析认为,MagicGUI的开源将加速消费电子领域自动化应用普及,其“小脑理解-大脑规划-手脚执行”的神经架构设计,为行业提供了可复用的技术范式。

© 版权声明

相关文章