荣耀发布开源多模态感知大模型MagicGUI，引领手机AI交互新阶段

AI产品动态10个月前发布 AI视野

在2025世界人工智能大会（WAIC）期间，荣耀正式发布自研多模态感知大模型 MagicGUI，并宣布将其全面开源。该模型作为荣耀首个GUI开源大模型，以70亿参数规模为核心，支撑底层AI智能体的多模态感知与自动化任务规划能力，首发搭载于折叠屏旗舰Magic V5，标志着手机AI交互进入新阶段。

技术层面，MagicGUI采用“继续预训练+强化微调”两阶段训练方案，结合空间增强复合奖励函数、DF-GRPO强化学习算法等创新方法，在数据工程中构建高效采集框架，形成高质量多模态训练数据集。实际测试显示，其在Magic V5常用场景操控准确率达91.5%，较行业顶级开源模型提升16.4%，尤其在移动端视觉定位、页面理解问答等四类任务中全面领先。

功能实现上，该模型使YOYO智能助手实现从单任务执行到多智能体协同的跨越。以出行场景为例，用户仅需语音指令，YOYO即可自主调度高德、滴滴等应用完成全流程操作，包括地址修改、车型选择及订单管理。这种跨应用闭环执行能力，将复杂任务拆解为自动化动作序列，显著提升交互效率。

作为阿尔法战略的关键节点，荣耀此次开源决策旨在推动AI终端生态建设。公司已联合复旦大学等机构共同研发，并参与《智能体协议共建共享联合倡议》，牵头10余项AI终端标准立项。业界分析认为，MagicGUI的开源将加速消费电子领域自动化应用普及，其“小脑理解-大脑规划-手脚执行”的神经架构设计，为行业提供了可复用的技术范式。

文章版权归作者所有，未经允许请勿转载。

荣耀发布开源多模态感知大模型MagicGUI，引领手机AI交互新阶段

百度发布新一代数字人技术NOVA，罗永浩数字人创5500万GMV纪录

商汤科技发布“悟能”具身智能平台，推动AI技术规模化落地

相关文章

重庆加速AI与消费融合，打造“机器人+”多元化应用场景

MIT与ORNL研究：AI已具备替代美国11.7%劳动力能力，工资暴露达1.2万亿美元

美国企业AI应用加速：大型企业成转型主力，就业市场现结构性调整

智谱AI开源GLM-4.6V多模态大模型：原生Function Call实现视觉到行动闭环，API成本降50%

最新资讯

热门AI工具

热门资讯