近日,苹果公司正式发布《Apple Intelligence Foundation Language Models Tech Report 2025》技术报告,标志着其AI战略进入新阶段。这份报告由即将离职的AI负责人庞若鸣(Ruoming Pang)主导完成,他在社交媒体上确认已正式将团队交接给继任者陈智峰(Zhifeng Chen)。庞若鸣近期被Meta以高薪挖角,此次报告被视为其在苹果的收官之作。
报告详细披露了双轨并行模型架构:一款为30亿参数的设备端模型,通过KV缓存共享和2位量化感知训练等创新技术,深度适配苹果自研芯片,可在iPhone、iPad和Mac等设备实现高效本地化运行;另一款为云端可扩展模型,采用新型并行轨道混合专家(PT-MoE)Transformer架构,结合全局-局部注意力机制,专为苹果私有云平台优化。两种模型均通过多语言多模态数据集训练,支持图像理解、工具调用及新增语言处理能力。
技术亮点包括PT-MoE架构的突破性设计——将模型划分为多个独立处理的轨道模块,仅需在轨道块边界同步数据,使同步开销降低最高87.5%。报告强调,该设计在保持隐私性的同时,通过端云协同显著提升任务处理效率:简单任务由设备端模型处理,复杂计算则交由具备同等隐私保护的云端模型完成。
此次发布被视为苹果在生成式AI领域的重要布局,其技术路线明显区别于行业主流方案,特别强调设备端性能优化与隐私保护的结合。随着M5芯片即将在多款新品中亮相,新一代AI模型与自研硬件的协同效应值得持续关注。
© 版权声明
文章版权归作者所有,未经允许请勿转载。