智谱开源全球首个手机操作AI Agent模型AutoGLM,推动AI手机生态开放化

智谱于2025年12月9日正式宣布开源其核心AI Agent模型AutoGLM,该模型作为全球首个具备“Phone Use”(手机操作)能力的AI Agent,标志着人工智能移动设备交互领域取得突破性进展。AutoGLM能够稳定执行外卖点单、机票预订等涉及数十步操作的复杂任务,目前已覆盖微信、淘宝、抖音、美团等50余个高频中文应用的核心场景。

此次开源包含训练好的核心模型、手机操作能力框架与工具链、可直接运行的Demo示例(适配50+主流App)、Android适配层及完整技术文档。开发者可基于该框架快速构建能“理解”屏幕内容并模拟人类触控行为的AI助手,显著降低AI手机技术门槛。项目采用MIT开源许可证,代码托管于GitHub平台,支持本地与云端双部署模式,确保用户数据与隐私控制权不受第三方干预。

智谱团队表示,AutoGLM的研发始于2023年4月,历时32个月攻克了屏幕语义理解、操作流程恢复等关键技术。其创新性在于通过云端虚拟手机沙箱进行强化学习训练,既提升模型泛化能力,又避免触及真实用户隐私数据。官方强调,AI手机生态不应由少数厂商垄断,开源策略旨在推动行业从封闭走向开放共创,加速实现“每台手机皆可AI化”的愿景。

行业观察人士指出,AutoGLM的自动化操作能力与早前引发热议的“豆包手机”演示效果相当,其开源将促使更多硬件厂商和开发者参与AI手机生态建设。目前该项目已获得多家头部手机厂商的关注,预计将推动消费电子领域新一轮智能化升级。

© 版权声明

相关文章