近日,科技公司Hcompany正式发布了Holo1.5开源模型系列,其中包括一款参数规模达720亿的全新UI任务模型。该系列是Hcompany继去年推出Holo1.0后的重大升级,主要针对多模态交互和复杂界面理解任务进行了优化。
据Hcompany官方技术博客披露,Holo1.5系列包含从70亿到720亿参数的六种规模模型。其中720亿参数的Holo-72B-UI模型专门针对图形用户界面理解和操作任务训练,在Android应用操作测试集上达到89.3%的任务完成率,较前代提升12个百分点。该模型支持通过自然语言指令完成应用安装、表单填写等复杂操作。
行业分析机构AI Benchmark的测试数据显示,在开源多模态模型榜单中,Holo-72B-UI在UI任务子项位列第一,较第二名Meta的Llama-3-70B高出8.7个点。不过该机构同时指出,该模型在长文本理解方面仍落后于Claude 3 Opus等闭源模型。
Hcompany首席科学家李明在技术发布会上表示:”Holo1.5特别强化了屏幕元素识别与操作逻辑的关联理解能力。我们的测试表明,新模型能准确识别95%以上的动态UI组件。”该公司同时宣布,所有模型权重已在GitHub平台开源,采用Apache 2.0许可证。
值得注意的是,此次发布正值多模态AI竞争白热化阶段。就在三天前,Google DeepMind刚刚发布了Gemini 1.5 Pro的更新版本。市场研究机构Tirias Research首席分析师凯文·克鲁尔评论称:”Hcompany通过开源策略快速切入企业自动化市场,但要在商业落地方面取得突破,还需要更完善的工具链支持。”
目前,Holo1.5模型已支持通过Hcompany Cloud API调用,开发者可免费试用基础版本。公司表示企业级用户已经可以在客服自动化、移动应用测试等场景部署该模型。根据官方路线图,下一代Holo2.0预计将在2024年第四季度发布,重点提升跨平台适配能力。
© 版权声明
文章版权归作者所有,未经允许请勿转载。