香港大学与CAMEL-AI等机构联合研发的多智能体协作框架Workforce及其训练方法OWL(Optimized Workforce Learning)近日取得突破性进展。根据2025年6月17日发布的最新测试结果,该系统在通用AI助手标杆基准GAIA上的准确率达到69.70%,不仅刷新开源领域纪录,更超越包括OpenAI Deep Research在内的多家商业系统。相关论文及代码已通过GitHub开源,目前项目星标数已突破17,000。
技术架构与核心优势
OWL基于CAMEL-AI框架构建,通过动态智能体交互机制提升任务处理的自然性与鲁棒性。其创新点包括:
1. 闭环规划系统(Tree-Planner):优化智能体决策路径,提升复杂任务执行效率;
2. 环境扩展方案(AgentGen与Text2World):实现大规模场景适配;
3. 上下文管理技术(HiAgent):采用层次化架构增强系统稳定性。
该系统支持多模态处理(视频、图像、语音)、实时网络检索(集成维基百科/Google等引擎)及浏览器自动化操作(基于Playwright框架),并能解析Office文档与执行Python代码。
行业影响与开源生态
自2025年3月开源以来,OWL持续领跑GAIA基准测试开源榜单(平均分58.18)。研究团队强调,该项目旨在推动学术研究与产业应用的结合,目前已提供完整文档与实验复现工具。分析人士指出,其超越商业系统的表现可能重塑AI任务自动化领域竞争格局,尤其对中小企业降低技术门槛具有重要意义。
© 版权声明
文章版权归作者所有,未经允许请勿转载。