Together.ai与Agentica联合发布开源AI Agent框架DeepSWE,基于Qwen3-32B模型构建

知名大模型训练平台Together.aiAgentica于7月3日联合发布了开源AI Agent框架DeepSWE,该系统基于阿里巴巴最新开源的Qwen3-32B模型构建,采用强化学习技术训练,标志着AI与软件工程融合的重大突破。

技术实现方面,DeepSWE依托专为语言智能体设计的rLLM训练框架,在64个H100 GPU上进行了为期6天的强化学习训练。训练数据来自R2E-Gym子集的4500个真实世界软件工程任务,涵盖GitHub问题修复、新功能实现及代码调试等场景。这种训练方式使系统具备在复杂代码库中导航、精准编辑代码、执行构建测试命令等能力,并能针对实际拉取请求优化解决方案。

性能测试显示,在SWE-Bench-Verified基准测试中,DeepSWE以64k上下文窗口和100环境步长设置下,16次运行平均Pass@1准确率达42.2%。通过混合测试时扩展(TTS)技术优化后,性能跃升至59%,超越所有开源Agent框架位列榜首。值得注意的是,该成绩是在未依赖专有教师模型蒸馏或监督微调的情况下取得,验证了纯强化学习方法的有效性。

开源策略上,项目方在Hugging Face平台全面公开了模型权重、训练方法、完整日志及数据集,这种透明化举措有助于开发者深入理解系统原理并进行二次开发。已有头部互联网公司反馈,基于DeepSWE微调的模型使其微服务架构优化效率提升25%,同时降低40%训练成本。

产业影响层面,该框架被视为AI Agent技术普惠化的重要里程碑。Agentica首席科学家指出,当尖端AI Agent技术成为公共基础设施时,软件开发生产力革命才真正具备广泛适用性。研究团队透露,下一步将整合多模态能力以处理代码、文档等异构数据,并探索跨语言编程场景的自动转换优化。金融机构和制造企业等垂直领域可基于该框架开发专属的代码审计、自动化调试等企业级智能体工具。

市场分析机构认为,DeepSWE的开源将加速AI Agent在2025年的规模化落地,建议重点关注AI算力基础设施与垂直场景应用的协同发展机遇。

© 版权声明

相关文章