上海交通大学与上海人工智能实验室联合团队近日在人工智能领域取得突破性进展,其研发的7B参数规模AI智能体(ML-Agent)通过”经验学习”新范式,仅需9个机器学习任务的训练即超越671B参数的Deepseek-R1模型性能,标志着AI-for-AI(AI4AI)技术路径实现从”提示工程”到”经验学习”的范式跃迁。该成果于6月21日发表于论文《ML-Agent: Reinforcing LLM Agents for Autonomous Machine Learning Engineering》。
研究团队指出,当前AI开发高度依赖人工调参与实验迭代,成为制约通用人工智能(AGI)发展的关键瓶颈。ML-Agent通过自主设计、优化和改进AI算法,显著降低人类干预需求。实验数据显示,该智能体在持续探索学习中形成的算法设计能力,已突破传统大模型依赖参数规模扩展的技术路线。
这一突破恰逢2025年全球智能体技术爆发期。6月18日至20日上海世界移动通信大会上,AI智能体被列为最受关注议题。上海市经信委4月发布的创新任务通知明确提出探索智能体群智协同技术,工信部近期也强调以工业智能体深化AI工业应用。业内专家表示,具备”自感知-自决策-自执行”能力的智能体正推动政务、电力、营销等领域的应用落地。
值得注意的是,该研究同时揭示了智能体技术对算力的新需求。尽管7B模型实现性能超越,但智能体在任务规划与执行过程中产生的算力消耗仍显著高于传统大语言模型。这预示着下一代AI基础设施将面临更复杂的算力架构挑战。
© 版权声明
文章版权归作者所有,未经允许请勿转载。