强化学习

Cursor最新升级Tab模型，采用实时强化学习技术优化代码补全，采纳率提升28%。了解其在线训练机制、策略梯度算法及对AI辅助编程的未来影响。

9个月前

前OpenAI高管Mira Murati创立的Thinking Machines Lab完成20亿美元融资，估值突破100亿美元。TML凭借定制化AI模型技术和强化学习解决方案迅速崛起，成为AI领域最...

11个月前

月之暗面公司旗下AI产品Kimi-Researcher智能体启动灰度测试，基于端到端自主强化学习技术，实现超万字研究报告生成与全程溯源，技术能力领先行业，或将重塑学术与商业研究协作模式。

11个月前

Meta超级智能实验室最新ExIt方法实现大语言模型单步多步自我改进，性能提升22%，训练效率提高25%。了解突破性强化学习框架如何降低AI算力门槛，推动自动编程与实时应用商业化部署。

9个月前

苏黎世联邦理工学院最新研究显示，其开发的AI控制微型机器人系统在血管环境中导航成功率突破90%。该技术融合MBRL策略与超声驱动，仅需1小时微调即可适应新环境，为精准医疗提供全新解决方案。

11个月前

小红书技术团队在深度思考模型领域取得重大突破，创新提出'Think When You Need'强化学习训练范式，显著缩短思考长度并保持性能。该研究揭示了反直觉的大模型思考特征，为AI认知优化提供新思...

11个月前

苹果发布革命性RLCF人工智能训练方法，通过结构化清单反馈机制显著提升大模型复杂指令执行能力，在FollowBench等测试中实现最高8.2%性能优化。了解AI如何通过WildChecklists数据...

9个月前