AI2科学家揭秘强化学习与推理模型新突破,开源对标DeepSeek-R1 深度解读AI2科学家Nathan Lambert团队在强化学习与推理模型领域的最新研究成果,包括GRPO算法优化、OpenReasonerZero训练流程复现,以及打造开源推理模型对标DeepSeek... AI新闻资讯# AI竞赛# DeepSeek# 人工智能 2天前
OpenAI发布ChatGPT Agent:AI技术迈向自主代理新时代 深度解析OpenAI最新发布的ChatGPT Agent技术:采用端到端强化学习实现自主工具组合,在多项基准测试中刷新纪录,将重塑人机协作模式并推动AI产业链发展。了解这一突破性AI技术的架构特点、性... AI新闻资讯# AI技术# ChatGPTAgent# OpenAI 2周前
昆仑万维开源多模态推理模型Skywork-R1V 3.0,实现跨模态推理突破 昆仑万维宣布开源多模态推理模型Skywork-R1V 3.0,该模型通过GRPO强化学习算法显著提升跨模态推理能力,在高考数学测试中表现优异,超越Claude、GPT等国际主流模型。 AI产品动态# AI# 多模态推理# 开源模型 4周前
开源运动控制框架Tien Kung-Lab发布,推动人形机器人技术迈入新阶段 北京人形机器人创新中心发布Tien Kung-Lab开源运动控制框架,整合强化学习与人体运动数据,显著提升机器人运动控制的稳定性和泛化性,推动行业技术发展。 AI产品动态# AI技术# 人形机器人# 开源框架 4周前
Together.ai与Agentica联合发布开源AI Agent框架DeepSWE,基于Qwen3-32B模型构建 Together.ai与Agentica联合发布开源AI Agent框架DeepSWE,基于Qwen3-32B模型构建,采用强化学习技术训练,性能测试显示其在SWE-Bench-Verified基准测... AI产品动态# Agentica# AIAgent# DeepSWE 1个月前
ETH突破性AI技术:微型机器人血管导航成功率高达90% 苏黎世联邦理工学院最新研究显示,其开发的AI控制微型机器人系统在血管环境中导航成功率突破90%。该技术融合MBRL策略与超声驱动,仅需1小时微调即可适应新环境,为精准医疗提供全新解决方案。 AI新闻资讯# AI医疗# ETH研究# 强化学习 1个月前
前OpenAI高管Mira Murati创立的Thinking Machines Lab完成20亿美元融资,估值突破100亿 前OpenAI高管Mira Murati创立的Thinking Machines Lab完成20亿美元融资,估值突破100亿美元。TML凭借定制化AI模型技术和强化学习解决方案迅速崛起,成为AI领域最... AI新闻资讯# AI融资# MiraMurati# OpenAI 1个月前
月之暗面Kimi-Researcher智能体启动灰度测试,AI深度研究技术实现突破 月之暗面公司旗下AI产品Kimi-Researcher智能体启动灰度测试,基于端到端自主强化学习技术,实现超万字研究报告生成与全程溯源,技术能力领先行业,或将重塑学术与商业研究协作模式。 AI产品动态# AI# Kimi-Researcher# 强化学习 1个月前
小红书技术团队突破深度思考模型优化,提出’Think When You Need’新范式 小红书技术团队在深度思考模型领域取得重大突破,创新提出'Think When You Need'强化学习训练范式,显著缩短思考长度并保持性能。该研究揭示了反直觉的大模型思考特征,为AI认知优化提供新思... AI新闻资讯# AI技术# 人工智能# 小红书 2个月前