强化学习

苹果发布RL4HS技术：强化学习精准定位大模型幻觉片段，AI可靠性迎突破

苹果发布RL4HS突破性AI技术，利用强化学习精准定位大模型幻觉片段，支持片段级错误检测。涵盖技术原理、实验数据及在医疗、法律等领域的应用价值，为LLM可靠性提供全新解决方案。

8个月前

腾讯发布TiG框架：AI战略决策准确率提升超30%，《王者荣耀》实战验证

腾讯全新TiG框架在AI战略决策领域取得重大突破，基于《王者荣耀》实验平台，通过监督学习+强化学习两阶段训练，使Qwen系列模型决策准确率最高提升至90.91%，具备自然语言解释能力，技术可延伸至金融...

AI新闻资讯 # AI战略决策 # GRPO # TiG框架

8个月前

DeepSeek-R1登《自然》封面：全球首个获同行评审认证的开源大模型

DeepSeek-R1成为全球首个登上《自然》封面的主流大语言模型，通过纯强化学习框架降低算力消耗与数据依赖，技术细节经同行评审认证，推动AI研发开源化发展。

AI产品动态 # DeepSeek # 人工智能 # 大语言模型

8个月前

Cursor AI编程平台升级Tab模型：实时强化学习提升代码补全精准度

Cursor最新升级Tab模型，采用实时强化学习技术优化代码补全，采纳率提升28%。了解其在线训练机制、策略梯度算法及对AI辅助编程的未来影响。

AI产品动态 # AI编程 # Anysphere # Cursor

8个月前

Meta突破性ExIt方法发布：单步训练实现LLM多步自我改进，性能提升22%

Meta超级智能实验室最新ExIt方法实现大语言模型单步多步自我改进，性能提升22%，训练效率提高25%。了解突破性强化学习框架如何降低AI算力门槛，推动自动编程与实时应用商业化部署。

AI新闻资讯 # AI商业化 # AI训练技术 # Meta研究院

9个月前

清华大学联合团队突破搜索智能体训练瓶颈：自搜索强化学习（SSRL）实现高效Sim2Real迁移

清华大学与上海AI实验室联合发布自搜索强化学习（SSRL）技术，解决搜索智能体训练成本高与模拟环境差距问题，实现LLM知识高效提取与真实场景迁移，代码已开源。

AI新闻资讯 # Sim2Real # 人工智能 # 大语言模型

9个月前

苹果AI重大突破：RLCF方法重塑大模型训练，复杂指令执行能力提升达8.2%

苹果发布革命性RLCF人工智能训练方法，通过结构化清单反馈机制显著提升大模型复杂指令执行能力，在FollowBench等测试中实现最高8.2%性能优化。了解AI如何通过WildChecklists数据...

AI新闻资讯 # AI训练技术 # RLCF # 人工智能

9个月前

腾讯推出大模型训练库WeChat-YATT，多模态训练效率提升15%

腾讯推出大模型训练库WeChat-YATT，专注强化学习与多模态优化，支持中文语境预训练并降低15%硬件消耗。了解其分布式框架、云集成能力及在微信智能客服等场景的应用前景。

AI产品动态 # AI基础设施 # WeChat-YATT # 多模态AI

9个月前

AI2科学家揭秘强化学习与推理模型新突破，开源对标DeepSeek-R1

深度解读AI2科学家Nathan Lambert团队在强化学习与推理模型领域的最新研究成果，包括GRPO算法优化、OpenReasonerZero训练流程复现，以及打造开源推理模型对标DeepSeek...

AI新闻资讯 # AI竞赛 # DeepSeek # 人工智能

10个月前

OpenAI发布ChatGPT Agent：AI技术迈向自主代理新时代

深度解析OpenAI最新发布的ChatGPT Agent技术：采用端到端强化学习实现自主工具组合，在多项基准测试中刷新纪录，将重塑人机协作模式并推动AI产业链发展。了解这一突破性AI技术的架构特点、性...

AI新闻资讯 # AI技术 # ChatGPTAgent # OpenAI

10个月前

苹果发布RL4HS技术：强化学习精准定位大模型幻觉片段，AI可靠性迎突破

腾讯发布TiG框架：AI战略决策准确率提升超30%，《王者荣耀》实战验证

DeepSeek-R1登《自然》封面：全球首个获同行评审认证的开源大模型

Cursor AI编程平台升级Tab模型：实时强化学习提升代码补全精准度

Meta突破性ExIt方法发布：单步训练实现LLM多步自我改进，性能提升22%

清华大学联合团队突破搜索智能体训练瓶颈：自搜索强化学习（SSRL）实现高效Sim2Real迁移

苹果AI重大突破：RLCF方法重塑大模型训练，复杂指令执行能力提升达8.2%

腾讯推出大模型训练库WeChat-YATT，多模态训练效率提升15%

AI2科学家揭秘强化学习与推理模型新突破，开源对标DeepSeek-R1

OpenAI发布ChatGPT Agent：AI技术迈向自主代理新时代

热门AI工具

最新资讯