AI视野 | 全球AI信息聚合平台
  • 首页
  • AI工具
    • 智能聊天
    • 职场办公
    • 个人助手
    • 写作应用
    • 图像处理
    • 音频处理
    • 视频处理
    • 设计工具
    • 开发编程
    • 智能体
    • 智慧搜索
    • 教育应用
    • 商业应用
    • 生态应用
  • AI资讯
    • AI每日资讯
    • AI产品动态
    • AI新闻资讯
  • 站内排行榜
  • AI排行榜
    • 全球AI排行榜Top30 | 2025年07月
    • 中国AI排行榜Top30 | 2025年07月
    • 智能聊天AI排行榜Top20 | 2025年07月
    • 职场办公AI排行榜Top20 | 2025年07月
    • 个人助手AI排行榜Top20 | 2025年07月
    • 写作应用AI排行榜Top20 | 2025年07月
    • 图像处理AI排行榜Top20 | 2025年07月
    • 音频处理AI排行榜Top20 | 2025年07月
    • 视频处理AI排行榜Top20 | 2025年07月
    • 设计工具AI排行榜Top20 | 2025年07月
    • 开发编程AI排行榜Top20 | 2025年07月
    • 智慧搜索AI排行榜Top20 | 2025年07月
    • 智能体AI排行榜Top20 | 2025年07月
    • 教育应用AI排行榜Top20 | 2025年07月
    • 商业应用AI排行榜Top20 | 2025年07月
    • 生态应用AI排行榜Top20 | 2025年07月
    • 往期AI排行榜
    • 首页
    • AI工具
      • 智能聊天
      • 职场办公
      • 个人助手
      • 写作应用
      • 图像处理
      • 音频处理
      • 视频处理
      • 设计工具
      • 开发编程
      • 智能体
      • 智慧搜索
      • 教育应用
      • 商业应用
      • 生态应用
    • AI资讯
      • AI每日资讯
      • AI产品动态
      • AI新闻资讯
    • 站内排行榜
    • AI排行榜
      • 全球AI排行榜Top30 | 2025年07月
      • 中国AI排行榜Top30 | 2025年07月
      • 智能聊天AI排行榜Top20 | 2025年07月
      • 职场办公AI排行榜Top20 | 2025年07月
      • 个人助手AI排行榜Top20 | 2025年07月
      • 写作应用AI排行榜Top20 | 2025年07月
      • 图像处理AI排行榜Top20 | 2025年07月
      • 音频处理AI排行榜Top20 | 2025年07月
      • 视频处理AI排行榜Top20 | 2025年07月
      • 设计工具AI排行榜Top20 | 2025年07月
      • 开发编程AI排行榜Top20 | 2025年07月
      • 智慧搜索AI排行榜Top20 | 2025年07月
      • 智能体AI排行榜Top20 | 2025年07月
      • 教育应用AI排行榜Top20 | 2025年07月
      • 商业应用AI排行榜Top20 | 2025年07月
      • 生态应用AI排行榜Top20 | 2025年07月
      • 往期AI排行榜

    强化学习

    共 15 篇AI资讯
    强化学习
    排序
    发布更新浏览
    DeepSeek-R1登《自然》封面:全球首个获同行评审认证的开源大模型

    DeepSeek-R1登《自然》封面:全球首个获同行评审认证的开源大模型

    DeepSeek-R1成为全球首个登上《自然》封面的主流大语言模型,通过纯强化学习框架降低算力消耗与数据依赖,技术细节经同行评审认证,推动AI研发开源化发展。
    AI产品动态# DeepSeek# 人工智能# 大语言模型
    3天前
    Cursor AI编程平台升级Tab模型:实时强化学习提升代码补全精准度

    Cursor AI编程平台升级Tab模型:实时强化学习提升代码补全精准度

    Cursor最新升级Tab模型,采用实时强化学习技术优化代码补全,采纳率提升28%。了解其在线训练机制、策略梯度算法及对AI辅助编程的未来影响。
    AI产品动态# AI编程# Anysphere# Cursor
    5天前
    Meta突破性ExIt方法发布:单步训练实现LLM多步自我改进,性能提升22%

    Meta突破性ExIt方法发布:单步训练实现LLM多步自我改进,性能提升22%

    Meta超级智能实验室最新ExIt方法实现大语言模型单步多步自我改进,性能提升22%,训练效率提高25%。了解突破性强化学习框架如何降低AI算力门槛,推动自动编程与实时应用商业化部署。
    AI新闻资讯# AI商业化# AI训练技术# Meta研究院
    2周前
    清华大学联合团队突破搜索智能体训练瓶颈:自搜索强化学习(SSRL)实现高效Sim2Real迁移

    清华大学联合团队突破搜索智能体训练瓶颈:自搜索强化学习(SSRL)实现高效Sim2Real迁移

    清华大学与上海AI实验室联合发布自搜索强化学习(SSRL)技术,解决搜索智能体训练成本高与模拟环境差距问题,实现LLM知识高效提取与真实场景迁移,代码已开源。
    AI新闻资讯# Sim2Real# 人工智能# 大语言模型
    3周前
    苹果AI重大突破:RLCF方法重塑大模型训练,复杂指令执行能力提升达8.2%

    苹果AI重大突破:RLCF方法重塑大模型训练,复杂指令执行能力提升达8.2%

    苹果发布革命性RLCF人工智能训练方法,通过结构化清单反馈机制显著提升大模型复杂指令执行能力,在FollowBench等测试中实现最高8.2%性能优化。了解AI如何通过WildChecklists数据...
    AI新闻资讯# AI训练技术# RLCF# 人工智能
    4周前
    腾讯推出大模型训练库WeChat-YATT,多模态训练效率提升15%

    腾讯推出大模型训练库WeChat-YATT,多模态训练效率提升15%

    腾讯推出大模型训练库WeChat-YATT,专注强化学习与多模态优化,支持中文语境预训练并降低15%硬件消耗。了解其分布式框架、云集成能力及在微信智能客服等场景的应用前景。
    AI产品动态# AI基础设施# WeChat-YATT# 多模态AI
    1个月前
    AI2科学家揭秘强化学习与推理模型新突破,开源对标DeepSeek-R1

    AI2科学家揭秘强化学习与推理模型新突破,开源对标DeepSeek-R1

    深度解读AI2科学家Nathan Lambert团队在强化学习与推理模型领域的最新研究成果,包括GRPO算法优化、OpenReasonerZero训练流程复现,以及打造开源推理模型对标DeepSeek...
    AI新闻资讯# AI竞赛# DeepSeek# 人工智能
    2个月前
    OpenAI发布ChatGPT Agent:AI技术迈向自主代理新时代

    OpenAI发布ChatGPT Agent:AI技术迈向自主代理新时代

    深度解析OpenAI最新发布的ChatGPT Agent技术:采用端到端强化学习实现自主工具组合,在多项基准测试中刷新纪录,将重塑人机协作模式并推动AI产业链发展。了解这一突破性AI技术的架构特点、性...
    AI新闻资讯# AI技术# ChatGPTAgent# OpenAI
    2个月前
    昆仑万维开源多模态推理模型Skywork-R1V 3.0,实现跨模态推理突破

    昆仑万维开源多模态推理模型Skywork-R1V 3.0,实现跨模态推理突破

    昆仑万维宣布开源多模态推理模型Skywork-R1V 3.0,该模型通过GRPO强化学习算法显著提升跨模态推理能力,在高考数学测试中表现优异,超越Claude、GPT等国际主流模型。
    AI产品动态# AI# 多模态推理# 开源模型
    2个月前
    开源运动控制框架Tien Kung-Lab发布,推动人形机器人技术迈入新阶段

    开源运动控制框架Tien Kung-Lab发布,推动人形机器人技术迈入新阶段

    北京人形机器人创新中心发布Tien Kung-Lab开源运动控制框架,整合强化学习与人体运动数据,显著提升机器人运动控制的稳定性和泛化性,推动行业技术发展。
    AI产品动态# AI技术# 人形机器人# 开源框架
    3个月前
    加载更多

    热门AI工具

    最新资讯

    AI视野 | 全球AI信息聚合平台
    AI视野 - 全球AI信息聚合平台,拓展AI视野,致力于打造全面专业的AI信息平台。 整合全球最全面的AI应用资源库,实时追踪最新AI行业资讯与技术动态,深度解析AI产品发展趋势,提供多维度的AI应用排名。 以专业视角为您打开AI视野,了解全球AI领域动态,助力您在AI智能时代把握先机,智领未来。

    AI资讯 站内排行 全球AI排行榜Top30 中国AI排行榜Top30 往期AI排行榜 关于我们

    扫码加公众号AI视野 | 全球AI信息聚合平台
    扫码加公众号
    扫码加微信AI视野 | 全球AI信息聚合平台
    扫码加微信
    Copyright © 2025 AI视野 | 全球AI信息聚合平台  粤ICP备2025421237号 
    AI工具
    AI工具AI资讯