微软开源rStar2-Agent数学推理模型:140亿参数超越6710亿大模型,主动式强化学习突破 微软研究院开源rStar2-Agent数学推理模型,仅140亿参数超越6710亿参数大模型。基于主动式强化学习架构,实现高效训练和卓越泛化能力,降低计算成本,推动AI推理技术发展。 AI产品动态# AI模型# 主动式强化学习# 小参数模型 2个月前
英伟达开源Nemotron-Nano-9B-V2模型:90亿参数性能比肩主流,吞吐量达6.3倍 英伟达发布开源小型语言模型Nemotron-Nano-9B-V2,在GSM8K、MMLU-Pro等基准测试中性能媲美Qwen3-8B,支持128K上下文长度,单个A10 GPU可运行,现已在Huggi... AI产品动态# AI模型# GPU部署# Nemotron-Nano 2个月前