英伟达Jet-Nemotron开源:2B/4B参数模型实现53倍推理吞吐量突破 英伟达发布全面开源的Jet-Nemotron系列AI语言模型,通过PostNAS架构优化与JetBlock模块实现47-53倍推理速度提升,在MMLU-Pro等基准测试中超越Qwen3、Gemma3等... AI产品动态# AI大模型# Jet-Nemotron# PostNAS 2天前
英伟达发布Jet-Nemotron小型语言模型,全华人团队打造性能效率双突破 英伟达Jet-Nemotron系列小型语言模型由全华人团队开发,凭借PostNAS和JetBlock技术实现性能与效率双重突破,在推理任务中超越Qwen3、Gemma3等模型,吞吐量提升53.6倍,适... AI产品动态# AI推理# Jet-Nemotron# JetBlock 3天前