英伟达发布Jet-Nemotron小型语言模型,全华人团队打造性能效率双突破 英伟达Jet-Nemotron系列小型语言模型由全华人团队开发,凭借PostNAS和JetBlock技术实现性能与效率双重突破,在推理任务中超越Qwen3、Gemma3等模型,吞吐量提升53.6倍,适... AI产品动态# AI推理# Jet-Nemotron# JetBlock 4个月前
华为发布UCM推理加速技术,助力金融AI应用效率提升 华为发布UCM推理记忆数据管理器技术,通过分级管理KV Cache记忆数据,显著提升AI推理效率并降低成本。中国银联已试点该技术,联合华为发布智慧金融AI推理加速方案。了解UCM技术如何推动金融AI应... AI新闻资讯# AI推理# UCM技术# 华为 4个月前
华为与中国银联联合发布AI推理突破性技术,降低HBM依赖并提升性能 华为与中国银联联合发布AI推理突破性技术,减少对HBM的依赖并提升性能,推动金融行业实时风险评估、智能投顾等场景应用,助力中国自主AI生态发展。 AI新闻资讯# AI推理# HBM# 中国银联 4个月前
谷歌推出Gemini 2.5 Deep Think模型,AI推理能力再升级 谷歌推出Gemini 2.5 Deep Think模型,性能超越OpenAI和xAI竞品,现已面向Ultra用户开放。了解这款基于多假设推理的AI模型如何提升复杂问题解决能力。 AI产品动态# AI推理# AI模型# Gemini2.5DeepThink 5个月前
英伟达CEO盛赞DeepSeek-R1模型:中国AI技术的全球突破与开源革命 英伟达CEO黄仁勋公开称赞中国DeepSeek-R1模型的技术突破与开源价值,该模型通过混合专家架构和思维链技术实现高效推理,正在重塑全球AI产业生态。 AI新闻资讯# AI推理# DeepSeek# 人工智能 5个月前