华为开源轻量级大模型openPangu-Embedded-7B-v1.1,实现快慢思维自由切换突破 华为开源轻量级大模型openPangu-Embedded-7B-v1.1,实现动态快慢思维模式切换,提升推理效率50%,适用于工业物联网和移动终端。了解技术突破与应用前景。 AI产品动态# AI推理# openPangu-Embedded# 华为 1周前
面壁智能发布MiniCPM 4.1基座模型:稀疏架构突破AI推理效率瓶颈 面壁智能MiniCPM 4.1基座模型采用稀疏化架构,实现8B参数高效推理,兼容Ollama/vLLM等框架,准确率提升18%,显存占用降30%,推动AI终端部署与算力优化解决方案。 AI产品动态# AI推理# MiniCPM# 大模型优化 2周前
英伟达发布Jet-Nemotron小型语言模型,全华人团队打造性能效率双突破 英伟达Jet-Nemotron系列小型语言模型由全华人团队开发,凭借PostNAS和JetBlock技术实现性能与效率双重突破,在推理任务中超越Qwen3、Gemma3等模型,吞吐量提升53.6倍,适... AI产品动态# AI推理# Jet-Nemotron# JetBlock 4周前
华为发布UCM推理加速技术,助力金融AI应用效率提升 华为发布UCM推理记忆数据管理器技术,通过分级管理KV Cache记忆数据,显著提升AI推理效率并降低成本。中国银联已试点该技术,联合华为发布智慧金融AI推理加速方案。了解UCM技术如何推动金融AI应... AI新闻资讯# AI推理# UCM技术# 华为 1个月前
华为与中国银联联合发布AI推理突破性技术,降低HBM依赖并提升性能 华为与中国银联联合发布AI推理突破性技术,减少对HBM的依赖并提升性能,推动金融行业实时风险评估、智能投顾等场景应用,助力中国自主AI生态发展。 AI新闻资讯# AI推理# HBM# 中国银联 1个月前
谷歌推出Gemini 2.5 Deep Think模型,AI推理能力再升级 谷歌推出Gemini 2.5 Deep Think模型,性能超越OpenAI和xAI竞品,现已面向Ultra用户开放。了解这款基于多假设推理的AI模型如何提升复杂问题解决能力。 AI产品动态# AI推理# AI模型# Gemini2.5DeepThink 2个月前
英伟达CEO盛赞DeepSeek-R1模型:中国AI技术的全球突破与开源革命 英伟达CEO黄仁勋公开称赞中国DeepSeek-R1模型的技术突破与开源价值,该模型通过混合专家架构和思维链技术实现高效推理,正在重塑全球AI产业生态。 AI新闻资讯# AI推理# DeepSeek# 人工智能 2个月前