Akamai联手英伟达推出边缘AI推理平台,响应速度提升10倍 Akamai与英伟达联合推出AI推理边缘云平台,整合RTX PRO 6000 Blackwell GPU和全球4200个边缘节点,实现AI推理响应速度提升6-10倍,企业算力成本降低45%,推动自动驾... AI产品动态# AI推理# Akamai# BlackwellGPU 19小时前
Fireworks AI完成2.54亿美元C轮融资,估值达40亿美元,加速AI推理技术布局 人工智能推理初创公司Fireworks AI完成2.54亿美元C轮融资,估值达40亿美元。了解其独特的轻资产模式和speculative inference技术如何推动AI推理市场发展,以及融资资金将... AI新闻资讯# AI技术# AI推理# FireworksAI 1周前
IBM与Groq达成战略合作,通过Watson x Orchestrate提供高速AI推理服务 IBM与Groq达成战略合作,通过Watson x Orchestrate平台提供GroqCloud的高速AI推理服务,降低企业AI部署成本,提升金融、医疗等领域的实时推理效率。预计2026年推出集成... AI产品动态# AI推理# Groq# GroqCloud 2周前
EXO Labs分布式推理技术突破:异构设备协同实现AI大语言模型性能提升2.8倍 EXO Labs最新研究成果展示:通过智能协同苹果M3 Ultra与英伟达DGX Spark设备,在AI大语言模型推理中实现2.8倍性能提升。详解分布式推理架构如何通过KV缓存数据传输突破硬件瓶颈,为... AI新闻资讯# AI推理# EXOLabs# MetaLlama-3.1 3周前
英特尔发布Crescent Island数据中心GPU 强化AI推理市场竞争力 英特尔正式发布代号Crescent Island的新一代数据中心GPU,配备160GB内存,基于Xe3P架构专攻AI推理市场。产品针对大语言模型优化,支持风冷服务器,预计2026年交付样品,剑指英伟达... AI产品动态# AI推理# Xe3P架构# 人工智能硬件 3周前
华为开源轻量级大模型openPangu-Embedded-7B-v1.1,实现快慢思维自由切换突破 华为开源轻量级大模型openPangu-Embedded-7B-v1.1,实现动态快慢思维模式切换,提升推理效率50%,适用于工业物联网和移动终端。了解技术突破与应用前景。 AI产品动态# AI推理# openPangu-Embedded# 华为 2个月前
面壁智能发布MiniCPM 4.1基座模型:稀疏架构突破AI推理效率瓶颈 面壁智能MiniCPM 4.1基座模型采用稀疏化架构,实现8B参数高效推理,兼容Ollama/vLLM等框架,准确率提升18%,显存占用降30%,推动AI终端部署与算力优化解决方案。 AI产品动态# AI推理# MiniCPM# 大模型优化 2个月前
英伟达发布Jet-Nemotron小型语言模型,全华人团队打造性能效率双突破 英伟达Jet-Nemotron系列小型语言模型由全华人团队开发,凭借PostNAS和JetBlock技术实现性能与效率双重突破,在推理任务中超越Qwen3、Gemma3等模型,吞吐量提升53.6倍,适... AI产品动态# AI推理# Jet-Nemotron# JetBlock 2个月前
华为发布UCM推理加速技术,助力金融AI应用效率提升 华为发布UCM推理记忆数据管理器技术,通过分级管理KV Cache记忆数据,显著提升AI推理效率并降低成本。中国银联已试点该技术,联合华为发布智慧金融AI推理加速方案。了解UCM技术如何推动金融AI应... AI新闻资讯# AI推理# UCM技术# 华为 3个月前
华为与中国银联联合发布AI推理突破性技术,降低HBM依赖并提升性能 华为与中国银联联合发布AI推理突破性技术,减少对HBM的依赖并提升性能,推动金融行业实时风险评估、智能投顾等场景应用,助力中国自主AI生态发展。 AI新闻资讯# AI推理# HBM# 中国银联 3个月前