AMD收购MK1强化AI推理技术,挑战英伟达市场地位 AMD完成对MK1的收购,专注于AI推理技术优化,通过内存算法和FP8/FP4精度降低20%系统成本,提升25%推理效率,直接挑战英伟达Blackwell系列,预计2026年市场份额升至30%。 AI新闻资讯# AI加速器# AI推理# AMD 1个月前
华为开源UCM推理记忆数据管理技术,AI推理性能大幅提升 华为开源UCM推理记忆数据管理技术,通过稀疏化模块和KV Cache优化,实现首Token时延降低90%、吞吐量提升22倍,推动AI推理高效低成本发展。 AI新闻资讯# AI推理# KVCache# ModelEngine 2个月前
微软Azure与英伟达Blackwell Ultra GPU实现每秒110万token AI推理新纪录 微软Azure与英伟达合作推出基于Blackwell Ultra GPU的虚拟机,在Llama2 70B模型上实现每秒110万token推理速度,性能提升27%,能效优化2.5倍,为企业级AI部署设立... AI产品动态# AI推理# BlackwellUltra# Llama2 2个月前
Akamai联手英伟达推出边缘AI推理平台,响应速度提升10倍 Akamai与英伟达联合推出AI推理边缘云平台,整合RTX PRO 6000 Blackwell GPU和全球4200个边缘节点,实现AI推理响应速度提升6-10倍,企业算力成本降低45%,推动自动驾... AI产品动态# AI推理# Akamai# BlackwellGPU 2个月前
Fireworks AI完成2.54亿美元C轮融资,估值达40亿美元,加速AI推理技术布局 人工智能推理初创公司Fireworks AI完成2.54亿美元C轮融资,估值达40亿美元。了解其独特的轻资产模式和speculative inference技术如何推动AI推理市场发展,以及融资资金将... AI新闻资讯# AI技术# AI推理# FireworksAI 2个月前
IBM与Groq达成战略合作,通过Watson x Orchestrate提供高速AI推理服务 IBM与Groq达成战略合作,通过Watson x Orchestrate平台提供GroqCloud的高速AI推理服务,降低企业AI部署成本,提升金融、医疗等领域的实时推理效率。预计2026年推出集成... AI产品动态# AI推理# Groq# GroqCloud 2个月前
EXO Labs分布式推理技术突破:异构设备协同实现AI大语言模型性能提升2.8倍 EXO Labs最新研究成果展示:通过智能协同苹果M3 Ultra与英伟达DGX Spark设备,在AI大语言模型推理中实现2.8倍性能提升。详解分布式推理架构如何通过KV缓存数据传输突破硬件瓶颈,为... AI新闻资讯# AI推理# EXOLabs# MetaLlama-3.1 2个月前
英特尔发布Crescent Island数据中心GPU 强化AI推理市场竞争力 英特尔正式发布代号Crescent Island的新一代数据中心GPU,配备160GB内存,基于Xe3P架构专攻AI推理市场。产品针对大语言模型优化,支持风冷服务器,预计2026年交付样品,剑指英伟达... AI产品动态# AI推理# Xe3P架构# 人工智能硬件 2个月前
华为开源轻量级大模型openPangu-Embedded-7B-v1.1,实现快慢思维自由切换突破 华为开源轻量级大模型openPangu-Embedded-7B-v1.1,实现动态快慢思维模式切换,提升推理效率50%,适用于工业物联网和移动终端。了解技术突破与应用前景。 AI产品动态# AI推理# openPangu-Embedded# 华为 3个月前
面壁智能发布MiniCPM 4.1基座模型:稀疏架构突破AI推理效率瓶颈 面壁智能MiniCPM 4.1基座模型采用稀疏化架构,实现8B参数高效推理,兼容Ollama/vLLM等框架,准确率提升18%,显存占用降30%,推动AI终端部署与算力优化解决方案。 AI产品动态# AI推理# MiniCPM# 大模型优化 3个月前