AI推理

英伟达联手SK海力士与群联电子，推出10倍性能AI SSD，重塑AI推理存储格局

英伟达与SK海力士、群联电子合作研发新型AI SSD，性能提升10倍至1亿IOPS，专为AI推理优化，填补内存与存储鸿沟，预计2027年前商用，将降低AI基础设施成本并影响半导体供应链。

5个月前

AMD收购MK1强化AI推理技术，挑战英伟达市场地位

AMD完成对MK1的收购，专注于AI推理技术优化，通过内存算法和FP8/FP4精度降低20%系统成本，提升25%推理效率，直接挑战英伟达Blackwell系列，预计2026年市场份额升至30%。

AI新闻资讯 # AI加速器 # AI推理 # AMD

7个月前

华为开源UCM推理记忆数据管理技术，AI推理性能大幅提升

华为开源UCM推理记忆数据管理技术，通过稀疏化模块和KV Cache优化，实现首Token时延降低90%、吞吐量提升22倍，推动AI推理高效低成本发展。

AI新闻资讯 # AI推理 # KVCache # ModelEngine

7个月前

微软Azure与英伟达Blackwell Ultra GPU实现每秒110万token AI推理新纪录

微软Azure与英伟达合作推出基于Blackwell Ultra GPU的虚拟机，在Llama2 70B模型上实现每秒110万token推理速度，性能提升27%，能效优化2.5倍，为企业级AI部署设立...

AI产品动态 # AI推理 # BlackwellUltra # Llama2

7个月前

Akamai联手英伟达推出边缘AI推理平台，响应速度提升10倍

Akamai与英伟达联合推出AI推理边缘云平台，整合RTX PRO 6000 Blackwell GPU和全球4200个边缘节点，实现AI推理响应速度提升6-10倍，企业算力成本降低45%，推动自动驾...

AI产品动态 # AI推理 # Akamai # BlackwellGPU

7个月前

Fireworks AI完成2.54亿美元C轮融资，估值达40亿美元，加速AI推理技术布局

人工智能推理初创公司Fireworks AI完成2.54亿美元C轮融资，估值达40亿美元。了解其独特的轻资产模式和speculative inference技术如何推动AI推理市场发展，以及融资资金将...

AI新闻资讯 # AI技术 # AI推理 # FireworksAI

7个月前

IBM与Groq达成战略合作，通过Watson x Orchestrate提供高速AI推理服务

IBM与Groq达成战略合作，通过Watson x Orchestrate平台提供GroqCloud的高速AI推理服务，降低企业AI部署成本，提升金融、医疗等领域的实时推理效率。预计2026年推出集成...

AI产品动态 # AI推理 # Groq # GroqCloud

7个月前

EXO Labs分布式推理技术突破：异构设备协同实现AI大语言模型性能提升2.8倍

EXO Labs最新研究成果展示：通过智能协同苹果M3 Ultra与英伟达DGX Spark设备，在AI大语言模型推理中实现2.8倍性能提升。详解分布式推理架构如何通过KV缓存数据传输突破硬件瓶颈，为...

AI新闻资讯 # AI推理 # EXOLabs # MetaLlama-3.1

7个月前

英特尔发布Crescent Island数据中心GPU 强化AI推理市场竞争力

英特尔正式发布代号Crescent Island的新一代数据中心GPU，配备160GB内存，基于Xe3P架构专攻AI推理市场。产品针对大语言模型优化，支持风冷服务器，预计2026年交付样品，剑指英伟达...

AI产品动态 # AI推理 # Xe3P架构 # 人工智能硬件

7个月前

华为开源轻量级大模型openPangu-Embedded-7B-v1.1，实现快慢思维自由切换突破

华为开源轻量级大模型openPangu-Embedded-7B-v1.1，实现动态快慢思维模式切换，提升推理效率50%，适用于工业物联网和移动终端。了解技术突破与应用前景。

AI产品动态 # AI推理 # openPangu-Embedded # 华为

9个月前

英伟达联手SK海力士与群联电子，推出10倍性能AI SSD，重塑AI推理存储格局

AMD收购MK1强化AI推理技术，挑战英伟达市场地位

华为开源UCM推理记忆数据管理技术，AI推理性能大幅提升

微软Azure与英伟达Blackwell Ultra GPU实现每秒110万token AI推理新纪录

Akamai联手英伟达推出边缘AI推理平台，响应速度提升10倍

Fireworks AI完成2.54亿美元C轮融资，估值达40亿美元，加速AI推理技术布局

IBM与Groq达成战略合作，通过Watson x Orchestrate提供高速AI推理服务

EXO Labs分布式推理技术突破：异构设备协同实现AI大语言模型性能提升2.8倍

英特尔发布Crescent Island数据中心GPU 强化AI推理市场竞争力

华为开源轻量级大模型openPangu-Embedded-7B-v1.1，实现快慢思维自由切换突破

热门AI工具

最新资讯