EXO Labs分布式推理技术突破:异构设备协同实现AI大语言模型性能提升2.8倍 EXO Labs最新研究成果展示:通过智能协同苹果M3 Ultra与英伟达DGX Spark设备,在AI大语言模型推理中实现2.8倍性能提升。详解分布式推理架构如何通过KV缓存数据传输突破硬件瓶颈,为... AI新闻资讯# AI推理# EXOLabs# MetaLlama-3.1 2个月前
微软首个分布式AI超级工厂正式运营,跨州整合数十万GPU突破算力极限 微软首个分布式AI超级工厂正式投入运营,通过专有光纤连接两大数据中心,整合数十万颗英伟达GPU,实现跨州协同计算,将复杂AI训练周期从数月缩短至数周,引领AI基础设施网络化转型。 AI新闻资讯# AI训练# AI超级工厂# GPU集群 1个月前