OpenAI革命性MXFP4技术:大模型推理成本直降75%,效率飙升4倍 深度解读OpenAI突破性MXFP4技术:4位浮点格式使AI大模型显存占用减少75%,token生成速度提升4倍,揭秘1200亿参数模型80GB显存运行的黑科技。 AI产品动态# AI技术# MXFP4# OpenAI 6个月前
Meta发布MobileLLM-R1系列小参数模型,端侧AI推理效率突破新高 Meta最新发布的MobileLLM-R1系列以140M-950M参数实现高效AI推理,在数学计算与编程任务中性能超越大模型。本文解析其技术突破、基准测试表现及对端侧AI开发的行业影响。 AI产品动态# AI基准测试# MetaAI# 小参数语言模型 4个月前
Hugging Face发布Transformers v5.0:确立PyTorch唯一后端,四大架构革新引领AI开发新范式 2025年Hugging Face重磅推出Transformers v5.0候选版,首次确立PyTorch为唯一后端,实现代码极简设计、全流程预训练支持、推理引擎互操作及核心量化四大突破。本文解读此次... AI产品动态# AI开发# AI开源工具# HuggingFace 2个月前