模型量化

共 3 篇AI资讯

模型量化

排序

发布更新浏览

OpenAI革命性MXFP4技术：大模型推理成本直降75%，效率飙升4倍

OpenAI革命性MXFP4技术：大模型推理成本直降75%，效率飙升4倍

深度解读OpenAI突破性MXFP4技术：4位浮点格式使AI大模型显存占用减少75%，token生成速度提升4倍，揭秘1200亿参数模型80GB显存运行的黑科技。

AI产品动态 # AI技术 # MXFP4 # OpenAI

10个月前

Meta发布MobileLLM-R1系列小参数模型，端侧AI推理效率突破新高

Meta发布MobileLLM-R1系列小参数模型，端侧AI推理效率突破新高

Meta最新发布的MobileLLM-R1系列以140M-950M参数实现高效AI推理，在数学计算与编程任务中性能超越大模型。本文解析其技术突破、基准测试表现及对端侧AI开发的行业影响。

AI产品动态 # AI基准测试 # MetaAI # 小参数语言模型

8个月前

Hugging Face发布Transformers v5.0：确立PyTorch唯一后端，四大架构革新引领AI开发新范式

Hugging Face发布Transformers v5.0：确立PyTorch唯一后端，四大架构革新引领AI开发新范式

2025年Hugging Face重磅推出Transformers v5.0候选版，首次确立PyTorch为唯一后端，实现代码极简设计、全流程预训练支持、推理引擎互操作及核心量化四大突破。本文解读此次...

AI产品动态 # AI开发 # AI开源工具 # HuggingFace

6个月前