蚂蚁集团开源业界首个高性能扩散语言模型推理框架dInfer,推理速度提升10.7倍 蚂蚁集团开源业界首个高性能扩散语言模型推理框架dInfer,实现10.7倍推理速度提升,支持LLaDA等主流dLLM,在HumanEval代码生成任务中达1011 tokens/秒,推动AI推理效率新... AI产品动态# AI开源# dInfer# 人工智能技术 5天前