蚂蚁百灵开源Ring-mini-linear-2.0与Ring-flash-linear-2.0模型:长文本推理成本降至传统模型1/10 蚂蚁百灵开源Ring-mini-linear-2.0与Ring-flash-linear-2.0混合线性推理模型,通过线性Attention技术将长文本推理成本降至传统模型十分之一,推理效率提升12倍... AI产品动态# AI成本降低# AI模型# 开源AI 1个月前
蚂蚁百灵开源Ring-mini-2.0:轻量级AI推理模型,16B参数激活1.4B实现高效性能 蚂蚁百灵开源Ring-mini-2.0 AI推理模型,采用高效MoE设计,仅激活1.4B参数实现强大推理性能,支持128K长文本处理,吞吐量超500 token/s,助力企业降低AI应用成本。 AI产品动态# AI优化# AI开源# MoE架构 2个月前