蚂蚁百灵开源Ring-mini-linear-2.0与Ring-flash-linear-2.0模型:长文本推理成本降至传统模型1/10 蚂蚁百灵开源Ring-mini-linear-2.0与Ring-flash-linear-2.0混合线性推理模型,通过线性Attention技术将长文本推理成本降至传统模型十分之一,推理效率提升12倍... AI产品动态# AI成本降低# AI模型# 开源AI 3周前