月之暗面开源Kimi Linear混合注意力架构:KV缓存降75%,解码吞吐量提升6倍 月之暗面开源Kimi Linear混合注意力架构,通过KDA模块实现KV缓存降低75%、解码吞吐量提升6倍,在1M tokens长上下文任务中性能提升6.3倍,现已集成至阿里云PAI平台,加速AI在智... AI产品动态# AI开源# AI架构# KimiLinear 18小时前