DeepSeek论文获ACL2025最佳论文奖:原生稀疏注意力技术突破长文本处理瓶颈 DeepSeek联合北大研发的原生稀疏注意力(NSA)获ACL2025最佳论文,该技术实现64k文本11.6倍加速,计算复杂度降至线性,支持百万tokens上下文窗口,将彻底改变法律金融等领域的长文本... AI新闻资讯# ACL2025# AI论文# DeepSeek 4个月前
DeepSeek推出V3.2-Exp实验模型:自研DSA稀疏注意力机制大幅提升长文本处理效率 DeepSeek推出实验性V3.2-Exp模型,采用自研DSA稀疏注意力机制显著提升长文本训练推理效率,API调用成本降低超50%,支持160K长上下文,已在HuggingFace等平台开源。 AI产品动态# AI模型# API降价# DeepSeek 2个月前