月之暗面开源Kimi Linear混合注意力架构:KV缓存降75%,解码吞吐量提升6倍 月之暗面开源Kimi Linear混合注意力架构,通过KDA模块实现KV缓存降低75%、解码吞吐量提升6倍,在1M tokens长上下文任务中性能提升6.3倍,现已集成至阿里云PAI平台,加速AI在智... AI产品动态# AI开源# AI架构# KimiLinear 2天前
DeepSeek-OCR开源:30亿参数OCR模型实现长文本处理突破,97%识别精度引领多模态AI新范式 DeepSeek团队开源30亿参数OCR模型DeepSeek-OCR,采用创新光学压缩技术实现97%识别精度。该模型在长文本处理、多分辨率输入方面表现卓越,为金融、医疗、出版行业提供高效数字化解决方案... AI产品动态# AI开源模型# DeepSeek-OCR# OCR技术 2周前
蚂蚁百灵开源Ring-mini-linear-2.0与Ring-flash-linear-2.0模型:长文本推理成本降至传统模型1/10 蚂蚁百灵开源Ring-mini-linear-2.0与Ring-flash-linear-2.0混合线性推理模型,通过线性Attention技术将长文本推理成本降至传统模型十分之一,推理效率提升12倍... AI产品动态# AI成本降低# AI模型# 开源AI 1个月前
DeepSeek推出V3.2-Exp实验模型:自研DSA稀疏注意力机制大幅提升长文本处理效率 DeepSeek推出实验性V3.2-Exp模型,采用自研DSA稀疏注意力机制显著提升长文本训练推理效率,API调用成本降低超50%,支持160K长上下文,已在HuggingFace等平台开源。 AI产品动态# AI模型# API降价# DeepSeek 1个月前
字节跳动开源512K长文本大模型Seed-OSS-36B:性能超越Gemma3、Qwen3-32B 字节跳动开源360亿参数大模型Seed-OSS-36B,支持512K超长文本处理,性能超越Gemma3-27B和Qwen3-32B。Apache-2.0协议可免费商用,适用于法律分析、代码库理解等长文... AI产品动态# AI大模型# GPT替代方案# Seed-OSS-36B 3个月前
DeepSeek-V3.1重磅升级:128K上下文窗口震撼发布,长文本处理能力翻倍 DeepSeek-V3.1实现重大技术突破:上下文窗口扩展至128K,多步推理性能提升43%,幻觉概率降低38%。专为长文档分析、代码库理解和复杂计算场景优化,为企业级AI应用提供领先解决方案。 AI产品动态# AI模型升级# DeepSeek# MoE架构 3个月前
DeepSeek论文获ACL2025最佳论文奖:原生稀疏注意力技术突破长文本处理瓶颈 DeepSeek联合北大研发的原生稀疏注意力(NSA)获ACL2025最佳论文,该技术实现64k文本11.6倍加速,计算复杂度降至线性,支持百万tokens上下文窗口,将彻底改变法律金融等领域的长文本... AI新闻资讯# ACL2025# AI论文# DeepSeek 3个月前
MiniMax发布M1推理模型:突破百万Token上下文极限,成本效率双提升 MiniMax发布M1推理模型,该模型凭借支持100万Token上下文窗口及8万Token推理输出的能力,成为全球长文本处理领域的新标杆。 AI产品动态# AI技术# 开源模型# 推理优化 5个月前