硅基流动公司于2025年8月25日正式上线DeepSeek-V3.1大语言模型,该版本由深度求索团队研发,标志着人工智能领域在混合推理架构与超长上下文处理能力上的重要突破。作为近期大模型技术迭代的关键成果,该模型已通过硅基流动平台向开发者开放服务。
技术参数方面,DeepSeek-V3.1总参数量达6710亿,其中激活参数为370亿,采用创新的混合推理架构。该设计突破性地实现了思考模式与非思考模式的动态切换:前者适用于需要深度分析的复杂任务,后者则针对常规问答提供高效响应。实测数据显示,相较于前代DeepSeek-R1-0528,新版本在保持同等任务表现的前提下,思考模式下的输出token数量减少20%-50%,显著提升推理效率。
性能表现上,该模型在SWE软件工程基准、Browsecomp复杂搜索测试、xBench多领域评估及SimpleQA基础问答等测试中均实现显著提升。在编程智能体任务中,其终端环境操作(Terminal-Bench)和代码修复(SWE)的完成轮数较前代大幅减少;在需要多步推理的专家级难题测试(HLE)中,模型取得29.8分的突破性成绩,展现出接近人类专家的复杂问题处理能力。
上下文窗口扩展至160K成为本次升级的核心竞争力,该特性支持无损处理法律合同、学术文献等超长文档,并实现多轮对话的连贯性记忆。技术团队通过KV Cache压缩和分段稀疏注意力技术,在显存占用仅增加18%的情况下达成该突破,推理延迟控制在2.1秒内。实际应用中,该能力可支持百份文档的嵌入式检索,显著降低传统RAG方案的错误率。
商业化进程同步推进,硅基流动平台已对API服务进行扩容,新定价体系将于9月6日生效,当前输入/输出成本分别为4元/M Tokens和12元/M Tokens,较同类产品具有显著价格优势。目前官方App、网页端及API接口均已完成升级,用户可通过”深度思考”按钮自主切换推理模式。
© 版权声明
文章版权归作者所有,未经允许请勿转载。