阶跃星辰发布第三代大模型Step 3,7月31日全球开源,性能超越国内外同类模型

7月25日,阶跃星辰在上海正式发布第三代基础大模型Step 3,并宣布将于7月31日面向全球开源。作为国内首个万亿参数混合专家模型(MoE架构),Step 3总参数量达3210亿,激活参数量380亿,较前代Step 1提升10倍。在多项公开评测中,其表现超越国内外同类开源模型,展现出显著的技术突破。

技术层面,Step 3通过架构创新实现跨硬件平台的高效推理。在国产芯片上,其32K上下文推理效率最高可达DeepSeek-R1的300%;基于英伟达Hopper架构芯片的分布式推理测试显示,吞吐量较DeepSeek-R1提升超70%。阶跃星辰联合创始人朱亦博解释,团队在模型设计中重点优化了访存比斜率,使其更适配国产芯片的计算特性,有效规避显存与计算瓶颈。

商业化进展方面,公司披露全年营收目标为10亿元人民币,并宣布与上海国有资本投资有限公司达成战略合作,后者将参与新一轮融资。据悉,本轮融资规模超5亿美元,资金将用于持续提升模型能力及生态建设。

为推进算力与模型协同优化,阶跃星辰联合华为昇腾、沐曦、寒武纪等近10家芯片厂商成立”模芯生态创新联盟”,目前已实现Step 3在华为昇腾芯片的完整搭载。创始人姜大昕强调,公司坚持”超级模型+超级应用”战略,认为多模态领域的技术突破将开启”无AI味影视生产”等新场景。

此次开源决策被业界视为国产大模型生态建设的重要里程碑。随着7月31日全球开源节点的临近,Step 3在跨硬件适配性与推理效率方面的优势,或将对现有开源模型格局产生实质性影响。

© 版权声明

相关文章