蚂蚁集团百灵Ling-mini-2.0大模型首发上线硅基流动平台,128K上下文助力企业降本60%

9月10日,硅基流动平台正式宣布首发上线蚂蚁集团百灵团队最新开源的大模型Ling-mini-2.0。该模型采用16B总参数设计,通过动态稀疏激活技术实现每Token仅激活1.4B参数(non-embedding部分789M),在保持高性能的同时显著降低计算成本。平台提供的服务支持128K超长上下文窗口,定价策略为输入0.5元/M Tokens、输出2元/M Tokens,这一价格体系在同类开源模型商用服务中具有显著竞争力。

技术文档显示,Ling-mini-2.0通过参数共享和条件计算技术,在16B总参数量级下实现了接近稠密模型70B参数的推理质量。其动态路由架构允许模型根据输入内容自动选择激活路径,这使得单位Token的计算能耗较传统稠密模型下降约60%。目前该服务已面向企业开发者开放API接入,首批应用场景预计将集中在金融文本分析、长文档摘要生成等领域。

行业观察人士指出,此次合作标志着蚂蚁集团在开源大模型商业化生态建设上的重要进展。硅基流动作为国内领先的AI基础设施服务商,其平台已累计接入超过20个开源大模型,此次引入Ling-mini-2.0进一步完善了从7B到16B参数级别的模型矩阵。值得注意的是,该服务采用按量付费模式,相较私有化部署方案可降低中小企业85%以上的初始投入成本。

© 版权声明

相关文章