12月20日,摩尔线程在北京中关村国际创新中心召开的首届MUSA开发者大会上,正式发布新一代全功能GPU架构”花港”及配套全栈技术体系。此次发布标志着国产GPU在计算性能、能效比及超大规模集群支持能力等方面取得突破性进展。
架构性能实现多维突破
“花港”架构基于摩尔线程自主研发的MUSA统一体系,在计算密度、能效优化及互联能力上展现显著优势。技术参数显示,该架构采用新一代指令集实现算力密度提升50%,能效比优化达10倍;支持从FP4到FP64的全精度端到端计算,新增MTFP6/MTFP4混合低精度支持。通过集成自研MTLink高速互联技术,可扩展支持十万卡规模以上的智算集群部署。
产品路线图明确
基于新架构的两款芯片同步公布技术路线:面向AI训推场景的”华山”芯片在浮点算力、访存带宽等关键指标上超越国际厂商上一代产品,专为万卡级智算集群设计;图形渲染芯片”庐山”实现3A游戏性能15倍提升,光线追踪性能提升50倍,并完整支持DirectX 12 Ultimate标准。两款芯片预计将于2026年量产上市。
全栈技术生态升级
大会同期发布夸娥万卡智算集群解决方案,其浮点运算能力达10Exa-Flops,在万亿参数模型训练中展现工程化可靠性。软件层面,MUSA 5.0实现全栈升级,包含新一代异步编程模型和ACE2.0通信引擎,显著提升大规模集群算力利用率。实测数据显示,MTT S5000单卡在671B参数模型推理中实现Prefill吞吐4000 tokens/s、Decode吞吐1000 tokens/s的性能突破。
开发者生态建设加速
为完善技术闭环,摩尔线程推出首款AI算力笔记本MTT AIBOOK,搭载自研”长江”智能SoC芯片,异构算力达50TOPS。公司同时宣布”摩尔学院”开发者计划,目标覆盖20万技术社群成员。
业内专家指出,”花港”架构的发布使国产GPU在超大规模智算集群支持能力上达到国际先进水平,为构建自主AI算力基础设施提供关键技术支撑。海淀区政府代表在大会致辞中强调,此类硬科技创新对实现”算力自主”战略目标具有重要价值。
© 版权声明
文章版权归作者所有,未经允许请勿转载。