华为与中国银联将于8月12日在上海举办的“2025金融AI推理应用落地与发展论坛”上联合发布一项AI推理领域的突破性技术成果。该技术旨在降低国内AI推理对高带宽内存(HBM)技术的依赖,同时提升大模型推理性能,进一步完善中国自主AI推理生态的关键环节。
此次发布的技术聚焦两大核心突破:一是通过算法优化与硬件协同设计减少对HBM的依赖,缓解“卡脖子”风险;二是实现性能与生态双升级,不仅提高单点推理效率,更推动金融等场景的规模化应用。据透露,该技术可显著优化金融领域的实时风险评估、智能投顾等场景响应速度,同时降低中小金融机构部署复杂AI模型的硬件门槛,为高频交易欺诈检测、个性化财富管理等创新模式提供技术支撑。
论坛期间,中国信息通信研究院、清华大学及科大讯飞等机构的专家将分享大模型推理加速与体验优化实践。华为作为国家人工智能应用中试基地生态建设合作伙伴,目前已与全球超5600家金融客户建立合作。此次与中国银联的联合发布,标志着AI推理技术从实验室走向产业化的关键一步,也为金融行业智能化转型提供了新的技术路径。
© 版权声明
文章版权归作者所有,未经允许请勿转载。