近日,清华大学、上海交通大学联合北京华控智加科技有限公司和华北电力大学研究团队,正式发布全球首个多模态工业信号基座模型FISHER。该模型采用创新的子带建模技术,实现对异质工业信号的统一处理,其技术报告与模型权重已在GitHub平台开源,相关论文同步发布于arXiv预印本库。
工业设备智能化运维长期面临M5挑战——多模态信号(如振动、声音、温度)、多采样率、多尺度特征、多任务需求及少故障样本的复杂场景。传统解决方案需针对单一传感器数据开发专用模型,不仅开发成本高昂,且难以挖掘跨模态数据的互补价值。FISHER模型通过短时傅里叶变换(STFT)构建标准化子带单元,采用模块化架构处理任意采样率信号,特别强化了对高频故障分量和旋转机械倍频特征的表征能力。
研究团队指出,尽管工业信号表面差异显著,但其底层存在五大共性特征:健康状态语义一致性、声振信号同源性、谱分析手段通用性、设备故障模式相似性以及任务特征可迁移性。FISHER模型通过参数规模化训练,成功捕捉这些深层规律,在轴承故障诊断等典型场景中展现出较传统小模型更优的泛化性能。
该成果标志着工业智能领域首次实现多模态信号统一建模的技术突破,其开源策略将加速工业AI技术的普惠化进程。随着2025年多模态大模型技术持续升温,FISHER的发布为工业设备预测性维护提供了标准化基础架构,有望推动制造业智能化升级进入新阶段。开发者可通过论文链接与GitHub仓库获取完整技术细节。
© 版权声明
文章版权归作者所有,未经允许请勿转载。