小米开源MoE模型Xiaomi MiMo-V2-Flash发布:150token/秒生成速度创纪录,性能比肩DeepSeek-V3.2 小米发布开源MoE模型Xiaomi MiMo-V2-Flash,以每秒150token生成速度创纪录,总参数3090亿,采用混合注意力架构。模型在代码和多语言测试中表现卓越,成本仅为Claude 4... AI产品动态# AI性能突破# AI推理优化# MoE模型 2个月前
FriendliAI完成2000万美元融资,GPU成本节省90%领跑AI推理优化赛道 FriendliAI完成2000万美元种子扩展轮融资,专注于AI模型推理阶段优化技术,实测可为企业节省90%GPU成本。目前已与LG电子等30家大型企业合作,2025年营收预计增长600%。了解AI推... AI新闻资讯# AI推理优化# FriendliAI# GPU成本节省 5个月前