AI推理优化

共 2 篇AI资讯

AI推理优化

排序

发布更新浏览

小米开源MoE模型Xiaomi MiMo-V2-Flash发布：150token/秒生成速度创纪录，性能比肩DeepSeek-V3.2

小米开源MoE模型Xiaomi MiMo-V2-Flash发布：150token/秒生成速度创纪录，性能比肩DeepSeek-V3.2

小米发布开源MoE模型Xiaomi MiMo-V2-Flash，以每秒150token生成速度创纪录，总参数3090亿，采用混合注意力架构。模型在代码和多语言测试中表现卓越，成本仅为Claude 4...

AI产品动态 # AI性能突破 # AI推理优化 # MoE模型

5个月前

FriendliAI完成2000万美元融资，GPU成本节省90%领跑AI推理优化赛道

FriendliAI完成2000万美元融资，GPU成本节省90%领跑AI推理优化赛道

FriendliAI完成2000万美元种子扩展轮融资，专注于AI模型推理阶段优化技术，实测可为企业节省90%GPU成本。目前已与LG电子等30家大型企业合作，2025年营收预计增长600%。了解AI推...

AI新闻资讯 # AI推理优化 # FriendliAI # GPU成本节省

9个月前