DeepSeek发布mHC架构突破大模型训练稳定性难题,信号放大降至1.6倍 DeepSeek在2026年元旦发布mHC流形约束超连接架构,通过几何约束机制解决大规模模型训练稳定性问题,信号放大倍数从3000倍大幅降至1.6倍,梯度波动减少83%,性能提升2.2%,为大模型研发... AI产品动态# AI研究# DeepSeek# 人工智能 4周前
00后创立的AI独角兽Mercor获3.5亿美元融资,估值达100亿美元 美国AI服务商Mercor完成3.5亿美元C轮融资,估值达100亿美元。这家由00后创立的公司为OpenAI、Anthropic提供AI模型训练服务,年营收运行率5亿美元,正承接Scale AI转移客... AI新闻资讯# AI独角兽# AI融资# Mercor 3个月前
滑铁卢大学发布SubTrack++技术:大模型训练效率提升3倍,碳排放降低42% 加拿大滑铁卢大学SubTrack++技术实现大语言模型训练革命性突破:预训练耗时减少67%,70亿参数模型性能对标千亿模型,算力消耗降低30%,碳排放减少42%,2026年将开源。 AI产品动态# AI节能技术# SubTrack++# 人工智能 2个月前