DeepSeek发布mHC架构突破大模型训练稳定性难题,信号放大降至1.6倍 DeepSeek在2026年元旦发布mHC流形约束超连接架构,通过几何约束机制解决大规模模型训练稳定性问题,信号放大倍数从3000倍大幅降至1.6倍,梯度波动减少83%,性能提升2.2%,为大模型研发... AI产品动态# AI研究# DeepSeek# 人工智能 4周前