Grok-4大语言模型测试数据泄露,多项基准测试成绩超越主流模型 xAI公司尚未发布的Grok-4大语言模型在多项基准测试中表现优异,HLE测试得分达45%,远超OpenAI o3和Gemini 2.5 Pro。GPQA测试成绩与o3持平,SWE Bench和AIM... AI产品动态# AI# Grok-4# xAI 2个月前
DeepSeek公开大模型训练技术细节:预训练与优化训练双阶段突破,能耗降低30% DeepSeek公司公开大模型训练技术细节,涵盖预训练与优化训练双阶段,采用MoE架构和FP8混合精度,降低能耗30%,在数学推理和代码生成任务中表现突出,为AI行业提供技术参考与工程实践样本。 AI新闻资讯# AI技术# DeepSeek# MoE架构 4天前