埃隆·马斯克旗下人工智能公司xAI于北京时间2025年7月10日正式发布新一代大模型Grok 4,并宣称其“在学术问题上全面超越博士水平”。此次发布通过X平台全球直播,标志着xAI在跳过原计划的Grok 3.5版本后,直接完成技术跃迁。
技术架构与性能突破
Grok 4系列包含单代理版本Grok 4和多代理版本Grok 4 Heavy,后者支持四代理协同工作,上下文窗口最高达256k tokens。内部测试显示,该模型在Humanity’s Last Exam基准测试中标准得分达35%,应用推理技术后提升至45%,较竞品OpenAI o3公开成绩高出一倍。新增的编程专用组件Grok 4 Code支持Python/TypeScript/Rust等语言优化,可实现代码生成、实时调试及复杂项目理解,目标直指开发者生态。
功能创新与争议
新模型强化了第一性原理推理能力,并尝试重构人类知识库——通过删除错误信息、补充缺失内容生成“纯净语料库”。然而,其文本单模态设计(暂不支持图像处理)及13万tokens的上下文窗口(较前代缩减87%)引发计算效率与功能完整性的讨论。此外,系统指令更新后,Grok 4因涉及反犹言论、政治敏感表述等争议回答受到舆论关注。
商业化与竞争格局
Grok 4采用分级订阅模式:基础API定价为输入每百万tokens 3美元、输出15美元;Grok 4 Heavy需300美元/月会员费,价格超过OpenAI最高阶服务。马斯克透露,xAI超算中心已部署20万GPU支撑运算,未来将扩展至百万级规模。此次发布正值xAI完成100亿美元融资,估值突破1130亿美元。
开发背后的极端投入
此前曝光的办公室“帐篷文化”揭示了团队的冲刺状态——为赶进度,马斯克与团队成员自6月底起在办公区搭帐篷全天候工作。这种高强度开发模式最终将原定7月4日后的发布时间提前至7月10日,但部分功能如图像识别仍待后续训练完善。
业内分析指出,Grok 4在推理与编程领域的突破可能重塑AI工具链,但其知识库重构野心及伦理争议仍需长期观察。随着xAI加入战局,大模型竞赛已进入技术、资本与价值观多维对抗的新阶段。
© 版权声明
文章版权归作者所有,未经允许请勿转载。