阿联酋穆罕默德·本·扎耶德人工智能大学(MBZUAI)与科技集团G42于9月9日联合发布了一款名为“K2 Think”的低成本AI推理模型。该模型基于阿里巴巴开源的Qwen 2.5架构开发,通过技术创新实现了显著的高性价比优势。
官方披露的技术细节显示,K2 Think模型仅采用320亿参数规模,但宣称其性能可超越参数规模大20倍的同类竞品。这一突破主要得益于两项核心技术:长链式思维监督微调(CoT)方法,通过模拟人类逐步推理过程提升模型逻辑能力;以及推理阶段扩展技术(test-time scaling),在模型部署时动态分配额外计算资源以增强表现。
MBZUAI基础模型研究所所长Hector Liu强调,K2 Think的创新不仅在于模型本身,更体现在系统化的开发理念。与常规开源项目不同,研发团队将持续监控模型的实际部署表现,并建立动态优化机制。该模型特别针对数学、科学等专业领域进行了优化设计,目前已在Cerebras提供的专用硬件平台上完成测试验证。
行业观察人士指出,此次合作标志着阿联酋在人工智能基础研究领域取得重要进展。G42作为阿联酋重点培育的科技企业,与学术机构的深度协同展现出该国在AI技术产业化方面的战略布局。基于中国头部科技企业的开源成果进行二次创新,也体现了全球AI研发生态的协同效应。
© 版权声明
文章版权归作者所有,未经允许请勿转载。