近日,人工智能初创公司Cognition宣布推出其最新软件工程大语言模型SWE-1.5。该模型在推理速度上取得显著突破,达到每秒950令牌(tokens),较行业同类产品提升约40%。这一进展或将重塑AI辅助编程工具的效率标准。
据Cognition官方技术博客披露,SWE-1.5基于改进的Transformer架构,特别优化了长代码序列的并行处理能力。实测数据显示,在GitHub公开的Python代码库测试中,该模型完成典型函数补全任务仅需1.2秒,较前代SWE-1.0版本响应时间缩短53%。值得注意的是,模型在保持高速推理的同时,其代码建议的首次准确率仍稳定在78%左右,与当前主流竞品持平。
行业分析师指出,这一突破性进展主要受益于三项技术创新:动态批处理技术的应用、注意力机制的硬件级优化,以及新型量化方法的部署。Cognition CTO Scott Wu在开发者论坛透露,团队通过重构CUDA内核实现了计算效率的显著提升,使得模型能在NVIDIA H100集群上实现接近理论极限的吞吐量。
市场反应显示,包括GitHub Copilot和Amazon CodeWhisperer在内的主流编程助手服务商已开始调整产品路线图。据彭博社报道,微软研究院人工智能部门上周紧急召集会议,讨论应对SWE-1.5可能带来的市场竞争压力。
不过也有专家持审慎态度。斯坦福大学计算机科学教授Michele Catasta在接受TechCrunch采访时表示:”推理速度只是评估AI编程工具的维度之一,真实场景下的上下文理解能力、多轮交互稳定性等指标同样关键。”目前SWE-1.5尚未开放大规模公测,其实际表现仍有待验证。
Cognition表示,该模型已进入有限预览阶段,首批合作伙伴包括云计算服务商Lambda Labs和开源平台Replit。公司计划在2024年第三季度末推出商业化API服务,定价策略将采用按token计费模式,具体细则尚未公布。
© 版权声明
文章版权归作者所有,未经允许请勿转载。