Kimi模型输出速度突破100 Tokens/秒!限时5折优惠助力AI开发

Kimi开放平台近日宣布,其kimi-k2-turbo-preview模型输出速度实现重大突破,已从初始版本的每秒10 Tokens经两次迭代提升至当前每秒60 Tokens,峰值性能可达每秒100 Tokens。这一技术升级使得模型响应效率较8月1日发布的40 Tokens版本再次提升50%,为用户提供更流畅的交互体验。

该高速版模型在保持与原版kimi-k2相同参数规模(总参数1T,激活参数32B)的基础上,通过架构优化显著提升处理速度。作为采用MoE架构的基础模型,其技术特性包括支持128K长上下文、强化工具调用能力,并在SWE Bench Verified等基准测试中保持开源模型领先水平。

目前平台正推出限时5折优惠活动,截至9月1日前,用户可享受每百万Tokens输入价格2元(缓存命中)/8元(未命中),输出价格32元的特惠费率。恢复原价后,对应价格将调整为输入4元/16元,输出64元。

官方表示此次提速是持续优化计划的重要节点,工程师团队将继续致力于性能提升。用户可通过Kimi开放平台官网获取实时技术参数及API接入文档。该模型的加速迭代,标志着国产大模型在工程化落地方面取得实质性进展,为AI应用开发提供了更高性价比的基础设施支持。

© 版权声明

相关文章