Kimi模型输出速度突破100 Tokens/秒！限时5折优惠助力AI开发

AI产品动态9个月前发布 AI视野

Kimi开放平台近日宣布，其kimi-k2-turbo-preview模型输出速度实现重大突破，已从初始版本的每秒10 Tokens经两次迭代提升至当前每秒60 Tokens，峰值性能可达每秒100 Tokens。这一技术升级使得模型响应效率较8月1日发布的40 Tokens版本再次提升50%，为用户提供更流畅的交互体验。

该高速版模型在保持与原版kimi-k2相同参数规模（总参数1T，激活参数32B）的基础上，通过架构优化显著提升处理速度。作为采用MoE架构的基础模型，其技术特性包括支持128K长上下文、强化工具调用能力，并在SWE Bench Verified等基准测试中保持开源模型领先水平。

目前平台正推出限时5折优惠活动，截至9月1日前，用户可享受每百万Tokens输入价格2元（缓存命中）/8元（未命中），输出价格32元的特惠费率。恢复原价后，对应价格将调整为输入4元/16元，输出64元。

官方表示此次提速是持续优化计划的重要节点，工程师团队将继续致力于性能提升。用户可通过Kimi开放平台官网获取实时技术参数及API接入文档。该模型的加速迭代，标志着国产大模型在工程化落地方面取得实质性进展，为AI应用开发提供了更高性价比的基础设施支持。

文章版权归作者所有，未经允许请勿转载。

Kimi模型输出速度突破100 Tokens/秒！限时5折优惠助力AI开发

谷歌联合GSA推出Gemini政府平台：年费47美分颠覆AI采购市场

谷歌Pixel Journal正式发布：AI驱动的智能日记应用，重塑个人记录体验

相关文章

亚马逊云科技Bedrock平台新增Qwen3与DeepSeek-V3.1模型，国产AI实现全球可用

Sandbar推出Stream Ring智能戒指：AI语音助手与隐私化交互新突破

Mistral AI发布Devstral 2系列开源代码模型：1230亿参数旗舰版成本仅为竞品1/7

昆仑万维Skywork AI推出网页复刻功能，数分钟快速生成网页原型

最新资讯

热门AI工具

热门资讯