近日,快手正式推出端到端生成式推荐系统OneRec,该系统通过大模型技术重构传统推荐架构,在效果与成本方面实现双重突破。OneRec采用端到端生成式架构,将推荐问题从传统的多阶段分层筛选彻底转变为大模型直接生成推荐内容列表的模式,标志着推荐系统进入”端到端生成式觉醒”新阶段。
技术层面,OneRec系统主要包含三大核心模块:用户建模(Encoder)、推荐生成(Decoder)和奖励机制。系统会对用户长期行为数据进行深度编码,形成多维兴趣向量;基于此,由大模型的MoE解码器生成推荐内容;同时引入强化学习机制,根据用户反馈动态优化推荐结果。特别值得注意的是,该系统首创协同感知多模态分词器,融合视频标题、图像等多维信息与用户行为,利用RQ-Kmeans分层生成语义ID。
实际运营数据显示,OneRec已全面上线快手App及极速版,承接约25%的QPS(每秒请求数量)。在性能指标方面,系统有效计算量提升10倍,算力利用率分别达到23.7%和28.8%,运营成本仅为传统方案的10.6%。用户体验方面,带动App停留时长提升0.54%-1.24%,关键指标7日用户生命周期(LT7)显著增长。
该系统的推出被视为推荐系统领域的重要突破,为行业从传统Pipeline架构向端到端生成式架构转型提供了首个工业级可行方案。目前相关技术报告已在arXiv平台公开发布,详细阐述了系统架构、训练方法及优化策略。
© 版权声明
文章版权归作者所有,未经允许请勿转载。