昆仑万维开源Skywork-Reward-V2系列奖励模型,刷新七大评测基准SOTA成绩 昆仑万维最新开源Skywork-Reward-V2系列奖励模型,覆盖6亿至80亿参数规模,在七大评测基准中刷新SOTA成绩。该模型采用创新人机协同数据构建方法,推动RLHF技术进步,降低AI技术门槛... AI产品动态# AI开源# RLHF# Skywork-Reward-V2 2天前