阿里巴巴开源全球首个应用思维链技术的音频生成模型ThinkSound 阿里巴巴通义实验室开源全球首个应用思维链(CoT)技术的音频生成模型ThinkSound,实现音画同步精准控制,为影视、游戏及无障碍内容创作提供革新性解决方案。模型采用事件解构-声学推导-时序合成框架... AI产品动态# AI# CoT技术# ThinkSound 1个月前
阿里巴巴开源32款Qwen3系列MLX模型,全面适配苹果设备生态 阿里巴巴通义千问团队宣布开源Qwen3全系列32款MLX量化模型,覆盖4种精度版本(4bit、6bit、8bit、BF16),专为苹果芯片架构深度优化。 AI产品动态# AI开源# MLX模型# Qwen3 2个月前
阿里开源3D数字人框架Mnn3dAvatar,支持面部捕捉和3D 虚拟角色动画映射 阿里巴巴近日正式开源3D数字人框架Mnn3dAvatar,该技术基于自研的3D高斯溅射算法,实现了高精度实时面部捕捉与虚拟角色动画映射,标志着消费级硬件迈入影视级数字人应用时代。 AI产品动态# 3D数字人# AI技术# 开源框架 2个月前