开源模型

微软最新开源轻量级实时文本转语音模型VibeVoice-Realtime-0.5B，以仅5亿参数实现300毫秒首音延迟，支持中英文双语合成与4角色自然对话，适用于智能客服、数字人、电商直播等场景，推动...

4个月前

美团2025年开源5600亿参数混合专家模型LongCat-Flash，通过零计算专家与ScMoE架构实现推理速度提升3倍，支持开发者快速部署，助力本地生活场景智能化应用突破。

8个月前

深度解析Mistral AI最新开源推理模型Magistral Small 1.2的技术特性：240亿参数规模、多模态输入支持、可验证推理架构及商业应用场景，助力开发者构建下一代企业级AI解决方案。

7个月前

上海AI实验室在2025世界人工智能大会上开源全球首个科学多模态大模型Intern-S1，首创跨模态科学解析引擎，性能超越顶尖闭源模型，推动AI驱动科研新范式，降低科研AI部署成本，加速全球科学协作。

9个月前

阿里巴巴夸克团队与浙江大学联合开源的OmniAvatar模型实现音频驱动全身视频生成技术突破，支持单图+音频输入生成高精度唇形同步与流畅肢体动作视频，提供文本调控功能，适用于教育、创意等领域。

9个月前

阿里巴巴开源通义千问Qwen3-Coder AI编程大模型，采用MoE架构，性能超越GPT-4.1等闭源模型，支持256K上下文窗口，显著提升编程效率，免费获取使用。

9个月前

腾讯混元团队发布SRPO技术，通过语义相对偏好优化解决Flux模型人像生成皮肤过油问题，真实感提升3倍，训练效率达75倍提升。代码已开源，推动AI生成内容在影视游戏领域应用。

7个月前