开源模型

Resemble AI开源语音合成模型Chatterbox Turbo：5秒克隆人声，内置抗编辑水印

Resemble AI发布开源语音合成模型Chatterbox Turbo，仅5秒音频即可克隆人声，音质优于竞品。模型支持免费商用、多语言生成与抗编辑水印，适用于客服、游戏等实时场景，推动AI语音技术...

5个月前

阿里通义开源Qwen-Image-2512图像生成模型，突破真实感与文字渲染技术瓶颈

阿里巴巴通义实验室开源新一代图像生成模型Qwen-Image-2512，在人物真实感、自然纹理细节和复杂文字渲染三大核心领域实现突破性进展。模型采用多尺度特征融合与3D感知架构，解决传统AI图像'塑料...

AI产品动态 # AIGC技术 # AI图像生成 # Qwen-Image-2512

5个月前

中国开放权重AI模型实现技术超越与全球市场渗透，推动全球AI竞争格局重构

斯坦福大学报告显示中国开放权重AI模型实现技术突破：通义千问等模型在推理与代码生成基准测试中超越GPT-oss，全球使用占比八个月内从1.2%增长至30%，成本控制与生态开放性正推动全球AI竞争格局结...

AI新闻资讯 # AI生态 # DeepSeek # 中国AI

5个月前

优刻得UModelVerse率先部署GLM-4.7开源模型，企业级AI服务再升级

优刻得UModelVerse平台正式部署智谱新一代开源大模型GLM-4.7，提供企业级AI服务。该模型在Code Arena编码评估中位列开源模型第一，支持代码生成、长文本处理等场景，助力企业降低大模...

AI产品动态 # AI大模型 # GLM-4.7 # UModelVerse

5个月前

阿里通义开源Fun-Audio-Chat 8B端到端语音模型，实现情绪感知与低延迟交互

阿里巴巴通义团队开源Fun-Audio-Chat 8B端到端语音交互模型，采用序列到序列设计，实现情绪感知与自动化任务执行，在OpenAudioBench等评测中领先，GPU开销降低50%，适用于智能...

AI产品动态 # AI技术 # 人工智能 # 开源模型

5个月前

智谱华章发布并开源新一代旗舰大模型GLM-4.7，编程与推理能力全球领先

智谱华章正式发布并开源新一代旗舰大语言模型GLM-4.7，在Code Arena、LiveCodeBench等国际基准测试中斩获开源与国产模型双料第一，编程与推理能力实现重大突破，性能超越GPT-5...

AI产品动态 # AI模型 # GLM-4.7 # 人工智能

5个月前

谷歌开源T5Gemma 2模型系列：多模态与长上下文处理的编码器-解码器新突破

谷歌开源T5Gemma 2模型系列，支持视觉-语言多模态输入与128K tokens长上下文处理，基于Gemma 3架构开发。涵盖270M、1B、4B参数版本，在数学推理、医疗文本生成等任务中性能显著...

AI产品动态 # Gemma3 # T5Gemma2 # 医疗AI

5个月前

美团开源SOTA虚拟人视频生成模型LongCat-Video-Avatar，实现动作拟真与情感表达突破

美团最新开源虚拟人视频生成模型LongCat-Video-Avatar实现三大技术突破：支持文本/图片/视频多模式生成、5分钟长视频稳定生成、情感化动作表达。本文详解其解耦无条件引导、跨片段隐空间拼接...

AI产品动态 # AI # LongCat # SOTA技术

5个月前

阶跃星辰发布Step-GUI系列AI Agent，开启图形界面智能体规模化应用时代

阶跃星辰发布Step-GUI系列AI Agent，实现图形界面智能体规模化应用。技术包含云端模型、端侧开源模型及MCP协议，支持200+应用，10分钟手机部署，已与荣耀、OPPO等厂商合作，推动终端设...

AI产品动态 # AIAgent # MCP协议 # Step-GUI

5个月前

通义大模型开源语音AI双升级：Fun-CosyVoice3实现3秒音色克隆，Fun-ASR嘈杂环境识别率达93%

通义大模型团队开源语音AI双模型Fun-CosyVoice3与Fun-ASR完成重大升级。Fun-CosyVoice3实现首包延迟降低50%、中英混说错误率下降56.4%，支持多语言方言与情感控制，其...

AI产品动态 # AI工具 # Fun-ASR # Fun-CosyVoice3

5个月前

Resemble AI开源语音合成模型Chatterbox Turbo：5秒克隆人声，内置抗编辑水印

阿里通义开源Qwen-Image-2512图像生成模型，突破真实感与文字渲染技术瓶颈

中国开放权重AI模型实现技术超越与全球市场渗透，推动全球AI竞争格局重构

优刻得UModelVerse率先部署GLM-4.7开源模型，企业级AI服务再升级

阿里通义开源Fun-Audio-Chat 8B端到端语音模型，实现情绪感知与低延迟交互

智谱华章发布并开源新一代旗舰大模型GLM-4.7，编程与推理能力全球领先

谷歌开源T5Gemma 2模型系列：多模态与长上下文处理的编码器-解码器新突破

美团开源SOTA虚拟人视频生成模型LongCat-Video-Avatar，实现动作拟真与情感表达突破

阶跃星辰发布Step-GUI系列AI Agent，开启图形界面智能体规模化应用时代

通义大模型开源语音AI双升级：Fun-CosyVoice3实现3秒音色克隆，Fun-ASR嘈杂环境识别率达93%

热门AI工具

最新资讯