Resemble AI开源语音合成模型Chatterbox Turbo:5秒克隆人声,内置抗编辑水印 Resemble AI发布开源语音合成模型Chatterbox Turbo,仅5秒音频即可克隆人声,音质优于竞品。模型支持免费商用、多语言生成与抗编辑水印,适用于客服、游戏等实时场景,推动AI语音技术... AI产品动态# AI语音合成# ChatterboxTurbo# ResembleAI 4周前
阿里通义开源Qwen-Image-2512图像生成模型,突破真实感与文字渲染技术瓶颈 阿里巴巴通义实验室开源新一代图像生成模型Qwen-Image-2512,在人物真实感、自然纹理细节和复杂文字渲染三大核心领域实现突破性进展。模型采用多尺度特征融合与3D感知架构,解决传统AI图像'塑料... AI产品动态# AIGC技术# AI图像生成# Qwen-Image-2512 4周前
中国开放权重AI模型实现技术超越与全球市场渗透,推动全球AI竞争格局重构 斯坦福大学报告显示中国开放权重AI模型实现技术突破:通义千问等模型在推理与代码生成基准测试中超越GPT-oss,全球使用占比八个月内从1.2%增长至30%,成本控制与生态开放性正推动全球AI竞争格局结... AI新闻资讯# AI生态# DeepSeek# 中国AI 1个月前
优刻得UModelVerse率先部署GLM-4.7开源模型,企业级AI服务再升级 优刻得UModelVerse平台正式部署智谱新一代开源大模型GLM-4.7,提供企业级AI服务。该模型在Code Arena编码评估中位列开源模型第一,支持代码生成、长文本处理等场景,助力企业降低大模... AI产品动态# AI大模型# GLM-4.7# UModelVerse 1个月前
阿里通义开源Fun-Audio-Chat 8B端到端语音模型,实现情绪感知与低延迟交互 阿里巴巴通义团队开源Fun-Audio-Chat 8B端到端语音交互模型,采用序列到序列设计,实现情绪感知与自动化任务执行,在OpenAudioBench等评测中领先,GPU开销降低50%,适用于智能... AI产品动态# AI技术# 人工智能# 开源模型 1个月前
智谱华章发布并开源新一代旗舰大模型GLM-4.7,编程与推理能力全球领先 智谱华章正式发布并开源新一代旗舰大语言模型GLM-4.7,在Code Arena、LiveCodeBench等国际基准测试中斩获开源与国产模型双料第一,编程与推理能力实现重大突破,性能超越GPT-5... AI产品动态# AI模型# GLM-4.7# 人工智能 1个月前
谷歌开源T5Gemma 2模型系列:多模态与长上下文处理的编码器-解码器新突破 谷歌开源T5Gemma 2模型系列,支持视觉-语言多模态输入与128K tokens长上下文处理,基于Gemma 3架构开发。涵盖270M、1B、4B参数版本,在数学推理、医疗文本生成等任务中性能显著... AI产品动态# Gemma3# T5Gemma2# 医疗AI 1个月前
美团开源SOTA虚拟人视频生成模型LongCat-Video-Avatar,实现动作拟真与情感表达突破 美团最新开源虚拟人视频生成模型LongCat-Video-Avatar实现三大技术突破:支持文本/图片/视频多模式生成、5分钟长视频稳定生成、情感化动作表达。本文详解其解耦无条件引导、跨片段隐空间拼接... AI产品动态# AI# LongCat# SOTA技术 2个月前
阶跃星辰发布Step-GUI系列AI Agent,开启图形界面智能体规模化应用时代 阶跃星辰发布Step-GUI系列AI Agent,实现图形界面智能体规模化应用。技术包含云端模型、端侧开源模型及MCP协议,支持200+应用,10分钟手机部署,已与荣耀、OPPO等厂商合作,推动终端设... AI产品动态# AIAgent# MCP协议# Step-GUI 2个月前
通义大模型开源语音AI双升级:Fun-CosyVoice3实现3秒音色克隆,Fun-ASR嘈杂环境识别率达93% 通义大模型团队开源语音AI双模型Fun-CosyVoice3与Fun-ASR完成重大升级。Fun-CosyVoice3实现首包延迟降低50%、中英混说错误率下降56.4%,支持多语言方言与情感控制,其... AI产品动态# AI工具# Fun-ASR# Fun-CosyVoice3 2个月前