Soul AI Lab开源播客语音合成模型SoulX-Podcast,支持多方言60分钟稳定对话 Soul AI Lab开源播客语音合成模型SoulX-Podcast,采用LLM+Flow Matching技术,支持中英文及四川话等方言,具备零样本音色克隆、跨方言音色转换能力,可稳定输出60分钟自... AI产品动态# AIGC# AI语音合成# SoulX-Podcast 5天前
英伟达发布Omniverse DSX Blueprint方案,打造吉瓦级AI数据中心标准化模板 英伟达发布革命性Omniverse DSX Blueprint设计方案,专为吉瓦级AI数据中心打造。该方案通过数字孪生技术实现全周期管理,提供DSX Boost和DSX Flex双轨配置,可实现30... AI产品动态# AI基础设施# AI数据中心# GPU架构 5天前
Cartesia发布Sonic-3实时对话TTS模型:90毫秒延迟支持42种语言,基于SSM架构实现技术突破 Cartesia推出基于SSM架构的Sonic-3实时对话TTS模型,延迟仅90毫秒,支持42种语言,提供声音克隆和情感调节功能,为视频会议、即时通讯等场景带来革命性AI语音体验。 AI产品动态# AI语音合成# Cartesia# Sonic-3 5天前
国内首款鸿蒙人形机器人“夸父”亮相,打破国外操作系统垄断 国内首款搭载开源鸿蒙系统的人形机器人“夸父”在武汉亮相,具备8毫秒级时延控制和0.1mm触觉反馈精度,实现多模态智能交互,打破国外在机器人操作系统领域的垄断,鸿蒙生态设备总量已突破11.9亿台。 AI产品动态# AI技术# 人形机器人# 开源鸿蒙 5天前
IBM发布Granite 4.0 Nano系列:3.5亿至15亿参数小型AI模型,支持消费级硬件部署 IBM最新发布Granite 4.0 Nano系列小型生成式AI模型组,包含3.5亿至15亿参数版本,支持消费级笔记本CPU和浏览器端部署,在指令跟随评估和函数调用测试中表现优异,采用Apache 2... AI产品动态# AI模型# Granite4.0# IBM 5天前
谷歌DeepMind联合推出AI营销工具Pomelli,中小企业内容创作进入分钟级时代 谷歌与DeepMind联合推出AI营销自动化工具Pomelli,具备智能解析网站、自动提取品牌元素、实时调整内容风格等功能,专为中小企业提供高效低成本的定制化营销内容生成方案,现已开放免费试用。 AI产品动态# AI营销# Pomelli# 中小企业数字化 5天前
苹果发布Pico-Banana-400K数据集:40万张AI编辑图像推动多模态学习突破 苹果公司发布突破性Pico-Banana-400K数据集,包含40万张高质量文本指令编辑图像,采用谷歌Gemini-2.5模型构建,涵盖八大编辑类型,解决图像编辑数据瓶颈,被誉为图像编辑领域的Imag... AI产品动态# AI图像编辑# Gemini模型# Pico-Banana-400K 5天前
Adobe Firefly Image 5震撼发布:400万像素原生生成+图层编辑,AI图像创作迎来新纪元 Adobe在MAX 2025发布Firefly Image 5,实现400万像素原生图像生成,突破性引入AI图层编辑功能,支持个性化模型训练,全面提升AI创作效率和质量,助力数字创意产业发展。 AI产品动态# Adobe# AdobeMAX2025# AI图像生成 5天前
中国智谱AI GLM架构首次深度嵌入美国主流开发工具链,Windsurf平台采用GLM-4.6模型 美国AI编程平台Windsurf采用中国智谱AI的GLM-4.6模型,这是中国大模型技术首次深度嵌入美国主流AI开发工具链。GLM-4.6专为代码生成速度和智能体能力优化,在代码补全等场景延迟表现优于... AI产品动态# AI开发工具链# AI编程平台# GLM-4.6模型 5天前
iOS 26.1 RC版发布:液态玻璃特效可调节,锁屏误触相机问题终解决 苹果iOS 26.1 RC版新增液态玻璃特效透明度调节功能,支持关闭锁屏相机误触开关,扩展8种语言支持。国行版Apple Intelligence功能因监管审批暂未上线,预计年底前通过iOS 26.2... AI产品动态# AppleIntelligence# iOS26.1# RC版 5天前