Cartesia发布Sonic-3实时对话TTS模型:90毫秒延迟支持42种语言,基于SSM架构实现技术突破 Cartesia推出基于SSM架构的Sonic-3实时对话TTS模型,延迟仅90毫秒,支持42种语言,提供声音克隆和情感调节功能,为视频会议、即时通讯等场景带来革命性AI语音体验。 AI产品动态# AI语音合成# Cartesia# Sonic-3 4天前
国内首款鸿蒙人形机器人“夸父”亮相,打破国外操作系统垄断 国内首款搭载开源鸿蒙系统的人形机器人“夸父”在武汉亮相,具备8毫秒级时延控制和0.1mm触觉反馈精度,实现多模态智能交互,打破国外在机器人操作系统领域的垄断,鸿蒙生态设备总量已突破11.9亿台。 AI产品动态# AI技术# 人形机器人# 开源鸿蒙 4天前
IBM发布Granite 4.0 Nano系列:3.5亿至15亿参数小型AI模型,支持消费级硬件部署 IBM最新发布Granite 4.0 Nano系列小型生成式AI模型组,包含3.5亿至15亿参数版本,支持消费级笔记本CPU和浏览器端部署,在指令跟随评估和函数调用测试中表现优异,采用Apache 2... AI产品动态# AI模型# Granite4.0# IBM 4天前
谷歌DeepMind联合推出AI营销工具Pomelli,中小企业内容创作进入分钟级时代 谷歌与DeepMind联合推出AI营销自动化工具Pomelli,具备智能解析网站、自动提取品牌元素、实时调整内容风格等功能,专为中小企业提供高效低成本的定制化营销内容生成方案,现已开放免费试用。 AI产品动态# AI营销# Pomelli# 中小企业数字化 4天前
苹果发布Pico-Banana-400K数据集:40万张AI编辑图像推动多模态学习突破 苹果公司发布突破性Pico-Banana-400K数据集,包含40万张高质量文本指令编辑图像,采用谷歌Gemini-2.5模型构建,涵盖八大编辑类型,解决图像编辑数据瓶颈,被誉为图像编辑领域的Imag... AI产品动态# AI图像编辑# Gemini模型# Pico-Banana-400K 4天前
Adobe Firefly Image 5震撼发布:400万像素原生生成+图层编辑,AI图像创作迎来新纪元 Adobe在MAX 2025发布Firefly Image 5,实现400万像素原生图像生成,突破性引入AI图层编辑功能,支持个性化模型训练,全面提升AI创作效率和质量,助力数字创意产业发展。 AI产品动态# Adobe# AdobeMAX2025# AI图像生成 4天前
中国智谱AI GLM架构首次深度嵌入美国主流开发工具链,Windsurf平台采用GLM-4.6模型 美国AI编程平台Windsurf采用中国智谱AI的GLM-4.6模型,这是中国大模型技术首次深度嵌入美国主流AI开发工具链。GLM-4.6专为代码生成速度和智能体能力优化,在代码补全等场景延迟表现优于... AI产品动态# AI开发工具链# AI编程平台# GLM-4.6模型 4天前
iOS 26.1 RC版发布:液态玻璃特效可调节,锁屏误触相机问题终解决 苹果iOS 26.1 RC版新增液态玻璃特效透明度调节功能,支持关闭锁屏相机误触开关,扩展8种语言支持。国行版Apple Intelligence功能因监管审批暂未上线,预计年底前通过iOS 26.2... AI产品动态# AppleIntelligence# iOS26.1# RC版 4天前
全球首款家务人形机器人NEO开启预售 – OpenAI投资的1X Technologies推出2万美元家用助手 全球首款面向消费市场的家务人形机器人NEO于2025年10月29日正式开启预售,由OpenAI投资的挪威企业1X Technologies研发推出。该产品定价2万美元(约合人民币14.2万元),同时提... AI产品动态 4天前
腾讯混元推出国内首个交互式AI播客,开启智能化互动新纪元 2025年8月,腾讯混元推出国内首个交互式AI播客,突破传统单向传播模式,支持用户实时语音文字提问。基于大模型四项核心技术,具备跨模态生成能力,提供多风格多音色定制,开启播客智能化互动新阶段。 AI产品动态# AI播客# 交互式播客# 人工智能 4天前