AI产品动态

Meta推出AI音频翻译功能：Facebook与Instagram Reels支持实时多语言翻译

Meta推出基于AI的Reels短视频音频翻译功能，实现英语与西班牙语实时互译与口型同步。了解如何通过AI技术降低多语言视频制作门槛并提升全球传播效果。

9个月前

微软开源VibeVoice-1.5B音频模型，突破90分钟长语音合成技术壁垒

微软开源VibeVoice-1.5B音频模型，突破90分钟连续语音合成技术，解决音色失真与语义连贯性问题。适用于有声书、在线教育及实时交互场景，降低制作成本，推动AI语音技术发展。

AI产品动态 # AI开源 # VibeVoice # 人工智能

9个月前

清华大学与IDEA联合研发GUAVA框架：单张照片0.1秒生成3D化身，实时渲染破局元宇宙基建

清华大学与IDEA研发的GUAVA框架实现单张照片0.1秒生成高保真3D化身，渲染速度50帧/秒，突破传统多视角限制。技术入选ICCV 2025，开源代码推动影视、游戏与虚拟会议应用，助力元宇宙基础设...

AI产品动态 # 3D化身生成 # GUAVA框架 # IDEA

9个月前

Figure AI突破性进展：人形机器人Figure 02实现完全自主叠毛巾，柔性操作技术领先行业

Figure AI人形机器人Figure 02通过Helix端到端VLA模型实现完全自主叠毛巾操作，22秒完成折叠，技术迁移无需参数调整，推动柔性物体精细操作与家庭服务机器人商业化进程。

AI产品动态 # AI突破 # FigureAI # Helix模型

9个月前

宇树科技发布“芭蕾舞者”人形机器人：31自由度突破运动与交互极限

深度解读宇树科技“芭蕾舞者”人形机器人的31关节自由度技术、仿生设计优势及其在医疗、家庭、工业场景的应用潜力，分析行业标准化与成本控制趋势。

AI产品动态 # 人工智能 # 人形机器人 # 仿生设计

9个月前

小米澎湃OS 3重磅升级：AI驱动、灵动岛交互、多端协同全面解析

小米澎湃OS 3将于9月正式发布，支持灵动岛交互、端侧AI大模型及多设备协同。基于Android 16底层优化，应用启动速度提升15%，覆盖小米16/Redmi K80 Pro等10款机型，重塑移动操...

AI产品动态 # AI操作系统 # Android16 # 小米16

9个月前

华为鸿蒙小艺助手12.2.6.402版本众测升级：交互重构与多模态AI全面增强

华为小艺智能助手12.2.6.402版本开启众测，新增桌面入口、智能体集成与多模态AI功能，优化语音交互与任务处理能力，适用于健康咨询、文案生成等场景，推动鸿蒙生态AI服务体验全面提升。

AI产品动态 # AI升级 # DeepSeek # HarmonyOS

9个月前

深度求索DeepSeek-V3.1入驻火山引擎，企业可免注册免费体验超低延迟AI大模型

深度求索DeepSeek-V3.1大模型正式入驻火山引擎，提供20-40毫秒超低延迟响应和500万TPM并发支持。企业用户免注册即可免费体验完整功能，通过可视化界面2分钟快速完成API配置，显著降低A...

AI产品动态 # AI大模型 # DeepSeek-V3.1 # 企业AI服务

9个月前

谷歌Pixel 10推出对话式AI图片编辑功能：用文字指令轻松修图

谷歌为Pixel 10系列推出革命性AI图片编辑功能'Edit with Ask Photos'，基于Gemini技术实现文字指令修图，支持修复、去背景、调色等操作，所有编辑均带C2PA透明标识。了解...

AI产品动态 # AI图片编辑 # C2PA # GeminiAI

9个月前

xAI开源Grok 2.5大模型：代码/数据全面开放，同步预告Grok 3突破性能力

xAI正式开源Grok 2.5大模型，提供500GB数据与42个模块，商业授权限年收入百万美元以下企业。详解Grok 3的百万级文本处理、电池故障预测能力，及移动端多模态功能升级，洞察AI开源战略与竞...

AI产品动态 # AI开源 # Grok # xAI

9个月前

Meta推出AI音频翻译功能：Facebook与Instagram Reels支持实时多语言翻译

微软开源VibeVoice-1.5B音频模型，突破90分钟长语音合成技术壁垒

清华大学与IDEA联合研发GUAVA框架：单张照片0.1秒生成3D化身，实时渲染破局元宇宙基建

Figure AI突破性进展：人形机器人Figure 02实现完全自主叠毛巾，柔性操作技术领先行业

宇树科技发布“芭蕾舞者”人形机器人：31自由度突破运动与交互极限

小米澎湃OS 3重磅升级：AI驱动、灵动岛交互、多端协同全面解析

华为鸿蒙小艺助手12.2.6.402版本众测升级：交互重构与多模态AI全面增强

深度求索DeepSeek-V3.1入驻火山引擎，企业可免注册免费体验超低延迟AI大模型

谷歌Pixel 10推出对话式AI图片编辑功能：用文字指令轻松修图

xAI开源Grok 2.5大模型：代码/数据全面开放，同步预告Grok 3突破性能力

热门AI工具

最新资讯