Meta推出AI音频翻译功能:Facebook与Instagram Reels支持实时多语言翻译 Meta推出基于AI的Reels短视频音频翻译功能,实现英语与西班牙语实时互译与口型同步。了解如何通过AI技术降低多语言视频制作门槛并提升全球传播效果。 AI产品动态# AI翻译# Facebook# Instagram 6个月前
微软开源VibeVoice-1.5B音频模型,突破90分钟长语音合成技术壁垒 微软开源VibeVoice-1.5B音频模型,突破90分钟连续语音合成技术,解决音色失真与语义连贯性问题。适用于有声书、在线教育及实时交互场景,降低制作成本,推动AI语音技术发展。 AI产品动态# AI开源# VibeVoice# 人工智能 6个月前
清华大学与IDEA联合研发GUAVA框架:单张照片0.1秒生成3D化身,实时渲染破局元宇宙基建 清华大学与IDEA研发的GUAVA框架实现单张照片0.1秒生成高保真3D化身,渲染速度50帧/秒,突破传统多视角限制。技术入选ICCV 2025,开源代码推动影视、游戏与虚拟会议应用,助力元宇宙基础设... AI产品动态# 3D化身生成# GUAVA框架# IDEA 6个月前
Figure AI突破性进展:人形机器人Figure 02实现完全自主叠毛巾,柔性操作技术领先行业 Figure AI人形机器人Figure 02通过Helix端到端VLA模型实现完全自主叠毛巾操作,22秒完成折叠,技术迁移无需参数调整,推动柔性物体精细操作与家庭服务机器人商业化进程。 AI产品动态# AI突破# FigureAI# Helix模型 6个月前
宇树科技发布“芭蕾舞者”人形机器人:31自由度突破运动与交互极限 深度解读宇树科技“芭蕾舞者”人形机器人的31关节自由度技术、仿生设计优势及其在医疗、家庭、工业场景的应用潜力,分析行业标准化与成本控制趋势。 AI产品动态# 人工智能# 人形机器人# 仿生设计 6个月前
小米澎湃OS 3重磅升级:AI驱动、灵动岛交互、多端协同全面解析 小米澎湃OS 3将于9月正式发布,支持灵动岛交互、端侧AI大模型及多设备协同。基于Android 16底层优化,应用启动速度提升15%,覆盖小米16/Redmi K80 Pro等10款机型,重塑移动操... AI产品动态# AI操作系统# Android16# 小米16 6个月前
华为鸿蒙小艺助手12.2.6.402版本众测升级:交互重构与多模态AI全面增强 华为小艺智能助手12.2.6.402版本开启众测,新增桌面入口、智能体集成与多模态AI功能,优化语音交互与任务处理能力,适用于健康咨询、文案生成等场景,推动鸿蒙生态AI服务体验全面提升。 AI产品动态# AI升级# DeepSeek# HarmonyOS 6个月前
深度求索DeepSeek-V3.1入驻火山引擎,企业可免注册免费体验超低延迟AI大模型 深度求索DeepSeek-V3.1大模型正式入驻火山引擎,提供20-40毫秒超低延迟响应和500万TPM并发支持。企业用户免注册即可免费体验完整功能,通过可视化界面2分钟快速完成API配置,显著降低A... AI产品动态# AI大模型# DeepSeek-V3.1# 企业AI服务 6个月前
谷歌Pixel 10推出对话式AI图片编辑功能:用文字指令轻松修图 谷歌为Pixel 10系列推出革命性AI图片编辑功能'Edit with Ask Photos',基于Gemini技术实现文字指令修图,支持修复、去背景、调色等操作,所有编辑均带C2PA透明标识。了解... AI产品动态# AI图片编辑# C2PA# GeminiAI 6个月前
xAI开源Grok 2.5大模型:代码/数据全面开放,同步预告Grok 3突破性能力 xAI正式开源Grok 2.5大模型,提供500GB数据与42个模块,商业授权限年收入百万美元以下企业。详解Grok 3的百万级文本处理、电池故障预测能力,及移动端多模态功能升级,洞察AI开源战略与竞... AI产品动态# AI开源# Grok# xAI 6个月前