微软Edge测试版推出AI视频实时翻译功能,支持多语言但硬件要求高

AI产品动态12小时前发布 AI视野

微软近日在Windows 11系统的Edge浏览器Beta测试版(141.0.3537.13版本)中推出了一项突破性的AI视频实时音频翻译功能。该技术通过本地AI模型实现,可将正在播放的视频音频即时翻译为西班牙语、韩语或英语,目前主要适配YouTube等视频平台。用户启用功能后,浏览器将自动下载AI模型、静音原声并生成翻译音轨,实测显示翻译延迟控制在可接受范围内。

不过,该功能对硬件配置提出较高门槛:需至少12GB可用内存及四核CPU支持。测试表明,即使在16GB内存设备上运行,Edge会持续占用约12GB内存,导致系统资源紧张。这意味低配设备用户可能无法流畅使用该功能,且多任务处理时可能受影响。值得注意的是,当前版本仅支持三种语言的互译组合,且处于预览阶段,部分Beta用户可能暂未开放体验。

技术验证中发现,AI模型对音调变化较为敏感,偶现将单一说话者的音频误判为男女不同音轨的情况。微软尚未公布该功能的正式上线时间,但透露未来计划扩展至印地语、俄语等更多语种。行业分析认为,此举标志着浏览器正从工具向智能服务平台转型,但高硬件需求可能成为普及障碍。

© 版权声明

相关文章