谷歌Gemini AI耳机实时翻译功能上线，支持70+语言跨语言交流

AI产品动态5个月前发布 AI视野

谷歌近日推出了一项突破性的实时耳机翻译测试功能，将Gemini人工智能模型深度整合至翻译服务中，标志着跨语言交互技术迈入新阶段。这项创新允许用户通过任意品牌耳机实现单向实时语音转译，目前已在安卓平台的美国、墨西哥和印度市场率先上线，支持超过70种语言的互译。

技术团队通过深度学习模型实现了语音特征的精准还原，系统不仅能即时转换语言内容，还能完整保留说话者的语气、重音和语调特征。在实际应用中，该功能可清晰区分不同发言者的声音特征，测试数据显示其在嘈杂环境下的识别准确率较前代提升37%。谷歌搜索垂直领域产品管理副总裁Rose Yao表示，这项技术将彻底改变国际会议、海外教育及多媒体消费等跨语言场景的体验。

同步升级的Gemini文本翻译模块通过上下文语义分析，显著提升了对文化特定表达的处理能力。以英语习语”stealing my thunder”为例，系统不再进行字面直译，而是根据语境生成符合目标语言习惯的”抢风头”等等效表达。该功能目前支持英语与20种主要语言的互译，包括中文、日语、西班牙语等，覆盖安卓、iOS及网页全平台。

语言学习工具方面，谷歌正在德国、印度等近20个新市场推广双向学习模块，并新增连续学习追踪功能。系统可记录用户学习天数并生成进度报告，同时提供发音、语调等维度的具体改进建议。公司计划在2026年完成iOS平台适配，并将服务扩展至更多国家和地区。

此次技术升级将普通耳机转化为实时翻译设备的创新思路，为全球化沟通提供了更便捷的解决方案。随着测试范围的扩大和功能的持续优化，这项服务有望成为跨语言交流的基础设施级应用。

文章版权归作者所有，未经允许请勿转载。

谷歌Gemini AI耳机实时翻译功能上线，支持70+语言跨语言交流

商汤Seko 2.0重磅升级：百集动画一键生成，单集成本低至15元

宇树科技全球首发人形机器人应用商店，打造机器人功能共享新生态

相关文章

英伟达发布Vera Rubin超级芯片，AI算力再突破，2026年量产

2025年中国AI投融资聚焦大模型与具身智能，资本加速技术高地集聚

OpenAI紧急提前发布GPT-5.2，直接回应谷歌Gemini 3市场挑战

阿里达摩院多癌早筛AI技术全球突破：覆盖9国服务2000万人次

最新资讯

热门AI工具

热门资讯