谷歌Gemini AI耳机实时翻译功能上线,支持70+语言跨语言交流

谷歌近日推出了一项突破性的实时耳机翻译测试功能,将Gemini人工智能模型深度整合至翻译服务中,标志着跨语言交互技术迈入新阶段。这项创新允许用户通过任意品牌耳机实现单向实时语音转译,目前已在安卓平台的美国、墨西哥和印度市场率先上线,支持超过70种语言的互译。

技术团队通过深度学习模型实现了语音特征的精准还原,系统不仅能即时转换语言内容,还能完整保留说话者的语气、重音和语调特征。在实际应用中,该功能可清晰区分不同发言者的声音特征,测试数据显示其在嘈杂环境下的识别准确率较前代提升37%。谷歌搜索垂直领域产品管理副总裁Rose Yao表示,这项技术将彻底改变国际会议、海外教育及多媒体消费等跨语言场景的体验。

同步升级的Gemini文本翻译模块通过上下文语义分析,显著提升了对文化特定表达的处理能力。以英语习语”stealing my thunder”为例,系统不再进行字面直译,而是根据语境生成符合目标语言习惯的”抢风头”等等效表达。该功能目前支持英语与20种主要语言的互译,包括中文、日语、西班牙语等,覆盖安卓、iOS及网页全平台。

语言学习工具方面,谷歌正在德国、印度等近20个新市场推广双向学习模块,并新增连续学习追踪功能。系统可记录用户学习天数并生成进度报告,同时提供发音、语调等维度的具体改进建议。公司计划在2026年完成iOS平台适配,并将服务扩展至更多国家和地区。

此次技术升级将普通耳机转化为实时翻译设备的创新思路,为全球化沟通提供了更便捷的解决方案。随着测试范围的扩大和功能的持续优化,这项服务有望成为跨语言交流的基础设施级应用。

© 版权声明

相关文章