ChatGPT语音交互重大升级!语音模式全面整合至主界面,多模态体验再进化

OpenAI于11月25日宣布对ChatGPT语音交互功能进行重大升级,将原本独立的“语音模式”(Voice Mode)全面整合至主聊天界面。这一更新标志着多模态交互体验的进一步优化,用户无需切换界面即可同步进行语音对话、接收视觉信息及查阅文字转录内容。

此前,语音功能作为独立模块存在,用户需手动切换至专属界面,且仅支持单向语音交互。新版设计实现了语音与文本、视觉元素的深度融合:当用户通过语音提问时,系统会以自然语音回应,同时在聊天窗口实时显示地图、图表或图片等关联内容,并自动生成对话的文字记录。例如查询旅游路线时,用户可同步听取导航指引、查看路线地图,并通过转录文本回溯信息。

为兼顾不同使用习惯,OpenAI在设置菜单中保留了“独立语音模式”切换选项。偏好纯音频交互的用户可一键恢复旧版界面,体现了产品设计的灵活性。该更新已面向移动端、桌面端及网页版用户全面推送。

此次功能整合是OpenAI多模态战略的重要一步。今年以来,该公司已陆续推出AI购物助手、群聊功能及GPT-5.1模型升级,持续拓展人工智能的应用边界。技术分析指出,语音与视觉信息的无缝协同将显著提升人机交互效率,尤其在教育、导航等场景中具有广泛的应用潜力。

© 版权声明

相关文章