ChatGPT语音交互重大升级！语音模式全面整合至主界面，多模态体验再进化

AI产品动态6个月前发布 AI视野

OpenAI于11月25日宣布对ChatGPT的语音交互功能进行重大升级，将原本独立的“语音模式”（Voice Mode）全面整合至主聊天界面。这一更新标志着多模态交互体验的进一步优化，用户无需切换界面即可同步进行语音对话、接收视觉信息及查阅文字转录内容。

此前，语音功能作为独立模块存在，用户需手动切换至专属界面，且仅支持单向语音交互。新版设计实现了语音与文本、视觉元素的深度融合：当用户通过语音提问时，系统会以自然语音回应，同时在聊天窗口实时显示地图、图表或图片等关联内容，并自动生成对话的文字记录。例如查询旅游路线时，用户可同步听取导航指引、查看路线地图，并通过转录文本回溯信息。

为兼顾不同使用习惯，OpenAI在设置菜单中保留了“独立语音模式”切换选项。偏好纯音频交互的用户可一键恢复旧版界面，体现了产品设计的灵活性。该更新已面向移动端、桌面端及网页版用户全面推送。

此次功能整合是OpenAI多模态战略的重要一步。今年以来，该公司已陆续推出AI购物助手、群聊功能及GPT-5.1模型升级，持续拓展人工智能的应用边界。技术分析指出，语音与视觉信息的无缝协同将显著提升人机交互效率，尤其在教育、导航等场景中具有广泛的应用潜力。

文章版权归作者所有，未经允许请勿转载。

ChatGPT语音交互重大升级！语音模式全面整合至主界面，多模态体验再进化

哈佛大学开发AI模型popEVE：精准识别蛋白质致病突变，遗传疾病诊断迎来突破

阿里通义千问视觉模型登顶全球空间推理榜，超越GPT-5.1和Gemini 3

相关文章

Skywork AI推出Nano Banana Pro：AI海报设计新革命，免费体验专业级视觉创作

DeepGEM癌症病理基因大模型正式落地，AI实现”读片知基因”技术突破

Meta发布新款Ray-Ban Display智能眼镜，2027年将推全息AR版本

IBM与Groq达成战略合作，通过Watson x Orchestrate提供高速AI推理服务

最新资讯

热门AI工具

热门资讯