OpenAI升级ChatGPT语音功能：新增语速调节与自定义指令前缀

AI产品动态4个月前发布 AI视野

OpenAI近日对ChatGPT网页应用的语音模式进行了重要功能升级，新增语速调节滑块和自定义指令前缀功能，进一步优化人机交互体验。根据最新测试版本显示，用户现可通过0.5倍至2.0倍的连续滑块自由调整语音播报速度，该设计能适配不同场景下的信息接收需求，如慢速适合语言学习场景，快速则便于高效获取信息。值得注意的是，该功能目前仍处于灰度测试阶段，尚未向全体用户开放。

在交互逻辑方面，新引入的自定义指令前缀功能实现了对话记忆的突破。系统可永久保存用户设定的基础指令模板，例如要求AI保持特定语气风格或措辞规范。典型应用场景中，当用户预设”维持专业严谨的表述方式”后，即使后续对话中提出”用轻松语气回答”的临时要求，系统仍会优先遵循初始指令框架。技术文档显示，该功能通过分离指令层与内容层的逻辑处理来实现这一特性。

此次更新同步完善了模型选择体系，付费用户可重新调用GPT-4模型，同时GPT-5模型新增高精度、快速和自动三种运行模式。据观察，语音模式升级与模型架构优化存在协同效应，高速模式下语音响应延迟已降低至800毫秒以内。行业分析师指出，这些改进标志着AI语音交互正从基础功能实现向精细化体验设计转型。

OpenAI产品负责人表示，语音功能将持续迭代，未来计划整合多语言实时翻译等扩展能力。目前团队正在收集测试用户关于语调自然度和指令识别精度的反馈，预计完整功能套件将于今年第四季度全面上线。随着智能语音助手渗透率持续攀升，此类个性化设置或将成为行业标准配置的重要参考。

文章版权归作者所有，未经允许请勿转载。

OpenAI升级ChatGPT语音功能：新增语速调节与自定义指令前缀

三星加速布局智能眼镜市场，2026年推出无显示屏AI眼镜

谷歌推出AI驱动的Flight Deals功能，革新旅行航班搜索体验

相关文章

OpenAI估值冲刺5000亿美元：GPT-5革新在即，股权出售锁定核心人才

中国星动L7人形机器人刷新跳高世界纪录，技术突破引领行业

百度发布新一代数字人技术NOVA，罗永浩数字人创5500万GMV纪录

百度发布自研视频生成模型MuseSteamer及平台“绘想”，AIGC领域再添重磅创新

最新资讯

热门AI工具

热门资讯