OpenAI近日对ChatGPT网页应用的语音模式进行了重要功能升级,新增语速调节滑块和自定义指令前缀功能,进一步优化人机交互体验。根据最新测试版本显示,用户现可通过0.5倍至2.0倍的连续滑块自由调整语音播报速度,该设计能适配不同场景下的信息接收需求,如慢速适合语言学习场景,快速则便于高效获取信息。值得注意的是,该功能目前仍处于灰度测试阶段,尚未向全体用户开放。
在交互逻辑方面,新引入的自定义指令前缀功能实现了对话记忆的突破。系统可永久保存用户设定的基础指令模板,例如要求AI保持特定语气风格或措辞规范。典型应用场景中,当用户预设”维持专业严谨的表述方式”后,即使后续对话中提出”用轻松语气回答”的临时要求,系统仍会优先遵循初始指令框架。技术文档显示,该功能通过分离指令层与内容层的逻辑处理来实现这一特性。
此次更新同步完善了模型选择体系,付费用户可重新调用GPT-4模型,同时GPT-5模型新增高精度、快速和自动三种运行模式。据观察,语音模式升级与模型架构优化存在协同效应,高速模式下语音响应延迟已降低至800毫秒以内。行业分析师指出,这些改进标志着AI语音交互正从基础功能实现向精细化体验设计转型。
OpenAI产品负责人表示,语音功能将持续迭代,未来计划整合多语言实时翻译等扩展能力。目前团队正在收集测试用户关于语调自然度和指令识别精度的反馈,预计完整功能套件将于今年第四季度全面上线。随着智能语音助手渗透率持续攀升,此类个性化设置或将成为行业标准配置的重要参考。
© 版权声明
文章版权归作者所有,未经允许请勿转载。