OpenAI发布GPT-5 Pro及GPT-realtime-mini：多模态交互战略升级，推动AI技术普惠化

AI产品动态8个月前发布 AI视野

在2025年10月6日举行的第三届OpenAI DevDay开发者大会上，OpenAI首席执行官萨姆·奥尔特曼宣布通过API正式发布GPT-5 Pro及轻量化语音模型 GPT-realtime-mini，标志着公司在多模态交互领域的战略升级。此次发布是OpenAI推动AI技术普惠化的重要举措，旨在为开发者提供更高效、灵活的模型集成方案。

GPT-5 Pro作为新一代核心模型，现已面向所有通过组织验证的Tier 1至Tier 5级别API用户开放。该模型在实时推理、复杂任务处理等方面表现显著提升，企业用户可通过数据控制设置选择共享反馈数据，以优化模型的领域适应性。同步推出的GPT-realtime-mini专注于语音交互场景，其轻量化架构便于开发者快速部署语音功能，奥尔特曼强调”语音将成为人机交互的核心方式之一”。

技术实现层面，OpenAI通过10月3日更新的Auto路由控制系统，使企业可自主配置GPT-5 Pro的推理请求分配策略。新模型还整合了经心理健康专家指导的对话干预机制，能更精准识别用户情绪状态并提供适当支持。开发者现可通过扩展API同时调用GPT-5 Pro、GPT-realtime-mini及视频生成模型Sora 2，构建跨模态应用。

此次发布是OpenAI平台化战略的关键一步。伴随Apps SDK和AgentKit等开发工具的推出，开发者能够像构建移动应用一样创建ChatGPT内嵌功能。首批集成案例显示，新模型可将设计类任务的响应速度提升40%，语音交互延迟控制在800毫秒以内。行业分析师认为，这种”模型即服务”的生态布局，正在重塑AI技术的商业化路径。

文章版权归作者所有，未经允许请勿转载。

OpenAI发布GPT-5 Pro及GPT-realtime-mini：多模态交互战略升级，推动AI技术普惠化

OpenAI发布Agent Builder工具：可视化构建AI智能体，开发门槛大幅降低

谷歌Opal AI无代码工具全球扩张：新增15个国家，可视化调试功能重磅升级

相关文章

阶跃星辰发布开源语音大模型Step-Audio 2 mini，多模态架构革新语音交互

宇树科技公布表演机器人专利，可挥动、旋转、抛动道具，表演性强

谷歌Gemini推出Veo 3图像转视频功能：AI视频生成技术迈入新阶段

马斯克宣布xAI的Grok 3.5将系统性重编人类知识体系，引发科技界热议

最新资讯

热门AI工具

热门资讯