ITBEAR科技资讯
网站首页 科技资讯 财经资讯 分享好友

OpenAI发布GPT-5 Pro及轻量语音模型 加速多模态AI交互布局

时间:2025-10-07 09:00:08来源:互联网编辑:快讯

OpenAI近日在API服务中正式上线了新一代旗舰模型GPT-5 Pro,同时推出了一款专为实时语音交互设计的轻量化模型GPT-realtime-mini。这两项技术突破标志着该公司在多模态人工智能领域迈出了关键一步。

据OpenAI首席执行官奥尔特曼透露,GPT-5 Pro作为当前最先进的文本生成模型,将为企业和开发者提供更强大的自然语言处理能力。而同步发布的GPT-realtime-mini则以极低的延迟和资源消耗,实现了高质量的语音识别与合成功能,特别适用于需要实时响应的交互场景。

奥尔特曼特别强调了语音交互在未来人机沟通中的核心地位。他指出,随着技术发展,语音将成为用户与AI系统交互的主要方式之一。此次推出的轻量化语音模型,正是为了降低开发者集成语音功能的门槛,推动语音交互技术在更多场景中的普及应用。

业内分析认为,OpenAI此次双管齐下的产品策略,既保持了其在文本生成领域的领先优势,又通过专用语音模型完善了多模态交互能力。这种技术布局不仅满足了市场对高效AI工具的需求,也为构建更自然的人机交互体验奠定了基础。

更多热门内容
OpenAI发布AgentKit工具包,为开发者搭建与部署AI智能体提供强大助力
在 OpenAI 公司举办的开发者日活动上,首席执行官山姆・奥特曼于周一宣布推出 AgentKit——这是一套用于构建和部署人工智能智能体(AI Agents)的工具包。 奥特曼表示:“AgentKit …

2025-10-07

OpenAI开发者日:ChatGPT接入第三方应用 8亿用户市场开启新机遇
作为背景,OpenAI在周一的开发者日上宣布ChatGPT开始内置第三方应用程序,开发者即日开始可以使用新版Apps SDK来构建这些应用。周一发布的更新直接整合进ChatGPT的回复中,将为开发者带来应用…

2025-10-07

马斯克再出招!Grok上线视觉生成模块Imagine 构建全模态AI社交系统
这一更新也意味着X生态的又一关键拼图完成:Chat(对话):提供智能交互与问答;Imagine(想象):负责视觉与视频生成;Search(搜索):未来与GrokiPedia知识库整合;Live(实时):即将…

2025-10-07

OpenAI发布AgentKit工具包:简化流程,为开发者构建AI智能体添动力
在 OpenAI 公司举办的开发者日活动上,首席执行官山姆・奥特曼于周一宣布推出 AgentKit——这是一套用于构建和部署人工智能智能体(AI Agents)的工具包。 奥特曼表示:“AgentKit …

2025-10-07