ITBEAR科技资讯
网站首页 科技资讯 财经资讯 分享好友

OpenAI强化音频AI能力,无屏幕设备将至,欲重塑AI交互新形态

时间:2026-01-02 03:28:47来源:快讯编辑:快讯

据行业内部消息,OpenAI正加速布局音频人工智能领域,计划推出一款以语音交互为核心的消费级硬件设备。这款设备将突破传统屏幕依赖模式,通过自然语音指令实现操作,旨在重新定义人机交互方式。知情人士透露,OpenAI已整合工程、产品与研究团队,集中攻克现有音频模型在准确性与响应速度上的短板,为硬件落地铺路。

当前,ChatGPT的语音功能与文本回答采用不同模型架构。OpenAI研究人员发现,现有音频模型在复杂场景下的表现仍显不足,例如应对打断、多轮对话等自然交互需求。为此,公司正在开发新一代音频模型,计划于2026年第一季度正式发布。该模型已具备生成更自然语音、实时响应打断的能力,甚至能模拟人类对话中的情感起伏。

在硬件设计理念上,OpenAI与谷歌、亚马逊等科技巨头形成共识:现有设备形态难以满足未来AI交互需求。公司团队认为,语音是人类最本能的交流方式,无屏幕设计不仅能降低使用门槛,还可避免用户过度依赖视觉界面。曾主导苹果产品设计的乔尼·艾维参与合作项目时强调,新一代设备应承担纠正消费电子负面影响的责任,通过“隐形交互”减少用户注意力分散。

尽管愿景宏大,OpenAI仍需跨越用户习惯与市场认知的双重障碍。内部数据显示,当前ChatGPT语音功能使用率偏低,既与模型性能不足有关,也源于用户对语音交互的认知局限。为改变这一现状,公司正通过产品迭代与用户教育同步推进,例如在现有平台中逐步强化语音功能体验。

组织架构方面,OpenAI已组建跨部门专项团队推进音频战略。来自Character.AI的语音专家昆丹·库马尔负责技术方向把控,工程师本·纽豪斯主导底层架构重构,多模态产品经理杰基·香农则协调跨模态交互设计。这种配置显示出公司对音频领域的重视程度不亚于其核心大模型研发。

产品规划显示,OpenAI的硬件布局不止于单一设备。公司正开发包括智能眼镜、无屏幕音箱在内的多形态产品线,定位为“环境感知型助手”。这类设备将通过音频、视频多模态输入,主动理解用户所处场景,在获得授权后提供适时服务。例如在烹饪时语音指导步骤,或在通勤时播报实时路况。

为支撑这一战略,OpenAI在2025年初完成一笔重大收购——以近65亿美元(约合人民币455.06亿元)价格收购乔尼·艾维联合创立的io公司。这笔交易不仅获得顶尖工业设计资源,更整合了供应链管理能力。目前,公司正同步推进模型优化、硬件原型开发与生产链路搭建,三条工作线并行以加速产品落地。

更多热门内容
OpenAI加码音频AI研发 布局无屏设备或引领未来交互新潮流
OpenAI 团队希望用户通过“说话”而非“看屏幕”与设备互动,认为语音才是最贴近人类交流本能的方式。 与 OpenAI 合作推进硬件项目的乔尼・艾维也强调,无屏幕设计不仅更自然,还有助于避免用户沉迷。在推出…

2026-01-02

安信稳健聚申一年持有混合A:12月31日净值微跌,前十大重仓股曝光
来源:新浪基金∞工作室该基金成立以来收益51.05%,今年以来收益7.05%,近一月收益-0.66%,近一年收益7.05%,近三年收益22.38%。黄琬舒自2025年7月15日管理(或拟管理)该基金,任职期内…

2026-01-02

科大讯飞:以全栈自主可控之力,引领AIGC技术迈向产业新征程
近日,2025EDGE AWARDS年度AI创新榜正式揭晓,科大讯飞凭借在AIGC领域的关键突破与卓越落地成果,荣获"年度AIGC技术先驱"称号。在AI行业从"参数竞赛"转向"价值落地"的今天,科大讯飞始终将…

2026-01-02

2025年末回望:马斯克火星梦未圆,日本月球基地无果,中国航天步履坚实
在2025年12月31日即将结束之际,有网友再次翻出了马斯克和日本多年前放出的豪言壮语:一个在2016年说等到2025年将送人类上火星,一个说要在2025年到月球上建设基地。 然而,当2025年即将划上句号时…

2026-01-02

太空小鼠当妈啦!中国航天生命探索再获突破性进展
说到那“水中小白鼠”的斑马鱼,它可是两度登上太空啊,神舟十八号任务中科研人员搭建了由斑马鱼和金鱼藻组成的双重水生生态系统,能在失重环境里稳定工作了43天,不仅打破了国际同行的系统运行纪录,还成功实现了斑马鱼…

2026-01-02