ITBEAR科技资讯
网站首页 科技资讯 财经资讯 分享好友

京东开源全球首个全栈实时视频视觉语言交互模型JoyAI-VL-Interaction 赋能多场景AI助手

时间:2026-06-23 06:45:12来源:快讯编辑:快讯

京东近日正式开源了全球首个全栈开源的实时视频视觉语言交互模型——JoyAI-VL-Interaction,并获得vLLM-Omni的day-0原生支持。这一创新模型标志着大模型交互方式从传统的“一问一答”模式向“边看边说”的动态交互迈出了重要一步,为开发者构建具备持续观察、自主判断和即时响应能力的实景AI助手提供了全新框架。

与传统模型依赖用户发起问题后才开始处理画面的被动模式不同,JoyAI-VL-Interaction具备主动判断能力。它能够持续观察视频流,自主分析场景变化,无需等待指令即可决定何时需要输出信息或保持沉默。这种特性在安防监控、老人看护等需要实时响应的场景中具有显著优势,避免了因延迟导致的风险或体验下降。

在实时性方面,该模型突破了传统视频理解需上传完整文件后再分析的限制。针对安防预警、实时翻译、直播解说等对时间敏感的场景,JoyAI-VL-Interaction可对正在发生的视频流进行即时处理,画面变化时立即响应,确保信息传递的时效性。例如,在直播带货场景中,模型能实时识别商品特征并生成解说内容,提升互动效率。

模型还引入了“适时智能体委托”机制,通过前后台协同优化任务处理效率。当遇到生成代码、复杂推理等需要高算力支持的任务时,前台模型可将任务委派给后台大模型或Agent,自身继续保持对现场的观察。任务完成后,结果无缝融入对话流程,实现观察与交互的并行处理。这种设计既保证了响应速度,又提升了复杂任务的处理能力。

在技术适配性上,JoyAI-VL-Interaction支持摄像头、直播流、监控流等多种视频输入方式,并兼容语音输入输出、可视化界面、长期记忆等功能。开发者可根据需求灵活替换ASR语音识别、TTS语音合成、后台模型等组件,甚至接入自定义业务系统或前端界面。这种模块化设计降低了技术整合门槛,加速了应用落地速度。

目前,该模型已在监控预警、实时计数、直播导览等58个真实流式场景中完成评测。对比豆包视频通话助手,JoyAI-VL-Interaction总体胜率达77.6%;与Gemini视频通话助手的对比中,胜率提升至87.9%。这些数据验证了模型在视觉触发响应和实时性方面的优势,为其在安防监控、电商导购、操作指导、AI眼镜、无障碍辅助等领域的商业化应用奠定了基础。

更多热门内容
阿里再推新作!HappyHorse1.1视频生成模型五大能力显著提升
与此前发布的1.0版本比较,该版本在动态表现力、主体一致性、指令遵循、视觉质感和音频能力等维度系统性升级。与此前发布的1.0版本比较,该版本在动态表现力、主体一致性、指令遵循、视觉质感和音频能力等维度系统性升…

2026-06-23

马云携阿里核心管理层插秧团建,以团结之姿稳市场信心与人心
据新浪科技6月22日下午消息,阿里巴巴合伙人、高德董事长刘振飞在内网发帖《手里有秧,才能确保未来有粮》,记录了阿里管理层的插秧团建。 活动照片显示,马云、吴泳铭、邵晓锋、蒋凡、吴泽明、蒋芳等人悉数到场;蚂蚁集…

2026-06-23

石家庄阿里巴巴国际站:冀南企业跨境出海优选,官方授权服务助力品牌腾飞
该中心的服务内容包含阿里巴巴国际站开店入驻、选品分析及运营指导、谷歌独立站与海外社媒营销推广、小满CRM客户管理及AI智能获客系统、accio work企业级外贸智能体算力销售,同时可提供AI外贸全链路数字…

2026-06-23

马云携阿里蚂蚁高管下田插秧,刘振飞借田间劳作传递企业发展之道
红星资本局6月22日消息 今天,阿里巴巴合伙人、高德董事长刘振飞在阿里内网发文《手里有秧,才能确保未来有粮》,文章记录了近日阿里管理层在杭州一次下田插秧的团建活动。阿里巴巴首席科学家周靖人,也出现在插秧现场。…

2026-06-23

雷军刘震云对谈AI:可辅助创作但难取代人类,创新仍是核心价值
紧接着他也点明了AI的底层局限,AI所有产出依赖的大数据本质上全是沉淀下来的过往知识,不管对创作者还是企业家来说,最核心的能力永远是创新,而创新恰恰是要在过去的基础上,造出原本完全不存在的全新事物,这部分能…

2026-06-23

雷军谈“过早”争议与流量现象 忆赌局直言后悔曾与董明珠开玩笑
雷军直言:“在今天这个流量的时代,可能夸你有流量,骂你也有流量,嘲讽你更有流量,这可能是当下时代,我们都要承受的代价。” “2013年我参加央视一个活动,我跟格力的董明珠董大姐打了个赌,本来就打个赌,本来开…

2026-06-23

马云携阿里高管下田插秧,以农耕之态诠释AI战略的深耕与坚守
看到这里,可能有不少网友已经在问:阿里这是吃饱了撑的?阿里目前在AI领域的布局已经覆盖了从自研芯片、云计算基础设施、通义千问开源大模型,到电商、办公、出行等具体场景落地的完整全栈链条。 所以,这次的插秧团…

2026-06-23

马云领衔阿里高层下田插秧,蒋凡周靖人等现身,团建激发团队新活力
红星资本局6月22日消息,今天,阿里巴巴合伙人、高德董事长刘振飞在阿里内网发文《手里有秧,才能确保未来有粮》,文章记录了近日阿里管理层在杭州一次下田插秧的团建活动。 活动照片显示,此次插秧团建的“同事们”阵容…

2026-06-23

马云等阿里高层下田插秧,阿里管理层团建传递团结乐观信号
每日经济新闻记者获悉,今天(6月22日),阿里巴巴合伙人、高德董事长刘振飞在阿里内网发文《手里有秧,才能确保未来有粮》,文章记录了近日阿里管理层在杭州一次下田插秧的团建活动。阿里巴巴首席科学家周靖人,也出现…

2026-06-23