ITBEAR科技资讯
网站首页 科技资讯 财经资讯 分享好友

昆仑万维发布Skywork UniPic2.0:多模态AI领域迎来新突破

时间:2025-08-13 10:00:06来源:ITBEAR编辑:快讯团队

昆仑万维集团在其SkyWork AI技术发布周活动步入尾声之际,震撼宣布了一项开源创新——「Skywork UniPic2.0」模型的问世。这一多模态人工智能领域的最新力作,预示着技术边界的又一次飞跃。

Skywork UniPic2.0,作为一款集理解、生成与编辑于一体的多模态模型,其核心竞争力在于高效训练和推理框架的构建。该模型巧妙融合了生成与编辑模块的轻量化设计,以及多模态理解模型的联合训练策略,旨在打造“高效、高质、统一”的智能化体验。

模型的核心架构由三大模块支撑:生图编辑、统一模型能力,以及生图编辑后的训练流程。基于SD3.5-Medium架构的Skywork UniPic2.0,实现了从文本输入向文本与图像双重输入的跨越,将单纯的生图能力拓展至兼具生成与编辑的双重功能。通过冻结生图编辑模块,结合多模态模型Qwen2.5-VL-7B与Pre-Train连接器,模型进一步整合了理解、生成与编辑的一体化能力。经由连接器与编辑模块的联合微调,最终成就了这一全面而强大的模型。

昆仑万维集团的此番开源,不仅向开发者与研究人员敞开了全面合作的大门,提供了包括模型权重、推理代码及强化策略在内的丰富资源。尤为Skywork UniPic2.0的生成模块基于2B参数的SD3.5-Medium架构训练,其在生图和编辑方面的性能指标,甚至超越了参数规模更大的同类模型。模型还融入了强化学习策略,借助Flow-GRPO首创的渐进式双任务强化策略,显著提升了模型对复杂指令的解析能力,以及图像生成与编辑的一致性。

对于有志于探索多模态人工智能领域的开发者与研究人员而言,Skywork UniPic2.0无疑是一座宝贵的资源宝库。项目主页、技术报告、GitHub地址以及HuggingFace平台上的相关资源,均已全面开放,诚邀各界人士共襄盛举。

项目详细信息,请访问:

项目主页:https://unipic-v2.github.io/

技术报告:https://github.com/SkyworkAI/UniPic/blob/main/UniPic-2/assets/pdf/UNIPIC2.pdf

GitHub地址:https://github.com/SkyworkAI/UniPic/tree/main/UniPic-2

HuggingFace Gradio体验:https://huggingface.co/spaces/Skywork/UniPic2-metaquery

HuggingFace模型资源:https://huggingface.co/Skywork/UniPic2-SD3.5M-Kontext-2B;https://huggingface.co/Skywork/UniPic2-metaquery-9B

更多热门内容