国内首个基于纯国产算力预训练的移动端视觉基座大模型“橘洲”迎来重要升级。10月11日,该模型在长沙正式发布V1.5端侧版本,实现了从IOS到安卓生态的全面覆盖,性能较5个月前发布的1.0版本显著提升。
“橘洲”大模型由湖南汇视威智能科技有限公司自主研发。今年5月21日,其V1端侧版首次亮相,便以“离线可用、秒级生成”的特性引发关注。该模型能够在无网络环境下,为IOS系统手机提供1024×1024分辨率图像的快速生成服务,兼具低成本、高质量、轻量化等优势。
据汇视威创始人顾善植介绍,接入国家超算互联网后,模型在技术层面取得多项突破:通过国产显卡完成训练,摆脱了对第三方云端服务器的依赖;采用超轻量化架构设计,支持手机等端侧设备自主运行;优化生成技术,使其更适配移动端场景。这些创新使得大模型能够直接植入手机,实现无需联网即可使用的功能。
近五个月来,研发团队对模型的核心组件进行重构,包括去噪网络和解码器的优化。通过迭代步数调整,训练速度提升至原有水平的5倍,推理步数从28步压缩至4步,同时显著提高了生成图片的质量。团队成功打通安卓生态,完成对高通芯片的适配,目前已在小米、荣耀等品牌手机上实现稳定运行。
发布会现场,工作人员在飞行模式下分别使用IOS和安卓设备进行测试。输入“深海机器人”“孤帆远影碧空尽”等指令后,模型均在4秒内生成了与文字描述高度匹配的高质量图片,验证了其跨平台兼容性和实际性能。
技术团队透露,在参数量缩减至1/50、训练速度提升5倍、生成速度提升7倍的基础上,“橘洲”经过行业数据训练后可快速转化为垂类大模型,为各行业提供定制化解决方案。