ITBEAR科技资讯
网站首页 科技资讯 财经资讯 分享好友

苹果再出手,300亿参数AI大模型MM1.5来了!

时间:2024-10-13 13:50:36来源:ITBEAR编辑:瑞雪

【ITBEAR】苹果公司近期为其多模态大模型MM推出了1.5版本,新版本在延续前代MM1数据驱动训练原则的基础上,着重研究了混合不同类型数据对模型性能的影响。相关模型文档已在Hugging Face上发布,并附有论文链接。

MM1.5版本提供了10亿至300亿多种参数规模的选择,具备图像识别和自然语言推理能力。苹果的研发团队在新版本中改进了数据混合策略,显著增强了模型在多文本图像理解、视觉引用与定位以及多图像推理方面的表现。

根据参考论文,苹果在MM1.5的持续预训练阶段引入了高质量的OCR数据和合成图像描述,大幅提升了模型对富含文本内容的图像的理解能力。研究团队还在监督式微调阶段分析了不同数据类型对模型性能的影响,并优化了视觉指令微调数据的混合方式,使模型实现了更高的效率,即便是小规模的模型(10亿、30亿参数版本)也能展现出优秀的性能。

苹果公司此次还推出了MM1.5-Video模型,专门用于视频理解,以及MM1.5-UI模型,专注于移动设备用户界面的理解。MM1.5-UI模型未来有望成为iOS背后的“苹果牌”AI,它能够处理各种视觉引用与定位任务,总结屏幕上的功能,或者通过对话与用户进行交互。

更多热门内容
AI应用深化,游戏行业「不可能三角」将被打破?
规则明确、博弈性强的电子游戏,向来是AI试验与应用的“前沿阵地”。游戏公司是对AI投入最为积极的群体之一,近两年,国内主要游戏企业都在不断加码AI,多家游戏公司已经推出了自研大模型产品。AI也早已应用到游戏开…

2024-10-16

扎克伯格出手,联想AI Now要基于Meta Llama大模型构建?
美国西部时间10月15日消息,联想集团今日在美国西雅图召开年度Tech World大会。联想CEO杨元庆在主题演讲中,与Meta创始人兼CEO马克·扎克伯格一道宣布,联想与Meta合作基于Llama大模型推出…

2024-10-16