ITBEAR科技资讯
网站首页 科技资讯 财经资讯 分享好友

加速原生创新,智谱携手昇腾、昇思打造自主创新原生模型

时间:2024-08-21 15:44:16来源:ITBEAR编辑:茹茹

2024年8月19日,北京人工智能生态大会在中关村国家自主创新示范区会议中心颐和厅成功召开。智谱CEO张鹏作专题分享,简要介绍了昇腾对自主创新的智谱大模型的助力,以及正在打造的基于昇腾的第四代代码模型CodeGeeX4和多模态模型CogVLM2-video,华为昇腾计算业务副总裁刘鑫介绍昇腾原生进展。

智谱代码生成大模型CodeGeeX4的新版本基于昇腾AI与昇思AI框架训练,依托昇腾与昇思的多维混合分布式并行技术等软硬件能力等,将大幅提升模型开发、训练的效率及模型精度。

智谱CEO 张鹏

华为昇腾计算业务副总裁 刘鑫

模型能力

1.代码生成大模型CodeGeeX4

第四代代码模型CodeGeeX4堪称代码生成大模型的“六边形战士”,已经发布的CodeGeeX4-ALL-9B 仅用百亿级参数实现模型精度超越业界主流产品。在NaturalCodebench等测试基准上,相对于更大的模型实现了性能反超。

CodeGeeX4单一模型实现编程开发全流程覆盖,包括需求设计、前端开发、后端开发、数据处理等场景,支持代码补全和生成、代码问答、代码解释器、工具调用、联网搜索、项目级代码问答等全面能力。模型长序列达128K,支持中文、英文、俄语、法语、西班牙语等20+自然语言和300+编程语言。同时,在模型推理可实现单卡部署,最低24GB显存即可进行量化推理,用户可在本地私有化部署,保护企业代码安全。

2.多模态大模型CogVLM2-video(视频生成文本)

多模态大模型CogVLM2-video实现视频生成文本能力,支持2K序列长度、224×224分辨率的视频理解以及中英文回答等功能。测试实践显示,CogVLM2-video在多个视频问答任务上达到了state-of-the-art SOTA模型)的性能,并能够实现一分钟内的视频理解,在几个主流性能测试数据集(MVBench, VideoChatGPT-Bench and Zero-shot VideoQA datasets)中,CogVLM2-video也表现不俗,展现出全面竞争力,同时在多类主要指标上完成对其他模型的领先。

基于昇腾与昇思的新版本CodeGeeX4

CodeGeeX4在训练过程中,调用昇腾原生的融合算子,利用昇思MindSpore AI框架的提供的多维混合分布式并行能力,通过对流水交织并行、tensor模型并行的优化,解决内存瓶颈、降低计算空泡、提升通信效率,实现“计算、网络、存储”协同优化,对比同等规模参数的模型,训练效率20%提升,加速模型的迭代创新。

该模型也采用MindSpore 2.3版本原创的多级编译技术,开启O1编译选项增加自动算子融合优化,以接近动态图的启动时间获取了图模式下接近理论值的内存复用率,进而降低重计算比例,相对动态图获得15%的性能收益。

未来,智谱将与昇腾AI持续携手,打造更多领先的自主创新大模型,加速人工智能产业发展,助力中国千行百业的智能化转型,共同迈向智能新世界。

更多热门内容
星环科技!IDC中国数字政府一体化大数据平台领导者类别
近日,国际知名市场研究机构IDC发布的《IDC MarketScape:中国数字政府一体化大数据平台2024年厂商评估》报告中(DOC# CHC51571924,2024年7月),星环科技位居领导者类别,成为推动中国数字政府一体化大数据平台发展的中坚力量。星环科技持续关注数字政府行业发展,通过

2024-08-30

火山引擎数智平台:A/B测试个性化配置能力发布,拓展多场景策略最优解
对于这些场景,你一定不会感到陌生:打开手机时,一款购物应用推荐的正好是你心仪已久的商品;浏览网页时,新闻资讯自动排列,展示的都是你最感兴趣的话题;沉浸于在线娱乐时,所呈现的内容仿佛是为你量身定制……这一切与“用户个性化配置发布”能力息息相关。“用户个性

2024-08-28

星环科技!中国大数据平台连续4年蝉联专业厂商市场份额第一!
近日,全球领先的 IT 市场研究和咨询公司 IDC 发布《中国大数据平台市场份额,2023:数智融合时代的真正到来》(Doc# CHC51598124,2024年8月)报告,星环科技大数据平台私有化部署市场份额增速第一,并连续4年保持专业厂商市场份额第一。IDC中国研究总监卢言霞表示:“星

2024-08-28

外贸资讯宝GT6.0:大数据AI革新,展望外贸智能营销新时代
随着全球数字化转型的加速,外贸行业正在经历一场由人工智能技术引领的全面“洗牌”。 特易外贸资讯宝GT6.0的升级,正是AI技术为外贸企业赋能的力证。将AI技术深度融入外贸服务之中,为外贸企业带来了多维度的革新。本次升级不仅深度强化了AI技术的应用边界,更以全库印

2024-08-27

华为云盘古大模型,政务评估竟获卓越级最高分!
华为云盘古大模型在政务场景覆盖一网统管、一网通办、一网协同多种政务大模型领域,包括基层视频治理、城市应急事件处理、公文生成、公文审批等10+政务通用场景,覆盖行政服务、人社服务、财税服务、等10+政务专用场…

2024-08-22