ITBEAR科技资讯
网站首页 科技资讯 财经资讯 分享好友

国产万卡万参大模型训练完成,TeleChat2-115B开源引领AI新潮!

时间:2024-09-28 19:57:22来源:ITBEAR编辑:瑞雪

【ITBEAR】9月28日消息,中国电信人工智能研究院近日取得了重大突破,成功完成了国内首个完全基于国产化万卡集群训练的万亿参数大模型,并将千亿参数的星辰语义大模型TeleChat2-115B对外开源。

这一里程碑式的成果显示,国产大模型训练已全面实现国产化替代,迈入了自主创新、安全可控的新阶段。TeleChat2-115B大模型依托于天翼云的“息壤一体化智算服务平台”及“星海AI平台”进行训练,不仅保证了训练精度,还通过多项优化技术显著提升了训练效率和稳定性。

在模型训练过程中,TeleAI团队创新性地采用了小模型Scaling策略,有效验证了不同模型结构的性能。同时,通过精细的数据配比和回归预测模型,实现了训练数据的优化配置。

后训练阶段,TeleAI合成了大量针对数学、代码和逻辑推理的问答数据,用于监督式微调。团队还采用迭代式更新和拒绝采样技术,进一步提升了模型生成的答案质量和数据代表性。

为便于业界同仁共同研究与进步,TeleChat2-115B大模型已在多个平台开源,包括GitHub、Gitee、ModelScope和Modelers,供全球开发者和研究者免费访问和使用。

更多热门内容
湖南株洲首发亮相:无人驾驶赛车“天猿”开启智能竞速新篇章!
“天猿”无人驾驶赛车在湖南株洲国际赛车场首发,赛道竞速测试取得3.77公里圈速3分15秒6的优异成绩,呈现良好的操控性和稳定性。“天猿”是高盛擎动(株洲)体育文化发展有限公司自主研发的竞赛级无人驾驶操作系统,…

2024-09-28

苹果春季新品曝光:智能家居设备亮相,支持人工智能功能!
据报道,苹果计划在2025年春季推出一款新的智能家居设备,该设备将结合iPad、Apple TV和HomePod的功能。这款新的智能家居设备代号为J490,并被称“HomeAccessory”,上市时可能会被…

2024-09-28

中国算力大爆发!246EFLOPS总规模,引领全球新潮流?
作为以算力为主题的大会,工业和信息化部信息通信发展司副司长赵策在论坛上介绍了我国算力运营和使用的最新情况,整理如下(截至 2024 年6 月底): 据此前报道,中国信息通信研究院数据显示,…

2024-09-28