ITBEAR科技资讯
网站首页 科技资讯 财经资讯 分享好友

掘力计划第21期 - 大模型的崛起:解析大语言模型的训练和应用

时间:2023-08-17 10:32:06来源:互联网编辑:茹茹

8月12日,掘力计划第21期在北京市海淀区方恒时尚中心举行。本次技术分享的主题是《大模型的崛起:解析大语言模型的训练和应用》,活动邀请了四位大模型领域的专家来为开发者作技术分享。

图片1.png

CodeGeeX:代码生成模型到编程助手的进化

图片2.png

首先,智谱AI的薛宇飞博士做了题为《CodeGeeX:从代码生成模型到AI编程助手》的技术分享。薛宇飞博士是智谱AI大模型事业部的副总裁,他拥有清华大学计算机系的博士学位和博士后经历,在人工智能领域有多年的研究和产品经验,曾任职于多家顶级科技公司。这次薛博士以自身团队在代码生成模型方面的研究为切入点,详细介绍了从训练一个大规模的通用代码生成模型,到落地产品化并开发 IDE 插件,最终使广大开发者能够享受到 AI 编程助手带来的便利。

薛博士分析了编程工作正在朝着更简单、更符合人的思维逻辑的方向发展的背景。他指出,AI 辅助的代码生成技术正在让自动编程成为可能。之后他详细介绍了 CodeGeeX 项目的模型训练过程,团队如何构建数据集,采用 GPT 结构训练出百亿参数的多语言模型,并在华为的支持下完成模型训练。训练完成后,对模型进行评测与优化,最终获得当时最优秀的开源多语言代码生成模型。在此基础上,团队开发出支持主流 IDE 的 CodeGeeX 插件,将模型应用于实际编程过程,为用户提供代码补全、注释生成等功能。插件已经累积十多万用户。最后,团队在今年推出了新版本模型 CodeGeeX2,效果显著提升,代表了代码生成模型发展的新方向。

Ray:构建 AI 系统的通用计算引擎

图片3.png

第二位分享嘉宾是蚂蚁集团 Ray 团队的宋顾杨,他的主题是《Ray: 大模型时代的AI计算基础设施》。宋顾杨讲师是 Ray 开源社区的核心贡献者之一,他首先概述了 Ray 框架的发展历程,从初期的强化学习框架逐步转型为面向 AI 的通用分布式计算框架。当前 Ray 通过任务调度、资源管理等功能,可以高效支持AI模型的训练与推理。许多知名企业如 OpenAI 都采用了 Ray。

宋顾杨讲师还重点介绍了 Ray 的一些核心设计,如跨语言的计算单元,自动故障恢复等。这使得 Ray 可以抽象出通用的分布式系统问题,减轻研发人员的工作量。Ray 已支持绝大多数AI框架,构建起完整的 AI pipeline。最后,宋顾杨讲师列举了一些 Ray 在大模型方面的应用案例,包括 GPT-4 在内的多种知名模型和公司,说明 Ray 正在成为大模型基础设施的重要选择。

轻量级 LLM Agent:大模型应用的新方向

图片4.png

第三位分享嘉宾是 CNCF WasmEdge 项目的 Michael Yuan 博士,他的主题是《轻量级运行时在构建 LLM Agent 中的作用》。Yuan 博士指出 LLM Agent 是连接 LLM 模型与外界的关键组件,目前主流的 Python Agent 在多方面存在局限。他建议可以使用轻量级运行时如 WebAssembly 来构建 LLM Agent。WebAssembly 使用系统级编程语言如 Rust 开发,可以生成更轻量和性能更好的程序。

Yuan 博士还分析了如何设计模块化、简单的 Agent 架构,避免过于复杂的功能。总体而言,轻量级 LLM Agent 可以降低应用 LLM 的门槛,使更多组织从中受益。Yuan 博士的观点为构建生产可用的 LLM 提供了新的思路。

有道子曰:专注教育场景的自研大模型

图片5.png

网易有道技术总监林辉进行了题为《有道子曰大模型及其在教育领域的应用》的分享,林辉讲师十余年来深耕算法研发,在智慧教育领域具有丰富的实践经验。他从大模型发展的历史切入,指出大模型的智能顶点决定了其发展的决定性因素。相较于10年前线性模型的有限效果,近年来卷积神经网络、Transformer 模型的出现使大模型智能能力指数级增长,应用范围也不断扩展。林辉讲师进一步解析了有道在大模型战略方向的考量,即追求实际教育场景驱动,以技术创新助力教育创新。

林辉讲师指出,与其他通用模型不同,有道子曰大模型专注于教育场景,以提高精准度。目前已在口语教练、作文与阅读教练等多个方向落地,为用户提供个性化的学习体验。具体来说,口语教练具有精准的发音和逼真的对话能力;作文教练可以评价语言表达、逻辑结构等多个维度,给出针对性建议。在部署上,有道智云提供开放的API接口,已累积服务上百万用户。

本次掘力计划第21期汇聚多位业内大模型专家,从模型训练、基础设施、应用落地等多个角度进行了技术分享,使与会开发者对大模型的发展现状及应用场景有了更为全面的了解。大模型正在快速发展变化,相信未来其应用范围还将不断扩大,为更多行业带来革命性的影响。掘力计划也将继续关注大模型等前沿技术,致力于推动技术交流。

关于掘力计划

掘力计划由稀土掘金技术社区发起,致力于打造一个高品质的技术分享和交流的系列品牌。聚集国内外顶尖的技术专家、开发者和实践者,通过线下沙龙、闭门会、公开课等多种形式分享最前沿的技术动态。(作者:史博羽)

更多热门内容
2025上半年营收破百亿,九号公司靠智能两轮车杀出重围
九号公司2025半年报一出来,我注意到一个很有意思的点:公司上半年在研发上的投入达到5.22亿元,同比大涨49.5%。在行业竞争越来越激烈的情况下,能这么大幅加码研发,说明九号是真的在靠技术拉开差距。截至期末,九号公司全球专利总数已经达到5982项,产品也在不断创新

2025-08-03

联想集团AI赋能广东省超,科技助力“全民快乐足球”
8月3日,广东省足球超级联赛(下称广东省超)2025赛季启动发布会在广州举办,正式宣布联想集团成为“广东省超联赛官方AI技术合作伙伴”。业内分析认为,具有蓬勃活力与高涨参与热情的民间赛事与全球领先AI科技企业携手践行“足球,AI就玩了”的快乐足球理念,为这场覆盖广

2025-08-03

TCL携全场景电竞显示产品与智慧终端亮相2025ChinaJoy展会
8月1日,全球数字娱乐盛会ChinaJoy2025在上海新国际博览中心盛大开幕。TCL科技与TCL实业两大产业集团联合策展,由TCL华星携手三星、联想、华硕、AOC、飞利浦、iQOO、Acer、MSI、LG、雷鸟等品牌合作伙伴联合参展,全面展示TCL华星在电竞显示领域创新与TCL实业在智能终端

2025-08-02

一加高调亮相 2025 ChinaJoy,四大游戏体验区燃炸全场
8 月 1 日,2025 年中国国际数码互动娱乐展览会(ChinaJoy)盛大开幕。一加手机以“上车 MVP,当场换新机”为活动主题,携三大性能旗舰产品一加 13、一加 Ace 5 和一加 13T 强势亮相骁龙主题馆,并在展会现场设置四大游戏主题体验区,搭载骁龙 8 至尊版和一加独家自研芯片

2025-08-02

BLACKPINK出道九周年 网易云音乐成巡演快闪独家合作音乐平台
2025年8月2日,全球顶级艺人BLACKPINK官宣入驻网易云音乐,并通过独家中文笔记向平台乐迷分享了最新动态。YG娱乐联合CASTER STAR、网易云音乐在中国开展BLACKPINK WORLD TOUR POP-UP STORE(全球巡演中国快闪)活动。作为本次快闪的独家合作音乐平台,网易云音乐倾力打造

2025-08-02

创想三维亮相 ChinaJoy, 3D打印赋能动漫次元
8 月 1 日,2025 ChinaJoy 在上海新国际博览中心盛大开幕。全球消费级3D打印生态领创者创想三维携手京东打造3D打印展区,携全品类设备强势登陆,以 “科技赋能娱乐” 为核心,给观众带来一场融合 3D 打印、动漫与互动体验的创意盛宴。作为中国乃至全球数字娱乐产业的风

2025-08-02

2025按摩椅十大品牌排名最新榜单深度解析
面对市面上琳琅满目的按摩椅品牌,从国产到进口,价格从几千到上万,哪些品牌才是真正专业高品质,什么样的按摩椅才是真按得舒服?下面将基于市场认可度和用户口碑,解析2025年按摩椅品牌排行榜前十名,为消费者避开营销迷雾,助您做出明智选择。2025年十大按摩椅品牌:

2025-08-02

开源大模型史上最高分!阿里千问3性能全球第三
8月2日凌晨,国际权威大模型评测 Chatbot Arena更新了最新一期的大模型榜单,上周新鲜开源的阿里千问3新模型斩获1433分,超越顶尖闭源模型Grok4、Claude4,位列所有闭源及开源模型的全球总榜第三,是全球最强非推理(non-thinking)模型,并创下全球开源模型和国产模型的

2025-08-02

蚂蚁数科 Agentar 企业级智能体开发平台:五大支撑驱动金融新质生产力可信跃迁
蚂蚁数科的 Agentar 企业级全栈智能体平台,通过五大核心支撑构建起金融领域智能应用的可信底座,既突破了金融场景的专业性、复杂性壁垒,又确保了技术应用的合规性与可靠性,最终推动金融新质生产力实现跃迁。支撑一:企业级全栈智能体平台,夯实技术底座平台以 “1000

2025-08-02

蚂蚁 Agentar-Fin-R1:以大模型能力重构企业级智能体开发平台全栈范式
在智能化开发转型的深水区,全栈开发能力已成为智能体规模化落地的核心竞争力。蚂蚁集团推出的 Agentar-Fin-R1 金融大语言模型,通过与 Agentar 企业级智能体开发平台的深度耦合,实现了从数据治理、模型训练到应用落地的全流程赋能,重新定义了金融智能体开发的效率、

2025-08-02