ITBEAR科技资讯
网站首页 科技资讯 财经资讯 分享好友

GOTC 2023 圆满落幕,字节跳动详解多款开源项目

时间:2023-06-15 15:36:38来源:互联网编辑:茹茹

5 月 27 至 28 日,字节开源携多个开源项目及相关技术实践方案亮相 2023 全球开源技术峰会(Global Open-source Technology Conference,GOTC )。为期两天的峰会上,来自字节跳动的多位开源布道师、工程师向大家讲述了字节跳动开源的故事,以及相关的开源项目和实践经验。

字节跳动的开源之路,经历了从使用到参与,再到主动开源这三个阶段。

Apache 软件基金会董事、字节跳动首席开源布道师姜宁讲述了字节跳动的开源之路。他提到,字节跳动在开源的不同阶段关注的重点不一样。比如在使用开源时,会面临开源软件供应链风险,包括安全风险、运维风险、合规风险,这就需要有对开源软件有清晰的认知。因此字节跳动做了开源合规治理相关的工作,包括基础建设、合规治理、培训宣贯等。整体来说,为了在全阶段都更好地拥抱开源,字节跳动相应地开启了开源合规治理、开源文化培养和教育、开源可持续战略等方面的建设。

之后,字节跳动多位工程师带来具体开源项目与实践的相关分享,覆盖 Rust、云原生、数据库技术、AI 技术、安全实践等多个热点话题。

云原生理念下的技术实践与分享

火山引擎资深云原生工程师、CloudWeGo Reviewer 胡文带来了“基于 Kitex Proxyless 和 Istio 的云原生微服务实践”主题分享。

CloudWeGo-Kitex 是一个支持多协议的 RPC 框架,字节内部主要是 Thrift 协议,所以在 Thrift 协议深耕已久,做了大量优化,Kitex 开源希望能帮助其他企业快速构建微服务,但使用 Kitex-gRPC 采用 Istio - Sidecar 解决方案存在上面说的问题,同时也希望使用 Thrift 协议的用户能基于 Istio 实现服务治理,所以针对多协议,Kitex 支持了基于 Istio 的 Proxyless 模式。

Kitex 直接基于 xDS 协议对接 Istiod 控制面,无需再借助 sidecar 来实现与控制面交互,可以实现 Proxyless 模式的方式纳入到网格中统一管理。

胡文还分享了基于 Kitex Proxyless 落地全链路泳道的实践设计。流量染色环节,在网关层进行流量染色,根据原始请求中的元数据,来进行一定规则(条件、比例)转换成对应的染色标识;基准泳道中,未被染色的流量会被路由到基准泳道中;分支泳道中,被染色的流量会被路由到 reviews-v2 ->ratings-v2 的分支泳道中。

火山引擎资深云原生工程师刘晟丽带来了“字节跳动基于 Kubernetes 的大规模集群联邦技术实践”主题分享。

随着字节跳动内部各业务系统云原生化的演进,k8s 集群数量和规模极速增长,集群维护成本不断提高,同时数量众多,形态各异的集群也为用户选择集群部署带来认知负担。

字节跳动自 2015 年起发展云原生第一代基础架构,自 2021 年起已进入第三代架构设计与搭建中。具体到集群联邦技术方面,字节跳动 2019 年以 KubeFed 为基础引入集群联邦,但随着生产环境的不断变化,KubeFed 无法满足新的要求。

因此在 2021 年,字节跳动为满足多样化负载接入、精细化调度需求、以及更高的业务稳定性保障,提出的第二代联邦系统 KubeAdmiral。 KubeAdmiral 为用户提供统一的服务部署入口,方便任务负载在多集群之间流转,为打造统一资源池,提高资源利用率奠定基础。

数据库技术、分布式训练框架、安全建设实践

火山引擎分析型数据库负责人陈星详细以 ByConity 为例,讲述了分析型数据库技术创新与开放之路。

ByConity 的背景可以追溯到 2018 年,当时字节跳动开始在内部使用 ClickHouse,因为业务的发展,要服务于大量的用户,数据规模变得越来越巨大,ClickHouse 已不能满足需求。所以字节在 ClickHouse 架构基础上进行了升级,于 2020 年在内部启动了 ByConity 项目,并于 2023 年 1 月发布 Beta 版本,5月底正式对外开源。

作为一个分布式的云原生 SQL 数仓引擎,ByConity 擅长交互式查询和即席查询,具有支持多表关联复杂查询、集群扩容无感、离线批数据和实时数据流统一汇总等特点。其核心优势包括:高性能低成本、多种场景统一支持、生态友好。

字节跳动基础架构计算框架研发工程师徐合邦介绍了一款通用的分布式训练调度框架 Primus。

近些年来,机器学习科技已经深植各应用领域,并且成功带来显著的提升。面对与日俱增的训练资料和模型规模,为了满足更高效率的模型训练,分布式训练的概念顺应而生。

作为一个通用的分布式训练调度框架,Primus 提供一个通用的介面桥接了分布式训练任务和物理计算资源,让资料科学家可以专注与学习算法的设计,并且让分散式训练任务可以运行在不同种类的计算集群,例如 Kubernetes 和 YARN。于此基础上,Primus 更提供了分布式训练任务所需的容错能力以及资料调度能力,进而更提升了分布式训练的易用性。

Elkeid 项目负责人、字节跳动主机安全负责人陈越分享了字节跳动技术团队在生产环境下多工作负载安全建设实践。

企业生产环境工作负载随着传统的物理、虚拟机到后来的容器、容器集群的演变,其安全风险也随之变化。伴随着复杂度提升,对安全能力的要求也越来越高,如:反入侵,威胁溯源与止损,风险发现等。理想情况并不独立的解决某一个 Workload 的风险,而是将多种混合的 Workload 其视作一个整体来看。

Elkeid 解决方案通过统一代理、统一平台的方式解决上述风险问题了。主机安全,容器安全,RASP,阻断于响应能力,追溯能力通过插件的形式集成在一个Agent上,既可以通过宿主机部署保护宿主机与之上的容器;也可以云原生方式部署。并不是不同产品的拼接,而是原生的一套架构,带来的优势便是各方信息都可以自然的关联与组合;运维运营压力也会由此降低。

用 Rust 构建新一代工具

Rust 语言在性能、安全性、跨平台和社区支持等方面具有很高的优势,被越来越多的开发者视为一种非常有潜力的编程语言。本次峰会,字节跳动分享了两款基于 Rust 语言构建的新一代工具。

Rspack 是一个基于 Rust 的高性能构建引擎, 具备与 Webpack 生态系统的互操作性,可以从 Webpack 低成本的迁移,并提供更好的构建性能。在处理具有复杂构建配置的巨石应用时,Rspack 可以提供 5~10 倍的编译性能提升。

字节跳动前端工程师何相君详细介绍了 Rspack 的技术选型目标与实现策略,其目标是尽可能保证与 Webpack API 以及插件的兼容,尽可能的提高构建速度。实现策略则是按照 Webpack 原架构进行移植,改进原本的算法以尽可能的并行化。

Rspack 用 Rust 实现核心部分,充分利用并发和 LTO 优化。而之所以选择 Rust 语言,是因为 Rust 性能优秀,和 C、C++ 在一个等级;且 napi 支持良好,可以基于此更好地兼容 Webpack API,得益于 Rust 的宏支持,也可以少写样板代码;Rust 作为 WebAssembly 的新特性,基本上都能很快得到支持,甚至可以看到 WASM proposal 落地后推着 Rust proposal 前进的 issue;Rust 生态中 swc 提供丰富的 AST 操作 API,同时支持转译 Javascript 到 ES5。

实践证明,Rspack 可以解决许多问题,字节跳动前端工程师何庚坤介绍,Rspack 具备更快的速度,以及更灵活丰富的配置,不止覆盖 Web 开发场景,还能够应对各种场景;强大可自定义配置的拆包能力等决定了产物的性能……

何庚坤还分享了 Rspack 未来的计划,包括支持更多常用框架,如 Vue、Qwik 等;完善插件 API,兼容更多 Webpack 生态;支持 Module Federation 模块联邦;支持 Lazy Compilation 懒编译;支持 Persistent Cache 持久缓存;更多生产环境优化策略;持续优化构建性能。

此外,字节跳动还带来了 Rust RPC 框架背后相关技术的分享。

字节跳动服务框架研发工程师刘翼飞介绍了代码生成工具 Pilota 的设计背景、原理,以及面临的一些挑战。Pilota 通过 IDL 生成 Rust 代码,提供给 Volo 框架和用户使用。而 Volo 则是字节跳动服务框架团队研发的高性能、可扩展性强 的 Rust RPC 框架。

对于一个 Rust RPC 框架来说,根据 IDL 做代码生成是为了让用户更方便地使用框架。而生成代码的质量以及周边能力都会对用户的开发体验有着非常非常直接的影响。面对非常庞大的代码生成量,就需要有更好地处理方式。所以字节跳动开发了 Pilota 框架,来为用户生成良好的代码。Pilota 在面对庞大 IDL 做了体验优化,Thrift Parser 和 Protobuf Parser 只要转换成 Pilota 自有的 AST 格式,即可兼容任意形式的 IDL。

除了在 GOTC 2023 会议上与大家见面的开源项目,字节跳动还开源了多款产品。姜宁表示,字节跳动看重参与开源的长期价值,对开源一直是开放、鼓励的,希望与全球合作伙伴共同实现生态繁荣。

更多热门内容
2025上半年营收破百亿,九号公司靠智能两轮车杀出重围
九号公司2025半年报一出来,我注意到一个很有意思的点:公司上半年在研发上的投入达到5.22亿元,同比大涨49.5%。在行业竞争越来越激烈的情况下,能这么大幅加码研发,说明九号是真的在靠技术拉开差距。截至期末,九号公司全球专利总数已经达到5982项,产品也在不断创新

2025-08-03

联想集团AI赋能广东省超,科技助力“全民快乐足球”
8月3日,广东省足球超级联赛(下称广东省超)2025赛季启动发布会在广州举办,正式宣布联想集团成为“广东省超联赛官方AI技术合作伙伴”。业内分析认为,具有蓬勃活力与高涨参与热情的民间赛事与全球领先AI科技企业携手践行“足球,AI就玩了”的快乐足球理念,为这场覆盖广

2025-08-03

TCL携全场景电竞显示产品与智慧终端亮相2025ChinaJoy展会
8月1日,全球数字娱乐盛会ChinaJoy2025在上海新国际博览中心盛大开幕。TCL科技与TCL实业两大产业集团联合策展,由TCL华星携手三星、联想、华硕、AOC、飞利浦、iQOO、Acer、MSI、LG、雷鸟等品牌合作伙伴联合参展,全面展示TCL华星在电竞显示领域创新与TCL实业在智能终端

2025-08-02

一加高调亮相 2025 ChinaJoy,四大游戏体验区燃炸全场
8 月 1 日,2025 年中国国际数码互动娱乐展览会(ChinaJoy)盛大开幕。一加手机以“上车 MVP,当场换新机”为活动主题,携三大性能旗舰产品一加 13、一加 Ace 5 和一加 13T 强势亮相骁龙主题馆,并在展会现场设置四大游戏主题体验区,搭载骁龙 8 至尊版和一加独家自研芯片

2025-08-02

BLACKPINK出道九周年 网易云音乐成巡演快闪独家合作音乐平台
2025年8月2日,全球顶级艺人BLACKPINK官宣入驻网易云音乐,并通过独家中文笔记向平台乐迷分享了最新动态。YG娱乐联合CASTER STAR、网易云音乐在中国开展BLACKPINK WORLD TOUR POP-UP STORE(全球巡演中国快闪)活动。作为本次快闪的独家合作音乐平台,网易云音乐倾力打造

2025-08-02

创想三维亮相 ChinaJoy, 3D打印赋能动漫次元
8 月 1 日,2025 ChinaJoy 在上海新国际博览中心盛大开幕。全球消费级3D打印生态领创者创想三维携手京东打造3D打印展区,携全品类设备强势登陆,以 “科技赋能娱乐” 为核心,给观众带来一场融合 3D 打印、动漫与互动体验的创意盛宴。作为中国乃至全球数字娱乐产业的风

2025-08-02

2025按摩椅十大品牌排名最新榜单深度解析
面对市面上琳琅满目的按摩椅品牌,从国产到进口,价格从几千到上万,哪些品牌才是真正专业高品质,什么样的按摩椅才是真按得舒服?下面将基于市场认可度和用户口碑,解析2025年按摩椅品牌排行榜前十名,为消费者避开营销迷雾,助您做出明智选择。2025年十大按摩椅品牌:

2025-08-02

开源大模型史上最高分!阿里千问3性能全球第三
8月2日凌晨,国际权威大模型评测 Chatbot Arena更新了最新一期的大模型榜单,上周新鲜开源的阿里千问3新模型斩获1433分,超越顶尖闭源模型Grok4、Claude4,位列所有闭源及开源模型的全球总榜第三,是全球最强非推理(non-thinking)模型,并创下全球开源模型和国产模型的

2025-08-02

蚂蚁数科 Agentar 企业级智能体开发平台:五大支撑驱动金融新质生产力可信跃迁
蚂蚁数科的 Agentar 企业级全栈智能体平台,通过五大核心支撑构建起金融领域智能应用的可信底座,既突破了金融场景的专业性、复杂性壁垒,又确保了技术应用的合规性与可靠性,最终推动金融新质生产力实现跃迁。支撑一:企业级全栈智能体平台,夯实技术底座平台以 “1000

2025-08-02

蚂蚁 Agentar-Fin-R1:以大模型能力重构企业级智能体开发平台全栈范式
在智能化开发转型的深水区,全栈开发能力已成为智能体规模化落地的核心竞争力。蚂蚁集团推出的 Agentar-Fin-R1 金融大语言模型,通过与 Agentar 企业级智能体开发平台的深度耦合,实现了从数据治理、模型训练到应用落地的全流程赋能,重新定义了金融智能体开发的效率、

2025-08-02