ITBEAR科技资讯
网站首页 科技资讯 财经资讯 分享好友

广告出价进入“自动驾驶”时代,快手提出生成式强化学习出价技术

时间:2025-09-26 17:27:48来源:互联网编辑:茹茹

近日,快手首次提出生成式强化学习出价技术,并将其应用于大规模广告系统中。该项技术显著提升了广告竞价的智能化水平,实现了出价策略从传统“依赖单步状态决策”到新一代“序列决策”的关键跨越,在为广告主带来更高投放回报的同时,也提升了平台整体收益,真正实现了双赢。2025年至今,该技术已成功推动快手广告收入提升3%,成效显著。

广告出价:实时竞价中的“智能大脑”

在实时竞价(RTB)广告系统中,出价模块作为连接广告主与流量的核心枢纽,需要在多重约束条件下实现广告投放效果的最优化。

这一过程面临三大挑战。首先是既要控制支出,又要追求效益。广告主不仅需要将单日花费严格控制在预算范围内,还应力求降低每次转化的成本,实现成本效益的双重优化。

其次是,未来环境的不确定性。系统难以预知即将到来的流量状况与竞争对手行为,因此必须依赖实时花费与成本等数据,动态调整出价策略以应对波动市场。

最后是决策之间的连锁影响。每一次出价不仅直接影响广告的展示与消耗,还会改变账户状态(如剩余预算),进而干扰后续出价决策,形成一个连续且复杂的序列决策问题。

三代技术革新,快手提出新一代生成式强化学习出价技术

快手出价技术已历经三代演进:从PID控制——基于当前状态与目标的偏差进行调节,响应直接但适应性有限,难以应对复杂多变的竞价环境;到第二代MPC预测模型——能够预测短期未来并优化动作,但预测范围有限,易陷局部最优;再到第三代强化学习——通过历史数据学习不同状态下的最优出价策略,最大化长期收益,兼顾效果与安全性。

近年来,尽管强化学习在自动出价中表现优异,但其决策仍依赖单步状态信息,对序列历史利用不足。而生成式模型擅长对序列数据进行建模和生成,却不擅长直接优化目标收益。

面对这一挑战,快手创新融合两类技术,提出生成式强化学习出价技术——在继承生成模型序列建模能力的基础上,引入强化学习的目标导向优化机制,实现出价策略在长序列决策中的新突破。

两大核心算法实现广告出价“多维思考”,助推智能决策升级

在将生成模型应用于强化出价策略的过程中,主要面临两大挑战:一是对高质量数据集的依赖较强,限制了泛化能力;二是生成模型难以直接优化序列整体收益,导致出价策略与广告主全局目标存在偏差。

针对这些挑战,快手提出了GAVE和CBD两大创新算法。GAVE算法融合了Score-based RTG机制与价值函数引导的动作探索策略,显著提升了离线训练中的探索能力,该成果助力团队荣获NeurIPS 2024自动出价竞赛双赛道冠军。

CBD算法则聚焦于生成模型与优化目标的对齐问题,引入“Completer(扩散补全)”和“Aligner(偏好对齐)”双模块,通过补全未来状态轨迹并进行校准,使出价策略更贴合广告主真实需求,提升了系统长程规划与决策可解释性。

2025年至今,生成式强化学习出价技术已在快手广告系统中全面部署,并推动平台广告收入提升3%。在多项关键客户指标上实现突破——如在成本控制场景中,消耗提升2.0%,CPA达标率提升1.9%。

展望未来,快手将围绕两大方向持续演进。一是构建出价基座大模型,整合多场景数据训练通用模型,发挥规模效应;二是发展出价推理大模型,引入大语言模型增强推理能力,提升可解释性与复杂决策水平。

快手将继续推动自动出价技术向更高层次的智能化迈进,为数字营销行业注入创新动力。

更多热门内容
了不起的老铁西北刀客篇上线 快手携手京东3C数码打造猎猪人纪录片
近日,快手平台市场部We我们工作室旗下内容IP《了不起的老铁》推出全新作品——了不起的老铁·西北刀客篇《西北猎猪人》。本季特别篇与京东3C数码达成深度商业化合作,不仅为观众呈现了一段热血与温情交织的护农故事,更标志着该IP系列纪录片首次成功打造商业化标杆案例

2025-09-26

AI-RAN赋能垂直行业:2025企业数智化转型,Private AI-RAN开启网络升级新篇章
通感算智融合的Private AI-RAN不仅是企业数智化转型的核心支撑,还能为企业释放长期商业价值,推动业务创新与可持续发展。Private AI-RAN凭借其独特优势,在垂直行业的应用不断深化,未来有望推…

2025-09-26

智慧AB门系统:以科技之力重构监狱安防,开启智能管控新篇章
•与车辆管理系统的联动:对于进出车辆,系统可实现全流程自动化:车牌识别自动抬杆->进入过渡区->车辆底盘扫描系统自动扫描并AI比对违禁品->系统确认无误后,才授权开启B门。2. 风险态势评估:系统可综合…

2025-09-26

超10万亿Tokens数据集炼成记:中国电信天翼AI如何构建AI发展基石
同时,2025年中国电信加速“云改数转智惠”战略升级,布局算力、数据、模型、平台及应用等全产业链,尤其在基础大模型技术攻坚方面,我们致力于成为AI领域的主力军,推进AI迈向普惠发展新阶段,这些都要求我们自主建…

2025-09-26

对话诺基亚贝尔程刚:借AI与网络融合之势,为千行百业数字化转型添能
程刚表示,诺基亚贝尔正推动AI与网络的深度融合,进入“AI超级周期”,而中国市场凭借其领先的需求与创新实践是诺基亚全球创新的重要组成部分之一。他强调:“我们需进一步强化与行业及生态伙伴的紧密合作,加速创新成…

2025-09-26

华为Mate 80系列或推钛金属与陶瓷版本 搭载新一代通讯架构及双层OLED屏
【CNMO科技消息】近日,有数码博主爆料称,华为Mate 80系列将推出6.8英寸3D人脸识别直屏版本,并采用全新一代通讯网络架构。 通信能力方面,华为或将首次为Mate系列引入“全新一代通讯网络架构”,预计…

2025-09-26

五年磨一剑:小米17 Pro Max评测,高端之路的实力见证者
在影像上的表现也是,升级的潜望式长焦在应对白天黑夜各种场景和远近交通各种距离都能有超乎想象的表现,主摄更是怎么拍怎么好,这样越级的画面表现不禁让我担心起了未来的Ultra,Pro Max版已经有了如此的表现…

2025-09-26

专业团队实测iPhone 17 Pro相机:8倍长焦突破与算法优化双升级
CNMO注意到,Lux团队此次对iPhone 17Pro相机的评测重点聚焦三大核心升级:全新的4倍和8倍长焦变焦功能、显著提升的"光学品质"2倍变焦,以及创新的Center Stage前置摄像头系统。2倍…

2025-09-26

小米新品发布会重磅来袭,平板等新品亮点足,哪款能戳中你心?
具体包括:小米平板 8 系列、小米电视 S Pro Mini LED 2026 ;米家冰箱 Pro ;米家三区洗衣机 Pro;小米路由器BE10000 Pro ;小米 Sound 2 Max 音响 ;小米…

2025-09-26

手游迈入165帧超流畅时代,一加自研技术领航,总裁揭秘新Ultra旗舰
智东西9月26日北京现场报道,刚刚一加举办了一场聚焦手机游戏技术的大会,亮出了诸多一加在游戏领域的最新自研技术创新,并将手游带到了165超高帧游戏阶段,这些技术都会在后续即将发布的一加15系列上落地。 经过…

2025-09-26