ITBEAR科技资讯
网站首页 科技资讯 财经资讯 分享好友

AWS re:Invent 2025发布Trainium3及UltraServers,AI算力成本再降新突破

时间:2025-12-03 16:15:05来源:快讯编辑:快讯

在拉斯维加斯举办的年度技术盛会上,亚马逊云计算部门(AWS)正式推出了新一代自研AI芯片Trainium3,并同步展示了为下一代AI工作负载设计的Trainium3 UltraServers。与此同时,AWS还公布了Trainium4的研发路线图,引发行业高度关注。

为满足自身需求并降低运营成本,亚马逊、谷歌等云服务巨头早在数年前便开始布局自研云端AI芯片。据AWS披露,其定制芯片业务规模已达数十亿美元,Trainium系列芯片全球部署量突破100万张,成为支撑超大规模AI计算的核心基础设施之一,仅次谷歌TPU的市场表现。这一数据印证了自研芯片在云服务领域的战略价值。

Trainium3基于台积电3nm制程工艺打造,单芯片可提供2.52 PFLOPs(FP8)算力,支持FP32、BF16、MXFP8及新增MXFP4等多种精度格式。内存配置方面,该芯片将HBM3e容量提升至144GB,带宽达4.9TB/s,并通过强化结构化稀疏性及微缩放硬件支持,显著优化了大语言模型的训练与推理效率。AWS宣称,Trainium3可将AI模型全生命周期成本降低50%,为客户提供更具性价比的算力服务。

基于全新Neuron Fabric互联技术,AWS同步推出的Trainium3 UltraServers实现了算力跃升。该系统最多可整合144颗Trainium3芯片,总算力达362 FP8 PFLOPs。实测数据显示,与上一代Trainium2 UltraServers相比,新系统的原始性能提升4.4倍,性能功耗比提升4倍,能源效率提高40%。在部署GPT-OSS等主流开源模型时,单芯片吞吐量提升3倍,响应延迟缩短4倍,大幅缩短模型训练周期——原本需数月的任务可压缩至数周,同时支持更多推理请求,降低项目上线时间与运营成本。

通过EC2 UltraClusters 3.0架构,Trainium3 UltraServers可扩展至最高100万张芯片的超级集群,规模较上一代提升10倍。目前,该架构已为Anthropic的“Project Rainier”项目提供核心算力支撑,当前部署50万张Trainium 2芯片,并计划年底前扩容至100万张。这一扩展能力进一步巩固了AWS在超大规模AI计算领域的领先地位。

实际应用中,Trainium3及Trainium3 UltraServers已展现显著成效。Anthropic、Karakuri、metagenomi、NetoAI、Ricoh、Splash Music等企业反馈,采用该方案后训练成本较其他方案最多降低50%。这一成果验证了AWS自研芯片在商业化场景中的竞争力。

关于下一代产品,AWS透露Trainium4正在研发中,虽未公布具体发布时间,但承诺其性能将实现突破性提升:FP4处理性能至少提升6倍,FP8性能提升3倍,内存频宽提高4倍。更值得关注的是,Trainium4将支持NVIDIA NVLink Fusion高速互连技术,可与Graviton处理器及EFA(Elastic Fabric Adapter)在通用MGX机架中无缝协作,实现与NVIDIA GPU的互操作与性能扩展。这一技术整合或为AI计算生态带来新的变量。

更多热门内容
科梦奇迎宾机器人:解锁接待新场景,从入口到导览的智能服务全攻略
品牌对比如何理解科梦奇机器人侧重迎宾接待、场馆讲解、路线引导和内容展示,适合需要长期运行的接待空间。 日常使用中的任务分工迎宾机器人更适合承担清晰、重复、可标准化的岗位。科梦奇机器人在部署时,应结合入口视线…

2026-05-31

Hermes Agent智能体赋能Coredoo Store:构建全域电商智能运营新生态
Hermes Agent 智能体框架的出现,为企业搭建了一个“人机协同、数据驱动、智能决策”的全新商业中枢,将商城系统从传统管理平台升级为智能化运营生态。通过全域触点的覆盖,HermesAgent 智能…

2026-05-31

小米REDMI K90至尊版入网:骁龙8至尊版加持,165Hz高刷屏6月登场
作为旗舰系列,所有版本均为旗舰配置起步,确保整体性能需求,而区别在影像、续航、处理器、散热等方面,进行精准调整。 整体性能同样达到旗舰级别,可流畅运行各大手游,而且是高画质+高帧率模式下,提升视觉+游戏体验…

2026-05-31

拯救者Y70新机来袭!2K大屏搭配8000mAh电池,6月9日开启游戏新体验
“高配置、高性能”成为高端机、旗舰机、游戏手机的主力方向,主要是考虑到高负载场景运行,尤其是大型游戏,具备高画质+高帧率模式,流畅与视觉体验兼顾。 新机整体亮点明确,比如2K大屏、三重散热、高续航、第五代骁龙…

2026-05-31

小米MiMo-V2.5系列大揭秘:全链路优化技术细节首公开,推理成本大降
据介绍,该团队围绕 Hybrid SWA + MoE + 多模态的复合架构,系统性重构了从 KVCache管理、分级缓存、前缀缓存到调度策略与 Prefill / Decode 链路的完整推理栈,KVCa…

2026-05-31

专为水上运动而生!零零科技哈浮AQUA飞行相机开启水上拍摄新纪元
AQUA 不仅延续了哈浮飞行相机经典的 AI 智能运镜、无需遥控器的交互体验,更在 IP67专业级防尘防水、水面起降的可靠性,以及专为水上运动优化的飞行性能等方面,实现了革命性突破。 AQUA 致力于攻克…

2026-05-31