ITBEAR科技资讯
网站首页 科技资讯 财经资讯 分享好友

AI价值重心加速迁移:模型层崛起,算力端定价滞后蕴藏新变局

时间:2026-06-28 22:28:51来源:互联网编辑:快讯

人工智能产业的价值分布格局正经历深刻变革。过去两年,英伟达、内存制造商及能源供应商主导了AI投资回报分配,但智能体AI(Agentic AI)的商业化进程加速,正推动模型层利润空间以惊人速度扩张。值得注意的是,作为算力核心供应商的英伟达与台积电,其定价策略尚未充分反映这一趋势,形成显著的市场错位。

Anthropic的财务数据印证了这种结构性转变。据行业研究机构SemiAnalysis统计,该公司年化营收从年初的90亿美元激增至440亿美元以上,推理基础设施毛利率同期从38%跃升至70%以上。成本端呈现相反趋势:代币生产成本因硬件迭代与软件优化大幅下降,价值与成本间的剪刀差持续扩大,推动模型厂商进入利润率快速提升阶段。

在算力供给端,资源稀缺性达到前所未有的程度。台积电N3制程产能利用率预计2026年下半年突破100%,英伟达、博通、AMD等企业为争夺有限晶圆配额展开激烈竞争。内存市场同样紧张,DRAM晶圆厂利用率超90%,但定价策略仍显保守。这种供需失衡与定价滞后形成鲜明对比,为产业链价值重分配埋下伏笔。

智能体AI的普及正在重塑代币经济模型。SemiAnalysis以自身运营为例,其年化代币支出已达员工薪酬总额的30%,人均月消耗超50亿代币,是meta内部水平的5倍。财务建模、图表制作等原本需要初级分析师数小时完成的工作,现可通过智能体以极低代币成本实现。在特定任务场景下,运行Opus 4.7的实际混合价格降至每百万代币0.99美元,远低于官方标价,这得益于智能体工作负载高达300:1的输入输出比及90%以上的缓存命中率。

硬件性能的突破进一步放大了这种剪刀差。Blackwell系列芯片在前沿工作负载下的代币生成速度较H100提升30倍,优化配置的GB300 NVL72在FP8精度下吞吐量提升17倍,切换至FP4后差距扩大至32倍,而总拥有成本仅增加70%。这种技术跃迁与成本控制的双重效应,成为Anthropic毛利率飙升的核心驱动力。

面对模型厂商利润率扩张,市场普遍担忧竞争会压低价格,但SemiAnalysis认为这种担忧缺乏依据。前沿闭源模型在真实知识工作场景中仍保持显著优势,开源模型难以形成实质性威胁。更关键的是,算力约束导致需求持续超过供给,Anthropic通过设置订阅门槛、限制第三方接入等方式主动管理需求,这种结构性稀缺赋予其按价值而非成本定价的能力。该公司Opus fast定价是普通版本的6倍,即将推出的Mythos定价达25美元/125美元,仍获企业客户青睐。

算力供应商的定价滞后现象尤为突出。台积电完全具备提价条件,且客户可能欢迎这种调整——英伟达CEO黄仁勋曾公开呼吁台积电涨价,因为更高的晶圆价格将削弱竞争对手的产能获取能力。英伟达自身的定价框架仍基于"单位算力愿付价格随时间下降"的旧假设,但智能体工作负载的爆发已使算力需求呈现复合加速态势,原有定价模型亟待重构。

以2026年下半年发布的Vera Rubin(VR NVL72)系统为例,SemiAnalysis构建的定价分析框架显示,基于新兴云服务商15.6%的内部收益率要求,该系统每小时每GPU最低租金需达4.92美元;而以GB300当前5年期合约租金为基准,租金上限可达每GPU每小时12.25美元。当前定价仅使每PFLOP成本降至0.28美元,较GB300 NVL72降幅达60%,存在约40%的上调空间。内存定价同样关键,VR NVL72采用的SOCAMM模组价格预计2026年底超每GB 13美元,英伟达若实现60%毛利率具有合理性,因其既掌握最大供应份额,客户又缺乏替代选择。

这种价值分配错位本质上是算力供应商的战略选择。英伟达通过软件效率提升向下游输送价值,维持生态系统扩张动力,同时规避反垄断监管;台积电则延续"稳定生态、不吃尽上行红利"的定价哲学。但随着推理投资回报率日益清晰,两家公司向价值定价框架切换的压力将持续上升,届时AI产业链的价值分配格局或将迎来新一轮重塑。

更多热门内容