AI价值重心加速迁移：模型层崛起，算力端定价滞后蕴藏新变局-业界动态-ITBear科技资讯

人工智能产业的价值分布格局正经历深刻变革。过去两年，英伟达、内存制造商及能源供应商主导了AI投资回报分配，但智能体AI（Agentic AI）的商业化进程加速，正推动模型层利润空间以惊人速度扩张。值得注意的是，作为算力核心供应商的英伟达与台积电，其定价策略尚未充分反映这一趋势，形成显著的市场错位。

Anthropic的财务数据印证了这种结构性转变。据行业研究机构SemiAnalysis统计，该公司年化营收从年初的90亿美元激增至440亿美元以上，推理基础设施毛利率同期从38%跃升至70%以上。成本端呈现相反趋势：代币生产成本因硬件迭代与软件优化大幅下降，价值与成本间的剪刀差持续扩大，推动模型厂商进入利润率快速提升阶段。

在算力供给端，资源稀缺性达到前所未有的程度。台积电N3制程产能利用率预计2026年下半年突破100%，英伟达、博通、AMD等企业为争夺有限晶圆配额展开激烈竞争。内存市场同样紧张，DRAM晶圆厂利用率超90%，但定价策略仍显保守。这种供需失衡与定价滞后形成鲜明对比，为产业链价值重分配埋下伏笔。

智能体AI的普及正在重塑代币经济模型。SemiAnalysis以自身运营为例，其年化代币支出已达员工薪酬总额的30%，人均月消耗超50亿代币，是meta内部水平的5倍。财务建模、图表制作等原本需要初级分析师数小时完成的工作，现可通过智能体以极低代币成本实现。在特定任务场景下，运行Opus 4.7的实际混合价格降至每百万代币0.99美元，远低于官方标价，这得益于智能体工作负载高达300:1的输入输出比及90%以上的缓存命中率。

硬件性能的突破进一步放大了这种剪刀差。Blackwell系列芯片在前沿工作负载下的代币生成速度较H100提升30倍，优化配置的GB300 NVL72在FP8精度下吞吐量提升17倍，切换至FP4后差距扩大至32倍，而总拥有成本仅增加70%。这种技术跃迁与成本控制的双重效应，成为Anthropic毛利率飙升的核心驱动力。

面对模型厂商利润率扩张，市场普遍担忧竞争会压低价格，但SemiAnalysis认为这种担忧缺乏依据。前沿闭源模型在真实知识工作场景中仍保持显著优势，开源模型难以形成实质性威胁。更关键的是，算力约束导致需求持续超过供给，Anthropic通过设置订阅门槛、限制第三方接入等方式主动管理需求，这种结构性稀缺赋予其按价值而非成本定价的能力。该公司Opus fast定价是普通版本的6倍，即将推出的Mythos定价达25美元/125美元，仍获企业客户青睐。

算力供应商的定价滞后现象尤为突出。台积电完全具备提价条件，且客户可能欢迎这种调整——英伟达CEO黄仁勋曾公开呼吁台积电涨价，因为更高的晶圆价格将削弱竞争对手的产能获取能力。英伟达自身的定价框架仍基于"单位算力愿付价格随时间下降"的旧假设，但智能体工作负载的爆发已使算力需求呈现复合加速态势，原有定价模型亟待重构。

以2026年下半年发布的Vera Rubin（VR NVL72）系统为例，SemiAnalysis构建的定价分析框架显示，基于新兴云服务商15.6%的内部收益率要求，该系统每小时每GPU最低租金需达4.92美元；而以GB300当前5年期合约租金为基准，租金上限可达每GPU每小时12.25美元。当前定价仅使每PFLOP成本降至0.28美元，较GB300 NVL72降幅达60%，存在约40%的上调空间。内存定价同样关键，VR NVL72采用的SOCAMM模组价格预计2026年底超每GB 13美元，英伟达若实现60%毛利率具有合理性，因其既掌握最大供应份额，客户又缺乏替代选择。

这种价值分配错位本质上是算力供应商的战略选择。英伟达通过软件效率提升向下游输送价值，维持生态系统扩张动力，同时规避反垄断监管；台积电则延续"稳定生态、不吃尽上行红利"的定价哲学。但随着推理投资回报率日益清晰，两家公司向价值定价框架切换的压力将持续上升，届时AI产业链的价值分配格局或将迎来新一轮重塑。