谷歌TPU成本暴降70%,AI芯片竞争迎来新拐点

高盛发布的研究报告显示,Google/Broadcom TPU 在推理阶段的单位成本大幅下降,TPU v7的推理成本较前一代降低了约70%。这使得其在成本上与英伟达的GB200 NVL72几乎持平,甚至在某些情况下略显优势。
2026-01-22 17:21:55  |   作者:开源爱好者  |   来源:

谷歌TPU成本暴降70%,AI芯片竞争迎来新拐点

高盛发布的研究报告显示,Google/Broadcom TPU 在推理阶段的单位成本大幅下降,TPU v7的推理成本较前一代降低了约70%。这使得其在成本上与英伟达的GB200 NVL72几乎持平,甚至在某些情况下略显优势。
2026-01-22 17:21:55
作者:开源爱好者
来源:

随着AI产业的商业化压力逐渐增大,芯片成本问题成为焦点。近期,高盛发布的研究报告显示,Google/Broadcom TPU 在推理阶段的单位成本大幅下降,TPU v7的推理成本较前一代降低了约70%。这使得其在成本上与英伟达的GB200 NVL72几乎持平,甚至在某些情况下略显优势。

google.jpg

这标志着AI芯片竞争的评价标准正在发生转变:从单纯的算力争夺转向成本效率的较量。过去,AI芯片市场更多关注训练算力,但随着大模型逐步进入实际应用阶段,推理成为了持续产生现金流的关键。这一转变让系统效率(包括算力密度、内存带宽和能源消耗)成为决定性因素,TPU的快速进步清晰地表明了这一点。

TPU的系统优化带来大幅降本

TPU v7的成本暴降并非来自单一的技术突破,而是系统级优化的结果。谷歌通过提升计算相邻技术,如网络互联、内存方案和封装技术等,实现了推理成本的快速下降。这些技术进步不仅让TPU在推理场景中展现出更高的性价比,还使得谷歌在AI市场的地位得到进一步巩固。

此外,谷歌内部的TPU使用比例逐年上升,越来越多的客户选择将TPU作为AI训练和推理的核心技术,Anthropic甚至向Broadcom下达了约210亿美元的订单,预计将在2026年交付。

英伟达面临挑战,但仍占据优势

尽管TPU在推理成本上迎头赶上,英伟达仍凭借其GPU的强大生态和持续的产品迭代占据优势。高盛指出,英伟达通过快速的产品更新(如GB300 NVL72和未来的VR200 NVL144)不断保持市场竞争力,而其CUDA生态和系统级研发投入仍然是其护城河。

不过,随着TPU等定制ASIC方案的崛起,英伟达的市场主导地位正面临越来越强的挑战。尽管如此,英伟达的产品迭代和技术积累使其仍处于AI芯片市场的前列。

投资视角:ASIC崛起,英伟达护城河尚未被击穿

从投资角度来看,高盛依然看好英伟达和Broadcom的未来。尽管TPU的降本带来了强劲竞争,但英伟达凭借持续的技术创新和生态优势,依然是AI芯片市场中的重要玩家。而在ASIC阵营中,Broadcom的受益逻辑最为明显,其AI网络和定制计算领域的盈利潜力值得持续关注。

AI行业的“算力大战”正向“成本大战”转变,推理成本的下降正在重塑市场格局。TPU的快速追赶不仅是技术的进步,更是对AI商业化可行性的一次重要压力测试。随着AI产业进入一个更加注重成本效益的阶段,芯片市场的竞争将更加激烈,GPU与ASIC的争夺才刚刚开始。