大模型贵到用不起？五大因素揭示AI定价必降

大模型天价账单撑不住了。五大因素正在合力压低AI成本，Uber四个月烧完全年AI预算只是开始——企业正在重新审视这笔开支的必要性。

成本为何高烧不退

当前最贵的GPT-5.5每百万输入token收费5美元、输出token收费30美元，单次处理50个TypeScript文件就能花掉54美元。这是因为前沿实验室不只收推理费，还要分摊模型架构研发、训练数据收集与整理、数十亿美元的训练成本、人员工资和营销费用。这种定价模式在市场缺乏竞争时管用，但不会持久。

降价五大推手

性能提升撞上天花板。 每代新模型的进步幅度正在缩小，训练数据也快被耗尽——主流实验室很可能已经用尽了所有数字和印刷媒体资源。如果模型能力不再大幅跃升，提价就失去理由。Claude Opus 4.8与4.7定价相同，已经是市场信号。

开源模型撕开缺口。 开源模型去掉了研发和营销成本，只收推理费用。GLM-5.2在编程测试中已追上GPT和Opus，价格却只有十分之一。这种竞争会越来越激烈。

专用芯片拉低推理价。 Google TPU比英伟达H100 GPU便宜30%到70%，Cerebras、Groq等专用AI芯片也在抢市场。芯片一旦量产，边际成本骤降。加上MoE架构、缓存等效率改进，每token处理成本还会继续下滑。

切换成本趋近于零。 传统软件换供应商要迁移数月，AI模型切换只需几秒。OpenRouter这类网关已能按编程自动切换最优供应商——谁敢涨价，用户立刻跑。

本地部署将成终极变量。 再过四到五年，新芯片会让本地运行大模型变得流畅，内存白菜价也会推一把。操作系统可能直接集成模型接口，简单的代码补全、校对、查错都在本地完成，企业不再需要每月20美元或200美元的订阅费。

价格压力必然从上述一个或多个方向袭来，最终受益的是消费者。

编注：材料为个人博客经Hacker News传播，分析框架完整但数据未标注来源，读者可作参考不作为投资依据。