大模型贵到用不起?五大因素揭示AI定价必降

大模型贵到用不起?五大因素揭示AI定价必降

_

大模型天价账单撑不住了。五大因素正在合力压低AI成本,Uber四个月烧完全年AI预算只是开始——企业正在重新审视这笔开支的必要性。

成本为何高烧不退

当前最贵的GPT-5.5每百万输入token收费5美元、输出token收费30美元,单次处理50个TypeScript文件就能花掉54美元。这是因为前沿实验室不只收推理费,还要分摊模型架构研发、训练数据收集与整理、数十亿美元的训练成本、人员工资和营销费用。这种定价模式在市场缺乏竞争时管用,但不会持久。

降价五大推手

性能提升撞上天花板。 每代新模型的进步幅度正在缩小,训练数据也快被耗尽——主流实验室很可能已经用尽了所有数字和印刷媒体资源。如果模型能力不再大幅跃升,提价就失去理由。Claude Opus 4.8与4.7定价相同,已经是市场信号。

开源模型撕开缺口。 开源模型去掉了研发和营销成本,只收推理费用。GLM-5.2在编程测试中已追上GPT和Opus,价格却只有十分之一。这种竞争会越来越激烈。

专用芯片拉低推理价。 Google TPU比英伟达H100 GPU便宜30%到70%,Cerebras、Groq等专用AI芯片也在抢市场。芯片一旦量产,边际成本骤降。加上MoE架构、缓存等效率改进,每token处理成本还会继续下滑。

切换成本趋近于零。 传统软件换供应商要迁移数月,AI模型切换只需几秒。OpenRouter这类网关已能按编程自动切换最优供应商——谁敢涨价,用户立刻跑。

本地部署将成终极变量。 再过四到五年,新芯片会让本地运行大模型变得流畅,内存白菜价也会推一把。操作系统可能直接集成模型接口,简单的代码补全、校对、查错都在本地完成,企业不再需要每月20美元或200美元的订阅费。

价格压力必然从上述一个或多个方向袭来,最终受益的是消费者。

编注:材料为个人博客经Hacker News传播,分析框架完整但数据未标注来源,读者可作参考不作为投资依据。


DeepSeek宣布团队扩编一倍,首轮融资超400亿元落地 2026-06-26
苹果涨价冲击波:亚洲果链全线下跌,存储芯片巨头蒸发千亿市值 2026-06-26