大模型定价迷局：每赚1块亏4块4，你的钱被谁花掉了？

作为一个做了十几年技术研发管理的人，我最近在研究大模型的定价。越研究越觉得，这行业跟我以前经历过的所有技术浪潮都不太一样。

01 先看财报，数字不会骗人

我习惯先看财报。

智谱2025年营收7.24亿元，归母净亏损46.98亿元。MiniMax营收7904万美元，经调整净亏损2.5亿美元。两家都是上市公司，数字是公开的。

什么意思呢？智谱每赚1块钱，账面要亏出去6块5。

我们团队以前做SaaS，毛利率60%以上才敢说站稳了。大模型这帮人，营收几个亿，亏几十亿，而且还不是早期烧钱阶段——智谱都上市了，MiniMax也上市了，亏成这样。

主要大模型厂商2025年财务数据（已披露年报）：

厂商	营收	归母/年内亏损	经调整净亏损
智谱	7.24亿元	46.98亿元	31.82亿元
MiniMax	7904万美元（约5.43亿元）	18.72亿美元	2.5亿美元（约17.2亿元）

数据来源：两家公司2025年年报

我以前在互联网公司经历过烧钱大战，但那时候烧的是用户补贴，想停随时能停。大模型烧的是GPU、是电费、是HBM内存。这些东西，用户用得越多，厂商烧得越多。不存在规模效应摊薄成本这回事。

02 API价格，我看不懂了

我们团队接了好几家大模型的API。2026年上半年，各家价格变动让我这个老研发也犯迷糊。

智谱年内调了三次价，整体涨了60%以上。腾讯混元输出价格涨了457%。阿里云、百度云的算力卡也涨了5%到34%。

但另一边，DeepSeek把价格压到0.025元/百万Token，小米MiMo跟到同样的价格。

2026年6月几家主流API价格：

同一个市场，一边猛涨，一边暴跌。我做了这么多年技术，没见过这种局面。

后来琢磨了一下，逻辑可能是这样的：涨价的厂商，手里有企业客户，算力不够分，提价还能撑住。降价的厂商，要么工程优化做得狠，要么在抢生态位。DeepSeek V4 Pro的性能我测过，不差，价格是别人几十分之一，开发者肯定用。

但作为技术负责人，我必须考虑一个问题：DeepSeek这个价格能撑多久？如果哪天突然涨价，我系统里全是他家的API，迁移成本虽然不高（改一行代码的事），但业务连续性怎么保证？这不是技术问题，是供应链风险。

03 Token这个东西，跟你想象的不一样

我们团队用大模型API做长文档处理，上个月账单出来，我吓了一跳。

仔细一查，问题出在"上下文膨胀"上。

大模型的计费逻辑是：你每发一次请求，它把你和它之前聊过的所有内容重新读一遍，按总量计费。你聊得越久，单次请求越贵。

我们有个同事跑一个PPT生成任务，在一个会话窗口里做了840条消息，Input Token干到了2040万。好在用的是DeepSeek，便宜，花了二十多块钱。换成Claude Opus，同样的活要480块。

两种模式对比：

模式	Input Tokens	DeepSeek V4-Pro花费	Claude Opus花费
全程一个会话	2040万	约20元	约480元
分两个会话	200-400万	约3-5元	约40-90元

我们的做法很简单：把"方案确认"和"执行生成"分成两个会话。方案确认完，所有结论写成文件存好。新会话直接从文件读，不背历史包袱。Token消耗降了80%，质量反而更稳定——因为上下文干净了，模型不会"记混"。

这个调整花了我们半天时间改工作流，ROI极高。我建议所有用API的团队都检查一下自己的会话管理。

04 定价权不在模型厂手里

做研发的都知道，在产业链里，谁不可替代，谁说了算。

大模型这条链上，GPU（英伟达）、HBM内存（SK海力士）没有替代品。数据中心资本开支一年几千亿美元，产能要2028年才释放。这些上游玩家把利润吃走了。

模型API层呢？智谱、DeepSeek、通义、混元、豆包、MiniMax……十几家挤在一起，开发者换一家只需要改一行代码。这是完全竞争市场，没有定价权。

我去年选型的时候对比过，各家模型能力差距没有价格差距那么大。但作为甲方，我确实是受益者——价格被打下来了。问题是，如果长期这样，谁还愿意投钱做基础模型？

05 我的判断：这生意不能按Token卖

我做了这么多年B端产品，有一条经验：客户不关心你用了什么技术，只关心你解决了什么问题。

Token是技术视角的计量单位，不是业务视角的。你告诉客户"这次调用花了2000万Token"，他听不懂，也不想懂。

我们做技术方案的，最终交付的是一套能替客户省人、省钱、省时间的系统。定价应该基于这个，而不是基于Token消耗量。

百度李彦宏在Q1业绩会上说了一句话，我比较认同："未来人们会为智能体和应用付费，而这是比token更大的市场。"

翻译成我们做产品的语言就是：按效果收费，不按消耗收费。

06 几个现实问题，我还没想明白

作为技术管理者，我脑子里有几个问题一直在转：

第一，DeepSeek的价格能维持多久？ 0.025元/百万Token，我算过，连电费都不一定 cover 得住。如果这是战略性亏损抢市场，什么时候开始收割？如果突然涨价，依赖它的开发者怎么办？

第二，缓存命中这个定价逻辑，对开发者公平吗？ 同样的Token，命中了就便宜，没命中就贵。问题是能不能命中，很大程度上取决于你的使用场景和调用方式，不是开发者能完全控制的。这个定价机制，到底是公平的激励，还是隐形的成本转嫁？

第三，长期亏损的行业怎么留住人才？ 我招过算法工程师，行情好的时候一个应届生开到80万。如果公司一直亏，股权不值钱，奖金发不出，能留住的只有真正热爱的人。但光靠热爱撑不起一个行业。

结语

我是做技术的，不擅长预测行业走向。但从一个研发管理者的角度看，大模型这个行业现在面临的根本问题不是技术，是商业模式。

技术路线已经跑通了，模型能力也在快速迭代。问题是，这门生意到底该怎么赚钱？

是继续卖Token，薄利多销，靠规模撑起利润？还是转向B端，按项目、按效果收费，做产业效率的生意？

我没有答案。但作为每天都在用API、每个月都在付账单的技术人，我希望行业能找到一条可持续的路。毕竟，稳定的供应链，比便宜的价格更重要。

数据来源

智谱2025年年报数据：营收7.24亿元，归母净亏损46.98亿元，经调整净亏损31.82亿元
- 来源：上海证券报、中国证券报、界面新闻
MiniMax 2025年年报数据：营收7904万美元，经调整净亏损2.5亿美元
- 来源：证券时报/第一财经、金融界、中华工商时报
智谱MaaS平台及定价信息
- 来源：东方财富/中国证券报
百度2026年Q1财报数据：总营收321亿元，AI收入136亿元
- 来源：东方财富/财联社、人民网、新浪财经
阿里云2026年Q1财报数据：营收416亿元，AI产品收入89.71亿元
- 来源：网易/雷递、证券时报/21世纪经济报道
腾讯2026年Q1资本开支数据
- 来源：证券时报/21世纪经济报道

大模型定价迷局：每赚1块亏4块4，你的钱被谁花掉了？

01 先看财报，数字不会骗人

02 API价格，我看不懂了

03 Token这个东西，跟你想象的不一样

04 定价权不在模型厂手里

05 我的判断：这生意不能按Token卖

06 几个现实问题，我还没想明白

结语

数据来源

评论

发表评论

大模型定价迷局：每赚1块亏4块4，你的钱被谁花掉了？

分享

01 先看财报，数字不会骗人

02 API价格，我看不懂了

03 Token这个东西，跟你想象的不一样

04 定价权不在模型厂手里

05 我的判断：这生意不能按Token卖

06 几个现实问题，我还没想明白

结语

数据来源

评论

发表评论