作为一个做了十几年技术研发管理的人,我最近在研究大模型的定价。越研究越觉得,这行业跟我以前经历过的所有技术浪潮都不太一样。
01 先看财报,数字不会骗人
我习惯先看财报。
智谱2025年营收7.24亿元,归母净亏损46.98亿元。MiniMax营收7904万美元,经调整净亏损2.5亿美元。两家都是上市公司,数字是公开的。
什么意思呢?智谱每赚1块钱,账面要亏出去6块5。
我们团队以前做SaaS,毛利率60%以上才敢说站稳了。大模型这帮人,营收几个亿,亏几十亿,而且还不是早期烧钱阶段——智谱都上市了,MiniMax也上市了,亏成这样。
主要大模型厂商2025年财务数据(已披露年报):
| 厂商 | 营收 | 归母/年内亏损 | 经调整净亏损 |
|---|---|---|---|
| 智谱 | 7.24亿元 | 46.98亿元 | 31.82亿元 |
| MiniMax | 7904万美元(约5.43亿元) | 18.72亿美元 | 2.5亿美元(约17.2亿元) |
数据来源:两家公司2025年年报
我以前在互联网公司经历过烧钱大战,但那时候烧的是用户补贴,想停随时能停。大模型烧的是GPU、是电费、是HBM内存。这些东西,用户用得越多,厂商烧得越多。不存在规模效应摊薄成本这回事。
02 API价格,我看不懂了
我们团队接了好几家大模型的API。2026年上半年,各家价格变动让我这个老研发也犯迷糊。
智谱年内调了三次价,整体涨了60%以上。腾讯混元输出价格涨了457%。阿里云、百度云的算力卡也涨了5%到34%。
但另一边,DeepSeek把价格压到0.025元/百万Token,小米MiMo跟到同样的价格。
2026年6月几家主流API价格:

同一个市场,一边猛涨,一边暴跌。我做了这么多年技术,没见过这种局面。
后来琢磨了一下,逻辑可能是这样的:涨价的厂商,手里有企业客户,算力不够分,提价还能撑住。降价的厂商,要么工程优化做得狠,要么在抢生态位。DeepSeek V4 Pro的性能我测过,不差,价格是别人几十分之一,开发者肯定用。
但作为技术负责人,我必须考虑一个问题:DeepSeek这个价格能撑多久?如果哪天突然涨价,我系统里全是他家的API,迁移成本虽然不高(改一行代码的事),但业务连续性怎么保证?这不是技术问题,是供应链风险。
03 Token这个东西,跟你想象的不一样

我们团队用大模型API做长文档处理,上个月账单出来,我吓了一跳。
仔细一查,问题出在"上下文膨胀"上。
大模型的计费逻辑是:你每发一次请求,它把你和它之前聊过的所有内容重新读一遍,按总量计费。你聊得越久,单次请求越贵。
我们有个同事跑一个PPT生成任务,在一个会话窗口里做了840条消息,Input Token干到了2040万。好在用的是DeepSeek,便宜,花了二十多块钱。换成Claude Opus,同样的活要480块。
两种模式对比:
| 模式 | Input Tokens | DeepSeek V4-Pro花费 | Claude Opus花费 |
|---|---|---|---|
| 全程一个会话 | 2040万 | 约20元 | 约480元 |
| 分两个会话 | 200-400万 | 约3-5元 | 约40-90元 |
我们的做法很简单:把"方案确认"和"执行生成"分成两个会话。方案确认完,所有结论写成文件存好。新会话直接从文件读,不背历史包袱。Token消耗降了80%,质量反而更稳定——因为上下文干净了,模型不会"记混"。
这个调整花了我们半天时间改工作流,ROI极高。我建议所有用API的团队都检查一下自己的会话管理。

04 定价权不在模型厂手里
做研发的都知道,在产业链里,谁不可替代,谁说了算。
大模型这条链上,GPU(英伟达)、HBM内存(SK海力士)没有替代品。数据中心资本开支一年几千亿美元,产能要2028年才释放。这些上游玩家把利润吃走了。
模型API层呢?智谱、DeepSeek、通义、混元、豆包、MiniMax……十几家挤在一起,开发者换一家只需要改一行代码。这是完全竞争市场,没有定价权。
我去年选型的时候对比过,各家模型能力差距没有价格差距那么大。但作为甲方,我确实是受益者——价格被打下来了。问题是,如果长期这样,谁还愿意投钱做基础模型?
05 我的判断:这生意不能按Token卖
我做了这么多年B端产品,有一条经验:客户不关心你用了什么技术,只关心你解决了什么问题。
Token是技术视角的计量单位,不是业务视角的。你告诉客户"这次调用花了2000万Token",他听不懂,也不想懂。
我们做技术方案的,最终交付的是一套能替客户省人、省钱、省时间的系统。定价应该基于这个,而不是基于Token消耗量。
百度李彦宏在Q1业绩会上说了一句话,我比较认同:"未来人们会为智能体和应用付费,而这是比token更大的市场。"
翻译成我们做产品的语言就是:按效果收费,不按消耗收费。
06 几个现实问题,我还没想明白
作为技术管理者,我脑子里有几个问题一直在转:
第一,DeepSeek的价格能维持多久? 0.025元/百万Token,我算过,连电费都不一定 cover 得住。如果这是战略性亏损抢市场,什么时候开始收割?如果突然涨价,依赖它的开发者怎么办?
第二,缓存命中这个定价逻辑,对开发者公平吗? 同样的Token,命中了就便宜,没命中就贵。问题是能不能命中,很大程度上取决于你的使用场景和调用方式,不是开发者能完全控制的。这个定价机制,到底是公平的激励,还是隐形的成本转嫁?
第三,长期亏损的行业怎么留住人才? 我招过算法工程师,行情好的时候一个应届生开到80万。如果公司一直亏,股权不值钱,奖金发不出,能留住的只有真正热爱的人。但光靠热爱撑不起一个行业。
结语
我是做技术的,不擅长预测行业走向。但从一个研发管理者的角度看,大模型这个行业现在面临的根本问题不是技术,是商业模式。
技术路线已经跑通了,模型能力也在快速迭代。问题是,这门生意到底该怎么赚钱?
是继续卖Token,薄利多销,靠规模撑起利润?还是转向B端,按项目、按效果收费,做产业效率的生意?
我没有答案。但作为每天都在用API、每个月都在付账单的技术人,我希望行业能找到一条可持续的路。毕竟,稳定的供应链,比便宜的价格更重要。
数据来源
-
智谱2025年年报数据:营收7.24亿元,归母净亏损46.98亿元,经调整净亏损31.82亿元
- 来源:上海证券报、中国证券报、界面新闻
-
MiniMax 2025年年报数据:营收7904万美元,经调整净亏损2.5亿美元
- 来源:证券时报/第一财经、金融界、中华工商时报
-
智谱MaaS平台及定价信息
- 来源:东方财富/中国证券报
-
百度2026年Q1财报数据:总营收321亿元,AI收入136亿元
- 来源:东方财富/财联社、人民网、新浪财经
-
阿里云2026年Q1财报数据:营收416亿元,AI产品收入89.71亿元
- 来源:网易/雷递、证券时报/21世纪经济报道
-
腾讯2026年Q1资本开支数据
- 来源:证券时报/21世纪经济报道

评论
发表评论