“AI免费”退场?算力账单压顶,大模型厂商谋变

2026年05月07日 18:13   21世纪经济报道 21财经APP   董静怡
涨价和收费,不得不面临的选择

21世纪经济报道记者 董静怡

豆包开始收费了。

中国月活最高的AI应用,“五一”期间悄然在应用商店更新了订阅计划。三档价格——标准版连续包月68元、加强版200元、专业版500元——像三颗石子投入平静湖面,行业里“补贴”“免费”的市场氛围,正在走向终点。

过去两年,豆包一直扮演着激进的补贴者角色,用几乎零门槛的方式把大模型推向了数亿用户。但算力成本正在成为沉重的包袱。数据显示,豆包的日均Token使用量三个月翻了一倍,突破120万亿,背后是字节跳动千亿级的资本开支,以及净利润超过70%的同比下滑。

没有哪家大模型厂商可以永远回避这个问题。近段时间,国内外大模型厂商们几乎是在以“周”为单位刷新纪录,表面的技术跃进之下,是算力账单压顶之下的生存焦虑。

4月底,OpenAI发布GPT-5.5,比上一代贵了一倍。国内,智谱一个月内两次提价,Kimi输入价格上涨58%。涨价和收费,成了行业不得不面对的现实选择。

大模型开始算账了

过去的一个月,可以被定义为大模型的“超级更新月”。但相比以往单纯刷榜的狂欢,这轮发布的底色更为务实,几乎都指向了特定的应用场景或商业回报。

4月底,OpenAI发布了其最新一代大模型GPT-5.5,面向复杂工作与智能体,输入定价为5美元/百万Tokens,输出定价为30美元/百万Tokens,比GPT-5.4整体贵了一倍。Pro版本价格更高,输入价格为30美元/百万Tokens,输出价格为180美元/百万Tokens。

随后,它又在发布至今的短短两周内发布两个版本:针对网络安全任务进行优化的GPT-5.5-Cyber和面向C端的免费模型GPT-5.5 Instant,同时上线测试版ChatGPT自助广告管理器。

在OpenAI的商业考量里,通过旗舰版(Pro)服务高价值付费用户和企业,通过免费的Instant版巩固庞大的用户基础,并借助广告等方式探索变现。每个新版本都背负着明确的商业化目标。

一直面向企业市场的Anthropic也在4月发布Claude Opus 4.7,软件工程领域显著提升,距离上一代发布仅间隔两个多月。面对OpenAI等竞争对手向B端市场的进攻,Anthropic的步伐需要迈得更快。

再看国内。4月初,智谱公布了今年以来的第三次提价计划,发布新一代旗舰模型GLM-5.1的同时提价10%,而其距离上次调价30%起仅一个月。4月下旬,Kimi发布K2.6,API输入价格从0.60美元/百万Tokens上调至0.95美元/百万Tokens,涨幅58%。

虽然提价,市场仍然火热。据国家数据局3月披露,我国日均Token调用量已突破140万亿,相比2024年初增长了1000多倍。在智谱2025年业绩说明会上,智谱CEO张鹏也表示,2026年一季度智谱的API调用定价提升83%,即便如此,市场依然呈现出供不应求的情况,调用量增长400%。

C端市场,“免费”和“补贴”的呼声也渐渐平息了。作为中国月活最高的AI应用,豆包也在日前启动了付费订阅测试,推出了标准版(68元/月)、加强版(200元/月)和专业版(500元/月)三档方案。

当然,字节的做法并非简单的“割韭菜”。其细节显示,基础聊天依然免费,付费点集中在PPT生成、数据分析、视频制作等“重算力”场景。

摩根士丹利在一份报告中指出,作为中国消费级AI赛道最激进的补贴者,豆包此举释放出重要的行业信号:中国消费者AI使用习惯的培育阶段已基本完成,行业正从用户补贴转向商业可持续性。

然而,需要承认,中国用户的付费意愿与收入水平的错位也是客观存在的。500元的月费占中国居民人均可支配月收入的约16%。

这意味着,国内的商业化探索更像是在走钢丝:价格定低了,无法覆盖成本;价格定高了,将面临用户用脚投票,流向那些仍在“流血补贴”的竞争者。如何平衡,将是厂商们接下来面临的课题。

商业化的新故事

大模型为何在2026年商业化集体加速呢?问题不在一侧,而在多重压力同步叠加。

首当其冲的是算力成本。

“以前我们讲互联网的边际成本趋近于零,但在大模型时代,边际成本是恒定的,甚至随着上下文变长,成本是递增的。”一位AI从业者向记者指出。

2026年,谷歌、微软、亚马逊、Meta四家科技巨头在AI上的总投入预计达到7250亿美元,同比大增约77%;OpenAI披露2026年算力支出将达500亿美元。

而在国内,字节跳动2025年净利润同比下滑超过70%,净利润率也出现了大幅下滑。浙商证券测算,2025年字节跳动资本开支约1600亿元,其中900亿元用于AI算力采购。

而算力账单的支付与收入回笼之间存在显著的时间差。亚马逊在股东信中明确指出,2026年的资本支出将在2027年至2028年逐步变现。行业普遍面临投资带来的短期利润率压力。

这种“增收不增利”以及“投入过大”的局面,在资本市场是无法长久维系的。上述四家科技巨头在财报发布后股价走向分化,唯有变现路径最为清晰的谷歌说服了投资者。

而Token消耗的结构性变化更放大了成本压力。张鹏此前表示,现在的大模型处理复杂任务时,需要很长的推理链路、反复调试和修正错误,一个复杂任务消耗的Token量可能是简单问答的数十倍甚至百倍。

以豆包为例,其日均Token使用量在2026年3月已突破120万亿,三个月翻一倍,相比2024年5月首次推出时增长整整1000倍。这也被看作是豆包近期试水付费订阅模式最直接的原因。

与此同时,一级市场已经很难再为这种“吞金兽”的故事买单了。过去一年,国内AI赛道的融资额虽然在增长,但单笔融资的规模在缩小。动辄数十亿元甚至百亿元的算力投入,已经超出了大多数VC的承受范围。

因此,我们看到了一场“抢滩登陆”。智谱和MiniMax已登陆港股;月之暗面(Kimi)、阶跃星辰也被爆出已在筹备港股IPO。

对于上市或筹备上市的公司而言,资本市场的估值锚定需要可持续的商业数据作为支撑。在烧钱换增长的逻辑彻底失效之前,大模型厂商们必须讲出一个关于商业化的新故事。

Anthropic的案例很有说服力。这家公司在私募市场的隐含估值一度超过OpenAI,核心原因不是技术更强,而是B端渗透率更高——在部分美国企业的抽样中,Anthropic的付费客户占比达到30.6%。资本愿意为“能收钱”的公司支付溢价。

在国内,几家头部的AI公司都有着对标Anthropic的信心。摩根士丹利预计,头部模型单家ARR有望在2026年底达到10亿至15亿美元,2027年底进一步攀升至25亿至50亿美元,对应3-5倍的年化增速。

这场始于2026年春天的商业化加速,不过是一场新生存游戏的开始。

关注我们