“AI免费”退场？算力账单压顶，大模型厂商谋变

涨价和收费，不得不面临的选择

21世纪经济报道记者董静怡

豆包开始收费了。

中国月活最高的AI应用，“五一”期间悄然在应用商店更新了订阅计划。三档价格——标准版连续包月68元、加强版200元、专业版500元——像三颗石子投入平静湖面，行业里“补贴”“免费”的市场氛围，正在走向终点。

过去两年，豆包一直扮演着激进的补贴者角色，用几乎零门槛的方式把大模型推向了数亿用户。但算力成本正在成为沉重的包袱。数据显示，豆包的日均Token使用量三个月翻了一倍，突破120万亿，背后是字节跳动千亿级的资本开支，以及净利润超过70%的同比下滑。

没有哪家大模型厂商可以永远回避这个问题。近段时间，国内外大模型厂商们几乎是在以“周”为单位刷新纪录，表面的技术跃进之下，是算力账单压顶之下的生存焦虑。

4月底，OpenAI发布GPT-5.5，比上一代贵了一倍。国内，智谱一个月内两次提价，Kimi输入价格上涨58%。涨价和收费，成了行业不得不面对的现实选择。

过去的一个月，可以被定义为大模型的“超级更新月”。但相比以往单纯刷榜的狂欢，这轮发布的底色更为务实，几乎都指向了特定的应用场景或商业回报。

4月底，OpenAI发布了其最新一代大模型GPT-5.5，面向复杂工作与智能体，输入定价为5美元/百万Tokens，输出定价为30美元/百万Tokens，比GPT-5.4整体贵了一倍。Pro版本价格更高，输入价格为30美元/百万Tokens，输出价格为180美元/百万Tokens。

随后，它又在发布至今的短短两周内发布两个版本：针对网络安全任务进行优化的GPT-5.5-Cyber和面向C端的免费模型GPT-5.5 Instant，同时上线测试版ChatGPT自助广告管理器。

在OpenAI的商业考量里，通过旗舰版（Pro）服务高价值付费用户和企业，通过免费的Instant版巩固庞大的用户基础，并借助广告等方式探索变现。每个新版本都背负着明确的商业化目标。

一直面向企业市场的Anthropic也在4月发布Claude Opus 4.7，软件工程领域显著提升，距离上一代发布仅间隔两个多月。面对OpenAI等竞争对手向B端市场的进攻，Anthropic的步伐需要迈得更快。

再看国内。4月初，智谱公布了今年以来的第三次提价计划，发布新一代旗舰模型GLM-5.1的同时提价10%，而其距离上次调价30%起仅一个月。4月下旬，Kimi发布K2.6，API输入价格从0.60美元/百万Tokens上调至0.95美元/百万Tokens，涨幅58%。

虽然提价，市场仍然火热。据国家数据局3月披露，我国日均Token调用量已突破140万亿，相比2024年初增长了1000多倍。在智谱2025年业绩说明会上，智谱CEO张鹏也表示，2026年一季度智谱的API调用定价提升83%，即便如此，市场依然呈现出供不应求的情况，调用量增长400%。

C端市场，“免费”和“补贴”的呼声也渐渐平息了。作为中国月活最高的AI应用，豆包也在日前启动了付费订阅测试，推出了标准版（68元/月）、加强版（200元/月）和专业版（500元/月）三档方案。

当然，字节的做法并非简单的“割韭菜”。其细节显示，基础聊天依然免费，付费点集中在PPT生成、数据分析、视频制作等“重算力”场景。

摩根士丹利在一份报告中指出，作为中国消费级AI赛道最激进的补贴者，豆包此举释放出重要的行业信号：中国消费者AI使用习惯的培育阶段已基本完成，行业正从用户补贴转向商业可持续性。

然而，需要承认，中国用户的付费意愿与收入水平的错位也是客观存在的。500元的月费占中国居民人均可支配月收入的约16%。

这意味着，国内的商业化探索更像是在走钢丝：价格定低了，无法覆盖成本；价格定高了，将面临用户用脚投票，流向那些仍在“流血补贴”的竞争者。如何平衡，将是厂商们接下来面临的课题。

大模型为何在2026年商业化集体加速呢？问题不在一侧，而在多重压力同步叠加。

首当其冲的是算力成本。

“以前我们讲互联网的边际成本趋近于零，但在大模型时代，边际成本是恒定的，甚至随着上下文变长，成本是递增的。”一位AI从业者向记者指出。

2026年，谷歌、微软、亚马逊、Meta四家科技巨头在AI上的总投入预计达到7250亿美元，同比大增约77%；OpenAI披露2026年算力支出将达500亿美元。

而在国内，字节跳动2025年净利润同比下滑超过70%，净利润率也出现了大幅下滑。浙商证券测算，2025年字节跳动资本开支约1600亿元，其中900亿元用于AI算力采购。

而算力账单的支付与收入回笼之间存在显著的时间差。亚马逊在股东信中明确指出，2026年的资本支出将在2027年至2028年逐步变现。行业普遍面临投资带来的短期利润率压力。

这种“增收不增利”以及“投入过大”的局面，在资本市场是无法长久维系的。上述四家科技巨头在财报发布后股价走向分化，唯有变现路径最为清晰的谷歌说服了投资者。

而Token消耗的结构性变化更放大了成本压力。张鹏此前表示，现在的大模型处理复杂任务时，需要很长的推理链路、反复调试和修正错误，一个复杂任务消耗的Token量可能是简单问答的数十倍甚至百倍。

以豆包为例，其日均Token使用量在2026年3月已突破120万亿，三个月翻一倍，相比2024年5月首次推出时增长整整1000倍。这也被看作是豆包近期试水付费订阅模式最直接的原因。

与此同时，一级市场已经很难再为这种“吞金兽”的故事买单了。过去一年，国内AI赛道的融资额虽然在增长，但单笔融资的规模在缩小。动辄数十亿元甚至百亿元的算力投入，已经超出了大多数VC的承受范围。

因此，我们看到了一场“抢滩登陆”。智谱和MiniMax已登陆港股；月之暗面（Kimi）、阶跃星辰也被爆出已在筹备港股IPO。

对于上市或筹备上市的公司而言，资本市场的估值锚定需要可持续的商业数据作为支撑。在烧钱换增长的逻辑彻底失效之前，大模型厂商们必须讲出一个关于商业化的新故事。

Anthropic的案例很有说服力。这家公司在私募市场的隐含估值一度超过OpenAI，核心原因不是技术更强，而是B端渗透率更高——在部分美国企业的抽样中，Anthropic的付费客户占比达到30.6%。资本愿意为“能收钱”的公司支付溢价。

在国内，几家头部的AI公司都有着对标Anthropic的信心。摩根士丹利预计，头部模型单家ARR有望在2026年底达到10亿至15亿美元，2027年底进一步攀升至25亿至50亿美元，对应3-5倍的年化增速。

这场始于2026年春天的商业化加速，不过是一场新生存游戏的开始。

相关新闻