Token价格分化,豆包加速商业化丨记者观察

2026年06月02日 18:47   21世纪经济报道 21财经APP   雷晨
国内大模型市场呈现Token价格分化:通用模型技术降本致降价潮,高端模型凭复杂任务能力溢价;豆包推C端分层订阅制,行业迈向价值付费新阶段。

21世纪经济报道记者雷晨

5月下旬,国内大模型市场呈现明显价格分化。通用模型依托技术优化持续下调Token调用价格,同质化赛道持续降价;主打高算力、复杂任务的高端模型逐步形成能力溢价。叠加字节豆包即将上线C端付费体系,行业正式形成通用降价、高端溢价、终端分层付费的新格局。

近期通用模型降价动作密集落地。5月22日,DeepSeek宣布V4-Pro模型永久2.5折,整体降幅75%,百万Token输出价格为6元。5月27日,小米MiMo-V2.5系列调价,特定规格最高降幅99%,取消输入长度分级,统一全场景Token定价;5月30日,小米公开本轮降价的工程技术方案,说明本次降价核心依托技术优化实现降本。

与此同时,头部应用商业化付费体系加速落地,且走出了差异化的计费模式。5月初,豆包App Store页面出现付费版本服务声明。声明称,为更好地服务专业用户,豆包将在免费版的基础上,推出包含更多增值服务的付费版本。6月1日,知情人士透露,字节旗下豆包计划于6月下旬正式落地商业化付费体系,相关细则或将在火山引擎Force大会期间对外披露。

过去两年,国内大模型行业以发动Token价格战的方式争夺开发者与用户。进入2026年,行业定价逻辑重构:同质化通用模型价格持续下行,具备复杂推理、长文本处理、Agent运行能力的高端模型开始出现溢价,市场从单一低价竞争,转向分层定价的精细化竞争模式。

两轮降价周期,从补贴竞争到技术降本

行业先后经历两轮性质完全不同的降价周期。2024年上半年为第一轮降价周期,行业模型产品能力趋同,厂商主要依靠低价、免费额度、补贴吸引开发者,扩大生态规模。这一阶段的低价策略主要依靠企业资金与集团资源支撑,并非技术降本带来的成本下行。

2026年开启的第二轮降价,逻辑发生实质性转变。虽然仍有厂商依靠资源补贴维持低价,但主流厂商已通过模型架构、推理工程优化降低单Token成本,降价具备技术支撑,可持续性更强。

补贴式降价空间有限、依赖资金输血;技术降本可通过推理效率、算力利用率、缓存机制迭代持续优化成本,是当前行业核心降本路径。

市场供需分层是价格分化的核心原因。当前通用模型供给过剩,同质化竞争激烈,价格持续承压;适配复杂任务、行业定制场景的高端算力与模型供给偏紧。

瑞银证券分析师熊玮表示,高价值场景优质Token需求偏紧,头部客户复杂任务算力需求难以被充分满足。厂商单纯低价走量,不仅压缩利润,还可能影响服务稳定性。

需求结构变化进一步放大市场差异。企业端AI智能体落地,带动多步骤推理、工具调用、复杂任务场景增多,此类场景Token消耗远高于普通问答。熊玮判断,AI产业进入规模化落地阶段,市场Token整体需求将持续增长。

降本路径差异化,催生多元定价体系

价格分化的背后,是厂商推理效率与降本技术的路线差异。大模型推理成本高度依赖上下文缓存,在长对话、长文本场景下显存占用高、并发低、成本高。针对这一痛点,国内厂商形成两套差异化优化路径,也形成了不同的定价能力。

DeepSeek采用架构优化降本,V4系列通过MLA多头潜在注意力、MoE混合专家架构,优化显存占用、提升长文本场景并发能力,降低单次推理成本。

有分析师指出,国内厂商更侧重工程落地与成本控制,形成了模型价格下行快、性能差距可控的市场特征。

小米MiMo-V2.5主打缓存精细化治理,通过滑动窗口注意力机制筛选有效上下文,搭配全新缓存与调度策略,将线上前缀缓存命中率稳定至93%,减少重复算力损耗。这也是其取消输入长度分级、统一Token定价的技术基础,有效简化开发者计费成本。

与通用模型降价相反,高端复杂任务模型实现价格溢价。月之暗面Kimi主打长文本、复杂代码、Agent自主运行场景,K2.6版本强化复杂任务处理能力,可完成高时长、高复杂度连续任务,依托场景价值实现API价格小幅上调。月之暗面创始人杨植麟在2026年3月中关村论坛上公开表示:“在模型能力趋同的前提下,开源模式具备绝对优势。开源是和生态系统合作共赢,能让各方在Token规模增长中共同获益。”

豆包商业化路径与Kimi的B端溢价模式不同,以C端平台运营为核心,并未单一依赖B端Token售卖。本次付费落地,豆包采用的是行业通用的基础免费、增值订阅模式,脱离了纯按量计费逻辑。

具体来看,豆包基础功能免费开放,长文档解析、数据分析、AI视频生成等高算力功能,通过会员订阅收费,不按单次Token消耗计费。同时,豆包可联动抖音电商、本地生活、广告等字节生态业务,订阅收入仅为其商业化布局的一部分。

行业商业化迈入深水区,价值付费成共识

本轮价格分层与付费落地,标志着AI商业化逻辑切换。行业逐步告别传统流量变现,转向算力消耗、实际落地价值变现,Token按量计费、API服务、会员订阅成为主流商业化形态。

瑞银方锦聪认为,企业采购AI服务核心是为了降本提效,而非消耗流量。B端Token计费适配企业复杂算力需求,C端订阅匹配个人生产力需求,两类模式覆盖不同市场场景,拓宽了行业商业化空间。

目前行业商业化路径清晰,但规模化落地仍存阻碍。熊玮援引EvidenceLab调研数据指出,国内企业AI支出仅占整体IT预算的12%,核心制约并非预算不足,而是AI落地投入产出比难以量化。

该问题具备全球性共性。瑞银数据显示,78%的企业已进入AI实际部署阶段,但受限于场景适配、价值量化难题,Agent规模化落地仍需约1.7年的迭代周期。

随着价格战减弱、分层定价成型,大模型行业竞争进入新阶段。行业竞争不再依赖低价优势,厂商的场景落地能力、价值兑现能力与降本能力,将成为后续行业竞争与洗牌的核心依据。

关注我们