21世纪经济报道记者 雷晨 武汉报道
“目前龙虾消耗的Tokens,有一大半都是无谓的探索。”火山引擎总裁谭待4月2日在AI创新巡展·武汉站上对21世纪经济报道等媒体指出。他以解数学题类比:枚举法也能得出答案,但计算量庞大,龙虾完成任务时会尝试各种解法,有时会很惊艳,缺点是会有大量无效的浪费。
谭待认为,企业应当关注“完成一件事情的整体花费”,而非单Token价格,单Token成本低,如果用较差的模型需要消耗10倍甚至20倍Token还做不出结果,只会造成浪费。
针对部分云厂商近期提价的举动,谭待表示:“涨价只是部分厂商的行为,也有厂商在降价。Tokens的价值不同,价格也不同。”下一代模型能力更强,单Token成本理论上会更贵,但单Token产生的经济价值也会更高,“就像买手机、芯片看单算力成本一样,ToB领域也是这个逻辑”。
据其介绍,火山引擎每一代模型的定价都经过精心设计,新一代模型能力更强,但结合智力水平看,单Token价格实际在下降。例如豆包2.0 Lite版本性能远超之前的1.8 Pro,定价却更低。
谭待指出,以前企业多模型混用,是因为各模型能力相差无几;当有模型足够优秀时,大家自然会选择最好的那个。“就像在Coding相关平台上,大家都会选择最好的几个模型,即便收费贵也会使用。”
他以视频生成模型Seedance 2.0为例,该模型的API直到武汉巡展才正式公测,此前主要供给C端产品“即梦”,导致用户集中、排队严重。企业客户为了批量生产,不得不用多个小账号排队。API开放后,企业可以直接购买批量调动能力,“生产效率会进一步提升”。用Seedance 2.0以低成本、高效率制作内容,在广告营销、内容制作上获得更多收入,“一旦这个商业逻辑跑通,企业对模型的要求就会转向价值导向”。
版权保护方面,Seedance 2.0 API延迟公测的另一原因是需要先搭建完善的版权保护系统。谭待透露,火山引擎基于豆包强大的视觉理解(VLM)能力,打造了一套全新的版权IP保护机制,能够识别一个人物十年前、年轻时的样子,以及穿古装、现代装、素描版、漫画版等不同形态。
从Token调用分布来看,视频创作和Agent场景已成为新的增长主力。谭待透露,目前Token消耗涨势快源于两个因素:一是视频创作,所有行业都有营销需求,视频内容是最好的载体,视频生成的Token消耗增长显著;二是“龙虾”类产品(即OpenClaw类智能体)的普及,让每个员工都能用AI处理招聘、周报、市场分析等任务。
截至2026年4月,豆包大模型日均Token消耗已从去年底的约63万亿增长至120万亿,涨幅接近一倍,春晚赞助、多模态模型推出以及“龙虾”类产品的普及是主要推动力。
在安全层面,火山引擎做了大量工作,包括对提示词、Agent运行环境、skill的检测,并获得了信通院的两项相关认证,是国内唯一同时获得这两项认证的厂商。此外,火山引擎还推出了AI机密计算(AICC)方案,核心原理是端到端加密,叠加CPU和GPU的TEE环境,确保解密后的明文仅在芯片受保护环境中运行。
谭待认为,AI私有化是行不通的:“私有化部署一个模型,可能3个月就过期了,芯片等硬件的生命周期也很短。”企业AI转型应通过公有云方式,而AICC解决数据安全问题,权限问题则通过零信任方式解决。
据IDC在2025年9月发布的《中国大模型公有云服务市场分析,2025H1》报告,2025年上半年,中国公有云上大模型调用量达536.7万亿Tokens,较2024年全年增长近400%。其中,火山引擎以49.2%的市场份额位居第一,阿里云百炼平台以27%排名第二,百度智能云千帆平台以17%位列第三。
谭待强调,IDC的统计口径为“各大云厂商对外部客户提供的大模型公有云服务调用量,不包含自有业务调用”,所有厂商都按这一标准上报数据,只有把内部调用排除在外,才能真实反映MaaS面向企业客户的商业落地情况。
关于“各家平台是否会形成只开放给自己线下生态的封闭局面”,谭待明确回应:“绝对不会。就像做APP会适配多个平台一样,类龙虾产品也会面向各类生态开放。”他透露,火山引擎已与ClawHub官方合作搭建中国镜像站,而非做私有生态。对于微信、公众号、邮箱等外部产品的对接问题,谭待认为这是行业趋势:“未来更多人愿意使用harness的框架,现有软件就一定会拥抱这个生态,要么提供skills、plug in,要么提供CLI。”
谭待用马拉松比喻行业阶段:“现在大概跑了一公里左右。”他判断的方法是用终局倒推,看所有Tokens能产生的收入规模,再看当前实际收入,二者的比值对应到42公里马拉松中。从全球OpenAI、Anthropic等企业的收入来看,行业仍处于极早期。
关于商业化目标,谭待透露去年已经修改了商业计划,将目标提升了不少,“按照现在的发展速度,目标大概率会提前实现”,但目前还没有做3年的盈利规划。
对于当前部分厂商调整收费逻辑,如配额制、订阅制等,谭待认为订阅制本质还是按Token收费,只是提前购买积分。他判断,OpenClaw这类通用型平台适合按Token收费,因为应用场景广泛,无法统一定义效果和成本;但未来可能会孵化出垂直领域的智能体,比如客服智能体,就可以按回答问题的数量收费,按效果付费。“但这种按效果的计费模式只适用于垂直领域,通用型产品还是要以Token收费为主。”
关于“龙虾”类产品是否适合普通人,谭待表示认同:“大部分普通人使用豆包APP就足够了。豆包APP现在的功能越来越多,比如专家模式、制作PPT等,都非常好用。”他认为,“龙虾”的受众主要是企业员工、个人开发者和极客,但这个人口基数也高达数亿,市场规模并不小,而且两者使用场景不冲突。
至于“龙虾”是否会被更先进的技术取代,谭待用电脑发展史上的软盘作类比:“每一项新技术的出现,都会推动整个AI技术向前发展。未来到了AGI时代,再回看今天的定位,现在很难判断。但可以肯定的是,这类产品正在推动行业进步。”

