文 | 超聚焦
火山引擎,想做独属于AI时代的云。
12月18日-19日,火山冬季原动力大会在上海召开,此次大会上,火山引擎正式发布了豆包大模型1.8版本,也将豆包图像创作模型Seedream更新至4.5版本,为用户们带来了更丰富的创作工具与更低门槛的AI应用落地方案。
不过,要说最被市场关注的,还得是火山引擎的token调用量。
而据火山引擎总裁谭待公布,截至今年12月,该模型的日均调用量已突破50万亿次,较去年同期增长超十倍,与发布初期相比更是实现了417倍的爆发式增长。
原动力大会
这也被市场认为是火山引擎良好“兑现”自己是云原生AI的最好例证。
不过,在大家都在为这张成绩单惊叹的背后,却也产生新的考量:呈几何倍数增长的Token消耗量,究竟能为火山引擎的报表贡献多少实实在在的营收?自我标榜为AI原生云的火山引擎,又能否利用AI跨过国内SaaS重人力的陷阱呢?
万亿Token, 到底能换回多少真金白银?
要理解火山引擎的野心,得先看清它的“出身”。
在国内云市场的牌桌上,火山引擎是个“异类”。它不同于阿里、腾讯这些背负着沉重“传统云”包袱的前辈,火山引擎几乎没有历史负担——它出生在移动互联网的黄昏,却刚好赶上了大模型的黎明。
这种“迟到”反而成了一种战略红利。因为没有老旧的数据中心架构需要兼容,火山引擎从第一天起就活得像个AI时代的特种兵:它不想做那种传统的、靠卖存储和带宽过日子的“包租公”,它想做的是MaaS(模型即服务)的绝对庄家。
这也是总裁谭待在各种场合反复布道的逻辑:火山引擎就是为AI而生的云,它的终极形态,就是卖模型调用,卖智能服务。
如今,市场确实买账了。50万亿次的日均调用量,不仅是一个让同行侧目的天文数字,更像是火山引擎在AI云赛道上跑通了第一条“高速公路”。但热闹归热闹,当烟花散去,理性的投资者和观察者终究会拿起计算器,算一笔最现实的账。
这50万亿Token的消耗,到底能给火山引擎带来多少营收?
我们可以从火山引擎今年披露的几组核心数据中,清晰地捕捉到这种近乎疯狂的扩张曲线。根据官方发布及市场公开数据,火山引擎豆包大模型的日均Token调用量呈现出了典型的指数型增长:
2024年12月:日均调用量仅为4万亿次。 2025年4月:迅速攀升至12.7万亿次。 2025年5月:达到16.4万亿次。 2025年8月:突破25.9万亿次。 2025年10月:稳步增长至30万亿次。 2025年12月:最终在原动力大会上宣布,日均调用量正式突破50万亿次。
而如果我们将这些点连接起来,并假设在统计区间内消耗量是平稳增长的,那么整个2025年,豆包大模型的Token消耗总量已经超过9000万亿,接近一万万亿。
但是,这看似庞大的数据,却没能转化为可观的收入,而其核心症结在于:Token的单价实在是太低了。
为了在群雄逐鹿的云市场中撕开一道口子,火山引擎在过去一年几乎是以“自杀式”的降价策略在横扫市场。
去年5月,火山引擎在业内首先开打价格战,把豆包主力模型的推理输入价格降至0.0008元/千tokens,较当时的行业价格下降了超过99%,而在之后的一年时间里,也延续了“崩溃式”降价的逻辑。
这种推倒重来的定价逻辑,虽然让火山引擎在极短的时间内吸引了海量用户,但也意味着它必须面对一个极其残酷的现实:Token已经从昂贵的“奢侈品”变成了廉价的“大宗商品”。
那么,2025年一万万亿Token,到底为火山引擎带来了多少收入呢?我们以火山引擎目前官网的单价为基准,经计算,在综合了在线推理、在线推理-上下文缓存、批量推理的价格后,可得出每千Token的价格大约在0.0009元附近。
按照目前该单价计算,这“一万万亿”次的年度总调用量,理论上能为火山引擎撑起近百亿规模的营收空间。
然而,这90亿元绝非最终落袋的真金白银。
在市场推广的初期,为了跑马圈地,绝大多数的Token其实都是被“免费送出”的。在激烈的价格战和生态补贴下,真正产生扣费的付费流量比例极低。如果我们大胆假设收费Token仅占总量的10%,那么火山引擎2025年实际的MaaS收入仅为9亿元左右。
和MaaS收入形成鲜明对比的是,2025年火山引擎营收已经超过了200亿元(约为240亿至250亿左右)。
这意味着,尽管Token调用量在官方口径里显得气势磅礴,但在现阶段,火山引擎营收的压舱石依然是IaaS、PaaS和算力租赁业务,而非纯粹的AI调用。
这种“头重脚轻”的数据结构清晰地表明:AI原生云的理想很丰满,但商业化的现实依然骨感。
所以,在即将到来的2026年,火山引擎必须要面对的一个问题是,当Token彻底沦为像电力一样的廉价基建后,如何能快速推动Token消耗继续指数级增长,通过规模效应来让MaaS成为真正的营收支柱,成为谭待向市场描绘的那个火山引擎?
当Agent遇上传统甲方, 火山引擎也要派人驻场?
如果说卖Token是卖电力,那么火山引擎通过扣子(Coze)等平台力推的Agent,就是想直接卖给客户一套“自动化工厂”。
在谭待的蓝图里,理想的路径是极其轻盈的:火山引擎搭建好底座和工具,客户只需像搭积木一样,在平台上自行开发出适配业务的Agent。这本质上是在重塑SaaS的交付逻辑,从过去的“厂商喂到嘴里”,变成现在的“客户自给自足”。
然而,在国内的商业土壤上,这种“轻盈”往往意味着某种巨大的挑战:你如何说服一个习惯了“看人头付费”的甲方,转而为一套看不见摸不着的算法逻辑买单?
国内SaaS行业过去十年跌过的最深的坑,就是“非重人力投入不付费”的怪圈。由于国内软件付费意愿长期处于低位,为数不多愿意掏钱的企业客户,往往信奉一种极其朴素的逻辑:我花了钱,就得看到你的人。
于是,我们看到无数标榜标准化的SaaS厂商,最后都活成了“装修外包队”。
为了拿下一个大单,乙方往往要派出一支庞大的交付团队,背着电脑进驻甲方场地,陪着对方熬夜改代码、调接口。这种“人头攒动”带来的安全感,曾是国内SaaS能够成交的心理基石。
这种模式不仅重,而且极其低效。一旦进入项目制,原本边际成本递减的软件生意,就变成了边际成本恒定的体力活。火山引擎作为“后来者”,深知如果跟着其他云厂去卷这种“人肉交付”,不仅难以反超,更会让自己标榜的“AI原生”底色消失殆尽。
所以,火山引擎的策略是“工具化反击”。它推出来的不仅是大模型,还有一整套Agent开发套件。它的潜台词是:别再找我们要几百个工程师了,给你们一个足够好用的工具,你们自己的员工就能搞定。
但这正是矛盾的焦点所在。习惯了“饭来张口”的甲方,很难在短时间内迅速适应这种从“买方案”到“学工具”的身份转变。对于大多数传统企业来说AI依然是个黑盒,Agent的开发虽然门槛降低了,但“能跑通”和“能落地业务”之间,依然隔着万水千山。
更何况,Agent作为一个新生事物,其稳定性、逻辑闭环以及对复杂商业场景的理解,正处于“半成品”向“成品”进化的阵痛期。想要让一个刚出炉的Agent达成过去由几十个程序员、产品经理手工打磨出来的SaaS软件水平,本身就是一件极难的事情。
当甲方发现自己折腾了半天出来的Agent还是“人工智障”时,他们最自然的反应依然是:火山引擎,你们能不能派点懂行的人来帮我调优一下?
这就产生了一个巨大的悖论:火山引擎越是想推行标准化、低门槛的Agent,就越是发现,在实际落地的“最后一公里”,依然需要大量专业人员进场去填平技术与业务之间的鸿沟。
而如果火山引擎不能在技术上实现真正的“类人级交付”,或者不能培养出一个庞大的、能够替它分担体力活的第三方合作伙伴生态,那么它标榜的AI原生云,极有可能在向深水区迈进时,身不由己地重新掉入那个“为了赚一百块,得堆十个人”的重人力怪圈。
届时,支撑日均500、5000万亿调用量的,或许不再仅仅是后台同步跳动的服务器,还有台前无数疲惫奔波的交付工程师。这种“新瓶装旧酒”的局面,恐怕不是谭待想要向市场交出的最终答卷。
火山引擎想做AI时代的云,这确实是一个性感的愿景。但从“万亿Token”的狂欢转向“实打实利润”的深耕,这条路上的硬仗才刚刚开始。
当技术的神话遇上商业的常识,火山引擎需要证明的不仅是它的模型有多快,更是它对国内商业生态的耐力有多强。



































