今天看到一组数据,挺有意思的。《纽约时报》DealBook专栏发了一篇关于Ant

末号来看科技 2026-05-30 20:00:46

今天看到一组数据,挺有意思的。

《纽约时报》DealBook专栏发了一篇关于Anthropic的深度报道,里面引用了OpenRouter平台的数据,画了两张折线图。

第一张图,是Anthropic在OpenRouter上的Token消耗份额变化。从2025年初接近50%的占比,一路滑到现在的15%左右。

如果只看这张图,你可能会觉得,这家公司是不是不行了?

但第二张图,说的是同一时间段内,Anthropic在美国企业付费AI订阅中的市场份额,从接近于0一路飙升到将近35%,几乎追平了OpenAI。

Token消耗在减少,但这家公司赚的钱反而多了?这不是自相矛盾吗?

其实,这两张图揭示的可能不只是Anthropic一家公司的故事,而是整个AI行业正在经历的一次底层认知转变:我们一直在用的那把衡量AI价值的尺子,可能不太好使了。

1、Token衡量的到底是什么?

Token为什么会被当成衡量AI公司的标准?

大模型跑一次任务,要消耗Token;Token用得越多,说明模型被使用得越频繁,说明这家AI公司越有价值。

这个逻辑早期确实是成立的,那时候模型能力差不多,效率也差不多,你能让用户多跑任务、多烧Token,确实说明产品有吸引力。

但现在情况变了。

首先,模型在变聪明。以前需要好几轮对话才能完成的任务,现在一轮就搞定了。Token消耗量反而下来了,但用户得到的价值一点没少,甚至更多。

其次,多模型路由在分流。像OpenRouter这样的平台,开发者可以根据任务类型灵活切换模型,Token消耗被分散到了不同的供应商头上。单看某一家的Token份额,已经不能反映真实的市场地位了。

还有,Agent也在改变游戏规则。当AI不再只是的聊天工具,而是能自主完成一整个任务链的智能体时,Token的消耗模式就变了。

可能一次消耗很少,但完成的任务价值非常高。说白了,Token衡量的是投入,不是产出。

2、那什么指标更接近价值本质?

这个问题我之前没想太明白,直到前段时间看了百度Create 2026开发者大会上李彦宏的发言。

他提出了一个概念叫DAA,Daily Active Agents,翻译过来就是"日活智能体数"。简单说就是:每天有多少个Agent在替人干活、交付结果。

为什么这么说?Token衡量的是消耗,DAA衡量的是交付。一个看投入端,一个看产出端。这两个视角得出的结论可以是完全不同的。

还是拿Anthropic的数据举例。如果用Token份额来衡量,它在OpenRouter上的存在感确实在下降。

但如果换一个视角,看它的Agent渗透了多少企业的核心工作流、每天在替多少人完成实际任务——结论就反过来了。

报道里提到一个细节:Claude Code已经渗透进了Uber超过84%的工程师的日常工作。这意味着每天有大量的Agent在替这些工程师写代码、做Review、处理任务。Token消耗可能并不高,但这些Agent交付的价值是实打实的。

这让我想起李彦宏在大会上说的一段话,大意是Token代表成本不代表收益,它衡量的是投入而不是产出。

当行业进入智能体时代,真正该关注的是有多少Agent在给人干活、交付结果。

3、PV→DAU→DAA

我自己捋了一下,其实每次技术产业的度量衡发生变化,背后都对应着一次认知的升级。

互联网早期看PV,因为那时候「有人来看」就是最大的价值。后来发现光看浏览量不行,得看「有多少人真的在用」,于是转向了DAU。

DAU一统天下之后,整个互联网行业的竞争逻辑都变了,不再拼页面多不多,而是拼用户留不留得住。

AI行业现在正在经历类似的转变。Token消耗量在早期是一个合理的参考,就像PV在互联网早期一样。

但当模型效率持续提升,当Agent开始替人完成任务而不只是回答问题,「消耗量」这个指标就越来越不能反映真实的价值创造了。

DAA的提出,本质上是把关注点从「AI消耗了多少资源」转向了「AI交付了多少成果」。

而且我觉得DAA还有一个好处,它天然跟商业价值挂钩。一个Agent每天在替人干活,说明它创造了真实的价值,用户自然愿意为此付费。这比单纯看Token消耗量,离商业化的逻辑更近。

当然,我也在想一个问题:这组折线图反映的现象到底是个别情况,还是整个行业的趋势?

从最近的一些信号来看,应该不止是个例。模型效率在整个行业范围内都在提升,多模型路由和Agent架构也在快速普及。

也就是说,「用更少Token交付更多价值」这件事,可能正在行业层面系统性地发生。

4、度量衡的迁移不会一夜之间完成

那么,Token作为度量衡有没有价值?当然有。它在现阶段仍然是行业内最通用的参考指标之一,短期内也不会被完全替代。

DAA这个概念虽然方向对了,但它的计算标准、统计口径、行业共识,都还需要时间去建立和完善。

《纽约时报》这两张折线图,反映出Token消耗份额下滑和商业价值暴涨可以同时发生。而李彦宏在这个时间点提出DAA,给了行业一个值得认真思考的新方向。

度量衡这件事,从来不是谁"发明"了就能定下来的,它需要市场来验证。但当越来越多的数据指向同一个结论时,共识的形成可能比我们想象的要快。

0 阅读:2
末号来看科技

末号来看科技

感谢大家的关注