词元 (Token) 和词元经济

本刊记者 孙庭阳 姚坤

随着OpenClaw(即大家俗称的“龙虾”)火爆出圈,以及一众国产智能体的火速跟进,词元(Token)也很快成为朋友圈和新闻标题高频词汇。

词元究竟是什么?

词元是大模型处理信息的最小单元,大模型的计算成本,本质上取决于处理文本的计算量,词元是基础指标。

举个简单的例子,你向大模型提问,就是你在向大模型输入信息,你的问题越长、表达得越详细,则你向大模型输入的词元越多;反之亦然,大模型回答你的问题,是大模型在向你输出信息,大模型回答得越长、越深入细致,则大模型向你输出的词元越多。

大模型在面对普通用户简单的一问一答时,几乎都是免费的。比如,你向AI提问“我准备把旧笔记本电脑卖二手,如何清除里面的数据”,AI给你答案时并不会收费,所以很多人对词元消耗不敏感。

但当企业用户或专业用户需要用到大模型更复杂的功能时,比如近两年流行的Vibe Coding(可以简单理解为利用AI为自己编程),大模型几乎都是要收费的。

现在的大模型已经进化到你提出“帮我写一个在浏览器里玩的俄罗斯方块游戏”,它就输出上百行代码,给你一个马上可玩的游戏。当然,专业用户的需求比这复杂得多,比如OpenClaw本身就是Vibe Coding的产物,代码量达到几十万行,即大模型输出了海量词元。

另外,据OpenClaw作者Peter Steinberger透露,他在用AI编程时通过语音输入指令,最夸张的时候曾因话说得太多而失声,可见专业用户向大模型输入的词元量也不容小觑。

在上述这类收费场景中,大模型分别计算输入词元费用和输出词元费用,向用户收费。

中文大模型中,1个汉字约为1.5—2个词元,标点和空格也算入词元量。输出词元的数量、价格一般都超过输入词元。大家对比不同大模型价格时,通常对比输出词元价格。

词元经济快速升温

今年3月,中国日均词元调用量已突破140万亿。这一数据近两年呈指数级上升。2024年初,调用量为1000亿;2025年底,跃升至100万亿,两年增长超千倍。

词元是大模型处理信息的最小单元,具有可计量、可定价、可交易的特征。其不仅是智能时代的价值锚点,更是连接技术供给与商业需求的“结算单位”,为商业模式的落地提供了可量化的可能。

今年1月底以来,有的大模型企业创下20天收入超越2025年全年总收入的业绩纪录。

这些数字背后,是一套以词元计费为基础的新型商业逻辑正在加速演进。围绕词元的调用、分发与结算,一套新的价值体系加速演进形成,成为人工智能产业商业化的重要路径。

在词元经济中,同样少不了供求关系影响价格。

今年4月18日,阿里云AI算力将涨价5%—34%,原因是全球人工智能需求爆发、供应链涨价,行业核心硬件采购成本显著上涨。

在词元经济中,用户也要对比词元性价比。

不同大模型词元价格透明,在满足需求情况下,用户优先选择性价比高的大模型。

截至3月中旬,在全球最大AI模型API聚合平台 OpenRouter上,全球调用量前5名大模型中,3名来自中国。全球用户如此爱用中国大模型,很重要原因是中国大模型和中国词元性价比高。

研究词元经济,更少不了成本核算。

大模型企业的成本中,除了硬件,电力成本同样有“发言权”。

通常而言,大模型企业数据中心的计算成本中,硬件约占45%—50%、电力是30%—40%、软件与运维成本20%—25%。

中国电费比美国普遍便宜50%左右,一些西部地区还能更低,“量大管饱”。2025年,我国全社会用电量历史性突破10万亿千瓦时,高于欧盟、俄罗斯、印度、日本全年用电量总和。

我国已建成全球门类最全、规模最大的能源体系,能源生产总量全球占比超1/5。“十四五”以来,能源自给率保持在80%以上,能源消费增量90%以上由国内自主保障。还有,我国每用3度电,就有1度多是绿电。

2026年,我国还要“实施超大规模智算集群、算电协同等新基建工程,加强全国一体化算力监测调度”。

人工智能时代,特斯拉首席执行官马斯克喊话全世界,未来的货币本质上将是“瓦特”。电力,俨然已成为人类社会未来发展的“硬通货”。

当全世界调用中国大模型,数据跨洋到达中国数据中心,中国的电力完成推理,结果再传回调用方。价值通过词元形成了结算。


顶部