中国TOKEN出海爆发:Openclaw带火国产模型,反超美国真实吗?

一张桌面俯视画面:摊开的世界地图上标着“中国→海外”的箭头,旁边放着写有“TOKEN”“Openclaw”的便签、小算盘与电路板符号,暗示价格与流量出海,羊皮纸,钢笔彩色手绘的统一风格。

Openclaw带动的中国 TOKEN 出海,会不会压垮美国 AI 公司的嵌套游戏呢?

大家好,欢迎收听老范讲故事的 Youtube 频道

中国 TOKEN 出海:一个全新的叙事

排行榜式画面:一块写着“Openrouter 排行榜”的黑板,上面用柱状条标出 Minimax、Kimi、GLM、Deepseek 的 TOKEN 体量与增长百分比,角落用小字写“价格 1/10~1/20”,羊皮纸,钢笔彩色手绘的统一风格。

中国 TOKEN 出海是一个全新的叙事。Openrouter 上面做了一个最新的排行榜统计:

  • 第一名 Minimax M2.5,单周 2.45 万亿 TOKEN,环比增长 197%
  • 第二名月之暗面 Kimi K2.5,单周 1.21 万亿 TOKEN
  • 第三名智谱 GLM5,单周 0.87 万亿 TOKEN,环比增长 158%
  • 第五名 Deepseek V3.2

这四款模型合计贡献了前五名调用量的 85.7%。第四名咱们刚才没讲,是 Claude Opus4.6,用的也是很多的。第九名是千问 3.5 PLUS。

这是中国大模型在上面上榜的这些。中国 TOKEN 的价格只是美国同样 TOKEN 的 1/10 到 1/20。特别贵的就是 Claude Opus4.6,非常非常贵。

整体占比方面,平台前十名的模型 TOKEN 消耗量是 8.7 万亿,中国模型占 5.3 万亿,占比高达 61%。2 月第三周中国模型周调用量达到了 5.16 万亿 TOKEN,三周暴涨 127%;同期美国模型仅 2.7 万亿 TOKEN,实现历史性的反超。

谁在用这些 TOKEN:增长来自海外开发者

人群与地球仪的画面:地球仪上美国区域被高亮,旁边站着不同肤色的开发者在敲键盘,气泡标注“US 47.17%”“CN 6.01%”,箭头指向“中国模型份额暴涨”,羊皮纸,钢笔彩色手绘的统一风格。

那么谁在用这些 TOKEN 呢?是不是中国人在用?不是。Openrouter 是一个美国公司,用户结构的话,该平台的美国用户占比是 47.17%,中国开发者仅占 6.01%。增长核心来自于海外开发者的主动选择。

而在一年前,中国模型在该平台上份额不足 2%,现在这个数突然就暴涨了。Openrouter 之外,其他的同类平台也都出现了中国模型渗透率激增的情况,中国 TOKEN 出海的叙事就这么来了。

你看我们卖电器给你、我们卖手机给你、我们卖电动车给你,我们现在直接卖 TOKEN 出去,多爽。我们的电便宜,我们的 TOKEN 便宜,我们的大模型特别好,所以这又是一次赢麻了的故事。

中国的 AI TOKEN 现在到底是不是碾压全球了呢?真是这样的吗?先说结论:还真的是大差不差,是这么回事。但是具体情况可能要比“赢麻了”这种说法稍微复杂一些,咱们来仔细说一下。

今天的故事:六段结构

  • 第一段,带动中国大模型起飞的就是 Openclaw 大龙虾
  • 第二段,Openrouter 等代理商其实是给自己留下了后门,偷偷在使用中国算力
  • 第三,使用中国机房里的算力有可能会带来的问题
  • 第四,两大中国 TOKEN 的海外生产基地都在什么地方
  • 第五,美国算力的嵌套游戏是不是可能会崩盘
  • 最后,我们能做点什么

第一段:Openclaw(大龙虾)带动中国大模型起飞

一只穿着“工程背心”的大龙虾推动巨大的齿轮与数据带,齿轮上刻着“Minimax / Kimi / GLM / Qwen”,数据带上写“agent”“MOE”“多模态”,象征 Openclaw 带动模型调用,羊皮纸,钢笔彩色手绘的统一风格。

首先,带动中国大模型起飞的就是大龙虾 Openclaw。现在 Openclaw 实在是太火了。中国新的一批模型确实也有巨大的提升,比如 Minimax 的 M2.5、Kimi K2.5、智谱的 GLM5、千问 3.5 以及豆包 Seed 2.0。

这一批新的模型都是在春节前后发布的,它们都是原生多模态,就是直接可以认识图片,直接可以输入视频和声音;然后 agent 能力增强,它可以很好地进行 agent 的编排,可以做很精准的函数调用;指令依存度很高,就是你给它下命令,它会老老实实照着执行,输出格式也很精准;都使用 MOE 架构,成本都很低。这就是这一批模型,或者叫“中国马年春节模型组”的共同特性。

这些模型里,其中有一些是蒸馏了 Claude 4.6 Opus,达到了基本能用的状态。你说比人强这事咱不好说,但确实能用了。特别是刚才咱们讲到,Openrouter 里边的第一名 MiniMax,实锤拉取了 1,300 万条 Claude 4.6 Opus 的数据,确实是学得最像的一个。大家也用脚投票,真的去使用了,因为它很便宜,它的价格只是 Claude 4.6 Opus 的 1/20。

那你说这个事跟 Openclaw、跟大龙虾有什么关系呢?首先是 Openclaw 消耗的 TOKEN 非常非常多,而且很多人也想用 Claude 的大模型。第一个是很贵,第二个你通过各种方式去蹭,比如去蹭 20 美金套餐、200 美金套餐,Anthropic 会封你的账号,所以没有办法,只能去找一些替代产品来用。

而且使用 Openclaw 的时候,它对于大模型的要求其实没有那么高。你只要能够把 agent 跑通,不需要那么聪明,也不需要做什么科学计算、做什么人类解决不出来的问题,做特别精复杂精准的推理都不需要。我们就是需要跑 agent,需要去处理文档。这个事国内这些大模型基本上大差不差也能用。

这有点像什么?就有点像公司里边的一些行政人员,不需要真学霸,甚至连小镇做题家都不需要,你就是处理日常事务就可以了。所以国内这个模型顶上来了。

第二段:Openrouter 等代理商的“后门”与路由机制

一张“路由迷宫”示意图:用户请求从“Openrouter”入口进入,被箭头分流到“美国机房 / 新加坡 / 马来西亚 / 中国机房”等节点,旁边有“最便宜”“最快”的标注与隐约的“后门”小门,羊皮纸,钢笔彩色手绘的统一风格。

第二段,Openrouter 这些代理商其实是给自己留了后门,允许他们偷偷使用中国算力。Openrouter 上调用的,是不是应该是美国机房里跑的中国这些开源大模型呢?很多人会这样想,因为确实这些模型是开源的,美国机房可以部署它,没有毛病。太天真了。

大家仔细去看一看 Openrouter 的用户手册,这是一个 TOKEN 路由服务。什么叫 TOKEN 路由?就是当你去 Openrouter 上调用这些服务的时候,他们会自主选择一个当前最快、最便宜的地方给你产生这些 TOKEN。他不会保证说你美国的用户一定在美国使用,或者一定在中国之外使用,它没有这样的条款,只是写着会自动去给你找最便宜、最快的。

这种 TOKEN 是不是有可能来自于中国呢?可能性不是没有,但过程可能比大家想象的复杂一些。确实有 TOKEN 是来自于美国本地机房部署的中国开源模型,但一定不多。原因很简单:美国机房它贵,而且使用 TOKEN 本身对于速度的要求并不高。你多等一秒两秒不会有感觉。像我们现在可以在美国机房里看 Youtube 直播,那 TOKEN 对速度的要求比 Youtube 直播差远了。所以你就跑到中国绕一圈再把数据拿回来,他们不会觉得慢。

Minimax、Kimi、GLM、阿里、华为、字节都在海外有算力中心,那我们是不是就使用这些海外算力中心就可以了呢?有一部分有可能是用的这些,但你不能排除它有一部分又路由到中国来了。

这里跟华为有什么关系?要注意大家现在使用的大量 Deepseek 的算力其实是来自于华为。Deepseek 在海外基本上没有什么算力中心,而且 Deepseek 跟华为的昇腾芯片适配得还非常好。使用 Deepseek 的时候,就有可能是华为。

像字节、阿里,他们都是在美国有算力中心的;但其他的像 Kimi,很多服务是部署在新加坡或者马来西亚。即使是使用美国算力中心的千问服务,它也有可能自己路由来路由去,把中国的 TOKEN 掺沙子掺进去。因为它自己也会去路由:发现美国算力中心成本很高、速度很慢或者比较拥堵了,那我就干脆调新加坡算力中心的 TOKEN 回来;或者说新加坡的也挺贵的,算了,把中国的 TOKEN 调出来吧,直接进去掺沙子。这个你没法杜绝。

Openrouter 的意义:统一接口与路由采购

那么 Openrouter 这样的企业,它存在的意义在哪呢?讲了半天,你说我直接上 OpenAI 去买不就完了吗?我直接上谷歌去买,或者上 Anthropic 直接买他们家的 TOKEN 不就完事了吗?我为什么一定要跑到 Openrouter 来绕一圈?

原因很简单。比如我们开发了应用或者做了一些系统,这个系统里头需要同时使用几家的 TOKEN:有些任务想用 Gemini,有些任务想用 Claude,有些任务想用 GPT,或者有些任务还想用千问。在这样的情况下,我希望写统一的一个接口,把所有问题都解决掉,就需要 Openrouter 这种服务了。

他们就是专门进行这种路由:Openrouter 上也有 Claude、GPT、Gemini,什么都有,而且特别快,通常新模型发布三四个小时以后,这边就上线了。

它的很多 TOKEN 其实是直接跳转到 OpenAI、跳转到微软、跳转到亚马逊那边去使用的。Openrouter 自己也会稍微部署一点点开源模型,但更多是在中间进行 Router、进行路由。他看谁家便宜,就把东西采购回来给你们交付出去,主要是来做路由的。

Openrouter 还有很多竞争对手,他们也是用同样的方式在做。我们去买同样的 TOKEN,100 万 TOKEN,Openrouter 的价格通常要比原厂还稍微便宜一点点,大概便宜 5% 左右。原因也很简单:他采购量大,是大客户,一下采购一大堆,就能拿折扣。我即使比原厂卖得便宜 5%,还是有利润可赚。

现在一堆竞争对手还在跟他打价格战,而且这些竞争对手里头有一些是直接由中国大厂控制的白手套,这里头具体是谁咱不能讲,但确实有。

在这样的过程中,Openrouter 肯定要拼命寻找更便宜更快的 TOKEN 向大家提供。至于这个 TOKEN 到底是在美国、在新加坡、在马来西亚还是在中国,他也不知道,反正就是我去选择了。而且你使用我服务的时候,我用户手册上写了我自动去选择,你只管用就好了,我也不承诺这东西是哪来的。

第三段:使用中国机房算力可能带来的问题

第三段,使用中国机房里的算力可能会带来什么问题?首先要注意一点,中国政府其实并不希望外国用户来使用中国的模型,或者部署在中国机房里的模型。所谓的 TOKEN 出海,中国政府其实还是希望进行一定控制的。

原因很简单:中国境内的模型是必须经过特别调整的,号称心中常驻中宣部的那种。

刚才我们讲的这些大模型公司提供的接口,通常都是分国际版和境内版的:Kimi、Minimax、GLM、字节和阿里都是这样。有境内版,也有国际版。中国境内版的服务需要申请资质、需要审核,确保心中常驻了中宣部;境外版本没有这些东西。而且中国政府也不希望境外用户发现我们到底审核了什么、到底阉割了什么。

如果境外用户直接使用境内端口来服务,可能会出现很多合规拦截的问题,这是我们不希望外边看到的。

今天我用龙虾的时候其实就遇到了相应的问题。我让龙虾调用国内端口的千问 3.5 PLUS 测试图片识别时,就发生了一个情况:它测试用的是境外维基百科上的一个图片链接,让它认一下,结果读不出这张图片来,因为你境内嘛,没办法去使用这张图片。

所以想要在境外使用,最好就使用国际端口。但国际端口的处理也有可能会路由回国内来,只是这些厂商会想办法绕过国内的合规审核,直接给你服务掉就完事了。

第四段:两大中国 TOKEN 的海外生产基地

双基地对照画面:左边是“新加坡/马来西亚机房”机柜与海底光缆、旁边画出从老挝水电站来的电力闪电;右边是“中东算力中心”沙漠边的机房与大片光伏板、储能电池柜,箭头汇成“低价 TOKEN”出口到全球,羊皮纸,钢笔彩色手绘的统一风格。

第四段,要跟大家讲两大中国 TOKEN 的海外生产基地。他们真的是用了中国各种产能过剩的电、产能过剩的各种设备生产 TOKEN 给大家使用。

基地一:马来西亚与新加坡机房(老挝电力链路)

第一个就是刚才咱们讲到的马来西亚和新加坡的机房。他们可以名正言顺地大批量购买英伟达芯片。字节、阿里、华为、Kimi、GLM、Minimax 都有新加坡和马来西亚的机房,而且这些机房还可以用中国的绿电,就是水电或者风电,他们用水电最多。

那你说难道从中国拉根电线过去吗?不是。处理他们电力问题的公司叫老挝国家输电网公司,这公司是老挝公司。跟中国有什么关系?这公司老挝持股 10%,剩下 90% 的股份是中国南方电网持股,而且中国南方电网拥有老挝国内电网 25 年的运营权,就是老挝国内电网都是由中国南方电网来管的。

然后他们还有一个协议叫 LTMS-PIP 项目,这是老挝、泰国、马来西亚跟新加坡的电力一体化项目,是东盟首个四国多边跨境电力贸易项目,2026 年已经完成了二期升级,输电规模直接翻倍。实际上就是老挝供电,剩下三个国家买。

那你说电是老挝的电,电哪来的?难道真的是从中国拉根线先到老挝,再把它从老挝拉过去吗?有一部分确实会有,但更多的电是在老挝境内发出来的:由南方电网、中国的国家电投、中广核、中国电建在老挝境内投资建设了几十座水电站。

所以这是绿电没毛病。你使用中国电力设备、使用中国资金、使用中国运营方和管理方法发了电,送到新加坡和马来西亚,到那边去产生 TOKEN,然后卖到全世界去,这是其中一个基地。

基地二:中东土豪算力中心(中国公司运营 + 光伏储能)

另外一个是中东土豪们的基地。中东土豪们买了很多英伟达算力卡,这些卡也要跑起来。而且这些算力卡购买、建立算力中心的时候,是董王亲自带着黄教主过去卖的,黄教主还在很努力鼓吹主权 AI,你们要自己来管理自己的 AI。

这么多算力中心,中东土豪们怎么运营?由中国公司来运营,比如阿里、腾讯、华为,他们都在沙特和阿联酋运营着大量算力中心。这里面使用的是英伟达的算力卡,当然也有一部分使用的是华为昇腾的算力卡。里边跑的模型肯定是中国的开源大模型,这里头绝对不会跑 OpenAI、Anthropic、谷歌,一定是跑中国模型。

那中东的电是什么价格?虽然是由中国云计算公司运营的中东算力中心,你总得在当地烧电吧。中东土豪总不能烧石油发电,那玩意多污染。这还是要由中国人过剩的产能来救场:中东正在大规模部署中国的太阳能光伏发电设备,量非常非常巨大;宁德时代、比亚迪和华为在给中东建设大规模的储能电站。因为太阳能白天晒太阳,晚上没有电,需要用储能电站把电存起来,才能保证这些算力中心一天 24 小时都有非常稳定的电力供应。中东土豪们给出的这些 TOKEN 价格也是很低的。

谁是真正的赢家:阿里

这里头谁是真正的赢家呢?咱们前头讲的第一名是谁?Minimax,阿里是最大的外部股东;智谱 GLM,阿里是最重要的产业投资方;第三名月之暗面,阿里是核心投资方,最新一轮投资的领投方。

所以这里头谁是最大的赢家?阿里云遍地开花,算是除了美国三朵云之外的第四朵云。美国三朵云就是亚马逊云、微软云、谷歌云,现在 Oracle 云还差得稍微有点远,还在努力追赶。再往后就是阿里云:自己做云计算中心,全世界去布局;自己投资了一大堆 AI 大模型厂商,做开源模型;阿里云里头通通都可以部署,这个路子就算打通了。所以真正的赢家就是阿里。

第五段:美国算力的嵌套游戏是否可能崩盘

“左手倒右手”的金融齿轮画面:几只手把写着“投资”“算力采购”“芯片订单”的钱袋在 OpenAI、云厂商、芯片商之间来回传递,旁边一张价签写“TOKEN 10~20x”,背景是正在建设的巨型数据中心脚手架,羊皮纸,钢笔彩色手绘的统一风格。

第五段,美国算力的嵌套游戏是不是有可能崩盘?美国人很会玩这种左手倒右手的游戏。比如 OpenAI 刚拿了 1,000 多亿美金的投资,这边亚马逊说我投 500 亿,但这 500 亿你得回来买我的算力,你还要买我自己做的算力芯片;英伟达说我也给 300 亿,但你也得上我这来买芯片。大家都是这么个玩法,左手倒右手,倒来倒去倒了好几圈了。

2026 年光烧算力中心的钱就要 7,000 亿美金,要落地的。结果他们的 TOKEN 价格是中国的 10 到 20 倍。这些算力中心建好了以后,这么贵的 TOKEN 到底怎么卖掉?这是大家真正需要思考的问题。

谷歌现在已经出来喊了,说 TOKEN 跟 TOKEN 是不一样的,但是真的有那么多高级任务需要去烧你们这么贵的 TOKEN 吗?普通任务使用中国便宜 TOKEN 就够了,量大管饱价格低,而且开源,你可以随意部署。我需要多一点,我就随时多开几台机器,绝对是各种土豪的最爱。

土豪希望什么?我这边打开机器你就给我跑,你不要再跟我谈什么 license、许可,这个许干那个不许干,通通听我的就行。所以中国提供的开源大模型绝对是土豪最爱。

而且 TOKEN 这个东西还很难征关税,你不像电动车可以征关税,可以在海关把它拦住,这玩意根本拦不住,都在网络上直接跑起来了。

如果美国算力中心建起来了,却无法赚得相应的钱,那乐子可就大了。

第六段:我们能做点什么

最后我们能做点什么?

  1. 第一个可以干的事是将自己的 AI 任务分级,高级任务用美国 TOKEN,普通任务选个便宜的就可以。
  2. 第二个,阿里还是值得关注的,前期阿里广撒网做了非常多 AI 相关投资,现在开始见效果了。现在我们看到的 Minimax、Kimi、GLM 这些 TOKEN 在 Openrouter 上快速被消耗,其实背后都是阿里,是他们最后烧的很多 TOKEN,就是在阿里云的算力中心里边烧出来的。

最后我们也期待看看美国这些算力投资后续如何收场,这些钱都烧掉以后到底怎么把钱挣回来。还有 TOKEN 肯定会越来越便宜,即使是中国 TOKEN 也会越来越粗鄙的。如果现在大家还在这听故事,不好好把这些 TOKEN 烧掉,那一定会落后的。

好,今天的故事就讲到这里。感谢大家收听,请帮忙点赞、点小铃铛,参加 DISCORD 讨论群,也欢迎有兴趣有能力的朋友加入我们的付费频道。再见。


背景图片

Prompt:Marvel-inspired hand-drawn realism, intricate ink crosshatching, semi-realistic comic rendering, industrial interior visualization, abandoned downtown US data center hall with meticulously aligned server racks, reflective metal doors, blinking status LEDs, outside the broken windows: empty cracked avenues, derelict facades, debris-strewn sidewalks, no central hero, environmental composition, 28mm wide shot, eye-level, deep perspective, soft directional light, restrained rim light, desaturated steel palette, graphite gray, oxidized orange accents, micro-detail textures on paint peel, dust, rust, cable wear –no people, capes, dramatic hero pose, pristine architecture, text, watermark, logo –ar 16:9 –stylize 130 –chaos 6 –v 7.0 –p qaczhqj