CURSOR翻车:Composer 2被曝套壳Kimi?

夜色中的科技发布会舞台中央悬着“Composer 2”发光招牌,前景是被放大的终端日志窗口里突然露出“Kimi K2.5”字样,观众席一半惊讶一半举起手机拍照,羊皮纸,钢笔彩色手绘的统一风格。

CURSOR 发布了新模型,号称达到甚至超过了 Claude Opus 4.6 的水平,而且只有 1/10 的成本。结果翻车,被发现是套壳的 Kimi。CURSOR 你这浓眉大眼的,也干这种事吗?

大家好,欢迎收听老范讲故事的 YouTube 频道。

今天咱们要讲的故事,不是“美国人也抄咱们的”,也不是“咱们又抄美国人的”,而是什么呢?就是当一个祖上阔过、原来在一条赛道上跑得非常快、跑到第一名的选手,突然发现路线错误的时候,会发生什么样的事情。咱们慢慢听这个故事。

CURSOR 发布 Composer 2,结果迅速翻车

一台复古打字机般的电脑屏幕上显示“Composer 2 发布”,旁边堆着低价标签“$0.5 / million tokens”和高分基准榜单,屏幕下方一根数据线悄悄连向写着“Moonshot / Kimi”的服务器机柜,羊皮纸,钢笔彩色手绘的统一风格。

2026 年 3 月 19 日,CURSOR 发布了一个新模型,叫 Composer 2,主打更强的编码能力和更低的价格。它的每百万 Token 只要 50 美分,非常非常便宜。

官方宣称,在多项编程基准上已经超越了 Claude Opus 4.6 这个全世界公认的第一编程模型,而且成本只是 Claude Opus 4.6 的 1/10。官方还公布了各种基准成绩、各种跑分,这里就不一一复述了。

但是翻车了。发布之后不到 24 小时,开发者通过自定义 API 转发调试的时候发现,Composer 2 的模型请求路径中出现了 Kimi K2.5 的字样,直接指向了 Moonshot AI 的 Kimi K2.5。这个事情就开始在各种社交媒体上发酵了。

为什么自定义 API 调试会发现问题

发酵之后,CURSOR 的反应也很戏剧化:它把人家调用方法给封掉了。

为什么会出现自定义 API 转发调试这个事呢?因为这些编程 IDE 或者编程工具,希望有一个正规途径,让大家通过这个途径去使用它的模型。它不希望程序员绕开这道门,让模型去干其他事情。

这什么意思呢?比如说麦当劳餐厅后边有后厨,你在前头点套餐 1、2、3 没毛病,但是你说:“我认识这个厨师,你偷偷给我做一个加大汉堡,在里头再做一些其他东西,给我做一些我自己想吃的东西。”这个事通常是大家不喜欢的。

现在 CURSOR 的做法就像是在说:你居然敢说我抄袭、敢说我套壳,我咔嚓一下把这条路给你封掉。他干了这么个事情。

更多证据出现后,CURSOR 开始“挤牙膏”

一支挤到变形的牙膏管上写着“官方回应”,挤出来的不是牙膏而是一条条证据纸条:序列器一致、基座模型、商业授权,桌边几只手正举着放大镜和截图,羊皮纸,钢笔彩色手绘的统一风格。

然后后面更多证据就出来了。包括 Kimi 自己的一个高管也出来说,CURSOR 这个模型,它的序列器就是用的我们的,一模一样。

什么叫序列器?就是你给它一个问题以后,它要先给你编码,编码用的那个东西跟我们是完全一样的,这肯定是我们家的东西。

然后 CURSOR 自己才开始慢慢挤牙膏,先出来承认说,我们确实是用的一个开源模型作为基座,还没有说 Kimi 的事。再往后,实在逼不过去了,才出来说,我们确实使用了 Kimi K2.5 作为基座,但是这个东西我们只用了 1/4,3/4 都是我们自己的。我们在这个基础上做了继续预训练和超强计算的强化学习。

那这事就炸锅了。你看看你,一开始不承认,然后挤牙膏,还封人家的路径,最后出来说,我们是这么干的,但是大头都是我这的。

Kimi 的态度反而很微妙

但是这个过程中,Kimi 的态度很有意思。一开始它还出来说,这个序列器是我的。后来它把这帖子删了,然后还出来祝贺了一下,说祝贺你,这东西做得不错。

它也解释说,这个事他们确实用了,但是他们做了商业授权,是给了钱的,都是符合合同的。最后 Kimi 等于做了这样的一个解释。月之暗面的预训练负责人,也把他原来那个指责的帖子给删了,这事就算过去了。

这件事到底违不违法

那这事到底违不违法呢?咱们先从这个角度上来讲,这就比较尴尬了。

Kimi K2.5 采用的是 modified MIT license。MIT 的意思就是你拿去用就完了,这没问题。但是现在除了 DeepSeek 会拿这种原始开源协议让人直接使,其他的大模型公司,号称开源的,都会在原来协议上改一点。

改什么呢?就是当你达到一定程度以后,比较大的公司如果用了我的,你得说是用我的,它有这样的条款。

怎么写的呢?如果你的用户达到 1 亿月活,或者你每个月的收入超过 2000 万美金,你要用了我的,就必须要跟最终用户说你用我的了。

  • 第一个条件:你的月活达到了,或者你的月收入达到了;
  • 第二个条件:你不能只在中间偷偷写,你要在最终用户那里写明白。

为什么说这件事很尴尬

一张摊开的许可证文书放在木桌上,关键条款被红墨水圈出“最终用户披露”,旁边是算盘、营收报表和一个试图用袖子遮住数字的公司高管背影,羊皮纸,钢笔彩色手绘的统一风格。

CURSOR 自己不是上市公司,所以它没有发财报的义务。CURSOR 在 2025 年 11 月宣称的年化收入是超过了 10 亿美金,也就是你每个月可能有七八千万。到 2026 年 3 月,TechCrunch 报道说 CURSOR 的年化收入已经超过 20 亿美金了,也就是每个月可能能有 1 亿多美金。

那肯定是超过了。超过了你就得出来对最终用户说,我用 Kimi K2.5 了,因为人家协议上是这么写的。你用了,就说明你已经同意这个协议了。

你如果前头没吹牛,那你就应该老老实实写;你如果没写,Kimi 也认了,说没事,就这样吧,我们算商业授权了,他没写就没写吧,我们也不说他什么了。那是不是前面吹牛了?所以为什么说这个事稍微有一点点小尴尬。

CURSOR 所说的“1/4 和 3/4”到底是什么意思

那么 CURSOR 具体怎么干的呢?这个 1/4、3/4 是怎么分的呢?

首先,它找了一家公司叫 Fireworks。这个公司是干嘛的呢?是专门给别人做模型后训练的。在美国有一批公司干这个活,比如 Fireworks、Together,还有 GROQ。

GROQ 这家公司原来的创始团队已经被黄仁勋都挖走了,但是他们也是自己有芯片,专门给人做相关后训练。他们拿着中国的这些开源模型,在这个基础上再去做后训练。CURSOR 说,我去买了他们家的服务,直接在那上头去做的。

什么叫继续预训练

这里头有两个词,一个叫继续预训练,另外一个叫高计算的强化学习

相当于这样:今天有一个大学毕业生,本科毕业了,这就属于 Kimi K2.5 这个 base 模型。你毕业了,瞪着清澈的大眼睛说,我啥也不会。这就是这么样的一个人。

什么叫继续预训练?就是你坐在这儿,我给你做公司规章制度培训、公司历史培训,告诉你要做什么事情,有什么条款,你从头到尾整个学一下。这个就叫继续预训练,就是在原来的基础上接着往后学。

什么叫强化学习

一间训练教室里,一位刚毕业的年轻学生坐在课桌前,黑板左边是“继续预训练”的公司手册和知识图谱,右边是“强化学习”的一叠又一叠打钩打叉的试卷,老师不断发新题,羊皮纸,钢笔彩色手绘的统一风格。

那什么叫强化学习?强化学习实际上就是我们熟知的“刷题”。你有一个老师给你出题,出完题以后你做,做完以后他现场改,改完以后你拿着这个打了勾打了叉的卷子回来再接着学,然后再给你出题,就是这样的一个循环过程。

Composer 2 是先做了继续预训练,然后再做了所谓高计算的强化学习。那高计算强化学习和普通强化学习之间的差异,就是我们给你更多的题,疯狂刷,刷很多很多的题,这就叫高计算的强化学习。

“1/4 是 Kimi,3/4 是我们自己的”应如何理解

所谓说原来 Kimi K2.5 的 base 模型只占 1/4,我们后边的继续预训练和高计算强化学习占算力的 3/4,这个话是什么意思呢?这是最后把所有遮羞布都撕干净以后,CURSOR 给出来的一个解释。

意思是这样:原来 Kimi K2.5,比如说本科毕业,在这个水平上,它一共学了多少多少知识,有多少 Token 进去,它怎么学的;我现在在后边这两步里头,再给你的 Token 或者说这些材料,是你原来的三倍。你把所有这些东西都学完了,所以你现在主要是我教出来的。

大概是这样的一个过程。

因为你真正让它去干活的时候,比如说现在你去给我写程序吧,这个时候其实你没法计算说哪一部分是原来的 base 算力,哪一部分是后边产生的算力。

你也没法像辅导班老师似的,说你原来考多少分,在我这培训了以后我给你增加多少分,你也不可能增加 3/4 的分上去,这不扯淡吗?我应该没见过有这么牛的补习老师。

所以只能说,你原来的预训练资料很少,只占整个资料的 1/4;我后边给你做后训练以及大量刷题,这个量是你前面这个量的三倍,所以一共 3/4 是我的。只能这么去理解。

CURSOR 真正的问题:可能选错了赛道

一条岔路口上立着两块木牌,一边写“AI IDE”通向华丽但尽头断开的高架路,另一边写“CLI”通向朴素却延伸到远方的山谷小径,领跑者站在路口回头张望,羊皮纸,钢笔彩色手绘的统一风格。

CURSOR 现在的日子其实很难过。为什么呢?因为 IDE 这条路未必有出路,可能这条路是错的。

这也是咱们一开始讲的:今天我们要讲的不是谁丢人了,而是什么?就是这种原来阔过、祖上有过钱的选手,现在发现这条路错了以后,你该怎么办的问题。

CURSOR 曾经是 AI IDE 这条路里的老大,因为它的估值已经到 300 亿美金了,非常非常高,而且现在据说还在融资,准备冲 500 亿。这绝对是行业排头兵。

为什么 Claude Code 出现后,IDE 逻辑开始松动

但是从 Claude Code 出来以后,发现这个路子不对了。以前我们为什么一定要有 IDE?因为我们要去看代码。我提了各种要求,做了各种推理以后,我要去在代码上再调点东西。

现在 Claude Code 出来以后,发现我们不用看代码了。包括 Codex、Gemini CLI、OpenCode 这些东西都出来以后,现在我们再去做一些项目的时候,根本就不看代码,我不需要 IDE 了,那这条路可能就有问题。

后来像 OpenCode、OpenClaude 这类东西,也是不用看代码了,实际上它也是在后台进行编程。很多人就出来说,IDE 已经死了吧,大家不需要看代码了,还要 IDE 干嘛呢?IDE 叫集成开发环境,你必须是跟代码打交道才需要这玩意儿;你不跟代码打交道,就不需要这东西。

这条赛道上的其他玩家

那么这条赛道上的其他人怎么办呢?老大是 CURSOR。老二在 2025 年 7 月直接把创始团队给卖了,24 亿美金,把整个核心创始团队卖给谷歌了。谷歌现在拿着这个团队做的 Anti Gravity,也挺好使的。

还有老三,这家公司原来叫 Devin,后来改了个名字叫 Cognition,现在叫 Cognition AI。他们还把老二卖完谷歌以后剩下的壳也买了。所以现在是他们两家在折腾这个市场。其他人虽然也做过类似工具,但是都没什么声响了。

所以大家都看着,这到底是一个怎么样的方向,是不是就没有出路了。

为什么 CURSOR 不能轻易转向 CLI

那你说 CURSOR 既然已经前面这么强了,人家都改成 CLI 了,都改成这种直接在命令行干活了,我们也改不就完了吗?为什么我一定要抱着 IDE 这条路走到死呢?

就跟蔚来汽车的李斌似的,大家都觉得换电不靠谱,他为什么一定要换电呢?

原因很简单,因为它这个估值顶在这儿了。你想,它 2025 年 11 月 D 轮融资 23 亿美金,估值 293 亿,接近 300 亿。所有那些做 CLI、做命令行工具的,都没那么值钱。

  • OpenCode 基本上没什么估值;
  • OpenClaude 本来大家觉得它应该有很大估值,结果创始人选择去 OpenAI 上班,项目直接开源,由基金会托管;
  • 这些东西都没估值。

那你说你这个 CURSOR,293 亿的估值怎么继续往前交代?没法走。而且现在还在惦记做 500 亿估值的新一轮融资,估计也很费劲了。

被“借壳”的 Moonshot 反而估值更低

这一次被它借壳的这家公司 Moonshot 值多少钱呢?43 亿美金。2025 年年底最新融的那一轮,就是阿里跟腾讯给钱那轮,估值 43 亿。

到 2026 年 3 月,现在正在进行一轮新的 10 亿美金融资,投后估值估计会达到 180 亿美金,也就是它原来这个估值的一半。所以这没法整了。CURSOR 说我原来的路错了,我换一个赛道,换不了,所以它被架这儿了。

为什么别人用中国开源模型没翻车,CURSOR 却翻了

使用中国大模型做微调,CURSOR 也不是头一个了,很多人都这么干。为什么就它翻车了呢?

Perplexity 和 Together 的做法

两张并排展示的模型说明海报,左边写着“基于 DeepSeek R1”,右边写着“基于 Qwen 3 32B”,两位工程师坦然站在作品旁介绍,和另一侧一块空白说明牌形成鲜明对比,羊皮纸,钢笔彩色手绘的统一风格。3:2

2025 年 2 月 18 日,Perplexity 出了一个模型叫 R1-1776。这个模型一上来就跟大家讲了,是用 DeepSeek R1 为基础再去做后训练的。大家觉得没问题,很厉害,你做得非常棒。而且它把 DeepSeek R1 里头的一些政治正确限制都给去了,大家很喜欢它。

Together 也干过这个活。Together 做了一个模型,讲说我这个模型就是在 Qwen 3 32B 的基础上拿它再去训练的,没毛病。大家也觉得,你干得很厉害。

CURSOR 问题出在“不说”

但是 CURSOR 怎么就翻车了呢?很简单,因为它没跟人说。你上来以后先啥也不提,被人发现抓包了以后,再慢慢慢慢去挤牙膏,还尝试去封堵,那它就必然会翻车。

类似案例并不只有 CURSOR

当然,翻车的绝对不是只有 CURSOR 一家。

乐天 AI 3.0 套壳 DeepSeek V3

比如这两天还有一个故事,日本 乐天 AI 3.0 套壳 DeepSeek V3。这个事是 2026 年 3 月 17 日爆出来的。

乐天集团宣布推出号称日本当前最强开源大语言模型,叫 Rakuten AI 3.0,声称在多项日语基准测试中表现优于 GPT-4o 等多款模型。

乐天最初一直暗示这是日本原创的。大家注意,它通常不会把这玩意儿写在纸面上,但是会喊“遥遥领先”,让你自己去领会。

后来网友们在其配置文件以及底层代码中发现了 DeepSeek V3 的痕迹,架构和配置与 DeepSeek V3 几乎一模一样。之后乐天才补充说明,说确实使用了 DeepSeek V3 进行了继续训练。

但是乐天没有 CURSOR 丢人丢这么大。原因就是它一被发现马上就承认了。它不像 CURSOR 似的,还得让人挤两天牙膏,中间把各种痕迹都留下来:我到底怎么狡辩的,我做了哪些拦阻,我说了哪些瞎话。它把整个痕迹都给人留下来了。

而且还有一点,就是乐天在这个圈子里其实没有 CURSOR 有名。乐天虽然是个很大的公司,但是你说你做 AI 这个事,跟 CURSOR 比肯定完全是个名不见经传的小弟弟。

华为盘古和 Cognition 的案例

还有这一年被抓包的,比如华为的盘古 Pro MoE,被抓包说它是使用的 Qwen 2.5 14B 去进行的后训练。但是华为就是不认,就这样了,把该开的人开了,这个模型也不推了,往这一放就完了,这事也算混过去了。

还有一家公司,就是 Cognition,也就是刚才咱们讲的那个在 IDE 领域里的第三家。他们出的 1.5、1.6 版本的自家模型,被发现底层是用的 GLM-4.5 和 GLM-4.6。他们也是说,这事我就不说了,就这样了,我也不解释,死猪不怕开水烫。

他们也不算特别丢人。为什么呢?因为你毕竟不是老大。这种事,丢人还是要看老大来丢。所以 CURSOR 这个,是这几年最丢人的一次了。

真正的教训:不是不能用,而是必须说清楚

一座小型法庭与公众广场合二为一的场景,台上摊着合同与开源协议,台下是一群开发者高举“信任”“透明”的牌子,中央一只裂开的面具象征隐瞒后的信誉崩塌,羊皮纸,钢笔彩色手绘的统一风格。

所以这件事上,你用别人的模型本身并不丢人。开源就是让大家去用的。基本原则就是,你一定要在第一时间把这事说清楚:我用的谁的,我怎么用的,我拿谁的模型做的后训练。这个事你要说明白。

这种拿了别人的模型做了后训练、做了强化学习,然后你不说,就很容易翻车。

即使你在协议上完完全全是合规的,比如前面承认销售额造假了,这事我们认了,那这样的话,它对于 Kimi 的开源协议来说就合规了。因为人家说一个月 2000 万美金以上,那我现在虽然号称一年有 20 亿美金,但我就不说,那这个事大家也是可以去理解的,吹牛嘛,谁不会。

但是你千万不要用法律条款去跟一帮热爱者讲道德的事情,因为道德是要比法律高的。

“我生气不是因为你骗我,而是因为我再也无法相信你了。”

像 CURSOR 这种,还是很多人喜欢的。我记得前两天还看到一个朋友,他是个软件公司的老板,他就很自豪地跟我说,我给我们公司每个人都订了 CURSOR。他觉得这是一个非常非常棒的事情。

但是出了这种事情以后,大家一定会更加恨它。原因是什么?本来我那么信任你的。

这话是哪来的呢?是尼采《善恶的彼岸》里的意思。就是大家愿意相信 CURSOR,因为它是行业老大。很多人说,我们一定要有 IDE,我们不能相信完全自动驾驶的 Claude Code 这种模式。但是现在一看,老大塌房了,这个事大家一定会更加变本加厉地上去捶它。

总结:CURSOR 错不在用了 Kimi,而在隐瞒

总结一下吧。使用中国开源模型进行后训练,一定会大行其道。现在美国有很多公司手里有算力、有显卡,拿着中国这些开源模型去给各种不同的项目做后训练。

就像是中国培养了大量的优秀学生,输送到美国去,他们在那边再去学个硕士、学个博士,再到大公司里边磨练一段时间。现在他们在美国 AI 行业的各个领域里发光发热,实际上跟这个过程非常像。所以这条路一定会快速继续前进。

那么 CURSOR 到底错在哪了呢?不是错在用了 Kimi K2.5,而是错在你用了以后没说,而且被人抓包了以后还在那藏着掖着。

而这件事情对于 CURSOR 来说,它为什么会采用这样的一种方式?所有这些其实都是不得已。没有谁说我故意要骗你,是为了寻开心,不可能的。CURSOR 就是走错路了,它又是这条路的头一名,没法掉头,所以只能硬着头皮往前走。

在这种情况下,它要把自己的架子撑起来:我要是跟人说我用了别人的模型,丢不起这人。它干了这样的事情。

如果发现路线错了,跑在最前面的人有三种选择

一位领跑者站在终点前忽然发现赛道前方塌陷,面前浮现三扇路门:左边是“卖公司”的金色城门,中间是“低调熬上市”的狭长石桥,右边是“硬撑前行”的碎裂独木桥,远处观众与投资人都在注视,羊皮纸,钢笔彩色手绘的统一风格。

其实对于这种跑在最前面的人来说,如果发现道路错了,它其实有三种选择。

最优解:尽快卖公司

最优选是什么?最优选就是快速地把公司卖掉,找个土豪来接盘。其实这就是很多优质项目最常见的选择。马斯克也好,扎克伯格也好,其实都还是愿意接受这种项目的。而且它这个估值,对于马斯克和扎克伯格来说,这几百亿美金不算特别过分。

次优解:隐忍,低调熬到上市

那次优解是什么呢?就是你现在实在不愿意委身他人,还不太甘心,没准我还能找到更好的。没跑到最后,你怎么能证明我这条 IDE 的道路就是错的呢?没准再走着走着,发现这条路又峰回路转了呢。这个在行业里边还是出现过一些情况的。

如果是这样的情况,就需要隐忍。你需要自己慢慢忍下去,千万不要引起别人的注意。不要一上来说“你看我还是老大”,这个事是不行的。不要去跟人吵这个架,小心翼翼地一直熬到上市,也算给投资人一个交代。

Dropbox 的例子

比如互联网时代的 Dropbox,就是走的这条路。网盘一出来以后,大家说太厉害了,这就是互联网的未来,我们大家都要去做网盘。但是后来发现不是这么回事。

现在大家再看看网盘市场,只有谷歌、苹果,国内像华为、小米这些做手机的厂商,他们做网盘有人用。你单独做一个网盘,根本卖不掉。

你说国内不是还有百度网盘、夸克网盘吗?对,国内情况比较特殊。这些网盘实际上都是做盗版盘用的,就是盗版电影。你如果没有盗版电影的话,它们是没法跟这些手机厂商的网盘竞争的。

Dropbox 最后怎么办呢?就是忍,一直忍,忍到上市了,给所有投资人以回报。反正长也长不大了,就这么养着。所以这也是一条出路。

就是明明已经被质疑路线错误了,还要出来宣扬一些自己做得很有瑕疵的事情,用法律条款来逃避道德瑕疵,最后就会翻车。

这就是这一次 CURSOR 故事的全部了。


背景图片