
Anthropic 真的要给 AI 按下暂停键了吗?
其实是一边喊危险,一边在说:我最强,赶快来用。
大家好,欢迎收听老范讲故事的 YouTube 频道。开场咱们先纠个偏。这两天中文圈里最热的标题是:Anthropic 万字长文要求全面停止 AI 研发。这件事情三分真、七分假。
哪部分是真的?Anthropic 真的写了一篇文章,在 2026 年 6 月 4 日发出来,确实谈到了 AI 研发的放缓和暂停问题。假的是,它并不是要求明天全球就停工,也不是按照美国政府的要求,以后每次发新模型都先给政府用 30 天。
这里有三个很关键的限定词:
- 有条件的:就是我们要想停,这个事是有条件的。
- 可协调的:就是我们要把所有实验室都协调在一起,才能停下来。
- 可验证的:就是大家一起停,还要相互监督。你不能一边喊停,一边自己偷偷努力。
很多学霸喜欢干这个活:问他昨天回去干嘛了,他说我一点都没学习,我回去打游戏了,我回去玩去了,实际上看书看到半夜。这个事是不行的。
所以传播链的问题是,英文媒体把重点压在了“暂停”这个词上,中文二传把“暂停”变成了“全面停止”。白宫确实在这几天发了个行政令,6 月 2 号发的,其中有一个“30 天”,也被塞到了相关文章里。最后就变成了一个更刺激,但是更不准确的标题。
所以这不是 AI 要停了,这是 AI 太快了,谁都不想先停下来。

这篇文章是谁写的?
这次不是 Anthropic 的 CEO 在喊话,是政策机构出手了。原文标题叫《当 AI 开始建造自己》,副标题是《我们走向递归自我改进的进展及其影响》。发布方是 Anthropic 研究院,作者叫玛丽娜·法瓦罗和杰克·克拉克。
玛丽娜·法瓦罗是 Anthropic 研究院的负责人之一,长期做前沿 AI 政策、安全治理和社会影响研究。杰克·克拉克是 Anthropic 的联合创始人,最早是 Bloomberg 的科技编辑,后来加入 OpenAI,在 OpenAI 里实际上负责安全相关的事情。2020 年,他跟阿莫迪兄妹一起离开 OpenAI,创建了 Anthropic。
这篇文章不是一个普通的技术博客,也不是 CEO 的商业访谈,它更像是 Anthropic 在上市之前递出的一份安全叙事说明书。既讲技术,又讲政策,还顺手给自己的模型能力做了一波大大的展示宣传。这是 Anthropic 在上市前给世界递出的一张“我很强,所以我很危险”的名片。
Anthropic 给出的 5 个关键数字
在这篇文章里,Anthropic 给出了 5 个证据,说你看,AI 已经接近自我进化了。但我要说的是,这其实是在王婆卖瓜,自卖自夸。Anthropic 只是换了一种安全警告的姿势,再强调一下“我最强”。
它讲的 5 个关键数字是:
- 80% 以上:2026 年 5 月,Anthropic 合并到代码库中的代码,超过 80% 是由 Claude 编写的。
- 8 倍:2026 年第二季度,Anthropic 工程师人均合并代码量约为 2024 年的 8 倍。
- 52 倍:小型 AI 训练加速任务中,Claude Opus 4 在 2025 年 5 月能够把速度提高 3 倍;到了 Claude Mythos Preview 这个版本,在 2026 年 4 月可以把速度提升 52 倍。
- 64%:在下一步研究该往哪走的评估中,2026 年 4 月,Mythos Preview 胜出人类选择的比例达到了 64%。Anthropic 官方 X 帖还把它和 2024 年约 22% 的基线做了对比。
- 76%:开放任务成功率在 2026 年 5 月达到了 76%。而且他们使用 Mythos Preview 这个模型可以连续跑 16 个小时,已经达到测试上限了。

所以“危险”的意思就是:我还是好厉害,只有我这么危险。
这 5 个数字到底在讲什么?它不是在讲 AI 已经自我进化了,它真正讲的是 AI 已经进入 AI 研发流程,开始帮人类制造下一代 AI 了。而且它的要点其实有很重的营销味道。这些数字都是 Anthropic 自己拿出来的,是一手材料,实际上也就是自家的广告。
这好比有一家火锅店,上来贴了一个招牌,说请大家千万注意,我们家的锅底实在太香了,香到十里八街都睡不着。甚至有些火锅店会贴个告示,说我家这个底料放了点猛料,实在是太好吃了,你一定要小心。这目的是什么?是真的告诉你里头放了什么,让你不要来吃吗?不是,是告诉你赶快来试试,这玩意你从来没吃过这么香的火锅。
所以你说这事算提示风险吗?也不能说不算。但更关键的是,它在打广告。Anthropic 不是单纯地说 AI 危险,它是在说危险的原因是我实在太厉害了。
AI 暂停不是 Anthropic 发明的
AI 暂停这件事其实有很长的历史,也不是 Anthropic 发明的。好几年了,每年都有人喊:AI 是不是太厉害了?
- 最早是阿西洛马 AI 原则,2017 年 1 月发布,一共 23 条原则。其中第 22 条规定的就是递归自我改进,要求这类系统接受严格的安全和控制措施。
- 生命未来研究所在 2023 年 3 月 22 日发布了“暂停巨型 AI 实验”公开信,要求暂停 6 个月训练比 GPT-4 更强的模型。当时 GPT-4 是最强的一个。当时有很多人跑去签字,包括埃隆·马斯克、尤瓦尔·赫拉利这些人。但是后来这个签字做乱掉了,有些好像是伪造的签字,所以这个事情最后不了了之。
- 布莱切利宣言是 2023 年 11 月在英国布莱切利 AI 安全峰会上,28 国加上欧盟签署的,推动 AI 安全研究所的体系。
- 首尔宣言和巴黎 AI 行动峰会,是 2024 年、2025 年相继形成的 AI 安全共识,但是没有真正的全球强制暂停。
- 特朗普行政令是 2026 年 6 月 2 日签署的。这个行政令要求,在网络安全上有巨大风险的模型,可以自愿在交给可信机构之前,提前 30 天让政府去评估。有这样的一个文件。
- OpenAI 也做了一个叫“前沿安全蓝图”的文件,是在 6 月 3 日发布的,主张联邦统一框架。意思就是:你们来管吧,这事我管不了了,联邦政府你们来搞。而且不要每个州搞一套,我们会被摁死在这的。
- 再往后就是 2026 年 6 月 4 日,Anthropic 发的《当 AI 开始建造自己》这篇文章,把 RSI,也就是递归自我改进,和可验证暂停机制推到了台前。

其实最喜欢搞这种事情的人就是加州。大家都在加州,加州政府又是相对来说比较圣母的,所以他们特别喜欢去搞 AI 控制。
所以这个事情一直都在往前走。AI 暂停已经喊了 9 年了,停下来的不是模型,只是口号。
Anthropic 的暂停条件几乎不可能实现
Anthropic 自己说得也很清楚:我不会单方面停下来。原文的条件写得非常清楚,有意义的放缓或者暂停,需要多个有资源的前沿实验室,需要这些实验室分布在多个国家,需要大家在同等条件下停止,还需要彼此能够验证对方真的停了。
它提出这个要求,属于绝对不可能实现。别说其他国家,就光美国这些公司就能打出狗脑子来。Anthropic 跟 OpenAI 怎么相互验证大家停下来?不可能。再加上谷歌、xAI 和 Meta,你怎么去相互验证大家停下来了?
多个国家,现在真正有能力训练模型的实际上就两个国家:一个美国,一个中国。让中美两国相互信任,然后设立观察员,看看你们都在干什么。就算中国愿意,美国也不愿意。
中国说,我很开心,我愿意派观察员到 Anthropic、到 OpenAI 去观察一下你们停下来没有,顺便跟以前的中国老乡聊聊天,你们都干什么了,平时吃什么,数据怎么训练的。这些事你说美国能愿意吗?它也不能愿意。
所以这个条件提出来,意思就是这个事不可能停下来。Anthropic 的暂停条件翻译成人话就是:除非所有人都停,而且我能看见你真停了,否则我也不停。

30 天暂停到底是怎么回事?
再往后讲一下这个 30 天暂停的事情。这是 6 月 2 号特朗普签的行政命令。这个命令是从 90 天草案,被行业强烈反对以后,压缩到了 30 天自愿窗口里。
在白宫最终签署之前,围绕前沿模型的审查,美国已经有多股监管压力,包括州法议员提案、网络安全担忧、Anthropic Mythos 触发的高端网络能力恐慌。早期草案曾经出现过 90 天更长的审查窗口。但是多家媒体报道,埃隆·马斯克的 xAI、马克·扎克伯格的 Meta,以及 David Sacks——这个应该是白宫的 AI 沙皇——都强烈反对。核心理由是,这会拖慢美国的 AI,把优势让给中国。
但是你想想,Sam Altman 没出来反对,阿莫迪没出来反对,说明什么?就这两家最厉害。你就算停 90 天,我把剩下的人拖住也行。在美国 AI 公司中出来反对的人,是马斯克和扎克伯格,因为他们落后了,所以一定要出来反对这个事情。当然借口肯定是中国,美国就是这么干活的。
特朗普一开始没有签那个 90 天的版本,最后签了一个折中方案。最终版本保留的是自愿框架,就是你可以拿给我看,也可以不拿给我看,这个无所谓,自愿。而且是开发者可以在受覆盖的前沿模型发布给可信伙伴前,给联邦政府最多 30 天访问。
这话怎么解释?就是类似于 Claude Mythos Preview 这样的模型,你要在发布给 Project Glasswing 这种受限的合作伙伴使用之前,先给政府,最长不超过 30 天。行政令明确说了,不能把它解释为强制许可、预先审批、发布许可要求。你就算没给我,你也可以发布。千万不要理解成你没给我,或者在我这看完以后有问题,我就不让你发布了。没有这事。
所以这就是一个从 90 天被打成 30 天,从强制被打成自愿的过程。这不是在踩刹车,而是把脚放在刹车旁边拍了个自拍,就干了这么个事。

Anthropic 自己也矛盾重重
而 Anthropic 自己也是矛盾重重。安全问题是真的,算计也是真的。
第一重矛盾:2 月份刚软化安全承诺,6 月份又呼吁行业暂停
《时代周刊》在 2026 年 2 月 24 日报道,Anthropic 调整了负责任扩展政策 RSP 的第三版,删除了旧版中“未达安全门槛则不训练、不部署”的承诺,改成了更灵活的路线图和透明度报告。原来是做不好我就不发,现在是我把路线图拿出来,稍微透明一下,你们监督一下就完事了。
Anthropic 的首席科学官贾里德·卡普兰对《时代周刊》的解释是,如果竞争对手继续推进,Anthropic 单方面停止训练实际上帮不了任何人。这句话很诚实,也很尴尬。自己不愿意被硬承诺锁住,但 4 个月后,又开始呼吁行业讨论暂停机制的问题了。
第二重矛盾:IPO 时间线实在太紧
- 2026 年 2 月 12 日,Anthropic 宣布了 300 亿美金的 G 轮融资,投后估值 3,800 亿美金。
- 2026 年 5 月 28 日,Anthropic 宣布了 650 亿美金的 H 轮融资,投后估值 9,650 亿美金,年化收入超过了 470 亿美金。
- 2026 年 6 月 1 日,Anthropic 保密提交了 S-1,也就是美国 IPO 注册草案,启动了上市程序。
- 2026 年 6 月 4 日,Anthropic 发布了 AI 自我改进和暂停机制的长文。
所以当 2026 年 6 月 5 日全球媒体刷屏的时候,CNBC 等媒体就把语境改成了“IPO 前夕”。你发这样的文章,到底想干嘛?意欲何为?

第三重矛盾:暂停条件几乎天然不可能实现
它喊了半天,所有这些暂停条件都不可能实现。
所以 Anthropic 不是在撒谎,它说的风险是真的。但是它也不是圣人,它拿到的是上市前资本叙事的脚本。
所有人都在喊危险,也都在继续前进
没有人真的在抢定义权。大家都知道有问题,但是到底怎么停下来,谁也说不明白。Anthropic 也好,美国政府也好,其他 AI 厂商也好,大家都知道有问题,但是没有人说,我们定义一下在什么样的情况下把它停下来,或者在什么样的机制下把它停下来。没有人干这个事。
大家在喊的都是同一件事:AI 实在太危险了,我实在太强了,来买我。
- 白宫说,前沿模型有高级网络能力,确实很危险。但是如果我让它强制停下来,中国会追上我们,这事不行。
- OpenAI 说,这个还是交给联邦统一去管吧,我也要甩锅了,这事我管不了。而且各个州,特别是加州,不要在我这添加镣铐。你们把我锁住以后,中国会追上你的。
- Anthropic 在说什么?AI 正在帮助 AI 自我改进,未来可能需要暂停机制。但是它自己也说了,不会单方面停止,除非其他前沿机构也都以可验证的方式停下来。
所以这场竞争最荒诞的地方就是:所有人都在喊危险,所有人都在证明自己最危险,然后所有人都在继续前进、继续冲锋。

最终的结论是,没有人真的要停,也没有人会停。前面等着我们的,可能是天堂,也可能是地狱,但是没有人会停下来,我们只能一路狂奔。
好,这个故事就讲到这里。感谢大家收听,请帮忙点赞,点小铃铛,参加 Discord 讨论群,也欢迎有兴趣、有能力的朋友加入我们的付费频道。再见。
背景图片
