Anthropic喊停AI？真要暂停还是上市前造势？ - 老范讲故事

一个巨大的红色暂停键悬在高速奔跑的 AI 机器人和实验室服务器上方，旁边有媒体标题卡片和商业发布会灯光，浅色背景的商业评论版橡皮泥平面信息图的统一风格。

Anthropic 真的要给 AI 按下暂停键了吗？

其实是一边喊危险，一边在说：我最强，赶快来用。

大家好，欢迎收听老范讲故事的 YouTube 频道。开场咱们先纠个偏。这两天中文圈里最热的标题是：Anthropic 万字长文要求全面停止 AI 研发。这件事情三分真、七分假。

哪部分是真的？Anthropic 真的写了一篇文章，在 2026 年 6 月 4 日发出来，确实谈到了 AI 研发的放缓和暂停问题。假的是，它并不是要求明天全球就停工，也不是按照美国政府的要求，以后每次发新模型都先给政府用 30 天。

这里有三个很关键的限定词：

有条件的：就是我们要想停，这个事是有条件的。
可协调的：就是我们要把所有实验室都协调在一起，才能停下来。
可验证的：就是大家一起停，还要相互监督。你不能一边喊停，一边自己偷偷努力。

很多学霸喜欢干这个活：问他昨天回去干嘛了，他说我一点都没学习，我回去打游戏了，我回去玩去了，实际上看书看到半夜。这个事是不行的。

所以传播链的问题是，英文媒体把重点压在了“暂停”这个词上，中文二传把“暂停”变成了“全面停止”。白宫确实在这几天发了个行政令，6 月 2 号发的，其中有一个“30 天”，也被塞到了相关文章里。最后就变成了一个更刺激，但是更不准确的标题。

所以这不是 AI 要停了，这是 AI 太快了，谁都不想先停下来。

两条新闻传送带把英文“暂停”标签逐步加工成中文“全面停止”大标题，远处 AI 赛车仍在高速前进，浅色背景的商业评论版橡皮泥平面信息图的统一风格。

这篇文章是谁写的？

这次不是 Anthropic 的 CEO 在喊话，是政策机构出手了。原文标题叫《当 AI 开始建造自己》，副标题是《我们走向递归自我改进的进展及其影响》。发布方是 Anthropic 研究院，作者叫玛丽娜·法瓦罗和杰克·克拉克。

玛丽娜·法瓦罗是 Anthropic 研究院的负责人之一，长期做前沿 AI 政策、安全治理和社会影响研究。杰克·克拉克是 Anthropic 的联合创始人，最早是 Bloomberg 的科技编辑，后来加入 OpenAI，在 OpenAI 里实际上负责安全相关的事情。2020 年，他跟阿莫迪兄妹一起离开 OpenAI，创建了 Anthropic。

这篇文章不是一个普通的技术博客，也不是 CEO 的商业访谈，它更像是 Anthropic 在上市之前递出的一份安全叙事说明书。既讲技术，又讲政策，还顺手给自己的模型能力做了一波大大的展示宣传。这是 Anthropic 在上市前给世界递出的一张“我很强，所以我很危险”的名片。

Anthropic 给出的 5 个关键数字

在这篇文章里，Anthropic 给出了 5 个证据，说你看，AI 已经接近自我进化了。但我要说的是，这其实是在王婆卖瓜，自卖自夸。Anthropic 只是换了一种安全警告的姿势，再强调一下“我最强”。

它讲的 5 个关键数字是：

80% 以上：2026 年 5 月，Anthropic 合并到代码库中的代码，超过 80% 是由 Claude 编写的。
8 倍：2026 年第二季度，Anthropic 工程师人均合并代码量约为 2024 年的 8 倍。
52 倍：小型 AI 训练加速任务中，Claude Opus 4 在 2025 年 5 月能够把速度提高 3 倍；到了 Claude Mythos Preview 这个版本，在 2026 年 4 月可以把速度提升 52 倍。
64%：在下一步研究该往哪走的评估中，2026 年 4 月，Mythos Preview 胜出人类选择的比例达到了 64%。Anthropic 官方 X 帖还把它和 2024 年约 22% 的基线做了对比。
76%：开放任务成功率在 2026 年 5 月达到了 76%。而且他们使用 Mythos Preview 这个模型可以连续跑 16 个小时，已经达到测试上限了。

五个立体数字路标围绕 Claude 机器人排列，分别指向代码、效率、训练加速、研究选择和开放任务仪表盘，浅色背景的商业评论版橡皮泥平面信息图的统一风格。

所以“危险”的意思就是：我还是好厉害，只有我这么危险。

这 5 个数字到底在讲什么？它不是在讲 AI 已经自我进化了，它真正讲的是 AI 已经进入 AI 研发流程，开始帮人类制造下一代 AI 了。而且它的要点其实有很重的营销味道。这些数字都是 Anthropic 自己拿出来的，是一手材料，实际上也就是自家的广告。

这好比有一家火锅店，上来贴了一个招牌，说请大家千万注意，我们家的锅底实在太香了，香到十里八街都睡不着。甚至有些火锅店会贴个告示，说我家这个底料放了点猛料，实在是太好吃了，你一定要小心。这目的是什么？是真的告诉你里头放了什么，让你不要来吃吗？不是，是告诉你赶快来试试，这玩意你从来没吃过这么香的火锅。

所以你说这事算提示风险吗？也不能说不算。但更关键的是，它在打广告。Anthropic 不是单纯地说 AI 危险，它是在说危险的原因是我实在太厉害了。

AI 暂停不是 Anthropic 发明的

AI 暂停这件事其实有很长的历史，也不是 Anthropic 发明的。好几年了，每年都有人喊：AI 是不是太厉害了？

最早是阿西洛马 AI 原则，2017 年 1 月发布，一共 23 条原则。其中第 22 条规定的就是递归自我改进，要求这类系统接受严格的安全和控制措施。
生命未来研究所在 2023 年 3 月 22 日发布了“暂停巨型 AI 实验”公开信，要求暂停 6 个月训练比 GPT-4 更强的模型。当时 GPT-4 是最强的一个。当时有很多人跑去签字，包括埃隆·马斯克、尤瓦尔·赫拉利这些人。但是后来这个签字做乱掉了，有些好像是伪造的签字，所以这个事情最后不了了之。
布莱切利宣言是 2023 年 11 月在英国布莱切利 AI 安全峰会上，28 国加上欧盟签署的，推动 AI 安全研究所的体系。
首尔宣言和巴黎 AI 行动峰会，是 2024 年、2025 年相继形成的 AI 安全共识，但是没有真正的全球强制暂停。
特朗普行政令是 2026 年 6 月 2 日签署的。这个行政令要求，在网络安全上有巨大风险的模型，可以自愿在交给可信机构之前，提前 30 天让政府去评估。有这样的一个文件。
OpenAI 也做了一个叫“前沿安全蓝图”的文件，是在 6 月 3 日发布的，主张联邦统一框架。意思就是：你们来管吧，这事我管不了了，联邦政府你们来搞。而且不要每个州搞一套，我们会被摁死在这的。
再往后就是 2026 年 6 月 4 日，Anthropic 发的《当 AI 开始建造自己》这篇文章，把 RSI，也就是递归自我改进，和可验证暂停机制推到了台前。

一条从 2017 到 2026 的 AI 安全时间轴穿过会议桌、公开信、政府文件和实验室图标，末端停在 Anthropic 长文文件夹上，浅色背景的商业评论版橡皮泥平面信息图的统一风格。

其实最喜欢搞这种事情的人就是加州。大家都在加州，加州政府又是相对来说比较圣母的，所以他们特别喜欢去搞 AI 控制。

所以这个事情一直都在往前走。AI 暂停已经喊了 9 年了，停下来的不是模型，只是口号。

Anthropic 的暂停条件几乎不可能实现

Anthropic 自己说得也很清楚：我不会单方面停下来。原文的条件写得非常清楚，有意义的放缓或者暂停，需要多个有资源的前沿实验室，需要这些实验室分布在多个国家，需要大家在同等条件下停止，还需要彼此能够验证对方真的停了。

它提出这个要求，属于绝对不可能实现。别说其他国家，就光美国这些公司就能打出狗脑子来。Anthropic 跟 OpenAI 怎么相互验证大家停下来？不可能。再加上谷歌、xAI 和 Meta，你怎么去相互验证大家停下来了？

多个国家，现在真正有能力训练模型的实际上就两个国家：一个美国，一个中国。让中美两国相互信任，然后设立观察员，看看你们都在干什么。就算中国愿意，美国也不愿意。

中国说，我很开心，我愿意派观察员到 Anthropic、到 OpenAI 去观察一下你们停下来没有，顺便跟以前的中国老乡聊聊天，你们都干什么了，平时吃什么，数据怎么训练的。这些事你说美国能愿意吗？它也不能愿意。

所以这个条件提出来，意思就是这个事不可能停下来。Anthropic 的暂停条件翻译成人话就是：除非所有人都停，而且我能看见你真停了，否则我也不停。

多个国家的 AI 实验室像棋盘上的堡垒彼此隔空监视，每个堡垒门口都有暂停牌但内部服务器仍亮着灯，浅色背景的商业评论版橡皮泥平面信息图的统一风格。

30 天暂停到底是怎么回事？

再往后讲一下这个 30 天暂停的事情。这是 6 月 2 号特朗普签的行政命令。这个命令是从 90 天草案，被行业强烈反对以后，压缩到了 30 天自愿窗口里。

在白宫最终签署之前，围绕前沿模型的审查，美国已经有多股监管压力，包括州法议员提案、网络安全担忧、Anthropic Mythos 触发的高端网络能力恐慌。早期草案曾经出现过 90 天更长的审查窗口。但是多家媒体报道，埃隆·马斯克的 xAI、马克·扎克伯格的 Meta，以及 David Sacks——这个应该是白宫的 AI 沙皇——都强烈反对。核心理由是，这会拖慢美国的 AI，把优势让给中国。

但是你想想，Sam Altman 没出来反对，阿莫迪没出来反对，说明什么？就这两家最厉害。你就算停 90 天，我把剩下的人拖住也行。在美国 AI 公司中出来反对的人，是马斯克和扎克伯格，因为他们落后了，所以一定要出来反对这个事情。当然借口肯定是中国，美国就是这么干活的。

特朗普一开始没有签那个 90 天的版本，最后签了一个折中方案。最终版本保留的是自愿框架，就是你可以拿给我看，也可以不拿给我看，这个无所谓，自愿。而且是开发者可以在受覆盖的前沿模型发布给可信伙伴前，给联邦政府最多 30 天访问。

这话怎么解释？就是类似于 Claude Mythos Preview 这样的模型，你要在发布给 Project Glasswing 这种受限的合作伙伴使用之前，先给政府，最长不超过 30 天。行政令明确说了，不能把它解释为强制许可、预先审批、发布许可要求。你就算没给我，你也可以发布。千万不要理解成你没给我，或者在我这看完以后有问题，我就不让你发布了。没有这事。

所以这就是一个从 90 天被打成 30 天，从强制被打成自愿的过程。这不是在踩刹车，而是把脚放在刹车旁边拍了个自拍，就干了这么个事。

一只脚悬在汽车刹车踏板旁边没有踩下去，旁边手机正在自拍，仪表盘上显示“90 天”被折叠成“30 天自愿”，浅色背景的商业评论版橡皮泥平面信息图的统一风格。

Anthropic 自己也矛盾重重

而 Anthropic 自己也是矛盾重重。安全问题是真的，算计也是真的。

第一重矛盾：2 月份刚软化安全承诺，6 月份又呼吁行业暂停

《时代周刊》在 2026 年 2 月 24 日报道，Anthropic 调整了负责任扩展政策 RSP 的第三版，删除了旧版中“未达安全门槛则不训练、不部署”的承诺，改成了更灵活的路线图和透明度报告。原来是做不好我就不发，现在是我把路线图拿出来，稍微透明一下，你们监督一下就完事了。

Anthropic 的首席科学官贾里德·卡普兰对《时代周刊》的解释是，如果竞争对手继续推进，Anthropic 单方面停止训练实际上帮不了任何人。这句话很诚实，也很尴尬。自己不愿意被硬承诺锁住，但 4 个月后，又开始呼吁行业讨论暂停机制的问题了。

第二重矛盾：IPO 时间线实在太紧

2026 年 2 月 12 日，Anthropic 宣布了 300 亿美金的 G 轮融资，投后估值 3,800 亿美金。
2026 年 5 月 28 日，Anthropic 宣布了 650 亿美金的 H 轮融资，投后估值 9,650 亿美金，年化收入超过了 470 亿美金。
2026 年 6 月 1 日，Anthropic 保密提交了 S-1，也就是美国 IPO 注册草案，启动了上市程序。
2026 年 6 月 4 日，Anthropic 发布了 AI 自我改进和暂停机制的长文。

所以当 2026 年 6 月 5 日全球媒体刷屏的时候，CNBC 等媒体就把语境改成了“IPO 前夕”。你发这样的文章，到底想干嘛？意欲何为？

一条紧凑的融资到 IPO 时间线像传送带一样推着 Anthropic 文件、美元估值牌和安全警告牌同时向上市钟前移动，浅色背景的商业评论版橡皮泥平面信息图的统一风格。

第三重矛盾：暂停条件几乎天然不可能实现

它喊了半天，所有这些暂停条件都不可能实现。

所以 Anthropic 不是在撒谎，它说的风险是真的。但是它也不是圣人，它拿到的是上市前资本叙事的脚本。

所有人都在喊危险，也都在继续前进

没有人真的在抢定义权。大家都知道有问题，但是到底怎么停下来，谁也说不明白。Anthropic 也好，美国政府也好，其他 AI 厂商也好，大家都知道有问题，但是没有人说，我们定义一下在什么样的情况下把它停下来，或者在什么样的机制下把它停下来。没有人干这个事。

大家在喊的都是同一件事：AI 实在太危险了，我实在太强了，来买我。

白宫说，前沿模型有高级网络能力，确实很危险。但是如果我让它强制停下来，中国会追上我们，这事不行。
OpenAI 说，这个还是交给联邦统一去管吧，我也要甩锅了，这事我管不了。而且各个州，特别是加州，不要在我这添加镣铐。你们把我锁住以后，中国会追上你的。
Anthropic 在说什么？AI 正在帮助 AI 自我改进，未来可能需要暂停机制。但是它自己也说了，不会单方面停止，除非其他前沿机构也都以可验证的方式停下来。

所以这场竞争最荒诞的地方就是：所有人都在喊危险，所有人都在证明自己最危险，然后所有人都在继续前进、继续冲锋。

多家 AI 公司吉祥物举着“危险”警示牌在同一条赛道上向前冲刺，观众席上资本和政府角色同时挥舞望远镜，浅色背景的商业评论版橡皮泥平面信息图的统一风格。

最终的结论是，没有人真的要停，也没有人会停。前面等着我们的，可能是天堂，也可能是地狱，但是没有人会停下来，我们只能一路狂奔。

好，这个故事就讲到这里。感谢大家收听，请帮忙点赞，点小铃铛，参加 Discord 讨论群，也欢迎有兴趣、有能力的朋友加入我们的付费频道。再见。