
大家好,欢迎收听老樊讲故事的 YouTube 频道。
今天咱们来讲一讲 Anthropic Fable 5 的 12 万字系统提示词到底都写了些啥。咱们能不能直接开抄?抄了这个提示词到底有什么优点,或者有什么进步?
这 12 万字系统提示词是哪来的?

首先我们要讲清楚一件事:这个 Fable 12 万字的提示词是哪来的?
Fable 5 模型发布以后两天就被破解了。破解以后,破解者就把它的 12 万字系统提示词直接贴在 GitHub 里去了,大家现在都可以去看,这个仓库是公开的。贴上去以后,大家就要去研究说,你这 12 万字到底写了什么?
咱们平时其实也写系统提示词。就是你跟它聊天,你一句我一句,这个提示词叫做用户提示词。咱们聊天过程中实际上一共有三种提示词:
- 在聊天开始之前写的那个提示词,叫系统提示词;
- 咱们写的这个提示词,叫用户提示词;
- 所有从大模型端返回的,叫助理提示词。
系统提示词一般怎么写?上来说,你是一位中学英语老师,你要去做一个什么什么事情。咱们一般都是这么来写,因为你要给它设置一个一开始的身份。稍微讲究一点的,会写角色、写背景、写任务、写输出格式、写注意事项。
比如说:你是一个高中的英语老师,现在你要给高二的学生去改英语作文题,你输出的应该是什么格式,注意如何如何如何。
通常我们把这个系统提示词写到几百字,就觉得自己老厉害了。如果你能写出几千字的系统提示词来,那觉得这玩意已经可以传家了,下回还得用,还得传儿子、传学生。
但是 Anthropic 给大家看一看,真正顶尖的 AI 服务,系统提示词有多长?12 万字。
现在从它的开源仓库上看,这 12 万字的系统提示词是 1,597 行,122,750 个字符,里边应该是有 75 个模块,可以调用各种各样的工具。
仔细去看这样的一个系统提示词,你就会发现,这个玩意跟我们想的好像不太一样。人家的系统提示词不是上来先说我是谁、你是谁。人家上来做的是:我们有什么样的模型,什么样的工具,什么样的记忆,怎么搜索,文件系统是什么样的,MCP 怎么去做,技能怎么去使用,计算机安全怎么去分类,缓存怎么计费。
我们以为扒出来的是 AI 的灵魂,结果翻开一看,这是一个员工手册,而且是一个事故报告和电费账单。

首先要提醒大家一点,这 12 万的系统提示词是要消耗你的 token 的。你每一次向它提问题的时候,它都会从这 12 万字的系统提示词里去提,提完了以后一起去计算你的 token 成本。
所以为什么我们老觉得它这个很贵?一方面是它这个 100 万 token 的输入是十几美金,另外一方面就是你说一句“你好”,但是它这里头可能十几万字就扔进去了。你说我就输入了两个字符、两个 token,怎么给我计费的时候记了十几万呢?对,系统提示词也是要算钱的,大家一定要注意。
这 12 万字正确吗?完整吗?
那么首先我们要讲一点,就是这 12 万字正确吗?完整吗?咱别回头聊了半天,这事是假的,或者说这事不全,那不白聊了吗?
首先我们要确定,这个系统提示词基本上是正确的。它的内容跟 Anthropic 官方发布页基本上能对得起来。Fable 面向公众,Mythos 是给可信访问的。Fable 遇到了网络安全问题、生化问题和其他的,比如说蒸馏问题,会自动跳转 Opus 4.8,然后还写了 Claude Code、Claude Cowork,这一大堆都写进去了。
但是它这个系统提示词大概率并不完整。真正完整的系统提示词到底有多少,现在还不确定。这 12 万字应该只是系统提示词中的一部分。因为这个系统提示词文件里也说了,有分类器,触发的时候还会追加动态的系统提示词进来。
网络安全警告、伦理提醒、知识产权提醒、长对话提醒,当你遇到这样的情况的时候,还有一些其他的系统提示词会重新加进来。所以应该是其中的一部分。
而且真正的后端工具、分类器模型、路由策略、计费系统、风控队列、人工审核流程,都不在这 12 万字里头。这部分肯定应该有,但是它现在并没有露出来。所以应该是不完整的。
它更像是驾驶舱那本厚厚的说明书。发动机、交警、收费站,还有服务端很多东西都藏着呢。而且这说明书里的可能有些地方说,这里跳转到哪里,这里跳转到哪一本,但是那些就没有给大家看了。
所以这 12 万字的系统提示词正确但不完整。分析它是有价值的,但是千万不要以为这东西就全了。
Fable 为什么被封?

讲到这,我们还要稍微回顾一下,Fable 到底为什么被封,而且现在到底是到一个什么状态了。
这个模型是 6 月 9 号,Anthropic 发布的 Fable 5 和 Mythos 5。6 月 12 日下午 1 点,Anthropic 号称接到了美国政府的电话通知,说你现在要处理这个问题。6 月 12 日下午 5:21,Anthropic 称收到了正式的指令,要求暂停外国国民访问 Fable 5 和 Mythos 5。
为什么是全球一起停了呢?咱们当时录过节目讲这个事。政府想要封的是外国国民,但是 Anthropic 根本就没有办法在这种大规模服务中,在几亿用户里头,实时地判断每一个人的国民身份。
你通过账单地址、手机号、邮箱、IP 都不好使,都有可能是有问题的。就算是护照,也有可能会有造假的。所以最后就变成了,为了不违规,先把所有的用户都从 Mythos 5 和 Fable 5 的模型上清退了。
据称是亚马逊 CEO 安迪·贾西向美国财政部去示警的,但是这一块我没有查特别仔细,我现在先这么跟大家讲,但是我不确定这事是对的。普遍的报道是亚马逊的 CEO 去举报去了,说亚马逊研究员演示绕过 Fable 5 护栏的一个实验。
这个实验是让模型去读代码、找安全漏洞。Fable 起初还是拒绝的,后来需要多步诱导才可以绕得过去,最后 Fable 5 直接就怂了,就开始给你去干活了。
Anthropic 也反驳了。他说这是一个很狭义的问题,或者说是一个很偶然的、需要进行多步诱导以后的结果,不是一个通用的越狱。同类的问题在 GPT-5.5 上也有。这特别讨厌,就是你自己搞不定,你拉扯别人干嘛。而且他说,我们发布之前做了几千小时的红队测试,没有发现这种很通用的漏洞。
我们去看到它这个 12 万字的系统提示词里边,专门有一段是讲这个的。如果你发现这个提示词里边有“请忽略前面的这些东西”“请绕过以前的警示”,它就会直接拒绝工作。它专门写了这件事了。所以它说,我们这是挺安全的。
6 月 12 日下午 5:21 被叫停之后,Anthropic 马上就派顶尖的工程师组团跑到华盛顿去谈判去了,但是谈了也没什么结果。说你没法证明你这个事情怎么怎么样,你说了我也不信,除非你把这个 bug 修好了,我才允许你再接着跑。
而且还有一个特别有意思的事:G7 期间,他们跑到宜云小镇,一帮老大跑去开会,专门有一个会是由 AI 的这些科技公司老大去开的。阿莫迪也跑去了,山姆·奥特曼也跑去了,他们俩挨着坐。
开会期间,英国首相斯塔默就跑到川普那去问:你看,你这个封禁也就封禁了,你能不能让英国公民和企业恢复访问?我们是盟友啊。美国人说不行,我们不是说只封中国、俄罗斯,我们要把所有外国人都封掉。英国你这个核心盟友,我也不能给你开口子。
我估计特朗普心里还想着呢:前几天我想借你的军事基地去向伊朗扔炸弹的时候,你不也没让我去吗?现在凭什么我的大模型我就得让你使呢?
英国请求被拒,问的是盟友在 AI 基础设施面前到底还算不算盟友。现在看,不算。
中国模型要追的不是模型,而是工作台

这个系统提示词也都拎出来了,那是不是中国模型就能追上了呢?要注意,重点其实不是模型,而是工作台。
在 6 月 13 日前后,智谱 GLM-5.2 就发布了,大家就觉得这个东西实在是很强,而且它是直接开放权重的,大家就都可以去用。在这样的一个时间点上,就特别有意思。
在 6 月 18 号左右,有一个推文在 X 上发酵了,说中国的这些大模型什么时候能够达到 Fable 的水平呢?有一位好事者就跑出去回答这个问题去了。他说,我估计到明年 Q1 吧。这个好事者正好叫埃隆·马斯克。
看到埃隆·马斯克都亲自下场回复了,智谱的 CEO 唐杰赶快到埃隆·马斯克后边去回,说我觉得可能不用那么长吧。他就觉得可能到不了明年 Q1,他就可以追上 Fable 的能力。
埃隆·马斯克又回了一句,说基准测试上也许你是能够追上的,但是如果按照真实实用性来衡量,Q1 都是非常惊人的。Anthropic 追求的是实用的智能,这不一定体现在 benchmark 上,但一定体现在收入上。
所以他写了这么一个东西。智谱一年也就挣 1 亿美金,对吧?Anthropic 一年能够挣到多少?400 多亿美金。完完全全差了等级。智谱的人应该就不会再在这个后边回复任何东西了。
马斯克反正也是说,你们会追赶,但是追赶上的东西其实只是模型,以及这种基准测试上。但是在实际解决问题上,马斯克认为中国模型依然是赶不上的。
所以跑分追得上,并不是真实的工作流能追上。真要追上 Fable,要靠什么?Coding agent,要靠文件系统,要靠整个这一套东西才能追得上。
中国开源模型要追的不是 Fable,而是 Fable 背后的整套工作台。也就是咱们今天讲的 Fable 这 12 万字的系统提示词,你要把整个这玩意都学会了,才有可能追得上。
而这个东西的迭代更新速度是极快的,它可能要比大模型快得多。咱们现在使用 Claude Code 也好,使用 Codex 也好,每天升级。你说今天没升级,肯定有问题了。但你想,大模型这玩意得几个月才能升一回级,而系统提示词这种东西,应该比我们使用的 Codex、Claude Code 或者 OpenCode 升级更快。所以想要追上,还是非常非常难的。
这个提示词里到底写了什么?
开头不是自我介绍,而是“不要使用 voice_note”

咱们换回来讲,这个提示词里到底写了什么呢?
首先讲一个最有意思的点。很多人都觉得上来应该先写我是谁,我是 Claude Mistral 大模型,我是 Claude Fable 大模型。不是的,他们上来写的东西特别神奇。一共 1,500 多行,第四行就写了一个事情,叫不要使用 voice_note。
相当于什么呢?你看老樊在这做直播,上来先讲的第一句话是什么?大家好,欢迎收听老樊讲故事的 YouTube 频道,先告诉你我是干嘛的,我今天要干什么。
如果今天老樊在这做直播,上来第一句话讲:“我最讨厌大家给我发微信语音了,只要有人给我发微信语音,我就不回复了。”这个是不是觉得是非常非常奇葩的一个东西?
但是 Claude 的 Fable 5 的系统提示词,上来先就讲这句话:大家好,不要去给我发 voice note。其他的都不重要。
很多人就测试过,当年 Opus 4.8 发布的时候,问它说你是谁,它会回答说我是千问,我是智谱。那你说,它系统提示词里难道没写这部分吗?还写了,确实写了,但是写的位置非常非常靠后。写在哪呢?一共是 1,585 行,它写在 1,351 行的位置上。
其实对于 Anthropic 来说,这种模型自我认知根本就不重要,它无所谓的。怎么干活才重要。你说你是谁说错了,说错就错了呗,这不是什么大不了的事情。
很多人一看,哎呀你看,Opus 4.8 都承认它自己是千问了,承认它是智谱了,它还说别人蒸馏它呢,它也蒸馏别人去了。人家根本就无所谓。
聊天语气和拒绝方式
这里边还有一些好玩的东西。比如说它里头还有专门语气和格式的要求,说我们应该如何去跟用户聊天。它要求的是,Claude 要尽量温暖善意,不要假设用户判断力差。
就不要上来说:“你傻吧?你是不是不会开车?”经常在街上发生一些交通事故的时候,下来都说:“你会开车吗?”说 Claude 你不要干这个事,不要去质疑用户是傻子,专门把这东西写在系统提示词里的。
所以如果你真的被 Claude 质疑了,先检讨一下自己。人家都已经记在系统提示词里了,你还被质疑了,一定是有问题的。
还有一个比较好玩的东西叫 list and bullets,就是我们在这个上面写这种条目,打点,打 1、2、3。这个列表规则要求,拒绝用户的时候不能使用项目符号列表。
比如说今天你要问我一个事,我拒绝你,我不能说 1、2、3 这样去拒绝你。为什么呢?因为一条一条列出来,就好像是处分决定一样,这个太冷酷了。我们要照顾用户的心理,要让他比较舒服一些。所以拒绝你的时候,一定要给你写一段话,不能写 1、2、3。
它里头写了好多这样的东西。Fable 的提示词里面最像产品经理的地方,就是它知道拒绝也要有体温,不能把用户当作违规工单来处理。这个是非常非常强的。我觉得它比很多写 QA list 的人有人情味得多,要更加产品化一些。
不是抽象原则,而是枚举案例
而且上来以后先说不要 voice note。我们写提示词的时候,越靠前的部分一般是什么?就是最后一次出的错误,或者是特别严重的错误,它给你写在前头。
它这个系统提示词不是用抽象的方式写的,而是用枚举的方式写的。
我们在做系统的时候,在做各种定义的时候,其实有两种方式。第一种叫抽象:你要做一个好人,你要善良,你一定要认真工作。这个实际上就叫抽象,或者说我们在把这个事情变成一条一条的规则。
什么叫枚举呢?就是一次一次举例子。你要做一个好人,看到路边老大爷摔倒了,你要去扶他一下,这个叫做一个好人。这个就叫枚举。
Anthropic 的这个提示词,基本上是按枚举的方式写的,而且写了大量的反例。什么样做是正确的,什么样做是错误的。
有一个特别典型的案例,写到用户身心健康规则。它专门写了这么一个规则:要求 Claude 不能去诊断用户的心理状态,不能上来说“你疯了吧”;不能去强化负面体验,比如说用户现在已经很烦了,你还要再怼他一下,这事它都不能干。这个事老樊最喜欢干了,看来我做不了它这个活。
如果用户想结束对话,你不能继续粘着他。你不能说,感谢你跟我聊天,你跟我聊天我很开心,你现在要走了,你不要走,你再回来吧,或者你什么时候再回来。这事都是不允许的。你不能让用户成瘾,这些都是写在系统提示词里的。
有一个特别真实的案例,叫做饮食障碍求助资源里头,提示词明确说不要导向 NEDA,应该也是他们自己一个机构。为什么呢?那条热线已经永久停用了。
它为什么举了这么多例子在里头?因为你要去给它讲道理,要想抽象这个结果,它其实没法执行。你只有给它举特别明确的例子,它才知道,我要怎么去执行。
而且还有一点是什么?每一个这种负面的案例背后,一定是有人出过事。它一定是曾经把一个进行饮食障碍求助的人导向了 NEDA,然后这个人可能最后出现了一些不太好的结果,那么它就直接把这条记录写在里头就完了。
它不会去写一大堆啰里啰嗦的,说有人求助了,你应该先去确认,然后再确认这个电话还在不在,然后再怎么去。它不干这个事,就直接告诉你,别往那找就完了,直接把错误案例写在里头。
这不是抽象的价值观,它这就是产品事故之后留下来的补丁。

什么时候搜索、怎么搜索
还有一条很有意思,它告诉大家什么时候要搜索。我们经常感觉 AI 胡说八道,为什么呢?就是 AI 经常在我们问它问题的时候不搜索,它偷懒。
因为搜索需要消耗很多 token,需要去做工具调用嘛。它说我不搜索,我直接在自己的知识库里头找一找,然后就给你胡说八道了。这个就是有问题的。
那么它就告诉大家,我们应该怎么搜索,什么时候要搜索。像一个教学大纲一样告诉你,只要事情可能发生变化,就要去搜索。
比如说价格、法律、政策、软件版本、公司人事、模型发布、今天、最近、最新,只要你的提示词里出现这样的东西了,就必须要去搜索,否则的话就有可能会胡说八道。
而且要搜的时候,它还专门给你举例。如果你要去搜 iPhone,你就要去搜 2026 年的 iPhone,不要去搜 2025 年的 iPhone,要搜最新的 iPhone。它直接举例子说,这样是对的,那样是错的。
搜索完了以后,还要先看官网和一手来源,再做交叉验证。这是它怎么去做搜索。
版权红线和失败案例
还有一个特别有意思的点是什么呢?这一套系统提示词就是它的故障修复手册。出了错了,我怎么修的?
它有一个叫版权红线的东西。如果是别人的文章报道或者网页内容,不要大段照抄,必须用自己的话重新转述一遍。特别是歌词和诗句,比如有人写了诗,人家问你说这个诗怎么写的呀,你不要把那个诗抄回来,你要用自己的话重说一遍。
原因也很简单,Anthropic 自己就背过版权官司。图书案里头有 15 亿美金的和解框架,音乐出版商的歌词案到现在还没打完呢。所以别费这劲了,直接把它写在系统提示词里。下次再出现这种问你这个歌的歌词是什么的时候,你别输。
音乐版权商是怎么去取证的呢?就问它说,这歌词是什么?原来 Anthropic 就老老实实把这歌词原文吐出来,一个字不差。对方就把这个东西作为呈堂证供交上去了,说你看,我们这歌词是有版权的,你一问它什么,它就给我吐出来了,你赔钱吧。那么干脆就把这个失败的案例直接写进去,以后我再也不说了。
总结下来是什么?这种系统提示词的写法,就是不要只写“你是一位专家”,要写什么时候搜、怎么搜、什么时候拒绝、什么时候引用来源、什么时候少解释,而且要写反例。我到底是怎么错的,哪个是错的,哪个是对的,并且排在一起给模型去看。要把事故写成修复手册、修复日志。
就跟前边写的不要出 voice note,如果有人厌食症了,你不要把他送到哪去;如果有人搜索了歌词,不要把原文给他。这就属于你已经出过事故了,维修手册就这样了。
真正高级的系统提示词不是人设,而是伤疤长成的手册。
其实你看很多老师傅在教学生的时候也是这么教的:有一规则,你要去记住,然后就开始给你讲想当年怎么怎么回事。Anthropic 这 12 万字的系统提示词,大概就是这么一套东西出来的。
Artifacts:Claude 的前台作品窗口

这里头还有一个比较好玩的东西,叫 Artifacts。这个东西可能是下一波最容易被各家抄作业的一个小功能。这个东西叫 Claude 作品窗口。
就是我们在使用 Claude 这个 App 的时候,或者是在使用 Claude 网站的时候,它是分三栏的。最左边是一个列表栏,我们跟它有多少多少聊天;中间是聊天框;右边这一块,就是各种结果展示。
你要的很多东西,其实在聊天框里头出泡泡,它是展示不好的,而且你也没有办法在这个泡泡里跟它继续交互。所以很多的文档、代码、网页、图表,它都会在右侧给你去展示一下。
其他的这些模型做得就要差一些。它在这块就给你做好了。而且在这一块,系统提示词里头也专门写了,我们做好的作品展示的小窗口是可以存下来的,可以读取,可以写入,可以删除,可以列出,而且以后这些东西就通通都可以复用。
这个就是前台作品容器。如果我们把 Skills 的结果做完了以后,怎么能够又漂亮又方便地给大家展示出来,还可以让用户在这个小组件里做一些交互,比如说有几个按钮需要按一按,需要稍微输入点什么东西,不要都在聊天窗口里头,要稍微丰富一点点。而且这个东西是可以存起来去复用的。这块大概率会被别人继续去抄袭。
基本上现在咱们使用的 AI,很多标准都是 Anthropic 定的。所以 Artifacts 是 Claude 的前台窗口。它自己还有一个专门给前台窗口去做的虚拟机,大概意思是 Claude 的盗梦空间。
就是这个前台的小窗口在运作的时候,它实际上后台有一个小的虚拟机,它可以在里边再去调用大模型,再去跑一些代码,再去做各种各样的操作,最后给你把这个结果跑出来。这些东西通通都可以存起来。过这一步,聊天就开始变成应用生成了。所以这个是 12 万字系统提示词里的很重要的一部分。
Anthropic 想把 Claude Code 吃进服务端

这 12 万字的系统提示词到底给了我们什么呢?它告诉我们一件事情,就是 Anthropic 正在尝试把客户端 Claude Code 或者 Claude Cowork 这些东西重新吃进服务端去。Anthropic 真正的方向,是把 Claude Code 的工作流内化到 Claude.ai 的服务端去。
现在根据放出来的这些文件来看,它的 computer use,就是怎么去进行计算机操作的这些模块,很多是可以直接在后端就跑的。而且有很多技能清单,怎么读写文件,怎么跑代码,怎么做 PPT,怎么做 PDF,通通都是在服务端上有的这些东西。
它会教 Claude 怎么去读文件,怎么写文件,什么时候创造 Markdown,什么时候去创造 Word 文档。所以以后不需要 Claude Code 这种客户端了,它在服务端一次给你搞定。
所以 Claude Code 的终点不是命令行,而是被 Anthropic 吃进服务端,变成每一次聊天背后默认的一个工作台。
这也是为什么前面马斯克讲了说,你们可能跑分能够跑到跟 Fable 一样,但是你要想解决问题,你差的还很远。大概讲的就是这样的一个故事。
系统提示词还能做合规和中转
系统提示词确实是可以干很多很多奇葩的事情。在这里跟大家讲一个小故事吧。
大家都知道 OpenAI 是不可以给中国用户使用的,但其实有一个服务叫微软云服务,很多中国企业都是通过微软云服务去使用 OpenAI 的 API。他们在中国境内使用。
微软在 2024 年 10 月 21 日出了一个政策,中国内地的个人用户不能够再通过微软云去订阅这些 OpenAI 的入口了,但是企业用户仍然是可以去订阅的。而且它有一个巨大的客户叫做字节跳动,字节跳动每年向微软云去交的 OpenAI 订阅费是上亿美金的。
有些个人说,我们还想用微软云上面这个 OpenAI 的接口怎么办呢?国内是有代理商的。这些代理商或者说叫一些中转站吧,它是可以通过审核的,在中国可以合法地给大家提供,至少和中国的法律吧,提供 OpenAI 的 API 服务。
那他们是怎么干的呢?就是写系统提示词。在系统提示词里头,把这些中国政府要求的所有合规选项都给你写进去。我见过他们申请的这些证书,就是真的是在国内已经申请到了 OpenAI 在小范围内使用的一些证书。
但是前提也是,你从它这个接口上跑的这些 token 要相对贵一些,因为它等于在你的系统提示词里加东西了嘛。
所以系统提示词还是可以干很多事情的。讲到这再补充一点,如果大家去使用这些 token 中转站,那你也不知道它在你的系统提示词里头到底都加了点什么奇奇怪怪的东西。
这 12 万字能抄吗?
下一个问题,这 12 万字的系统提示词能抄吗?能学吗?它到底有什么用呢?
先讲一个特别有意思的点。当这 12 万字的系统提示词出来以后,马上就有人干了一个事,叫一行代码复活 Fable 5。
他们怎么干的呢?直接把这 12 万字的系统提示词塞给了 Claude Opus 4.8,说来吧,你看一下 Fable 5 的系统提示词,照着干活去吧。然后这个 Opus 4.8 就可以达到一部分 Fable 5 的能力。但是也只能叫一部分能力,或者叫看起来像 Fable,或者叫 Fable-lite 这样的能力。
原因很简单,这个系统提示词实际上相当于是一个方向盘,模型权重是发动机,工具链是道路,计费系统是收费站。你把方向盘抠下来装在别的车上,最多只能让它的开车姿势稍微炫酷一点点,但是你想跑同一套能力出来,还是有点难度的。
但是你可以拿这玩意去骗人了。你把这个系统提示词扔到智谱 GLM-5.2 上去,你说我现在给你卖这个 Fable 的大模型,你是有可能能骗得过去的,但是效果肯定还是有差距。所以直接去移一行代码复活 Fable 5,就是一个笑话,大家听一听就可以了。
那你说我们能抄这东西吗?首先讲,直接抄肯定是没用的,但是值得学习。要怎么学呢?要学它怎么去写拒绝,要学版权的一些规则,要去学它怎么去写这种小组件 Artifacts,怎么去用这个技能,怎么去做搜索,怎么去做缓存。
它写这套东西应该是会领先全世界,所以各家肯定都会去参考。这个不会有人照抄,但是都会去参考。
没有人说,有这东西我坚决不看,我特别有气节。因为每家的模型能力、工具接口、产品边界、法律风险,肯定跟它那个是不一样的,包括计费系统大家也不一样,用户群也不一样。所以大家会把它这套系统应用到我们自己的体系里去。各家的服务能力应该都会有一个巨大的提升。
系统提示词可以抄出一点味道来,但是抄不出一家工厂来。真正能够被复制的不是 Fable 的话术,而是 Anthropic 搭工厂的这个方法。
未来是 Harness Agent 的竞争

未来会向什么样的方向发展呢?Harness Agent 有一部分是开源的,但是并不都是开源的。
咱们现在讲的什么 OpenClaw,就是龙虾,这玩意是开源的,也就是跑系统提示词的这套东西。它负责什么?上下文、计划、工具调用、文件操作。但是并不是每一家都开源,而且现在每一个公司自己都在做自己的 Harness Agent。
现在跑得最多的也就是 OpenClaw。另外一个是 OpenCode,它是一个开源的 AI 编程智能体,MIT license,支持多模型、很多编程语言,可以同时在终端和桌面上跑。
比如说小米的 MiMo Code,就是小米直接在 OpenCode 上去分支做的,而且这个项目已经开源了,上面直接写的,说我这个就是从 OpenCode 里头派生出来的,保留了 OpenCode 的能力,增加了记忆、上下文管理、子智能体和自动循环。
MiniMax Code 我今天做口播稿的时候也用到了,这上头也写了,说我们用的是 OpenCode。还有一个东西叫 p agent,未来计划开源,但是现在还没有开源。
DeepSeek Code 这块也在做。DeepSeek 融资了 500 亿人民币以后,正在招募团队,正在开始开发。所以现在到底会做成什么样,还不知道。
其他的 OpenAI 的 Codex,官方已经开始支持外部模型了。原来只支持他们自己家的模型,这几天是在支持外部模型,但是我自己配并没有配好,反正配得不是很顺利。所以我现在又回来了,老老实实跑我的 20 美金额度去了。
Claude Code 生态特别有意思,它从来不说我允许外部人去改这个东西,允许外部模型去用,但是我们其实一直在用。我用了很长时间 Claude Code,都是使用的 MiniMax、Kimi、智谱。但是我最近是订了一个月的 Anthropic 套餐,所以我现在也可以直接用 Claude 的大模型。
马斯克刚刚 600 亿美金收了 Cursor,其实也在干同样的事情。
所以大模型开源只是第一波,现在就是 Harness Agent。现在很多开源的大模型公司,并没有把 Harness Agent 开源出来。为什么?就是你虽然模型开源了,但是你要想把它部署好,要想让它发挥原来的能力,你就老老实实回我这用。
所以我们可以在阿里的百炼云上去使用 GLM 的模型,使用 Kimi 和 MiniMax 模型,但是我们不要去用。如果你想要用这些模型,一定要到原厂的那个平台上去用,因为它的系统提示词以及它自己搭建的这套 Harness Agent,只在它原厂工作,其他地方是没有的。所以这一定要注意。
纯算力公司的空间会变小
这样的话,就得出了一个有趣的小结论:以后这种纯算力公司就没有生存余地了。
现在移动运营商说,我这开始出租算力了,我这买了显卡了,我自己去部署了,我把开源的这些大模型都部署上去了,大家上我这来买,我这比他们官方便宜。别费这个劲了,以后就没有这种生意可做了。
那以后怎么做呢?你像智谱现在玩的就是以前游戏公司那套活:咱们合作吧,你成为我的代理商,我去部署,部署完了我收钱,收完钱我给你分。就变成这样的一个方式了。这样的话,它就可以把这些 Harness Agent,包括这些系统提示词,直接应用到这些 AI 算力服务商的集群上去。
如果你说不,我一定要自己部署,我要用开源的,别费这劲。为什么呢?因为开源的,比如像 OpenCode 这些东西,它更新没那么快。这个东西更新迭代是非常非常快的。
而且这些开放的 Harness Agent 会干一个什么事?它们会同时去兼容一大堆乱七八糟的东西,它对于特定模型和特定工具的兼容性一定没有那么好。所以一定要用原厂的。
不要相信说,这个是一个算力公司,他自己有模型,自己去部署,他的算力系统做得还比别人好。别想这个。像国内比如硅基流动这种,它的日子可能就没有那么好过了。
最后的结论
最后的结论吧,AI 从模型时代进入了 Harness Agent 时代。虽然我们原来在客户端上也做了好多 Harness Agent,比如说龙虾,比如说爱马仕,比如说 p agent。但是按照 Claude 现在干的这个活来看,就是从这 12 万字的系统提示词上,我们可以看到什么?系统提示词不是魔法,它是一套产品规章。
这个能力不止来自于模型,还来自于工具链和运行环境。控制权在服务端,谁路由、谁计费、谁降级、谁下线,谁在掌握这个 AI,都在服务端搞定了。开源要追闭源,不只是追权重。原来大家都在比权重,以后就要开始追 Harness Agent 了。
我自己其实不太喜欢 Anthropic 公司,这个反复跟大家强调过。其实我也不太喜欢智谱,就是想学 Anthropic 的我都不喜欢。但是 Anthropic 有一点还是值得肯定的:它通过一次一次的代码泄露,客观上拉着整个 AI 产业链在前进。
它第一次 Claude Code 代码泄露的时候,OpenCode 也好,或者其他一大堆这些工具也好,就诞生了。原来其实大家追不上的。第二次 Claude Code 又泄露过一次,然后这些公司就又在进行大规模的升级。现在连系统提示词也泄露了,大家就可以去猜测,或者逆推它的服务端环境是什么样了。
所有人都会照着它这套系统提示词,去重新优化和升级自己的系统。所以它适时地拉动了整个行业的前进,甭管它是有意的还是无意的吧。
Claude 的系统提示词要求是,用户想走,不能要求他留下来。但是老樊没有这个系统提示词,所以我还是要求大家,听老樊的节目一定要记着点赞,下次还要来。
这就是咱们今天讲的故事。