继Model Context Protocol后,AI下一个新标准已现雏形?Anthropic凭“简单、开放、中立”三原则再次领先|Claude Skills、Anthropic、OpenAI

继Model Context Protocol后,AI下一个新标准已现雏形?Anthropic凭“简单、开放、中立”三原则再次领先|Claude Skills、Anthropic、OpenAI已关闭评论

Anthropic Claude出了新工具,叫skills技能。这是不是MCP的升级版本呢?

大家好,欢迎收听老范讲故事的YouTube频道,咱们又有新玩具了。这一次,Anthropic出了一个东西,叫skills技能。它呢,应该是大模型功能拓展标准的一个新尝试。

大模型除了可以一本正经地胡说八道之外呢,你还需要去做一些技能拓展。比如说,你可以去写PPT,可以去做Excel,skills就主要干这玩意儿使的。这也算是AI agent以及上下文工程有可能会迎来的一个新标准,甚至呢,在部分功能上已经取代了MCP的功能。待会儿咱们再讲哪一部分可以取代MCP了。

到底什么是skills呢?它呢,是直接给Claude去赋能,让Claude code去做一些琐碎的工作。我举一个例子吧,比如说一个律所,你律所里头需要干一个什么事?就是你们出的所有的这个文件,它是有排版要求的。哪个地方用几号字,哪个地方用几号字,什么地方要用什么样的方式来表述,这个都是有要求的。以前我们律师给写的文件,大概每一个文章倒数第二段的时候,要写一个“以及”还是什么,反正有一个特别奇怪的要求。我第一次看到,我说:“你们为什么写这个?”他说:“律所要求就是必须这么写。”包括哪个标题需要使用什么字号、什么字体、字间距、行间距,他们都有要求。

这个东西你要让大模型去干活呢,就很费劲,特别是大模型每一次干出来不一样。那现在就是你,可以通过skills直接给它赋能,说我们以后按照这个律所什么什么要求去做,甚至是哪个版本的要求,去处理这些文件,最后处理出来的格式跟你的要求是一致的。

这东西呢,配置起来要比MCP省事。MCP配置还挺麻烦的,你需要在本地起服务器,或者就算是远程服务器,你也需要在本地去进行MCP服务的配置。这个配置的过程,可能普通非程序员不是说完全处理不了,但是还是比较费劲的。但是skills就省事多了,直接写个Markdown文件扔里头,完事。你就是建个目录,写一个skills.MD的一个文件,告诉它说,我什么样的字需要使用什么字号,或者说我这个信的结尾要加“此致敬礼”什么,你可以写一大堆这样的要求进去。写完了以后呢,直接在执行的时候告诉它说:“这是我的技能文件,请照着这个干活。”它就去照着执行去了。

而且skills呢,是可以在全客户端执行的。它可以在API上跑,也可以在Web端、手机端客户端,都是可以跑的。甚至呢,还可以在Claude code里头去跑,这个都没问题。如果你是在Claude code这样的本地的AI agent里头跑的话,它可以基本上覆盖MCP的功能。为什么?待会儿咱们细讲。在其他端这个还不太行,它是有一定限制的,至少目前还有吧。

现在呢,普通人都可以用这个skills工具。它主要是用两个格式的文件往里写东西:一个是Markdown。Markdown其实你基本上认为它是个纯文本就完了,只是呢,里头有一点点的简单的这种格式标记,写一个井号后边是大标题,两个井号是中标题,三个井号是小标题,它就是有一些这样的标记在里头,其他的也没有跟普通文本差异的地方。你用任何的纯文本编辑器都可以打开它,只是呢,没有渲染的效果而已。另外一个呢,叫YAML。YAML呢,实际上也是一种纯文本的配置文件,它呢,特点就是缩进,就是你通过缩进的方式来去写配置。现在大家看到很多的项目里头,都有这种文件,前面基本上是一个属性,打个冒号,后边是要赋的一个值。现在很多配置文件都是拿这玩意儿写的。

当然了,skills你要想处理一些更复杂的东西呢,它也允许你加代码进去,但是代码执行呢会比较受限制。因为这个skills是在哪跑的呢?它是在一个虚拟机里跑的,是在Anthropic本地的一个虚拟机里边去跑。这个虚拟机是不能联网的,也不能去调用很多的这种库文件进来,所以它的功能比较受限。

只有是在Claude code,就是在我们本地跑的时候,它可以联网。所以呢,你在本地跑的时候,它不是在虚拟机里头,你就可以基本上取代MCP的功能了。甚至你在skills里头直接写说,我要调一个什么API,这个API的调用方法是什么,返回值是什么,就是我们把很多那个API的文档文件直接贴在那个Markdown文件里就完事了,它就直接干活去了。所以只有在Claude code里头才可以替代MCP,如果不是在Claude code里头,它是不允许联网的。它的格式刚才我们讲了,就是一个叫skills.MD的一个文件放在一个目录里,或者再加一些其他的这种配置文件就完事了,极个别的情况需要加代码。

现在呢,Anthropic官方呢,也给出了一些skills,比如说一些Excel、Word、PDF、PPT这样的处理方式。我本来想去充一个Anthropic的会员,20美金充一个会员,后来翻了翻,发现这东西就完完全全的不支持中文,连繁体中文都不支持,最后算了,就不跟它费劲了。我相信skills应该很快就会普及出来,就像MCP一样,不是只有Anthropic自己可以用。

那skill适合做什么呢?最适合做文件处理、格式处理。如果在Claude code里头,基本上是全能的。技能和标准的固化和重用,这是它主要干的活。这个什么意思?比如说有一个人说:“我就擅长整理律所的文件格式。”这个东西呢,叫一个技能。你要再找一个人来说:“你给我把这个律所的文件都处理成我们要求的格式呢?”他需要重新学习。现在呢,等于是我们把这个东西固化下来了,说这个skills就叫“律所文件格式处理”,把它固定下来了。固定下来以后呢,就直接可以反复地重用了。我下一次需要去处理文件的时候,直接告诉Anthropic我的skills叫这个名字,去干活去吧,它就去干活去了。

Anthropic为什么总能拿出这种推动行业的新标准来呢?这样的一个功能,现在大家都在讨论的核心原因,就是大家觉得这可能是未来的标准。最早它推出的MCP标准虽然不完美,因为它调用的时候必须要起个服务器,这个事还是很讨厌的,但是呢,现在已经是标准了。谷歌、OpenAI都已经跟进了,国内的各大模型厂商、各大AI agent和工具厂商也都跟进了MCP了。原因很简单,就是它会秉承着叫“简单、开放、中立”这样的一个原则,这才是真正的关键。你把这事搞得很复杂,各种方方面面我都想到了,或者说我只能在自己的平台上使,我又不开放,或者说我虽然是中立的,但是呢,我们中间的这些代码是不给别人看的,其他的人你是不知道我怎么去调用这个功能的,这些都很难成为标准。你必须要简单、开放、中立。除了大模型的处理能力这些,MCP也好,skills也好,它基本上不依赖其他技术,这个也是非常非常重要的。你说我现在做了一个新的标准出来,我需要依赖很多很多东西,这个就很麻烦。像MCP呢,还是需要依赖一些外部服务,需要依赖一些这样的技术,但是skills就更简单,什么也不依赖,你直接拿出来就可以用的东西。

大模型能力拓展的尝试呢,其实一直在持续。从ChatGPT 3.5开始,GPT进入到公众视野以后,大家一直在尝试这东西到底能干嘛,除了一本正经地胡说八道之外还能干点什么。现在每天大模型的能力在上升,我又训练出GPT-5了,又训练出GPT-6了,但是还有一些东西呢,是它搞不定的。第一个是角色的固化,或者说技能的固化与重用,这个事情呢,是大模型自己搞不定的,因为大模型都是按照通用的模式来去训练的。另外一个就是要调用外部工具,我不可能自己把所有外部工具都跑通,它真跑通了就吓人了,有可能这个人类就没有存在的必要了。它还是有一定的能力边界的,这一块呢,就是在不断地拓展。

很多人可能会记得,咱们经常在写提示词的时候,第一句话干嘛?第一句话赋能,说“你是一个编辑”,“你是一个律所的文档格式大师”。我们经常会写这样的话在第一句。那你说这个真的会让ChatGPT也好,Anthropic Claude也好,像律所里边的文档编辑大师一样工作吗?是不能的。为什么呢?因为每个律所的文档格式要求是不一样的,它也不知道你要用什么方式去干活。所以你去写提示词的时候,对大模型进行角色赋值,说“你是什么什么”的时候,到底起什么作用?告诉大家,不会提升答案的质量,他原来该答什么还是答什么,但是呢,会让大模型将结果模仿成指定角色的方式说出来。他会去想说,这样的这个角色是怎么说话的,我先生成结果,然后模仿这个人的方式再重新说一遍。这个就是我们每一次去指定说“你是谁谁谁”的时候得到的一个结果。这肯定不是我们所希望的嘛,我们还是希望它真的具有相应的能力。

现在我们就要去做固定技能以及能力拓展,咱们做了很多尝试。前面OpenAI做的一个东西叫GPTS,这个东西呢,推出来的时候我就说这玩意没戏,现在呢,基本上已经没有什么人去玩耍了。GPTS主要干的活,实际上就是一个固定技能,当然它还有很多其他的功能,那个调用处理起来就非常非常麻烦了,你需要在里头写程序的。而且GPTS还有一个问题是什么呢?就是它必须在ChatGPT里头跑,它不能出来,这个是很麻烦的。刚才我们讲了,你要想确立标准的话,必须得中立,它的中立性就没有了。而且这个东西做起来其实没有那么容易,GPTS刚出来的时候我也做过一些,效果呢,差强人意,不一定每一次按照你的要求去做,因为当时模型的能力也没有那么强。折腾了半天GPTS以后,发现不是我想要的东西,所以现在呢,基本上玩的人很少了。

第二个就是function call,就是直接让大模型去通过代码干活。这块呢,甭管是国内的模型,还是国外的这种主流模型,都是支持function call。OpenAI、Anthropic的Claude,还有Grok、Gemini,都是支持function call。但是呢,这个东西比较麻烦,在哪呢?你必须写程序,你不写程序这事搞不定。只能在API里头使,你说我在客户端用,我在Web端用,这事你是没有办法拿它干活的。所以这东西呢,对于非程序员来说,基本上相当于没有。这就是function call的一个情况。

再往后呢,就是MCP了。MCP呢,比function call要简单一些,不再需要那么高的程序能力了。我可以说直接把一个MCP的配置文件写到比如Cursor,或者写到一些其他的这种支持MCP的客户端里去,他就可以去干活了。这个对于很多这种非程序员来说呢,就已经比较友好了。现在呢,你要去调MCP,可以写程序,也可以直接在支持它的客户端里配置就可以用。现在呢,有很大一部分的服务平台都将自己的服务包装成了MCP。你比如说支付宝、微信支付、高德地图、百度地图、大众点评,都开始出MCP了。这一块呢,就是只要上大模型,你挂上这些MCP以后,就可以实现相应的一些功能了。MCP主要干的活是什么呢?就是能力拓展,它并没有说把一些能力固化下来。你说我告诉大模型我有MCP了,那不能保证你每一次输出的结果都是你想要的,但是呢,它可以保证说大模型可以去调用百度地图了,知道这周围有什么好吃的,这个他可以去干了。

现在呢,skills来了。skills呢,和MCP比起来,对于非程序员就更加友好。原来MCP你要去做配置的话,还需要去写JSON,JSON还算是一种程序员使用的配置语言,而现在的话直接Markdown了,你就直接用自然语言去写就完了。JSON的话你要是把它写错了,大模型拿它也没办法,但是Markdown的话,你写错了以后,比如我写了几个错别字在里头,或者哪个地方我写点病句在里头,大模型就直接处理掉了。所以这一块容错率还是比较高的。它呢,可以很好地将技能固化下来,让你再去重用,也可以去拓展一些外部功能。但是拓展外部功能就只能是在Claude code里头用。我相信未来可能会有更多的客户端去支持skills,只要是有客户端支持的skills,就可以去允许你拓展外部功能,可以去联网。否则的话,你跑到Anthropic的自己的服务器上开虚拟机的话,它就不会让你干这个活。现在呢,在网页、API都可以去跑,但是网页、API包括手机端、PC端的这些客户端里头,它都是调用的Anthropic自己的虚拟机,不允许联网。如果你是在本地跑,它是允许你去联网的。

那你说未来大家会不会跟进呢?一个新技术,你不能说上来我就要做标准,这事是不对的。一个新技术出来了以后,一定是什么呢?一定是自己先用起来,大家喜欢了以后,逐渐去遵循你为标准。而且你前提还得是开放,你如果不开放的话,别人想去遵循你为标准也没有这个能力。我觉得呢,大概率skills会成为下一个标准,继MCP之后的下一个标准。为什么呢?就是skills的技术是完全中立的一个技术,因为你写进去的就是一堆Markdown,其他的没有什么,就算写一些Python代码,或者是一些TypeScript,或者是其他的这种代码进去,它要求的也都比较简单,不会要求写特别复杂的代码,因为它是在一个没有网络、也不可以调用外部代码库的一个虚拟机里去执行的,所以这个代码也不会太复杂。所以第一个,完全中立。第二个呢,就是它直接开放的,Markdown文件拿出来看就完了,我到底是一个什么样排版的文件,我直接看就可以了。

WPS里头有非常非常多的模板库,班级的点名表,或者是各种的报告,它都有模板库。以后这些东西通通都可以写成skills,我们就直接调用的时候,就可以产生出符合各个单位里头要求的格式化文档,这个还是很棒的。甚至呢,可以进行一些逻辑上的检查,比如说所有的股权算完cap table以后,加起来必须是100%,你这些东西通通都可以在skills里去干。现在大量的skills文件呢,已经开源了,都在GitHub上,大家可以自己去找去,直接下载下来就可以用。而且支持skills这件事呢,本身对于大模型也没有什么新的要求,完完全全是可以在这种客户端上就跑。你比如说Cursor或者是VS Code,这些东西就直接可以去支持了,并不需要模型做任何的修改,也不需要在模型API上做特别多的调整。所以这个东西成为标准的门槛是比较低的。

skills对模型唯一的要求是什么?就是你模型的上下文要进一步的提升,要有更好的指令依存度。我要求你干什么,你必须老老实实给我干去,这就是skills对模型的要求。现在Anthropic Claude对于skills的这种要求,特别是现在的4.5的版本,基本上是可以满足的。Gemini 2.5相信应该也没有任何问题,甚至马上要出Gemini 3,可能这个礼拜就要出Gemini 3,做这些事情应该也都是OK的。GPT-5处理skills这样的一些小问题,应该也没有任何毛病。国内的话,豆包、DeepSeek和千问应该也都可以完成相应的这种改造,就是你模型不用动,直接在这个客户端上处理一下就可以了。

未来的话,可能就是我们只要告诉大模型说,我有哪些function就是哪些功能,哪些MCP,比如说我可以调用百度地图、高德地图,然后呢,我们再告诉他,我还有哪些skills,哪些技能,我想干什么,然后它就给你干去了。我举一个例子吧,我们现在有MCP是高德地图的,有一个skills叫做“Excel格式整理和数据校验”,然后我们就可以告诉它什么呢?我现在想知道某一个地区周围有哪些日料店,他们都是一个什么样的情况,按照这个打星的情况去排序,还是按照价格排序,还是按照一个什么样的方式排序,然后呢,请给我去进行什么样的格式。把这个命令整个交给这个大模型以后,它就会自动地去调用MCP得到某一个地区附近的日料店,然后把里头所有数据都拎出来,再按照我们的要求调用skills,把这些东西通通都塞到Excel里头去进行校验、进行排序、进行这种格式的梳理,然后生成一个我们所要的这种Excel文件出来。它就是这么干活的。

跟这种标准,国内的这些公司应该会跑得很快的。国内一大堆抄袭Claude code的这种工具,像现在阿里、字节、腾讯都开始出这种客户端上直接进行命令行输入的、类似于Claude code的工具了,他们想去支持skills还是非常容易的。国内的这些AI IDE应该也会第一批跟上。云厂商跟进应该会更快一些,因为刚才我们讲了,skills执行的一个原理是开一台虚拟机,处理完了以后把它关上,这个对于所有的云服务厂商来说,“这个我们熟”,他们会更快的跟上。而国内最大的云厂商是谁?阿里。千问未来去支持skills应该是顺理成章的,国内MCP最早支持的应该也是阿里。

总结一下吧,你想去建立一个新的AI标准,你必须按照“简单、开放、中立”这个标准去,而且除了大模型能力之外,你其他的都不能要求。这个就是MCP成功的原因,也是skills我认为未来有可能会成功的一个底层逻辑。Anthropic呢,可以不断地确立新的行业标准,就是遵守了简单、开放、中立这样的一些基础。当然优点呢,是标准性;缺点是什么呢?就是不能吃独食。很多国内的这些厂商说,我也要去建立标准,建立了半天,他老惦记吃独食,这事你肯定就做不起来。现在AI领域里头是什么?就是一帮巨头,甭管美国的OpenAI、Anthropic、谷歌、Grok,这些都是巨头,非常非常值钱的公司。国内的字节、阿里,这都是巨头,可能DeepSeek稍微小一点点。在这个时候,没有谁说我确立一个标准,你必须在我这跑,其他人都不兼容,这事是跑不起来的。OpenAI就老惦记干这种活,吃个独食,把自己的私货加进去,但是效果非常的不好,所以他建立的各种标准一般是没有人用的,都是Anthropic在建立标准,大家去使用。

好,这就是今天要给大家讲的故事。感谢大家收听,请帮忙点赞、点小铃铛、参加Discord讨论群,也欢迎有兴趣、有能力的朋友加入我们的付费频道。再见。

Comments are closed.