继Model Context Protocol后,AI下一个新标准已现雏形?Anthropic凭“简单、开放、中立”三原则再次领先|Claude Skills、Anthropic、OpenAI
10 月 21
AIGC Agent Skills, AI Agents, AI工具, AI新标准, AI能力拓展, AI行业标准, Anthropic, Claude, Claude Code, Claude Skills, Excel处理, Function Call, Gemini, MCP, OpenAI, PPT制作, Word处理, 上下文工程, 企业级AI, 低代码AI, 大模型, 大模型应用, 技能固化, 技能重用, 提示词工程, 文档格式化, 格式化文档, 模型能力拓展, 自动化工作流, 自定义AI, 非程序员AI 继Model Context Protocol后,AI下一个新标准已现雏形?Anthropic凭“简单、开放、中立”三原则再次领先|Claude Skills、Anthropic、OpenAI已关闭评论
Anthropic Claude出了新工具,叫skills技能。这是不是MCP的升级版本呢?
大家好,欢迎收听老范讲故事的YouTube频道,咱们又有新玩具了。这一次,Anthropic出了一个东西,叫skills技能。它呢,应该是大模型功能拓展标准的一个新尝试。
大模型除了可以一本正经地胡说八道之外呢,你还需要去做一些技能拓展。比如说,你可以去写PPT,可以去做Excel,skills就主要干这玩意儿使的。这也算是AI agent以及上下文工程有可能会迎来的一个新标准,甚至呢,在部分功能上已经取代了MCP的功能。待会儿咱们再讲哪一部分可以取代MCP了。
到底什么是skills呢?它呢,是直接给Claude去赋能,让Claude code去做一些琐碎的工作。我举一个例子吧,比如说一个律所,你律所里头需要干一个什么事?就是你们出的所有的这个文件,它是有排版要求的。哪个地方用几号字,哪个地方用几号字,什么地方要用什么样的方式来表述,这个都是有要求的。以前我们律师给写的文件,大概每一个文章倒数第二段的时候,要写一个“以及”还是什么,反正有一个特别奇怪的要求。我第一次看到,我说:“你们为什么写这个?”他说:“律所要求就是必须这么写。”包括哪个标题需要使用什么字号、什么字体、字间距、行间距,他们都有要求。
这个东西你要让大模型去干活呢,就很费劲,特别是大模型每一次干出来不一样。那现在就是你,可以通过skills直接给它赋能,说我们以后按照这个律所什么什么要求去做,甚至是哪个版本的要求,去处理这些文件,最后处理出来的格式跟你的要求是一致的。
这东西呢,配置起来要比MCP省事。MCP配置还挺麻烦的,你需要在本地起服务器,或者就算是远程服务器,你也需要在本地去进行MCP服务的配置。这个配置的过程,可能普通非程序员不是说完全处理不了,但是还是比较费劲的。但是skills就省事多了,直接写个Markdown文件扔里头,完事。你就是建个目录,写一个skills.MD的一个文件,告诉它说,我什么样的字需要使用什么字号,或者说我这个信的结尾要加“此致敬礼”什么,你可以写一大堆这样的要求进去。写完了以后呢,直接在执行的时候告诉它说:“这是我的技能文件,请照着这个干活。”它就去照着执行去了。
而且skills呢,是可以在全客户端执行的。它可以在API上跑,也可以在Web端、手机端客户端,都是可以跑的。甚至呢,还可以在Claude code里头去跑,这个都没问题。如果你是在Claude code这样的本地的AI agent里头跑的话,它可以基本上覆盖MCP的功能。为什么?待会儿咱们细讲。在其他端这个还不太行,它是有一定限制的,至少目前还有吧。
现在呢,普通人都可以用这个skills工具。它主要是用两个格式的文件往里写东西:一个是Markdown。Markdown其实你基本上认为它是个纯文本就完了,只是呢,里头有一点点的简单的这种格式标记,写一个井号后边是大标题,两个井号是中标题,三个井号是小标题,它就是有一些这样的标记在里头,其他的也没有跟普通文本差异的地方。你用任何的纯文本编辑器都可以打开它,只是呢,没有渲染的效果而已。另外一个呢,叫YAML。YAML呢,实际上也是一种纯文本的配置文件,它呢,特点就是缩进,就是你通过缩进的方式来去写配置。现在大家看到很多的项目里头,都有这种文件,前面基本上是一个属性,打个冒号,后边是要赋的一个值。现在很多配置文件都是拿这玩意儿写的。
当然了,skills你要想处理一些更复杂的东西呢,它也允许你加代码进去,但是代码执行呢会比较受限制。因为这个skills是在哪跑的呢?它是在一个虚拟机里跑的,是在Anthropic本地的一个虚拟机里边去跑。这个虚拟机是不能联网的,也不能去调用很多的这种库文件进来,所以它的功能比较受限。
只有是在Claude code,就是在我们本地跑的时候,它可以联网。所以呢,你在本地跑的时候,它不是在虚拟机里头,你就可以基本上取代MCP的功能了。甚至你在skills里头直接写说,我要调一个什么API,这个API的调用方法是什么,返回值是什么,就是我们把很多那个API的文档文件直接贴在那个Markdown文件里就完事了,它就直接干活去了。所以只有在Claude code里头才可以替代MCP,如果不是在Claude code里头,它是不允许联网的。它的格式刚才我们讲了,就是一个叫skills.MD的一个文件放在一个目录里,或者再加一些其他的这种配置文件就完事了,极个别的情况需要加代码。
现在呢,Anthropic官方呢,也给出了一些skills,比如说一些Excel、Word、PDF、PPT这样的处理方式。我本来想去充一个Anthropic的会员,20美金充一个会员,后来翻了翻,发现这东西就完完全全的不支持中文,连繁体中文都不支持,最后算了,就不跟它费劲了。我相信skills应该很快就会普及出来,就像MCP一样,不是只有Anthropic自己可以用。
那skill适合做什么呢?最适合做文件处理、格式处理。如果在Claude code里头,基本上是全能的。技能和标准的固化和重用,这是它主要干的活。这个什么意思?比如说有一个人说:“我就擅长整理律所的文件格式。”这个东西呢,叫一个技能。你要再找一个人来说:“你给我把这个律所的文件都处理成我们要求的格式呢?”他需要重新学习。现在呢,等于是我们把这个东西固化下来了,说这个skills就叫“律所文件格式处理”,把它固定下来了。固定下来以后呢,就直接可以反复地重用了。我下一次需要去处理文件的时候,直接告诉Anthropic我的skills叫这个名字,去干活去吧,它就去干活去了。
Anthropic为什么总能拿出这种推动行业的新标准来呢?这样的一个功能,现在大家都在讨论的核心原因,就是大家觉得这可能是未来的标准。最早它推出的MCP标准虽然不完美,因为它调用的时候必须要起个服务器,这个事还是很讨厌的,但是呢,现在已经是标准了。谷歌、OpenAI都已经跟进了,国内的各大模型厂商、各大AI agent和工具厂商也都跟进了MCP了。原因很简单,就是它会秉承着叫“简单、开放、中立”这样的一个原则,这才是真正的关键。你把这事搞得很复杂,各种方方面面我都想到了,或者说我只能在自己的平台上使,我又不开放,或者说我虽然是中立的,但是呢,我们中间的这些代码是不给别人看的,其他的人你是不知道我怎么去调用这个功能的,这些都很难成为标准。你必须要简单、开放、中立。除了大模型的处理能力这些,MCP也好,skills也好,它基本上不依赖其他技术,这个也是非常非常重要的。你说我现在做了一个新的标准出来,我需要依赖很多很多东西,这个就很麻烦。像MCP呢,还是需要依赖一些外部服务,需要依赖一些这样的技术,但是skills就更简单,什么也不依赖,你直接拿出来就可以用的东西。
大模型能力拓展的尝试呢,其实一直在持续。从ChatGPT 3.5开始,GPT进入到公众视野以后,大家一直在尝试这东西到底能干嘛,除了一本正经地胡说八道之外还能干点什么。现在每天大模型的能力在上升,我又训练出GPT-5了,又训练出GPT-6了,但是还有一些东西呢,是它搞不定的。第一个是角色的固化,或者说技能的固化与重用,这个事情呢,是大模型自己搞不定的,因为大模型都是按照通用的模式来去训练的。另外一个就是要调用外部工具,我不可能自己把所有外部工具都跑通,它真跑通了就吓人了,有可能这个人类就没有存在的必要了。它还是有一定的能力边界的,这一块呢,就是在不断地拓展。
很多人可能会记得,咱们经常在写提示词的时候,第一句话干嘛?第一句话赋能,说“你是一个编辑”,“你是一个律所的文档格式大师”。我们经常会写这样的话在第一句。那你说这个真的会让ChatGPT也好,Anthropic Claude也好,像律所里边的文档编辑大师一样工作吗?是不能的。为什么呢?因为每个律所的文档格式要求是不一样的,它也不知道你要用什么方式去干活。所以你去写提示词的时候,对大模型进行角色赋值,说“你是什么什么”的时候,到底起什么作用?告诉大家,不会提升答案的质量,他原来该答什么还是答什么,但是呢,会让大模型将结果模仿成指定角色的方式说出来。他会去想说,这样的这个角色是怎么说话的,我先生成结果,然后模仿这个人的方式再重新说一遍。这个就是我们每一次去指定说“你是谁谁谁”的时候得到的一个结果。这肯定不是我们所希望的嘛,我们还是希望它真的具有相应的能力。
现在我们就要去做固定技能以及能力拓展,咱们做了很多尝试。前面OpenAI做的一个东西叫GPTS,这个东西呢,推出来的时候我就说这玩意没戏,现在呢,基本上已经没有什么人去玩耍了。GPTS主要干的活,实际上就是一个固定技能,当然它还有很多其他的功能,那个调用处理起来就非常非常麻烦了,你需要在里头写程序的。而且GPTS还有一个问题是什么呢?就是它必须在ChatGPT里头跑,它不能出来,这个是很麻烦的。刚才我们讲了,你要想确立标准的话,必须得中立,它的中立性就没有了。而且这个东西做起来其实没有那么容易,GPTS刚出来的时候我也做过一些,效果呢,差强人意,不一定每一次按照你的要求去做,因为当时模型的能力也没有那么强。折腾了半天GPTS以后,发现不是我想要的东西,所以现在呢,基本上玩的人很少了。
第二个就是function call,就是直接让大模型去通过代码干活。这块呢,甭管是国内的模型,还是国外的这种主流模型,都是支持function call。OpenAI、Anthropic的Claude,还有Grok、Gemini,都是支持function call。但是呢,这个东西比较麻烦,在哪呢?你必须写程序,你不写程序这事搞不定。只能在API里头使,你说我在客户端用,我在Web端用,这事你是没有办法拿它干活的。所以这东西呢,对于非程序员来说,基本上相当于没有。这就是function call的一个情况。
再往后呢,就是MCP了。MCP呢,比function call要简单一些,不再需要那么高的程序能力了。我可以说直接把一个MCP的配置文件写到比如Cursor,或者写到一些其他的这种支持MCP的客户端里去,他就可以去干活了。这个对于很多这种非程序员来说呢,就已经比较友好了。现在呢,你要去调MCP,可以写程序,也可以直接在支持它的客户端里配置就可以用。现在呢,有很大一部分的服务平台都将自己的服务包装成了MCP。你比如说支付宝、微信支付、高德地图、百度地图、大众点评,都开始出MCP了。这一块呢,就是只要上大模型,你挂上这些MCP以后,就可以实现相应的一些功能了。MCP主要干的活是什么呢?就是能力拓展,它并没有说把一些能力固化下来。你说我告诉大模型我有MCP了,那不能保证你每一次输出的结果都是你想要的,但是呢,它可以保证说大模型可以去调用百度地图了,知道这周围有什么好吃的,这个他可以去干了。
现在呢,skills来了。skills呢,和MCP比起来,对于非程序员就更加友好。原来MCP你要去做配置的话,还需要去写JSON,JSON还算是一种程序员使用的配置语言,而现在的话直接Markdown了,你就直接用自然语言去写就完了。JSON的话你要是把它写错了,大模型拿它也没办法,但是Markdown的话,你写错了以后,比如我写了几个错别字在里头,或者哪个地方我写点病句在里头,大模型就直接处理掉了。所以这一块容错率还是比较高的。它呢,可以很好地将技能固化下来,让你再去重用,也可以去拓展一些外部功能。但是拓展外部功能就只能是在Claude code里头用。我相信未来可能会有更多的客户端去支持skills,只要是有客户端支持的skills,就可以去允许你拓展外部功能,可以去联网。否则的话,你跑到Anthropic的自己的服务器上开虚拟机的话,它就不会让你干这个活。现在呢,在网页、API都可以去跑,但是网页、API包括手机端、PC端的这些客户端里头,它都是调用的Anthropic自己的虚拟机,不允许联网。如果你是在本地跑,它是允许你去联网的。
那你说未来大家会不会跟进呢?一个新技术,你不能说上来我就要做标准,这事是不对的。一个新技术出来了以后,一定是什么呢?一定是自己先用起来,大家喜欢了以后,逐渐去遵循你为标准。而且你前提还得是开放,你如果不开放的话,别人想去遵循你为标准也没有这个能力。我觉得呢,大概率skills会成为下一个标准,继MCP之后的下一个标准。为什么呢?就是skills的技术是完全中立的一个技术,因为你写进去的就是一堆Markdown,其他的没有什么,就算写一些Python代码,或者是一些TypeScript,或者是其他的这种代码进去,它要求的也都比较简单,不会要求写特别复杂的代码,因为它是在一个没有网络、也不可以调用外部代码库的一个虚拟机里去执行的,所以这个代码也不会太复杂。所以第一个,完全中立。第二个呢,就是它直接开放的,Markdown文件拿出来看就完了,我到底是一个什么样排版的文件,我直接看就可以了。
WPS里头有非常非常多的模板库,班级的点名表,或者是各种的报告,它都有模板库。以后这些东西通通都可以写成skills,我们就直接调用的时候,就可以产生出符合各个单位里头要求的格式化文档,这个还是很棒的。甚至呢,可以进行一些逻辑上的检查,比如说所有的股权算完cap table以后,加起来必须是100%,你这些东西通通都可以在skills里去干。现在大量的skills文件呢,已经开源了,都在GitHub上,大家可以自己去找去,直接下载下来就可以用。而且支持skills这件事呢,本身对于大模型也没有什么新的要求,完完全全是可以在这种客户端上就跑。你比如说Cursor或者是VS Code,这些东西就直接可以去支持了,并不需要模型做任何的修改,也不需要在模型API上做特别多的调整。所以这个东西成为标准的门槛是比较低的。
skills对模型唯一的要求是什么?就是你模型的上下文要进一步的提升,要有更好的指令依存度。我要求你干什么,你必须老老实实给我干去,这就是skills对模型的要求。现在Anthropic Claude对于skills的这种要求,特别是现在的4.5的版本,基本上是可以满足的。Gemini 2.5相信应该也没有任何问题,甚至马上要出Gemini 3,可能这个礼拜就要出Gemini 3,做这些事情应该也都是OK的。GPT-5处理skills这样的一些小问题,应该也没有任何毛病。国内的话,豆包、DeepSeek和千问应该也都可以完成相应的这种改造,就是你模型不用动,直接在这个客户端上处理一下就可以了。
未来的话,可能就是我们只要告诉大模型说,我有哪些function就是哪些功能,哪些MCP,比如说我可以调用百度地图、高德地图,然后呢,我们再告诉他,我还有哪些skills,哪些技能,我想干什么,然后它就给你干去了。我举一个例子吧,我们现在有MCP是高德地图的,有一个skills叫做“Excel格式整理和数据校验”,然后我们就可以告诉它什么呢?我现在想知道某一个地区周围有哪些日料店,他们都是一个什么样的情况,按照这个打星的情况去排序,还是按照价格排序,还是按照一个什么样的方式排序,然后呢,请给我去进行什么样的格式。把这个命令整个交给这个大模型以后,它就会自动地去调用MCP得到某一个地区附近的日料店,然后把里头所有数据都拎出来,再按照我们的要求调用skills,把这些东西通通都塞到Excel里头去进行校验、进行排序、进行这种格式的梳理,然后生成一个我们所要的这种Excel文件出来。它就是这么干活的。
跟这种标准,国内的这些公司应该会跑得很快的。国内一大堆抄袭Claude code的这种工具,像现在阿里、字节、腾讯都开始出这种客户端上直接进行命令行输入的、类似于Claude code的工具了,他们想去支持skills还是非常容易的。国内的这些AI IDE应该也会第一批跟上。云厂商跟进应该会更快一些,因为刚才我们讲了,skills执行的一个原理是开一台虚拟机,处理完了以后把它关上,这个对于所有的云服务厂商来说,“这个我们熟”,他们会更快的跟上。而国内最大的云厂商是谁?阿里。千问未来去支持skills应该是顺理成章的,国内MCP最早支持的应该也是阿里。
总结一下吧,你想去建立一个新的AI标准,你必须按照“简单、开放、中立”这个标准去,而且除了大模型能力之外,你其他的都不能要求。这个就是MCP成功的原因,也是skills我认为未来有可能会成功的一个底层逻辑。Anthropic呢,可以不断地确立新的行业标准,就是遵守了简单、开放、中立这样的一些基础。当然优点呢,是标准性;缺点是什么呢?就是不能吃独食。很多国内的这些厂商说,我也要去建立标准,建立了半天,他老惦记吃独食,这事你肯定就做不起来。现在AI领域里头是什么?就是一帮巨头,甭管美国的OpenAI、Anthropic、谷歌、Grok,这些都是巨头,非常非常值钱的公司。国内的字节、阿里,这都是巨头,可能DeepSeek稍微小一点点。在这个时候,没有谁说我确立一个标准,你必须在我这跑,其他人都不兼容,这事是跑不起来的。OpenAI就老惦记干这种活,吃个独食,把自己的私货加进去,但是效果非常的不好,所以他建立的各种标准一般是没有人用的,都是Anthropic在建立标准,大家去使用。
好,这就是今天要给大家讲的故事。感谢大家收听,请帮忙点赞、点小铃铛、参加Discord讨论群,也欢迎有兴趣、有能力的朋友加入我们的付费频道。再见。
RSS