Anthropic Claude – 老范讲故事｜AI、大模型与商业世界的故事

AI客服越智能越坑人？坑了商家、坑客户，咋办？

老范讲故事 — Tue, 10 Mar 2026 00:42:16 +0000

AI客服，有没有把你逼疯过呢？

大家好，欢迎收听老范讲故事的 YouTube 频道。

AI客服，这个AI最原始的应用场景里头，正在同时逼疯商家和顾客。

Reddit上最近有一个热帖，一位英国的小商家出来抱怨，说客户花了一个多小时，跟网站的AI助手周旋闲聊，最终让机器人给自己编了一个折扣码，要求给8,000英镑的商品打两折。就是人家愿意付1,600英镑。

具体他卖什么也没说。这个商家现在就很痛苦，到底是不是要履约呢？这个实在是一个艰难的选择。

今天这故事，咱们分五段来讲。

第一段，AI客服的正面反馈，肯定还是不少的。因为AI这东西最开始出来，就是准备让它去做客服的。
第2个，让商家崩溃的案例有哪些？咱们罗列一下。
第3个，让顾客崩溃的案例有哪些？咱们也得罗列一下。
第4个，AI客服产品设计的思路，可能从来就不是解决问题。这个跟大家认知，可能会有一点点小偏差。
最后，咱们能干点什么呀？AI客服这事，肯定谁也躲不过去，一定未来会越来越多。咱们到底怎么做？

AI客服的正面反馈

首先，AI客服正面的反馈，肯定是不少的。AI最早就是做这个的。在ChatGPT出来之前，AI就已经开始去做客服了。

Lyft，也就是跟Uber竞争的另外一个打车软件，他们就使用Anthropic的Claude大模型，平均客服解决时间下降87%。

对于占大多数客服请求的、高频的、标准化的简单问题，AI绝对是很强大的帮手。相信使用AI客服的很多商家，都会有正面的反馈。

不过，上面这些报道都是官方报道，就是Lyft这公司自己报的。应该还有一些并不全面的地方。

比如说，个别难以处理的问题，是不是真的转到人工了，得到了处理？这个事就不知道了。

即使是经过AI和人工的两层处理之后，总的问题解决比例到底是上升了还是下降了，也没有给出一个答案。

但是，总会有倒霉蛋。不可能所有人的问题都得到满意解决。问题得不到解决，最后会被AI逼疯，这个是无可避免的。

还有一点没有报道的是什么？上了这套系统以后，到底裁员了多少人？他没说。这种系统的上线，必然会伴随着裁员。

让商家崩溃的案例有哪些

那么，让商家崩溃的案例有哪些呢？

去年6月份，Anthropic自己做了一个实验，让AI店长去卖东西。现在很少有人敢让AI直接上去卖东西了。闲鱼好像有，你如果在闲鱼上卖一些东西的话，它是有AI去负责成单的。但是有的时候，那个AI也会犯二，直接把这个价格压得很低，就把单子成交了。

去年6月份，Anthropic的这个实验，完全被人类玩坏了。这个实验项目，用户就是好事的记者和Anthropic自己的员工。这些人不断地测试，如何通过提示词诱导Claude越狱。最终，这个商店血本无归，大量的商品被免费赠送了，或者是打了非常非常低的折扣，就这么卖出去了。

这是一个反面典型。说明什么呢？就是尽量不要把定价、折扣、优惠这种事情交给AI去干，它搞不定的。

早期还有一个案例是什么呢？2023年，雪佛兰的经销商，当时他们使用的是ChatGPT的聊天机器人。最终，机器人被诱导，用一美元的价格出售了一辆雪佛兰太浩的汽车。

后来我查了一下，太浩是美式全尺寸SUV。这个车在国内大概是卖60万到70万人民币一台。人家一美元给卖了。就算加上税的话，我估计这个车在美国应该也是在七八万之间吧，具体我没有查，但反正肯定很贵的一辆车，一美元给卖了。

“我说的这个话没问题，我说了就算数，有法律效力。”

当然，这个车最终没有成交。这个聊天机器人同意成交的内容，并不具备法律约束力。最后，雪佛兰去找了人裁决，做了这样的判决下来。媒体对这件事情的定性，基本都是“被诱导说出的荒唐报价”，而不是“成交生效”。所以这个事情就这么过去了。

聊天机器人马上下岗，回厂整修去了。

上个月，英国的一个小商家，就是刚才咱们一开头讲那故事，AI聊天助手被套出了80% off的折扣券。

他是怎么做的呢？客户反复去跟机器人聊天，闲聊了一个多小时。聊什么呢？他诱导机器人做算术。这个数乘那个数得多少？如果这个价格是这样的，那么打多少折扣以后应该是什么样的？如果价格是那样的话，打多少折扣是什么样的？

他反复跟AI在聊，聊完了以后，他还夸这个AI，说：

“你好棒啊，你算得真厉害。你看我都算不明白，你一下就算明白了。”

再往后，诱导AI假设有个订单：

“你给我打一个80% off，你给我生成一个折扣码。”

这个AI就真的给它生成了一个折扣码。

但是，这个折扣码并没有办法去通过平台的认证。客户最后怎么办呢？把聊天截图以及这个折扣码，发到这个商品的备注里去了，要求用这样的一个折扣，1,600英镑去买那个8,000英镑的东西。

这个商家现在也很痛苦，这个怎么弄？

其实，这个商品你本身并不需要成交，也不需要承担什么法律后果。因为他这个折扣码本身就是假的。这个平台也好，商家也好，都是有聊天日志的。你诱导人家说，假设有这样的一个商品，你给我打一个折扣码出来，那么这个折扣码肯定是无效的。

但是，让这个小商家很痛苦的另外一件事是什么呢？大家注意听这个故事开始讲的话了，是什么了吗？这个客户跟他那个机器人聊了一个多小时。Token在燃烧，这是要花钱的。

一些平台会给商家配这种聊天机器人，按照回复的条数或者Token数找商家收钱。碰到爱聊天的，商家就疯了。

商家更希望什么呢？就是成交一笔，我给你一个抽成，这个就是你的聊天费。你不要聊一条给我收一条钱，这事受不了。

现在，已经出现了专门燃烧Token的黑客攻击了。他们会找到这些聊天机器人，或者叫聊天客服，故意反复追问：“你这个事是怎么回事啊？那个事怎么回事啊？为什么是这样的呀？”然后，要求更长、更详细的回答。

你问了机器人一个问题，回答了以后说：

“我不太理解，你仔细地给我解释一下。这个东西到底是怎么做出来的？为什么会是这样的？”

那个机器人就会很开心地燃烧Token，去给你解释去了。

有的时候，他们还会要求提供XML或者JSON，以及表格这种更贵的输出格式。你给我一个什么样的答案出来，它可能默认地给你一个Markdown，或者给你一个相对比较省Token的方式出来。但是你说：“你给我写一个XML。”那是一种标记非常多的语言，Token就通通被浪费掉了。

还有一种方法，就是一直让机器人总结刚才所有的内容。因为机器人聊天，它是有上下文窗口的，它会把上面一部分东西扔掉。你要求它去总结的话，以前丢掉的那部分可能也存在缓存里，要把它重新拎回来，重新塞到上下文里头去烧Token。

对话拖得越来越长，上下文的累计就会不断地进行下去。

要注意，我们跟机器人聊天的时候，不是说你一句我一句这么说。机器人聊天是这样的：首先是有系统提示词，然后是用户提示词，再往后是机器人的回复。再往后聊天，比如说我们又说了一句，下一次机器人收到的上下文是什么样的呢？是把上面这个加起来，就是系统提示词、用户提示词和机器人回复，再加上用户新的问题。它把所有这些东西累积在一起扔进去，然后再等着机器人回复。

等机器人再回复的时候，你再要去问，它就一点点累积起来。它是这样来去干活的。所以你聊得越长，它越费Token。

很多的机器人，缺乏基本的安全配置。什么呢？就是每个订单的Token限制。有些是设置的，比如我这个订单就允许烧多少Token，烧过了以后我就不理你了。

还有的，就是频率限制。机器人多长时间可以回答多少问题，这个也是一种控制成本的方式。

还有，就是对话深度限制。我们就只聊跟我们这事相关的，你要是聊跟我们这没关系的，我就不理你了。

如果你要是就着我这个话题不断地去引申，不断地去问我，比如说我买双鞋：“这鞋什么材料的？这个材料怎么做的？做这个材料的东西环保吗？”这样的话，它就是聊天等于不断地推进去了，这个也是应该有限制的。

还有的，就是要去做预算警告和循环打断。当你超过多少预算了以后，要进行警告或者去做一些其他的处理。

至于循环的话，你想，你就真让一个人去跟机器人聊，他哪有那么多话题可聊？也是车轱辘话说来说去的。那我们看看怎么去打断这件事情，这个叫基本的安全设置。其实很多的机器人是没有的。

前面这些，就是让商家崩溃的案例了。

让顾客崩溃的案例有哪些

那让顾客崩溃的案例，肯定更多。

去年11月，Reddit上还有一个热帖，一个印度小哥宣称把Zomato上的AI客服聊崩了。Zomato相当于印度的美团，就是你可以在上头订东西吃。

其实，他并没有把Zomato聊崩，而是这个小哥自己崩溃了。他下错订单了，多订了一大堆的食物。然后，他就打电话去饭店，饭店说没问题，不需要的东西给你退了。但是，我不能直接给你退，你必须要走Zomato的客服系统，因为人家是按着这收钱的。你如果不走它那个系统的话，我直接给你退掉了，是有问题的。

这个小哥就去给Zomato的客服发消息去了。大家注意，我还确认了一下，他没有打电话，而是文字聊天。因为印度人的口音有时候还是比较奇怪的。虽然Zomato也是印度的产品，但是他们自己口音也是很多的。所以我确认了，这是文字聊天。

聊完了以后，陷入死循环了。直到外卖员取走订单上的所有商品，也没有解决任何问题。

这个帖子当时非常非常热。为什么呢？因为陷入同样困扰的人非常多。

我自己其实也曾经跟蜂巢快递柜的客服陷入过这种沟通。就是你怎么让它转人工，它就不理你；怎么跟它说，它就说不明白；它给你设置的所有选项，都不是你的情况。你怎么去弄，就是搞不清楚。而且这个循环很深，非常非常麻烦。

估计饭店也是想坑人，就是不希望取消订单，但是又不愿意自己做坏人，就让AI来做这个坏人。所以这个小哥打电话到饭店去，饭店说没问题，你只要把Zomato那边说明白，我就给你退。最后Zomato那边没说明白，它就开开心心地把这单子做了。

下一个故事，是加拿大航空2022年的故事，也是一个聊天机器人案例。

某人要去参加葬礼，但是他可能有一些积分，或者有一些什么样的折扣机票，当时又买不到了。聊天机器人就跟他说：

“没问题，你先买全价的，90天以后你回来退差价就完了。”

结果到了90天，退不出来了。这个人就不乐意，就告这个加拿大航空去了。

最后，BC省的裁决是：加拿大航空不能把责任推给聊天机器人这个独立的实体，公司要为官网机器人提供的信息负责。最后，加拿大航空还是退钱了。

虽然这个案例是加拿大航空退钱了，但是对于一个要参加葬礼，然后被聊天机器人耍得团团转的客户来说，也还是很崩溃的。

还有一个案例，是2024年1月路透社报道的DPD。这是英国的快递公司，也不确定他们用的是谁家的模型。反正问题解决不了，循环来循环去。最后机器人被客户给骂急了，因为客户肯定嘴里也没有那么干净了，机器人居然和客户一起破口大骂DPD公司。客户还把这个截图截下来了，被路透社给报道了。

当然，问题肯定最后也解决不了了。如果真解决问题了，谁有空骂你啊？

这就是把顾客逼疯的几个案例。我作为顾客来说，可能这一块更容易引起我的共鸣吧。

AI客服产品设计的思路，可能从来就不是解决问题

AI客服产品设计的思路，从来就不是解决问题。这一点，可能跟很多人想的不太一样。

大家觉得，你说我做个客服，不就是为了把问题解决掉吗？不是。

商家也好，平台也好，他们是要为客服系统付钱的。所以到底怎么做客服系统，是他们说了算，而不是我们这些顾客说了算。

他们从来不惦记解决问题，他们要去做的是节省成本。所以这是一个成本逻辑。把大部分的客户挡在AI里面，这就是他们要干的第一件事。为什么要挡在AI里面呢？就可以尽可能地裁撤和缩减员工了吧。

然后，是把赔付、退款、申诉这种高成本的问题，尽量地模板化，让你在一个很复杂的迷宫里转来转去，转不出来。

所以大家的感觉就是：AI客服会聊天，但不办事。我自己也有这样的感受。

AI客服系统的目标函数，它是为什么东西设计的呢？是降低单位服务成本。客户满意度、问题解决的比例，从来就不在设计需求里边。

所以，AI客服系统通常是一套防御性的提示词。第一个，企业不会公开贴出系统提示词来，我不会告诉你我这东西怎么设计的，但是基本思路是确定的。

第一个，不轻易承认责任。这东西是我错了，这事它是坚决不说的。
第二个，不直接给退款和赔偿的承诺。怎么着我也不能给你赔钱，因为你目的是省钱嘛。
第三个，把复杂问题引导回FAQ，就是快速问答的一个列表。因为太复杂了，它会重新给你一个列表：你到底出现哪个问题？你说不清楚，你再回到这个列表里，你再选一选。这样的话，就可以用更简单的模型。因为走FAQ，在大模型出来之前，他们就一直靠这个玩意在干活嘛。
再往后，是把超出知识库的问题，使用安全模板直接给你糊弄过去。有一些事情你问了以后，它这个列表里没有，或者知识库也没有，它会有一个套话模板给你套过去。大家看什么外交部新闻发言人的那个发言，基本上就那个套路。
只有命中少数条件的，才会转人工，否则它是不转的。就是尽可能省人工。

预算限制会让这个模型变得更笨，让你觉得这东西为什么这么傻。他们使用什么呢？更便宜的模型。你说我用GPT也好，用Anthropic也好，这都已经是很好的了。但是你说，我用Claude Nano，或者我用GPT Mini，我用最便宜的模型去，行不行？也行。

然后，把知识库做得比较小，不要把那么多东西放进去。它也可以让整个的回答变得简洁很多，是可以少烧很多Token。

然后，去截短上下文，少训练，更新慢。他们会用这样的方式来去节省成本。

有的企业，只愿意为一个便宜的门卫去付钱。大家觉得这种AI系统很笨的一个核心原因，就是这个。

咱们能干点什么呀

那你说，我们能干点什么呢？

首先要确定，AI客服这个潮流，大家是躲不开的，必然会越来越多。所以，我们一定要去适应AI客服的时代。

如果您是商家

首先，如果您是商家，那您能干点什么呢？

第一个，是设置好安全防范，避免被薅Token。这个是很重要的一点。
第二个，高风险、紧急的问题，最好还是上人工。多雇一些人，这个不是什么问题。赔付、申诉、解封、风险判断，这些最好找人去处理。不要在那个问题列表里转来转去。
如果碰到什么奔丧、医疗、欺诈、安全这种特别着急的事，责任很大的事，也最好转人工。
不要把价格、折扣、优惠这些权限交给AI。前面那个一块钱卖了一辆全尺寸SUV的案例，大家要记得；被Anthropic员工骗得倾家荡产的AI店主，大家也要记得。
最后，如果您是商家，记住一点：品牌的客户信任与人情味也是成本。不要为了裁几个客服，丢了西瓜捡了芝麻。您把几个客服裁了以后，成本确实下降了，但是您的品牌会失去客户的信任，会失去人情味，这个可能丢的会更多。

如果您是客户

如果您跟我一样，是个客户，咱就是买东西的人，或者是享受服务的人，那怎么办呢？

第一个，不要去跟机器人闲聊。即使商家真的气着您了，也别这么去报复人家。反正我提醒到了，至于您怎么做，这事跟我没关系了。
不要尝试去诱导AI越狱，白送商品，或者是给出超出范围的折扣和优惠。平台是不会认的，这个口子绝对不能开。因为你一旦把这口子开了以后，那大家就天天去跟这些机器人聊天去了，那这个平台它也烧不起Token。

到底应该如何跟AI客服聊天呢

那么，到底应该如何跟AI客服聊天呢？

第一件事，叫直奔主题。订单号、时间、具体诉求，我到底是要退款、改签、解封，还是转人工，你一定要把这事说清楚。截止时间，也要告诉AI。我现在要哪天的订单，我哪天必须要结束这事。你要跟AI一把把它说清楚。
时刻记住，AI不是人。为什么要记这件事？因为有很多人会去跟AI客服说：“你要理解我，我多么多么难，你要可怜可怜我。”这个事对于AI来说，除了浪费Token，没有任何其他的作用。所以，不要去跟它费这个劲。
要让AI提供某些判定所引用的规则原文。比如说AI说了：“我这个事情不能给你解封。”或者“我这个东西不能给你退。”可以，但是你要告诉我，你是根据什么条款给我做的这个判断？请你把这个原文发给我。这个是要比你让它理解你，要好使得多。
第三个，要明确要求输出依据、限制和下一步。你要让AI给出它的结论，不要跟你去绕车轱辘话，或者是这种外交辞令。

一定要有结论。第二个，你为什么下的这个结论？你是根据哪些条款下的这个结论？请把这个条款也发给我。第三个，你不能处理的部分是什么？哪部分是你可以决定，哪部分你不能决定？你不能决定的这部分，下一步该由谁来去处理？

一定要用这样的方式去跟AI聊天。因为很多死循环，是怕这样聊天的。为什么呢？就是你只要不让它说这些事情，它就一直在这个FAQ列表里兜圈子。因为有些AI系统，它是没有下一步的。我就是要让你在这儿，我不让你出去，或者我不告诉你出口在哪。你只要没有说“芝麻开门”这句话，我就永远不开门，永远不让你去人工。它是这样来去工作的。

最后一个，就是全程截图。能导出尽量导出。因为拼多多什么的，曾经出现过把用户截图直接删掉这样的事情。所以，截图、导出，什么订单页、聊天记录、通话记录、通话录音、邮件回执、工单号，都要通通留下来。实在搞不定，您还可以去投诉。

最后，希望大家在和AI客服的沟通过程中，能够有一个愉快的体验。既然无法逃避，那就享受吧。

好，今天这故事就讲到这里。感谢大家收听，请帮忙点赞，点小铃铛，参加Discord讨论群，也欢迎有兴趣、有能力的朋友加入我们的付费频道。再见。

背景图片

Prompt：a high-contrast watercolor scene, in the style of cinematic editorial illustration, neon cyan rimlight, deep navy background, sharp subject separation, minimal palette (ink blue, neon cyan, gold accents), glossy reflections, extremely legible negative space for text, a surreal AI customer service control room filled with endless chat windows, looping response bubbles, refund icons, warning triangles, tiny discount codes, faceless users waiting in queue, a cold corporate support terminal speaking politely but solving nothing, floating FAQ panels and escalation arrows blocked by glass walls, background environment for a talking-head video, no dominant hero subject, center-left negative space reserved for presenter, balanced depth layers, wide establishing shot, eye-level, soft directional light, subtle rim light, anxious but witty mood, clean readable composition, editorial storytelling, hints of token burn, cost dashboards, automation funnels, customer frustration without chaos overload –no giant faces, central character, readable UI text, watermark, logo, cluttered foreground, extra hands, distorted screens, horror gore –ar 16:9 –stylize 180 –chaos 8 –v 7.0 –p qaczhqj

1600万次偷跑曝光！Deepseek与Minimax如何偷偷蒸馏Anthropic？

老范讲故事 — Thu, 26 Feb 2026 00:51:04 +0000

Anthropic指责三家中国大模型公司蒸馏他们的模型，这仅仅是众多应对Deepseek V4的小连招之一。大家好，欢迎收听老范讲故事的Youtube频道。Anthropic指责了三家中国公司蒸馏他们的模型：Deepseek、Kimi和Minimax这三家。

马斯克逢圣母必反，他跳出来说：“Anthropic你自己刚刚因为使用盗版书赔了15亿美金，还有一个几十亿美金的版权官司还在打，你也有脸出来说别人吗？”

今天这故事咱们分四段来讲：

Anthropic也不能空口白牙，他们到底有什么铁证如山的证据来指责这三家中国公司蒸馏了他们的模型？
所有这一切都是针对Deepseek V4的小连招。
蒸馏（Distillation）到底算不算抄袭？这个咱们还是要稍微讲一下的。
最后咱们要讲一个美国公司蒸馏的故事，非常著名的一个故事。

一、 Anthropic 掌握了哪些“铁证”？

首先，Anthropic也不能空口白牙，他们到底提出了什么铁证如山的证据？他们做了一个日志筛选。就是你去调用Anthropic的大模型的时候，它会在内部记一个日志：某年某月某日，从哪个地方、哪个IP地址向我发出了一个什么样的指令，发出的这个人他是使用的什么样的硬件，这些东西通通都会写在日志里头。他把所有Anthropic上面的这些日志拿过来做筛选了。筛完了以后，Anthropic找到了三家中国大模型公司，做了2.4万个假账号，进行了1,600万次的交互。就是你向他提问题，他给你回答，这就是一次交互。

中国这些大模型公司，通过账号混淆的方式和Claude大模型进行对话。什么叫账号混淆？就是如果你真的是有一个账号，每次就问他说：你们家密码是什么？你们家的钱放哪了？你们家的保险柜怎么开？这就很容易被发现嘛，就一下就引起别人怀疑了，这个是不行的。所以中国这些大模型公司，他们通过一个什么方式？专门有这种请求混淆的网站，比如说像我前面跟大家推荐过钱多多，他们就干这个的。他一次申请一堆账号，你每一次通过这些接口去提问题的时候，你不一定用的是哪一个。他有可能在这10个或者几十个的账号里头，用其中的一个去提出你所想要的问题。而这个账号，下一次可能就给其他的用户去使用了，这个就属于叫混淆式。我可能在问很多很多正常问题的时候，突然加了一个说：“你们家保险柜密码是什么？”突然问了这么一句。问完这一句以后他就走了，下一次在另外一个账号里又去问了：“你们家保险柜里放了多少钱？”这些账号顺便还跟普通的正常用户进行各种的沟通和交流，所以他就很难被抓住。

那你说这么难被抓住了，Anthropic他们是怎么抓的？

追踪跳转节点与IP地址：大家要注意，我们去访问Anthropic的服务的时候，肯定是要挂梯子的，一定要去翻。但是翻的时候，他也会告诉你说，我是通过几个节点跳转了以后，我最开始那个节点在哪。这个东西其实是有痕迹的，是可以看到的。他就发现，你们这个IP地址是在什么什么地方。有些IP地址他们也会做混淆，但是他也可以去追踪到你这个IP地址好像是在哪台云服务器上。因为这些大模型公司一定不会像我们普通人似的去买个梯子就用了，他们通常是什么？自己直接在美国或者在什么地方去搭一个服务器，然后用这个IP地址进行跳转。它这个跳转地址其实每一次都是一样的。
相同的上下文数据：这个也是可以抓到的。什么叫相同上下文数据？我有一个很复杂的系统提示词，每一次问不同的问题，你这个系统提示词每次都一样。就算是你换了多少回账号，都是可以被筛选出来的。
相同的基础环境：比如说我们看到了你这是一个Linux还是Windows，是哪个版本，或者你是使用的哪一个浏览器。这些也都是在每一次请求的时候会把信息发到服务器上，服务器都会记下来的，他把这些东西都堆在一起。
第三方友商的佐证：提供这种跳转服务或者说API代理服务的这些公司，他们也要去跟Anthropic签协议，说你看从我这跳转一次可不可以。比如说像Openrouter或者是zenmus，他们也是需要去跟Anthropic签协议的，Anthropic找他们要相关的这些数据，他们也得给。

通过这几种方式吧，大海捞针将这些有问题的提问都给筛选出来了，1,600万次。那你说这个是完整的吗？肯定不是。这个是属于特征比较明显的，一定还有很多其他的没有被抓住的。

二、被指责的三家中国公司分别“学”了什么？

1. Deepseek（约15万次交互）

在这三家里头，Deepseek算是用的最少的，只有15万次交互。你想1,600万次嘛，它这个算少的。Deepseek主要用这个东西干嘛使？

强化学习的评分和奖励建模：什么叫强化学习？就是这个大模型训练完了以后，给他提问题，让这个Deepseek的模型来回答一些问题，回答完了以后让这个Anthropic的模型给它判分去。
推理能力蒸馏：Deepseek反复的去跟Claude去讲：你这个是怎么推理出来的？你这个步骤是什么样的一个步骤？让我看一看，这个东西合理吗？会提这样的问题出来。然后把这些东西扔回到Deepseek训练数据里头去，它就可以把Anthropic的这个推理过程或者叫推理能力，蒸馏到Deepseek里边去。
内容引导和审查：规避相关的对话专项的训练。大家知道Anthropic的模型，因为它自己号称叫宪法模型嘛，它对于各种的违规话题规避的是相对比较严格的。所以Deepseek干脆咱们就做这个专项训练吧，你这个话题你是怎么规避的？那个话题你怎么规避的？他让Anthropic给他做这种训练，这个也是很聪明的一个点。这种事你要让这个Grok去训练，那这事就训练废了，那个玩意百无禁忌的。所以一定要找这个最严格的模型出来，训练这个违规内容怎么去规避的事情。

2. Kimi（约340万次交互）

Kimi用的量要比Deepseek多一些，它是340万次交互。它主要训练的是代理能力（Agent）、工具调用、代码的和数据的分析、计算机的使用、视觉等多模态智能体方向的能力，这个都是Anthropic最强的地方。你说真的解数学题这种事，没准谷歌的Gemini 3.1 Pro或者是GPT 5.2，这些可能还要更强一些。但是你说怎么去调用工具，怎么去做一个很长的AI agent代理，这个事是Anthropic最强的。所以他反复蒸馏这些信息回来去训练。Kimi也有一定的叫推理轨迹重构这样的一个痕迹，就是说：你这个是怎么推理的？那个是怎么推理的？这几步为什么这么排？他会问这样的问题，然后拿这个结果回去训练自己的模型去。

3. Minimax（约1,300万次交互）

用的最多的是Minimax，1,300万次交互都是它做的。一共1,600万次嘛，其中1,300万次是Mini Max干的。它主要做的：

Agentic Coding（代理编程）：就是做这种代理编程的训练，这个也是Anthropic最强的地方。Anthropic到目前为止还是第一编程模型，它比GPT也好，Gemini也好，Grok也好，编程都比他们强得多。
工具使用和编排：我有一个任务下来以后，我到底应该调哪些工具？应该怎么来编排这个任务？这个也是Anthropic最强的地方，Mini Max去学去了。那你说他们只学Anthropic吗？绝对不会。他们也会去学谷歌，也会去学OpenAI的。至于Grok的话，这个学的时候稍微小心一点，有可能学歪了。

Mini Max最气人的在哪？他们会快速追踪Anthropic新模型能力的更新。前两天Anthropic刚刚推出了4.6 Opus，又在春节期间推出了4.6的sonnet。然后这个Anthropic就发现，每一次我出了新模型以后，24小时之内就有大量的问题冲上来，就是Minimax冲上来就问。他要看看这个新的模型跟以前到底有什么区别，然后拿着这些数据回去再训练他们自己的模型去。这个是Mini Max跟的很紧。

三、应对 Deepseek V4 的“小连招”

那么为什么讲说这一次Anthropic的指责，应该是针对Deepseek V4的三连招之一？Deepseek V4本身并没有发布。在春节之前其实我还专门录了节目去讲，咱们春节的时候有一个新的传统，从Deepseek R1开的传统，就是我一定要在春节期间发新模型。发了千问3.5，发了豆包2，发了Seedance 2.0，发了Minimax 2.5，发了Kimi 2.5，发了GLM 5，这么一大堆模型都是在春节前后这几天发出来的。大家都在等Deepseek V4出来炸场，但是最后Deepseek V4也没出来。但是去年的Deepseek R1给美国这些公司留下来的印象实在太深刻了，所以今年一定要准备好。甭管你有没有，我先得准备着。

备忘录施压：2026年2月12日，OpenAI向美国众议院美中战略竞争特别委员会提交了一个备忘录，指责Deepseek蒸馏了他们GPT O1的推理过程。这个其实是去年的事情，只是现在又重新补充了材料，说你看Deepseek R1能够做推理，他们是蒸馏了我GPT O1的整个推理过程，拿着这个蒸馏数据回去重新训练的。重新提交了一个备忘录上去。
官方发声指责：2026年2月23日，Anthropic官方发了博客，三个公司：Deepseek、Kimi、Minimax蒸馏我们的大模型，回去去训练他们自己模型去了。
芯片禁运指控：同日，美国政府有官员指责Deepseek是用Blackwell芯片进行训练的。大家注意，英伟达的Blackwell芯片是对中国禁运的，在中国境内按道理来说不应该有这种东西。但其实有没有的话，大家自己心里就猜就好了，类似于薛定谔的猫的状态。国内像Deepseek他们也通常会去否认，说没有这事，我们用华为的昇腾芯片去训练。至于到底训练出来、训练没出来，这个就不知道了。用华为昇腾芯片是可以去做推理，训练这件事还要再等结果。

所以虽然Deepseek V4并没有在春节期间发布，但是都准备好了，你不用这不浪费了吗？所以就在春节过完了以后，这些人就赶快稀里哗啦把准备好应对Deepseek V4的这些证据、这些投诉信，挨着个都拎出来给大家展示一下：你看他们没什么了不起的，都是从我们这学的。

四、蒸馏到底算不算抄袭？

很多人说当然算了，蒸馏怎么能不算抄袭？首先说什么叫蒸馏？

其实我们去上学、去学习的过程就是一种蒸馏的过程。老师学了很多很多年，他通过上课的方式把这个知识聚集在一起，灌输到我们脑子里去，我们去参加考试去。这实际上就是一个蒸馏过程。那你说这个不能这么讲，有没有更形象一点的？有，刷题。我们在考试之前进行刷题训练，这个其实就是标准的蒸馏。我们不再去学习知识了，不再去研究这东西为什么了，你就给我题让我做，做完了以后拿回去评个分，然后我去改改错题，然后我再接着做下一套。这就是标准蒸馏。小镇做题家就是标准蒸馏的一个结果。你说这个不能算蒸馏，你刷题也算是一个正常学习的过程。

那咱们再往前走一步：刷真题。按道理说我们刷仿真题这事没毛病，但是你要知道在中国考托福、考雅思、考SAT、ACT这些玩意，他们是刷真题的。这个真题是有版权的，你是不应该拿回来刷的。即使是中国这些SAT、ACT的代理机构，他们也经常拿出真题来让大家刷。那你刷了真题以后考一个很高的分数，这个就是妥妥的蒸馏了。

但是蒸馏这件事到底是不是违反，它的边界是非常模糊的。刚才我也讲了，你是上学，然后刷题，刷真题，是这样的一个过程下来的。我们现在看一下当前的情况是什么样的。

1. 大模型输出内容没有版权

首先，大模型的输出内容是没有版权的。目前为止全世界主流国家的甭管是立法也好，还是判例也好，都是不会给大模型生成内容确认版权的。因为版权这个东西是必须有人去进行表达，它才有版权。比如说我们去向大模型写提示词了，这个提示词是有版权的，但是大模型输出类的东西是没有版权的。所以我们拿着大模型出来的东西去做训练，这个东西首先不侵权，要跟大家说清楚。

2. 数据已被大模型“污染”

第二个就是现在的数据其实都已经被大模型污染了，很难避开大模型生成的结果找到干净的数据。所以现在你在网上去找各种的开放数据都是大模型生成的，所以这个基本上躲不开。像前面GLM 5发布的时候就出过这种事，有人问他说：“你是谁？”他说：“我是GROK 4.6 OPUS。”很多人说一定是蒸馏出来的。其实不是的，就是他是拿Claude 4.6 OPUS生成的源代码直接训练的。

什么意思？比如说我们现在写的程序，大量的程序，特别是开源程序，都是用Claude code去写的。这个Claude code写程序的时候，里边会有一个叫Claude.MD的文件，它里头就会写出我们用的是什么什么东西，然后写各种的文档、写各种各样的说明文件里头都会告诉他说我是Claude OPUS 4.6，他会写这种东西进去。那我直接从比如GitHub上去拿这些数据去做训练的时候，你没法把这玩意摘掉，这个是很麻烦的。

另外一个翻车的是谁？另外一个翻车是Grok。Grok就是在早期的时候，问他说这样怎么办，Grok的回答是：“因为我是OpenAI，OpenAI限制我回答这样的问题，所以我不能告诉你。”很多人说马斯克你是不是去蒸馏OpenAI去了？其实也不是。就是OpenAI大量生成的内容在各种网站上去贴，Grok抓取了这些内容拿回来训练，又没有清洗干净，就会造成这样的结果。这是一个很难避免的事情。

当然了，还有一些网站会专门的去搜集大模型的优质结果。这个大模型发了一个结果出来，这个不错，我把它存下来，下次我再用。谷歌就干过这种事，它直接用一个叫ShareGPT的网站上搜集的大量的OpenAI生成的结果，去训练他们的当时叫巴德（就是Bard，还不是Gemini，是Gemini前头的一个版本）。所以你问当时的谷歌大模型：“你到底是谁？到底怎么回事？”他也经常说我是OpenAI，也是这么来的。百度的文心一言什么的都出过这种事。

3. 开源协议与用户条款的灰色地带

Llama应该算是蒸馏界里的老祖宗。为什么？因为他是开源的。他自己可以不去蒸馏，但是他开放了结构，鼓励别人用同样的架构去蒸馏数据。所以很多使用LLAMA架构的这模型都是用这个，比如GPT也好，用Anthropic也好，用他们的模型蒸馏的这个结果再去训练的。其实现在就算是Grok、Anthropic他们自己去训练大模型也没有原生数据了，他们的数据也都是用自己的模型再去生成的。他们只是什么？自己先去做一个大模型，去清洗数据以后，然后再蒸馏这些数据，而不是说拿别人的数据回来蒸馏。所以差就差在这了。Anthropic也承认，蒸馏是一种普遍的方法，就他自己肯定也用。

那蒸馏到底违不违法？这个里头是一个比较灰色的地带。首先要确认，大模型生成的内容是没有版权的，所以我们肯定没有侵犯版权。但是我们使用这个大模型生成的结果去训练新模型，它是违反用户使用协议（ToS）的。

我跟你签了个协议，我们双方认可了，但是我违反了这个协议，他是这样的一个问题。这个协议里头，首先禁止中国地区的人使用，但是中国人伪装IP，然后挂着梯子来用，这个本身就属于一个比较灰色的地带了。第二个，这个用户协议里头，明文禁止机械化批量化的蒸馏数据去训练竞争对手的模型。中国这些模型公司花了钱了，使用API了，你甭管是直接在Anthropic使的，还是说我通过API代理去使的，即使是混淆了以后去用这些模型接口的，他也是同意了用户协议的。在这些代理网站，比如说Openrouter，我现在可以使用Anthropic的大模型，他也会在他的用户协议里头写上，你不可以去违反原来Anthropic的用户协议。就是你只要花钱用了，都是属于默认同意了这个用户协议的。你拿这些模型去蒸馏回来训练自己的新模型，你又是Anthropic的竞争对手，那么违反用户协议这件事，他是肯定跑不掉的。

五、 Anthropic 的“论迹推心”与潜在后果

Anthropic其实做的事情叫做“论迹推心”。什么意思？原来咱们有人讲说，你这事是论迹不论心，还是论心不论迹？迹就是我发现的迹象，心就是你一开始起的这个念头。他发现了一些迹象，但是人家到底是不是这么想的，他也不管了，反正我发现迹象，我就认为你是这么干的就完了。中国公司的使用本身是付了钱的，也没有去破解他们的接口，也没有逃票。你规定一个TOKEN多少钱，我就老老实实付了，只是伪装了身份，伪装了行为，进行了请求混淆。如果用同一个账号明目张胆的去进行序列化、机械化的提问回答的话，那很容易被封号。Anthropic觉得我已经发现这些迹象了，我认为你就是故意的。

可能的结果是什么样的？

起诉会很麻烦。因为这些公司都在中国，你一个美国公司在中国又没有任何业务，我跑到中国来起诉你这件事非常非常麻烦，而且周期也会很长。特别是大模型这种东西日新月异，它比互联网那个进化的还快，所以未必会去起诉。现在这个圈子里头谁会起诉？就是传统的出版商会去起诉OpenAI，会去起诉Anthropic。因为他们已经比较习惯了，本来动作就很慢，说我就慢慢起诉呗，拖个两三年，我把官司打完了以后，你该赔钱你还是得赔嘛。但是大模型公司一般不会干这个活。如果真起诉了，也只有违反用户协议是肯定能够成立的，版权这些很难界定。

如果Anthropic起诉了，也胜诉了会怎么样？有没有可能判什么东西？

删除账号：这个其实基本上没有什么效果，因为本来就是假账号，你这个给我删了，我再去注册别的呗，最多就是我账号里比如充的值你给我没收了。
经济赔偿：其实很难界定金额。你说我做了一个新模型出来，我到底给Anthropic造成了多少损失？他原来应该挣多少钱？现在少挣了多少钱？你很难说明白这件事。最多就是说你挣了多少钱，你挣的这些钱应该是属于Anthropic的，或者说你是用很便宜的价格挣的，把这个价格转换成Anthropic的定价，他应该挣更多的钱，应该挣你这个十倍的钱，你按这个赔。但是这个很难说清楚，因为这些大模型公司也不是只蒸馏Anthropic一家，他是蒸馏一堆的这个大模型出来，然后得到了自己的这个结果。
要求删除数据（最可能）：就是我们现在确定了这1,600万次是你们从Anthropic这边套的话，你现在要把这些数据都删掉。这个是比较容易去界定和执行的。
删除使用这些数据训练的大模型：或者是从大模型中将这些数据清除掉。当然这个后边这句话不太可能，因为大模型只要训练完了以后，它是个黑盒子，你不可能说我把它拆开了以后哪一块给你去掉，这事是不现实的。因为前面很多画家、作家就曾经干过这种事，说我们要求OpenAI使用我们的文章或者图片训练的这个模型把我这一块去了，这事是不行的。因为这个大模型这个东西只要训练完了就是一个整体，不可能去掉其中一部分。但一旦是判了，说要求删除数据，删除使用这些数据训练的大模型的话，对于这些中国大模型公司来说就很麻烦了，等于现在发布的所有产品就没法用了，它会涉及非常多违约的这个诉讼。
列入执行黑名单：我现在判了你了，你爱执行不执行了吧。你不执行就禁止合作，所有在美国，比如说被告完了以后没有进行纠正，没有把这个判罚执行完的这些公司，美国公司不允许跟他做生意。这个有可能会成为一个结果。

各大模型的开源协议对比：Deepseek 是个例外

大家会想到一个问题：是不是各家的大模型用户协议或者是开源协议都禁止使用蒸馏数据去训练竞争对手的？这个可以跟大家补充一下。

首先在美国的这些大模型，基本上都是有这样的要求的。即使是Meta，他们做的LLAMA开源的模型，也有类似的这种要求。国内的模型，豆包它是闭源的，那用户协议里头明确禁止用豆包蒸馏训练竞争对手。千问、Minimax、Kimi和GLM智谱虽然都是开源的，但并没有直接使用通用的开源协议，比如MIT、阿帕奇，他没有用这些协议，而是各自去修改了开源协议，都加上了禁止蒸馏训练竞争对手的条款，这都不允许。

刚才讲了半天，是不是发现少了一个？对，有一个例外。Deepseek明确写了：用户对输入输出可用于广泛用途，包括开发衍生产品、训练其他模型，含蒸馏。干去吧没关系。Deepseek R1的仓库里头也明确写了：我就是MIT的开源协议，我没有做任何修改，允许衍生，包括用于训练其他大语言模型的蒸馏都可以。这是唯一的一个不一样。

六、著名美国公司“蒸馏”事件：Bing vs. Google

甭管是Grok还是谷歌，都因为承认自己是别的模型被怀疑过是蒸馏，但是都没有实锤。真正实锤的美国公司蒸馏别人的故事，要在这补充一个。那是2011年的2月，这么古老吗？那时候还没有大模型。当时是谁在蒸馏？微软的Bing。微软的Bing去蒸馏谷歌的搜索结果的故事。

谷歌怀疑Bing蒸馏了他们的搜索结果。Bing每次接到搜索请求之后，会先调用谷歌搜索，然后跟自己的搜索结果进行比对，发现有差异的部分，再将差异的部分并入到自己的训练库里边去，后续不断的进行改进。最后导致Bing搜索的结果跟谷歌搜索结果越来越像。大家注意，这个搜索结果不是找得着找不着这么简单的事，搜索结果最重要的是排序，谁排前头谁排后头。Bing在这一块蒸馏了谷歌很多的数据，但是你又没有证据，那怎么办？

谷歌做了一个特别有意思的验证实验。他做了一堆乱码的搜索关键词，就是这个词是没有任何意义的，也不会有人去搜索这个词。他设置了可能一组这样的词，然后设置了一堆蜜罐网址（Honeypot）。什么叫蜜罐网址？就是这个网址本身没什么用，只有你去搜索这个完全没有任何意义的乱码搜索词的时候，它才会对应到这个蜜罐网址里去。设置完了以后，过了一段时间发现Bing搜索里面，有一部分乱码搜索词跟他这些蜜罐网址进行了一一对应，直接可以命中了。谷歌以此为论据，说你肯定是抄我东西了。这玩意就像什么？就是到最后一个题说我不会，Bing在最后一个题说我也不会。大概就是干了这么个事情。

当然了，即使是拿到了这样的证据，谷歌也没有去起诉微软，而是进行了一个舆论战，说他们就是抄我的，他们不行，他们技术差很远。做完这个舆论战也就完事了。

七、总结

中美两国的大模型之战还会继续下去。我们这一次看到的，就是针对Deepseek V4的一个小连招。Anthropic提出的三家蒸馏它模型的这个中国厂商，应该是这个小连招三招中的一招。美国玩的是堆算力，研究最聪明的模型去解现在人类解不开的这个数学问题，以及研究各种场景的应用模式。中国在美国人确定了方向以后，咱们不研究降本增效（注：咱们研究降本增效），我们怎么能够达到Anthropic调用工具实现AI Agent（智能体）这种连续运行的这样的一个逻辑，同时降低成本，实现类似的功能。我们所需要的成本大概是Anthropic的1/10到1%的一个成本，非常非常低。

现在在AI Agent领域，Anthropic绝对是王者。不光是中国模型厂商，全世界都在学它，绝对不止这三家被点名的去蒸馏了Anthropic。包括谷歌，包括OpenAI，还有法国的Mistral，应该都去了。Anthropic自己其实也蒸馏别人，这个谁都跑不掉。

用户条款中的有一些条目本身就很模糊。不允许蒸馏我的数据去训练竞争对手这件事其实非常模糊。你说我这个数据是向你这个大模型花钱提问得到的，还是说我在网上去搜集的？你其实没法界定这个事。你假设说这1,600万次不是这三家模型公司通过账号混淆向Anthropic大模型提的问题，而是直接在网上找到了数据集，或者找到了一些已经用Claude code写好的代码，我拿回来训练这事行不行？其实你是没法去界定的。所以这些条款本身意义不是特别大，你就最后真的拿这个条款去打官司，也很难有什么结果。

以后如果需要使用国内大模型，我准备去试试Minimax，1,300万条，应该就数他们学Anthropic学的最像了吧。最后Deepseek V4还是值得期待一下的，希望还能够给我带来一些惊喜吧。

好，今天这个故事就讲到这里。感谢大家收听，请帮忙点赞、点小铃铛，参加Discord讨论群。也欢迎有兴趣有能力的朋友加入我们的付费频道，再见！

背景图片

Prompt：in the style of Hayao Miyazaki, Studio Ghibli hand-drawn watercolor anime background art, warm-toned poetic techno-nature fusion, a cloud-computing data center carved inside a vast mountain body, endless rows of server racks fading into distance, naturally exposed stone walls and cavern textures, multicolored cables neatly routed and systematically connected between racks, 24mm wide establishing shot, eye-level environmental framing, spacious layered depth with no single hero subject, soft directional warm light with subtle rim light, amber, ochre, warm slate and moss accents, fine ink outlines and painterly textures, –no people, modern office furniture, neon cyberpunk glow, text, watermark, logo –ar 16:9 –stylize 180 –chaos 8 –v 7.0 –p qaczhqj

Clawdbot深度评测：全能AI助理的成本与实战避坑

老范讲故事 — Tue, 27 Jan 2026 00:47:48 +0000

Clawdbot AI再进化，社交媒体又爆了。这一次是真的很厉害，还是尬吹？

大家好，欢迎收听老范讲故事的YouTube频道。被突然爆火的clawdbot给砸到头了，这是一种什么样的感觉？

我最近在X上面，看到很多人在晒他们新买的Mac mini，甚至有人晒了12台的Mac mini，摆满了办公桌。实在让我觉得很诧异，他们到底在干什么？后边都有一个词叫clawdbot。我一开始还没有太注意这件事情，昨天直播的时候有人问我：“最近最火的clawdbot你玩了没有？”哎呀我还没玩儿，因为最近在玩agent skills，还没有太关注到。这么神奇的东西我要去看一看。

突然爆火的原因

突然爆火的原因，是因为很多人跑出来吹了，说这个东西实在是太强了，又革命性了。2025年11月25日，这个产品就已经上线了，它是个开源产品，上线在GitHub上面。到2026年的1月，突然有很多位的网红博主开始非常用力的宣传这个产品，一下就火出圈了。这是一个住进聊天软件里面、7*24小时服务的助理，甚至有很多人给这个助理直接起了个名字。

大家要注意，我们一般不会给ChatGPT、Gemini或者是Anthropic Claude起名字，而像现在的这个clawdbot，很多人都给他们起名字了。这是一个非常非常划时代的事情，因为你一旦给它起名字了，它就人格化了。这不是那种情感陪伴型的聊天工具，这是一个帮你去办公的助理，这是非常重要的。这帮网络大V就出来吹了，说这是个人AI助理的未来形态。有人一周烧掉了1.8亿TOKEN。大家注意，这是非常关键的一个信息：使用clawdbot，你的TOKEN在燃烧。

产品形态与体验的明显差异

1. 全时驻留

它的产品形态跟体验上，跟过去的产品有明显的差异。第一个特别重要的差异，就是全时驻留。像以前我要去跟ChatGPT聊天，我要点开APP，或者我要到网站上去打开这个网页；现在这个就不用了，它就永远在线，而且功能非常完整。这也是为什么Mac mini突然销量暴增的原因。你可以命令它：

打开Word文档
打开Excel
去干任何事情，浏览网站
用iMessage跟人聊天、给人发短信

它这个全能干，没有任何问题。但是你要保证所有功能都能使的话，特别是你要使用iMessage的话，你必须要有Mac的系统，要有Mac、要有Mac mini。这是一个自托管成本很低、部署很方便的系统。大家都是买个Mac mini放在家里头，甭管是放在办公桌上，还是放在机柜里，放在电视旁边，这都不重要。但是这是你放在自己家里头的，你不用再担心任何隐私问题了。

2. 持久记忆加上主动触达

像我们现在都说ChatGPT也好，一些聊天工具也好，要有记忆，但是他们记住的东西其实非常少。原因也很简单，如果ChatGPT记住很多东西的话，他就不知道什么时候该用什么了。而现在的clawdbot他是全记忆，你跟他聊天的所有内容他都记得。

所以很多的博主上来用clawdbot之前，先会用很长的时间去跟他描述：

我是谁
我喜欢什么东西
我在干什么
我对什么东西感兴趣
我对什么东西有什么样的要求
为什么我喜欢这个球队、为什么我喜欢那首歌……

他会把这些东西通通都告诉这个clawdbot。他会记下来，记下完了以后再去跟你聊天的时候，这些通通都会变成系统资料，它就会很懂你。

而且clawdbot还有一点非常重要的是什么？就是它会主动的来去跟你聊天。原来是被动的，你不去跟ChatGPT说话，它就不会回答你任何问题，所以我们要先提出问题。而现在的话，你可以告诉他说：“什么什么时候记得提醒我干事”、“每天告诉我最近应该做一些什么什么样的事情”。不是说你列好计划让他做什么事情，而是说你觉得我应该做点什么，他会告诉你说我觉得你应该干点这个、应该干点那个，他会有很多这样的建议性的东西出来。甚至他每天早上起来说：“我今天早上起来了，把我认为你今天该干的活都给你列出来。”他可以干这样的事情。

开源且无所不能的系统

这个系统还是开源的，而且迭代的速度非常快。之所以突然爆火，还有一个很重要的原因，就是这个产品基本上是无所不能。你基本上能想到的活它全能干，包括你让它去做vibe coding，你让它指挥Claude code下去干活去，都没问题。它可以浏览各种网页替你买东西，通过agent skills和这个MCP，我们现在互联网上这些服务，它全都可以使用起来了。就是因为这些原因，这个产品突然就爆起来了。

但是你说这个里头有没有尬吹的部分？肯定有。你自己去安装的时候，你就会发现可能也没那么方便。而且如果有些人对于结果的格式要求非常严格的话，你可能会觉得他产出的东西依然是AI垃圾。但是方向是正确的，就是全时驻留、持久记忆、主动触达，这就是未来的AI助理的一个方向，而且还要最好能够全能一些，所有问题都可以解决掉。

有人说原来ChatGPT不是出过这种东西吗？原来ChatGPT你是可以通过WhatsApp跟他聊天的，为什么到这就突然爆了？因为很简单，ChatGPT你虽然可以通过WhatsApp跟他聊天，但是它只能调用ChatGPT里边这些东西。你说我想去调用外边这些东西，我想去写个Word文档、我想去做个PPT、我想去剪个视频、我想去搜集一些信息，它这个功能还是有一定局限的。他们家就是玩这套东西，所以就并没有推开。而现在clawdbot直接就爆了。

传奇的创始人：Peter Steinberger

它的创始人很传奇，这个创始人的经历还让老范很有代入感，为什么？这哥们在维也纳是一位退休程序员。老范现在也可以算退休程序员了，但是人家还是比我厉害很多了。这个人叫Peter Steinberger，他是PSPDFKit的创始人。这个产品是什么？是面向开发者的PDF的SDK框架。它给你一套框架，然后你可以写程序，通过它这套框架去操作PDF，做PDF查看、PDF注释、PDF编辑、签署、填表单，做这些功能。它的产品在iOS、安卓、Web和桌面端全覆盖。它的公司主要是提供文档、PDF相关的SDK和框架能力的。因为它有这样的一个技术背景，所以对于配置系统、跨平台交付、可观测行为、安全边界等等这些方面，都是非常敏感的。这也是为什么clawdbot这样的一个产品突然会爆起来。

Clawdbot到底能干点什么？

什么都能干。就是这么简单的一个问题。但是你说真的什么都能干嘛？跟大家讲一个笑话。岳云鹏有一次出去参加综艺，人家问他你数学怎么样？说特别快没问题。然后就出了一个问题：

26*78等于多少？等于75。

人家说你这对不？

岳云鹏说：“我又没说我算的特别对，我就说我算的特别快，你就说我快不快吧？”

所以虽然clawdbot什么都能做，但是结果到底是不是能够让人满意，就是冷暖自知了。有些人很挑剔，他就觉得这不行；这些人可能提的问题也很模糊，对于结果又很挑剔，那么他就得不到满意的结果。有些人的问题提的非常详细、非常具体，对于结果特别是格式又要求不是很高，他们就会得到满意的结果。我觉得这样解释是相对比较清楚的。那种提问题、提要求的时候云山雾罩，经常玩这个“佛祖拈花一笑”，出来的这个结果还挑三拣四的这种领导，反正伺候起来比较难吧。比较难伺候的领导，clawdbot这样的助理他也搞不定。但是有一些领导就是提要求事无巨细，只要结果正确、格式无所谓的，这些领导，clawdbot就是你最好的助理。

部署Clawdbot的风险：TOKEN在燃烧

但是如果你去部署clawdbot，一定要小心的是什么？TOKEN在燃烧。前面有人一个礼拜烧了1.7亿TOKEN，那是非常非常贵的。通常使用clawdbot需要什么？就是买Anthropic Claude 4.5 Opus 200美金一个月的Max账号。如果没有这个账号的话，这个产品会很难用的。当然了现在我们就在看Anthropic会不会封他，因为前不久Anthropic刚刚把open code的账号给封了。原来我们使用open code的时候，也可以用Anthropic的20美金或者200美金的这种Pro或者是Max账号，但是Anthropic说不行，不让你用了。所以现在还要看，它到底能使到哪天。

千万千万不要干嘛？千万不要用Anthropic的API key，你真的会破产的。那个玩意非常非常的消耗TOKEN。GPT 5.2据说也还不错，但是跟Anthropic的Claude 4.5 Opus还是有一点点差距的，最好也是用200美金的Pro账号。用我现在这种plus账号可能是比较费劲的，我准备待会把它装上，把plus账号挂上试试。还有博主推荐Mini Max，Mini Max有10美金左右的月账号，它也是一种编程账号，效果再比open code再差一些，但是人便宜。大家也可以试一试。功能都是TOKEN烧出来的，你没有那么多TOKEN，就不要指望它有那么多功能。

为什么一定要Mac mini？

这么多人都去晒Mac mini，其实并不是必须要Mac mini，最好是使用闲置的非工作主力电脑。你说我这就是上班每天用的电脑，我把这个clawdbot挂在上头行不行？最好别这么干。为什么？因为你上班的电脑第一个，它的能力很强，晚上有可能还会关机，比如说你要把它合起来，这个电脑就会关掉。这个系统是要7*24小时工作的，所以你最好不要把它放在你的工作电脑上。很多家庭有这种闲置的Mac mini，放这个上面就挺方便的。价格也不贵，也还很省电，还很漂亮。特别是最新的Mac mini M4，很小、非常非常漂亮、非常精巧，放在家里头、放在各种地方都不显得突兀。

全功能的系统配置

最好是给clawdbot配这种叫“全功能的系统”。什么叫全功能系统？就是它可以直接使用浏览器、可以跑vibe coding、可以调用office，这些东西都是可以工作的。对于本地的算力其实并没有特别高的要求，所有的AI都是调云端的算力。它通过即时通讯工具来工作。我们想去跟clawdbot聊天的时候，你可以打开：

Telegram
Discord
iMessage
WhatsApp
或者是给你发短信

都是可以的。国内的不行，像什么微信搞不定这事，因为微信对于这种机器人是封闭的，比较严格的，怕各种黑灰产。

很多人想去用iMessage，就是苹果系统的这种iMessage，这个就没办法，你必须使用Mac mini。你说我现在想整个Windows、想整个Linux上iMessage？上不去。这个iMessage也不是一个开放系统。很多苹果全家桶的玩家，特别是在程序员和AI玩家里头，苹果全家桶玩家的比例是很大的，肯定是喜欢上Mac mini的。家里头其他的闲置电脑其实也可以跑，Windows电脑也可以。但是如果你要在Windows电脑里跑，最好是装WSL。WSL就是Windows里面的Linux，现在Windows新的系统里边都是可以装一个Linux系统的。然后Linux电脑，这个肯定也是没问题的。我准备上NAS了，家里NAS已经跑了一大堆的各种各样的Docker了，它也是可以跑上去的。

云主机也没毛病。你都花了200刀去买套餐了，那你一个月花5刀去租个云主机跑这个clawdbot肯定也是没问题的。Oracle云上有免费的主机，大家可以上去玩耍一下。NAS、瘦服务器或者是在云主机上跑clawdbot，浏览器也是能用的，但是会比较费劲。vibe coding就要稍微克制一点了。如果是在你的Mac mini上，你就可以给它下指令，说打开哪个vibe coding的工具，然后在里边去给我写一什么产品出来，他自己吭哧吭哧就干活去了。你可以每天晚上睡觉之前给他布置一大堆任务，早上起来看看，完成几个、没有完成的部分你还可以去辅助一下。他是这样来干活的。你要是在云主机上，就不能干这活了。

Clawdbot是不是一次革命性的创新？

方向上肯定是。这个方向也很明确，就是无限记忆、私有部署、绝对隐私保护、7*24小时驻留、随时待命、主动沟通和提醒，基本可以解决各种问题。随着模型能力的提升、agent skills的发展，他的能力一定还会继续爆炸式增长。大模型厂商应该会争先恐后的推出新套餐了。因为有了前车之鉴，Anthropic估计过一段时间还是会封他的。这个咱们预言一下，咱们打个赌，猜一猜会不会把他封掉？前面open code用户量上去以后，Anthropic就直接把他封掉了。

因为现在买TOKEN基本上是两套玩法：一套就是你具体按100万TOKEN多少钱去算；另外一套就是给你套餐，这个编程套餐。因为现在编程实在是太烧TOKEN了，所以Anthropic出了这种编程套餐，OpenAI、谷歌都出了这种编程套餐。但是Anthropic还是希望，如果你想要去买它的编程套餐，你就只能用Claude code，你不能用其他的东西。像咱们现在讲这个clawdbot，这就不允许用。那么OpenAI跟谷歌应该会继续支持你。像open code这块，在Anthropic说我封闭它之后，OpenAI说我们准备继续支持。没毛病，你买我的plus套餐、Pro套餐，我都继续支持你。谷歌在这一块其实是放的比较宽松的，只要你愿意用，谷歌还是愿意笑脸相迎的。

国内的模型平台的话，也应该会推出一些专门的套餐，应该是会像code套餐这样，都是可以挂上使的。国内平台的code套餐基本上有5美金一个月的、10美金一个月的，甚至可能最便宜的有3美金一个月的。他们都是去仿真Anthropic的这个API形式，只要我仿真好了，就往上挂就完了，都是可以用的。

硬件与巨头的新机会

家庭瘦服务器应该有新的应用场景，以后的NAS也可以配更好的CPU GPU了。至于家里是不是要买一台Mac mini，让我再犹豫几天吧，反正我目前为止还没有下决心再去买一个Mac mini。至于Mac mini农场，也许会在一段时间内流行起来。什么叫Mac mini农场？就是在一个房间里边装一大堆的Mac mini，允许大家从远程去访问它、替你去维护，我们只管去付租金就可以了。这可能也是一种未来的服务形式。

黑苹果可能会焕发第二春。什么叫黑苹果？就是在一些比较便宜的Intel这种架构上，使用macOS系统重新去破解，然后给你装上，让你去使用。这个东西叫黑苹果。其实黑苹果随着后来苹果出M系列芯片以后，已经不是那么活跃了，但是现在的话，应该会重新再活跃起来。

腾讯、Meta、苹果、谷歌机会来了，就看谁能抓得住了。为什么他们机会来了？他们做即时通讯工具的。既然大家觉得以后的这些个人助理应该是活在WhatsApp、活在Telegram、活在Discord里头了，腾讯说我这有微信，干脆我在这边给你配一个助理不就完事了吗？你有什么事跟助理说不就完了吗？我觉得他们未来是有机会的。至于说Meta的话，你像WhatsApp是它的，Facebook Messenger也是它的，全世界最大的两个即时通讯工具都是它的。苹果自己也是有iMessage的。它们都是有机会去腾飞一下的。

最后总结一下

又一个神奇的AI工具发布了，赶快玩起来吧。甭管好不好使，大家一定要去玩起来。7*24小时永久驻留、永久记忆、主动提醒、全能助理，这应该就是未来的方向了，这个基本上可以确定。助理已经这么强大了，具体做什么就是留给我们的问题了。网上的介绍视频里头经常是这样的，他问clawdbot：“你觉得我该干点什么？”还是要有自己的想法。只要烧得起TOKEN，我们每个人都会得到一个强大的全能助理。

好，这一期就讲到这里。感谢大家收听，请帮忙点赞、点小铃铛，参加DISCORD讨论群。也欢迎有兴趣、有能力的朋友加入我们的付费频道。再见。

背景图片

GPT-5 发布！是革命还是挤牙膏？深度解读AI竞争新格局！AI价格屠夫来了！开发者和创业者的黄金时代开启？

Luke Fan — Tue, 12 Aug 2025 00:51:22 +0000

大家好，
欢迎收听老范讲故事的YouTube频道。
今天咱们来讲一讲GPT-5发布了，到底是又一次划时代的革命，还是开始挤牙膏了呢？

8月8号凌晨开的发布会，我呢看了一眼就去睡觉了，实在是没有功夫把它都看完。北京时间凌晨1点开始发，我今天看了一下回放，大概是一个小时十几分钟吧，但是我并没有特别耐心地把它们都看完。

GPT-5到底有什么不一样的呢？

首先，这一次的发布会跟OpenAI以前的发布会，有一些巨大的差异。第一点大家有没有注意到，就是这次发布以后呢，没有出现服务器拥挤宕机的情况。以前甭管是Sora呀，还是GPT-4o这些产品发布的时候，紧随而来的都是OpenAI的服务器拥堵宕机。这次没有，第一时间就可用，免费版也可以使用，速度还挺快的。我自己反而感觉速度还可以，应该呢是进行了一些实时的算力分配，简单的问题就没必要消耗那么多的算力。原来呢，大家都是要尽可能用最大的模型，你哪怕问一个“你好，今天天气不错”，他也得把那个最大的模型跑起来。现在的话应该就不需要干这个事了，他发现你去问“你好，你是谁，你到底是哪个版本”的时候，他可能做一些很简单的回复，消耗的算力就比较小。这是第一个比较大的差异。

第二个比较大的差异是什么呢？这一次没有哀嚎一片。原来OpenAI每次开发布会以后，通常都是哀嚎一片：“完了，我们创业白创了，做的事情被OpenAI覆盖了，创业公司天塌了。”这次还好。那这个是不是代表着OpenAI就开始挤牙膏了呢？还是说恰恰是一个新时代的开始呢？服务器也没崩，说明他肯定是有一些算法的优化在里头，但是是不是大家也没什么兴趣？另外一方面，没有哀嚎一片，是不是他也没做出什么东西来呢？咱们要去看一看这个问题。

除了GPT-5发布之外，还有一个很重要的新闻是什么？说马斯克在那说风凉话，有人在那尬吹，有人在那开骂了。跑分呢，其实是必不可少的。GPT-5这样的东西出来以后，必然要跑分，但是现在大家对于跑分也没有那么重视了，因为跑分好的这个模型其实未必好使。在这个里头有两项跑分呢，没有跑过Grok-4，就是马斯克自己的模型。马斯克就出来发了一个X，说“Grok-4 Beats GPT-5 on ARC-AGI”，在这个测试里头我们把它打败了。

ARC-AGI是一个什么样的测试呢？它呢是常识推理和复杂问题解决能力的一个测试。模型呢找到类似于大学入学考试难度的问题，让AI在有限信息里头进行推理，得出答案。就是做这个测试的时候呢，是不可以联网的，不可以调用工具，必须是使用模型本身的能力去做测试。它呢偏向于测模型的思考能力，而不是背诵搜索信息的本事，对于AI的生成推理挑战更高一点点。在这个里头呢，GPT-5是怎么输给Grok-4的呢？GPT-5呢使用的是GPT-5 BASE模型，它的正确率是9.9%，而Grok-4呢使用的是Grok-4 thinking模型，就是思考模型，它的正确率呢是15.9%，足足高了6个百分点。

但是大家注意了没有，这里头好像有些细节不对。GPT-5使用的是base基础模型，而Grok-4呢使用的是思考模型，thinking模型。那你说如果GPT-5使用thinking模型，或者是thinking Pro的这个模式，是不是能够反超呢？这个不知道。为什么呢？thinking模式肯定要比这个base模式消耗更多的算力和TOKEN，它有更高的正确率，它是合理的。马斯克是不是作弊了？也不能这么算。为什么呢？因为他这个测试的要求呢，是不可以调用外部工具，要依赖自身的能力完成测试。对于是不是要使用thinking模式，或者是不是要进行多步推导呢，这个测试本身并没有要求。你愿意一步到位，还是愿意多步思考，这些都没毛病。那你说是不是GPT-5高风亮节一下，我就测一下base模式一步生成？也没那么夸张。这个原因其实挺简单的：GPT-5的thinking模式和thinking Pro的这个模式，默认是要调用外部工具解决问题的，关不掉。所以它只能用base模式来参加这个测试，如果用了thinking，你就调用外部工具就作弊了。Grok-4呢，它是可以在不调用外部工具的情况下进行推理的，所以呢Grok-4它也没有作弊。但是要注意一点，你不调用工具直接去thinking，直接去进行推理的话，在现实工作中意义不是很大，就是我们完全靠模型自己的能力去推理，现实工作中一般不干这个事。

那么这是一项。另外一项Grok-4比GPT-5高的测试是“最终人类测试”。在这个里头呢，GPT-5 Pro，也就是最强的这个版本，答对了42%的题目；而Grok-4 heavy，也是最强的版本，答对了44.4%的这种题目。这个呢就没什么好说的，火力全开，都是用的最大的模型，工具链武装到牙齿，不计成本的情况下，Grok-4呢还是要稍微高出一点点，高2.4%的一个这样的一个比例。所以呢，在一些特别难的情况下，或者说进行深度思考的时候，Grok-4做的还不错。

那GPT-5到底更新了点什么东西呢？

第一个，统一大模型，不再需要选来选去的了。原来我们需要选GPT-4、GPT-4o、GPT-3…一大堆的东西我们要选，选完了以后还要进去选，说你是给我画画，你还是给我做其他事情，你要去选半天。现在呢就不需要了，你从统一入口就进来就可以了。当然了，它可以选择GPT-5和GPT-5 thinking，或者是GPT-5 thinking Pro。当然Pro呢，你必须要200美金的账号才可以选。但是你说，哎，我就选GPT-5了，我也没有去点击thinking，没有强制他使用thinking，这个没问题，该思考的时候他就会进入思考模式。而且呢，他发现你在跟GPT-5聊天的时候，进入思考模式是不计次数的。不计次数什么意思？待会收费的时候去详细讲这个东西。Pro版本，你没有200美金的这个账号，你就别用了，跟我这种Plus用户关系不大。通过API调用的时候呢，并没有一个模型叫Pro，通过API调用的时候就是GPT-5、GPT-5 mini、GPT-5 Nano这样的几个模型，然后自己选择消耗多少thinking的TOKEN就可以了。你进去的时候，你去选说我现在是深度思考一下，还是简单想一想，还是说拍脑袋就来，你自己去设计好。

GPT-5的上下文是256K，比Gemini还是短。Gemini 2.5 Pro的上下文是一兆，就是100万TOKEN，要比它大四倍，还是很强的。但是呢，也别羡慕这东西。当你向GPT里头去输上下文的时候，少于200K是一个价格，超过200K是另外一个价格，输的多以后要单独加钱的。

现在呢，GPT-5也不再区分各种功能、工具、任务，都不再管了。虽然有选择的地方，你还可以选说我现在是不是到canvas里头去做一些后期的编辑，还是说给我画画。但是呢，如果在聊天上下文里头，你直接告诉他“给我画画去，给我去做什么编辑”，它就直接过去了，你不需要再单独靠菜单去选择这个事情。

生成代码极其强大。这个事呢怎么说呢，我今天试了试，我觉得它生成代码还是有待提高的，特别是有的时候代码的格式、缩进什么的还有点小错误。现在呢，Anthropic的Claude一直是程序员最爱的模型。这里的话，OpenAI也做了一个很骚的操作，他呢把Cursor的CEO拎来了，说：“来，你给我演示一下GPT-5很强大。”这小伙子坐在那演示，说这个绝对是太强了。Cursor原来里边主流的模型就是Anthropic。为什么他跑来给OpenAI站台呢？因为最近Cursor跟Anthropic闹得不是特别开心。两个Anthropic Claude code的核心开发离职加入了Cursor，但是呢只在Cursor干了两个礼拜以后呢，又回Anthropic继续去开发这个Claude code去了。反正这种事搁谁身上谁都不会太爽。现在呢一群的程序员都在测试GPT-5的编程能力到底怎么样，这个效果呢还可以，但是我个人感觉距离Claude 4 sonnet还是稍微有一点点小差距，有待提高。

继续往前发展呢，跑分其实已经意义不是很大了。因为很多考试成绩很好的人，未必能够干的好活，更别说招人喜欢了。有一些人就是特别会考试，但是呢你跟谁聊天，跟谁去合作，大家都烦他，这种人是存在的。Anthropic的CEO曾经在很多个场合强调过一个事儿，说人们倾向于使用某个AI，不仅仅是因为其性能指标，而是因为其人格和性格特质。他认为AI的人格特质直接影响用户使用的体验和信任感。这个我是比较认可的，就很多人喜欢使用Claude，还是说Claude的整个的人格是比较讨喜的。

现在呢，GPT-5说：“我们也改进这件事吧。”原来呢GPT-4o的时候呢，会有这种讨喜型人格上来去夸你。现在说我们把这事改掉了，已经没这事了。现在呢是推了五个人格，你可以在五个人格里自己选。第一个是默认人格，上来你不用改它，叫“乐观灵活”，这是它的特性。第二个叫“挑剔者人格”，犀利毒舌，就经常骂你这种。第三个呢是“机械人格”，就是高效直言，上来以后有话我就直说了。还有“倾听者人格”，善解人意，如果有人需要诉说一下，你改成倾听者人格。还有一个叫“技术宅人格”，就特别热情，而且呢喜欢去刨根问底。这个人格还可以有一些更复杂的选择，它有一些属性你可以去选择去，包括：健谈、诙谐、直言不讳、鼓励性、z时代、传统型、前瞻型、思维有主见、谦虚、俏皮、直接、务实、企业、打破常规、同理心。你说上面这个5个不能满足我要求，你可以在下边挑一个自己最喜欢的。当然还有一些特殊的信息，你可以直接在里头写，比如说我这个人喜欢什么东西，不喜欢什么东西，下次他再跟你聊天的时候，会注意这些事情。这个是我觉得GPT-5一个比较大的提升吧。

另外一个比较重要的提升是什么呢？就是极大的降低了幻觉。AI哈，一本正经地胡说八道，就是他们最擅长做的事情。但是现在的话，GPT-5说我们已经把幻觉降低了30%-40%。所以呢，现在GPT-5的各种答案相对来说是比较靠谱了。我原来集中在使用Claude 3模型，觉得已经是比较靠谱了，至少比国内能够拿到的模型，或者像Grok、Gemini 2.5 Pro，比这些模型还是要靠谱一些的。那么现在的话，它在Claude 3的基础上再降低幻觉30%-40%，那我觉得这个已经是可以去做一些严肃的工作了，包括医疗健康，还有法律相关的工作，拿它去上手已经没毛病了。

然后安全上面呢，还是很严格的。这个是我不太喜欢OpenAI的一点，就是它道德制高点，我该干什么，不该干什么来它决定，这个事我是不喜欢的。这一次呢稍微做了一些变通吧，就是说原来你触碰红线呢，就直接告诉你说“对不起”，停止工作了。现在呢你触碰了红线以后呢，他还会尽量说点什么，不是直接就应声地给你停掉了，“我绕一下看看，我能够给你回答点什么，过线那部分我就不说了”。但是在这点上呢，我是站Grok这边的，Grok基本上还是百无禁忌的。

那么下边呢，谁能用？多少钱能用？我现在在网页上已经能用了。在这个网页端，现在我们已经不可以再去选择GPT-4、GPT-4o什么Claude 3都没有了，现在就三模型了：一个是GPT-5，一个叫GPT-5 think，还有一个叫Pro。Pro就是你点击了以后，就找你要200美金去了。大概就这三个模型可以选了，其他模型都直接隐藏掉了。这个是我现在的一个状态。

现在呢，免费用户也可以直接用，5个小时可以问10条，超过了以后就降级到GPT-5 MINI，这个比较小的模型去了。他们每天还可以用一条thinking，每天有一个额度。但是要注意，当我们使用GPT-5模型问了一些问题，GPT-5自己认为需要去推理的时候，这个时候是不占这条thinking的这个指标的。所以呢，我们在跟GPT-5沟通的时候，要更努力地去把这个问题提清楚，让他不要占我的指标，直接把该思考的问题给我思考清楚。大家需要技巧一点。当然了他设置这种技巧也是不怕大家去薅羊毛的。为什么呢？就是胡乱地去问一些简单问题，其实对于OpenAI来说是一个很重的负担。但是你说我每一个问题都三思而后行，想了半天再往里提，哪怕他thinking了一下的话，对于他来说这个负担都还是可以承受的。

那Plus用户，像我这样的用户呢，每三个小时呢可以使用GPT-5 50次，超过的部分就退回到GPT-5 MINI了。thinking模式呢是每周200条，估计基本上也够我使了。Pro用户，就是200美金用户，基本上就都可以用了，专门有一个Pro的模型是给它用的，其他的呢基本上是没限制。

但是呢，在这里要跟大家讨论一个问题，就是对于Pro用户来说，这200美金到底买的是什么？难道Pro用户的消耗量真的是Plus用户的10倍吗？不是这样的哈。山姆·奥特曼曾经自己发过X去抱怨过这个事。他抱怨什么呀？Pro订阅让他们亏了好多钱。为什么呢？这个原因很简单，你一旦花了这个200美金以后，你就肯定说：“我不能让他闲着，我一定让他干起来。”就跟原来甲方乙方的电影似的，大骡子大马们得让它活动起来，不能让它闲着。山姆·奥特曼自己写了两条推，一条呢叫做：“疯狂的事，我们目前的OpenAI专业版订阅上亏损了，人们使用它的频率比我们预期的要高很多。”另外一条说：“我亲自定了价格，还以为我们能挣点钱呢，最后发现亏钱了。”

这两句话呢，其实告诉我们一个什么？就是200美元这个价格，并不是一个经过财务人员精确计算出来的，而是山姆·奥特曼拍脑袋拍出来的一个价格。Xai也有这样的一个套餐，叫superGrok heavy，300美元一个月。Anthropic呢，有一个套餐叫Anthropic Max，是100美金到200美金的一个月。因为我没有用过Grok的套餐，所以它这个为什么是100美金到200美金，我不是特别了解。谷歌AI的Ultra也有一个套餐，基本上250美金一个月吧。大家到底为什么要去设这样的一个套餐出来？真的是说有大量的TOKEN需要消耗，有大量的算力需要消耗，我需要回点血吗？其实压根不是那么回事。

大家注意，免费版是没有忠诚度的，我今天用你两天，明天用他几天，这都没有忠诚度。Plus版本呢其实还是可以朝三暮四，我买两三个都还是承担得起的。但是Pro、heavy、Max、Ultra这样的版本，你一旦买了200美金、300美金、250美金这种，买了你就一心一意地用吧。所以呢，大家去买这种Pro版本的，其实买的东西是一个叫“投名状”的东西，就是我把我的这个身家性命交给你了，以后我就在你家老老实实干下去了。他要求的是用户去交这个投名状，而不是说真的拿200美金就可以cover成本了，这是200美金的这种套餐设立的一个目的。

再往后讲呢，你说今天他亏了，难道一直亏下去吗？也不至于。因为TOKEN的成本呢，是在快速下降。20美金、200美金都是一种用户绑定的手段。现在亏钱，以后是不是能挣回来呢？未必，以后也未必能挣得回来。那为什么呢？TOKEN成本下降的是一个速度，但是呢我们通过使用agent，通过使用工具，也在快速提升TOKEN消耗量的速度。到底哪个更快？现在不知道。可能TOKEN现在价格是原来的1/10了，但是呢我们现在使用的TOKEN量是原来的100倍，至少最近这一两年吧，是这样的一个变化趋势。过一段时间以后，是不是TOKEN成本下降的这个速度可以追上TOKEN消耗量上升的速度？有这个可能，但是市场目前还没看到。

那咱们再讲一讲API的价格。GPT-5的API价格是极具竞争力和压迫感的。GPT-5 BASE模型，基础模型，100万TOKEN的输入输出分别是1.25刀和10刀。输入100万TOKEN是1.25刀，输出100万TOKEN是10刀。这个其实已经很便宜了。它的MINI模型，就是比它要稍微小一点的模型呢，基本上就是在前面那个数字上除5，0.25刀和两刀的这个输入和输出。Nano模型，就更小的模型就是，在MINI的基础上再除5，就是这样来的。就这种东西都是拍脑袋拍出来的，千万不要认为说这个数是很详细的计算出来的，真计算出来那个数不会这么有竞争力。

为什么说它有竞争力呢？Gemini 2.5 Pro的这个价格，我们去比较一下。Gemini 2.5 Pro的价格，200K以下的，输入是1.25刀，输出是10刀。这个呢跟GPT-5基本上是一样的，GPT-5基本上是照着谷歌的Gemini 2.5 Pro去定的这个价格。但是如果我输入的TOKEN超过200K了，输入是2.5刀，输出是15刀，它就会有一个上浮了。Gemini 2.5是有Pro版本、Flash版本，还有一个叫Flashlight的版本，所以它整个的定位跟GPT-5基本上是一致的。它的Flash版本和Flashlight版本呢，都要比GPT-5相应的版本，比如mini版和Nano版，要稍微贵那么一点点。具体钱就不跟大家念了，基本上是稍微贵一点点。Grok-4，就是XAI的呢，只有一个版本，输入3刀，输出15刀。这个明显要贵很多，它要比GPT-5和Gemini 2.5 Pro都要贵。所以呢，Grok-4刚出来的时候，我用了一段时间，一个礼拜吧，然后就都改成Gemini 2.5了。

另外的Anthropic的Claude，它的价格是什么样的呢？它最大的模型，输入15刀，输出75刀，基本上是没有竞争力的，太贵了。Sonnet输入3刀，输出15刀，又是一个田忌赛马的故事。其实我们平时用的最多的模型就是Sonnet，效果已经很不错了。但是呢，现在的GPT-5，1.25刀嘛，它这是三刀嘛，所以还是要便宜很多的。原来你使用Claude 4 Sonnet，现在咱们就使用GPT-5就可以了。所以GPT-5的价格是极具竞争力和压迫感的。

AI竞争的格局呢，也开始向新的方向去进发了。第一个，谷歌Gemini 3应该已经不远了。虽然没有明说，但是呢普遍猜测今年年底我们是应该可以看到Gemini 3的。现在呢，谷歌已经进入下一个竞争阶段，谷歌跟OpenAI开始去抢别的东西了，抢什么呢？开始抢终端用户了。怎么去抢终端用户？免费用户就可以去使用Gemini 2.5 Pro了。他现在也在努力地把谷歌的Gmail用户，他的Workspace用户，向他的Gemini Pro版本去进行转化。而像OpenAI，他也是说GPT-5出来了，你们这些免费用户就可以用了，我一定要把我最好的一面展示给你，万一有一点转化率，说我今天想去充钱了呢。

马斯克的XAI呢，应该已经感受到压力了。在Grok的模型能力上，其实还是有一点点小差距的。Grok-4在进行复杂运算的时候还是很能打的，但是呢在综合能力上和用户体验上还有待提升。Grok我觉得最大的优势是百无禁忌，这块是我最喜欢他的点。用户体验上，马斯克到底是不是要继续往前跑？现在呢还没有看出苗头来。因为现在的Grok的客户端，Grok的各种功能，比OpenAI也好，比这个Gemini也好，差的还是比较远的。而这一块的话，不是靠天才可以搞定的，这一块是需要靠堆人才能追的平的。你需要很多的人，OpenAI现在的总人数已经超过了XAI的总人数，即使是XAI跟X合并了以后的总人数，OpenAI也是人更多一些。XAI现在大概是1200人，OpenAI 7月份的人数的话，现在有两个猜测，因为没上市嘛，非上市公司，它的很多的数据就靠大家猜。一个呢是SEO.AI他们猜的，OpenAI现在有2659个人，就基本上是XAI的一倍多一些。另外一个呢叫LeadIQ，他们猜呢，OpenAI现在应该有6400人。那差为什么差这么多？因为有一些可能是contractor或者是一些派遣员工，或者是其他的这种合同制员工吧，所以可能会有一些差距。但甭管是哪个数吧，都差好几倍。另外一些竞争对手，比如说谷歌、微软，那你这俩公司就别跟他们比了吧，谷歌18.7万人，微软22.8万人，你说你跟他们比什么劲。但是后边说我们现在开始进行终端竞争了，要去打造一个用户体验非常好的生产环境了，你就需要堆人。马斯克可能未来需要堆人把这个事情搞定。所以下面呢，要去进行这个终端用户争夺，你到现在为止，Grok-4我还没有在平台上用过，我只用过API。为什么呢？因为像我这种8美金的X用户，他不给我用，必须要去买30美金的超级Grok用户，他才让你去用Grok-4。到目前为止，马斯克还没有把这个弯子转过来，所以他还没有进入到终端用户争夺的这个战场上去，已经落后半步了。

另外一个落后的可能比较远的是谁？就Anthropic。为什么呢？从资本到算力上，它都相对来说比较受限，所以在价格上就能体现得出来，它所有的这个API的价格它最贵，而且贵的不是一星半点。最后要打价格战的时候，刺刀见红拼不过前面那几个。马斯克虽然现在争夺终端用户他抢不过OpenAI、抢不过微软、抢不过谷歌，但是他至少手里还有一个X，X上还有一堆用户呢，这是他的天然基本盘。而且马斯克别的不行，募资很强，他募了一堆钱切着咔嚓买显卡，把它堆起来去堆算力这事，它是很强的。Anthropic融的钱本身就不是那么多，虽然它的两个大股东一个叫亚马逊一个叫谷歌，说“哎我这有算力你来使吧”，但是呢你真的要真刀真枪的去跟别人拼的话，还是不行。但我估计后边会比较麻烦，虽然他们家的模型我也很喜欢，但是从商业角度上来说他们是很麻烦的。现在有传闻苹果要收购他们，但是我其实不太相信，因为苹果呢不太做这种特别大规模的收购，这么高的价格去收购的话，不是厨子这种守城之君可以做出来的决定。如果他真能做出这种决定来，当时他就把车造出来了，而不是说抠搜抠抠搜搜，最后整个Vision Pro出来，这个我估计他搞不定。

然后Meta呢，等着看他们一鸣惊人吧。挖了这么多人回来，超级团队，后边可能还会为我们带来很多不同的故事。现在进入了一个新的竞争状态。

这里还有一帮人，中国团队怎么办呢？中国团队呢，只能靠差异化了。开源更大更新的模型，把agent一起开源出去，这可能就是中国团队未来竞争的一个方向。因为你去卷大模型，你卷不过他们了，手里头没有这么多的显卡，没有这么多的算力，数据上也有受到一定的限制，我们去卷底层大模型这块就会比较费劲。现在中国的这些AI公司里头呢，字节是在走OpenAI这条路，就是我闭源，我就疯狂的往前堆，但是未来到底能堆成什么样还不好说，而且字节也在堆显卡，他很多显卡是堆在海外了。其他的像阿里、百度、MiniMax、Kimi这些团队呢，都在堆开源，把最新的、最完整的、最大的模型直接开源出去，争夺一些客户回来，争夺一些市场空间回来。所以呢，大家玩的是不一样的。

那么开发者跟创业者应该干点什么呢？这一次OpenAI开完发布会以后，没有哀鸿一片，这是非常好的事情。说明什么？AI agent大家还是可以继续做下去的。把具体行业的需求解决掉，这个是创业者和开发者该去做的事情。而且现在呢，底层模型也相对来说比较稳定了，它没有那么多的幻觉了，拿着这些模型就可以去做一些相对比较严肃的工作了。所以现在就是开发者、创业者要冲的时候了。

GPT-5的API呢，我今天测试了一下，比Grok-4和Gemini 2.5呢，能力上其实并没有特别明显的差异。速度和稳定性、价格，这就是后边要拼的东西。这一块呢，OpenAI应该还是可以去占优的。为啥？因为OpenAI自己压根不惦记挣钱。谷歌那后边是个上市公司，你赔多了这事肯定是不行的。而至于说Grok的话，现在虽然他没有那么惦记挣钱，但是马斯克很多的操作其实是比较粗犷的，这种真正需要绣花，一针一线的往前去拼价格战的时候，他未必跟得上这个节奏。所以我相信在这一块上，OpenAI会领先一点点。未来一段时间呢，大家应该都会加班加点，对每一个应用中的AI节点进行效果、速度、稳定性和成本的这种对比，去更换GPT-5的API。这就是开发者现在该干的活。

原来说AI创业很难，原因就是大模型厂商的边界不清晰，你今儿干着干着，明天被他覆盖了。现在的话，这块清晰了，他们就去干他们的事情，我们干我们的事情。所以呢，最初的问题其实已经解决了，赶快去找到方向去干活。

那么到底是在挤牙膏，还是新的时代到来了呢？首先要讲，OpenAI再次地给行业指明了新的方向。第一个叫模型融合，不要整一大堆模型让我挑来挑去的，你就给我一个，我自己呢做这个提示词，你根据我的提示词去给我反馈就完了。该多说两句的时候多说两句，该少说两句的时候少说两句，不要让我去选取。第二个呢就是自动的进行判断，对于什么各种工具的调用，这个是需要去做的。还有一个方向就是降低幻觉比例，你要想去解决实际问题，就要降低幻觉。这块呢是中国大模型差的比较远的一块。在这一块上Gemini、Grok和Claude都还是比较强的，虽然达不到GPT-5这个层次吧，但是已经是可以用的了。中国的像Deepseek、千问、Kimi、豆包这些模型，幻觉得一塌糊涂，现在需要向这块去往前走一走。降低幻觉的方式就是不断的加算力进去，反复验证，多做这种强化学习，但是呢这个是需要大量算力在里边堆进去的。

新的时代还是到来了。新的时代是以什么样的方式到来了呢？阶级逐渐固化了，分层的时代到了。顶层的就是模型商卷，顶层模型OpenAI这次真正卷的是谁？他卷的是谷歌，卷的是XAI，卷的是Anthropic，他已经不再去跟这些应用厂商去竞争去了。“我们玩我们的，你们玩你们的。”这个是新的时代。他们一旦是开始把这个事搞清楚了，下面的这些创业者就可以冲锋了。就像是盘古开天地，混沌归于有序，大家就可以在这里繁衍生息了。这个是非常重要的一个时间点。

操作系统跟平台商呢，都去参与模型厂商的内卷就可以了。比如说谷歌，现在说Gemini不是大模型，Gemini就是操作系统。微软说我这个就按操作系统来了。OpenAI也说我就是操作系统。Grok肯定也是要去奔操作系统来的，它把X收进来以后，未来这一块可能就会有一个像微信似的超级应用，对于它来说这也是个操作系统。底层应用开发好好干吧，不用再担心模型商突然抄后路了。应用商也要有自知之明，不要去干这个大模型、操作系统、平台的这个事情。怎么说呢，要安天命，就是该你干的活你去干，不该干的活就别干。

这儿呢跟大家讲一个小故事吧。应该是在2014年年初的时候，我当时还在猎豹，跟着傅盛还有猎豹的其他几个高管呢，到谷歌北京办公室去吃早饭。不是占人便宜去了，我们跑去谷歌谈很多事情的时候呢，他们就特别喜欢让我们到他的办公室里去吃早饭，因为谷歌当时的食堂特别好，后来搬家了以后那食堂就没那么好了。当时是香港谷歌的一个负责商务的高管跑到那来跟我们吃早饭，趁着吃早饭的时候开个会嘛。当时我们做的工具呢，叫Clean Master，清理这个手机垃圾信息的。他问了一个什么问题呢？他说：“你们到底是清理memory，还是清理disk？”其他人就没想明白到底在问什么。我呢当时抖了个机灵，我说：“我们只清理disk，绝对不碰memory。”因为其实安卓手机上压根就没有DISK这个词，它叫storage drive，就是存储的驱动，这个不是叫DISK的。所以当时我就直接反应过来了。其实Clean Master是两个都会清理的。我回答了以后呢，其他人还看着我说你怎么胡说八道，明明不是这么回事，我们两个都可以清理，你干嘛说只能清理disk，不能清理memory呢？但是我回答完这个问题，还没有等到我的这些领导们来质疑我的时候，谷歌这个高管就直接肯定了，说：“这就对了，你们就只能清理disk，你们就不能清理memory。memory的事情是操作系统的事情，你不应该去做这件事。你就把这个硬盘上的东西清理清理就完了，或者说这个存储介质上东西清理清理。你一旦开始去碰内存了，就相当于是我们介入到了操作系统管理层去了，哎，你不该干这个活。”

讲完了以后呢，我们都是一头冷汗，也是觉得好不容易从鬼门关混出来了。吃完这顿早饭以后，出来这些高管就开始骂呀，说这个谷歌还说不作恶什么，这些东西都是扯淡。他划定这块地方，你就绝对不能碰他，你碰了他，他就甭管你是不是作恶，就直接干掉你。因为当时呢，跟我们同期有另外一个软件是杀病毒的，台湾趋势科技做的一个杀病毒的软件在里头，就被谷歌的高管作为典型跟我们讲。说你看这个台湾趋势科技，做了一个杀病毒的软件在安卓手机上，说这事是不对的。说为什么不对呢？说安卓是没有病毒的，我们已经宣布了安卓没病毒，你怎么可以在我这没有病毒的操作系统上杀病毒呢？最后你还杀出来了，这不扯淡吗？这个是不允许的。所以给了他们很严重的这种处罚。我们如果当时告诉他说“哎我们既清理硬盘也清理内存”的话，估计也是很严重的处罚。我们跟他吃完饭了以后，过几天就去纽交所去敲钟去了。如果当时那问题没回答好的话，这个钟就不用敲了。所以我觉得我那个机灵抖的还是挺好的。

这个也是说，做应用的厂商要各安天命，做自己该做的事情，在人家的规则下去做事情。这个就是未来这些模型厂商给这些做应用的厂商留出来的空间。当然了，中国厂商呢，总是会有一些不太愿意在你框框里头去跳的这些人吧，就是我们总是愿意做一些跳出圈的事情，不太喜欢这种逐渐固化的阶级，我们会再折腾一下。

所以结论就是，GPT-5发布了，确实还是有一些比较强的新特性的，包括统一的模型，自动地去判断怎么去工作，降低了幻觉。新的时代也到来了，这就固化，该选操作系统、选大模型的，你们选那个去，其他人在稳固的平台下，去做我们的应用就完事了。只要我们不去挑战权威，不去挑战规则，在这个规则下也可以挣到钱。这就是一个新的时代。

好，这一期呢就讲到这里。

Anthropic Claude – 老范讲故事｜AI、大模型与商业世界的故事

AI客服越智能越坑人？坑了商家、坑客户，咋办？

AI客服的正面反馈

让商家崩溃的案例有哪些

让顾客崩溃的案例有哪些

AI客服产品设计的思路，可能从来就不是解决问题

咱们能干点什么呀

如果您是商家

如果您是客户

到底应该如何跟AI客服聊天呢

背景图片

1600万次偷跑曝光！Deepseek与Minimax如何偷偷蒸馏Anthropic？

一、 Anthropic 掌握了哪些“铁证”？

二、 被指责的三家中国公司分别“学”了什么？

1. Deepseek（约15万次交互）

2. Kimi（约340万次交互）

3. Minimax（约1,300万次交互）

三、 应对 Deepseek V4 的“小连招”

四、 蒸馏到底算不算抄袭？

1. 大模型输出内容没有版权

2. 数据已被大模型“污染”

3. 开源协议与用户条款的灰色地带

五、 Anthropic 的“论迹推心”与潜在后果

可能的结果是什么样的？

各大模型的开源协议对比：Deepseek 是个例外

六、 著名美国公司“蒸馏”事件：Bing vs. Google

七、 总结

背景图片

Clawdbot深度评测：全能AI助理的成本与实战避坑

突然爆火的原因

产品形态与体验的明显差异

1. 全时驻留

2. 持久记忆加上主动触达

开源且无所不能的系统

传奇的创始人：Peter Steinberger

Clawdbot到底能干点什么？

部署Clawdbot的风险：TOKEN在燃烧

为什么一定要Mac mini？

全功能的系统配置

Clawdbot是不是一次革命性的创新？

硬件与巨头的新机会

最后总结一下

背景图片

GPT-5 发布！是革命还是挤牙膏？深度解读AI竞争新格局！AI价格屠夫来了！开发者和创业者的黄金时代开启？

二、被指责的三家中国公司分别“学”了什么？

三、应对 Deepseek V4 的“小连招”

四、蒸馏到底算不算抄袭？

六、著名美国公司“蒸馏”事件：Bing vs. Google

七、总结