API – 老范讲故事｜AI、大模型与商业世界的故事

ChatGPT Agent重磅发布，山姆奥特曼亲自站台却惨遭现场翻车，这究竟是Manus的机遇还是整个泛Agent赛道的丧钟？

Luke Fan — Sun, 20 Jul 2025 00:41:29 +0000

ChatGPT Agent来了。

Manus到底是该哭还是该笑呢？

ChatGPT重磅发布了他的Agent。怎么个重磅法？山姆·奥特曼亲自坐台。现在很多ChatGPT自己产品的发布，山姆·奥特曼都不在前台坐着，这次是亲自坐台。而且旁边坐了四位主讲，很多时候发布会就是俩人或者仨人，这次是山姆·奥特曼坐在这，旁边坐了四个人。而且呢，足足讲了25分钟。

很多人就想起Manus来了，好像有些测试还不如Manus。因为他现场有翻车的，大老板在旁边坐着，你测试翻车的话还是压力挺大的。在这个时候就有人说了，GPT也就这样，你们现在还觉得Manus做的不好吗？就有一些讨论在发生了。

ChatGPT的Agent到底会给Manus带来什么呢？Manus到底是该哭还是该笑呢？今天咱们讲讲这个事儿。

首先呢，咱们先回顾一下GPT Agent的一个发布过程。时间呢是太平洋时间2025年7月17号上午10点，也就是北京时间7月18号的凌晨1点。山姆·奥特曼坐在最边上，他不是主讲，他就是一个串场的。另外一头呢坐着一个印度老哥，中间呢是三个亚洲脸，两位男士呢应该确认是中国人，还有一位女士呢，虽然看起来是亚洲脸，但是是不是华人不知道。

25分钟的视频演示也很无奈，他这种演示你没法短，因为很多的任务，跑起来的时间就非常长，特别是婚礼差旅一条龙的。这个任务基本上是从头跑到尾，就是一开始布置任务下去，中间穿插了几个其他任务，最后到那个结束的时候，算是差不多跑完。

让Agent去帮忙参加朋友婚礼，挑酒店、挑礼物、定穿搭，中间还打断他说，我还要再买双鞋。这个其实挺好玩的，因为以前这种Agent，最讨厌的一点是什么呢？就是你只要让他开始跑，半个小时或者多长时间，你没法打断他，发现他错了以后呢你也没办法，只能让他重新开始。现在呢，我说我可以打断你，或者中间可以把你叫停，让你去帮我调整一些东西，加一双鞋或者做一些其他的。这个呢，算是一个，我觉得算是用户体验角度上的一个比较大的前进吧。

从技术角度上来说呢，并没有那么费劲。只是呢，在Agent的执行框架上需要做一些调整，你比如说多线程，或者是一些守护线程，他需要做一些这样的东西。在大家做了这么长时间的手机应用、前端后端应用以后，这个不是那么费劲的。

手机端呢，也可以进行即时的创意，也就是在iPhone上请求制作团队吉祥物贴纸，就是做了一些可以做设计的任务。这个应该是对着像LoveArt这种设计Agent去的。然后呢，做了一个财务数据分析，他讲的是去我的Google Drive上，把评估指标拉出来，给我做一个汇报。幻灯片还做的可以吧。

后面就是演示了随时打断和二次确认，在Agent里头点击打断，可以进行指令修改，Agent结束前弹窗确认邮件内容。但是呢，在现场还失败了一个，找球场这个是一个失败演示。

他干了一什么呢？规划一场夏季旅行，走遍30座职业棒球球场，并给每座球场买两张最便宜的日场票。给了他这样的一个任务。一开始呢，是先用文本浏览器，抓取了2025年赛程和票价，到这呢数据还是正常的。然后是通过脚本去终端执行，通过终端去执行脚本，生成Excel和绘制地图。但是呢，这儿就开始出错了，地图坐标严重错位，纽约、波士顿等东海岸的球队就没了，墨西哥湾里头凭空出现了一些球场，引起场下的一些窃笑了。

再往后呢，是用可视化浏览器，跳转到一个订票网站上，要去下单订票了。但是呢，因为这是一个跟金融和这种高风险相关的操作，所以呢进入了人工模式，就是你必须要确认一下要花钱了吗。然后就遇到了一个问题，Agent自动去填邮箱了以后呢，它网站需要跳这个叫二次验证，二次验证，就比如说我给你发个邮件，你给把这个邮件里头那个码给我呀，或者是给你发个短信，就是这种验证程序。这个Agent就跑不动了，他呢触发了订票网站等待用户的一个进程，要求你60秒钟之内呢要去接管，结果呢他也没有好好的接管这个东西，就直接超时终止了。这个稍微有些丢人，还跳出了红色的长串错误信息，反正现场就有点绷不住了。主持人呢只能尴尬收场，这个主持人是谁？山姆·奥特曼。他呢出来打了个圆场，说买票这步我们之后会在debug的。这是整场直播唯一强制终止的一个demo。

最新的ChatGPT Agent到底有哪些新特性呢？第一个呢，它是Operator加上Deep Research，这两个功能加一块的东西。Operator其实应该是今年年初的时候发布过一次，所谓Operator，就是在一个虚拟机上打开浏览器，给大家去做各种的操作，模仿真人去点击各种的网页。但是呢，这个功能呢，一直是在200美金的用户那里使用，像我这种20美金的用户是没使过的。而且即使是200美金的用户呢，应该对这个功能也不太感冒，因为你要去使用互联网的网站的话，难度还是很大的。

咱们做各种软件里头，最难做的一个软件不是操作系统，而是浏览器。为什么？因为每家做的网站都不一样，我到底用的是谁家的前端库后端库，在里边隐藏了哪些信息，怎么去做的缓存，做了哪些防刷以及防骗的这种工具，做了哪些多次验证的东西，这个真的是千奇百怪的。所以你要想完全兼容这种东西是很难的，你让一个机器人去点网页，成功率还是不太高的。所以这个产品虽然发布了，但是大家使得并不是那么爽。

现在说Deep Research这功能做的还不错了，那跟Operator两个功能结合起来，就是这一次我们所看到的GPT Agent。这俩功能呢，Operator我从来没用过，Deep Research呢是我经常用，而且经常把额度跑光，需要等到下边一个时间周期，重新分配额度接着跑的一个功能。

它呢是由一台虚拟化电脑，就还是Operator这套东西里头呢，内置了图形界面浏览器和文本浏览器。什么叫图形界面浏览器？就是我真的打开了一个网页，这边是有按钮的，那边是有输入框的有菜单的，这种浏览器呢叫做图形界面浏览器。而文本浏览器的话基本上就是，我把你这个网页抓出来了，直接把里头的内容呢进行了总结归纳，或者说把里头的内容直接提出来了。他们在这个里头是两个都有，大部分情况，你说我只需要进行信息总结的话，就是文本浏览器就够了。实际上文本浏览器大家可以理解为一个爬虫。图像浏览器的话其实，对于这种虚拟机来说是难度很大的。为什么？因为我们写网站的时候，还经常会去研究，比如说设备的自动适配，就是我在手机上，这个网页应该长成啥样，在平板上应该长成啥样，在PC上应该长成啥样，遇到特别大的浏览器应该长成啥样，这个都是不一样的。还有一些比如说我们有些网站上，会写这种不可见的字符，干嘛呢？骗AI的，说你遇到我这个网站就不能爬了，或者说不能做一些其他的工作。还有很多这样的东西。

另外呢，上浏览器的呢，其实还有一点小的问题，大家知道网站上有一个文件叫robots.txt，这个文件干嘛使的？实际上是应对爬虫的，告诉你说哪个爬虫你可以看哪些东西，不可以看哪些东西。而你一旦上浏览器了，Robots这个文件实际上就不起作用了。

那它这个一体化的虚拟电脑，除了图形化浏览器和文本浏览器之外，还有什么呢？还有终端，你可以在上面去跑一些程序，以及API连接器，包括一些模型，都在同一个沙盒里边完成。点击键入运行代码，调用Gmail、Calendar等等这些操作。为什么叫沙盒呢？就是这个盒里头出错了，其他的盒不影响。这个呢，就是这一次的ChatGPT Agent最核心的东西，就是一体化虚拟电脑。

另外呢，就是它可以自动的选择工具，跨步骤的自主执行，将Operator网页交互，加上Deep Research的深度分析，整合在一个流程里边。Agent自行决定何时调用浏览器，何时跑脚本，无需用户指定。这一块呢，确实是做的相当不错的，因为他演示的时候，几个很长的案例中间呢并没有出错，一直在往前走。因为让他去干这种活最怕什么？就中间出错了，中间出错了以后，可能跑非常非常多的TOKEN，而且在里边死循环，都是有可能，你可能早上一起来破产了。这个TOKEN是很贵的。

长链路任务加上时间轴回放，也是一个挺好玩的东西，就是你的一个任务跑完了以后，他们最后是像放这个视频一样去看，说跑了几十分钟很多步骤的工作，第几步跑成什么样了。为什么要看这个呢？就是你中间万一跑错了，或者说这个结果跟我想的不太一样，你可以看看哪错了，让他再去进行调整。否则的话，就是前头下了命令，中间不可干预，然后直接就结束了，你还没法看中间哪错了，你连改进的机会都没有。所以这个呢，也算是一个改进吧。

再往后呢，是它的任务是可以暂停继续和打断的，也算是在用户体验上做了很大的提升吧。当然了，可以打断可以暂停那件事呢，说明另外一个问题，就是这种任务周期很长，而且呢结果经常不可控。实际上它算是个缺陷吧，为了给这个缺陷打个补丁，所以加上这样的功能。

ChatGPT Agent呢，还有一些其他的功能，比如说叫Watch Mode观察模式，以及这种二次确认。为什么呢？就是涉及付款发信这种高后果或者叫高风险的行动，会自动的进入这种叫Watch Mode，用户呢需要保持焦点，并且手动确认，否则的话流程就会超时终止。这个还是不敢直接替你花钱买东西，还要看后边怎么去改进吧。

端到端的成果交付，可以直接生成可编辑的PPT、Excel、PDF等文件。这个算是对标Manus，或者是对标其他人做的Agent，现在大家都是有这功能，所以这一次ChatGPT的Agent也把这功能给你做上来了。他做的PPT还没有Manus做的好看呢。

那另外就是跨设备的无缝切换，专门给大家演示了iOS安卓设备上，你也可以看看，你这个项目跑到多少了，你这个项目跑到什么状态了。像我平时用Deep Research的时候也是这样，我在电脑上说我现在要Deep Research了，然后我的手机上就会弹出来说，你有一个Deep Research的工作开始跑了，跑到什么样状态有个进度条，跑完了以后，他会告诉你说你这个结束了，你去看看结果是不是OK。因为Deep Research一次的话，有的时候长的也要10分钟，快的可能是五六分钟，也能跑出来。你不可能说我这边打了回车以后一直坐这等，还是要去做其他事情的。

这次呢，把ChatGPT的连接器和计划任务呢，也都整进来了。可以通过官方的ChatGPT的Connectors，叫连接器，直接呢连接Gmail、GitHub、Google Drive这些服务。也可以将一次性任务，保持为定期的自动执行任务，比如每周干一什么事，这个现在都是允许的。

然后多层的安全站，它既然已经这么强大了，你可以干各种各样事情了，你要注意，你不要去做一些危害人类的事情，所以OpenAI还是有一点点小底线的吧。也面向开发者呢提供了Agent SDK和API，但是这一块呢，现在应该还是一个预览版吧，我反正没有看到谁去用这个东西。

性能呢，全面的跃升，它去解决各种人类实际问题的评分这块是上升了。这个呢，就是ChatGPT Agent的一个基本特性。

谁能用呢？我还没用上。Pro用户就是200美元的用户，现在已经可以用了，每个月呢可以用400次。这玩意肯定不能让你随便使，因为实在是太耗TOKEN了。Plus用户，就像我这样20美元用户呢，每个月可以使用40次，其实基本也够用。像我现在，用Deep Research我觉得一天用不了一次，但是还是经常把额度跑光。现在Plus用户呢，应该是未来三天进行灰度推送，但是还没轮到我，哈哈，再继续等待。

我自己观看演示以后的感受是什么样的？第一个是产品确实非常强大，能把这么复杂的任务，自己把它分配好，顺序的执行下来中间不乱，这个已经非常非常难了。另外第二个是什么呢？大概率是不会去用的。为什么呢？前面刚夸完人家这个很强大，你咋就不用呢？因为它的结果依然是不太可控的。

直接通过模拟浏览器去点击网站，我一直觉得这个方向有毛病。为什么呢？就是每个网站都不一样，而且这个网站上还有各种防刷防骗的东西。比如说吧，有些网站，你通过一个IP地址打开多少次以后，我就直接把你封掉了，把这个IP地址给你封黑了。那你遇到这样的网站你咋办？因为它这个虚拟机，它的IP地址都一样的，它是跑在微软的机房里头的，你通过统一的机房IP，你去访问人家的这个网站去，那你跑着跑着给你封了。

有的时候你需要二次验证，像前面我们讲的一个翻车，需要做二次验证，你也搞不定这个事你咋办？而且像我们比如说注册了很多账号，像谷歌呀、Twitter什么，这些账号我们都是要去做二次验证的，你不做二次验证就很容易被偷嘛。那你一旦做了二次验证以后，虚拟机里边的这个产品，他怎么去做二次验证？他根本就没法搞。还有一些需要去遵循其他的这种约定俗成的东西，你其实也是没有办法去完全的实现的。而且还有时候呢，这些网站自己还会更新，他更新的时候也不通知你，而且更新了以后到底是不是有bug，其实谁也不知道，经常更新出来那个网站是有bug的嘛。

所以呢，你通过这样的一种非常不确定的方式，去连接各种服务的话，到底未来行会变成什么样，到底能不能稳定的去执行任务，我是表示怀疑的。像他这种用仿真浏览器的方式，去执行任务的这种模式呢，更像什么呢？更像是马斯克的纯视觉自动驾驶，说人既然可以搞定，那我用纯视觉的方式车也可以搞定。其他人说我们不太相信这玩意，我们上激光雷达，它更准确。对于我来说，我可能觉得激光雷达会更好一点。

所以呢，未来可能是很多的服务，比如说订球票这些东西，应该是一些经过验证以后的安全的API出来，或者是MCP这样的这种服务出来，然后再由这些AI Agent去调用，才有可能让大家很好的把各种的交易串联起来，而不是说像现在似的，我们在各种的防骗网站中间，去点击鼠标，模拟人类点击，这个还是太不靠谱了。

那么ChatGPT Agent到底给Manus这种泛Agent的项目带来什么呢？最后我们来回答一下这个问题。首先呢，给结论，这个绝对不是好消息，应该算是又敲响了一次丧钟吧。OpenAI每一次发表新的功能呢，都会有很多的创业项目就直接死掉了。这一次呢应该不算直接枪毙，但是绝对不是一个好的声音。

虽然ChatGPT的Agent演示的，跟这个Manus的演示呢，算是各有所长，有些做的好一点，有些做的其实都不怎么样。但其实的结果是什么？ChatGPT也证明了说，这条路最后大概也就能走成这样的一个半半拉拉的样子就完事了。在一个赛道里边，其实不怕老大强大，而怕老大倒下。如果ChatGPT也就只能做成这个样子，那你所有在这个赛道上前进的人，就都比较危险。这是第一个，证明这种范Agent的模式是有问题的。

而且呢，这一次虽然OpenAI演示翻了一次车，但是它也验证了另外一个事情是什么？就是模型及应用，你跑这种Agent是非常非常消耗TOKEN的。OpenAI模型是我们自己家的，我自己可以优化，可以定价可以亏钱，但是对于Manus这样的公司来说，模型是别人家的，你对它进行底层优化的能力就没有，那你需用了这些模型以后，你就得老老实实去按TOKEN付钱，去跑这种Agent的项目，你要去按TOKEN付钱的话，那是会跑破产的。

在结果不那么靠谱的情况下，无法对模型层面进行优化，完全依靠这个外部调用的话，Manus这种项目其实是没有什么机会的。而OpenAI就是另外一回事，反正没那么靠谱，大家就去用就完了。Plus用户一个月44，Pro用户一个月440，你们就用吧。对于OpenAI来说它又不怕亏钱，每年亏个几十亿上百亿，对于它来说都是正常的。但是你Manus你亏得起这个吗？你亏不起的。

所以最终的结论就是，OpenAI的ChatGPT Agent证明了两件事情。第一件事就是，这种泛应用的Agent依然没那么靠谱，就算是OpenAI，也没有办法让这个东西更加靠谱，因为它需要靠模拟人类去点击浏览器的方式去做事情。原来双十一上的时候，也经常是淘宝网站崩了，或者是银行网站崩了，中间需要多做一次验证什么，这种事多去了。所以你现在想让机器去替代人去做点击的话，我觉得这个这条路是有问题的。

第二个是什么？第二个就是从成本的角度来去分析，Manus在这个赛道上它也跑不远。这就是今天咱们讲这故事。感谢大家收听，请帮忙点赞点小铃铛，参加DISCORD讨论群，也欢迎有兴趣、有能力的朋友加入我们的付费频道。再见。

德国全境禁用DeepSeek只是冰山一角？昔日我们建墙防外，今日欧美反向修墙防内，AI时代的数据主权争夺战已然打响。

Luke Fan — Tue, 01 Jul 2025 00:44:10 +0000

德国全境禁用DeepSeek，以后这墙要反着修了吗？

大家好，欢迎收听老范讲故事的YouTube频道。2025年6月27日，德国数据保护专员梅克坎普宣布，已经要求苹果和谷歌从德国应用商店下架DeepSeek应用程序了。德国不是第一个，估计应该也不是最后一个。第一个是谁？意大利。意大利在每一次反对AI这件事情上，都是占第一个。原来他还反过OpenAI的ChatGPT。2025年初，也就是R1刚出来的时候，就直接给封了。

欧盟的其他国家现在是一个什么状态呢？他们比较纠结。荷兰是禁止政府手机安装DeepSeek的APP；比利时是建议公务员的手机不要安装，但是不强制；西班牙是有消费者权益组织在呼吁，政府到目前为止没有采取任何的措施；英国表示说他们在持续的监测，目前还没有做出反应。

其他的一些国家对DeepSeek是什么样的一个态度呢？加拿大所有的政府设备禁止使用DeepSeek；丹麦政府设备禁止使用，但是丹麦有5个大区里头，只有3个在执行，剩下两个还在看。

美国在这件事情上比较散装。什么叫散装呢？就是他也是管政府，其他的就是全民的，这个现在还没管起来。而且政府是各自出禁令：NASA禁止员工使用，五角大楼禁止访问，美国海军禁止使用DeepSeek相关技术，都是直接禁掉了。德克萨斯州禁止政府设备使用DeepSeek。美国这么多州里头，只有德克萨斯出了这样的法令，其他地方都没动。数百家私营企业已经要求企业网络安全服务公司阻止访问DeepSeek。这个什么意思？就是很多的美国企业呢，他们会把公司内部的安全事项包给一个公司，说你们公司来帮我去做我们整个的网络安全，请在设置防火墙的时候，把DeepSeek整个的网站都给我封掉，不允许访问。这是美国的情况，没有全国性的法律。全国性的法律有人在提，但是现在距离能够真正成为法律还比较远。

澳大利亚是阻止政府设备访问DeepSeek服务；韩国是政府国防部各个部门禁止使用DeepSeek服务。

印度比较好玩，财政部禁止使用DeepSeek和ChatGPT。我们能够跟ChatGPT一起被禁止，也是很光荣的一个事情吧。电子和信息技术部建议本地部署，解决隐私问题，说咱们别封禁这玩意，咱们自己部署一套东西咱自己使吧。这个是印度还比较务实的一个玩法。

封禁DeepSeek，大家都在封，分很多个层次。

第一个层次就是叫政府设备禁用，其他民众不管。很多的政府呢都是这样去做的，包括像最早美国政府去封TikTok，也是这样的。就是政府工作人员的手机，不允许安装TikTok，其他的人我是管不着你的。他们反正也是有言论自由，或者各种的信息自由使用的权利嘛。所以呢，很多的政府是这样来处理这个问题的。

第二种呢，就是叫全境封锁，而且呢是封DeepSeek的APP。大家注意，我们现在都叫DeepSeek，但其实是分很多层级。DeepSeek有开源的大模型，任何人可以把它部署到自己的云服务器，或者部署到自己家里边去。然后呢，有DeepSeek网络服务，就是我们连接DeepSeek的网站，使用这个网站上的聊天功能，或者是使用它的网站上面，由DeepSeek官方部署的大模型，买它的API的TOKEN直接使用。第三个层级呢，才是移动端APP，就是安卓iOS的这个APP。

德国这次呢，实际上进了个寂寞，只封禁了DeepSeek APP。他没有去封禁DeepSeek网站，在德国境内的民众，依然可以通过DeepSeek网站去跟DeepSeek的服务去聊天，也可以通过DeepSeek的网站直接调用DeepSeek服务端的这些API，直接去工作都是没问题的。只是把这个APP给下架了，这个其实没有任何意义。

再往后一层级是什么？就是封这个DeepSeek网站。就是我不但要把你的APP下架，还要封网站，任何人都不允许访问你的网站去跟他聊天，也不允许调用他的API服务。意大利全境是达到这个高度，就是意大利境内你不可以访问DeepSeek.com这个网站的。

澳大利亚政府的设备不允许连接DeepSeek网站，也不允许安装DeepSeek的APP。这个其实相对来说比较好做，就是你只要是在澳大利亚政府的所有手机设备上，修改一个域名指向，保证所有指向deepseek.com的这个域名，把IP地址直接给它改掉就完事了。这样就即使你安装了DeepSeek的APP，你也访问不了它的服务，它是可以这样来处理的。

美国的很多大公司呢，也是通过他们各自的安全公司服务商的防火墙，封禁了DeepSeek的服务器访问。你拿着手机出去没人管你，你只要拿着手机进来了，连了公司的Wifi了，你就不可以再去访问DeepSeek的服务器了。你装了DeepSeek APP，你进到公司里边来也用不了，它是这么来工作的。那有没有人……

去禁止DeepSeek开源模型部署呢，也有。谁呢？美国国会、五角大楼、NASA是禁止在自己的设备上部署DeepSeek的开源大模型的。你把模型布在这儿，万一这个模型跑着跑着，把我数据偷跑了，这玩意不行。

澳大利亚禁止政府设备部署DeepSeek开源大模型。韩国呢，国防部是不允许部署开源的DeepSeek大模型的。其他的一些政府部门呢，别用它的服务就完事了。你部署模型本地使用，我不管你。

DeepSeek被欧美封禁呢，本身其实也没有太去争取过说解禁，或者说“我怎么能为你服务”。DeepSeek也没惦记这事，爱封封去呗。我反正就开放给你使，你愿意使使，不愿意使拉倒，大概是这样的一个态度。

意大利跟德国呢，其实都给DeepSeek写过邮件，发过信息，要求DeepSeek呢，对其数据的隐私保护措施进行说明和调整优化。就是说：“你这个数据能不能不要回到中国去？你能不能在意大利或者在德国，或者至少在欧盟吧，你建个服务器，把这些数据存在本地？或者能不能告诉我说，这个数据回到中国以后，是不是做了脱敏处理？能不能保证我们的这个信息安全？”

发了信息以后呢，DeepSeek基本上就是“我不理你”。反正我也在你这儿没有什么实体，我也不在你这运营，你拿我也没办法，我就懒得理你。所以意大利政府也好，德国政府也好，发现“我发了要求了，你不理我，那我就给你封掉”。

所以这件事呢，大家也没做错什么。开源模型完全可以在当地部署，将数据存在他们本国，是完全可以达到合规要求的，这个本身是没问题的。但是DeepSeek没惦记做他这个生意呢，也就没有费这个劲。

因为中国其他的这些大模型，包括AI的很多应用呢，都在欧盟、美国使用的很好，并没有被封禁。比如说像千问，阿里的这个模型，开源呢没有问题。国内外访问它是分离的，咱们在国内访问的是tongyi.com，在国外访问的是qwen.ai，这个不一样的网址。千问是qwen.ai，就是你各自访问各自的。所以呢，它这个数据本来隔离的，那它就不会有人去封禁你。

而且千问也好，通义也好，它这个用户量其实本身不是很大。它通义是有APP的，千问没有。通义的APP压根就没有在欧盟去上架，就是你这个APP到这个应用市场上架的时候，你可以选说我到底要在哪些国家上架，它没去，所以也没有被封禁的这个机会了。

另外一个中国公司，AI公司在海外有很多用户的呢，就是Mini Max。Mini Max呢，它是国内外也是分开的。

你想去调Mini Max的服务，他还要问你说：“你到底是调国内版还是调国外版？”如果是国内版的话，你的网址是什么？你要上什么地方去申请这个TOKEN？你要调国外版，它网址就不一样。那这样分离的话，它就没有问题，国外也都是允许使用的。只是DeepSeek懒得给你费这个劲了。

另外，你比如像字节、快手，他们的这种AI服务也都是分离的。字节的coze，它在中国访问的是coze.cn，在海外访问的是coze.com，它就完全分割的。那大家就用吧，没有任何问题。快手的可灵也是这样的，海外跟国内的域名、APP全都不一样，这个就没事。

现在这些大模型公司，大概只有一个是比较特殊的，不是DeepSeek，是谁？是智谱。智谱呢，是被美国列入实体清单了，进入了美国严选。就是中国的这些AI公司呢，原来那些做人脸识别的企业，都因为侵犯人权被挂在实体清单里头，像什么商汤科技、科大讯飞、海康威视、旷世科技、大华股份、一图科技、云从科技，这些都是实体名单里头的。这一波做大模型的公司里头，唯一进到实体名单里头就是智谱。那他的这个模型大家就别使了，其他的其实都没有进到美国实体清单里头去。这就是当前的一个情况，就各个国家到底是如何去封堵DeepSeek的一个情况。

那最后呢，总结一下：德国对DeepSeek的封禁呢，基本上是封了个寂寞。你把APP封了，网站没封，这个其实是没有任何意义的。德国境内的民众依然可以通过手机、电脑登录到DeepSeek的网站上，去享受他们的这种API服务，或者是直接在网站上跟人聊天，这都没毛病。DeepSeek自己呢，也没有惦记着去开拓海外的个人市场，所以呢，也没有费工夫去做合规。如果认真做，其实不会被封，就是DeepSeek本身应该是有能力合规的。

真正担心安全问题的，就不是像德国这样直接把APP封了了事了。真正担心安全问题的，会封禁DeepSeek的开源大模型，就是你不允许在我的设备上部署你的开源模型，这个才是真正有安全意识的人干的活。那是不是有人真的偷数据了呢？这个事真不好说，因为也没有证据。但是现在数据的流转，其实根本是没法封禁的。美国要求美国人的数据在美国，欧盟要求欧洲人的数据在欧洲，这个没有任何意义。即使数据库存在欧洲本地，也有很多方式通过远程的方式，把这些东西直接去进行解读、去进行打包，或者是加密了以后再传回中国来，都是可以做的。所以现在他们各个国家。

制定的什么“守门人”法令，或者各种AI的这种限制法令，对于数据安全来说，基本上是没有什么意义的。而且呢，有了AI之后，原来一些可以保证数据安全的方式，现在实际上都没法使了。

原来是说大量的数据混在无序数据里边，是被保护的，因为很难挑出来嘛。现在有AI了，在海量数据里边“大海捞针”也不是不可能的事情。所以呢，现在真的没有什么安全的方法。特别是伊朗这次被以色列彻底给渗透了之后，核专家一个一个被暗杀了，军队的高层领导一个一个定点清除，所有的这些设备设施，一个一个精准打击，就说明数据渗透这件事情还是非常可怕的。

以前呢，美国人喊中国“门户开放”，现在中国要求美国“技术共享，市场开放”。以前呢，中国通过“墙”保护，外面的信息别流进来；以后呢，可能全世界都需要建墙，保护自己的数据别流出去。

这就是这一次DeepSeek被德国勒令全境下架的一个故事。这个故事今天就跟大家讲到这里。感谢大家收听，请帮忙点赞，点小铃铛，参加DISCORD讨论群。也欢迎有兴趣、有能力的朋友加入我们的付费频道。再见！

GPT-3与O4 mini不再高冷：融合工具调用、记忆与超强图像推理，普通人也能高效应用AI，一文看懂成本、限制与Copilot捷径

Luke Fan — Fri, 18 Apr 2025 00:50:27 +0000

GPT-3和O4 mini发布了，这次绝不再仅仅是科学家们的玩具了。大家好，欢迎收听老范讲故事的YouTube频道。

本来GPT-3和O4 mini发布呢，我并没有抱太大的期望。为什么呢？因为前面O1和O3 mini发布的时候呢，看得我头晕眼花的。我记得应该是在去年12天连续发布会的时候发布的O3 mini，实在是太不明觉厉了。各种的复杂科学问题，咔咔就给解决了，然后各种的排名都排得很高。但是呢，我自己其实并不怎么用。

为什么呢？第一个，ChatGPT Plus用户里边呢，它是有用量限制的，并不是随便让你用的。所以在有用量限制的情况下，你就得省着用，而且你也感觉不出有太大差异来。你说你用它干嘛？据说编程很强，但是它没法跟IDE结合，基本上也就放弃了。你是可以出一大堆的代码，但是你还得向IDE里边去考来考去的，很麻烦。那你说我通过API调用吧，直接使用O1和O3 mini这些模型，实在是贵，所以就放弃了。

这一次呢，真的就不一样了。首先是Greg重新上线了。Greg其实好长时间不怎么出来了，他是在2023年11月份山姆·奥特曼宫变之后，就变得非常低调。2023年11月开始休假，后来是在微软的强烈要求下才回归的。到2024年又开始了长期休假，但是在大量高管离职之后，年底再次回归，还宣布：“我提前俩月回来了，我本来还想再多歇一歇的。”现在呢，主要负责机器人业务，不再担任董事会主席了，保留了总裁的职位。

Greg上来开始显得有一些紧张，不知道该说什么。大家可以去看看那25分钟的发布会录像，后面逐渐放松了，也是长时间不露面、不说话的一个表现吧。这一次的话，全程C位，坐在最中间的位置上，主持O3和O4 mini的发布会，可见重视程度了。

这一次的发布会呢，基本上是二对二的分配，就是两个老板配上两个做事情的。两个老板始终坐着不动，做事情的人呢，就是讲到不同的部分，然后来换。还有一个老板呢，叫Mark陈，首席研究官，亚洲脸，但不确定是不是华人。有传闻其父母是从台湾去的美国。现在呢，有一种ABC脸，看起来有点像华人，但是脸型又不像。这个据说呢，是长期英文发音和美式的饮食习惯，以及美国教育所形成的一种脸型，反正跟华人还是有一定区别的。有可能是个华人，当然也有可能是个越南人，这个不确定。

另外两个呢，是根据演示的过程不同，不停地换工程师。国内引用的照片呢，肯定是有偏向性的。国内各媒体呢……

通常引用的是讲到模型强化训练和各种跑分的这两位工程师。为什么呢？因为里头有一个叫周文达的，是一位华人。国内各个媒体引用照片的时候，一般会引用含华量比较高的照片。

一开始呢，也是讲科学，什么量子力学。本来我也挺失望的。科学的部分呢，对于我这种普通人来说，已经没有那么大关系了——看不懂，没需求，也用不起。所以一看，还是这东西，好像没什么意思。

但是讲到后边呢，越来越兴奋了。咱们讲几个好玩的特性，并不跟大家完整的去复述这个发布会了。有兴趣可以去看这个25分钟的发布会，各种数值绝对是遥遥领先。

OpenAI呢，作为行业老大，他是有自觉的。什么叫自觉？从来不跟别人比数值，只跟自己比。就是他不会说我把Gemini 2.5拎出来比一比，Claude 3.7拎出来比一比，或者跟DeepSeek比一比。别人都是说我比OpenAI强在哪，或者我已经接近OpenAI了。OpenAI永远说我就跟自己比。

所以我们现在可以看到的所有的数值比较，都是跟GPT O1、O1 mini、O3 mini跟这些模型进行比较的，没有跟其他模型比较的数据。

咱们来讲三个有趣的功能点吧。

第一个非常有趣的功能点，也是让我觉得GPT O3和O4mini真的能用了的一个最核心的点，就是它可以进行工具调用了。什么意思？我们正常情况下一个大模型，你让他去给你生成内容的时候，他其实都是在胡说八道的。就算他有的时候说的很像，但他依然是在胡说八道，是在编。他不能保证内容是可验证的，而且你每一次让他说同样的事情，他都给你编出不同的花样来。

那么一定要带上搜索，带上知识库，带上其他的辅助工具，他才可以靠谱的干活。现在推理模型已经可以靠谱的干活了。所以O3跟O4mini是可以进行工具调用的。但是他们绝对不是第一个。在发布会上他们讲说，我们是第一个在推理里边进行工具调用的，这个真的不是。GROK3也是推理模型，也是可以做各种工具调用的。

只是呢，GPT O3跟O4 mini呢，据说在工具调用上要有极大的提升，因为他们在这块专门做了训练。他可以进行几十次的这种工具调用。当你让他去做一个很复杂的事情的时候，他会反复的在他认为需要的时候去调用工具，获得外部数据，或者做一些相应的操作。这个很棒。

O3跟O4mini呢，是在推理的过程中去调用工具，效果绝对是碾压原来不能使用工具的O1，效果好的一塌糊涂。推理模型如果不挂搜索引擎……

不挂知识库，基本上就是胡说八道。他要比正常的生成模型还要再胡说八道一些，因为他想的多，越想就越错。知识越多越反动，这个幻觉是非常非常严重的。挂上搜索之后，基本上不再需要 deep research 这种东西了。现在你用 O3 去挂搜索，跟 deep research 的效果基本上是可以平齐的。

现在呢，OpenAI 内部有很多的工具，包括 Python 执行、调用浏览器、搜索，有很多这样的工具，它都可以自动的去调用。当有这些功能之后，每一个普通人，不需要是科学家，也可以用 O3 跟 O4mini 完成很多任务了。只是目前呢，OpenAI 内部的这些工具，你通过外部你使不了。还有 function call 这个调用呢，现在在代理站上还没有接上，这个还要再等一等。什么意思？就是你直接挂 OpenAI 的 API，挂它原厂的，是可以进行 function call 的，可以把你自己的各种各样的工具放在里边让它去调用。原来我们演示过使用高德地图的工具，让他去找饭馆、规划路线什么的，这个都是可以去使用了。如果我们使用 API 来调用 O3 和 O4mini 的话，OpenAI 内部的什么搜索呀，这些工具我们是无法使用的，就差在这了。这是一个比较有趣的点，但是具体怎么用，待会我们来举一个案例。

第二个有趣的点是什么呢？就是跟记忆相结合了。原来我们专门录了一期视频来讲 OpenAI 有了记忆功能，现在它也有记忆功能。于是我就向它提出了要求，我说：“根据你对我的了解，我是个 Youtuber，给我推荐一些适合我的 YouTube 话题，我要去写稿去了。”然后他就开始去搜索，调用搜索工具去搜索去了。搜索完了以后说：“我发现你是专门讲 AI、讲科技、讲流量、讲创投的博主，我发现有哪些哪些话题最近是最新的，适合你去讲。”其中有一个话题呢，叫 TikTok 降低了海外直播带货门槛。原来呢是要 1,000 个粉丝才可以带货，现在 200 粉丝就可以带货了，说这个你看怎么样？我说这个不错。我说：“你根据你对我的了解，给我去写个提纲吧。”然后他就按照我的习惯，给我夸夸把提纲列好了，说 TikTok 是哪天哪天发了一个什么样的文儿，为什么什么东西，写的还很好的一个提纲。在这个过程中引用了我的记忆，调用了搜索，聚集了大量的信息。我再说：“那你再给我补充点数据和观点吧。”一般我是会有一个自己的观点，我说：“我的观点是什么什么，你给我补充进去。”然后呢，我为了论证我的观点。

我还需要哪些数据？然后，夸夸夸又去搜索，搜索完了给我补充进来。做了两次补充以后，这个提纲基本上就完成了，就完完全全可以用了。过几天咱们去讲这个“TikTok降低海外直播带货门槛”这个故事吧，这个还是很有趣的一个点。所以现在真的是每个人都能用上了。

第三个比较好玩的点是什么呢？就是图片推理。这个图片推理是非常非常强的一个点，绝对不是识别图片，然后将文字作为提示词去推理。我们很多人一看图片推理这件事，都是想的说，我们把这个图片识别一下，变成一大堆文字。不是这样。

跟大家举一个案例吧。我今天去潭柘寺了，玩我的无人机。拿我的无人机呢，在潭柘寺的外面，拍了一张俯瞰潭柘寺的全景照片。我就问O3，我说这是哪？这个建筑群的布局是什么样的呀？这个提示词就这样的。问完了以后呢，这个O3就去干活去了。他把这个图片先整个的分析一下，然后呢，放大每一块切割，说这一小块是什么，那一小块什么，把它切成一块一块的。然后对每一块进行识别，而且在切完了以后，还对每一块去调整方向，说这块好像你拍歪了，改一个方向，可能更能认出是什么来。通过这样的一个方式去推理，看那个推理过程，惊讶的我目瞪口呆，我告诉你。

最后告诉我说什么？从这张航拍来看，这是一张典型的依山就势、三层台地式布局的北方佛寺，很像北京西山脚下的潭柘寺。我没有告诉O3这是航拍照片，他就全都认出来了，好聪明。但是注意不要被骗了，照片里面是有Meta data的，就是有一些基础信息的。这个信息包括什么？拍摄时间、分辨率、色彩、空间、光圈、快门、白平衡，都在里头。还有拍摄设备那个里头，写着你是用大疆的什么设备拍的，大疆air 3S。然后呢，这个照片里还写着经纬度，因为大疆的无人机里头是有GPS的，它拍完照片是会把经纬度直接写在照片里的。完完全全可以通过这些Meta data就编出来的。

所以呢，这个到底是真聪明还是假聪明？还是说我把经纬度拎出来，把这个拍摄设备拎出来，就直接搜索一下，就给你出结果了？这个我们要往下看。他呢还给我接着讲，说这个图片是中轴对称的三进院。第一进呢叫山门到天王殿，第二进呢是天王殿到大雄宝殿，第三进呢是大雄宝殿到法华殿和藏经阁。中轴线两侧各有回廊和配殿，比如观音殿、药师殿、僧房、斋堂，左右分布对称，也有现代化的客房和管理用房。

再往后还写了一个特别有趣的东西：底层的停车场与服务中心，通过台阶与甬道与寺内各层相连。右侧的通讯塔，现代建筑。

为后期补建的配套设施，这是不是根据潭柘寺的信息搜索出来的呢？这就是我们要去问的。他到底是真聪明还是假聪明？

潭柘寺最后的一进大殿不叫藏经阁，而是叫毗卢殿。应该是五方佛中间一个，然后后边是东方、西方、南方、北方，一共是五个佛在里面，所以不一样。但是中国寺庙的默认布局呢，最后一层是藏经阁。所以这个并不是直接搜索出来的。如果直接搜潭柘寺的话，他应该写最后一层是毗卢阁。

至于底层的停车场、服务中心、现代通信塔，绝对是图片推理推出来的。因为不会有哪个介绍潭柘寺的网页去把这些东西都给你写在里头，所以还是非常棒的，可以进行图片推理。

有了这些有趣的功能之后，咱们可以通过什么样的方式来使用它呢？现在免费用户无法使用。你说我不愿意交钱，那么O3跟O4mini你使不了。Plus用户，像我这样的一个月20美金的用户，是可以使用的，但是有限制。O3每周50次，我今天大概已经使了有五六次了。O4 mini呢是每天150次，这个应该足够使。如果是每个月200美金的Pro用户，无限量使用。

API依然很昂贵。使用它的API，我可能还要稍微掂量掂量。O3每100万TOKEN的输入是10美金，输出是40美金。O4mini要快一些，也要小一些，它呢每100万TOKEN的输入是1.1美金，输出是4.4美金。应该比在美国部署的DeepSeek R1相差仿佛吧，就是基本上还是可以用的。

这种推理模型呢都是话痨模型，价格还是挺贵的。特别是10美金100万TOKEN输入，40美金100万TOKEN输出，这个非常非常昂贵。再结合上工具调用，图片推理，这个价格就像坐在日本的出租车里，看着计价器跳的那叫一个心惊肉跳。

其他的一些代理，就是这种API代理也已经开始工作了。Open Router或者其他的一些代理都可以使用，价格是相同的。只是呢，目前function call还没接上。为什么要专门强调这个？因为有些人在国内充值OpenAI的API是比较费劲的，像我就是这样。所以我使用OpenAI的API都是通过各种的代理去使用的。

还有一些什么方式可以使用的呢？GitHub Copilot里头是有GPT4 O4 mini的，但是没有GPT O3。它只有这些mini模型，它有O1，但是没有O3上来。O4 mini的话，应该是可以大范围使用的，但是前提你还是付费的。

像我是Github Copilot，99美元一年的会员。所以呢，我现在可以在IDE里边去使用它，Client和Roo Code也可以通过Github Copilot的会员直接去使用GPT-4 mini。那你说Client或者是Roo Code，我自己挂OpenAI的API或者是Open Router的API行不行？没毛病，都可以使，但是你得按TOKEN付费，那个很贵。挂Github Copilot下面的GPT-4 mini的模型的话，你有那个99刀一年的年费，就可以放心的玩耍了。

总结一下，OpenAI现在前进的方向到底是什么样的？它呢正在将各种零散的功能点聚集在一起。其实记忆早就有了，function call早就有了，推理早就有了。他一方面呢，是在拼命的去做强化学习，然后告诉大家现在强化学习scaling law依然管用。你把更多的数据、更多的算力堆进去，强化学习的效果就能起来，没有任何问题，大家好好去买英伟达显卡。另外一方面，它就把各种其他的小功能给你凑起来了，包括记忆、function call、推理、搜索呀，把这些东西给你搁在一块，你看真的好用。

其他各大模型厂商呢，在某些方面可以接近甚至赶超OpenAI，但是综合实力上，OpenAI绝对还是领先的。当OpenAI把各种新功能聚合在一起的时候，绝对是遥遥领先。它在每一个细节点上，可能都会比别人强很多。就像咱们前几天讲过GPT-4O的绘图功能，它虽然说在完整的绘图过程中，它表现力上、艺术感上没有Midjourney强，但是呢，它在文字理解上、文字渲染上，肯定是要比其他所有的这些绘图模型都要强很多的。

GPT-5现在正在路上了，甭管是今年下半年能出来，还是什么时候能出来，我觉得都是值得期待的。到那个时候就不用再去选模型了，你上来以后，他就根据你的问题直接推荐，直接给你反馈了，说我这个应该推理还是不应该推理，应该使用更大的模型还是使用小一些的模型，我应该调用哪些工具，应不应该搜索。这个我觉得还是值得期待的，就像以前我们总讲的，叫total solution，一站式服务。你进来了以后，我给你服务好就完了，至于我到底给你上了几个工具、几个模型，你就甭问了，最后是包你满意。

后边还有Sora，还是有念想。虽然Sora前面翻车了，现在大家都已经把它忘掉了，但是当它把这么多的功能聚集在一起的时候。

什么搜索呀、工具呀、推理，把这些东西跟Sora聚集在一起的时候，可能又会变出一些新的、不一样的东西出来。

Sora当年可是号称叫“世界模型”的。当它跟我们真实世界通过搜索引擎连接在一起的时候，那可能真的就要创造世界了。

好，这一期就跟大家讲到这里。感谢大家收听，请帮忙点赞、点小铃铛，参加DISCORD讨论群。也欢迎有兴趣、有能力的朋友加入我们的付费频道。再见！

ChatGPT记忆功能并非小打小闹：揭秘山姆·奥特曼兴奋失眠背后，OpenAI从流量到用户的战略野心与AI助理的个性化革命

Luke Fan — Sun, 13 Apr 2025 00:41:40 +0000

ChatGPT推出了记忆功能，这是整个行业迈出的非常重要的一步。大家好，欢迎收听老范讲故事的YouTube频道。这是让山姆·奥特曼都兴奋得睡不着觉的一个功能，也就是给ChatGPT加GE。很多人都在讲说这个好像并没有多难，使用起来也没有觉得有多大的差异。这样的一个功能，怎么到老范这就变成了整个行业迈出了关键一步？到了山姆·奥特曼那里，就变成了兴奋的睡不着觉了呢？这到底是一个什么样奇葩的功能？有什么是大家没有理解到的？今天咱们来讲一讲。

在2025年4月10号，山姆·奥特曼发了一条推，说：“有那么几次，我会因为太兴奋而早早醒来，再也睡不着。今天就是这样的一天。”今天我们就来讲一讲这个GPT的记忆功能，为什么这么强大、这么好，能够让山姆·奥特曼都兴奋的睡不着，能够让老范来说这是整个行业迈出的关键一步。那么，ChatGPT的记忆功能其实以前也有，并不是没有，不是说到4月10号才推出的，而是4月10号做了一个相对比较关键的更新。那么更新了哪些东西呢？

第一个就是它直接可以引用我们的聊天记录了。它可以根据我们跟ChatGPT聊天的过程来去提取各种需要具体记下来的信息，而不需要像原来那样很显示的告诉他说：“请记住这个，请记住那个。”这个都不需要，现在他是完全可以自己记下来的。而且在后面我们跟ChatGPT聊天的过程中，可以非常灵活的来利用这些记忆，让ChatGPT变成一个越来越懂我们的助手。

那么，ChatGPT记忆功能到底有什么样的好处？首先咱们先看官方给出的信息。这个信息是由ChatGPT自己提供给我的，说第一个无需重复介绍自己了。原来我们每一次跟ChatGPT聊天的时候都需要重复的去介绍，哪怕是同一个人。我今天也要告诉他说：“今天是要去查一个什么资料，我要去做YouTube，你要去给我写提纲。”待会我要开一个新话题，开了新话题，他又不认识我了，那我要再重新介绍：“我今天要出去吃饭，喜欢吃什么，你去找相应的饭馆。”待会我再开一个新话题，他又不认识我了，我再跟他说：“我是一个游戏玩家，我最近在玩什么什么游戏，请帮我去查个攻略。”大家注意了没有？我是开了三个话题，做了三次不同的自我介绍。那么这就是一个很关键的信息，这叫有状态与无状态。其实我们每一个人都有非常多的层面，那么你每一次去跟他沟通的时候，如果ChatGPT不知道你到底要干什么，不知道你今天到底是以一个Youtuber的身份……

或者是一个要去吃饭的老饕，还是说一个游戏玩家的身份去跟他沟通，他没法去给你做回答。那么现在，你不需要反复地去介绍这件事了。你只需要跟他说：“哎，我吃饭去了，我在这边有什么好吃的？”GPT就可以很好地根据你以前聊天的信息说：“原来这个人喜欢吃日料，我要去给他推荐日本料理。”

这是一方面。另外一方面，很多人觉得这些人工智能像人工智障，是因为什么？是因为经常说：“我刚跟你讲过，你怎么就不记得了？”大家都会有这样的感受。但是你想，你只要每一次点击“开始新话题”的时候，他就是要把原来东西忘干净的。要不然，他再去给你提供各种信息也会混乱的。

我举一个例子，比如说我先跟他聊了半天说吃饭，我要去吃日料怎么怎么回事。待会我接着跟他说：“我现在想打一个游戏，这个游戏是怎么怎么回事的时候。”他会接着跟你讲日料的事情，他没有办法快速的进行切换。大模型在这块上还是要稍微的差一些。我们还是如此不停地去开新话题，每次开新话题它就刷新一些信息。但是有了记忆功能以后的GPT，虽然它把话题刷新了，但是我们的一些基础信息它是知道的。你不需要重复介绍了，你可以告诉他说：“我现在要去吃饭。”这是一个刷新新话题，但是它能记着你爱吃什么，这个还是很重要的。

除了这个优点之外，还有一个很重要的是什么？它可以根据个人的写作风格、兴趣和使用习惯，自动调整回答方式。很多人都说这个东西AI味那么浓，一写出来东西就是AI写的。那么以后就不会有这种问题，我们可以把ChatGPT生成的东西去进行修改、调整之后说：“我喜欢这样的一个风格。”那么以后这就是一个你个人的风格了，没有办法再说这一看就是ChatGPT的味了。他不会再干这种事情了。那么ChatGPT就会变成一个真正懂你、贴近，比以往更像一个专业助理的AI助理了。

甚至很多的大老板的助理，替大老板回邮件，替大老板去发微博，他们都看不出来这到底是谁发的。我记得我以前有一个同事，他就是给李开复管理微博账号的。那么以后ChatGPT就可以来替我们做这些事情了。它是可以用我们的口气，用我们的习惯去发各种社交媒体了。

这些记忆你说你都记住了，万一记错了怎么办？这个不用太担心，可以自己设置。在ChatGPT的界面里头，有一个叫“个性化”的菜单，打开了以后可以去设置关闭记忆功能或者打开记忆功能。你可以自己去设，你也可以管理和删除特定的记忆，说：“我把这个东西删掉，这条你给我忘掉，不允许记住。”因为总有社死的时候。

你也可以直接明确地跟他讲：“这事你给我记着，下一个事忘掉，这个事不要记住。”

你可以聊天的时候直接跟ChatGPT说，它可以自动修改这个记忆库。当然，你也可以开临时聊天。打开临时聊天，那么这一部分的内容就不会被记下来。

所谓不会被记下来，我们这里要提醒大家：OpenAI服务器上还是记着的，只是不会被用来生成下一次内容。这个是要注意的，千万不要以为开了临时聊天，你聊的内容他们就都忘掉了。不，不是这样的。

实际上，很多人都会讲一个笑话：拿出手机输入法来，打哪几个字母，看看排在第一个的是什么。比如输出了一个什么样的词，就说明你是个穷屌丝；如果你打了几个字母出来是一个别的词，你可能就是一个有钱人。

为什么？我们的拼音输入法把我们的一些输入习惯记下来了。在这里要稍微先进一些，你可以要求它记录，或者要求它不记录，可以更好地来控制，不会很容易被人发现我们的屌丝本质。

现在是Plus跟Pro的用户已经可以用了，未来免费用户也会可以用。至于其他的Teams用户，或者说一些企业用户和学生用户是不是可以用，还不好说。因为对于他们来说，隐私保护会更加敏感一些。

这些记忆是有容量限制的，不是无穷无尽的，可以一直记下去的。它的记忆限制很怪：1,200-1,400字。这个数字非常奇怪，而且无法扩容。我去问ChatGPT，我说：“我希望这数大一点，我给钱行不？”他说：“不行。”没有任何的途径可以让记忆空间变大。

那么这个容量的标记方式很奇怪：
1. 它居然是个字节数，不是说我记了多少条，或者是记了多少聊天记录，都不是。它是1,200字到1,400字。
2. 它不是一个确定的数字。像我们程序员一般会说：“你这就是1,000字，或者1,024个字，或者是2,000字，都是OK的。”它应该是个死数。现在OpenAI给出的是一个范围：1,200到1,400，这个我就不知道怎么回事了。

还有一点是什么？这个数不大，就是1,000多字。按道理来说，我们都认为它应该记很多东西在里头，但是并没有，只有1,000多字被记录进去了。

如果你把它记满了，你可以进去删，说：“这些不要了，我删掉，剩下的你再接着给我继续。”这个是允许的。你可以自己去整理记忆，就像是《哈利波特》里邓布利多的记忆盆——他可以把一些不太用的东西直接抽出来，需要的东西再塞回去。他可以干这样的一个事情。

那么，这背后应该也是隐藏着一些秘密的。

待会我们再去分析秘密。这是官方提到的一些信息。刚才讲的所有这些信息，都是ChatGPT直接给我生成的。下边咱们来讲一讲官方没有提到的好处。

光看前面这些好处好像是挺厉害，但是绝对达不到说整个行业迈出重要一步，或者山姆奥特曼都可以兴奋到晚上睡不着觉的一个状态。那么，只有没说的这部分才可以达到这样的效果。那到底是什么？

第一个，共享账号这件事没法搞了。你看这里头有记忆了，那我下一次我去跟人共享的时候，我就可以看到别人的记忆，或者别人可以看到我的记忆。这事肯定不行。那大家一定要好好的去买账号。这个肯定是可以让山姆奥特曼稍稍的小开心一下了，但是还达不到让他兴奋的睡不着觉。

很重要的一步是什么？这是真正的从流量向用户转换的关键一步。什么叫流量？什么叫用户流量？我们知道有人来了，但是我不知道他是谁。他也没有办法下一次回来以后继续去做原来的事情。这个东西就叫流量。像很多的互联网公司里面，他们的用户实际上都是流量。谷歌原来它的用户也是流量。比如说我们到谷歌这来搜索，搜索完了点击了搜索结果，实际上我们都是流量。我们并不是它的用户，我们也没有归属感，说下次我还要用谷歌的账号去做什么事情，有什么样的好处，并没有这些东西。

那谷歌是怎么完成从流量到用户的转换呢？它推出了一个非常重要的产品叫Gmail。我们把自己的邮箱存在谷歌了，里头存了我所有的收发邮件，存了我的日历，存了我的通讯录。那么我们对于谷歌来说，就正式从流量变成用户了。流量是没有粘性的，我这次来了，下次我就不来了。但是用户是有粘性的，我的Gmail在谷歌里边，我下次是还要来用的。我不可能说把这个东西进行迁移，非常麻烦。

现在OpenAI也迈出了这一步，从流量变成了用户。原来这么多大模型，在这里你方唱罢我登场。我们不停的去试谁家的模型，稍微好用了一点点，马上就转型。现在不行了，因为OpenAI ChatGPT把我的各种聊天信息都记在里头了。我希望有一个更懂我的助理为我服务，那我就要去使用ChatGPT，我就不能去使用Gemini，我就不能去使用其他的这些大模型了。这个是非常重要的一步。

那么，山姆奥特曼就会为这件事睡不着觉吗？山姆奥特曼前几天接受了一次采访。有人问他说，你的目标到底是什么？到底是不是要去做AGI，要让整个人类进步什么的？后来山姆奥特曼说，我其实已经没有那么天真幼稚了，我现在已经转变想法了。

最早开始做OpenAI的时候，我们确实是这么想的，但是现在已经变了。变成什么了？这是一家互联网消费公司。我们要做的是一个巨大的服务平台，我们的目标是10亿人使用的服务平台。

什么是10亿人使用的服务平台？微信、抖音、Facebook、谷歌、苹果，这些是10亿人使用的。X都达不到，那真的没有10亿用户。全世界能够达到这样标准的平台，没有几个。这才是OpenAI真正的目标。现在等于是在向这个目标迈出了非常关键的一步，可以让山姆·奥特曼睡不着觉，早晨一醒来以后就没法再去入睡了，非常兴奋。所以这很关键。

当时在采访的时候，山姆·奥特曼说了这样的一句话，说大家以后都要用OpenAI的账户来登录，就像是现在大家用谷歌的账户，或者苹果、Meta的账户登录一样。为什么这么干？因为登录以后，OpenAI可以提供专属的微调模型和各种的私有信息，来协助其他平台更好的为你服务。

这话什么意思？其他账户登录，比如说我们用谷歌账户登录了。现在很多的应用都是用谷歌账户登录的，那么登录了以后，谷歌会提供基本信息，包括什么姓名、邮箱、头像、联系人，还有日历，包括我们的Google Drive上的一些文件。你进行授权以后，使用谷歌账号登录的这些应用的话，都是可以去访问的。并不光是说证明了一下你是谁就完事了，这些都可以去访问。

如果我们用Facebook的账户登录了，它不但是可以知道我们的姓名、头像、性别，还可以得到我们的朋友列表和点赞页面。如果是用Twitter账号登录了，他可以得到关注消息、推文、用户资料、点赞和私信的这些权利。如果是用微软账号登录了，可以得到我们的基本资料、用户名、日历、邮箱、One Drive、团队信息。我们用微软账号去登录了其他的一些应用，比如说现在有一个应用叫做画图。我用微软账号登录了以后，最后他就来问你说，我是不是可以有权利把我画好的图存到你的微软的云盘上去？你只要确认一下，它就直接存上去了。但是微软也要去得到你确认的过程，你不确认它，这是没有权限的。所以它有很多的权限是需要后申请的。

如果我们用微信登录了，它也可以得到我们的昵称、性别，以及我们所在的省市、国家和头像，这个都是可以得到的。那么这些对于OpenAI来说都弱爆了。为什么呢？当我们平时聊天的信息都存入到ChatGPT里边以后，我们的专属助理就生成了。那我们这些专属助理可以干嘛呢？当我用OpenAI的账户去登录一个，比如说订餐网站的时候。

这个订餐网站就知道我吃什么，知道我吃什么过敏，知道我不爱吃什么。他也知道说在这个季节里头，有哪些新鲜的食材是我一定要去吃的。对于餐厅为我提供更好的服务，是非常重要的信息。

当我想去找一部美剧来解决剧荒问题的时候，这个助理是知道我看过哪些美剧，而且知道我看到第几季第几集了。还知道我喜欢什么类型的美剧，以及喜欢哪些小说和明星。他可以非常好的来为我推荐。

山姆他们向着他的目标，迈出了非常重要的一步。这就是山姆他们为什么兴奋的睡不着觉。那么从容量限制，我们看到了这个里面到底有什么秘密。我们可以猜测一下，以及ChatGPT记忆功能未来发展的方向，都可以从这里去稍微的猜测一下。

刚才我们讲到，它这个数字很怪：1,240-1,440。为什么是这样的一个数？应该是每次聊天的时候，都可以直接将这个1,000多个字符扔到提示词里边去。它占的TOKEN量并不是很大。而且要注意，OpenAI的API对于TOKEN输入的时候，它是有两个不同的价格的：一个是缓存内的TOKEN，一个是缓存外的TOKEN。那所有的记忆信息都属于叫缓存内的TOKEN，就本来就存在它服务器上，成本就更低了。所以它完全可以在我们每一次聊天的时候，都直接把这1,000多字塞进去。

这个字多了肯定是塞不下的。那么存储更多的信息对于OpenAI来说，本身成本其实并不高，相当于开个网盘呗。你想一个网盘能有多贵？而且现在网盘都是一开就是多少个g的空间，这1,000多字算啥？所以存并不费劲。但是你存太多了以后，用户也会担心什么：你ChatGPT会不会变成熟悉的陌生人？我有很多信息，我并不希望你知道。或者说，当我们发现ChatGPT了解我们很多信息的时候，你会感觉吓人的。所以他这个数一定要控制的稍微小一些。

如果这些信息变多了，比如说不再是1,000字到2,000字，而是100万字200万字了会怎么样？它处理起来还是要稍微麻烦一些。你不可能说我每一次产生结果的时候，去做问答的时候，都把一两百万字塞进去，这个事不太现实了。所以到那个时候，它可能需要额外的去做本地知识库，类似于RAG这样的东西，叫搜索辅助生成，要去做这个。还有的干脆是去微调小模型。原来苹果要去推出apple intelligence的时候，当时他们也讲到说，我们就想去给大家微调小模型，让你们在苹果电脑上就有一个根据你们的信息微调出来的小模型，非常懂你。

但是目前为止，他也没做出来。这个还是挺难做的，微调小模型也好，做这种本地知识库也好。这是山姆他们未来的设想，因为他前面接受采访的时候已经说了：“你们以后只要用OpenAI的账号，登录我给你的这些知识库，给你的这些微调的小模型，就可以直接使用了。”

一旦真的走到了Azure GPT帮我们存储本地知识库，和微调一堆小模型的时候，迁移成本就会无限放大，等于就彻底捆死我们了。我们再想从OpenAI的平台上离开，就基本不可能了。那么未来会变成什么样？未来更多的信息会被记录下来，这个一定是这样的。到那个时候，可能会花钱去购买更多的存储空间，这个是个玩笑了，不重要。

未来真正的变化是，大模型都会变成agent。现在大家玩的是模型，以后就都变成代理。那么现在谷歌刚刚发布了叫a to a的一个开源接口，这东西干嘛使的？就是让大模型之间聊天的。再加上MCP，谷歌、OpenAI、Azure现在都支持MCP了，它可以去调用各种的外部工具。比如说像刚才我讲的，去给我订餐、订酒店，帮我去订各种行程，帮我去查询各种知识，现在都可以通过MCP把这东西接进来了。

当这些东西都普及了之后，以后的大模型会变成一个统一入口。这个山姆他们也讲过了，说这就是GPT5给大家的形式。什么意思？以后我们再去跟ChatGPT聊天，再去跟各种的AI助手聊天的时候，你不需要去选了。你不用上来选我今天要跟GPT4聊天，还是GPT4O聊天，还是跟O1聊天、O3聊天还是跟谁聊天，你不需要选这玩意。你都是在跟GPT5聊天，GPT5会根据说你的要求，我来决定调哪些东西，我来决定走哪一个agent的路径来去帮你服务。这个是未来的一个方向。

到那个时候，他会自行来判断到底要去引用哪些记忆。我们来想一想，我们跟人打交道的时候，或者说真的跟一些助理打交道的时候，也是如此的。你不会站在那先去跟他讲，说你今要给我处理什么事了，他会自动的来去判断你今天到底要用哪一部分的知识来去完成相关的任务。

到那个时候，ChatGPT也好，或者其他的AI助手也好，就会为每个用户建立一个分类知识库和私人助理。他们会根据我们的上下文聊天，自动的去调用相应的知识库，形成相应的助理。到那个时候，会由AI来掌控更复杂的权限。什么意思？就是当我们要是授权这些助理去给别人干活的时候，比如说我今天把一个我爱吃什么饭的助理授权给了一个饭馆，那么它就不能去调出来我的其他信息。

我的收入、我的工作，这些东西你是不能调出来的。但是，它可以调出一些我爱吃什么，或者说我对餐厅有一些什么其他的要求。他可以把这些信息调出来。那么，这一部分以后都是要由AI来掌控的，不会由人来掌控。

说我今天先设好了，说这个助理可以访问哪些信息，那个助理可以访问哪些信息，哪个助理可以给谁授权。这个以后肯定都是由AI来处理，要人处理是处理不过来的。

而且，再往后发展是什么？我们今天讲的都是自己的记忆，因为ChatGPT有记忆了，所以我们不能去做共享账号了。但是，以后我们还需要去处理其他人的记忆和其他人的助理。这是什么意思？

假设吧，当我们需要为其他人服务的时候，就直接可以跟他们的助理沟通了。或者说，我们可以将他们的助理再介绍出去，直接去干活了。举一个例子，比如说今天我是个导游，我带了一帮朋友出来玩来了。到时候我需要去安排餐厅，那安排餐厅怎么办？我就先让这些游客把他们的助理都授权给我，我再把这些处理授权给了一个餐厅。

这个餐厅就可以根据每一个人的口味，去帮他们安排饮食，就可以来做这些个性化服务了。这个在以前是没法实现的，现在都可以实现了。比如说我今天做了一个导游的APP，谁让我去导游了，你们就用你们的OpenAI账号来登录我的导游APP。我们加入到一个游览的群里边去，等我再去餐厅订餐的时候，我就把游览群里边的每一个人的OpenAI账号授权给餐厅。

然后，餐厅就可以跟你们的助理去聊天了，去了要吃什么呀？最近在减肥，就吃一些清淡的；最近口重，想吃点咸的；最近怀孕了，酸男辣女，什么样的？大家要去稍微调整一下口味，这都没问题。以后都可以让每一个人都像带着一个助理出门一样，咱们之间就有更好的服务。这可能是大家可以憧憬的一个美好未来。

再讲一下，为什么在这个时候可以去宣布这件事？其实绝大部分的AI助手都是无状态的。刚才咱们讲过什么是无状态，这里不重复了。第一个是要解决隐私的顾虑，因为大家都觉得我们把很多的隐私交给AI，是一件很危险的事情，很恐怖的事情。所以原来咱们不说这个事。

降低运营成本也是很重要的，因为AI是按TOKEN收钱的。每一次回答问题之前，我先去看一下你是谁，还是挺贵的。还有一个重要原因，是要降低用户的心理预期。每一次当这个AI说胡话的时候，你就告诉用户说：“反正我是无状态服务，我也不知道你是谁，我就说成这样了，你也不要对我有太高的要求。”

给AI助手添加记忆这件事，在技术上其实并不困难。

只是舆论跟社会压力太大。

ChatGPT其实一直都有聊天记忆的功能，原来就有，只是原来并没有大张旗鼓的宣传。到4月10号，终于可以宣传一下了。那么，这个时间点为什么这么重要？

原来，ChatGPT是唯一一个有记忆功能的AI助手。但是，Grok来了，就是XAI的Grok。它可以根据我们的推文，给我们一个个人描述。你去检查一下，说你的AI助手到底有没有记忆功能，实际上很简单。你上来就问他一个问题：“你认为我是一个什么样的人？”或者说：“根据你对我的了解，给我一个描述。”你就给他这样的一个提示词。

在4月10号之前，ChatGPT也会给你一个很好的描述，而且那个时候，那个描述还写得特别的肉麻。什么时候心情不好了，你去问他，你看完了以后，你觉得我好像混的还可以。他是这样的一个状态。

Grok也开始提供这种功能了，所以OpenAI说：“那既然你也来了，我就不藏着掖着了。”我就开始打明牌了，直接公开。而且，山姆·奥特曼前面也透露了他的真实目的。原来还在这装清高，说：“我要为人类怎么样，我要为社会怎么样，我要去搞AGI。”前面去接受采访的时候，已经说的很清楚了：“在OpenAI开始融资之后，我们就已经清晰的认识到，这就是一家消费互联网公司。我就是老老实实来挣钱的，没有那么多虚头巴脑的东西。”

成为新的平台公司和流量入口，就是山姆·奥特曼的一个最终目标。我就是来挣钱的。现在，山姆·奥特曼又一次为整个的行业指明了方向：“大家上！”

在这个过程中，谷歌肯定有能力，没有任何问题。但是，内部的桎梏太多。因为前面也是做了好多年的圣母，现在在这一块上技术不难，但是他的舆论，包括伦理社会压力很大。这个弯子到底怎么转过来？估计谷歌还要稍微的转一段时间。

XAI的Grok这没什么问题。马斯克是信第一性原理的，所以应该会快速跟进。而且手里头还有我们发的推文，走这一步是顺理成章的。

Anthropic呢，要稍微麻烦一点。为什么？因为它主要是ToB的。现在即使在ChatGPT里头，记忆功能也没有向Teams用户去开放。因为在这块还是要更敏感一些。我办公室用的各种记忆，跟我家庭的各种记忆，他还是不是那么容易分清楚的。

至于Meta，现在连应用都没怎么做好，还是要继续努力。Meta属于只有模型没有应用。原来我们讲叫“模型及应用”，但是只有模型没应用，这条路也是走不通的。

至于国内，阿里跟字节必然会在这条路上狂奔，没什么好说的。卖东西，甭管阿里还是字节，后边实际上都是电商平台。

一旦说可以形成客户信任的助理了，那么他就可以直接帮客户下单、买东西了。这也可以很好地解决整个AI行业不挣钱的一个问题。所以，为什么我说这是整个行业的巨大一步，被今天迈出去了。

至于腾讯呢，它有点像谷歌，后面包袱也很重。为什么？因为它是一个很重很重的社交平台，我们所有的社交关系都在上面。他在这个里面去做助理，他一定是要非常小心谨慎。一旦踏错半步，会出很多问题的。所以，腾讯在这块可能会比较费劲。

至于百度，继续为大家提供欢乐就可以了，其他就不重要了。更多的AI agent的应用应该正在路上。可能有一些公司说：“我没有大模型，但是我可以通过GE的方式，给大家打造更多的应用。”这块应该也在往前走。

而且，很多的服务平台，比如美团、携程这些服务平台，他们也需要开始去处理相关的问题了。我们如何去跟这些助理打交道？我们如何提供我自己的MCP的接口？现在像高德地图很多的这样的平台，都已经开始官方提供MCP接口出来了，可以让AI大模型、可以让agent直接跟他们去沟通。这一块就是未来的一个很重要的方向，大家应该是在快速前进。

我觉得又可以开始招人了。很多的互联网公司，应该可以开始考虑招聘的问题了。

最终的总结：这是AI的一小步，但绝对是整个人类社会形态发展的一大步。不知道你们是不是同意我的观点？好，这就是今天讲的故事。感谢大家收听，请帮忙点赞、点小铃铛。参加DISCORD讨论群也欢迎。有兴趣、有能力的朋友，加入我们的付费频道。再见！

OpenAI或将ChatGPT涨价至2000美元/月，未来发展何去何从？

Luke Fan — Mon, 09 Sep 2024 00:40:10 +0000

2,000美元一个月的ChatGPT还会有人用吗？

大家好，这里是老范讲故事的YouTube频道。

今天咱们来讲一讲OpenAI有可能给ChatGPT涨价的事情。消息哪来的？国外著名科技媒体Information上报道，OpenAI因为连年的亏损，而且新的模型成本快速上涨，所以有可能给ChatGPT涨价。涨多少呢？他们也是搜集了很多的信息以后，判定有可能会涨到100倍，也就是2,000美元一个月。这是不是幻觉呢？大概率是。

那你说Information上面怎么会有幻觉呢？需要注意，Information上面也是说，我们根据各种信息总结出来以后，有一种声音提到有可能会涨100倍。具体是哪个涨100倍并没有说。到底是每个月这个20美金的订阅费用涨100倍，还是说TOKEN的费用，或者其他的一些商业合作的费用，涨到100倍都没有说。而到底是涨100倍，还是说按照这样的一个级别去涨，现在也没有讲清楚。所以只是说，我们根据传言得到了这样的一个消息，这就算是一个幻觉。

咱们再讲一个幻觉的故事。前面有人提到，印度产的iPhone良品率只有50%。后来被富士康的人出来辟谣，说没有那么差。如果良品率只有50%，苹果也受不了。其实印度产的iPhone良品率比中国的低10%。郑州富士康的iPhone良品率大概是96%，印度大概是85%或者86%这样的一个水平，其实依然是可以接受的。

那么前面讲的这个iPhone在印度产，良品率只有50%这件事，完完全全是造谣吗？也不是。有人报道说，印度的某一个零部件工厂，生产的iPhone外壳送到富士康检测之后，发现两个里面只有一个能用，这就是50%。也就是iPhone的某些工厂生产的某些配件，一些批次里面，它的良品率是50%。但是这样的消息拿到国内来以后，大家就传了，印度产的iPhone良品率就是50%。它会变成一个幻觉。

这种幻觉，我们一般认为它不叫完完全全的谣言，它是有出处的。只是大家把不同出处的信息进行总结归纳以后，就会变成一个假消息。以前有人在苏格兰坐火车的时候，看到有一头牛是紫色的，说苏格兰的牛都是紫色的。这个时候旁边人说，你不能这么讲啊，你应该说你在苏格兰看到了一头紫色的牛，而不能说苏格兰的牛都是紫的。另一个人又上来说，你这个说的依然不准确，那应该怎么说呢？说你在苏格兰看到一头牛，一头牛有一面是紫色的，另外一面你没看着。你不知道，但是如果有人出去传，苏格兰的牛都是紫色的，你说他算造谣吗？咱们稍微扯得远一点，讲一下这种幻觉是怎么产生的。其实，人也会产生幻觉。苏格兰的牛都是紫色的，印度产的iPhone只有50%的良品率，这就是人类自己产生的幻觉。

所以我们不要光去嘲笑大模型。好，我们继续往下讲，OpenAI现在到底在干什么？其实很多人也很关心这件事情。这一段时间来，传出了很多的新名词，但这些新名词都代表什么意思？

比如说，去年山姆·奥特曼突然被干掉，失去CEO职位，失去董事会职位的时候，就传出来的Q星算法，这玩意到底干嘛使的？今年前几个月，山伯特曼突然放了一张草莓的照片，那么草莓算法到底干嘛用的？以及山姆·奥特曼号称马上要发布的Orin猎户座模型到底是什么，或者说非常强大的Orin猎户座模型到底是什么？

前面号称OpenAI要涨价100倍的这篇《Information》文章里面也进行了一定的解释，它把这三个算法串起来了。Q星算法是主要做科学和数学计算的。大家知道，大语言模型通过语言进行推导，它就比较容易犯9.1比9.9大的这种错误。它从语言上看，11一定比9大，但如果有一个数学相关的模型直接算，就可以避免这种错误。这就是Q星算法。

而草莓算法，其实是以Q星为基础做出来的，也就是以数学和科学比较强劲能力的算法为基础的。它主要的特性是有极强的推理能力，它可以直接拆解我们所需要的任务，而得到一个完整的结果回来。这就是草莓算法。据说这种强劲推理能力的草莓算法，今年秋天就会面世，应该没几个月了。

而下一代的大模型，非常强劲的大模型Orin，也就是猎户座模型，是使用草莓提供的合成数据进行训练的。它把所有这些东西综合在一起。

现在其实大家遇到了一个问题，是什么呢？就是scaling law快卷不动了。Scaling law就是缩放法则，所有的AI公司老板都信誓旦旦地拍着胸脯跟大家讲，我们依然相信scaling law是成立的。英伟达的股票涨成现在这样的一个状态，也是大家相信scaling law依然成立。

Scaling law是什么？我不断地往里加数据，加更多的数据，加更大的算力，也就是显卡，算更长的时间，得到更大的模型，一定效果更好。这就是scaling law，也就是我们以前讲的大力出奇迹，只要你不停地往里堆，总有一个更好的结果出来。虽然所有人都在喊这件事情。但其实，过去的一年里，这个 scaling low 基本上并没有被突破，没有更大的模型出来。虽然我们看到了拉玛 3.1405B 的推出，但因为前面有不公开参数的 GPT-4、GPT-4O 以及 Gemini 1.5 Pro 这样的版本，所以我们并不能确定拉玛 3.1405B 是否在 scaling low 上继续往前走。

Anthropic 的 Cloud，它们最强的模型叫 Opus，虽然也没有公布参数量，但大家普遍认为它应该是跟 OpenAI 的 GPT-4 或者 GPT-4O 的参数量级在一个水平上的。结果，Anthropic 推了一个 Cloud 3.5，大家觉得实在是太香了。现在可能使用 Cloud 3 Office 的人已经越来越少了，而 Cloud 3.5 的 Office 版本这么长时间也一直没推出来。

大家已经在这种大模型的基础上进行蒸馏之后，往回退了一步，并没有继续往前走去实现更大的模型。而现在，各种 70 币上下规模的模型，它们的能力已经接近 GPT-4O 了。无论是使用拉玛 3.1 的 70 币，还是使用通义千问的 72 币，或者其他一些公司训练出来的开源、闭源 100 币以内的模型，它们不能说完全超越或全面碾压 GPT-4O，但在某些特定场景下，已经接近或超越 GPT-4O 的能力了。

小模型结合各种场景之后，甚至比这些 70 币的模型表现还要更强一些。也就是这种 7 币或者十几币的模型，如果进行一定的微调，再结合特定使用场景的话，效果也很好。这导致什么呢？对于更大模型的需求在变弱，大家觉得现在这些模型挺好的。在这样的基础上，不断把这个模型变得更小，让它更加贴合具体的应用，效果也非常好。

还有一个原因是什么呢？就是 GPT-4 和 GPT-4O 指明方向以后，大家已经追赶了一年了。追赶到现在一个位置后，大家说我们已经基本上达到和超越 GPT-4O 的水平，再往前走没有方向了，没人指明道路。现在大家都在等待行业的老大，或者叫排头兵的 OpenAI，来告诉我们下一个方向在哪里。

现在 OpenAI 告诉大家，下一个方向有可能是 Orin。而 Orin 跟现在的 GPT-4O 比起来，它的差异是什么地方呢？就是推理能力更强，逻辑能力更强，幻觉更少。这是现在新的追求方向。但是 Orin 出不来，大家也不知道应该怎么做，还是要等它做出来。

阻碍 scaling low 继续发展的还有一大原因，就是数据枯竭了。训练现有的模型已经可以把当前能够找到的数据基本上都使完了。更多的数据进行清理和处理的话，成本非常高。我们直接找到过往的书籍和互联网上的信息，对这些数据进行清理，人工的这种加工成本是非常高的，因为数据量实在太大了。很多的低质量数据，拿去训练以后，可能幻觉会变得更厉害。

所以现在大家普遍使用的方法是什么？就是使用合成数据。所谓的合成数据，就是由大模型生成的数据，再去训练新的大模型。而这些数据又不是靠大模型直接生编的，而是什么呢？让大模型去取代做数据清理的人工。我们拿到大量的网络数据以后，把这些数据交给一个大模型，让它去做清理，清理完了以后重新生成一遍。

这些合成数据也不算是无根之木，它也是从现实来的，只是经过大模型的过滤和清理。拿这样的数据再去训练新模型，发现效果会更好。拉玛3其实就是这么训练出来的，这拉玛3里边的数据是用拉玛2进行清理出来的，也算是合成数据，训练大模型的一个典范。

而现在OpenAI的Orin大模型，就是准备使用它的草莓算法生成合成数据，然后再去进行训练。OpenAI自己玩的就是一个心跳。现在新一轮融资还没有关闭，新一轮融资就是已经有领投方了。据说有一家公司说，我们愿意出10亿美金，然后再等其他人跟投，希望可以凑个几十亿美金让OpenAI再活半年。

OpenAI这个几十亿美金，大概也就是活半年。他一年应该妥妥的会烧掉上百亿美金，而且这个数字可能还会快速上涨。因为去年呢，他亏了大概50亿美金，今年应该亏到上百亿美金是没什么问题的，等到明年可能就是几百亿美金的亏损。

现在大家预估OpenAI一年的收益是35亿美金，也就是这个里面大概20亿美金来自于一个月20美金的订阅，剩下的可能是做TOKEN，我们使用API买TOKEN的钱，以及其他的一些服务费。这个是OpenAI的收益预估，因为它毕竟不是上市公司，没有财报出来，所以大家只能去猜测。

而亏损，每年OpenAI大家预估的亏损额是50亿美金，这是一个非常恐怖的数字。OpenAI手里边的现金，你想微软给了100亿，再加上其他一些人给的钱，所以现在基本上是烧完了，再不融到这一轮就没得玩了。你融到这一轮以后，可能也就是再烧半年的。

那你说钱这么多都烧哪去了？第一个就是烧算力。你得上微软爸爸那里去交钱，买微软云上的算力，继续去训练大模型。第二个，你现在是1,500人团队了。而且，OpenAI现在团队规模还在不断扩张。那你人多了以后，肯定有很多的内部是是非非。有一个故事说，这个活原来一个人能干，现在不行啊，干着太累了。招两个人来，一共三个人来做这个事情。原来这个人变成领导了，后来发现比以前还累。说为什么？说我现在需要给他们做计划，让他们也做计划，回来我要审核他们的计划，看看这个数据应该怎么去分配，任务分下去。我还要调解他们之间的矛盾，还要去做考核计划。说这个比以前我一个人把活干了还累啊。

所以，这个人增加了以后，绝不是说我增加了一倍的人，生产的效率就提高一倍。经常是提高到一定程度以后，你的生产效率就不会再提高了，而开始下降。这个就算是一个边缘。所以，OpenAI内部现在是是非非，肯定是非常多的。作为当前最红的行业AIGC的领头兵，也就是当红炸子鸡，OpenAI自己招聘人才，以及他要留住自己的人，成本肯定会直线上升。投资基金、各种猎头公司，每天都趴在他外边等挖他的人。

那么，你要想让这些人留下来，一定要多给钱。新的模型，训练成本肯定也是几何级数上升的。你想让scaling low再次起作用，就一定是要投入更多的数据、更多的算力，这个事没有办法。而且，越大的模型，你的安全成本就越高。以前我们就都在讲，什么叫知识越多越反动？你这个模型变聪明了以后，他有可能给大家带来的伤害会变得更加惨重。我们想让一个更聪明的大模型成为安全的模型，所需要支付的成本也一定会更高一些。如果这玩意再出错了，那就是高智商犯罪了。

OpenAI现在真正的困境是什么呢？就是不赚钱。开始其实有一些路就走错了。聊天模式20美元的订阅以及TOKEN收费，不光是他自己走错了，还把整个的行业都带沟里去了。他有他强的地方，就是你通过聊天方式，一开始就震惊了全世界，让所有人，不管适不适合去用AI的，大家都冲上来用，成为了全世界关注的焦点。这是他使用聊天模式取得的成就。

但是，聊天模式是一个双刃剑。一面是说大家都关注了，每一个人都可以用；另外一面是什么？你要想从聊天模式再继续往前走一步，可以让大家能够更好地体验到AI的能力，这一步其实是非常难以越过的。另一方面，20美金订阅，那他出了这样的一个数据之后，导致整个行业只能跟他对标。微软的Copilot也是20美金，谷歌的Gemini你只能在20美金往下做，其他的一些cloud等等。
都是在20美金这个范围上下去波动。至于一开始，那个人到底为什么定他20美金，这个大家只能想破脑袋去想了。前人一定是有他的道理。就跟原来有一个笑话说，有一个大的印象派画家，他有一副名画，很多人搞不清是画什么的。一堆人在那去做研究，甚至有些专家专门去研究这幅画，还发表了很多论文，成为了学术态度。

第一个研究这幅画具体画什么的学术泰斗离开人世去了天堂以后，正好碰到这个画家，就去问他说：“您那画到底画什么呢？你看我研究了一辈子，都成为学术泰斗了，我也没研究明白，还跟很多个派系吵来吵去的。”那个画家说：“你到底说的哪幅画，我想不起来了。”最后他太太在旁边提醒了一下：“你说的不会是擦手布吧？你每次画完画，然后拿那个布擦手，形成了一副印象派的名画，让后人研究了很长时间。”

所以20美金有可能就是这么来的。而20美金跟token付费这种事情，其实会极大限制使用AI的人数，因为它会限制流量的上升，也会限制新的商业模式的爆发，这个其实是有毒的。现在OpenAI其实面临着当时谷歌的困扰。谷歌的困扰是什么？是分叉。当时谷歌把安卓做出来以后，所有人一看，这个东西实在太厉害了，我们拿它去分叉，就有安卓的各种智能家电的操作系统、安卓的手表操作系统、安卓的各种嵌入式操作系统、安卓的各种定制操作系统。谷歌说不行，你们不能分叉，我一定要把安卓的版本一直升上去，让你们所有分叉人都死掉。

OpenAI其实现在面临的困难是一样的，它指明了方向，大家各自去发展，长出了Anthropic、拉玛、Gemini，现在的标准已经不统一了。想要继续站在排头上，继续引领风潮，必须不断放出新消息，不断去指明方向。但是，手里边的钱又不够多，攻城能力也不够强，也没有盈利能力，只能是不停地放空话。你像从2024年年初到现在，OpenAI已经吹了多少牛，到现在都没有实现。

那么OpenAI的解决方法有哪些呢？第一个就是涨价，像刚才我们前头讲的，把这个费用涨100倍，涨到2,000美金一个月。这就是第一个处理方法，涨上去以后就可以达到盈亏平衡了。第二种方式就是不停的融资。山姆·奥特曼在斯坦福大学演讲的时候也讲过，说你们不要去研究挣钱的事情，我就不停的去找钱，反正我有这个能力。找完了以后呢，就把它烧掉，再去找。现在新的一轮钱找到了，这条路还是在往前走，而OpenAI准备去上市。上市的时候，你又可以圈一大笔钱吧。但是上市了以后，你未来还是要去盈利的啊。所以甭管是找钱也好，还是上市也好，算是饮鸩止渴，或者是寅吃卯粮，我们把未来的一些可能性把它消耗掉，那继续在亏损和越亏越大的这个道路上狂奔向前，这不是一个长久的解决之道。

还有一条路是什么？就是重新发明定义，走通一些新的商业模式。这可能是山伯特曼或者整个OpenAI，包括整个硅谷和行业，都在期盼的一个事情，就是说我们不再去依赖传统的这种流量商业模式了，而是做一个新的商业模式，像收税一样，把这个税收上来，让大家像一个基础设施那样去使用这些AI大模型。但是这种模式呢，到目前为止还没有走通。未来到底能不能走通这件事情，还是一个问号。

那你说，如果这个商业模式走不通，盈利呢？其实从短期来看，还是很难的。还有没有其他的方式？OpenAI难道就要倒在这里了吗？还有一个方式就是国有化，直接交给国家，让国家通过税收、通过印钱直接去使用这些大模型。现在Scaling Low继续往前走的话，可能迟早会走到国有化这条路上。

那么就看到底是大家能够先去找到合适的商业模式，让整个AIGC产业健康发展，还是最终让AIGC都沦为主权大模型。到底是走哪条路？因为主权大模型这件事情，是黄仁勋提出来的，是说我们以后每一个国家都去买自己的显卡，建自己的算力中心，每一个国家都拥有自己的主权模型。这是他提的这条路，不知道是光明还是黑暗，但也在我们的前方等待着我们。

好，这就是我们今天讲的故事。一OpenAI准备涨价100倍，为开始探讨一下OpenAI未来的一些发展方向。好，今天的故事就讲到这里，感谢大家收听。请帮忙点赞，点小铃铛，参加Discord讨论群，也欢迎有兴趣、有能力的朋友加入我们的付费频道，再见。