GPT5.3 Instant 背后风暴:QuitGPT 潮、国防合同争议与奥特曼骑墙

深色桌面上摊开一张羊皮纸,旁边放着钢笔、手机与笔记本电脑屏幕显示“GPT5.3 Instant”字样,画面有紧急上线的新闻感与工具感,羊皮纸,钢笔彩色手绘的统一风格。

OpenAI 紧急上线了 GPT5.3 Instant。这只是一个快速止血包,真正的大招还在后面。

大家好,欢迎收看老范讲故事的 YouTube 频道。OpenAI 在 3 月 3 号晚上发了一篇简短的博客,模型就这么上线了:没有发布会,没有很复杂的发布仪式,直接就来了。现在大家在 GPT 的网页和 APP 上都可以看到这个模型。

这是要顶住 quit GPT 的风暴吗?因为大家知道,现在欧美正在流行退订 GPT,好像有几百万人已经退订掉了。虽然这几百万只是它所有订阅用户里很少的一部分,但是这个风气是很吓人的。

这个故事我分五段来讲:

  1. GPT5.3 Instant 到底是一个什么样的模型
  2. 内忧外患、四面楚歌的 OpenAI
  3. 面对国防部要求 AI 武器化的四种反馈,山姆·奥特曼为什么最不讨喜
  4. 真正能够让 GPT 摆脱困境的到底是什么
  5. 最后,我们能干点啥

第一段:GPT5.3 Instant 到底是一个什么样的模型

一张羊皮纸上用钢笔手写对比表“Instant vs thinking”,旁边画出速度快的箭头与简洁回答的短段落气泡,桌边摆着沙漏与闪电符号,突出“快速但更简洁”,羊皮纸,钢笔彩色手绘的统一风格。

它是一个在日常对话、信息检索、写作体验方面有所提升的快速模型。大家注意后边这个词叫 Instant,它是快速回答的,所以正常情况下,它不会像 GPT5.2 thinking 那样思考很久,然后哗哗哗给你出一大堆;它的回答非常简洁。

我今天尝试用这个模型来给大家写稿,发现不行:它写出来的东西只有非常非常简洁的提纲。你说你给我写一个很完整的东西,它得费点劲;但是速度确实很快。

GPT5.2 thinking 其实是我前面一段时间的主力模型,真的很慢。我每一次都是想好了问题,这个问题一定要想得非常非常清楚。为什么?因为你每次回车下去以后可能需要等很久才能有结果,所以我都要想很久,然后写一个很长的问题,经常我那个问题就有几百字甚至上千字。然后打一个回车,我就去干别的了,相当于半个 deep research 似的。

但是这一次 5.3 的 Instant 非常非常快,打了回车一会就回来了,绝对不需要站起来。这个模型更顺滑,可以做更好的外部信息整合,就是它搜索完了以后去进行信息整合。

那你说做更好的外部信息整合有什么意义?意义非常重大:可以减少幻觉。因为现在的 GPT 也好、Gemini 也好,他们出现幻觉最主要的一个原因,就是把各种各样的网页拎回来以后去进行整合的时候,数据有可能会相互干扰,会出现问题。现在 5.3 承诺说在这一块做得更好,但可能还需要十几天才能具体发现它是不是做到了。

更少的拒绝回答

真正 GPT5.3 Instant 做的改变是什么?更少的拒绝回答。原来 GPT5.2 也好,或者更早期的 5 以上的版本也好,都是会经常拒绝回答的。原来的 ChatGPT 实在是太“圣母”了:把医疗问题问深了不回答,法律问题经常也不回答,心理问题不回答。

这个非常重要,因为这么大的用户量里头总有心理不太健康的,你回答错了,他真自杀了,这事也很麻烦。因为 GPT 前两天刚出过一个事情:英国在什么地方有一个女性,通过 GPT 的询问配了一个什么毒药,把她老公给毒死了。前一段时间加拿大出现过枪击案,其实 OpenAI 在后台是看到数据了,他们还开了个会讨论了一下,有会议纪要,说我们是不是要向加拿大政府去汇报这件事情。就是在枪击之前,犯罪分子也是通过 GPT 去进行了问答。他们最后觉得好像没必要小题大做,就把这事放过去了,结果最后枪击真的发生了。

当然还有一个很重要的不回答是什么?成人话题不回答。原来一直说 1 月份 GPT 会上成人版,但是年龄测试这件事确实上了,成人版没来。现在的 GPT5.3 Instant 虽然也没有成人版,但是显著减少了不必要的拒绝回答:就是大量的问题,它现在就可以直接答了。

减少过度防御、道德化前置话术

它减少过度防御、道德化前置话术。有的时候它虽然给你回答,但是前头会说“你要注意”“你要这个有问题有风险”,或者“我说的我不负责任”,经常会讲这样的话。现在这种话就少说一点,你问什么我就答什么就完事了。前置免责声明太多、太说教的这部分,也已经进行了改进。

对安全但是敏感的问题,还是会有一定的拒绝回答。原来可能该答的没给人答,不该答的可能反而给人答了,这一块现在 5.3 Instant 做了很好的改进,用户的体验和对话会显得更加流畅。

像我为什么很少使用国内的模型,就是你不定问什么事,它就不给你干活了,所以你很难对它的表现有一个稳定的预期。在这点上 GPT 其实还算好了,比国内这些模型好很多了。我经常使用即梦的时候,你会发现你写了一个中文提示词,但是画面上出来的标题变成英文了,通常就是它不愿意回答这个问题,它认为你的内容是有问题的,但它又给你绕过去了,绕的方式就是把中文翻译成英文,然后给你写上了。

上下文长度与推理方式

一张羊皮纸上画出三条不同长度的卷轴并标注“128K / 256K / 400K”,旁边用钢笔画出节点网络象征 AI agent 规划被“短卷轴”装不下,突出上下文差异与用途,羊皮纸,钢笔彩色手绘的统一风格。

另外,GPT5.3 Instant 上下文稍微短一点:它只有 128K。大家注意,GPT5.2 thinking 的上下文有 256K,而 GPT5.3 Codex 的上下文有 400K。Codex 这个模型是专门给编程用的,thinking 那个模型是专门做复杂推理和思考的。Instant 整个上下文就短,所以你要想用这个 Instant 去推动 AI agent 基本上是很难的:上下文短了以后,就比较难去做复杂的 AI agent 规划,包括容纳 AI agent 不同节点回来的上下文,基本上是塞不下的。

那你说这个模型就不能做推理吗?其实也能推,只是它的推理控制属于自适应型:需要的时候我就推理,不需要的时候我就简单给你回答一句就完事了。它不像 GPT5.2 thinking 似的强制推理,“你必须要去给我想明白了再给我说”。它有点类似于 ChatGPT 的 auto 模式,就是它自己来决定。

这个版本适应的场景是搜索、写作规划和日常学习,这个很够了。目前已经上线了网页、APP,API 也上线了,但是价格没变:版本号涨了,价格没有涨。原来 5.2 是多少钱,现在 5.3 Instant 还是多少钱。

它为什么像“紧急止血包”

另外,模型变快了,它并不是类似于 Gemini 3.1 Flash 这样的轻量级模型,它还是用了原来的模型,只是把一些系统提示词、一些回答策略改了改,估计就是拨了点开关,就把这样的一个模型直接扔出来了。所以为什么咱们在开头讲说这是一个紧急救急的、紧急止血包:没有特别大的变化。

Codex 里边现在还没有这个模型。如果你使用的是 Codex CLI,或者像我一样使用 Openclaw 挂 Codex 的 API 去干活的话,现在使不了这个模型。我现在的 Openclaw 里边用的是 GPT5.3 Codex 这个专门的编码模型,就是上下文有 400K 的这个模型。

我今天还去问它了:GPT5.3 Instant 和 GPT5.3 Codex,到底哪一个更适合你?我的小龙虾告诉我了:请你使用这个 Codex 模型,这个推理更好、上下文更长;但如果你要写一些简单的东西的话,你可以去切换成这个 Instant 模型。我干嘛要切换?价格都一样,咱肯定是有大的不吃小的呀。

第二段:内忧外患、四面楚歌的 OpenAI

一张羊皮纸上画出 OpenAI 的盾牌被多支箭同时指向,箭头分别标注“退订风暴”“小模型竞赛”“政策争议”“融资压力”,背景有风暴云与被锤的靶子意象,羊皮纸,钢笔彩色手绘的统一风格。

下一个问题:现在内忧外患、四面楚歌的 OpenAI,必须要进行紧急止血了。

谷歌跟千问都刚刚推出了快速反应的小模型。前面谷歌推了 Gemini 3.1 Pro,确实很好用,但我后来还是把它换成了 GPT5.2,因为 Gemini 3.1 Pro 有的时候服务不是特别稳定,经常服务器就不理你了,这个还是很讨厌的。

昨天谷歌推出了 Gemini 3.1 Flashlight。一般的 Flash 就已经是快速、小规模的模型了。谷歌每一次推 Flash 模型的时候我都不太敢用,速度确实很快,但是幻觉异常严重,而且很笨。现在叫 Flashlight,应该比 Flash 还要再小、再轻快的一个模型。

另外,千问最近也推出了很多很小规模的模型,千问 3.5 从零点几 B 一直到 8B、二十几 B、35B,这一系列全都推齐了。当然要注意,千问 8B 这样的模型不是让你去做快速响应的,这种模型是为了上手机的,是为了在手机也好、汽车也好,在这种移动端进行本地推理用的,这跟我们普通人关系不是特别大。咱普通人能够使用云端的大模型,尽量使用云端的,这个差异还是很大的。

在“战争部”问题上,OpenAI 又在玩骑墙派,所以就被“圣母们”直接号召 quit GPT 了。你如果说我就老老实实怂了也没毛病,你说我就像 Anthropic 一样我也去硬顶也行,但是既要又要肯定是不行的,直接就被人号召起来了。

大家注意,所有这种号召退出的,他可能压根就不是你的会员。像我做 YouTube 也经常有人上来说“老范我讨厌你,再也不订阅你了”,实际上他压根就没订阅过。他之所以来喊这个话,就是想号召别人一起去退出。“圣母们”一般都喜欢玩这种事情,很恶心。

我这个人是比较讨厌“圣母”的。OpenAI 自己内部有挺多“圣母”的,山姆·奥特曼因为一直也是扯着“圣母”的这张皮,所以还是忽悠来不少“圣母”在他这旗下干活的。他去跟国防部签约了以后,他自己的员工跑出来去抗议,说你怎么可以干这样的事情。硅谷这种人是比较多的,需要整治几轮以后才有可能好转。待会咱们再讲公司里边“圣母”的故事。

推出成人版这事,肯定也是会被“圣母们”反对的。OpenAI 产品政策副总裁就因为这件事被解雇了。当然 OpenAI 自己说不是这个,跟这没关系。这位副总裁是一位女性,她反对 ChatGPT 提供成人模式,她认为可能导致青少年接触不当内容,安全防护不足,所以她拒绝这件事情。OpenAI 对外表示说:虽然我们把她开除了(注意她不是主动离职,是被开除的),但是她的被开除跟她拒绝做成人模式没关系,是因为她对一名男性同事存在性别歧视,她看不起男人,所以我们把她开了;但是这位女士自己表示说没有这回事。所以 OpenAI 在推成人版这件事情上,还是要跟内部斗争一段时间,才有可能往前走。

OpenAI 还刚刚完成了有史以来最大规模的融资,一下拿了 1100 亿美金。但是这种融资下来以后已经不再是好消息了。去年你说 OpenAI 拿了多少融资,这是好消息,大家一起股票普涨;现在已经不是这样了,因为他们这种左手倒右手的游戏,大家已经看得很腻烦了。

这一次亚马逊给 500 亿美金,而且这 500 亿美金好像是先给 100 亿,然后你要么上市,要么你要去实现 AGI,然后我才去给剩下的钱。而且你这个钱必须跟我签协议:我把钱给你以后,你要拿回来买我的算力,而且要买我自己这种芯片的,不是英伟达芯片的这种算力。英伟达那我也得签,签完了以后你还得接着使我的算力。大家还是说我跟 OpenAI 签字,我给你钱,拿了钱以后再回来买我的算力,就是左手倒右手嘛,继续在玩这个事。这事已经不新鲜了,所以大家现在有腻烦心理,看见谁干这个活都觉得肯定有问题。

而且要注意,这一次的 GPT5.3 Instant 并不完全是跑在英伟达上面的,它有一部分应该是跑在微软云上,就是微软自己的 ASIC 这种算力芯片。以后亚马逊上应该也是可以跑 GPT5.3 Instant,这种兼容性的问题对于大厂来说都不是特别严重的事情,他们自己是可以搞定的。

现在 OpenAI 绝对是整个行业的靶子,所有人都在拎着它锤。谁让它原来当了这么长时间老大,装了这么长时间“圣母”,最后一看说你原来也是这样的无耻下流之徒,那肯定锤你没什么好说的。而且你拿了这么多的钱,那大家更是要盯着你去锤。

第三段:面对国防部要求 AI 武器化的四种反馈,为什么山姆·奥特曼最不招人喜欢?

下一个问题:面对国防部要求 AI 武器化的四种反馈,为什么山姆·奥特曼最不招人喜欢?

四种反馈咱们一个一个数一下。

第一种:Anthropic 拒绝

第一种是 Anthropic 拒绝:我硬刚到底。董王怒了,但是民众买单,直接把 Anthropic 的 Claude APP 拉到了排行榜第一。因为大家要相信 Anthropic 应该不会花钱去买量的,这就是生生被用户给拉上去的。现在美国的苹果 iOS 免费榜第一名叫做 Claude。当然了,它原来算力储备是不够的,拉上第一以后必然面临的一个问题是什么?服务器崩了。这么多人冲上来,直接就不行了。所以大家也看到了,做“圣母”这件事它是有好处的:真的有人捧这个臭脚。

第二种:马斯克

第二种是马斯克这种:我从来也不装,上来就直接给了国防部一个无保留的合同。Anthropic 说我大部分条款同意,但是有两个条款我死活坚持,就是不给你。马斯克说没问题,要什么给什么,拿去用吧。大家早就知道马斯克是什么人了,所以也没觉得这有什么毛病。你不干这个活反而不对了,让我们不认识你了。

第三种:谷歌的状态

第三种是谷歌的状态:职业经理人。谷歌的创始人都已经基本上退休了,拉里·佩奇跟谢尔盖·布林基本上是在休息。整个谷歌的运营他们是不管的,虽然现在谢尔盖·布林号称是回来写代码去了,但是他不管理整个谷歌公司。管理谷歌公司的是一帮职业经理人,皮采这帮印度人在管。他们四平八稳,继续推进就完了,该干嘛干嘛,我也不出来说什么。

而且原来谷歌里头也是有很多“圣母”的,拉里·佩奇他们管的时候也是说谷歌是不作恶的,“圣母们”都来吧。但是后来应该是 08 年吧,谷歌去跟军队做合作,要把 AI 应用到军队里边去,然后这帮人也在谷歌拉横幅闹事。现在这帮人早都被谷歌都开干净了,可能都在 OpenAI 上班或者在 Anthropic 上班。所以谷歌现在还在稳稳地该干嘛干嘛,也没有出来发什么声音。

第四种:OpenAI 的山姆·奥特曼

第四种是 OpenAI 的山姆·奥特曼,算是最不招人喜欢的一个:首鼠两端。想要签合同拿钱,批评了 Anthropic 替国防部做主、替国家做主,自己签了合同还遮遮掩掩的,设了一些条款想要进行保护,但那些条款基本上形同虚设。你要不就跟马斯克似的,我啥条款也不要,来吧想干嘛干嘛;要么你就跟 Anthropic 似的说我两个条款坚持,说什么都白费。他这个就是写了一些模棱两可、遮遮掩掩的条款,实际上啥也没保护住。这个东西拿出来以后,大家就觉得你太装了,所以这种遮遮掩掩、既要又要,肯定是不招人喜欢的。

现在为了紧急救急一下,出了这个 5.3 Instant,只是一个补丁。后面 5.3 的 thinking、5.3 Pro 这些版本应该还在路上,可能再过几周就会出来。但是真正能够让 GPT 摆脱困境的,应该不是这些东西。

第四段:真正能够让 GPT 摆脱困境的到底是什么

一张羊皮纸上画出“Claude Code”与“Openclaw”两把对决的工具:左边是锋利的编程匕首,右边是巨大的龙虾形扳手/钳子象征 agent 工具,背后是代码雨与终端窗口轮廓,强调“杀器在工具”,羊皮纸,钢笔彩色手绘的统一风格。

真正能够让 GPT 摆脱困境的是什么?下一代模型基本上就不用指望了。虽然现在有传言说 GPT 很快会推出 5.4 的版本,但是这种模型的提升可能对于大部分普通人来说意义不是很大。

现在模型的能力极大地受到了上下文质量的影响:就是你把上下文规划好、隔离好,把该告诉它的都告诉它,大部分的模型其实差异已经没有那么大了,至少对于普通人来说是这样。您说您是个数学家或者科学家,那是另外一回事,可能 GPT 出 5.4 或者再往后的版本对您是有用的;对于绝大部分人来说,意义已经没那么大了。即使不太好的模型,只要上下文边界清晰,效果都大差不差,即使是中国的模型也是如此。

缺少像 Claude Code 这样的大杀器,模型再好别人也很难发挥得出来。Claude Code 在这块真的是大杀器。OpenAI 现在手里也拿到了一个杀器,虽然质量稍微差了一点点,但是大家使用的热情很高,这个东西就是 Openclaw 大龙虾。这条路 OpenAI 算是走对了:先把用户都拉回来,把用量拉起来,以这个 Openclaw 去对抗 Claude Code,这个就是 OpenAI 现在真正该干的事情。

现在谷歌的 Gemini 和 Anthropic 的 Claude 都在封杀 Openclaw。你要想使用 Openclaw,只能用 GPT 的套餐,或者是国内这些套餐;其他那个不是说不让你使,必须要上 API token,你必须要按照 API 的用量向谷歌和 Anthropic 交钱,真交不起。那玩意就是个话痨,非常非常浪费 token 的一个玩法,所以一定是有套餐了才能用。

除了 Openclaw 之外,还有一个可以让 OpenAI 重新火起来的东西是什么?抓紧把成人模式做了吧,别再装“圣母”了,已经破功了,装不下去了,该干嘛干嘛去吧。

第五段:最后,我们能干点啥

别盲目跟着版本号

第一个要提醒注意的:别盲目跟着版本号。现在虽然它叫 5.3 了,但是它其实没有 5.2 thinking 的效果好。您如果这个项目是需要认真推理和思考的,还是老老实实回去用 5.2 thinking;您说我这个需要快速得到一个结果就可以了,随便聊两句就行了,现在可以去切换 5.3 Instant。

选择自己喜欢的服务商

一张羊皮纸上画出三条分叉道路的路标,分别写着“OpenAI / Anthropic / Google”,路边有一只手拿着订阅账单与放大镜象征“用脚投票”,远处是云端服务器与终端窗口剪影,羊皮纸,钢笔彩色手绘的统一风格。

选择自己喜欢的服务商,这个非常重要。我本人并不太相信“圣母们”的表演,我相信的是什么?人生如戏,全靠演技。你在上头说得再好,他未必心里是这么想的。我是更喜欢像马斯克这种彻底不装的人;谷歌这些职业经理人管理的公司也行,这也没什么大毛病,反正不出圈嘛。大家自己花钱选模型,选一个自己顺心的,这个没毛病。

希望 Openclaw 可以拯救 OpenAI,也期待 OpenAI 在未来的几个月里头向我们贡献他们的成人模式,这个还是值得去期待一下的。我自己肯定不用,先说清楚。

好,故事就讲到这里。感谢大家收听,请帮忙点赞、点小铃铛,参加 DISCORD 讨论群;也欢迎有兴趣、有能力的朋友加入我们的付费频道。再见。


背景图片

Prompt:in the style of Marvel comics, highly detailed hand-drawn office interior, empty Silicon Valley artificial intelligence startup headquarters, expansive open floor, ergonomic chairs pushed in, multi-monitor coding stations asleep, glass walls with algorithm diagrams, prototype hardware lab corner, neat cable management, polished concrete floor reflections, 24mm wide establishing shot, eye-level, rich perspective lines, inked contours with cross-hatching and halftone texture –no humans, no faces, no brand names, no captions, no watermark –ar 16:9 –stylize 200 –chaos 6 –v 7.0 –p qaczhqj