GPT5.3 Instant 背后风暴：QuitGPT 潮、国防合同争议与奥特曼骑墙 - 老范讲故事

深色桌面上摊开一张羊皮纸，旁边放着钢笔、手机与笔记本电脑屏幕显示“GPT5.3 Instant”字样，画面有紧急上线的新闻感与工具感，羊皮纸，钢笔彩色手绘的统一风格。

OpenAI 紧急上线了 GPT5.3 Instant。这只是一个快速止血包，真正的大招还在后面。

大家好，欢迎收看老范讲故事的 YouTube 频道。OpenAI 在 3 月 3 号晚上发了一篇简短的博客，模型就这么上线了：没有发布会，没有很复杂的发布仪式，直接就来了。现在大家在 GPT 的网页和 APP 上都可以看到这个模型。

这是要顶住 quit GPT 的风暴吗？因为大家知道，现在欧美正在流行退订 GPT，好像有几百万人已经退订掉了。虽然这几百万只是它所有订阅用户里很少的一部分，但是这个风气是很吓人的。

这个故事我分五段来讲：

GPT5.3 Instant 到底是一个什么样的模型
内忧外患、四面楚歌的 OpenAI
面对国防部要求 AI 武器化的四种反馈，山姆·奥特曼为什么最不讨喜
真正能够让 GPT 摆脱困境的到底是什么
最后，我们能干点啥

第一段：GPT5.3 Instant 到底是一个什么样的模型

一张羊皮纸上用钢笔手写对比表“Instant vs thinking”，旁边画出速度快的箭头与简洁回答的短段落气泡，桌边摆着沙漏与闪电符号，突出“快速但更简洁”，羊皮纸，钢笔彩色手绘的统一风格。

它是一个在日常对话、信息检索、写作体验方面有所提升的快速模型。大家注意后边这个词叫 Instant，它是快速回答的，所以正常情况下，它不会像 GPT5.2 thinking 那样思考很久，然后哗哗哗给你出一大堆；它的回答非常简洁。

我今天尝试用这个模型来给大家写稿，发现不行：它写出来的东西只有非常非常简洁的提纲。你说你给我写一个很完整的东西，它得费点劲；但是速度确实很快。

GPT5.2 thinking 其实是我前面一段时间的主力模型，真的很慢。我每一次都是想好了问题，这个问题一定要想得非常非常清楚。为什么？因为你每次回车下去以后可能需要等很久才能有结果，所以我都要想很久，然后写一个很长的问题，经常我那个问题就有几百字甚至上千字。然后打一个回车，我就去干别的了，相当于半个 deep research 似的。

但是这一次 5.3 的 Instant 非常非常快，打了回车一会就回来了，绝对不需要站起来。这个模型更顺滑，可以做更好的外部信息整合，就是它搜索完了以后去进行信息整合。

那你说做更好的外部信息整合有什么意义？意义非常重大：可以减少幻觉。因为现在的 GPT 也好、Gemini 也好，他们出现幻觉最主要的一个原因，就是把各种各样的网页拎回来以后去进行整合的时候，数据有可能会相互干扰，会出现问题。现在 5.3 承诺说在这一块做得更好，但可能还需要十几天才能具体发现它是不是做到了。

更少的拒绝回答

真正 GPT5.3 Instant 做的改变是什么？更少的拒绝回答。原来 GPT5.2 也好，或者更早期的 5 以上的版本也好，都是会经常拒绝回答的。原来的 ChatGPT 实在是太“圣母”了：把医疗问题问深了不回答，法律问题经常也不回答，心理问题不回答。

这个非常重要，因为这么大的用户量里头总有心理不太健康的，你回答错了，他真自杀了，这事也很麻烦。因为 GPT 前两天刚出过一个事情：英国在什么地方有一个女性，通过 GPT 的询问配了一个什么毒药，把她老公给毒死了。前一段时间加拿大出现过枪击案，其实 OpenAI 在后台是看到数据了，他们还开了个会讨论了一下，有会议纪要，说我们是不是要向加拿大政府去汇报这件事情。就是在枪击之前，犯罪分子也是通过 GPT 去进行了问答。他们最后觉得好像没必要小题大做，就把这事放过去了，结果最后枪击真的发生了。

当然还有一个很重要的不回答是什么？成人话题不回答。原来一直说 1 月份 GPT 会上成人版，但是年龄测试这件事确实上了，成人版没来。现在的 GPT5.3 Instant 虽然也没有成人版，但是显著减少了不必要的拒绝回答：就是大量的问题，它现在就可以直接答了。

减少过度防御、道德化前置话术

它减少过度防御、道德化前置话术。有的时候它虽然给你回答，但是前头会说“你要注意”“你要这个有问题有风险”，或者“我说的我不负责任”，经常会讲这样的话。现在这种话就少说一点，你问什么我就答什么就完事了。前置免责声明太多、太说教的这部分，也已经进行了改进。

对安全但是敏感的问题，还是会有一定的拒绝回答。原来可能该答的没给人答，不该答的可能反而给人答了，这一块现在 5.3 Instant 做了很好的改进，用户的体验和对话会显得更加流畅。

像我为什么很少使用国内的模型，就是你不定问什么事，它就不给你干活了，所以你很难对它的表现有一个稳定的预期。在这点上 GPT 其实还算好了，比国内这些模型好很多了。我经常使用即梦的时候，你会发现你写了一个中文提示词，但是画面上出来的标题变成英文了，通常就是它不愿意回答这个问题，它认为你的内容是有问题的，但它又给你绕过去了，绕的方式就是把中文翻译成英文，然后给你写上了。

上下文长度与推理方式

一张羊皮纸上画出三条不同长度的卷轴并标注“128K / 256K / 400K”，旁边用钢笔画出节点网络象征 AI agent 规划被“短卷轴”装不下，突出上下文差异与用途，羊皮纸，钢笔彩色手绘的统一风格。

另外，GPT5.3 Instant 上下文稍微短一点：它只有 128K。大家注意，GPT5.2 thinking 的上下文有 256K，而 GPT5.3 Codex 的上下文有 400K。Codex 这个模型是专门给编程用的，thinking 那个模型是专门做复杂推理和思考的。Instant 整个上下文就短，所以你要想用这个 Instant 去推动 AI agent 基本上是很难的：上下文短了以后，就比较难去做复杂的 AI agent 规划，包括容纳 AI agent 不同节点回来的上下文，基本上是塞不下的。

那你说这个模型就不能做推理吗？其实也能推，只是它的推理控制属于自适应型：需要的时候我就推理，不需要的时候我就简单给你回答一句就完事了。它不像 GPT5.2 thinking 似的强制推理，“你必须要去给我想明白了再给我说”。它有点类似于 ChatGPT 的 auto 模式，就是它自己来决定。

这个版本适应的场景是搜索、写作规划和日常学习，这个很够了。目前已经上线了网页、APP，API 也上线了，但是价格没变：版本号涨了，价格没有涨。原来 5.2 是多少钱，现在 5.3 Instant 还是多少钱。

它为什么像“紧急止血包”

另外，模型变快了，它并不是类似于 Gemini 3.1 Flash 这样的轻量级模型，它还是用了原来的模型，只是把一些系统提示词、一些回答策略改了改，估计就是拨了点开关，就把这样的一个模型直接扔出来了。所以为什么咱们在开头讲说这是一个紧急救急的、紧急止血包：没有特别大的变化。

Codex 里边现在还没有这个模型。如果你使用的是 Codex CLI，或者像我一样使用 Openclaw 挂 Codex 的 API 去干活的话，现在使不了这个模型。我现在的 Openclaw 里边用的是 GPT5.3 Codex 这个专门的编码模型，就是上下文有 400K 的这个模型。

我今天还去问它了：GPT5.3 Instant 和 GPT5.3 Codex，到底哪一个更适合你？我的小龙虾告诉我了：请你使用这个 Codex 模型，这个推理更好、上下文更长；但如果你要写一些简单的东西的话，你可以去切换成这个 Instant 模型。我干嘛要切换？价格都一样，咱肯定是有大的不吃小的呀。

第二段：内忧外患、四面楚歌的 OpenAI

一张羊皮纸上画出 OpenAI 的盾牌被多支箭同时指向，箭头分别标注“退订风暴”“小模型竞赛”“政策争议”“融资压力”，背景有风暴云与被锤的靶子意象，羊皮纸，钢笔彩色手绘的统一风格。

下一个问题：现在内忧外患、四面楚歌的 OpenAI，必须要进行紧急止血了。

谷歌跟千问都刚刚推出了快速反应的小模型。前面谷歌推了 Gemini 3.1 Pro，确实很好用，但我后来还是把它换成了 GPT5.2，因为 Gemini 3.1 Pro 有的时候服务不是特别稳定，经常服务器就不理你了，这个还是很讨厌的。

昨天谷歌推出了 Gemini 3.1 Flashlight。一般的 Flash 就已经是快速、小规模的模型了。谷歌每一次推 Flash 模型的时候我都不太敢用，速度确实很快，但是幻觉异常严重，而且很笨。现在叫 Flashlight，应该比 Flash 还要再小、再轻快的一个模型。

另外，千问最近也推出了很多很小规模的模型，千问 3.5 从零点几 B 一直到 8B、二十几 B、35B，这一系列全都推齐了。当然要注意，千问 8B 这样的模型不是让你去做快速响应的，这种模型是为了上手机的，是为了在手机也好、汽车也好，在这种移动端进行本地推理用的，这跟我们普通人关系不是特别大。咱普通人能够使用云端的大模型，尽量使用云端的，这个差异还是很大的。

在“战争部”问题上，OpenAI 又在玩骑墙派，所以就被“圣母们”直接号召 quit GPT 了。你如果说我就老老实实怂了也没毛病，你说我就像 Anthropic 一样我也去硬顶也行，但是既要又要肯定是不行的，直接就被人号召起来了。

大家注意，所有这种号召退出的，他可能压根就不是你的会员。像我做 YouTube 也经常有人上来说“老范我讨厌你，再也不订阅你了”，实际上他压根就没订阅过。他之所以来喊这个话，就是想号召别人一起去退出。“圣母们”一般都喜欢玩这种事情，很恶心。

我这个人是比较讨厌“圣母”的。OpenAI 自己内部有挺多“圣母”的，山姆·奥特曼因为一直也是扯着“圣母”的这张皮，所以还是忽悠来不少“圣母”在他这旗下干活的。他去跟国防部签约了以后，他自己的员工跑出来去抗议，说你怎么可以干这样的事情。硅谷这种人是比较多的，需要整治几轮以后才有可能好转。待会咱们再讲公司里边“圣母”的故事。

推出成人版这事，肯定也是会被“圣母们”反对的。OpenAI 产品政策副总裁就因为这件事被解雇了。当然 OpenAI 自己说不是这个，跟这没关系。这位副总裁是一位女性，她反对 ChatGPT 提供成人模式，她认为可能导致青少年接触不当内容，安全防护不足，所以她拒绝这件事情。OpenAI 对外表示说：虽然我们把她开除了（注意她不是主动离职，是被开除的），但是她的被开除跟她拒绝做成人模式没关系，是因为她对一名男性同事存在性别歧视，她看不起男人，所以我们把她开了；但是这位女士自己表示说没有这回事。所以 OpenAI 在推成人版这件事情上，还是要跟内部斗争一段时间，才有可能往前走。

OpenAI 还刚刚完成了有史以来最大规模的融资，一下拿了 1100 亿美金。但是这种融资下来以后已经不再是好消息了。去年你说 OpenAI 拿了多少融资，这是好消息，大家一起股票普涨；现在已经不是这样了，因为他们这种左手倒右手的游戏，大家已经看得很腻烦了。

这一次亚马逊给 500 亿美金，而且这 500 亿美金好像是先给 100 亿，然后你要么上市，要么你要去实现 AGI，然后我才去给剩下的钱。而且你这个钱必须跟我签协议：我把钱给你以后，你要拿回来买我的算力，而且要买我自己这种芯片的，不是英伟达芯片的这种算力。英伟达那我也得签，签完了以后你还得接着使我的算力。大家还是说我跟 OpenAI 签字，我给你钱，拿了钱以后再回来买我的算力，就是左手倒右手嘛，继续在玩这个事。这事已经不新鲜了，所以大家现在有腻烦心理，看见谁干这个活都觉得肯定有问题。

而且要注意，这一次的 GPT5.3 Instant 并不完全是跑在英伟达上面的，它有一部分应该是跑在微软云上，就是微软自己的 ASIC 这种算力芯片。以后亚马逊上应该也是可以跑 GPT5.3 Instant，这种兼容性的问题对于大厂来说都不是特别严重的事情，他们自己是可以搞定的。

现在 OpenAI 绝对是整个行业的靶子，所有人都在拎着它锤。谁让它原来当了这么长时间老大，装了这么长时间“圣母”，最后一看说你原来也是这样的无耻下流之徒，那肯定锤你没什么好说的。而且你拿了这么多的钱，那大家更是要盯着你去锤。

第三段：面对国防部要求 AI 武器化的四种反馈，为什么山姆·奥特曼最不招人喜欢？

下一个问题：面对国防部要求 AI 武器化的四种反馈，为什么山姆·奥特曼最不招人喜欢？

四种反馈咱们一个一个数一下。

第一种：Anthropic 拒绝

第一种是 Anthropic 拒绝：我硬刚到底。董王怒了，但是民众买单，直接把 Anthropic 的 Claude APP 拉到了排行榜第一。因为大家要相信 Anthropic 应该不会花钱去买量的，这就是生生被用户给拉上去的。现在美国的苹果 iOS 免费榜第一名叫做 Claude。当然了，它原来算力储备是不够的，拉上第一以后必然面临的一个问题是什么？服务器崩了。这么多人冲上来，直接就不行了。所以大家也看到了，做“圣母”这件事它是有好处的：真的有人捧这个臭脚。

第二种：马斯克

第二种是马斯克这种：我从来也不装，上来就直接给了国防部一个无保留的合同。Anthropic 说我大部分条款同意，但是有两个条款我死活坚持，就是不给你。马斯克说没问题，要什么给什么，拿去用吧。大家早就知道马斯克是什么人了，所以也没觉得这有什么毛病。你不干这个活反而不对了，让我们不认识你了。

第三种：谷歌的状态

第三种是谷歌的状态：职业经理人。谷歌的创始人都已经基本上退休了，拉里·佩奇跟谢尔盖·布林基本上是在休息。整个谷歌的运营他们是不管的，虽然现在谢尔盖·布林号称是回来写代码去了，但是他不管理整个谷歌公司。管理谷歌公司的是一帮职业经理人，皮采这帮印度人在管。他们四平八稳，继续推进就完了，该干嘛干嘛，我也不出来说什么。

而且原来谷歌里头也是有很多“圣母”的，拉里·佩奇他们管的时候也是说谷歌是不作恶的，“圣母们”都来吧。但是后来应该是 08 年吧，谷歌去跟军队做合作，要把 AI 应用到军队里边去，然后这帮人也在谷歌拉横幅闹事。现在这帮人早都被谷歌都开干净了，可能都在 OpenAI 上班或者在 Anthropic 上班。所以谷歌现在还在稳稳地该干嘛干嘛，也没有出来发什么声音。

第四种：OpenAI 的山姆·奥特曼

第四种是 OpenAI 的山姆·奥特曼，算是最不招人喜欢的一个：首鼠两端。想要签合同拿钱，批评了 Anthropic 替国防部做主、替国家做主，自己签了合同还遮遮掩掩的，设了一些条款想要进行保护，但那些条款基本上形同虚设。你要不就跟马斯克似的，我啥条款也不要，来吧想干嘛干嘛；要么你就跟 Anthropic 似的说我两个条款坚持，说什么都白费。他这个就是写了一些模棱两可、遮遮掩掩的条款，实际上啥也没保护住。这个东西拿出来以后，大家就觉得你太装了，所以这种遮遮掩掩、既要又要，肯定是不招人喜欢的。

现在为了紧急救急一下，出了这个 5.3 Instant，只是一个补丁。后面 5.3 的 thinking、5.3 Pro 这些版本应该还在路上，可能再过几周就会出来。但是真正能够让 GPT 摆脱困境的，应该不是这些东西。

第四段：真正能够让 GPT 摆脱困境的到底是什么

一张羊皮纸上画出“Claude Code”与“Openclaw”两把对决的工具：左边是锋利的编程匕首，右边是巨大的龙虾形扳手/钳子象征 agent 工具，背后是代码雨与终端窗口轮廓，强调“杀器在工具”，羊皮纸，钢笔彩色手绘的统一风格。

真正能够让 GPT 摆脱困境的是什么？下一代模型基本上就不用指望了。虽然现在有传言说 GPT 很快会推出 5.4 的版本，但是这种模型的提升可能对于大部分普通人来说意义不是很大。

现在模型的能力极大地受到了上下文质量的影响：就是你把上下文规划好、隔离好，把该告诉它的都告诉它，大部分的模型其实差异已经没有那么大了，至少对于普通人来说是这样。您说您是个数学家或者科学家，那是另外一回事，可能 GPT 出 5.4 或者再往后的版本对您是有用的；对于绝大部分人来说，意义已经没那么大了。即使不太好的模型，只要上下文边界清晰，效果都大差不差，即使是中国的模型也是如此。

缺少像 Claude Code 这样的大杀器，模型再好别人也很难发挥得出来。Claude Code 在这块真的是大杀器。OpenAI 现在手里也拿到了一个杀器，虽然质量稍微差了一点点，但是大家使用的热情很高，这个东西就是 Openclaw 大龙虾。这条路 OpenAI 算是走对了：先把用户都拉回来，把用量拉起来，以这个 Openclaw 去对抗 Claude Code，这个就是 OpenAI 现在真正该干的事情。

现在谷歌的 Gemini 和 Anthropic 的 Claude 都在封杀 Openclaw。你要想使用 Openclaw，只能用 GPT 的套餐，或者是国内这些套餐；其他那个不是说不让你使，必须要上 API token，你必须要按照 API 的用量向谷歌和 Anthropic 交钱，真交不起。那玩意就是个话痨，非常非常浪费 token 的一个玩法，所以一定是有套餐了才能用。

除了 Openclaw 之外，还有一个可以让 OpenAI 重新火起来的东西是什么？抓紧把成人模式做了吧，别再装“圣母”了，已经破功了，装不下去了，该干嘛干嘛去吧。

第五段：最后，我们能干点啥

别盲目跟着版本号

第一个要提醒注意的：别盲目跟着版本号。现在虽然它叫 5.3 了，但是它其实没有 5.2 thinking 的效果好。您如果这个项目是需要认真推理和思考的，还是老老实实回去用 5.2 thinking；您说我这个需要快速得到一个结果就可以了，随便聊两句就行了，现在可以去切换 5.3 Instant。

选择自己喜欢的服务商

一张羊皮纸上画出三条分叉道路的路标，分别写着“OpenAI / Anthropic / Google”，路边有一只手拿着订阅账单与放大镜象征“用脚投票”，远处是云端服务器与终端窗口剪影，羊皮纸，钢笔彩色手绘的统一风格。

选择自己喜欢的服务商，这个非常重要。我本人并不太相信“圣母们”的表演，我相信的是什么？人生如戏，全靠演技。你在上头说得再好，他未必心里是这么想的。我是更喜欢像马斯克这种彻底不装的人；谷歌这些职业经理人管理的公司也行，这也没什么大毛病，反正不出圈嘛。大家自己花钱选模型，选一个自己顺心的，这个没毛病。

希望 Openclaw 可以拯救 OpenAI，也期待 OpenAI 在未来的几个月里头向我们贡献他们的成人模式，这个还是值得去期待一下的。我自己肯定不用，先说清楚。

好，故事就讲到这里。感谢大家收听，请帮忙点赞、点小铃铛，参加 DISCORD 讨论群；也欢迎有兴趣、有能力的朋友加入我们的付费频道。再见。

背景图片

Prompt：in the style of Marvel comics, highly detailed hand-drawn office interior, empty Silicon Valley artificial intelligence startup headquarters, expansive open floor, ergonomic chairs pushed in, multi-monitor coding stations asleep, glass walls with algorithm diagrams, prototype hardware lab corner, neat cable management, polished concrete floor reflections, 24mm wide establishing shot, eye-level, rich perspective lines, inked contours with cross-hatching and halftone texture –no humans, no faces, no brand names, no captions, no watermark –ar 16:9 –stylize 200 –chaos 6 –v 7.0 –p qaczhqj