超级App vs 独立操作系统:山姆·奥特曼的野心远不止取代搜索,52分钟发布会暴露其真正想颠覆的是整个应用平台|ChatGPT OpenAI Sam Altman Operating System
10 月 08
AIGC AI Agent, AI商业变现, AI开发者, AI硬件, Apps SDK, ChatGPT, ChatGPT操作系统, Codex, GPT-5 Pro API, OpenAI, OpenAI DevDay, OpenAI生态, Sam Altman, Sora 2 API, 人工智能未来, 全栈AI, 多模态AI, 小程序开发, 技术趋势分析, 股价影响, 自然语言编程, 行业领袖, 语音交互 超级App vs 独立操作系统:山姆·奥特曼的野心远不止取代搜索,52分钟发布会暴露其真正想颠覆的是整个应用平台|ChatGPT OpenAI Sam Altman Operating System已关闭评论
OpenAI开发者日,暴露了山姆·奥特曼的隐藏野心。
大家好,欢迎收听老范讲故事的YouTube频道。今天咱们先讲结论,然后告诉大家我怎么得出这样的结论,验证一下这个结论是否正确,再让大家行动起来,看看咱们在山姆·奥特曼指明方向以后,到底能干点什么。
OpenAI的开发者日呢,隐藏在发布会背后的野心和方向到底是什么?表面上这东西咱就不重复了,说到底发布了什么东西,只讲结论。
第一个,ChatGPT要做操作系统了。
第二个,自然语言和语音交互才是未来。
第三个,全栈、全生态、全模态的开发都在OpenAI。
有三个大的结论。
那咱们怎么得到这样的结论的呢?咱们看发布会,要稍微换一个方向来看。我自己呢,举办、参加过很多发布会,也专门受过训练,主持过发布会。咱们发布会一般看什么呢?叫“wow时刻”,一看这个东西,“wow,好厉害”,叫“wow时刻”。在52分钟的发布会视频里头,有哪些“Wow时刻”呢?那你说我是不是拿了个纸、拿了个笔,52分钟的发布会反复看,在这记笔记,哪个地方有掌声?不是这样的。我到GPT里边直接下了一个指令,把YouTube的视频链接贴进去,我说:“请给我统计一下,什么时候有掌声,掌声中度还是高度,有掌声的时候是谁在演讲,在讲什么,给我画个表格出来。”剩下的事情就交给GPT去干了,效果还是很好的。
第一次掌声,是山姆·奥特曼要求观众为消耗TOKEN最多的开发者鼓掌。他呢,屏幕上打了一堆开发者的名字,分颜色的,百万、千万甚至更多的TOKEN被这些开发者所消耗掉了,他们名字是用不同的颜色标出来的。这次掌声的不算很热烈。
4分22秒有一次自发的掌声,山姆在讲什么呢?当开发者使用SDK的时候,他们的应用可以覆盖数亿GPT用户。“我们希望这对于快速帮助开发者来说是一件大事,我们可以帮助他们规模化产品。”在这个时候突然就开始有掌声了,山姆·奥特曼被打断。这个时候屏幕上出现的topic是什么呢?是“变现”这样的一个词出现在屏幕上了。这个地方为什么会有掌声?大家想一想,它已经有这么大的用户量了,几亿的月活用户在那挂着,现在说:“我愿意把这些用户分享给大家,大家在我这个上面开发了应用以后,你们就可以在这个里边去使用各自的产品了,不再是使用我这个20美金的订阅,而是你们各自都可以有一些订阅或者有一些服务在这里边进行销售,可以在里边去变现了。”大家就真的要给他鼓掌了。所以这就是我们的第一个结论,这就是操作系统了,大家可以在这个里边去做项目了。有点像什么呢?有点像微信小程序、抖音小程序,大家现在都可以在ChatGPT里去做小程序了,这个肯定是会受到欢迎的,而且topic上写的是变现,这个非常重要的一点。
在APP SDK的demo结束的时候会有掌声,这个是很正常的演示,说我们怎么让一个应用通过SDK就可以把你们的程序变成了ChatGPT小程序了。他们在里边演示了很多的嵌入的产品,怎么订机票酒店,怎么租房,怎么去做海报。演示很成功,一定会有掌声。而且这个里头有比掌声更强的这种鼓励,就是比“wow”还厉害的东西,这就已经成为了行业领袖的发布会了。就普通人发布会到“Wow”这就结束了,待会咱们讲还有什么更厉害的。
再往后一项呢,有8分钟的限时挑战。它呢,其实就是把dify、N8N、Coze这些工作流编辑相关的功能装到ChatGPT里头去了。这块呢有帮助,但是帮助到底有多大,或者说是不是这种产品一出来,dify、N8N就死掉了?其实我觉得倒不会。因为呢,它这个里边只能使用ChatGPT自己的模型,你说我想在这个里边画一个流程,在里边使用Gemini、使用Grok,这都没戏。至于说调用外部工具的话,到目前为止应该也都是集成的ChatGPT里头的一些工具是可以调用的。你说我想非常自由的调用外部的大量的工具的话,虽然他说现在用MCP是可以挂上,但是应该没有那些已经积攒了很长时间的平台生态更好、自由度更大。所以呢,并不需要太担心说一下就把他们都干掉了。
但是呢,这个8分钟限时挑战还是值得掌声的。一位美女上来说:“来,我现在设置8分钟,我们要做很多很多事情。”其实咔嚓就把事情做完了,都是可以在ChatGPT里头就可以使用这些功能,就使用agent builder做出来的东西就可以跑,跑的还很漂亮。把所有的很复杂的功能做完了以后,居然还剩49秒,8分钟没有用完,确实是值回掌声。以后大家再去做发布会可以去挑战一下,但是呢,没练好别去。开发布会的时候,现场演示是非常非常紧张的,你平时练的好好的东西,上去都有可能出错,更别说在上面还设个时间了,那个绝对是给自己增加演示难度的。
再下一次掌声呢,是山姆·奥特曼宣布“Codex is into GA”,就是Codex现在已经正式发布了。前面我们不是做过视频了吗?讲这个Codex怎么又正式发布?所有这些东西发布呢,都是分Preview和正式发布两个版本,Preview已经过去了,现在我们正式发布了。因为Codex这个产品非常非常受欢迎,OpenAI内部也是大量的使用Codex去写代码,他们说现在Codex已经解决了他们70%的pull request。这样的一个产品,说现在正式的成为发行版本了,还是值得掌声的。这是一次高级别的掌声,GPT去统计的时候,还把掌声的级别也统计出来了。前面几次呢都是中等的掌声,8分钟极限挑战这是一个中高等的,真的是为这个小姑娘捏一把汗。下边坐的人呢,应该也都自己开过发布会,知道发布会有多紧张,在这个上面敢做一个8分钟计时挑战,确实是要佩服他的勇气,所以他的掌声要比前面发布那几个要高一些。真正的高级别的掌声是“Codex is into GA”。
再往后呢是Codex的演示。Codex的整场演示没有碰任何代码,都是靠打字、自然语言描述或者是语音描述来去实现的。它控制了摄像头云台,控制了灯光,而且呢把语音接进去,这个是OpenAI着重要去推广的东西,就是一定是自然语言的语音控制,不是打字,是要跟他说。所以他就跟他讲说:“你现在给我做一个这个,跟我做一个那个。”马上这个摄像头就开始发生变化了,而且是使用的现场设备,它直接把现场的一个索尼的电影摄像机的云台就控制起来,就开始转动了,这个是可以极大的提升演示效果的。
再往后呢,是Xbox手柄控制摄像头。Codex在片尾出这个字幕,做了一个彩蛋花絮吧,这个呢是有一个中高等级的掌声,因为他有参与感。虽然前面这个摄像头也是对着下面所有人的,但是现在一下出字幕了,把大家的名字打出来了,参与感上升,这个掌声是要大一些的。其实最后一次演示是翻车了,为什么呢?就是他把那个照片拍的黑乎乎的,他没有设置好曝光。你要去设置一个电影机去拍照的话,你的光圈、你的快门这些东西还是比较复杂的,他并没有把所有的参数都设对。但是最后这个名字字幕滚动的过程还是很帅的,所以这一块是赢得了大家的掌声。Codex的核心演示是什么?就是从头到尾没有碰代码,虽然它是个代码工具,但是呢没有看到任何一行代码被打进去,完完全全就是语音交互、Xbox的手柄交互、自然语言往里打字,这些东西就可以控制这么复杂的云台灯光,还可以跟ChatGPT一起工作,这个确实是很炫酷的东西。
再往后是山姆·奥特曼宣布GPT-5 Pro进入了API。大家注意,原来GPT-5在API里头,但GPT-5 Pro API是没法调用的。你要想使用GPT-5 Pro,必须是花20美金去定它这个Pro用户。现在说这个东西进入到API里去了,最高等级的掌声。大家对这个还是非常非常期待的,虽然这个模型很贵,它好像100万TOKEN的输入是十几美金,一百万TOKEN输出可能一百多美金。但是呢,大家对于这种非常高智能的模型可以通过API调用,还是抱有巨大的期望的。
Sora 2 Preview进入API,最高等级掌声。Sora 2是我们这几天在玩的视频生成模型,现在它已经进到API里去了,这个是大家所期待的。因为你原来在一个APP上或者在一个网页上,你控制它还是比较麻烦,必须是要进到API里头才可以进行精准控制。原来就是10秒钟一条,你现在就可以生成更长的视频、其他比例的视频,或者说做一些更复杂的搭配。你可以写一个完整的故事,通过API调用,可以让这些完整的故事顺序的去生成,这个就可以直接做成生产力工具了,原来那个东西是个社交工具。这是大家非常非常期待的一个功能。我已经去试过了,调用Sora 2 API生成了15秒钟的视频,花了我20美分,大概是这样的一个成本,还是非常非常有趣的。但是要注意,即使是调用API,它的控制也是很严格的。我上传了一张自己的照片,我说:“请按照这个照片去给我生成。”他说:“对不起,照片里头有人物,我是不可以给你干活的。”未来到底是如何把这东西用起来,如何让形象进入到许可范围内,如何把整套的系统能够跑起来,这个可能过一段时间我试一试,再跟大家录视频再跟大家讲。
后面Sora 2用于品牌电商、广告概念的这种展示,就是说Sora 2一旦变成API以后,你们都能拿它干什么。就是这玩意儿生产力工具了,可以干的东西很多了,又得到了一次中等规模的掌声。
结束谢幕肯定是最高等级掌声。50多分钟接近一个小时,七里咔嚓把这么多东西都扔上来,还是值得掌声的。
那刚才吊了半天胃口说,比“Wow时刻”还让人激动人心的是什么呢?必须是行业领袖的发布会才有这样的效果——股价上涨。你说OpenAI自己还没上市呢,谁的股价涨?这里头第一个涨的是AMD。AMD呢,虽然在整个的发布会里头没有被提名字,但是呢依然上涨了24%。这块的话回头再跟大家细细解读,山姆·奥特曼又玩了个骚操作,黄仁勋1,000亿美金投资OpenAI,OpenAI说一转头我去投资苏姿丰的AMD,去让AMD给我定制芯片,那蹭一下24%就涨上去了。
Figma涨了7%。因为在前面把应用集成到ChatGPT里头去的这个过程中,演示的就是Figma。说你看Figma现在已经集成进来了,我们可以在ChatGPT里头直接调用Figma的功能就可以干活了。相当于是Figma已经成为了ChatGPT的小程序了,直接涨了7%。
然后Expedia group涨了2%,这是机+酒业务嘛,机票加酒店。那你说在这里边,ChatGPT里头规划了半天行程,你总要有人去给你订机票订酒店嘛,Expedia group直接涨。
Coursera涨了8%。这是一个在线教育平台,人家上头直接问,说我现在想去学一下AI,我想去学一下大模型,就给我看看怎么学习一下,你有哪些课程适合。Coursera你给我推荐一下,而且我就可以直接在ChatGPT里头看Coursera的视频了,直接可以看他的这个课程了,这个涨了8%。
Uber涨了4%,它为什么能涨呢?我们现在可以直接在ChatGPT里头叫车了,涨4%。
DoorDash但是相当于美国的即时零售、外卖送餐的这样的一个项目,涨了4%。我们现在可以在ChatGPT里头说给我订一份煲仔饭回来,一会当当当敲门来了。当然对于美国来说,配送应该没有那么快,它不像在国内似的。
那你说有没有提了名字带不动的呢?也有。里头有一个公司呢,叫ZILLOW,是美国一个租房的网站。为什么带不动呢?因为正在被FTC起诉反垄断,就是你一旦在上面做广告了以后,它有排他条款在里头,现在正在被起诉。还有一个是Spotify,放音乐的。里边有一个案例,请给我做Spotify的一个播放列表。这个呢,第一个是Spotify的盘子比较大,就是这公司很大了;第二个呢,就是这个场景没选好,这是一个稍微失败一点的案例。大家觉得在ChatGPT里头去定制播放列表这件事呢,不是那么有趣,也没有那么挣钱,所以在这块上,这个股价基本上没动。
明白了吧?为什么只有行业老大提名字才有用?因为不是行业老大提了名字,股价不会上涨的,股市不会听这玩意的。所以OpenAI现在已经是行业老大了,证明这件事了。
那么验证一下我前面的结论吧:操作系统、入口、商业变现、全场景。这是第一个结论,OpenAI已经向操作系统前进了,它就是超级APP,它就是微信,它就是抖音,大家可以在里边做所有的事情了。OpenAI让应用通过SDK变成小程序,直接把自己集成ChatGPT里头去,所以这个野心已经彻底暴露了。以后它就是独立的操作系统,没有什么iOS,没有安卓,没有这些人的事,这就属于赤裸裸的直接竞争了。
第二个,自然语言、语音交互,这是最核心的。虽然有编程,但是从头到尾没动代码,所有的这些交互都是用自然语言交互的。即使是Codex这样的编程模型,也都是用自然语言交互,所有做出来的项目都是可以语音沟通的。而且人家还发布了实时语音的大模型的API,而且这个API还是高速廉价版本,要比正常的这种满血版本要便宜很多,速度还很快,所以大家赶快去使用吧。山姆·奥特曼在里头讲的,说我不认为未来很多的程序是需要代码去写的,我觉得自然语言和语音交互才是未来。这个野心背后是什么?他们的硬件马上要上来了,山姆·奥特曼的整套的硬件,他的硬件应该不是一个硬件,而是一套硬件,自然语言语音交互的一套硬件。现在OpenAI已经向果链企业下单了,我们很快就可以看到这套硬件到底长什么样,以及如何跟人类进行交互和沟通。
最后,全栈、全生态、全模态都在OpenAI。我们可以去做SDK,我们有MCP,我们有agent builder,你可以在里边去画流程图,也可以Codex直接去写代码,还可以处理语音的、图片的、视频的,我们所有东西全都有。这个就是真正老大要干的活,什么都得干。像其他的公司呢,可能大多是只做其中的一部分,比如像Anthropic,他就没有办法把从上到下所有东西都干一遍。现在能够跟着跑的也就是谷歌,从上到下都在做,虽然可能好多的地方还做的没有那么好,但是从上到下都有。国内的这些平台也都被打样了,说你们想去追OpenAI吗?你看看从上到下你是不是都坐上了?这个是一个新的方向。
最后,咱们要行动起来。不能山姆·奥特曼在上头手舞足蹈了半天,我们不知道该干嘛,那个就没有意思了。咱们该干嘛呢?
第一个,学习一下山姆·奥特曼发布会的组织形式,人家发布会怎么开的,这些掌声都是怎么来的。肯定会有人学,你看雷军,一开始是穿黑色的长袖t恤的“雷布斯”,后来开始穿小西装“雷斯克”,再往后呢,发布新片的时候穿了个皮衣,学谁自己去想。未来什么时候就可以穿这种宽松的套头衫,咱们再看。
通过SDK登录ChatGPT,这个是现在大家要赶快行动起来的,谁都别慢了。而且这个里头可能还有一件事大家想不到的是什么?抢注域名。因为当时在互联网刚开始的时候,大家都去抢注域名,而现在我们要在ChatGPT里头去呼叫、起一个应用的时候靠的是什么?不是域名,就是它的名字。比如说你在里头Coursera里边去讲“开”,或者是其他的一些应用,就直接写名字,写完名字以后就会自动被识别成某一个应用,就开始去干活了。这个名字是要去抢注的,因为他没有办法控制重不重名的问题,所以这块大家要赶快动起来,先做一个能用的东西,把名字占住,等以后其他人说“我们也想用这个名字”,花钱买呗。所以这是一个可能马上能去做的事情。
再往后一件事,所有厂商一定要提供友好的SDK,普通用户都可以玩起来了。这一次他们展示了怎么去玩会场灯光,怎么去玩索尼的电影机和电影云台。以后如果大疆出SDK的话,我肯定是愿意在Codex上去玩耍一下的。而且以后出了这些SDK的话,你的产品一定会卖得更好。原来这些SDK出来以后,只有专业厂商才能用得起来,普通用户是用不起来了。但是现在有了Codex,有了这些AI编程工具了,平权了,每一个人都可以拿着这些产品自己去编个程序,去稍微收拾收拾,这个门槛一下降低了很多。当然除了像大疆这样的拍摄设备或者索尼这样的拍摄设备之外,还有很多东西,它的SDK的使用率、使用量一下就会上升上去。原来都是系统集成商或者是代理商会去用这些SDK,而现在每一个普通用户都会去用。这是什么东西?智能家居。苹果折腾了半天Homekit,谷歌也折腾了半天,小米也折腾了半天这种智能家居的这种网关、智能家居的这些SDK,现在好了,有Codex以后通通都可以跑了。整个生态的竞争会进入下一个阶段。原来比如大疆跟其他的竞争,是竞争我们的图像参数有多好,竞争我的价格怎么样,竞争这个产品的使用有多方便,做的有多轻。以后的话就是生态竞争,谁家的SDK做得好,普通用户可以在Codex的帮助下可以玩出花样来,以后就会变成这样了。
再往后,抓紧把语音交互加到系统中去。如果原来你的系统没有做语音交互的话,赶快做进去。因为OpenAI操作系统的新硬件平台应该距离我们已经不远了。如果我们现在把自己的系统加上语音了,交互的还很好,那么OpenAI再去发布他们的硬件的时候,就有可能你的产品会成为发布会上展示的那个产品。这一次你想,OpenAI点了谁的名字,谁的股价就在涨,这就属于是典型的榜样力量。如果你现在就把这个产品做好了,未来就有可能蹭上这一波巨大的流量。像我以前有一些朋友,他们在iPhone、iPad早期发布的时候,做的产品做的特别好,让苹果直接在发布会上给人展示了,那真的是泼天的流量和财富就砸下来了。所以现在大家赶快动手,把这个语音加到应用里去。
最后一项,Sora 2的API,赶快玩耍起来。这个还是非常非常好玩的,15秒视频,0.2美金,价格还可以接受吧。大家就可以写出脚本来,顺序的让它把这个内容都生成出来,做出这种几分钟的短片出来都是OK的。
好,这个故事就跟大家讲到这里,感谢大家收听,请帮忙点赞、点小铃铛,参加DISCORD讨论群。也欢迎有兴趣、有能力的朋友加入我们的付费频道,再见。
RSS