一年亏损50亿美元,OpenAI压力山大:再不推出GPT5,可能没有机会了——GPT-4面临Anthropic Claude 3.5 Sonnet和Meta的LLama 3.1 405b的挑战
7 月 28
AIGC Aceropic Cloud 3.5 Sonnet, API销售, ChatGPT, GPT-4 Mini, GPT-5发布, GPT5, GT5推出, iPhone 16发布会, Microsoft OpenAI合作, OpenAI, OpenAI Plus, OpenAI估值, OpenAI压力, OpenAI发展策略, Redit, Steal the home, 上市计划, 云服务成本, 云计算, 亚马逊因素, 人员成本, 估值, 商业模式创新, 大模型之争, 小模型调试, 市场份额, 市场机制, 市场竞争分析., 市场策略, 市场验证, 开放AI生态系统, 开源模型, 微调与RAG, 微调免费, 微软, 微软销售策略, 投资风险, 拉玛3.1405B, 数据处理, 新兴竞争者, 新技术应用, 未来科技趋势, 核心竞争力, 梅塔, 模型训练, 特斯拉案例, 研发经费, 竞争力提升, 竞争激烈, 端到端语言训练模型, 苹果, 融资需求, 行业前景, 行业开拓, 行业新趋势, 行业规范, 行业震荡, 计算成本, 谷歌, 谷歌I/O, 高性能计算, 高质量训练数据 一年亏损50亿美元,OpenAI压力山大:再不推出GPT5,可能没有机会了——GPT-4面临Anthropic Claude 3.5 Sonnet和Meta的LLama 3.1 405b的挑战已关闭评论
GPT5如果再不出的话,可能就没有机会了。大家好,这里是老范讲故事的YOUT5频道。今天咱们来讲一讲OpenAI现在身上的压力到底有多大。再不出GPT5,可能真的要出事儿了,因为前面吹过的牛实在太多了,特别是Sola这样的模型,号称可以直接生成长的视频出来,到现在已经半年了,还没有真正拿出来,只是每个月放出几个视频而已。而其他各个公司,按照Sora方向做的产品,已经都开始在公众测试了,这对他们来说一定是巨大的压力。
前一段时间发布的Anthropic Claude 3.5 Sonnet,也把压力给到了OpenAI,因为这个模型的效果已经非常好,而且极其便宜。更不要说昨天刚刚发布的Llama3.1405B这样的一个开源模型。前面咱们讲的Anthropic的模型还是闭源的,而Llama可是个开源模型。405B的话,在各个层次上,都赶超了OpenAI的Chat GPT-4。老大的位置有可能会丧失。
大家注意,OpenAI这样的一家公司,可能不会轰然倒下,但对于一个领域的开拓者来说,丢失老大的位置是非常非常可悲的,基本上跟死掉了没有太大的区别。所以现在对于OpenAI来说,他们最害怕的就是把老大的位置丢了。
目前的应对方式也很怪,头一天先发了GPT-4欧MINI,第二天人家Llama3.1405B就开始偷跑。是谁在偷谁的家?我们现在看到了一个叫互相偷家的故事。
就是每一边都是在对方最强大的地方打了一根钉子。GPT-4o mini是打的Llama这样的小模型。原来很多人图便宜啊,我要用这种8币的模型,用70币的模型去进行微调,去进行各种各样的定制化开发,以后满足特定场景需求。那么好了,我现在推出GPT-4o mini啊,把这个市场抢过来。这边一个嘴巴子扇过去了,那头一看说:“哎,还有这事呢,老师来,我给你上个大的。你们原来不是说大模型厉害吗?PPT4O厉害,对吧?我直接给你上一个拉嘛,3.1405B超越你的碳模型。”所以叫相互偷家。
咱们还记得谷歌I/O开始的前一天,OpenAI在干嘛吗?啊,他发布了GPT-4o 端到端的语言训练模型。其实到现在为止,我们依然没有看到端到端的语言模型。现在看到的GPT-4o 依然是啊,要给它进行语音识别,处理完了以后,再给我们念回来的一个过程。这个端到端的模型,包括加上视觉的模型这一部分,现在也没拿出来。但是,就是要赶在谷歌I/O之前发,提前一天,导致了谷歌I/O上发布的Gemini 1.5 Flash,本来是做类似事情的模型一下就显得不香了,对吧?
那么这一次呢,我们看到的是非常神奇的GPT-4o mini,应该是啊,计划好了进行发布。阿克伯格那边说:“哎,我们原来虽然没计划好,但是咱们表演一个偷家吧,直接把磁力链放到Reddit里头,就直接偷跑出来了。”所以这一次呢,应该算是OpenAI被梅塔抄了后路了。
OpenAI GPT-4o mini 这样的一个模型,最初想去偷梅塔拉嘛的,后加的时候还有后续的动作出来。这个后续动作是什么呢?免费微调啊。什么意思呢?就是我们发布的这种预训练模型,如果想让它按照你所期望的方式去工作,是需要去微调的。微调这种模型本身是比较贵的,原来 GPT3.5 和 GPT4 都是允许微调的。
这个怎么干呢?就是说你上传一个文件上去,这个文件就是我说什么你回答什么,大概是这样的一个格式。当你把这个文件上传上去以后,就可以请求这个文件给你微调一个版本出来。那么这个版本的模型,是只有你自己能用的。原来也有这样的功能,现在到 GPT-4o mini 这儿,我们不是要抢Llama 38B 这样的生意吗?来,微调免费了,至少在一段时间内,微调是限时免费的。
本身这种小模型的微调就比较便宜,GPT-4o mini 就算是过完了限面,开始收费了。它的调试成本也是相对来说比较低的,100 万 TOKEN 的调试可能是 3 美金还是 5 美金。但是微调以后的那个模型,你再去使用就要贵一些了。GPT-4o mini 正常的输出 100 万 TOKEN 是 60 美分,而微调过的版本,因为这个版本只给你一个人用或者只给你一个团队来使用,这个成本就都要你自己来承担,100 万 TOKEN 是 1.2 美金,价格翻了一倍。这就是直接放出来的价格,这就是要抄家了。
大家知道Llama3这种东西的微调成本是多少吗?你说自己有显卡啊,或者说我用谷歌的云上,谷歌云上是可以薅羊毛的啊。你是可以免费开一个云主机,快速的调完了把它关掉,这个过程是不用付钱的。咱们不去参考这个价格,咱们看看gather上的价格是什么样的啊。
Llama3.18B的模型啊,咱们不要去调那个405B啊,那个东西很贵的。咱们调这个8B的模型,100万TOKEN,10次以内的迭代。因为你微调的时候,它会让你选你到底是调几次,10次以内的迭代,5美金啊,基本上是在同样的价格。所以我也在猜测GPT-4o mini的大小,应该也就是8币9币这样的一个程度,否则的话,这个价格是没法去比对的。
因为Llama3.18币啊,输出100万TOKEN的价格大概是0.9美金,微调100万TOKEN的价格是5美金。那GPT四O Mini输出100万TOKEN的价格是0.6美金,微调的话是3美金。当然现在是限免啊。
稍微在这里讲一下微调跟RAG之间的差别。以前我们讲了很多跟RAG自我、本地知识库相关的这种知识。那么什么时候上微调,什么时候上RAG呢?举一个简单案例吧,就是现在来了一个新的毕业生。微调相当于什么呢?叫入职培训。你来了以后,我先给你做个入职培训,看到领导要鞠躬,看到客户要说,先说你好,然后呢再给你一个入职手册,先把这东西都背下来。你以后就按照这个方式去工作。微调了以后,这样的版本。
我们经过了入职培训以后的版本。你问他相关的问题,就是入职手册写过的问题,他都会对答如流,按对入职手册回答给你,没有任何问题。而且呢,按照你要求的格式来输出。看见领导鞠躬,他会干的。
微调有一个问题是什么呢?就是超出手册的东西就没有了,这就是微调干的活。那你说RAG是干什么呢?RAG相当于给你发了一本字典,你随时需要查,随时可以查。说我现在需要查一下这个问题怎么办?那个问题怎么办?你随时在字典里去查。
我们一个新员工入职了,比如某位同学大学毕业,到公司上班来了,入职培训要做,对吧?字典也要发。这就是微调跟RAG之间的关系。RAG其实对于OpenAI来说,对于Llama来说没有太大的区别,大家都可以做。但是呢,微调原来GPT这块是要贵很多的,这个模型也贵。你微调了以后,整个微调的过程也都相对来说比较贵。
现在,OpenAI就在这一块跟Llama彻底找齐了。你说我们去调那个405B去,其实意义不大。一般微调就是调小模型,你去找一个大模型出来调,这实在太贵了。咱们还是以刚才这个新员工入职的过程来讲微调。你去找一个应届毕业生,让他做新员工入职培训,这个效果是相对来说比较好的。
对,我找猎头公司,从别的公司挖一大牛回来,或者我从其他公司挖一CEO回来,让他坐在这给新员工培训,这不扯淡吗?就这样,微调大模型的效果就是这样,又费劲效果还未必好。
所以,一般微调都是调小的。那么,OpenAI到底挣不挣钱呢?今天看了一些数据,OpenAI是真的不挣钱啊。前面还有人讲说OpenAI的收入已经很厉害了,今年可以达到30亿美金了。30亿美金的收入对于很多公司来说,是完全可望而不可及的一个数字。作为一个新创建没几年的公司,能够入账30亿美金的收入,这个非常厉害。
但是,挣的多,人家花的更多。花了多少钱呢?因为OpenAI不是一个上市公司,所以大家只能去根据各种蛛丝马迹去算它到底花了多少钱。基本上算下来的,它的成本大概是80亿美金,所以它一年亏50亿美金。
这80亿美金怎么算出来的呢?每年交给微软的钱就是去买算力的钱,大概是40亿。这个是微软内部的一些人,或者说了解OpenAI向微软付款的一些内部员工透露的,这个数基本认为是靠谱。第二块是什么呢?就是OpenAI还需要购买很多数据,比如说上Reddit里去买数据,包括一些其他的数据集,去购买和清洗加工,这个钱他是要去花的。
还有一块的钱是什么呢?人家那么多新员工,对吧?现在有1500人了,而且还在快速扩张,现在还有200个职位开着,准备再接着招人呢,这个也是一大笔钱。所以呢,他现在每年的成本大概在80亿美金左右,而且这个成本还在快速上升之中。你想,他还在疯狂的招人进来,前面还吹了那么多牛皮,还没有抹上呢。你要想把前面吹的牛皮补上,要干嘛?接着开足马力训练大模型啊。
Scaling啊,scaling low啊,接着跑啊。我进一步扩大模型的规模,进一步整更多的数据,然后整更多的人回来。而且现在整个行业已经热起来了啊,他这一千几百口的人,那一定得给到比较高的薪水,比较高的这种收益才可以啊,要不然别人会挖人的。全世界都在盯着他的人吧,哪怕是一个街边扫地的。你说我在OpenAI扫过地,那其他人说我把你请回来,是不是多给你点钱啊?OpenAI的人员成本一定是不低的。
微软呢,其实已经算是对OpenAI很好了啊,为什么呢?就是微软给OpenAI机房的价格应该是一个成本价,并没有真正的按照微软云的那种啊,对外报价去找OpenAI收钱,已经算是非常非常支持了。销售呢,这个没办法,特别是B端销售,大家都有KPI,谁也不能让着谁。所以微软在B端销售上,包括在Windows客户端的Copilot的这种产品的竞争上,肯定是跟OpenAI有一定的约定的啊。B端销售各打各的,你要能卖掉是你的,我要能卖掉是我的,Windows客户端你别碰啊,这个是我的。
所以现在OpenAI只有Mac版的客户端,没有Windows版的客户端啊,那边是留给微软自己家亲儿子Copilot的。作为一个公司来说呢,微软对OpenAI已经是非常非常好了啊,那么对比起Anthropic,OpenAI算是好的。这个玩意叫不患寡而患不均,那你说Anthropic后边是谁?是亚马逊。
微软对OpenAI好,这一定要有对比,那就要对比亚马逊对Anceropic。推理成本肯定是不低的,而且Anthropic其实并没有跑那么多的大模型。新的模型训练、新的模型的推理没有做这么多,而且用户量也没有OpenAI高。可是呢,以亚马逊找Asopic收的钱是不少的。
另外一个Anthropic,如果通过亚马逊云赚到了钱,比如说我把这个产品卖掉了一些弊端的用户买了我的产品,亚马逊是要在里边抽成的。所以Anthropic跟OpenAI比起来,属于过得更凄惨一点。Anthropic收入的话,大概是OpenAI的1/5。刚才我们讲了OpenAI是30亿美金,它大概有个五六亿美金的样子吧。
因为都不是上市公司,所以大家都不会说这个事。亏损也亏,他亏多少呢?亏大概是OpenAI的一半。OpenAI大概亏50亿美金,他亏25亿美金,就是这样的一个比例。所以前面我们也讲过,Isopic现在也快玩不下去了,玩不下去的话,亚马逊可以落袋为安了。
我记得以前有一个故事,电影院想去卖饮料,怎么能够把饮料卖得更多一些呢?我把空调开的小一点,让电影院里稍微热一点,这样我就可以多卖一些饮料出去。看看亚马逊跟Anceropic之间的故事,是不是有点像这个?当然了,OpenAI现在也很渴,也需要去买饮料喝了,像微软爸爸去买,现在山姆奥特曼的应该正在努力地找钱。
愿意给钱的人肯定不少啊,这个不用担心。毕竟是开拓一个新领域里边的老大,那这个时候肯定很多人都愿意给钱。那你说愿意给钱不就没事了吗?拿着钱接着烧呗。不那么容易啊,为什么?因为你要问微软同不同意。微软占49%,给了130多亿美金进来了。你现在再找,说我让苹果给钱啊,苹果愿意给,那微软说不行啊,这个必须排他。
像我们以前签很多这样的协议,进去的时候,特别是我成为大股东的时候,一定会有排他条款的,对吧?你让我的竞争对手进去,这事不行啊。微软就是说,我虽然愿意看着你努力成长,但我也更愿意看到你落到我的口袋里,在我这再多买些饮料。我说算了,我卖身给你得了,这个也是微软乐见其成的事情。
所以并不是谁的钱他都可以去拿的。一些微软的竞争对手,比如谷歌,比如说苹果是愿意给钱的时候,他就需要做微软的工作,说求求你让他们进来吧,他就会变成这样。那么下一个问题是什么呢?到底估值是什么样的?估值涨到多少,这个事微软才能乐意啊?其实还是跟微软有关。
现在OpenAI的估值是860亿美金,这个估值是OpenAI上一次进行内部的股票兑现的时候,或者说一些内部员工股票变现的时候的估值,并不是一个正式的估值。正式的估值的话,我觉得他现在有个大概两三百亿应该是合理的。嫁一个人进来,到底按什么样的估值进去,这个就很难去平衡。为什么?因为这个数已经很大了。嫁一个人,你说我为什么进去,投资这样的公司的目的。
一定是说你以后能够长得更高啊。然后呢,你去上市,我能够啊,多少倍啊,能够退出,至少是3-5倍能够退出,因为这么高的估值嘛,承担这么高的风险,一定希望能够尽快的按更高的倍数退出。现在已经是两三千亿了,你再往上翻这个数就不好翻了。而且如果真的是几千亿的估值,又拿了钱了,你上市怎么办?股市能不能支撑得住这样的公司?几千亿美金的公司上市,还是有一些难度的。
像AM上去,也就是几百亿上去,虽然上去了以后快速在增长,但是你说我直接就是按照几千亿,没准这一轮再上去了以后,大家就希望他上1万亿美金去上市。这个纽交所也好,纳萨克也好,虽然是注册制,只要是你提交的申请文件符合格式,你就可以去上市。但是这些地方啊,这些基金们啊,因为所有的美股大量的都是基金盘,很多基金经理会去看你这个产品到底值不值这么多钱,所以这个事对于所有人来说都是很有压力的。
那么现在怎么办呢?比当前的估值直接上市也许就是唯一的解决方案了。坚持到年底,Open I的业绩还是有爆发的可能性的。于现在,大家虽然预估他一年挣三十几亿美金,这事儿是怎么算出来的呢?是他每个月大概能挣到两点几亿美金,这两点几亿美金里头大概2亿美金,是他去卖那个20美金一个月的Plus的费用,在七八千万美金吧,是卖API的费用啊。他是这样来算的。那么,为什么到年底的时候会业绩大爆发呢?咱们想一想,9月份会发生什么大事情?9月份iPhone 16发布。
iPhone 16如果发布了,虽然它的成本会进一步上升,因为所有用iPhone的至少在国外吧,就可以去访问GPT-4了。但是,另外一方面,这些用户会大批量地转换成OpenAI Plus用户。那么它的收入也会爆炸式增长一下。所以到今年年底,还可以再大涨一波。
苹果算是OpenAI的一个救命稻草。如果它能够坚持到年底,数据再大涨一波,为所有的股民展示一下未来美好的前景,然后直接去上市,这个事还是有得救的。现在行业的心态肯定也是很矛盾的,竞争跟追赶这是必须的。甭管是谷歌、Anthropic还是Meta,都是在努力的竞争与追赶。但是谁也承担不起一个后果,就是老大倒下。
这是一个全新的行业,在全新的行业里头,一旦老大倒了,对于整个行业来说都是巨大的打击。每次开新行业的时候,有几件事是比较害怕的。第一是老大废了,一旦老大废了以后,就相当于是老大证明了跑得最快的人没跑出来,拼命往前跑,跑到头上是一条死路,撞在墙上,磕地上了。那后边紧追不舍的人该咋办,这事是很危险的。
另外一个是什么呢,就是老大上市了。上市了以后,发现业绩一般,因为大家一般在上市之前会冲业绩嘛。上市了以后,你要公布财报,很多东西变成公开透明了。那么下面的人也会觉得很危险。这就是一个新行业的宿命,至少要验证行业有未来。在这之前,老大是不能倒下的。如果说没有验证,直接就趴下了。
那么,整个行业都很麻烦啊。开天辟地的这种新行业,肯定都是非常困难的。这个呢,分几种情况。
第一种情况叫大企业开创新市场。举一个案例,比如说亚马逊,开创云计算这个新市场。这就是大企业开创新市场。但是,亚马逊也很痛苦。在开始的很长一段时间里,顶着非常大的压力,再往前走,也是用了好几年的时间,才慢慢地验证了说,云计算这个市场是一个真正的方向,大家要去向这个方向前进。这是大企业开创新方向。
当然,也有走得不是那么好的例子。比如说,梅塔做的梅塔Wars,原来叫Facebook,后来改名叫梅塔。他去做元宇宙这件事呢,就不是那么好。一直到现在,虽然名字还没改回来,但他得挂在那,挂上了还没有死掉。可是,他挂在那,所有人看着。在这么大一只半死不活的尸体挂在这个枝头上,所有人在想去做元宇宙的时候,都要稍微掂量掂量。而且,现在这个枝头上,还挂了另外一颗叫Vision Pro的东西,也挂在那了。在剩下的人就在这看着,在下面驻足观望,再也没有人敢往上冲了。这就是大企业开创的两种结果:坚持到底能够成功,或者跨在上面挂着。
那么,小公司开创新天地是什么样的呢?比如说,特斯拉、SpaceX,都是一开始的小公司。马斯克冲上来说,我要开创新天地了,开创一个新赛道出来。那是什么?就是耐心的,经历很长时间的亏损,十几年的亏损,不停地融钱,所有人都不看好,独自前行,慢慢把这个项目做起来。那你说,再举个失败的例子。
失败的例子没有啊。那么是不是小企业开创新天地就都能成功?错了,你只能看到成功的,剩下的全都不见了。我们没有机会看到,所以小企业开创新天地,我们只能看到幸存者。这是一种幸存者偏差。那你说一群人一拥而上,大家看好了方向,大家全上。这种事呢,通常是发生在商业模式创新上。如果是技术创新的话,这个机会不是特别大。
这种方式呢,也有成功的。你比如像国内的千团大战,最后就跑出了像美团这样的公司;滴滴共享单车大战,最后也是跑出来一些结果,是有能成功的案例的。但是呢,也有一些最后失败的,比如像刚才咱们讲的VR,所有人都冲,最后什么也没剩下。
现在的OpenAI呢,有点儿是骑虎难下的状态。按道理说呢,它应该是小公司,独自慢慢发展。但是它一下把这个热度炒太高了,现在搞成什么了?现在搞成一群人一拥而上了。这种乱拳打死老师傅的状态呢,一定是最危险的。
所以为了稳住阵脚,现在OpenAI必须拿出重量级的拳头产品出来,也就是咱们开篇时候讲的GPT-5,一定要拿出这种产品。如果在今年年底之前GPT-5还出不来的话,它的老大位置真的是危险了。而且它一旦倒下的话,可能整个行业都要至少颤三颤。不能说整个行业会为它陪葬,但颤抖一下是跑不了的。
好,这一期就讲到这里。感谢大家收听,请帮忙点赞,点小铃铛,参加Discord讨论群。也欢迎有兴趣有能力的朋友加入我们的付费频道,再见。