一年亏损50亿美元,OpenAI压力山大:再不推出GPT5,可能没有机会了——GPT-4面临Anthropic Claude 3.5 Sonnet和Meta的LLama 3.1 405b的挑战
GPT5如果再不出的话,可能就没有机会了。大家好,这里是老范讲故事的YOUT5频道。今天咱们来讲一讲OpenAI现在身上的压力到底有多大。再不出GPT5,可能真的要出事儿了,因为前面吹过的牛实在太多了,特别是Sola这样的模型,号称可以直接生成长的视频出来,到现在已经半年了,还没有真正拿出来,只是每个月放出几个视频而已。而其他各个公司,按照Sora方向做的产品,已经都开始在公众测试了,这对他们来说一定是巨大的压力。
前一段时间发布的Anthropic Claude 3.5 Sonnet,也把压力给到了OpenAI,因为这个模型的效果已经非常好,而且极其便宜。更不要说昨天刚刚发布的Llama3.1405B这样的一个开源模型。前面咱们讲的Anthropic的模型还是闭源的,而Llama可是个开源模型。405B的话,在各个层次上,都赶超了OpenAI的Chat GPT-4。老大的位置有可能会丧失。
大家注意,OpenAI这样的一家公司,可能不会轰然倒下,但对于一个领域的开拓者来说,丢失老大的位置是非常非常可悲的,基本上跟死掉了没有太大的区别。所以现在对于OpenAI来说,他们最害怕的就是把老大的位置丢了。
目前的应对方式也很怪,头一天先发了GPT-4欧MINI,第二天人家Llama3.1405B就开始偷跑。是谁在偷谁的家?我们现在看到了一个叫互相偷家的故事。
就是每一边都是在对方最强大的地方打了一根钉子。GPT-4o mini是打的Llama这样的小模型。原来很多人图便宜啊,我要用这种8币的模型,用70币的模型去进行微调,去进行各种各样的定制化开发,以后满足特定场景需求。那么好了,我现在推出GPT-4o mini啊,把这个市场抢过来。这边一个嘴巴子扇过去了,那头一看说:“哎,还有这事呢,老师来,我给你上个大的。你们原来不是说大模型厉害吗?PPT4O厉害,对吧?我直接给你上一个拉嘛,3.1405B超越你的碳模型。”所以叫相互偷家。
咱们还记得谷歌I/O开始的前一天,OpenAI在干嘛吗?啊,他发布了GPT-4o 端到端的语言训练模型。其实到现在为止,我们依然没有看到端到端的语言模型。现在看到的GPT-4o 依然是啊,要给它进行语音识别,处理完了以后,再给我们念回来的一个过程。这个端到端的模型,包括加上视觉的模型这一部分,现在也没拿出来。但是,就是要赶在谷歌I/O之前发,提前一天,导致了谷歌I/O上发布的Gemini 1.5 Flash,本来是做类似事情的模型一下就显得不香了,对吧?
那么这一次呢,我们看到的是非常神奇的GPT-4o mini,应该是啊,计划好了进行发布。阿克伯格那边说:“哎,我们原来虽然没计划好,但是咱们表演一个偷家吧,直接把磁力链放到Reddit里头,就直接偷跑出来了。”所以这一次呢,应该算是OpenAI被梅塔抄了后路了。
OpenAI GPT-4o mini 这样的一个模型,最初想去偷梅塔拉嘛的,后加的时候还有后续的动作出来。这个后续动作是什么呢?免费微调啊。什么意思呢?就是我们发布的这种预训练模型,如果想让它按照你所期望的方式去工作,是需要去微调的。微调这种模型本身是比较贵的,原来 GPT3.5 和 GPT4 都是允许微调的。
这个怎么干呢?就是说你上传一个文件上去,这个文件就是我说什么你回答什么,大概是这样的一个格式。当你把这个文件上传上去以后,就可以请求这个文件给你微调一个版本出来。那么这个版本的模型,是只有你自己能用的。原来也有这样的功能,现在到 GPT-4o mini 这儿,我们不是要抢Llama 38B 这样的生意吗?来,微调免费了,至少在一段时间内,微调是限时免费的。
本身这种小模型的微调就比较便宜,GPT-4o mini 就算是过完了限面,开始收费了。它的调试成本也是相对来说比较低的,100 万 TOKEN 的调试可能是 3 美金还是 5 美金。但是微调以后的那个模型,你再去使用就要贵一些了。GPT-4o mini 正常的输出 100 万 TOKEN 是 60 美分,而微调过的版本,因为这个版本只给你一个人用或者只给你一个团队来使用,这个成本就都要你自己来承担,100 万 TOKEN 是 1.2 美金,价格翻了一倍。这就是直接放出来的价格,这就是要抄家了。
大家知道Llama3这种东西的微调成本是多少吗?你说自己有显卡啊,或者说我用谷歌的云上,谷歌云上是可以薅羊毛的啊。你是可以免费开一个云主机,快速的调完了把它关掉,这个过程是不用付钱的。咱们不去参考这个价格,咱们看看gather上的价格是什么样的啊。
Llama3.18B的模型啊,咱们不要去调那个405B啊,那个东西很贵的。咱们调这个8B的模型,100万TOKEN,10次以内的迭代。因为你微调的时候,它会让你选你到底是调几次,10次以内的迭代,5美金啊,基本上是在同样的价格。所以我也在猜测GPT-4o mini的大小,应该也就是8币9币这样的一个程度,否则的话,这个价格是没法去比对的。
因为Llama3.18币啊,输出100万TOKEN的价格大概是0.9美金,微调100万TOKEN的价格是5美金。那GPT四O Mini输出100万TOKEN的价格是0.6美金,微调的话是3美金。当然现在是限免啊。
稍微在这里讲一下微调跟RAG之间的差别。以前我们讲了很多跟RAG自我、本地知识库相关的这种知识。那么什么时候上微调,什么时候上RAG呢?举一个简单案例吧,就是现在来了一个新的毕业生。微调相当于什么呢?叫入职培训。你来了以后,我先给你做个入职培训,看到领导要鞠躬,看到客户要说,先说你好,然后呢再给你一个入职手册,先把这东西都背下来。你以后就按照这个方式去工作。微调了以后,这样的版本。
我们经过了入职培训以后的版本。你问他相关的问题,就是入职手册写过的问题,他都会对答如流,按对入职手册回答给你,没有任何问题。而且呢,按照你要求的格式来输出。看见领导鞠躬,他会干的。
微调有一个问题是什么呢?就是超出手册的东西就没有了,这就是微调干的活。那你说RAG是干什么呢?RAG相当于给你发了一本字典,你随时需要查,随时可以查。说我现在需要查一下这个问题怎么办?那个问题怎么办?你随时在字典里去查。
我们一个新员工入职了,比如某位同学大学毕业,到公司上班来了,入职培训要做,对吧?字典也要发。这就是微调跟RAG之间的关系。RAG其实对于OpenAI来说,对于Llama来说没有太大的区别,大家都可以做。但是呢,微调原来GPT这块是要贵很多的,这个模型也贵。你微调了以后,整个微调的过程也都相对来说比较贵。
现在,OpenAI就在这一块跟Llama彻底找齐了。你说我们去调那个405B去,其实意义不大。一般微调就是调小模型,你去找一个大模型出来调,这实在太贵了。咱们还是以刚才这个新员工入职的过程来讲微调。你去找一个应届毕业生,让他做新员工入职培训,这个效果是相对来说比较好的。
对,我找猎头公司,从别的公司挖一大牛回来,或者我从其他公司挖一CEO回来,让他坐在这给新员工培训,这不扯淡吗?就这样,微调大模型的效果就是这样,又费劲效果还未必好。
所以,一般微调都是调小的。那么,OpenAI到底挣不挣钱呢?今天看了一些数据,OpenAI是真的不挣钱啊。前面还有人讲说OpenAI的收入已经很厉害了,今年可以达到30亿美金了。30亿美金的收入对于很多公司来说,是完全可望而不可及的一个数字。作为一个新创建没几年的公司,能够入账30亿美金的收入,这个非常厉害。
但是,挣的多,人家花的更多。花了多少钱呢?因为OpenAI不是一个上市公司,所以大家只能去根据各种蛛丝马迹去算它到底花了多少钱。基本上算下来的,它的成本大概是80亿美金,所以它一年亏50亿美金。
这80亿美金怎么算出来的呢?每年交给微软的钱就是去买算力的钱,大概是40亿。这个是微软内部的一些人,或者说了解OpenAI向微软付款的一些内部员工透露的,这个数基本认为是靠谱。第二块是什么呢?就是OpenAI还需要购买很多数据,比如说上Reddit里去买数据,包括一些其他的数据集,去购买和清洗加工,这个钱他是要去花的。
还有一块的钱是什么呢?人家那么多新员工,对吧?现在有1500人了,而且还在快速扩张,现在还有200个职位开着,准备再接着招人呢,这个也是一大笔钱。所以呢,他现在每年的成本大概在80亿美金左右,而且这个成本还在快速上升之中。你想,他还在疯狂的招人进来,前面还吹了那么多牛皮,还没有抹上呢。你要想把前面吹的牛皮补上,要干嘛?接着开足马力训练大模型啊。
Scaling啊,scaling low啊,接着跑啊。我进一步扩大模型的规模,进一步整更多的数据,然后整更多的人回来。而且现在整个行业已经热起来了啊,他这一千几百口的人,那一定得给到比较高的薪水,比较高的这种收益才可以啊,要不然别人会挖人的。全世界都在盯着他的人吧,哪怕是一个街边扫地的。你说我在OpenAI扫过地,那其他人说我把你请回来,是不是多给你点钱啊?OpenAI的人员成本一定是不低的。
微软呢,其实已经算是对OpenAI很好了啊,为什么呢?就是微软给OpenAI机房的价格应该是一个成本价,并没有真正的按照微软云的那种啊,对外报价去找OpenAI收钱,已经算是非常非常支持了。销售呢,这个没办法,特别是B端销售,大家都有KPI,谁也不能让着谁。所以微软在B端销售上,包括在Windows客户端的Copilot的这种产品的竞争上,肯定是跟OpenAI有一定的约定的啊。B端销售各打各的,你要能卖掉是你的,我要能卖掉是我的,Windows客户端你别碰啊,这个是我的。
所以现在OpenAI只有Mac版的客户端,没有Windows版的客户端啊,那边是留给微软自己家亲儿子Copilot的。作为一个公司来说呢,微软对OpenAI已经是非常非常好了啊,那么对比起Anthropic,OpenAI算是好的。这个玩意叫不患寡而患不均,那你说Anthropic后边是谁?是亚马逊。
微软对OpenAI好,这一定要有对比,那就要对比亚马逊对Anceropic。推理成本肯定是不低的,而且Anthropic其实并没有跑那么多的大模型。新的模型训练、新的模型的推理没有做这么多,而且用户量也没有OpenAI高。可是呢,以亚马逊找Asopic收的钱是不少的。
另外一个Anthropic,如果通过亚马逊云赚到了钱,比如说我把这个产品卖掉了一些弊端的用户买了我的产品,亚马逊是要在里边抽成的。所以Anthropic跟OpenAI比起来,属于过得更凄惨一点。Anthropic收入的话,大概是OpenAI的1/5。刚才我们讲了OpenAI是30亿美金,它大概有个五六亿美金的样子吧。
因为都不是上市公司,所以大家都不会说这个事。亏损也亏,他亏多少呢?亏大概是OpenAI的一半。OpenAI大概亏50亿美金,他亏25亿美金,就是这样的一个比例。所以前面我们也讲过,Isopic现在也快玩不下去了,玩不下去的话,亚马逊可以落袋为安了。
我记得以前有一个故事,电影院想去卖饮料,怎么能够把饮料卖得更多一些呢?我把空调开的小一点,让电影院里稍微热一点,这样我就可以多卖一些饮料出去。看看亚马逊跟Anceropic之间的故事,是不是有点像这个?当然了,OpenAI现在也很渴,也需要去买饮料喝了,像微软爸爸去买,现在山姆奥特曼的应该正在努力地找钱。
愿意给钱的人肯定不少啊,这个不用担心。毕竟是开拓一个新领域里边的老大,那这个时候肯定很多人都愿意给钱。那你说愿意给钱不就没事了吗?拿着钱接着烧呗。不那么容易啊,为什么?因为你要问微软同不同意。微软占49%,给了130多亿美金进来了。你现在再找,说我让苹果给钱啊,苹果愿意给,那微软说不行啊,这个必须排他。
像我们以前签很多这样的协议,进去的时候,特别是我成为大股东的时候,一定会有排他条款的,对吧?你让我的竞争对手进去,这事不行啊。微软就是说,我虽然愿意看着你努力成长,但我也更愿意看到你落到我的口袋里,在我这再多买些饮料。我说算了,我卖身给你得了,这个也是微软乐见其成的事情。
所以并不是谁的钱他都可以去拿的。一些微软的竞争对手,比如谷歌,比如说苹果是愿意给钱的时候,他就需要做微软的工作,说求求你让他们进来吧,他就会变成这样。那么下一个问题是什么呢?到底估值是什么样的?估值涨到多少,这个事微软才能乐意啊?其实还是跟微软有关。
现在OpenAI的估值是860亿美金,这个估值是OpenAI上一次进行内部的股票兑现的时候,或者说一些内部员工股票变现的时候的估值,并不是一个正式的估值。正式的估值的话,我觉得他现在有个大概两三百亿应该是合理的。嫁一个人进来,到底按什么样的估值进去,这个就很难去平衡。为什么?因为这个数已经很大了。嫁一个人,你说我为什么进去,投资这样的公司的目的。
一定是说你以后能够长得更高啊。然后呢,你去上市,我能够啊,多少倍啊,能够退出,至少是3-5倍能够退出,因为这么高的估值嘛,承担这么高的风险,一定希望能够尽快的按更高的倍数退出。现在已经是两三千亿了,你再往上翻这个数就不好翻了。而且如果真的是几千亿的估值,又拿了钱了,你上市怎么办?股市能不能支撑得住这样的公司?几千亿美金的公司上市,还是有一些难度的。
像AM上去,也就是几百亿上去,虽然上去了以后快速在增长,但是你说我直接就是按照几千亿,没准这一轮再上去了以后,大家就希望他上1万亿美金去上市。这个纽交所也好,纳萨克也好,虽然是注册制,只要是你提交的申请文件符合格式,你就可以去上市。但是这些地方啊,这些基金们啊,因为所有的美股大量的都是基金盘,很多基金经理会去看你这个产品到底值不值这么多钱,所以这个事对于所有人来说都是很有压力的。
那么现在怎么办呢?比当前的估值直接上市也许就是唯一的解决方案了。坚持到年底,Open I的业绩还是有爆发的可能性的。于现在,大家虽然预估他一年挣三十几亿美金,这事儿是怎么算出来的呢?是他每个月大概能挣到两点几亿美金,这两点几亿美金里头大概2亿美金,是他去卖那个20美金一个月的Plus的费用,在七八千万美金吧,是卖API的费用啊。他是这样来算的。那么,为什么到年底的时候会业绩大爆发呢?咱们想一想,9月份会发生什么大事情?9月份iPhone 16发布。
iPhone 16如果发布了,虽然它的成本会进一步上升,因为所有用iPhone的至少在国外吧,就可以去访问GPT-4了。但是,另外一方面,这些用户会大批量地转换成OpenAI Plus用户。那么它的收入也会爆炸式增长一下。所以到今年年底,还可以再大涨一波。
苹果算是OpenAI的一个救命稻草。如果它能够坚持到年底,数据再大涨一波,为所有的股民展示一下未来美好的前景,然后直接去上市,这个事还是有得救的。现在行业的心态肯定也是很矛盾的,竞争跟追赶这是必须的。甭管是谷歌、Anthropic还是Meta,都是在努力的竞争与追赶。但是谁也承担不起一个后果,就是老大倒下。
这是一个全新的行业,在全新的行业里头,一旦老大倒了,对于整个行业来说都是巨大的打击。每次开新行业的时候,有几件事是比较害怕的。第一是老大废了,一旦老大废了以后,就相当于是老大证明了跑得最快的人没跑出来,拼命往前跑,跑到头上是一条死路,撞在墙上,磕地上了。那后边紧追不舍的人该咋办,这事是很危险的。
另外一个是什么呢,就是老大上市了。上市了以后,发现业绩一般,因为大家一般在上市之前会冲业绩嘛。上市了以后,你要公布财报,很多东西变成公开透明了。那么下面的人也会觉得很危险。这就是一个新行业的宿命,至少要验证行业有未来。在这之前,老大是不能倒下的。如果说没有验证,直接就趴下了。
那么,整个行业都很麻烦啊。开天辟地的这种新行业,肯定都是非常困难的。这个呢,分几种情况。
第一种情况叫大企业开创新市场。举一个案例,比如说亚马逊,开创云计算这个新市场。这就是大企业开创新市场。但是,亚马逊也很痛苦。在开始的很长一段时间里,顶着非常大的压力,再往前走,也是用了好几年的时间,才慢慢地验证了说,云计算这个市场是一个真正的方向,大家要去向这个方向前进。这是大企业开创新方向。
当然,也有走得不是那么好的例子。比如说,梅塔做的梅塔Wars,原来叫Facebook,后来改名叫梅塔。他去做元宇宙这件事呢,就不是那么好。一直到现在,虽然名字还没改回来,但他得挂在那,挂上了还没有死掉。可是,他挂在那,所有人看着。在这么大一只半死不活的尸体挂在这个枝头上,所有人在想去做元宇宙的时候,都要稍微掂量掂量。而且,现在这个枝头上,还挂了另外一颗叫Vision Pro的东西,也挂在那了。在剩下的人就在这看着,在下面驻足观望,再也没有人敢往上冲了。这就是大企业开创的两种结果:坚持到底能够成功,或者跨在上面挂着。
那么,小公司开创新天地是什么样的呢?比如说,特斯拉、SpaceX,都是一开始的小公司。马斯克冲上来说,我要开创新天地了,开创一个新赛道出来。那是什么?就是耐心的,经历很长时间的亏损,十几年的亏损,不停地融钱,所有人都不看好,独自前行,慢慢把这个项目做起来。那你说,再举个失败的例子。
失败的例子没有啊。那么是不是小企业开创新天地就都能成功?错了,你只能看到成功的,剩下的全都不见了。我们没有机会看到,所以小企业开创新天地,我们只能看到幸存者。这是一种幸存者偏差。那你说一群人一拥而上,大家看好了方向,大家全上。这种事呢,通常是发生在商业模式创新上。如果是技术创新的话,这个机会不是特别大。
这种方式呢,也有成功的。你比如像国内的千团大战,最后就跑出了像美团这样的公司;滴滴共享单车大战,最后也是跑出来一些结果,是有能成功的案例的。但是呢,也有一些最后失败的,比如像刚才咱们讲的VR,所有人都冲,最后什么也没剩下。
现在的OpenAI呢,有点儿是骑虎难下的状态。按道理说呢,它应该是小公司,独自慢慢发展。但是它一下把这个热度炒太高了,现在搞成什么了?现在搞成一群人一拥而上了。这种乱拳打死老师傅的状态呢,一定是最危险的。
所以为了稳住阵脚,现在OpenAI必须拿出重量级的拳头产品出来,也就是咱们开篇时候讲的GPT-5,一定要拿出这种产品。如果在今年年底之前GPT-5还出不来的话,它的老大位置真的是危险了。而且它一旦倒下的话,可能整个行业都要至少颤三颤。不能说整个行业会为它陪葬,但颤抖一下是跑不了的。
好,这一期就讲到这里。感谢大家收听,请帮忙点赞,点小铃铛,参加Discord讨论群。也欢迎有兴趣有能力的朋友加入我们的付费频道,再见。
Both comments and pings are currently closed.