硕鼠的博客站

范路的博客主站,时而会发些东西。

大家好,这里是老范讲故事的YouTube频道。我们现在开始讲第一个故事:阿斯麦崩盘。

是不是AI大模型要迎来郁金香时刻?什么是郁金香时刻?就是我们认为有一个大的崩盘即将到来的时候,我们管它叫郁金香时刻。因为当年荷兰人去卖郁金香的时候,就遇到了郁金香崩盘这样的事情。后面每一次大的这种泡沫破裂的时候,你可以认为它是一个郁金香时刻。

那么阿斯麦是怎么崩盘的呢?算是意料之外,情理之中。为什么叫意料之外呢?因为由于某个技术原因或者某一个技术故障,导致了应该是晚一天发布的财报提前一天泄露了。但是呢,这个泄露出来的财报并不是说虚假的或者说有错误的,就是正确的财报,只是他看到的时间稍微早了一点,或者是大家意料之外的这个时间看到了。早看到一天、晚看到一天,里面的数据都不会发生任何变化。

所以呢,算是有一点点意料之外。所谓的意料之外的这个部分,唯一起到的作用就是放大了这个财报的各种情绪。原来财报里边写着我哪块做得不错,哪块做得不好。如果你是按正常的时间去放,大家就按正常的心理状态来看就好了。但是你突然提前泄露了它,那么这个里头一定是有一些奇奇怪怪的东西,大家心理被放大了。

现在呢,股市其实更主要是看未来的。股市不看今天的消息面,不看今天具体的什么,你今天多卖了几个硬盘,明天多卖了几个光刻机,人家是看你未来发展的。这其实也是大妈盘跟机构盘之间的差异。机构盘一般要看你未来三年的这种发展的状态,或者有什么样的新的方向,所以他允许你现在是赔钱的,你未来只要是能够发展的好,他就愿意来买。而大妈盘的话比较情绪化,他不会看那么远的事情,当前有什么变化我当前就要马上见钱,这是不一样的。

而股市里边,特别是欧美股市,机构盘要更重一些。现在阿斯麦提前透露出来的这个财报,它的收入跟利润其实还算是上升的,或者叫又创新高吧。但是呢,未来的订单只有预期值的一半,这个是非常非常吓人的。

因为像阿斯麦这样的光刻机,不是说像手机似的一年造几亿台,它一年大概也就是四五百台,不会太多了。所以,接到多少订单,就决定了未来的生产安排。现在,他只接到了20多亿欧元的订单,大家预期大概能有40多亿,所以差了一半的钱。这个数字让整个市场感觉到异常震惊。而且,仔细去看阿斯麦的财报,还会发现,在上一个季度的收入中,中国的收入占了一半,他有一半的东西都卖给中国了。中国购买的主要是28纳米以上的产品,真正的精密制程或高端制程的设备是不允许卖给我们的。

如果美国不管他,荷兰政府不管他,我估计他未来的订单还是能爆炸的。但是现在这个情况已经没有了。台积电、英特尔都在努力出货,就是要赶快把答应给我的机器交给我,我该付的钱付掉,你该给我的机器装上,再努力做。那么,问题出在哪里呢?韩国和存储市场崩了。韩国原本像三星要买一堆光刻机来用,但现在韩国的出货量没跟上去,未来的订单也不怎么样。

存储市场方面,我刚刚又去看了一下,淘宝上长江存储颗粒的SSD硬盘4T,现在价格已经回落到1,000多一点儿了,最便宜的时候大概能到900多,现在是在往下掉。阿斯麦这一部分的光刻机没有卖出去,未来的订单也就不存在了。

那么,芯片市场到底发生了什么变化呢?手机和电脑的需求其实都没起来,全球的需求相对来说比较疲软。这个锅谁来背呢?这个锅必须是AI来背,没有第二家能背的。因为现在大家能够让他换手机、换电脑的唯一理由就是AI。你现在要用AI手机,要用AI电脑,你要去买iPhone 16,要去买三星的AI手机,要去买谷歌的AI手机,国内的各种安卓手机都要去配AI。这两天,联想在拉着AMD、英特尔的老大、英伟达的老大在开会,就是要去卖AIPC,大家对这些AI手机的期待正在增加。

AI的PC都没有什么购买欲望,没有刺激起来嘛。原因只能是一个,就是AI对于普通用户来说没用。普通的用户没有觉得AI给我解决了什么问题,我需要付很多的钱重新更换设备,必须要来使用这些AI产品,没有。所以这个锅只能是AI来背。

阿斯曼他也在讲,说我们现在所有的逻辑芯片,就是CPU这些东西,存储芯片现在都不行,需求都很差。现在最后的一个亮点是AI了,也就是现在还有人在去买它的光刻机,去做SDM,就是算力卡上面用的这种内存,或者是去做H100、B200,或者是MI300这样的这种算力卡,这个东西还是有需求的。

但是大家要注意一点是什么呢?就是这种AI芯片,它呢很贵,一个H100五万美金,一个B200可能更贵,具体价格我没有去查,但是这种芯片总的量其实是很小的。它跟CPU,比如说高通的CPU、苹果的CPU比起来完全不可比。你想苹果每年要卖掉几亿只手机,PC你像英特尔、AMD每年大概几千万,也还是要出去的。但是你像H100这样的芯片,每年能够有个几十万撑死,应该到不了100万,也就是这种水平。

所以他那个量差得非常非常远。AI的这些东西呢,它可能现在还有很高的需求,但是大家就预测说,崩溃这种事情是带有滞后性的,也许下一个就轮到AI芯片崩了,因为前面是已经把CPU崩掉了,已经把存储芯片崩掉了。AI芯片是不是再过个比如说一年,或者再过个一两个季度就会崩掉,这个大家也在观望。所以他为什么股价就会崩掉。

现在呢,市场上的投资者心理已经站在悬崖边缘上了,因为AI整个的行业来说,投入实在太巨大了,而且看不到任何收益。这个东西呢不怎么挣钱,全世界所有的AI公司都不怎么挣钱。还有一个问题是什么呢?就是AI大家都觉得这就是未来的方向,但是现在AI给整个行业带来的变化是只见裁员,没有看到哪有新的企业快速成长,新的企业爆发,或者是有什么样的公司快速的招人。所以他这个AI会不会说,就是豁楞一下就跑掉了。

或者说,他就一个泡泡就破掉了。大家现在都很担心这件事。现在呢,还有另外一个让大家担心的,AI有可能泡沫破裂的原因是什么?就是H100的租金崩了。H100这种东西呢,是英伟达上一代的算力卡,也是现在的主力算力卡。现在虽然有B200出来了,但是真正用上的人还非常非常少。现在出来进行测试的B200,可能还有一些问题,在交货上还需要再等一等。

H100这样的算力卡,一张是5万美金。原来呢,说你们有人买不起吧,怎么办呢?你们可以租用这些算力卡,像云计算一样,去开一个这种带算力卡的主机,我们去用就完了。英伟达给的建议呢,是4.7美金一小时。去年的供不应求的时候,这个价格涨到了8美金一小时。但是现在呢,这个价格已经降到了两美金一小时,就是已经掉下来了。大家不需要了。

H100按照5年的寿命,5万美金价格,如果降到了3美金一小时以下的话,这个收益率可能就未必划算了。你可能最后挣的钱,还不如你把这钱存银行里收利息,收挣的钱多呢。如果这个价格降到2美元一小时以下,你可能连成本都收不回来。你把这个H100租用一年,收回来的租金不够这块卡钱呢,会出现这样的问题。

怎么又感觉像咱们原来挖矿的感觉?买了4090插在机器里挖矿,以太坊的价格一下跌,然后你觉得,哎呀,这个成本回收的时间又变长了。他现在变成这样的一个状态。而且呢,H100的这种租用的收益,你还不能按这样来算。为什么呢?因为你挖矿,只要把机器开着,它就一直在挖,不会说现在有人挖,待会没人挖,它有开机率的问题。它不会这样的,你只要开着机,它就一直挖。

但是像H100这种东西,你把它买回来以后,没有人租用的时候,它就有利用率啊。你比如说,现在虽然是能够卖到2美金一个小时,但是你可能开机率不足10%,不足20%。那你多少钱你都挣不回来。这个事是非常非常危险的。现在为什么H100的单价会掉得这么厉害呢?这个其实是真正反映到整个大模型。

这个产业整个行业的这种创业热情,现在舍得花钱去训练新模型的公司,其实已经很少了。在早期的时候,大家都愿意说:“我们花钱去训练了个新模型吧。”现在已经不愿意干了。独角兽零一万物的CEO李开复刚刚出来讲了,他说我们一定要继续坚持训练新模型。为什么他会出来讲这样的一个话?因为李开复他们已经好久没有新模型面世了,现在他终于又拿出了一个新模型,这个新模型叫e Lighting。这个模型呢,是一个Moe的模型,在很多的跑分里头已经超过了GPT4O以及GPT4O MINI。

现在又出来开了个发布会,他就讲说训练一次这样的模型需要3-4百万美金,还是很贵的。就是一般的公司你根本就玩不起。你不是独角兽,不是有10亿美金的估值,身上可能有个几亿美金的投资的话,你根本就没法弄这事。你想把这个钱挣回来也挣不回来。就是他们现在这些人,用几百万美金训练了一个模型,像他训练的模型应该还是相对比较小的模型,还不是像open AI那种大模型。那么这三四百万美金,你需要做多少服务能把它挣回来,非常非常难。

现在呢,基础大模型本身的同质化也很严重。open AI的GPT、claude、Gemini这三个模型,你说它到底有多大的差异,其实到最后差异都没有那么大。而且大模型呢,也不是针对普通用户的。他很多的大模型用户最终还是开发者。如果是开发者使用这些大模型的话,那最后这些大模型的竞争就会形成一个很悲观的结果,那就是赢者通吃。谁做的最好大家都去选他。

如果是你面向普通用户了,大家说:“哎呀,这个甭管好不好使,我用习惯了,我不换了。”它会有这个用户忠诚度的问题。但是你一旦是大模型,最后用户是开发者,是B端用户的话,随时有新的人家随时就换掉了。现在很多公司已经停止在训练自己的模型了,比如像Character AI这样的公司,就是说我们自己的模型以后不训了,以后我就用别的了,用Gemini就完事了。

普通人其实就直接聊天就可以了。更进一步的,其实普通人现在用不到现在的大模型。御三家也是跟游戏机似的,御三家OpenAI、Anthropic和谷歌,这三家是算最强的。国内的产品呢,通义千问、Moonshot、Deepseak、Yi,这些其实还是比较常见,我用的还比较多。其他像什么Mini Max呀,还有另外几个主要ToB的产品,基本上没用过。

咱也不止评论开源的这种,或者开放模型吧,Lama呀、Mistra呀,这些也都是可以使用的。当然这里还有一个比较奇葩的是XAI。为什么说它奇葩呢?融钱融的很多,名声也很响,顶上顶着马斯克,手里的算力也足够多。只是呢,现在大家所看到的结果,也仅仅是平台上面的一个聊天窗口,其他什么都没有,什么API啊、什么AI agent呀,所有这些东西它都没有。

号称是开源了Grok1.0的版本,也把这个原代码扔出来了,但是呢,放出来以后也没有任何人再去看他一眼,也没有任何后续的更新,什么都没干。他怕做了这么一样的一个东西出来,所以我觉得最后可能他会比较难看。

那么应用以及对于算力的需求呢,现在其实已经没有那么高了。除了刚才咱们讲的这几家之外,其他人其实用不了多少算力。对于大部分人来说,只要问答一下就行了。但是问答的时候呢,你用推理算力就行了,你并不需要去训练模型的那种算力。这个推理算力的话,有一个卡叫GROQ,用这种卡的效果其实比H100好,它非常便宜,非常高效的把你的推理结果给你送出来。

现在很多的公司,包括谷歌、亚马逊、微软,都在自己定制类似这样的卡。我们不再需要英伟达这些东西了,我们只管去回答人家聊天问题就行了。至于更进一步的开发AI agent呀,这些东西现在还在找方向。虽然很多人觉得这个东西很美,但大规模的使用现在其实并没有那么成熟。至于其他的AI应用方式,RAG这东西其实也没有大家想象的那么美好。

有些人说:“那我们上微调小模型吧。”现在确实这么干的人越来越多了。但是呢,大家要注意,很少有人去把一个比如说405币的模型拿出来微调一下,或者把七十几B的模型拿出来微调一下,很少啊。绝大部分人微调也就是去调这种,比如7B、9B这样的模型,甚至有人去调那个1B的、3B的模型。这种模型调起来的成本是非常低的。你到这种租用H100的平台上去调这种7B的模型,调一次可能花不了几百美金。

所以,对于他们这些做H100租赁的人来说,这个就真的是卖不出去了。因此,这些H100的租金就直接崩掉了。而且还有一个什么原因呢?很多购买H100的人其实买的是期货。什么叫期货?就是去年人家拿了投资,然后就花钱买了,买完了以后一直交不了货在这等。等到现在呢,开始逐步的交付,整个市场容量等于需求在下降,供给在上升,那它价格就只能崩掉。

而且,大模型训练这个事其实并不能一直跑。你只有像OpenAI、Anthropic、谷歌这样的公司,会不停地在去训练大模型。训练大模型这个过程,其实有点像造大炮。我造了一门大炮出来,但是呢,你得不断地开炮。你这一根炮管,你说我可以打500发炮弹,还是打300发炮弹,你把它打掉。你不能说我炮弹造大炮造出来了,炮弹没打两发,以后咱再造一门大炮吧,或者咱们过两天再造一门大炮,然后每天不停地造大炮,这个事不行。

现在大家其实对于算力的要求已经没有那么高了。当这一件事情真正传递到英伟达身上,传递到台积电身上的时候,可能整个AI大模型的这个泡沫就彻底捅破了。现在还没有传递到他们身上,现在还在喊说:“哎呀,我的H100这个订单很好啊,大家都在拼命地买啊。”马斯克说:“我要去买啊。”这两天好像是Oracle说:“我要去买一大堆100回来,大家赶快来使啊。”现在大家还在相信什么?就是谁买了一大堆的这个英伟达显卡,谁的股价就会涨。但是他们并没有想清楚说,你买了这些东西以后,部署到云计算机房,到底能不能用这个东西挣到钱?或者最后价格下滑了以后,是否这个生意依然是划算的?现在大家还没有想到这个事情,但应该很快就会想到。现在呢,整个行业也都比较迷茫。行业的老大OpenAI也没有给出什么新方向。现在,OpenAI还在不断地去训练新的大模型,但是不断训练新模型这件事情肯定是亏钱的。

其他人也不敢停下来。如果停止训练新模型,开始卷应用,可能最终在模型层次就会落后。那么,这有什么问题吗?这个问题很大。因为我们看看历史,云计算也好,广告也好,最后都是赢者通吃。最后剩下的,不管是亚马逊、阿里,还是广告平台上的谷歌、Facebook、苹果,这都是最后的赢者通吃。

他们都是靠说:“我从广告到云计算,再到最前端的应用,还有自己的用户,我要都有,然后才能把整个市场吃下来。”这些大厂是不敢去放弃,说“模型我不做了,我就只管把应用做好。”他们不太敢去干这个事了,因为一旦干这个事,最后就有可能被别人拿捏。人家说:“哎,平台是我的,广告也是我的,或者大模型是我的。我给你用的时候,就给你在里边放一些小的障碍,或者是让你觉得使用得不是那么舒服。我再出一些新的产品的时候跟你竞争,你就竞争不过我。”这个是大家所害怕的。

所以对于巨头来说,他们依然要去训练,但也没有什么方向。OpenAI今年亏了50亿美金,明年预计亏损140亿美金。而且过去五年,据说已经累计亏损了440亿美金。像OpenAI这样的公司,未来一段时间还会亏钱,可能预计到2029年才有可能盈利。现在是2024年,要再过个五年才有可能挣上钱,这个还是路很遥远。

像我们以前去投案子的时候说:“哎,你做个三年的财务规划吧。”人家说:“这玩意咋做?”我说:“你做呗,做完反正我也不看,我知道你是拍脑袋瞎猜的。”你像OpenAI想五年以后盈利,有人信吗?反正你愿意信,你就信就好了。

现在呢,整个行业其实都是非常非常纠结的。要不要继续卷?大模型这个东西看起来很美,但具体到应用的层次上,其实是脱节的。我们前面讲到说,大模型可以改变百分之多少人的工作,可以改变所有的应用,所有的应用环节都值得用大模型重新做一遍。但是到目前为止,没有谁说因为我用大模型重新做了应用以后,我就突飞猛进,我一把就封了,就涨起来了。并没有这样的公司出来,或者说这样的公司,比如说像 Character,大家觉得哎,你在用大模型做一些陪伴类的应用,这个好厉害。然后呢,这公司就不行了,核心团队被谷歌买走了,自己也不再训练自己的模型了。

有人说 Perplexity 很棒啊,人家做这个搜索很好用啊。但是大家看,看看谷歌,看看国内的豆包或者是 Kimi,大家都在往这一条路上挤。最后挤上去以后,他其实没有什么自己优势了,赢者通吃。一定是最后握有大模型的那个公司能够把它干掉。Perplexity 的模型不是他自己的,他的模型是 OpenAI 的。那么在这样的情况下,OpenAI 说来,我做 40 GPT 了,那就没你什么事儿;谷歌 Gemini 说来,我也把这个东西提升进去。那么在这样的情况下,Perplexity 是没法跟他们竞争的。

所以这个呢,现在大家也是非常非常苦恼的一个问题。大家都看到了裁员,但是没有看到新兴行业的崛起。而且这一次裁员呢,跟以前历届的裁员都有巨大的差异。以前裁员,比如说就跟军队裁军似的,他们会干嘛呢?把士兵干掉,把这个有经验的军士长留下来,把军官尽可能的留下来一些。为什么这么裁军呢?就是万一以后打仗,还可以以此为骨干,快速的再建立起新的军队来。但是这一次裁的都是中层管理干部。亚马逊现在已经透露出来,准备在未来一段时间里头裁员 1.4 万名中层管理干部。国内各大厂裁员的重灾区,不是底下干活的人,当然也不是说 35 岁毕业的人,而是什么呢?就是中间沟通环节的职位,不像什么 HRBP 啊,什么这些都重灾区。

把他们都干掉。我们不需要你去沟通了。以后的公司都是扁平化,底下的人用AI把能完成的工作尽量完成,上层的人用AI去尽可能地收集数据,进行判定或者做出决策就完事儿了。不需要中间有一大堆的人去制定规章制度、执行规章制度,然后去进行沟通。这部分的事情通通由AI来干。

现在变成了这样的一个状态,所以未来的大企业可能会更加的扁平化一些。而且现在很多的AI行业的这些公司也在思考问题:我到底是ToB还是ToC?我是给商业用户去做呢,还是给个人用户去做呢?ToB肯定是短期能够挣到钱的,因为商业用户只要是你能给他改变一点点的效率,他就愿意给钱。但是长期这样的公司大概率是会被淘汰的,混不下去的。

那么如果ToC的话,那是真卷不起,太贵了。现在流量都是握在大平台手里面。咱们就以做AI应用、AI桌面应用这一个赛道来看,国内Kimi肯定是做得相当不错的一个应用,而且声音也很响亮。他有多少月活?几百万。豆包6,000万月活。为什么?因为流量在字节跳动手里头,你Kimi想要流量,花钱买去,人家字节跳动说我自己有流量我自己上。当然,豆包也挺好使的,因为我现在每天主力的AI工具就是豆包,还是非常好用的一个东西。

在这个过程中,是没有中间状态的。我要么ToB,要么ToC。现在是不是有可能成为有一些新的中间态?我们来为他服务。现在呢,大家其实也在思考这个问题:什么是中间状态?就是ToB跟ToC的中间状态。我呀,我就是中间状态啊。我们这种人叫什么?叫自由职业者。我既不是B也不是C,我虽然是个个人,但我肯定不是一个大的商业。但是呢,我又不是说用这些AI工具去解决日常娱乐问题,我是用这个工具在上班在挣钱。

所以呢,可能未来的这些AI工具要思考一下,怎么为ToB与ToC中间的这部分人去服务。也许未来会有一些新的不同的方向出来。AI可能会替代80%的工作,这80%的人失业了以后,不会再在未来一段时间里再回到大企业里面去就业。他们可能就会像我一样,成为新的这种叫做自由职业者。这有可能才是未来的一个广大业态。明年呢,有可能是整个AI行业至暗时刻,更多的创业企业会崩盘,就像咱们前面讲的Character AI这样。而且国内的这些AI企业也会有大量崩盘的,这个没有任何办法,因为你花了太多的钱,做了太高的估值,你又挣不到钱,也没有办法解决实际的问题,也没有办法真正的去提高社会效益,这些企业一定会崩。

英伟达的B200交不了货,与台积电现在也在扯皮。这个事本身其实问题并没有那么大,台积电说英伟达,你这用了太多的新技术,给我们的时候又太着急,所以我们做出来的芯片是有问题的。英伟达就是说,台积电你们的技术有毛病,给我的芯片不好,那我们要去晚一些再去交付。这个其实不重要啊,真正重要的是什么?算力需求下降。如果大家发现没有那么多的算力需求了,你把这个卡造出来卖不掉了,这个才叫吓人,这个有可能就会在2025年发生。而且应用如果还是起不来,新的商业模式、新的交易、新的利润还是没有产生的话,那么这个崩盘就必然会到来。

但是呢,我觉得也不用太悲观,崩盘是一定会来的,但是呢,不破不立,必须要经历这次崩盘,最后呢才可以去说再继续往前走。当然最好在这个崩盘的过程中能够保住open AI,不要让这个老大倒下,这个老大倒下,可能整个的行业就爬不起来了。而如果能够保住它的话,那没准未来还是可以说经历一个大的起伏之后再慢慢的起稳回升。

在明年呢,更多的人应该会去做应用,更多的人会去思考新的商业模式。不要再去搞什么狗屁的UBI,就是全民基础收入,那东西搞不通的,不要脱离商品经济的底层逻辑。在这个逻辑上,大家去想有什么新的商业模式,有什么样新的业态。如果80%人失去工作了,都在外面做自由职业者,我们又需要什么样的东西为他们服务,这是明年真正需要想的东西。在这个过程中呢。

我们就要等待新的巨头产生。这个新的巨头有可能是OpenAI,它有可能会指明新的方向,或者说它能够为这80%的人提供新的平台,能够让他们在OpenAI的平台上去盈利、去生活。那么OpenAI就会成为新时代的谷歌。

Anthropic的话比较难,因为他们有可能最后会逃不脱收购,可能被亚马逊直接收掉就算了。谷歌的话,这一次应该不至于掉队,这应该就是上一个时代的微软,虽然没有赶上新的时代,但基本上也跟着了。这就是谷歌在这个时代要扮演的角色。

梅塔做的拉玛,有可能就是这个时代的安卓,所有的开源模型的标准制定者,这就是梅塔在这个时代的定位。在国内,现在看,三家跑得比较快的,一个是阿里,一个是字节跳动,还有一个是Kimi。至于其他的,还需要再努力一些才能被我看到,否则的话看不到他们。而这就是现在的一个状态。

整个AIGC的行业,有可能泡沫会经历一次爆破,但从我个人的观点来看,这一次爆破并不会把整个行业炸翻,但也会重新做一次洗牌。就在明年2025年,应该会重新洗一下,洗完了以后大家再慢慢地往前发展。在这个过程中,一定会有很多的痛苦,很多的动荡会发生。大家一定要安下心来,或者说要坚定信心,继续在AI的这条路上往前走。

而且在走的过程中,也要采取更加理智、更加稳妥的策略,比如小团队以盈利为核心。如果你真能融到钱,再去研究是不是去训练大模型。其实在今年的可能第一季度,三四月份的时候,我们去参加一些创投会的时候,所有的投资人和一些大厂的老大都在讲,现在不要再去训练大模型了,这个已经时代过了。现在训练大模型这件事情,就交给刚才提到的这几家就可以了:OpenAI、Anthropic、谷歌、梅塔、阿里、字节、Kimi。其他人大家努力去找到新的应用就好了。这就是现在由阿斯麦这一次的股价暴跌,我们去聊一下。

说AIGC的泡沫到底是不是该挤一下?好,这就是我们今天的第一条。

 

Both comments and pings are currently closed.

Comments are closed.

Close Bitnami banner
Bitnami