H100 – 老范讲故事｜AI、大模型与商业世界的故事

Deepseek V3.1 引爆A股！神秘代码 UE8M0 揭秘，华为升腾背后的“国运”豪赌

Luke Fan — Sun, 24 Aug 2025 00:41:25 +0000

Deepseek V3.1发布，很多人应该都有疑问，UE8M0到底是个什么东西？这个国运级的大模型，到底有没有翻车呢？

DeepSeek V3.1发布，为什么会墙内开花墙外香呢？大家说这东西在国外也没多火。咱们讲的墙内开花墙外香，并不是说国外火，而是在圈外火。什么意思呢？就是在真正大模型圈里，其实大家并不怎么说这个事，但是在炒股票的这帮人面前，一下就火了，国产算力芯片一把就飞了。

到底是一个什么样的情况？首先呢，Deepseek V3.1在性能上其实并没有特别显著的提升，所以一帮真正去研究大模型的人，或者去研究AI的人，只能在那尬吹，说这个好像强了一点，那个好像强了一点，但其实都并不明显。它的编程能力呢，确实应该有所上升吧，但是你说现在就可以吊打Claude Sonic 4，这个我觉得有些言过其实了。上下文现在是128K了，在Deepseek去年12月份发布的V3版本以及1月份发布的R1版本的时候呢，它的上下文都是64K的。到V30324和R10528这两个版本呢，就已经升级到128K了，所以这一次的V3.1依然是128K。工具调用上应该是真的增强了，比原来的V3增强了，也更加符合AI agent的一个需求，这个就是他的一个主要的优势。

所以为什么这东西一开始拿出来，大家没有觉得他怎么样，然后突然怎么就爆发了呢？一句话让二级市场直接就疯了。8月21号，Deepseek公众号上有一句话直接引爆A股。玩模型或者说玩AI应用的人，是不会太去看这个公众号到底写啥的，但是这些炒股的人不一样，人家天天盯着这个公众号，一个字一个字在那抠。

这句话说的是什么呢？V3.1使用了UE8M0和FP8规模的参数精度，为了适配未来的国产算力芯片。有这样的一句话在里头，那这还不赶快冲上去？而且在传播的过程中呢，FP8这个词呢，在后续的流传中就变得时隐时现了，大家不再提这个FP8了，主要都去强调这个UE8M0了。一堆人就问说这玩意到底是个啥呀？这么神奇的东西吗？甚至寒武纪就直接涨停板了。

下边呢，咱们来解释一下UE8M0到底是个啥。这个难度很大，因为我自己在数学这一块也没有多强，而且还想把它尽量地解释得通俗易懂一点，这个对于我来说是一个考验。如果我说了你没听懂的话，不是我没说好，是你自己智商有问题。咱们开个玩笑。

很多人呢，其实都搞不明白这个UE8M0是什么，但是呢都像老中医念口诀一样，上来都是这个脉怎么怎么样，应该什么君臣佐使一下，然后就开始给你开药方。念念有词以后呢，就冲进去买股票去了。

这个咱们解释一下，首先呢，用形象的三个词来跟大家解释一下什么是UE8M0。这三个词，第一个词叫“马赛克”。很多男生，特别是对于成人影片、日本成人影片有一些经验的这些男生，对于“骑兵”和“马赛克”这个词应该是能够有一些理解的。UE8M0呢，实际上就是一种马赛克格式，待会我们讲为什么。第二个呢，就是叫“九九乘法表”。在中国吧，大家从小就背，我们可以在某一些特定的计算里头超过老外。他们从小不背九九乘法表的这些人，就没有这个口算和速算的能力。我们从小背这个东西，我们就在某一些特定的运算里头会比他们先人一步。还有一个不是那么好听的词，但是更贴切，是什么？叫“裹小脚”。这个在满清时期，他们对汉族女性的一种残酷的压榨，要求大家去裹小脚，以小脚为美。UE8M0的话，就完完全全是符合这三个词的特性的。咱们下边一个一个给大家解释。

首先呢，要跟大家解释一下计算精度的演化。咱们要知道，做大模型计算，甭管是训练也好，还是后边推理也好，它最主要的一个计算叫矩阵乘法，就是把一大堆的数呢放在一个矩阵里，两个矩阵相乘，乘完了以后得到一个结果。甭管是训练也好，还是推理也好，大模型训练的90%以上的算力就在干这一件事：乘乘乘乘乘。这也是为什么他们跑到英伟达的算力芯片里面去干这个事。英伟达算力芯片非常非常多的核心，这些核心也干不了太复杂的命令，但是你让他做乘法，他还是做得很快的。所以这个东西要比咱们普通的CPU算得快很多。

矩阵乘法里头呢，就有一个问题，叫计算精度的问题。最标准的叫FP32，他们这个数是怎么表示的呢？第一位是符号，正数还是负数；后边呢，应该是8位吧，代表的是浮点；后边的几位呢，就是代表的一个精度。前边这个符号正负大家比较好理解，中间这一部分浮点数就意味什么呢？就是我可以表示最大和最小多少，这个是一个范围的表达。后边这个尾数呢，实际上是精度的表达，就是说我这个小数点后到底有多少位。当我们把这样的一个数字去进行乘的时候，肯定会得到一个结果。但是有一个问题是什么呢？咱们都是讲这大模型好大，有好多好多数据去进行运算的，那你说我要把这么多参数搬进去，在这个内存里跑来跑去，它就会变得非常非常消耗带宽。而在进行乘的时候，如果是两个很大的精度的数去进行乘的话，那它的对于算力的消耗也是非常非常可怕的。

所以大家怎么办呢？就是要降低精度。而且呢，因为大模型本身它是一个很稀疏的运算，你降低了精度以后，发现对结果的影响并不是很大嘛。现在他们用16位的，或者用一些更小的8位的，用这样的精度去计算了以后，发现好像得出来的结果跟32位的没什么太大区别，那咱们就把它降低一点呗。所以呢，大家就开始从FP32变成FP16、BF16。这里头要注意，FP呢一般都是英伟达这边去采用的一个标准，也都是一位符号，然后呢多少位浮点，多少位尾数。BF16呢是谷歌自己用的一个标准，它的浮点数要更长一些，尾数更小一点，这样的话它可以表达更大的一个数字，但是呢精度差一点，效果呢也还可以。后边呢还有FP8，FP8就是尾数更少一点，然后更多的数字去表达。后来呢，我们现在使用的大部分模型，真正去推理运算的时候，实际上都是FP8。现在的模型呢，大量的训练都是用FP16去训练的，现在也没有那么多人使用FP32去训练了。最早都是FP32训练，后来就是FP16训练，训练以后再去对这个大模型进行量化。

你说比在8再往下还有没有？还有，叫MXFP6和MXFP4。MX是什么意思呢？待会咱们再解释。FP4，咱们讲讲一下这个吧，它比较极端了。FP4是什么意思？就是它有一位符号，两位浮点和一位尾数。那你说我就一位尾数，这玩意算啥呀？我这要是0的话，那你前头这几位不就全废了吗？不是这么算的。如果你这个尾数是0，它代表什么呢？就是0、2、4、8。如果你这个尾数是1呢，它代表的是3、6和12。所以我们基本上这样看，FP4代表的数就是0、1、2、3、4、6、8、12。那你说就这几个数我乘来乘去，没有办法代表很多的东西，怎么办呢？不能说我整个大模型就这几个数就把它都表示了。所以呢，这个时候MX就起作用了。它呢，把这种很小范围的数呢，放在一个块里，这一个块呢有32个数，这一个块呢统一再进行一次浮点变化。这个浮点数变化呢，是写在另外一个叫做浮点位里头。那个浮点位呢，就是一个UE8M0的一个浮点位。UE8M0呢，意思是无符号的8位的浮点，没有尾数，就是这样的一个意思。它相当于什么呢？就是我们把4位4位的这种一块32个数，统一用一个浮点把它变化起来。MXFP4大概就是这么个意思。

哪个模型是用的这样极端的参数呢？最近公开的GPT-OSS就是用的MXFP4。而且这个里头有一点很强的是什么？OpenAI是从训练就直接使用的MXFP4，它没有经过后续量化，所以它的效果非常非常好，也极其节省内存。因为你想你一旦把精度降低了，它就可以干嘛呢？它就可以用更小的内存去存储这些数据、存储模型。然后你在进行模型运算的时候，你的显存跟你的GPU之间进行调度的内容就会变得更少，乘的时候乘得更快。

那你说在这个过程中，显卡或者说算力卡的公司干嘛使呢？他们就会想办法去优化。他写一些算法，或者说在里边做一些链路，让这些算法，比如说FP8的或者是FP16的这些数据，在我这做乘法和加法的时候让它变快一些。早期的显卡上是没有FP8的，有FP32、有FP16。什么时候开始有FP8呢？这个东西是在英伟达H100上出来的。BF16是只有谷歌TPU上才有，其他人不玩的东西。这个MXFP4呢，就是后来这个Blackwell黑井的显卡上是支持这种运算的。

在这个里头有一种比较极端的算法，就是UE8M0。就是我已经没有正负数了，全是正，我这个全是正数，里头也没有任何的这个尾数了，只有8位的指数。那么它能够代表的数是什么呢？0、2、4、8、16、32、64，它等于是这样可以上去的，可以代表很大的数字，但是呢就是完完全全没有精度了，它是属于跳跃、跳阶跳上去的。这就为什么我们讲UE8M0是马赛克。你想我有一个图片，这个图片里头呢，某一些关键部位里头就没有阶梯了，就没有很多的细节了，只剩下这种跳跃式的这种表达了，那不就变马赛克了吗？所以基本上你把它理解成一个马赛克，这个事是可以的。你说有没有这个宝马一点的？有，就是那个刚才我们讲那个FP4，它里头还有一位，它可以代表0、1、2、3、4、6、8、12，它中间还是多出一个来的，它这个码要稍微薄一点。最极端的大的厚码，就是这个UE8M0。大家可以这么去理解它。

Deepseek为UE8M0都做了些什么呢？首先呢，Deepseek并不是原生训练的UE8M0的大模型。它呢，是在英伟达的H800和H20上，使用FP16和FP8训练出来的一个模型。在训练完了以后呢，再专门针对UE8M0进行量化，把我原来这个训练完了结果的数据，按照UE8M0的这个方式重新量化、重新排一遍，然后拿出这样的一个小很多的模型出来。在这个专门为UE8M0进行优化的算力卡上，就可以跑得飞快。

UE8M0其实是有一些好处的。它好处是什么呢？马赛克虽然没有细节，但是呢它在运算的时候，内存搬运会变得非常少。你去表达同样的模型，你需要的这个数据变小了，这个是非常非常有好处的。因为咱们现在最大的瓶颈是什么？因为美国禁运，我们的算力芯片跟这些HBM芯片之间，或者说这种显存芯片之间的带宽比较低，那我们就专门优化一个这样的算法给你就可以了。但是我们要注意，就是在Deepseek发的那篇公众号里头，他写的是“我们支持UE8M0和FP8”。所以呢，现在大家去下载的Deepseek V3.1的模型里头，实际上是有两个版本的，一个版本是UE8M0的，另外一个版本是FP8的。你说我是用英伟达显卡的，我用AMD的显卡，你就用FP8的版本。你说我在国内，我要用升腾的芯片，那你可以使用UE8M0的这个版本。

为了适应UE8M0这种极限挑战，我要给你打马赛克，打完马赛克了以后你看了以后还觉得爽，这个是对于Deepseek来说非常非常高的挑战。那就需要干嘛呢？做专门的设计。他们在模型训练的时候做了专门优化，一方面呢是进行了混合精度的使用，就是有一些地方用的是比较高精度的，有些地方用的比较低精度的，他们专门做了这样的一个适配。然后呢，也在进行一些叫做累计误差检测。因为你想你把这个地方变成黑白的了，或者变成这种大马赛克了，那你这个误差就会变得很大，特别是需要进行多轮的矩阵计算以后的话，它的误差就会有累积的增加。Deepseek专门有一个设计，就是检测这个东西，如果误差达到一定阶段了以后，我会换一个方式重新来算一下，然后想办法把这个误差规避掉。它通过很多类似这样的手段呢，让这个模型在UE8M0上可以跑起来。

这里就有一个问题，就是不做特殊架构设计的大模型是不能被量化成UE8M0的。你说我现在把Llama 4拿出来，做一个UE8M0的量化行不行？做不出来。虽然大家都是在英伟达的FP16和FP8的基础上训练出来的，但是你前面没有做这些提前的准备，没有在这个架构上做特殊的设计，你是不能去做这种极端量化的。你那个打上马赛克，大家看了就没感觉了。只有Deepseek V3.1打上马赛克，还可以有一定的表达能力。

那为什么别人不用UE8M0呢？它呢，是需要专门修改训练架构，为极限情况进行纠偏的。这个过程呢，其实有点像裹小脚，你是必须从小抓起，等长大了再来的话，他就来不及了，已经长得比较大了，现在再去裹小脚裹不出来了。极大地增加训练的复杂度，而且呢也无法保证最后不翻车。有些人裹的一半说实在太疼了，算了我就放了吧。还有一些人真的是裹了一半完了，还留下一些残疾，最后发现也没有达到人家要求的效果。这个都是会发生的。九九乘法表也是一样，我们专门把一套特别高效的计算方式呢，把它背熟了，只有进行了同样训练的人，他才可以在某些特定领域里头极快速地去给出正确的答案来。刚才我们讲了马赛克、九九乘法表和裹小脚，其实最形象的呢就是裹小脚。

那么国产算力芯片跟UE8M0到底是什么关系呢？H100就开始支持FP8了，B系列呢，开始就是像什么B200这些芯片呢，开始支持MXFP4，它是向这个方向前进的。国内呢，我们是在跟随了。大部分的芯片实际上都是支持FP8的，就是按照英伟达这个路子走的，只是我们比人出的晚。H100是挺早就出来了，咱们大概是2024年、2025年新出的一些算力芯片呢，都开始支持FP8，也对FP8呢进行了一定的优化。

华为升腾芯片呢也是支持FP8的，但同时呢另辟蹊径，搞了UE8M0的这么一个算法出来。华为呢还出了一个叫MindSpore的开源框架，对华为芯片以及英伟达芯片进行全栈的AI应用，从推理到训练，所有的事情他都可以干。他做了这样的一个完整的开源框架。在这个开源框架里头呢，对于华为升腾芯片专门进行UE8M0的这种优化。你用传统的大模型推理框架，比如说PyTorch或者是TensorFlow，它是没有办法对UE8M0进行优化的。所以一旦你拿到的Deepseek V3.1是UE8M0量化版本的，你就只能去用华为的MindSpore。华为自己呢肯定用的是最好的。国内其他的芯片现在也开始兼容这个MindSpore，他们肯定出了芯片需要去兼容现在主流的这些开源框架，包括像PyTorch、TensorFlow，也要去支持MindSpore。他们也会对自己进行UE8M0的优化。比如说像寒武纪、摩尔线程，他们现在测试了UE8M0的计算的话，会比传统的FP8的方式呢效率要高很多，或者叫效率提升明显吧。这也是为什么大家都冲上去买寒武纪的股票。虽然华为是真正整套系统提出者，而且也是最大规模的部署者，但是呢它不是上市公司，炒股票的人就拿它没办法了。Deepseek自己也不是上市公司，炒股票的人拿它也没办法，那咱们就炒这个寒武纪就可以了。

国外的这些芯片像英伟达呀、AMD这些主流芯片，都没有对UE8M0进行优化。他们也可以用UE8M0版本的这个模型，但是呢可能会更慢一些，因为它还要把这些模型搬到内存里头，重新转换成FP8或者是FP16再重新计算，它有一个中间的过程就比较麻烦。但是也不用担心了，你说我现在这个是英伟达的卡，那你只需要去下载Deepseek V3.1 FP8的版本就可以去使用了。

那你说是不是国运？到底啥叫国运？只要带着国家转向都叫国运，还有另外一种可能吗？和国运级的升腾芯片进行绑定，那肯定是国运了。训练呢还是英伟达，推理呢专门为升腾进行了优化。后面呢就要进行道路之争了，中国人比较擅长，这个什么意思？千问、Kimi、MiniMax、豆包、智谱，这些开源模型都没有办法去做UE8M0的量化，因为他们在一开始训练的时候就没有考虑过我后边有可能裹小脚这个问题，所以他就没办法走这条路。你如果说也想去做UE8M0的这个量化的话，你就需要在训练的时候就调整，第一个很麻烦，第二个有极大的失败率。如果这就是未来的方向，那就真的是跟美国这边脱钩断链了，就是我们训练拿你这个东西继续训练下去，但是呢最后去量化和推理的版本就使用升腾了。确实在影响国运的走向，所以呢这个Deepseek V3.1确实是国运级产品。

未来会怎么发展呢？希望吧，股市上折腾一下就算了，大家去买买股票赚点钱，不要去真的影响未来国内大模型的走向。大家还是尽量去跟着国际主流的技术路线去走FP8的这个路线。如果你说我们要继续前进，大家可以想办法向MXFP4的方向去走，不要去走这个UE8M0的方向，这个方向就像裹小脚一样，非常非常危险的一个方向。Deepseek V3.1呢，算是做了一次尝试吧，但如果真的影响了未来国内的模型方向，不是什么好事。

这就是今天要跟大家讲的，希望大家能够听到一些自己原来不太理解的东西吧。好，这个故事就讲到这里，感谢大家收听，请帮忙点赞、点小铃铛、参加DISCORD讨论群，也欢迎有兴趣、有能力的朋友加入我们的付费频道，再见。

DeepSeek R2难产真相！金融时报爆料：华为昇腾芯片训练失败，揭秘国产AI算力的“卡脖子”困境。

Luke Fan — Mon, 18 Aug 2025 13:35:27 +0000

8月14号，英国金融时报发了一篇报道，说Deepseek R2模型之所以难产，是因为在使用华为升腾芯片训练的时候，持续遇到了技术问题，最后被迫改用了英伟达芯片。甚至透露华为曾经派出一支救火队，常驻在Deepseek，手把手帮忙调教升腾服务器，但仍然无法完成训练。无奈之下，Deepseek只能退回老路训练，重新切换回性能更加可靠的Nvidia的GPU，升腾芯片仅退居辅助，用于模型推理环节。

虽然没有华为和Deepseek官方的回应，也没有他们的辟谣，但是呢，据说是援引了三位知情人士的一些说法，也进行了很多交叉验证，所以这个事情呢，大概率是真的。

国运跟国运相碰撞的时候，升腾也号称是国运级产品，Deepseek肯定是国运级产品，为什么是升腾不灵呢？升腾芯片是可以替代的，也还有一堆竞争对手，所以出现问题以后，他的竞争对手会帮他去宣传。而Deepseek虽然在国内也有模型在追赶，但是地位是不一样的。升腾和国内的其他算力芯片，以及其他那些大模型，从来没有像Deepseek那样震动过世界。所以呢发生碰撞的时候，必须是升腾不行了，不可能是Deepseek不行了。

大家为什么会这么期待Deepseek R2呢？现在又有千问3，也有Kimi、Mini Max，还有豆包等，有一大堆的这些模型出来，怎么就只有Deepseek才行呢？其他人为啥都不行呢？其实现在呢，很多新的这些模型已经并不比Deepseek R1的性能差了，基本上是可以替代使用的。但是大家依然在期盼Deepseek R2，而且你只要讲Deepseek要出R2了，就会有流量。这个原因其实很简单，因为我们在跟国外的大模型竞争中打不过了。

国外已经进入了10万级芯片的训练时代了。Llama4，40万块H100训练出来的。虽然Llama4翻车了，但那也是10万块。而马斯克XAI的Grok 4，20万块H100训练出来的，效果相当不错。GPT5的话，现在推测也是20万块H100训练出来的。Anthropic的Claude 4，据说呢是40万块H100，但是呢它这个数并不是那么准确，40万块H100呢是一个部署的数量，并不是精确的训练的数量。另外一个没说的是Gemini 2.5。Gemini的2.5是没有公开数据，因为他们家使的TPU，其他人都是使的GPU，所以呢没有办法去比较，但应该也是几十万块H100的一个算力，才有可能训练出Gemini 2.5来。

以前是一个国外大模型特别强，特别是GPT4压着所有的模型的时候，我们终于期盼到了Deepseek R1一出来，觉得我们好像又可以了。但是现在我们发现，国内的大模型跟国外这些明显有差距了。我们只能再去期盼Deepseek，因为其他这些肯定是追不上的。那没有20万块H100，这个日子就没法过了。国内的算力芯片呢，大家也都知道不是那么靠谱。这个时候大家期待的就是奇迹了。

Deepseek V3、Deepseek R1，他们呢号称使用了2,048块H800，还不是H100。他们这个算力转换，可能也就是1,000多块H100。拿这样的算力就直接训练出来了，大家觉得你们可以用很少的卡训练出来，还可以震惊世界。现在我们还搞不定20万块的H100，是不是依然可以期待Deepseek再创造一次奇迹呢？

Meta花了好多钱收入进去的亚历山大王曾经在接受采访的时候说，Deepseek手里头有5万块H100，压根就不是他讲的几千块就给这事搞定的事。而且呢，新加坡3月份还抓了一些向大陆走私英伟达芯片的人，有传闻说这些芯片的采购方里边包括Deepseek。

Deepseek呢也正式做出过回应，2025年2月份做了回应。Deepseek强调，仅使用了2023年合法采购的H800芯片，其他我都没用。但是讲完了这个以后，甭管你原来这个东西到底有还是没有，你讲这个话以后肯定就不能再用了吧？所以呢现在大家期待说，这个反正你们原来是这么讲的，我们就这么信了。那以后呢创造奇迹也只能是等着你了。哪怕是使用H20芯片，用很少的芯片训练出来，堪比20万块H100芯片训练结果的这种奇迹，也不是完全不可能吧？这个怎么说呢，人有多大胆，地有多大产吧。我们总还是要有一些希望吧。

新的模型没有出来，但是新的论文呢，Deepseek其实一直不断在产生。在V3跟R1之前，Deepseek也没做什么铺垫，这不也就突然蹦出来了吗？他是这样去期待这个Deepseek的。

原来讲是8月15号到30号之间要发新版本，最后Deepseek自己出来辟谣说：“对不起，我们发不出来。”英国金融时报出来说，被这个升腾给拖累了。那这消息是怎么传出来的呢？Deepseek原来是有没有说过自己要去发Deepseek R2这件事呢？

首先呢，是Deepseek R1震动了世界，应该是在2025年春节前后的时候，我印象里特别深刻。Deepseek R1出来以后，我还连续做了很多天的直播来跟大家讲这个事情。国际大厂呢，在Deepseek R1的这种搅动之下，纷纷转向。转向什么呢？主攻数学、科学与编程，然后呢是长上下文、工具调用和agent，以及指令依从、降低幻觉。

数学跟科学这块呢实在太难了，这个咱们不擅长，而且那个你真的是需要可能10万块、20万块卡，你才可以把这事搞定，咱们没有。那编程呢基本可用，国内的这些模型做编程，肯定没有Anthropic的Claude 4好用，但是呢也基本上可以跑。长上下文、工具调用和agent这块呢，包括指令依从这一块呢必须要有，这一块其实国内的大模型基本上已经追上了。剩下的呢降低幻觉这事咱们就不谈了，反正有幻觉还是可以甩锅的事情。全面开源，这个是国内大模型真正卷的地方。千问直接把200多b的模型直接就开源出去了，Deepseek 600多b的模型直接开源出去了。这件事情我们在努力的往前走，所以各有所长吧。基础设施这块、数学科学这部分实在是费劲，大家就期待Deepseek来再创辉煌了，其他人就不管了。

Deepseek发R2这件事呢，其实传了两回。一回呢5月份，风起云涌。每一次说Deepseek要出R2的时候呢，都是风起云涌的时候，大家都在上新模型，说呀Deepseek你也得上，所以就会开始给他传这个事儿。

今年5月份，发生了一些什么样的事情呢？首先呢Claude 4、Opensource和sonnet这些模型直接出来了，王炸。5月份开谷歌IO，Gemini 2.5 Pro和Gemini 2.5 Flash直接发布，这个其实现在已经是我的主力模型了。GPT呢当时倒是没有什么特别大的动作，上了一个Deepseek 4.5，但是呢也没有引起特别多的响动。大家就说Deepseek你们也该来了。但其实呢Deepseek没有去出R2，而是把Deepseek R1的模型稍微的小步更新了一点点。

6月26日，the information就做了一个报道，说Deepseek R2原来计划是5月份发布的，但是呢因为梁文峰对于Deepseek R2表现的性能不是很满意，决定推迟了。路透社呢也引用了the information的这个报道，国内的媒体呢也纷纷去引用。但是这件事呢，并没有得到Deepseek官方的回应。Deepseek这个公司就是这样，他基本上不怎么回应大家的这个响动。你们猜吧，猜完了以后我也不理你，除非是有一些太过分的，否则他一般不说什么。

Deepseek呢也不是说没更新，就是做小版本更新。像Deepseek V3出了0324版，也就是2025年3月24号出了一个版，把分数又往上刷了刷。因为每一次去更新这些模型，一定要刷分数上去。代码能力，特别是前端代码能力呢，有所提升。拿这玩意写个网页没什么问题，但你说我要做一些大的架构，或者做一些这种后端的东西，可能就要稍微费劲一点。做算法的东西要费劲一点。为什么？因为它Deepseek有一个问题，就是它的上下文比较短，想去做一些大的架构上的东西，你必须上下文长，你得能把整个代码塞进去才行，这块还是要费点劲的。然后他把中文写作能力做了一些提升，Deepseek其实一直在努力的方向，就是中文推理。因为在海外的这些模型，很多都是使用英文推理，然后再翻译成中文的。他说我们直接用中文推理这个事，是不是OK？他们一直在努力干这件事情。使用体验上呢也有所提升，特别是function call更加准确了。在做AI agent的时候，其实核心就是function call的能力，就是我们先描述一堆的功能，然后交给大模型，大模型在完成整个的语言生成的过程中呢，去根据你描述进来的这些function，去决定我要调哪个、不调哪个，或者如何去调用、什么时候调用。Deepseek V3 0324呢，就在这一块做了一些增强。

Deepseek的R1呢，其实也更新了一个版本，就是0528。大家在传说Deepseek要出R2，讲的其实就是0528的这个版本。而这个版本呢，其把这个分又往前刷了刷，减少生成的一些错误信息。因为Deepseek最大的让大家无法忍受的东西是什么呢？就是胡编乱造，他太喜欢瞎编了。所以在这一块呢，稍微做了一些调整，但是依然胡编乱造的很厉害。Deepseek 210528呢，还支持了Json输出和function coding，提升了调用的准确度，但是呢不能叫R2。这就是5月28号的这个版本。

紧跟着就开始传说了，说8月15号到8月30号，要准备发布Deepseek R2了。这个消息是怎么来的呢？首先肯定还是要风起云涌一下。8月份发生了些什么事情呢？马斯克XAI的GROK4发布了，Anthropic又发布了Claude 4.1 Opensource，OpenAI发布了GPT5。GPT5这东西到底好不好使，大家各自去领会。大家可以认为说，GPT5是一个划时代的产品，但是也可以认为说，GPT5就是山姆奥特曼为了要去忽悠融资去搞的一个事情。因为GPT5出来以后，OpenAI的估值已经正式从3,000亿美金提升到5,000亿美金了，而且是孙正义要去买这个单，说您这5,000亿美金我认了，我去买去。

所以呢8月份风起云涌了。那么空穴来风呢，你这事怪不得别人。在Reddit上有人发了个帖子，这个帖子特别有意思，他说他去问了Deepseek R1：“Deepseek R2什么时候发布？”他等于是把这个东西交给Deepseek R1了。但是大家注意，Deepseek R1这个大模型呢，它并不代表Deepseek这公司的一些官方的观点，只是说这个模型给你生成了这样的一个结果。Deepseek R1回答了：“8月15号到8月30号之间发布。”而且号称呢是引用了雪球和东方财富等可信的信源，而且进行了多个渠道的证实。

Deepseek R1的幻觉其实一直都是很严重的，虽然经过0528的调整以后，但依然很吓人。而且Deepseek R1的最大幻觉是什么？就是编造可信的信源。说我从哪哪引用了，你点进去以后，压根就没有这篇文章。但是甭管怎么说，这个文章就在Reddit上就贴出来了，随后呢这个消息就逐渐的被传播和放大了。国内的很多的媒体、自媒体就开始引用这篇消息，特别呢是华为下边的一些科技媒体进行了转载。而且呢在标题里边还夹带了私货，讲的是什么呢？讲的是深度求索，就是Deepseek这个公司，“升腾芯片版本Deepseek R2预计在本月发布”。它讲的就是说，它是使用升腾芯片来去做训练的。

华为都说了，两大国运级产品强强联合了，那信吧，这事怎么办呢？国内一帮的媒体就冲上去说：“我们信了，确实是有这事了。”到8月14号，英国的金融时报出来报道，说升腾芯片拖累了Deepseek 2。然后动点科技、腾讯科技就出来辟谣，原引自公司内部人士，也就是Deepseek这公司里边的人说了，说8月份不会发布Deepseek R2。所以呢，8月15号到30号之间发布Deepseek R2的一个消息，实际上是Deepseek R1自己编出来的，其他人把这个编的信息信了，直接截了个图发到这个Reddit上，以此来发酵出来的一个过程。

那么Deepseek R2到底遇到了一些什么样的问题呢？首先升腾芯片确实是有问题的。升腾910C的这个芯片，虽然单芯片的算力在部分指标上呢，已经达到了H100的水平，但是呢显存的带宽不够，想从显存里调数据回来，速度是没有H100快的。而且最大的问题是什么？就是多个芯片之间的速度，就是我需要把数据在多个芯片之间进行流通的时候，这个速度是相对来说比较差的，而且差的很远。你要想去做同样的训练的话，你就需要更多的时间全功率的去运转。因为你想，人家都已经达到20万块H100这样的集群的规模再去训练新的模型了，你没准就是需要这个50万块或者60万块升腾910C串在一起，才能达到人家那个算力，而且你需要很长的时间去连续的运作，这个对于升腾910C的这种考验来说就比较大了。

这样的芯片，其实是没有办法长时间稳定地去运行的。并不是说训练一个模型，这头输入进去数据，过三个月去开盖看结果。中间每过一段时间，可以取得阶段性成果，再继续往下训练。但是中间这个过程呢，你是不能停的。你中间比如说准备了一批数据，你去训练了，如果这批数据没有训练完，升腾910C就直接冒烟了，就不干活了，这一波呢就白干了，你必须要从这个节点接着往后干。这个玩意有点像什么？有点像打怪升级，你一定要打死这个妖怪才能存盘，你没打死这个妖怪就不让你存盘。升腾910C在这块差一点。

那为什么差呢？升腾910C呢，是两个910B堆叠在一起的，散热肯定会出问题。就算是上了液冷以后，依然是搞不定这个事情。

其实同样的坑，英伟达也踩过。大家还记得H100独挑大梁好久了吗？很多人应该还是有印象的。甚至呢到现在为止，H100已经成为一种计量单位了。现在我们再去算说：“你这个算力相当于多少英伟达芯片呀？”我们都是以H100的这个算力作为一个计量单位的。就是因为H100挺长时间在那孤独一只。为什么它会孤独一只呢？本来计划替代H100的这个产品叫B100，叫Blackwell黑井100，这个芯片直接就跳票了。研究完了以后开了发布会，开完了以后，这个芯片压根就没有大规模的部署，也没有交付。为什么呢？就是他做的就是这种堆叠技术，导致散热失败。散热失败了以后会直接把版卡烧掉，这压根就没有办法去交付。到H200出来了以后说：“那这咱交付这个呗。”但是一开始依然是受困于散热问题，导致了大规模交付的延迟，一直到今年才开始去交付H200。

后面的工艺呢不断的进步，再加上全面液冷。H100这些机器是可以进行风冷的，你拿风扇吹它是OK的。但是到H200这个机器开始交付的时候，你必须是液冷。而且这种液冷呢，还不是种普通的液冷，叫完全浸泡式液冷。见过这种游戏主机装机视频的这些人，会知道他们那个液冷是怎么做的。他在芯片外面给你涂散热的胶，然后呢把这个液冷管贴上去，靠这个液体呢快速的把你热量带走到外边，再去找风扇把这个水给你吹凉了，再重新循环，它是这样来工作的。但是这种工作方式对于H200来说还是不行的，它必须是全浸泡式的，就是把整个的H200的芯片，或者包括它整个的板卡，一起泡在这个液体里头。这就肯定不是水了嘛，是一些不导电的水，整个泡在里头，才能够达到散热的这个能力。

当然了，甭管是英伟达也好，还是升腾也好，散热都是有问题的，导致什么呢？就是液冷概念股都涨疯了。你只要说我这公司是做液冷的，就赶快涨。而且现在都是浸没式液冷，就把整个板卡都泡里头。A股上强瑞科技、英维克、深林环境、飞龙股份，大概有十来家公司，都是专门做液冷的。飞龙股份是专门给升腾这个384超节点做液冷的。美股那边的话，有一个叫VERTIV的一个公司，它的代码是VRT，是专门给英伟达做液冷的公司，这个公司的股票也是涨的可好了。

讲回来，910C这个芯片连续的做长时间训练的话，液冷也压不住，直接把板卡烧掉。即使是有大量的华为的工程师坐在Deepseek公司里头，出来我帮你调，他也调不过去。实际上这些华为工程师能调什么呢？他们只能调一件事，就是CUDA里头没有实现的部分，我来帮你去实现一下。华为的这个升腾910C，他们使用的训练相关的代码的话，是华为自己开源的一套训练框架。这套框架据说是可以实现CUDA 70%的功能，但是还有30%你是实现不了的。那这一部分由华为的工程师到现场来搞定。再怎么搞，该冒烟、该着火、机器直接停摆，这个事它是解决不了这问题的。

另外一个传闻，DEEPSEEK R2出不来的原因是什么呢？是数据标注的质量跟速度不过关。这个呢也没有得到官方的证实，也是坊间在流传。因为在中国嘛，很多的数据肯定还是需要去审核一下的，这个审核的过程是相对来说比较麻烦的。

而且Deepseek呢，其实一直也是一个比较低调的公司。提前预热，不停的出来吹牛，这件事呢是容易翻车的。山姆奥特曼每次出来讲GPT5，说：“我太震惊了，我从来没见过这么棒的。”等GPT5发布的时候，大家说：“这就能让你震惊了？您到底是眼皮子有多浅？”马斯克在发布GROK4之前，也在说：“这是我所见过的最聪明的大模型。”也有人认为老马吹的有点过头了。

其他的公司都必须不断的发模型，跟着一起卷，不断的来吹牛，这个事是有原因的。为什么？因为这些公司是需要融资的。马斯克发GROK4发完了以后，马上就给XAI去融资。山姆奥特曼GPT5发完了马上融资，这公司直接值到5,000亿美金了，他现在已经是没有上市公司里头最贵的一家了。第二家应该是SpaceX，再往后是3,000多亿的字节跳动。但是大家注意，字节跳动的收入现在好像已经超过Meta了，这个是非常吓人的一个事情。所以这些人他有融资的需求，你就必须得不断的出来炒这个热点。不炒的话，你说我现在想提高估值，融资这事费劲了。而且现在Anthropic也在融资，而且是要按照1,500亿美金的估值要去融资，我估计他们后边的日子不是那么好过，现在他们的CEO应该已经奔中东，找中东土豪去给钱去了。

谷歌呢虽然不需要融资，但它后边有股市、有股价、有市值这些东西，所以呢不能落后，所以谷歌也必须要不停的推陈出新。实在做不出来东西呢，确实哪块也做的不太行，怎么办呢？你还可以像扎克伯格那样，表演抢人大戏这种行为艺术。我发2亿美金的薪水，我把人抢回来。虽然你的Llama4像屎一样，Llama再往后怎么走谁也不知道，但是看到你表演行为艺术表演的这么热闹的话，Meta的股价涨的也还可以。所以大家必须不停地去表演。

但Deepseek自己，他没有这种融资的需求，所以呢也并不太需要出来表演，自己踏踏实实做自己的事就好了。至于说他到底做成什么样，咱们也只能在外边来看。

大家有没有想过这样的一个问题：到底是谁家的芯片能够训练大模型呢？训练跟推理是完全两个不同的概念。训练你是必须要长时间高强度的工作，而且在中间是不允许停的。而且在训练的过程中，我们需要在更多的芯片之间进行数据的调度，更更大规模的这种协同。国内的这些算力服务器都搞不定这件事情，他没有办法说让这么多的芯片相互之间进行协调的情况下，这么长时间稳定的工作下去。推理的话相对来说要简单一些，可能只要几个芯片读出很少的数据来，他就可以把这事干完。比如说我们去提了一个问题，他给我们过了几秒钟做了一个反馈，反馈完了以后呢，他就可以再给我们分配其他芯片了。在这个过程中，芯片出现任何的问题，过热了或者说你对资源进行切换了，它是不影响的。所以呢推理咱们国内的这套系统是可以的，但是训练搞不定。

那么到底谁家的芯片可以做训练？英伟达这个必然是可以的。除了英伟达之外，还有哪些芯片可以进行大规模的这种模型训练呢？你说我这个芯片训练了一个10B的、20B的模型，这不算。或者说你说我这个虽然能够训练，但是我训练的模型从来没有人用过，这个也不算。现在唯一证实了可以进行大规模训练的，而且是训练这种大模型的，还被大家普遍接受和使用的，猜猜是谁？

很多人可能会猜是不是AMD？AMD MI300，或者现在应该是MI三百零几了吧，这样的一个芯片。不是他们。现在唯一的一个能干这个活的人，是谷歌的TPU。Gemini大模型是在上面训练出来的，Anthropic的Claude模型有部分声称是在TPU上训练的。除了英伟达之外就是他们了，再没有第二家了。

那老牌厂商像AMD、英特尔，号称我这个芯片是可以进行大规模的模型训练的，也给出了一些用他们的芯片训练大模型的实例，甚至呢还训练了一些不太流行的小模型拿出来去开源，但是他们训练出来的模型也没人用。AMD跟英特尔呢，一般大概也就是10B或者20B以内的这些小模型。另外一个呢就是富士通，富士通用一款ARM的CPU呢，也训练过一点可能也是10B以内的这种小模型吧，也没有听说过谁去用他们。

其他的一些ASIC芯片呢，也是号称自己能做。所谓ASIC芯片呢叫专用集成电路，像升腾、谷歌TPU呢都属于ASIC。亚马逊、阿里、百度呢，也都号称可以进行训练，但是呢没有实例。亚马逊号称是我拿自己的ASIC芯片呢，做了一些训练，也有几个模型，但是呢谁都没用过。OpenAI的模型，有些据说是在亚马逊上进行训练，但这个事呢，也没有得到最终的证实。百度呢是号称自己设计的ASIC芯片可以去进行训练，但是反正百度自己家的模型烂的跟屎一样，我们就不去评论了。

至于华为的升腾芯片呢，科大讯飞号称是在上面训练的。但是呢也有朋友跟我讲说，科大讯飞其实是在英伟达上训练出来的，只是呢对外宣称是在升腾上训练的，这个我们就不去做考证了。只是科大讯飞的模型，其实也没有那么普遍，除了一些教育领域里头有些人会去用，其他的让你自由选择的时候，很少有人会去选择用科大讯飞的模型。华为呢自己号称是在升腾模型上训练了盘古大模型，但是呢前面被内部的人指责蒸馏、指责抄袭，之后就不再有任何声音了。所以现在华为已经不再提他的盘古大模型这事了，估计是准备装一段时间的死狗以后，再次遥遥领先。所以华为的升腾模型，其实没有证实过训练成功过任何的大模型。Deepseek R2呢，应该是真的尝试过，但是败下阵来。

华为跟Deepseek官方呢，都没有出来证实，就既没有出来说我用了，也没有出来说我没用。所以呢升腾芯片，没有成功的训练出过任何一款大家普遍使用的模型。

那么国内的算力芯片是怎么样去竞争的呢？英伟达大概占54%，就一半多。升腾呢占28%，其实已经占的非常非常多了。像寒武纪等等其他的一些芯片公司的，所有的加在一起，可能还加上AMD的吧，一共占18%。这个大就是国内整个的算力芯片的一个分布情况。

国产的芯片呢，目前来看都是可以去做推理了，但是呢没有哪一个真的跑出来模型过。所以国内的算力芯片，基本上是没有办法做训练的。

现在呢还有一群的“赢学家”在鼓吹英伟达芯片里头有追踪器。但是这些“赢学家”呢，现在有点吹不下去了。他说呀：“这个英伟达的芯片里头，是不是在集装箱里装追踪器了？”还有人说：“是不是在包装箱里装追踪器了？”或者是说：“在服务器里边装追踪器了？”因为他们也知道，在这个芯片里头是装不上的。还有人说：“H20这里头肯定没有追踪器，但是呢H100、B200这个里头有追踪器。”这个呢都想多了。因为中国人是经历过挖矿的，我们是完完全全可以把芯片整个扒下来，重新拿新的版卡去焊。而且大量的，其实做英伟达版卡的公司就在国内，所以我们完全可以拿他的版卡，自己回来去加工这个事情。装追踪器这个事是没用的。

中国官方对于H20的态度呢，也很暧昧。有人就到外交部的新闻发布会上就问：“说你们是不是要准备禁售H20？”外交部的新闻发言人回答是：“没听说过这件事情。”中国的这些官员回答，一般都不会说是或者不是，通常回答是：“请你看以前的表态”，或者“请你看有关部门的表态”，或者说“我不知道”、“没有听说过”。所以他这一次的回答叫“没听说过”。

中国政府呢，也没有明令禁止说我们去销售H20或者谁去买这东西。但是呢潜规则就是这样去运营的。多家媒体，比如说Bloomberg、Marketwatch就做了些报道，说中国的监管部门针对H20芯片表达了强烈的不信任和谨慎态度，尤其是强调相关芯片可能存在后门的风险和数据隐患，建议企业回避在政府或敏感用途使用H20。所以呢这些H20可能最后去做训练就完了，推理的这块就通通交给国内的升腾384超节点就OK了。

还有报道说字节跳动、腾讯、百度等企业被召集，这些人是准备去买H20的。国内的有关部门把你们都召集一块说：“你们为什么要买这东西？买多少？”给他们开这样的会。监管侧重国家安全与网络安全审查，并未提出商业禁令，就是我们还是让你买，但是你买之前呢，我们得把你拎来稍微恶心恶心。所以现在都约谈过了。

总结一下吧。Deepseek R2呢确实是难产了，肯定的没有出来。国内的算力芯片目前呢，也无法进行大规模的模型训练，可以进行推理这个事没问题了，但是训练搞不定。20万块H100量级以上的大模型训练，国内很难突破。如果20万块串在一块可以训练大模型的话，我们可能至少需要40万块或者50万块，比如像升腾910C这样的芯片凑在一起，而且我们所需要消耗的电和时间，可能都是要呈几何级数上升的。因为我们卡之间的联通的速度是相对来说比较慢的。所以比如说H100，它也不是说一直就不坏，它可能工作个20个小时或者是40个小时都会坏一次，会出现问题，对于老外来说就可以去接受了。对于我们来说呢，我们可能要求要连续坚持500个小时不出问题，才能够回收回来数据了，因为算的慢嘛，真的达不到。大概就是这样的一个情况。

国内算力卡的这些供应商呢，很有可能会阻碍中国大模型的进展和训练。为什么呢？自己做不好，你又不让别人买H20，可能中国的大模型再往下一步走，就会变得非常非常困难了。

未来国内算力卡是不是可以训练大模型呢？反正一两年之内呢稍微有一些困难吧。国内的大模型到底能不能用呢？基本还是能跑的。高深的数学、科研研究、物理学或者这些基础学科，我们不去研究了。就是让你去做一些信息整理，现在国内大模型基本上都是可以用的。

还是稍微耐心地等待一下Deepseek的慢慢发展吧，它反正中间只要不需要融资，它也不需要出来吆喝，万一有惊喜呢？这个也不好说。这就是我们今天要讲的故事。

遥遥领先的华为升腾384超节点VS英伟达NVL72：FP16算力压H100却逊GB200，三倍功耗换自主可控值不值？

Luke Fan — Tue, 29 Jul 2025 00:57:08 +0000

遥遥领先的华为升腾384超节点，是不是又立功了？

大家好，欢迎收听老范讲故事的YouTube频道。

上海人工智能大会上，有一个镇场之宝，就是华为升腾384超节点。叫这个名字很怪，其实就是华为做的算力超级节点，华为云矩阵。384超节点这个东西，从外边看上去呢，像一堵墙一样，反正摆在厂子里头也确实比较唬人，而且也很昂贵。

很多人就兴奋了，说我们是不是又打破了西方的垄断呢？西方人对我们禁运，不给我们卖英伟达最好的芯片，我们自己造出来了。这个事到底达没达到呢？可以说部分达到了。在集群总的FP16算力上，为什么一定要强调这个？就是它在不同精度上的算力是不一样的。在FP16算力上呢，华为升腾384超节点，是介于H100和GB200组成的NVL72之间的一个算力。而这个话怎么解释呢？

现在我们去想算力，它是分三个层次的。第一个就是卡，卡这件事呢，咱肯定比不过人家，甭管你是比H100还是GB200，你根本比不过人家。第二个呢，就是叫整机，我是一台服务器。你像AMD呢，就是卖这种东西，就是我一台服务器里头有8个，他们叫MI300这样的服务器。第三种维度呢，就是说我给你卖一整个柜子，像NVL72呢，就属于整个柜子，我把72个H100或者72个GB200这样的东西，装在一个柜子里头，当成一台机器一把卖给你。

现在西方最主要的算力节点，就是NVL72。但是呢，同样的NVL72呢，它里头到底装的是H100，还是装的GB200呢？它算力是不一样的。华为升腾的384超节点，它超过了H100的NVL72的算力，但是呢，达不到GB200的NVL72的算力。虽然在其他方面呢有所欠缺，但是呢，也算是突破了一层西方限制吧。这个欠缺的部分，待会儿我们再去讲。

升腾384超节点，到底是一个什么样的架构呢？一面墙，为什么是一面墙？它是16个标准19寸机柜，这柜子的大小是有标准的。NVL72就是英伟达的，这个设备呢是一个柜子，咱是16个柜子。这个16个柜子里头呢，4个柜子是交换机，因为你这么多设备要拼在一起，你总是需要一些网络交换设备，去支撑它们的。所以有4柜子交换机，剩下12个柜子呢，是装的算力服务器。

每个柜子里头呢，是4台4U的升腾服务器。这个服务器呢，是按1U、2U，大概4U应该有这么高吧，这个就是4U的服务器，4台装在里头。当然它也装不满，这一个柜子里头应该是19U还是多少U，我记不太清了。剩下这空间，你还得放各种的路由设备、交换设备，因为你这些服务器之间，你还要通讯呢。

所以12个算力服务器柜里头，每个柜子里装了4台服务器，每个服务器里头呢，是4个鲲鹏920 CPU和8个升腾910C的NPU。所以呢，他把所有的NPU算一块，就是升腾910C的NPU，算一块呢是384个，这个名字是这么来的，384超节点。它等于是把384个NPU搁在一起，给大家干活儿。

鲲鹏CPU呢，应该是一个兼容ARM指令集的自主IP的CPU。鲲鹏早期的CPU呢，是使用的ARM IP，后来呢，为了防止美国人告他嘛，所以呢，他自己研究了一些新的架构，说我们不再使用ARM架构了，但是呢，它的指令集呢，还是部分兼容ARM的。里边装的操作系统是什么？鸿蒙，里头装的鸿蒙操作系统，但是它是专门给服务器用的。

升腾910C呢，也是一个自主架构，叫达芬奇架构的一个NPU。所谓的NPU呢，叫神经网络处理单元，实际上呢，是一种ASIC处理器。它是自己定制的一个大型集成电路，所以它不是CPU，它有自己的指令集，跟任何的CPU、GPU的指令集都不一样。这个是910C，这两个芯片呢，应该都是7纳米的芯片。但是现在嘛，华为的芯片都搞得神神秘秘的，做了一大堆7纳米的芯片，到底谁做的也不知道，怎么做出来的也不知道，反正就是7纳米的，把这些芯片造出来了。

下一件事是干嘛？就是要通讯。所有的这种算力服务器里头，实际上是三样东西。一个是GPU跟CPU，第二个呢是它的内存，这里头也有HBM内存，它的内存比NVL72给的还多，因为它里头的芯片多嘛，这个装了这么多柜子，咱总要多放一些。第三个呢，就是要通讯，卡跟卡之间是要去通讯的。

像这个NVL72，就是英伟达的这个设备呢，它里头使用NVLink呀，使用其他的一些协议，和一些专门的设备，去让它们进行通讯。不同的卡，它可以直接去调用其他机柜里头的HBM，这种高速的显存。这样的话，它的效率就会很高。拿这个设备去做大模型训练和推理的人呢，就完完全全可以把这一柜子72个GPU，当成一个GPU去使用。里头具体咋调动，你不管了，这个数据到底是放在哪个服务器的哪一个卡旁边的HBM的空间里头，你也不用去管了，它自己去调度去了。而且速度都很快，即使是跨服务器跨卡的这种调度，它不会影响任何速度。这是NVL72处理的方式。

升腾384超节点呢，服务器比别人多，里头的卡也比别人多，人家72个卡，他384个卡。他的通讯呢，肯定是处理起来更复杂的。它通讯呢，使用的是全线光模块，像NVL72里头还是有一部分是铜线的，有一部分是光模块，这个里边全是光模块，堆料堆的非常非常足。这样可以保证呢，这些芯片之间的通讯，服务器之间的通讯效率都非常高。所以为什么这里头，还有4个柜子的交换机呢？那些光模块，有些还是要通过交换机的交换以后，才可以找到下一个机柜里边的服务器，然后在里边找到你需要的地址，找到你需要的数据，才可以把它拉回来。所以呢，它整个的运作方式还是比较费劲的。

当然，光模块多了呢，也有光模块的问题，不是说我们上了光模块就完事了。光模块的问题是发热严重，它里头是个激光发生器嘛，故障率也比较高，这个玩意比较爱坏。还有一个问题呢，就是它的激光发生器的寿命呢，不是很长。所以使用这么多的光模块，它的运营维护成本和稳定性呢，都不是那么理想。

物理上连通了，那下一个问题是什么呢？我就要通过软件逻辑和分配上，我要把刚才我们讲的光模块这些缺陷，要给它处理掉。以前做工程上，有一个典型的故事，叫99米长的枪，什么意思？就是说我这个枪只能打一米远，但是呢，我要打中100米之外的那个鸟，怎么办？作为工程师来说，处理的方式就是造一支99米长的枪，把这个枪伸过去，乓一下，把那鸟打死。这个在工程上呢，并不可笑，在工程上，很多的解决方案都是这样的。

所以呢，升腾384超节点呢，也用了一些软件和逻辑的方式，来去解决光模块不稳定性的问题。它会自动的去判断说，我这不是不是光模块断了呀，还是说哪块出故障了呀，我怎么绕一下。它在每一个NPU外边挂了6-8个光模块，这坏了以后，还有其他路径可以走，我可以做冗余备份吗？

我们用了16倍的英伟达NVL72的体积，和3倍的耗电，来解决NVL72加上H100芯片所能达到的算力需求。这个就是我们现在干的活。三倍耗电这事很好理解吗？人家是5纳米或者是3纳米，咱们这个是7纳米，肯定是耗电发热要比别人厉害。人家是72个芯片，咱们是384个芯片，你比别人耗3倍的电，这个还算是好理解的一个地方。

它的功率呢，是559千瓦，开起来以后还是非常非常耗电的。559千瓦呢，还只是机器的耗电，还没算散热呢。散热加上以后的话，可能会到600-700千瓦之间的一个耗电。为什么这么说呢？升腾上一代做的类似这种东西，大概是10%的耗电量来去散热，比如这边用100瓦的电量去做了算力了，那边用10瓦的电量去做散热，他是这样来去做的。但是呢，这个384超节点，因为里边用了太多的光模块，好像是用了6000多个光模块，那么你的散热的耗电的话，肯定也是要上升很大一块的。散热不好的话，你的激光模块损耗的就会更快一些。它整个的系统完全是强制水冷，其实NVL72也是强制水冷，只是呢，它在一个柜子里，相对来说还比较好弄。升腾384超节点呢，因为在16个柜子里，整整一面墙，你要再给它配水冷呢，这个事费点劲吧，但是还是可以解决的。所以耗电比较厉害。

那么电费呢，中国还是相对来说比较便宜的。中国的工业用电呢，大概是6毛钱一度，其实美国也差不太多，我看了一下美国的平均工业用电，大概是8美分多一些吧，大概也是6毛多钱。美国有一个州电价比较便宜的，是路易斯安娜州，4毛多钱一度电。美国大概最贵的是加州，14美分，大概快一块钱一度电了。加州因为硅谷在那嘛，再加上机房也比较多，所以他那的电特别贵。中国的发电大省，比如说像云贵、内蒙、新疆这些省，如果是集中大规模的采购用电的话，应该可以做到2毛多一度电。按照咱们最便宜的电费，跟美国的平均电价去比较的话，我们的电费是他们的1/3。所以呢，我们耗英伟达NVL72三倍的电，这个也是可以接受的。所以我们依靠电价优势，勉强可以抹平成本。

升腾384超节点的生态如何呢？英伟达之所以可以打败天下无敌手，核心的原因，不是说别人造不出来这样的东西，而是呢，它有一个生态捆死了，大家离不开它。CUDA呀、NVLink呀，这些生态帮助老黄，整个的竞争过程中无往而不利。那你说我们现在做了一个升腾384超节点出来，如果大模型没法在上头跑，也没法在上面训练，这不是白干了吗？你就像英特尔搞不定这个事儿，AMD也搞不定这个事儿是一样的。虽然AMD说我造得出来，你也能将就使，但是你说我要进行大规模训练了，很少有人去选择AMD的设备。

现在呢，大规模使用的GPU其实就是两种。第一种呢，是英伟达的H100、GB200，GB300现在还没发布呢。另外一种呢，是谷歌的TPU。谷歌TPU就是说，反正我自己做自己用，我也不需要考虑兼容性问题，我就自己干了，我也不卖给别人，它的量也很大。另外呢，像亚马逊跟微软呢，都号称是自己要做GPU，特斯拉和XAI也号称自己要做GPU，但是都在号称的阶段，还没有动起来。山姆·奥特曼呢，也号称要跟孙正义一起拿ARM的IP，自己去做GPU，但是这件事呢，也停留在号称的基础上，也没有实际动作。所以现在真正广泛应用的大规模的GPU，就是英伟达和谷歌。这个里头最核心的原因就是生态。谷歌之所以能够大规模应用，就是我不管生态了，反正我自己使，你们不需要跟我兼容就完事了，否则根本没法跑。

咱们说回来，华为升腾384超节点，它的生态怎么样呢？第一个呢，是华为自己做了一个叫MindSpore这样的一个开源的推理和训练框架。你说我现在想用升腾384超节点，去训练我的新模型，你就使用它这个玩意就可以了。它呢，大概可以兼容70%-80%的CUDA指令，但是毕竟不能完全兼容嘛，你如果原来已经习惯了CUDA的编程的话，你可能到这边来去做训练，还是有问题的，你还是要去花时间去做迁移的。另外呢，PyTorch、TensorFlow、Hugging Face Transformer这些框架呢，升腾呢，也专门做了兼容性适配，就是我专门写一个模块，你只要带上我这个模块以后，你这个PyTorch，你的TensorFlow，你的Hugging Face Transformer，这些推理和训练框架，就都可以在升腾的384超节点上跑了。所以呢，如果大家说原来的这个系统，是在PyTorch上跑的，你也不需要再去做迁移了，直接在它这上就可以跑了，兼容性他们都给你测好了。所以呢，属于叫部分的兼容吧。

如果你真的是说我训练新的大模型，建议大家还是不要跟自己找不痛快，还是老老实实的去使用英伟达就完了。但是你说我拿回来做做推理，拿来去做一些后期的使用的话，升腾384基本上是够用的，没有什么太大问题，你只要别嫌它占地儿，别嫌它耗电，这个东西还可以使。

那你说为什么不能拿它做训练呢？刚才不是说它可以训练吗？而且训练的算力也不差。大家注意，训练呢，是一个非常长期的这种连续任务，你中间停了坏了以后的话，你是需要重新干的，你说让他接着往下干，这事很费劲。它里边有大量的光模块，而且这个玩意的故障率很高，寿命也不是很长。你如果跑着跑着出故障了，里头有一个光模块烧了，你的这个训练呢，未必会停下来，因为它通过了一些软件方式，让你去规避这个错误。你可能只是说我训练的过程中，哪一些数据取回的速度变慢了，但是呢，我还在接着往前慢慢跑。但是也有可能跑着跑着就直接出错，咔嚓就扔那了，这个可能性是很大的。

你像马斯克，他自己用的10万块H100，Meta这种几十万块的H100，他们去做这样训练的时候，还经常是说我跑着跑着突然就退出了，突然就崩了。那崩了怎么办？重来一遍呗。对于他们这些平台来说，你可能跑10次崩个两三次，但是你对于升腾384这样的超节点来说，你可能跑10次会给你崩个八九次，这个也许就突破忍受极限了，就没法忍了。他大概就是这样的一个情况，就是有些情况呢，咱们能用了，有些情况还是稍微费点劲的，跟它整个的硬件架构是有关系的，跟它的兼容性也有关。它毕竟没有100%兼容CUDA嘛，所以大家在CUDA上做训练的代码，拿到这边来再跑，还是会有很多问题的。

那你说华为升腾384超节点，最大的作用到底是什么呢？第一个呢，还是给国内算力中心了一种新的选择，否则你没得选，你只能是要么拿自己的卡或者服务器，这种完整可以拼在一起的算力节点，也算是一个工程上的突破吧。信创产业也算是填补了零的空白，因为现在很多是要求信创嘛，所有的必须是自主可控，自主的操作系统，自主的CPU，自主的GPU，所有都要自主的。我们现在迷信这玩意，原来呢，这些人没得选，现在等于是有的选了，也算是一个工程奇迹，就是99米长的枪。这个故事呢，大家别觉得可笑。

H20的库存呢，前面老黄在中国各种的表演之后，算是把他这个库存清了。川普呢，又要带着企业家来访华了，下次谈点什么，大家要想一想。上次黄仁勋是怎么去说服川普，说把H20解禁的呢？是告诉川普，华为的升腾910，已经基本上可以达到H20的水平了，你再不让我卖，我这就没意义了，人家也都做出来了。所以他把H20卖了。现在是华为升腾384超节点出来了，他说你看我这H100，加上NVL72的整个架构的性能，也被人超过了，咱就卖吧。至于GB200这个呢，咱们再看一看，现在它还没达到，不行咱们再把这个摁住了，或者说等我这个GB300出来了以后，咱们再把GB200的这套东西卖了。可能下一轮的解禁就要来了嘛。所以大概率川普老爷子还是比较好面子的，等他下一次带着企业家团队、一对CEO团队来访华的时候，H100的NVL72就可以卖了。

总结一下，升腾384超节点在工程实现上，确实有遥遥领先的地方，有一些敏感单位，可以选择全国产设备了，这个原来搞不定，现在可以搞定了。有很多瑕疵和不稳定的地方，用的越多，迭代越快，改进的呢也就越好，永远都是这样的。第一次拿出来都是磕磕绊绊的，第二版第三版第四版，慢慢就改好了。这个对于突破海外封锁，让美国进一步放宽管制来说呢，是有巨大作用的。如果是商业公司，哪怕你去选择H20，也比选择升腾384要划算。如果你不着急的话，可以稍微等一等H100，我相信H100在今年可能很快就会解禁。如果后面美国进一步放宽管制的话，英伟达的股票大家可以再关注一下。董王呢，是一个好大喜功的狡诈商人，黄仁勋也是。变化应该就在不远的将来。

好，这个故事就跟大家讲到这里。感谢大家收听，请帮忙点赞，点小铃铛，参加Discord讨论群，也欢迎有兴趣有能力的朋友，加入我们的付费频道。再见。

Meta为何砸下百亿重金投资而非直接收购AI数据标注巨头Scale AI？揭秘扎克伯格剑指AI生态霸权，欲借华人天才少年之力挽救Llama开源模型困局的深层战略与考量。

Luke Fan — Wed, 11 Jun 2025 00:43:17 +0000

Scale AI得到了Meta超过百亿美金的投资，AI圈又热闹起来了。大家好，欢迎收听老范讲故事的YouTube频道。

Scale AI这个名字怎么好像在哪听说过呢？好像有点耳熟，对吧？他呢，有一位特别传奇的CEO，或者叫创始人吧，叫华人天才少年CEO亚历山大王。当时呢，跳出来指责DeepSeek用H100的就是他。

DeepSeek R1到底是怎么训练的？引起了广泛的关注。DeepSeek自己讲呢，我使用了2,000多块的H800就完成了训练。但是亚历山大王呢，在一次接受采访的时候就出来说了，中国实验室里边拥有的H100的数量远超大家的想象，DeepSeek自己至少有5万块H100。但是这个话呢，没有实际证据，讲完了也就完了。DeepSeek跟亚历山大王之间呢，并没有就这个事情进行认真的探讨，所以这个我们把它当成一种谣传吧。

3月份呢，DeepSeek自己再次发了声明，说他们训练的都是使用的合规的GPU，也就是允许向中国出口的这些GPU。因为如果不说这个的话，美国就有可能要求说禁止使用这玩意儿。DeepSeek就讲了说，甭管是R1也好，V3也好，训练呢都是使用的H800，或者是后面的H20这些GPU训练的。

黄仁勋来北京的时候呢，还专门跟梁文峰两个人坐在一块去沟通过，肯定是对得上口径。所以呢，这应该是唯一的事实，不要再去猜测到底有多少H100在DeepSeek手里这件事情了。

这位华人小哥呢，这件事让我记住了，因为他也是个很大的公司，估值250亿美金的公司。因为它是一个ToB的公司，是为别人服务的公司，所以不太跟普通用户打交道，很多人没有听说过。

Meta的投资呢，这一次算是有点一反常态。为什么呢？你说互联网企业出来投资个别人项目，不是很正常吗？不行，这个里头，美国有一家比较奇特的互联网企业，中国有一家比较奇特的互联网企业，都是不怎么投资别人的。美国的就是Meta，中国的是拼多多，就是我自己有钱，自己就憋了死干，不怎么投资。

但是Meta呢，还不太一样。扎克伯格的原则是什么？叫收购或者埋葬，要不然我把你买下来，要不然我把你干掉，这就是不服就干那种状态。所以我一直说，Meta这个公司的玩法挺中国的。而且到目前为止，因为扎克伯格是创始人，依然在管理Meta，所以Meta还是有非常强的创始人风格的。

像皮才管理谷歌，或者是提姆库克管理苹果这样，这就是职业经理人了，他们是没有什么风格的。

但是，扎克伯格的风格就是这样：买你，或者把你干掉。到目前为止，唯一失败的就是Snapchat。这个没买成，也没把人干掉，其他的都算是成功的。

Meta过往的收购历程：

2012年，10亿美金收购Instagram。现在Instagram也是多么如日中天的一款产品。2013年，曾经想用60亿美金去收购Snapchat，被拒绝了，没把人干掉。这是唯一的败绩。

2014年，190亿美金收购WhatsApp。现在有这么多的人使用WhatsApp。除了中国使用微信，美国可能Facebook message跟WhatsApp是各占一半儿。泰国、日本、台湾使用line，其他的国家都是使用WhatsApp的。

2014年，20亿美金买了Oculus，就是现在我们看到的Meta VR产品。2020年，4亿美金买了一个公司叫GIPHY。这公司干嘛的呢？是做动态图标，或者说一个通俗易懂的话，就这公司做表情包的。

2020年，10亿美金买了一个公司叫Kustomer。它呢是k开头，这个是做客户服务CRM平台的。因为呢，Meta有大量的广告业务，很多人需要通过Meta去进行一些管理，干脆我花钱买一个吧。

2023年，4亿美金买了VC unlimited这样的一个公司。这个呢是虚拟现实内容开发的。你想他做了这么半天VR产品，VR产品的内容很难开发，那我干脆买一个吧。但是这一次呢就有点费劲了，虽然钱不多，4亿美金，他被FTC，也就是美国联邦贸易委员会起诉了，说你这个是要垄断。你自己做Oculus，Meta自己的VR产品，你还把提供VR内容的公司买下来，这事有问题。后来胜诉了才完成收购。2021年就跑去收购了，到2023年胜诉了，才把这个收购完成。

这一次投资而不是收购呢，应该也是怕FTC起诉他。因为Scale AI是整个AI数据标注行业的老大，绝对龙头。那你要把它收购下来，肯定是要被起诉的，而且这次可能还打不赢这官司。250亿美金的估值，直接投进去100多亿美金，基本上也算是控制了，但是应该没有控股。这种公司你控股了估计都会被起诉。微软不敢控股OpenAI，应该也是同样的原因。

那么，Scale怎么就这么敏感呢？咱们好好看一下Scale到底干嘛的。Scale AI和他的天才少年华人CEO，你看这么多定语在前头，咱们稍微给大家介绍一下。AI时代三要素，大家还记得是什么吗？技术、算力、数据。

这个Scale AI就是做数据的。Scale AI是世界上最大的数据标注公司，它的估值是竞争对手第二名的10倍。就是它250亿美金，在它后边跟它竞争的人25亿美金。

Scale AI的客户有哪些？微软、OpenAI、Meta、谷歌、亚马逊、英伟达。做大模型的公司都是他客户，然后做汽车的公司也都是他的客户：特斯拉、Volvo、Cruise（就是通用做的这个无人车公司），还有丰田和通用都是他的客户。Paypal、Airbnb都是他客户，三星以及美国国防部。

一旦美国国防部成为你的客户了，你就很难被收购了。我原来服务过的一家公司叫Borland，Borland到最后就想被人收购，说我已经玩不太下去了，谁来买我？卖不掉，为什么？他也是有一个客户叫美国国防部。他当时是给好像海军陆战队，还是给谁去做指挥链路的数据链系统。其实也不是一个特别底层的服务，就是做了这样的一个项目以后，谁想收购他就需要经过特别严格的审核。到最后也没有被收购成功。

这也是解释了为什么Meta不能收购它，只能投资它，连控股它都不能。第一个，它的位置很尴尬。它是所有这些做AI项目的公司的数据提供商，你一旦把它收购了，你就又垄断了，FTC一定会起诉它。另外一个，他还有一个很重要的客户叫美国国防部，一旦收购他就会被很严格的审查，这种案子基本上没法通过。

再讲一下这位天才少年华人CEO吧。这个亚历山大王呢，1997年出生于美国新墨西哥州，父母为洛斯阿拉莫斯国家实验室的物理学家。这就是物理学家生出来的天才少年。为什么叫少年呢？就是他创业的时候一定要特别年轻才叫少年。高中时候就获得了USACO（也就是美国计算机奥林匹克）的金牌，所以算是根红苗正。

曾经被美国的Addepar和Quora等公司破格录用，担任过Quora技术主管。在担任主管时主导了推荐系统的优化，使得问答匹配效率提升了40%。Quora呢其实是知乎抄的它，就算是美国版的知乎，全世界最大的问答网站。这个里面的推荐系统是亚历山大王优化的。

再往后呢，就是美国这帮天才少年CEO必须要干的一件事儿，是什么？叫辍学创业。2015年以满分GPA考入了麻省理工学院（就是MIT），大一期间因为Alphago引起的AI热潮，决定辍学创业，就创立了今天的Scale AI。Scale AI的种子轮融资是YC给的，给了12万美金。YC的CEO是谁？或者说给他钱的人，这个人叫什么？

这个人叫山姆·奥特曼，所以这个圈子真的很小。

然后，Scale AI的发展历程是什么样的呢？2016年，亚历山大·王19岁辍学创业。最开始呢，是在这个AI圈子里头叫“拉框”干这个事的。什么是拉框呢？就是给自动驾驶领域标注数据。自动驾驶里头有很多的摄像头、激光雷达呀。实际上，激光雷达也是个摄像头，只是拍出来的是一个黑白的、深度信息的照片。然后，哪个地方是人，哪个地方是车，哪个地方是牌子，或者说交通标志标线，你呢，需要靠人去拉一个框，把它标注下来。所以他最早就干这个。像什么Waymo（就是谷歌的自动驾驶公司），还有Cruise这些无人驾驶车的公司呢，最早的数据都是从他这来的。

全球首个规模化众包标注网络，涵盖50多个国家和10万名标注员。你标这个事情，他肯定是很耗人工的嘛。所以呢，他最后说：“我们众包吧，你们谁愿意标，谁就在我这平台上去注册，你来给我标来。”所以呢，他干的活叫“数据处理的人肉云计算”。虽然是云计算，但是底下都是真人。“越人工越智能”就是从这儿来的。

逐渐发展到为整个行业提供高质量的数据。它等于是从拉框开始，到最后，比如说OpenAI使用的各种对话数据什么的，都是由Scale AI来去标注的。后面和美国国防部合作，标注军用数据。你说这个无人机满天飞，导弹满天飞，我怎么能够说把正确的目标炸中了？那你也需要拉框，你也需要去做标注，看清楚这个是平民，那个是军用目标，你要做这样的标注。这个都是Scale AI提供的服务，包括伦理服务，包括对齐服务，他都要去提供。

而且呢，他也对标注呢进行分级。你说：“我是一个普通标注员，一个小时8美金，我去给人拉框去。”你说：“我是一个医学博士，那你可以来标注什么呢？医疗数据。”现在医疗影像数据也都标注过了，你是可以直接用大模型去进行什么X光片读片的，那个效率非常高，而且要比普通人读的还要准。

现在全行业的数据都有标注：医疗的、多模态的数据、国防的，各种数据它全标了。应该是全世界最大的一个，而且标注数据最全的一个标注公司，就是Scale AI。

下面咱们来讲一讲Meta为什么给了这么多钱给Scale AI呢？你说你花钱买的服务就完了，你干嘛要去直接100多亿美金砸进去呢？按道理来说，像我们投资案子有几个阶段。第一个阶段就是占20%以内，250亿美金，20%的话应该是50亿美金吧。为什么是这样呢？花钱投了，你也拿到钱了，我还不影响报表。超过20%呢，叫重大影响。

每年，Meta出这个财报的时候，你要把它也审计一遍，才可以去投超过20%。所以，像我们以前经常投资的，投19.9%就是为了躲避这个审计成本。

还有呢，就是直接控股，直接占51%，那我说了就算，甚至可以把CEO干掉，剩下我自己管。再往后就是我直接把你并购进来，整个公司的这个财务报表全进来了。特别是这个公司有很大的用户数据，或者有很大的营收的时候，你把它买下来是很划算的。买下来以后，就可以跟自己原来的业务去做整合了。

那么，在他这干这个活就很怪，给的钱很多。你想，250亿美金的估值，他给了100多亿美金，就属于绝对超过20%。但是呢，又不控股。不控股的原因咱们刚才也讲了，国防部的项目，你要敢控股它，你就等着接受审查吧，这事很麻烦。

那为什么要给这么多钱呢？这个不符合投资逻辑。那咱们来分析分析这件事情呢，还是要从Llama 4的翻车开始说。Llama呢，是开源大模型的领军，Llama1、Llama2都算是领军。到Llama3呢，很多人都在这上面去进行开发，拿Llama3去做微调，拿Llama3去构建自己的系统，构建自己的模型。但是还被DeepSeek跟千问直接抄了后路了。

你说现在最好用的，可能DeepSeek R1是所有开源模型里最好用的（咱不跟闭源的比）。使用量最大的千问，为什么千问使用量最大呢？也还算好使，而且呢，它提供的特别全，从0.6B的一直到200多B的，就是各种大小全都给了。大家去微调模型的时候，肯定是选一个自己合适的拿出来用。

Llama4就翻车了。第一个给的模型的版本就很少，你说我想找一个小模型去微调，他没给。另外一个翻车的核心原因是什么？就数据不行。他呢，使用的是合成数据。在训练Llama 3的时候，其实基本上已经把全世界能用的数据都给用光了。等到Llama4的时候，你说我要继续提高数据量，更大的规模去进行训练，那你这数据哪来呢？基本上能用数据都用掉了呀。

那么，Llama这帮人想了，是我们干脆合成吧，自己合成一堆数据去训练吧。结果Llama4就翻车了。合成数据三大致命缺陷：第一个是什么？叫领域泛化能力缺失。

什么叫领域泛化能力？Meta其实有的是数据，你想它几十亿用户，大家每天在上面聊个天，发个动态，它有多少数据？它是最不缺数据的。全世界可能不缺数据的公司，一个是谷歌，一个是Meta，其他人都没有他们这么多的数据。但是呢，Meta的数据有个问题，Meta的数据呢都是日常对话。

咱们在里头聊个天，在里边发个日常动态。其他领域的数据，比如医疗、国防，这些领域的数据它是没有的。导致呢，M4在垂直领域里的应用基本上全线崩溃。你问他说：“这个人今天是不是开心？”他可以回答得很好。你给他张片子说：“这个是不是有癌症？”他都答不出来了，这很正常嘛。

第二个呢，就是多模态对齐失效。什么叫多模态对齐失效呢？Llama4生成了很多的图片，说来：“咱们拿这玩意儿去做实验吧，咱们拿这个东西去做这个训练吧。”但是呢，Llama4的很多训练的生成数据本身是错的。比如说吧，他生成了一个红色轿车在雨中行驶的一张图片，但是呢，雨滴的方向跟车的运动轨迹是错的，这个就没法整了。Llama自己生成图片的能力就很差，他再拿这种数据去训练的话，就一定是各种错误就都出来了。

第三个呢，就是鲁棒性对抗不足。很多黑客呢通过注入对抗样本，也就是说把一些错误数据扔进去，导致呢Llama4的图像识别的准确率直接从89%降低到12%。这就是Llama4使用自己生成的数据，或者叫合成数据，训练出来以后翻车的一个核心原因。

那哪里摔倒了在哪里爬起来呗，就数据不行吗？咱就整数据就完了。Llama自己又不缺数据，那么多用户数据咱们就标注呗，花大钱把它买下来。虽然现在不让买嘛，但是我花大钱基本上还是能控制的，应该算是第一大股东了。有了Scale AI，我们就算把最后一块短板给补上了，这个就是煤炭为什么要投资它的原因。

但是呢，这里还有一个问题，就是刚才我们讲了投资逻辑。我投个19%就不就够了吗？为什么要投这么多呢？这肯定是第一大股东，已经超过亚历山大王的这种创始人的股份了。那你到底想干嘛呢？

Meta自己现在的战略其实是很清晰的：60万块显卡，算力我有了；杨乐坤大神在这呢，技术我也有了；不就是缺数据吗？Scale AI我是第一大股东，基本上控制住了。而且开源大模型我原来是领军人物，现在被DeepSeek跟千问超越了。那我现在要靠什么东西弄回来？你说我光靠提供Llama4的能力，或者后边比如说我出一个Llama4.1、4.5，我把能力提上去，我就能够战胜DeepSeek R1吗？我就能够战胜千问吗？胜不了的。

那怎么办呢？大家想一想，Scale AI它的客户都是什么人？它的客户比如微软。你说我用了Scale AI训练完，标注了数据了，我后边能够用Llama吗？这不可能。OpenAI你说我后边用Llama去……

这也不可能。那谁会去用Llama呢？大家要想一想：除了最大的这些Scale AI的客户之外，其他那些小一点的Scale AI的客户，他们请Scale AI去标注了数据以后，这些被标注的数据拿去干嘛用了呢？训练自己的大模型去了？开玩笑呢！只有最大的这几家公司——谷歌、微软、英伟达、OpenAI这样的公司，你是标注了数据回去训练大模型了。所有小一点的公司，或者说除了这几家之外的这些公司，你用Scale AI去标注了数据回来，只能干一件事儿，就是微调小模型。

现在好了，Meta把Scale AI基本上算控制了——虽然不是控股，但基本控制了。那以后用Scale AI标注的数据，微调谁家的大模型效果最好呢？一定是微调Llama家的大模型效果最好！内部是一波人各种的优化，咱们自己内部的搞定完事。原来大家都是拿这个Scale AI标注的数据去微调千问的模型，现在不用挑了，一定是自己家的最好。所以呢，这算是AI生态建设的关键一步，直接形成了闭环了：你用Scale AI训练，你用Scale AI标注数据，然后我给你同时提供微调解决方案，一次搞定哈！这是这一次Meta投资Scale AI的一个底层逻辑。

但是因为Scale AI的行业地位，一旦收购必然被FTC起诉，再加上Scale AI是美国国防部的供应商，一旦收购必然被美国国防部去审查，所以Meta就被迫采取了这样的一种很不舒服的投资方案——投了100多亿美金，成为Scale AI的第一大股东。这个故事到这儿就跟大家讲完了。

感谢大家收听，请帮忙点赞、点小铃铛，参加DISCORD讨论群，也欢迎有兴趣、有能力的朋友加入我们的付费频道。再见！

Elon Musk把原本属于Tesla训练FSD的NVIDIA H100显卡，划给了xAI去训练Grok。特斯拉股价下跌。更可怕的是，马斯克透露，特斯拉已经买到的H100，正躺在仓库里吃灰。

Luke Fan — Tue, 11 Jun 2024 11:33:14 +0000

好的，让我们开始讲下一个话题。马斯克把特斯拉的1.2万块H100给了XAI，这到底是什么情况？特斯拉在6月4号的消息，是英伟达报的料。1.2万颗H100转交给了XAI，这个直接就给了，肯定是不行的。它呢，其实是插队。什么意思？就是大家现在都在排队，等着拿英伟达的H100。马斯克的两个小伙伴都在上面排队，特斯拉也在那排着，CI也在那排着。

大家知道XAI最近拿着钱了吗？所以他现在急需要这些H100。而特斯拉呢，现金其实也还有，但是稍微有些下降，现在也没有那么着急用的地方。所以说来，我这1.2万枚，本来应该是特斯拉排到队了，SAI你先拿去用吧。等这个SAI买的1.2万枚排到了以后，特斯拉再用。但实际上是干了这么个事。

那么这个事情出来了以后，大家其实没有心思管理，到底是怎么干的。特斯拉的股价是先跌为敬。这个一看，马斯克也觉得心思都这样了，不干了，对吧。咱们就直接下跌就好了。今天是6月的7号，再过一个礼拜，6月13号就是什么节点呢？特斯拉的股东大会，投票截止日期啊。他会公布结果，马斯克的薪水到底给不给他，6月13号就要出数了。现在呢，可能好多股东，像我上次连线的那个引滴购，已经寄信寄去了，说我们同意把薪水给马斯克。但是现在一堆的大股东，他们发声，有人听着吗？

都说我们不想给他基金呢，已经通过投资这种XAI，已经确认了价值。就是万一马斯克你真干不下去了，拉着人跑路了，去XAI吧。我们已经都赚这钱了。那股民呢，现在估计有一些人在做空特斯拉了。啊，这个具体你就不知道了啊。咱们就不做任何的投资建议啊，一定要说清楚。

那大家想没想过，英伟达为什么在这个时候去给他爆料呢？就本身这件事没人知道啊。我跟英伟达说一下，哎，家里俩孩子啊，老大排的号，待会让老二先看病，等到老二那个号到了时候，再让老大看病去。对吧，就干了这么个事情的。英伟达为什么要给他泄露出来啊？这个是英伟达内部邮件泄露啊。就是英伟达内部有很多的邮件在沟通，说先给谁后给谁啊，怎么排号啊啊。这个是泄露出来的。那你说，是不是资本黑手在后面运作呢？大家就想在这个时候做空特斯拉股票，再整点新事出来。债多了不愁，虱子多了不咬啊。对吧，是不是这样的情况啊？可能性是存在的。

但是另外一种可能是什么呢？就是英伟达这些小兄弟们不开心了。谁是英伟达的小兄弟？就是像什么超微电脑啊，戴尔啊这些公司，就属于英伟达的小兄弟。对吧，拿着英伟达的这个GPU回来，自己去装服务器，然后再把服务器给人，在机房里的部署起来。他说挣这个钱啊。那这些小兄弟为什么不高兴呢？当然知道，这个特斯拉自己用的那个超级电脑叫Dodo啊，Dojo。

这个超级电脑里头用的GPU呢，也是H100啊。A100，H100就是用的这种东西。这个电脑，是谁做的呢？是一家叫做盛弘科技，他们给做的。这公司呢，在深圳啊，是一家妥妥的中国公司。这个公司呢，其实是做什么呢？就是特斯拉自动驾驶模块，特斯拉的三电系统，特斯拉的车身监控系统。它是一个TIER one的这种汽车配件商啊，做PSB的，做PCB板材的，这样的一个公司。它呢，是一个妥妥的叫特斯拉供应链公司，啊等于是特斯拉说来，我们自己这么多公司，都可以生产各种板材，咱就自己干呗。所以呢，这些大厂，它其实是就包括前面讲的什么，创维电脑啊，什么戴尔啊，他没挣着这笔钱。你要想把这H100送到特斯拉去啊，组装出这DOJO这个机器，这个过程呢，肯定还是需要特斯拉供应链的人给他干活的啊。那么这个呃，是稍微有些费劲。而且他这里还有一个什么问题？你这些H100不能到中国来，那怎么办？那这个深圳的公司怎么给你装起来？这个也是一个比较麻烦的问题吧。这个是现在英伟达的这些小兄弟们，没准他们不高兴了啊，给你点个炮啊，搞一下。马斯克呢，也回应了。马斯克的回应是什么呢？他说特斯拉的H100在仓库里放着，这些事都没有什么东西。但是大家要注意啊，特斯拉的H100在仓库里放着啊，这句话的潜台词就是：特斯拉的H100其实是富裕的啊。

用不起来的啊，搁那搁这呢。而且特斯拉呢，因为裁员的原因，导致特斯拉的数据中心其实建设是相对来说比较慢。正在德克萨斯机房里头建的DOJO的新的机器呢，现在应该也是比较慢啊，没有那么快速就把这个机器建起来。所以呢，现在特斯拉的H100，就是你再给他1.2万块，他其实是用不起来的。就是马斯克的意思是这样。然后特斯拉的日子呢，其实并没有那么好过啊。销量下滑，一季度滑的很惨啊。但是5月份扬眉吐气了啊，特斯拉5月份在中国卖了4万多辆车。呃，特斯拉在中国5月份，大概产了5万多辆车，剩下的车出口了，直接扬眉吐气了。但是呢，他前面一季度，跟中国的国产新势力竞争啊，打的很惨，只能是降价。再加上什么呢，欧洲减退了啊，或者叫削弱了电动车普及的这进程。所以对于特斯拉来说呢，都是相对来说的坏消息啊。那么整个的利润也在下降，就虽然车卖的少了，挣的钱还少了，因为什么呢？打价格战嘛，你降价呀，那肯定利润下降，没什么好说的。库存呢在增加啊，以前的特斯拉库存是一周的，有两周的，最早的时候特斯拉是要定了。现在特斯拉的库存已经达到一个月了，大家注意啊，汽车这种东西，放在库存里是非常吓人的，它非常非常的吃大家的资金啊，叫资金占压，这个事很麻烦。而且特斯拉的库存呢，跟其他公司的库存还不一样，为什么呀？特斯拉是直销公司。

就是你现在看到的，大街上这些特斯拉的专营店，都是特斯拉自己家的。所以，他的所有库存，这个包袱只能自己背着。他跟传统的车企哪不一样？传统车企下头有4S店，有经销商。那我把车造完了以后，我可以要求经销商压货啊。那么，这个库存的容量就要大一些。但你现在这个等于都是自己的，背着暴力一边审。你送到这个4S店去，只要还是特斯拉，自己把这个货压在那了，他就会比较麻烦。所以，特斯拉真正遇到的问题呢，不是销量下降，也不是竞争，也不是什么欧洲减缓的电动车普及，都不是，而是现金流在下降，就是他手里现金变少，这个是很危险的啊。

这个一季度财报里头，特斯拉手里的现金少了22亿美金啊。但是，手里现金还比较多，他现在还有269亿美金的现金在手里头啊，或者叫现金等价物吧啊。所以他还是可以玩的下去的，要一个季度少22亿，就至少还可以跑10个季度，还可以跑好几年呢。你只要别瞎造景，这个钱还可以跑啊啊。但是，马斯克号称，不是特斯拉要投入100亿美金去做AI吗？269亿你这边扔100亿进去，那边在不断的流血，这个事呃，有乐子看了。

FSD呢，现在中国区啊，也没有那么快啊。说号称FSD在中国落地，这为什么呢？因为据说啊，上海计算中心展缓了。就是他如果FSD在中国落地，他有可能在上海啊，应该也是在海边上吧，建一个大的计算中心。

现在这个事情也在慢慢往下顺延，这个事。而且现在FSD，据说已经给中国的所有特斯拉员工都推送了，就是特斯拉员工，现在已经可以开着FSD的车上街了。但是呢，这个还是在国内推广有一点点扑朔迷离吧。咱们再讲，马斯克现在干这活违不违法？咱们讲了说哎，马斯克把这个排号老大的号让老二先上了啊。那么这个事到底违不违法呢？

这件事啊，AX AI是属于x啊，x的这个投资人占有XAI 25%的股份。XAI是让后边是Twitter。如果仅仅是调整一下排队顺序，其实关系并没有那么大。你说我也不是说就不给他了，特斯拉花的钱，还是可以得到的。只是晚得到一点。你现在拿到这些GPU，你也只是让他在仓库里面吃灰，没什么必要啊。稍微等一等没什么问题。

但是如果用另外一个角度来思考，马斯克就有可能违法。这个角度是什么呢？这个角度是操纵证券市场啊，放假消息这个事呢，是有可能会被处罚的。那你说他咋操纵证券市场，放假消息了呢？呃如果这个事属实了，挨打的不是马斯克本人啊，挨打还是特斯拉。

特斯拉是一家人工智能公司，我要花100亿美金去做AI研发，这个呢都是马斯克自己说的，在4月份发财报的时候讲的。对吧？说任何人怀疑特斯拉是一家AI公司，你们都不应该成为特斯拉的股东啊，基本上算是原话翻译过来。现在英伟达指出的是什么呢？（注意：原文字数超出，但根据要求未做内容删减，仅添加了标点和分段。）

英伟达说，你特斯拉并没有投入这么多钱去做AI。你手里明明已经到货的这个H100的显卡，你没提货对吧？你让你的兄弟给提走了。这个是假消息啊，你只是出来虚晃一枪，这个事是不行的。如果在这个时候股价发生下跌了，那么特斯拉很有可能会面对集体诉讼啊，说你马斯克在这吹牛啊，什么也没干。你号称100亿做研发，结果你连卡都不买，还给了自己另外一个儿子啊，偏心，铁铁的集体诉讼上去啊。

因为我以前碰到过一次类似这样的事情，就我原来在Boland的时候。Boland号称要分拆对吧，我们要把开发工具，当时费什么要拆到另外一个地方去。然后这个事呢，也是CEO当时就宣布了，宣布完了以后找了一圈人买嘛。最后价格没谈拢，没拆出去。那么到年底了，这个就是叫什么叫放假消息。当时是给了一个警告，就是纳萨克发了一个黄牌警告过来，并没有罚款啊。但是你如果长时间这么干是会罚款的。所以他一般级别是啊警告罚款啊。如果再严重了，有可能会去坐牢啊，这个是可能性是存在的。

但是对于这种事情的应对方法也很简单啊，怎么干裁员？哈哈，像我们当时拨了呢，就是遇到这个警告牌下来以后，马上做了一波裁员，说你看我裁员了，我整改了，然后这个事算混过去了。

英伟达呢，股价昨天是超越了苹果，但是呢也马上迎来了反垄断调查。这个也很正常，他的市值吧。

短暂的占上了3万亿美金，现在3万亿美金往上呢，大概只剩一个了，就剩微软了。所以今天我去看了一下，英伟达跟苹果市值呢，都是2.97万亿美金，都到这样的一个位置，你都是这个全世界第二估值、市值的公司了。你还不反垄断一下，美国这个反正有关部门就吃白饭了。这事肯定不对，一定要上来收拾一下。所以这个事情是必然的应有之意，这是一方面。

然后另外一个问题是什么呢？就是国内现在，其实出现了一个比较奇怪的事情，就是算力淤了。所有的算力、显卡什么都在降价，这是国内现在比较奇怪的事情。就是AI到底是不是泡沫？其实现在很多人呢，也非常难过啊，为什么？因为你再去训练大模型，大模型变得越来越厉害，这个事大家是可以看到的。但是呢，没法挣钱，对吧？没有哪个大模型公司挣钱呢，他没法形成良好的闭环啊。这个是现在对于所有的AIGC行业，都是一个甭管美国还是中国，都是很难解决的问题。而中国人呢，又更着急，说你必须马上给我挣出钱来。所以，现在国内的所有的显卡都是余的啊，千万不要说啊，禁用了国内没有显卡用了，李娜远去了啊，完全是反过来的。

在这样的情况下，英伟达的股价到底能不能支撑下去？如果大家觉得哎呀，这个实在烧不下去了，是不是这个国外，比如说在美国，也会短期内出现显卡淤积的情况啊？你到那个时候，你觉得英伟达还能值几万亿美金呢？啊。

这个其实还是值得思考的一个问题。那么有没有人想过说，为什么大家不想让马斯克好过呢？啊，很多中国人都觉得忠君爱国一下，马斯克你劳苦功高，我们一定要好好的犒劳你一下，我们要忠诚一下，这都会这样来想这个问题。但是你发现，国外大量的这种很有影响力的大股东、大基金，他们都想让马斯克难过啊。这到底为什么原因呢？其实也很简单，就是马斯克的经历实在太分散了。对吧，又是X，又是这个Space X，又是这个Starlink，还有那个Starlink，就是那个啊，脑机接口啊，还有太阳能的Solocity啊。Solocity是现在属于特斯拉了。这么多东西你都在那看着，你哪玩的过来啊？对吧，这个是大家觉得比较痛苦的。

甚至呢，有一个人还指出来了说，你看，根据特拉华和美国的股权法，就像麦考密克法官的判决那样，就前面判决马斯克薪资啊，有问题直接给他驳回。那个法官就是麦考密克法官。他说什么呢？说XAI、推特、接口Salink、BORING这些公司，都是特斯拉首席执行官在其全职任期内创建的实体。根据股权法，上市公司的CEO不可以兼职。因此，这些公司是利用特斯拉的时间创建的，所有资金属于股东。就是现在有人在跟他较这个劲。如果这个事件真的叫下来以后，那就好玩了啊。因为他们现在美国就规定，你如果在上市公司当CEO，就不能有这么多的兼职。

你就不可以再干别的了。但是，马斯克呢？你像刚才我们讲了，干了一堆的事。那他们就说，这些啊，都是属于特斯拉的，不应该属于他们各自的股东或者什么样。或者特斯拉在里头，应该是占有一定的分量的。因为你这马斯克，这个CEO是属于特斯拉的啊，现在。如果得不到马斯克怎么办？说这马斯克，你就四处这个掖着啊，你就没法安心来干。怎么办？而这个办法呢，就是咱们不行，找个像提姆库科这样的守城之君，不行吗？对吧。就像我们得不到乔布斯，我们整一个提姆库克。哎，我们得不到马斯克，我们也找一个，这样老老实实的职业经理人，能把这摊守住了，接着往前走啊。我们踏踏实实挣这个钱不也挺好的吗？很多人是抱有这种心态。

题目顾客你看看他干的活啊，创新呢不太灵啊。就是苹果这么多年来，就是各种挤牙膏啊，也没有什么新东西出来啊。创新不灵，基本的面子呢，也还过得去。题目顾客你看出来，这到国内转一转，在美国也参加各种活动，对吧。走到哪也是个大网红啊，这个没毛病。对吧，大家也不会因为提姆库克有什么负面的新闻出来。对吧，大家觉得这人也还可以啊。但是也绝对不惊艳，绝不是像乔布斯、马斯克这样神一样的人物啊。这个绝对不是。但是呢，中规中矩，供应链大师啊。他把整个的苹果的供应链管理得很好。而且听顾客干的，最靠股东喜欢的一件事，知道是什么吗？

所有人真的喜欢说，题目顾客，你把这苹果搞成这样挤牙膏的状态吗？不是的啊。这些股东也知道这事有问题，但是题目顾客就干一件事，股东就支持他疯狂回购。他已经回购了快1万亿美金的苹果股票。那股东不开心死了，苹果股票能够涨成这样，就是疯狂回购，回购出来的。乔布斯当时就问巴菲特说，你看我手里有点钱，没事干干嘛使？巴菲特说你回购吧啊。乔布斯说不，我要把它留在手里，万一过两天我有东西要干呢，对吧。这个创始人一般都是这么想问题的。

然后等乔布斯死了以后，提莫克上来就疯狂回购，每年回购一年，回购的比一年多，对吧。他这么干这个事，那所有持有这个苹果股票的人很开心。一回购就注销，注销了以后，市值就往上涨。每一个这个人手里拿的股票，就变得更值钱，这多开心啊。

这个是真正题目库克强的地方。大家知道国内谁喜欢回购注销吗？不停的回购，回购了三次，已经注销了两次，让这个股价一直维持着。董明珠董大姐啊，他就是这么干啊，分红回购注销。对吧，他有的时候说的话，确实是让你觉得很难听啊。你比如说，35岁失业了，你怎么不去创业呢？如果想要清闲的话，你可以辞职吧。他最近有心辞上榜啊。但是呢，人家就老老实实做公司啊，挣了钱以后跟股东分红。分完红以后啊，再有余钱回购股票，回购了以后就注销掉啊。所以这些股东呢，就想把马斯克干掉。

换一个像提姆·富克上来，这个疯狂回购股票的人。你比如说，现在特斯拉手里还有200多亿美金的现金。那么在这种情况下，搞什么AI嘛？版本这200多亿美金，拿一半儿去回购特斯拉股票吧。回购完了以后，让这个股价涨一涨。然后没准我们车卖好了，又有点现金，拿着现金再去回购股票。这才是股东们真正喜闻乐见的这个CEO啊。

特斯拉骑士到现在为止，是基本上没怎么回购过的。马斯克也是说，有钱我自己看看怎么花着。我把它花掉的这个过程，一定是最高效的过程啊。绝对不会想到说，哎，我拿着钱了，我就回购点股票，我去讨好一下股东。他才不想这事。这就是我们今天讲的第2个故事啊。

黄仁勋AI时代英伟达GPU革命：一场市值2.7万亿美金的狂欢，COMPUTEX 2024重磅发布Blackware GPU，1.8万亿参数GPT4揭秘！

Luke Fan — Tue, 04 Jun 2024 01:02:00 +0000

大家好，欢迎收听老范讲故事YouTube频道。今天，咱们来讲一讲黄仁勋在COMPUTEX上的狂欢。COMPUTEX是一年一度在台湾举行的计算机大会。黄仁勋，作为现在真正AI时代的当红炸子机，可能是唯一靠AI赚了大钱的人。虽然微软也在赚钱，但是微软整个靠AI挣的钱并没有那么多。真正靠AI赚了大钱的公司只有他一家——英伟达。刚才我看了一下，英伟达现在市值2.7万亿美金。大家知道，再往前就是微软的3.2万亿，第二名是苹果，2.9万亿，还差那么一点点。可能稍微一哆嗦，英伟达就有可能成为世界第二市值的公司了。那么，黄仁勋上面都讲了什么呢？作为网红，肯定还要先暴露一下行业秘密，别人都不知道他知道的事情。上来先说一下他现在讲的是什么——就是GPT-4到底有多少参数。GPT-3.5大家知道是1,700多亿参数，就是一个170多亿级别的模型。但是到GPT-4的时候，OpenAI就再也没有出来说它到底有多少参数。很多人说你是不是超过万亿了，对OpenAI来说，这个数据不是很准确。我来辟谣了，但是具体有多少，从来没有讲过。黄仁勋在前面的GTC，就是GPU技术大会上，每年一次的英伟达自己的开发者大会上，上面也讲了……

说起来1.8T，这个1.8T指的是什么呢？其实就是1.8万亿参数，而且它是一个Moe模型。当时OpenAI并没有对此多说什么，但这一次，在《Computer Text》上，他们又反复强调了这个事情，明确指出GPT-4的训练参数达到了1.8T。这让人们意识到，想要达到GPT-4的水平，还有很长的路要走。尽管现在大家都在努力研发号称能达到或接近GPT-4水平的模型，比如几百亿参数的模型，比如梅塔的拉马3可能会有一个400亿参数的模型，国内也出现了很多一两百亿参数的模型。但事实是，即使提到的1.8T参数，如果考虑到是Moe模型，分成八份来看，那么单个模型可能也就相当于200多亿参数的水平。

这次先通过揭示现状，然后发布新GPU，但对于具体数据——多少核心、多大算力、内存多大、带宽多少，人们似乎已经感到麻木。现在大家更关心的是，如何将这些GPU有效地集成起来，如何把它们拼装成服务器，以实现更强大的计算能力。这背后的提升，不是5%或10%的增长，而是几倍的飞跃。这成了技术关注的新焦点。

如何装到机房里头，统一为别人去服务，这个是现在大家更关心的事情。所以现在呢，他们发布的叫Blackware GPU，而且，它取出来那个板子上是两块GPU和一个CPU，应该是他们自己做的CPU。这是一整块，然后可以装到一个大的服务器里面去。再把这些服务器堆叠在一起，使用它的NV link，让这些GPU可以像一块完整的GPU那样工作。这样说，你就可以去训练更大的模型了。而且，今年是这个Blackville，明年就是Blackville Ocho，再往后是Robin。就是说，往后一代都给你规划好了。再往后一步，是叫Robin Ocho，所有的GPU一直规划到2027年，一定让2027年之前的GPU都给你规划好了。

现在呢，很多大佬还在惦记着买H100。他现在就专门告诉你说，你看我这个艾克威尔跟这个H100比，它强在什么什么地方，好在哪哪哪。但是很多人还想买H100，这是为什么？可能Blackware它的这种工作方式，或者说它可能需要跟更多的设备先行捆绑，而H100的话，相对来说可能兼容性会更高、更好一些。就是你用任何的这种通道服务器，都能相对容易地兼容和使用。

你把它插上去都是可以用的。likerware我倒是真没看到它出这种——就是像原来金砖啊，像我们以前讲的A100、H100这样的，我们管它叫金砖嘛，就是它的卡还是金黄色的，方方的一块，可以插上去的。好像没有看到这样的东西啊。现在呢，基本上都是以两个black Verre在一起，然后头上带一个CPU，是完整的这个配置。

当然了，这些大佬，包括马斯克、扎克伯格，可能也不是说我就一定要去买H100。对于他们来说，H100就算是一种计量单位，就是说啊，他们会算上自己到底买了多少H100，或者说现在手里的算力相当于多少H100。你像扎克伯格之前讲，说他买了35万块，加上他手里现成的有60万了，再加上后面再接着买，现在扎克伯格手里的大概有接近100万块H100，相当的算力。这就跟我们造炸弹的时候说，这个炸弹相当于多少吨TNT啊，最后变成了一种衡量单位了。

老黄（指NVIDIA的CEO 黄仁勋）就告诉大家说啊，你们来买新的吧。而且这种升级是呈几何级数升级的，所以不要去买旧的，去买新的，这样的话才能够保持它的垄断地位。如果说哎，我现在这个GPU再涨上去，涨了10%，涨了20%，那大家就不买它的了，就去买AMD，买英特尔，买其他的这些算力芯片去了。

甚至像高通这样的公司，都能做出一定的算力芯片来。这样一来，人们可能就不会一定买它的产品了。但是现在的情况是，我们谈论的是算力要涨十倍、百倍、千倍，而且每年都要这样增长。为什么呢？因为这成了一场军备竞赛。每个人都害怕落后，就像人们常说的“输在起跑线上”。我们从小让孩子上补习班，是为了什么？就是出于这种害怕，这种焦虑感。老黄就是在给大家制造焦虑：你现在买了旧的，等明年出了新的，你就落后了。你必须去买新的，然后当更新的版本出来时，你又要再买。毕竟，GPU不像软件，软件可以逐年升级，而且升级成本相对较低。但GPU，你需要整块购买，一年后淘汰，再换新的，这成本实在太高了。一片就是4万美金，Blackwell的价格我虽然没查，但肯定不便宜。所以，要让大家每年跟着升级，必须讲出一些更有诱惑力的故事来。目前，从算力成本和能耗几个方面看，确实在全面升级。一方面，算力成千倍增长，成本自然是变贵了。这没什么可争议的。但就单位算力的成本来说，它是下降了。比如，原来的H100卖4万美金，但使用Blackwell之后……

你可能继续达到H100同样的算力，这只需要原来1/10，甚至1%的成本，是这样大幅下降的。能耗方面也是如此，比如说，要达到原来H100的算力，所需消耗的能耗可能也只是原来的1%。如此发展，GPT-4的1.8T训练能耗引人注目，因为之前很多人讨论，GPT-4训练一次的能耗相当于多少个家庭一年的电力消耗，让人担忧AI发展的能源瓶颈。但现在的进展是，重新训练一遍的能耗降低了99.7%，仅为原来的1/350。而进行推理时，即训练完成后用于问答等任务，能耗更是降低到原来的1/45,000。这样的发展速度令人惊叹，从GPT-4推出至今不过一两年，能耗的减少就达到了如此程度。

军备竞赛在AI领域体现为不断制造焦虑，促使各方持续投入。这就像冷战时期的军备竞赛，你有武器，我必须跟进。如今在技术领域，特别是英伟达所处的，情况类似，但效果是整体提升，正如“一人得道，鸡犬升天”。之所以提到这一点，是因为他们还强调了除了芯片本身，还有Vlink技术，能够将服务器像拼图一样连接，整个机房的服务器作为一个单一GPU工作，展示了技术整合带来的巨大效能提升。

因为，这些服务器在一起，你的GPU的算率越大，可以并行处理的东西就越多，与内存和CPU之间的通道越宽，整个进行大模型训练的效果就会越好。所以他说，他可以干这件事情，但在这个过程中，这些服务器，或者其他一些相关的配件，都跟着他“鸡犬升天”了。比如说，像戴尔、超微电子这些给他造服务器的公司，全都因此受益，一路上涨。因为你不能只有GPU，不能只有他们的加速卡，还得把所有配件凑在一起，这些东西才能正常工作。而这些配件，都是值钱的。

在这个过程中，服务器肯定变得更贵了。比如说，原来用的是H100的服务器，现在变成了更高级的查克威尔的服务器，那自然是服务器变贵了。但你想，服务器变贵的过程中，到底是什么东西变贵了呢？其实，只有与H100相关的专利费变贵了。大家要注意，因为大家自己并不造芯片，也不造服务器，他也不造算力中心。他只是设计好GPU，交给台积电去生产、封装、测试，然后下交给板卡厂商制作成板卡，再由服务器厂商组装成服务器，最后等待比如马斯克这样的人购买安装。所以，整个服务器链条上的价格上涨，实际上主要是由于关键技术组件的成本上升，特别是H100相关的专利费用。

除了GPU价格飙升之外，其它相关成本也难免水涨船高。你不能期望其它东西都保持低廉，这显然不合逻辑。我们整体的成本基数提高了，但单位成本可能有所下降。不过，要注意的是，老黄的市场策略极为精准。GPU的知识产权价值多少，或者说它的设计成本是多少，他们心中有数。如果没有竞争对手，价格自然可以定得更高。但即便如此，人们依然能看到成本在以惊人的速度下降，甚至是以十倍、百倍的幅度。然而，GPU的设计价值却在不断提升。

除了NVIDIA本身，那些制造显卡、服务器以及各种配件的厂商，它们的产品也会随之增值。比如，如果你用一个价值4万美金的H100来搭建服务器，仅这一部分就是一笔昂贵的投入。而且，随着Nvlink标准的采用，替代了以往的Pcie标准，意味着新的配件、新的线缆等都将应运而生，价格自然比过去高出许多。

我记得早些时候，为惠普的小型机配备一个简单的支架，就是一个铁质架子，都能卖出数千元的高价。原因在于它专为小型机设计，很多工程师甚至会私下找工厂定制支架，替换官方配件以赚取差价。这背后反映的是，即便是一些看似不起眼的配件，在特定情境下也能变得极其值钱。

大家其实也都知道，那个铁皮的支架，你说能值多少钱？你凭什么一定要买惠普的？他只要是惠普的工程师给你装上，下次他接着给你修不就完事了吗？你跟着这个比较贵的东西一块去卖，他就会卖的很贵。但是这几天呢，戴尔和这个超威的股价，其实已经快有点绷不住了。大家心里也明白，虽然你们跟老黄跟的很紧，但是这个里头真的，你就是个卖支架的，卖个铁皮，卖个机箱的，你跟着里头的GPU一起水涨船高，这件事稍微的有点侮辱大家的智商。

现在呢，是AI工厂时代，现在老黄也讲说我们现在就是AI factory。在这样的一个时代，我们应该如何与时俱进呢？我记得在移动互联网刚开始的时候，我们写很多应用，当时我们在思考说，哎呀，我怎么能够省一点流量，因为那个时候流量很贵。我们都想着如何去节省流量，如何在使用的时候联网，不使用的时候怎么把它断开，想着怎么去省一点电，怎么去做一些其他的节省资源的事情，可以少占一些硬盘的空间，可以交互的时候少交互一些流量。当时的我一位老板就跟我讲，说你们想这个事情是错的，说为什么呢？就是因为很简单，随着时代的发展，这些东西都会变得不值钱的。比如说现在，流量咱们现在……

其实，基本上是没有流量焦虑的。我记得最早开始使用手机，那时候刚进入3G时代，我们都会做什么呢？每天定时打开流量，收完邮件后立即关掉。为什么会这样？因为酷，而且节省。现在，还有人这样做吗？没有了。现在，我们走到哪儿，站在哪儿，就开始刷抖音、看视频。已经很少有人会说，我必须节省流量，等到有WiFi的地方再做这些。绝大部分人没有这个意识了。

电的问题现在也不那么大了。虽然手机应用还需要省电模式，但现在的手机几乎都是一天一充。你的应用再费电，能比微信还费电吗？能比原神还费电吗？所以，这些问题也变得无关紧要。因此，很多以前为了省电而做的操作，实际上已经没有意义了。

再往后说，我们是否会考虑在硬盘或手机上占用更少的空间？以前在猎豹工作时，我们还在研究如何让软件占用空间尽可能小。但现在看看《原神》有多大，看看那些手机游戏的大小，再看看微信在你手机里占了多少空间，就会觉得，我们当初那么精良的考虑，好像都没什么大作用。是的，所以在AI Factory这个时代，也就是AI工厂时代，我们仍在思考如何能省一点TOKEN，情况依然如此。

我怎么能够让它反应得稍微快一点？我怎么可以调用不同的大模型？这个模型贵一点，那个模型便宜点。我尽量让便宜的模型干尽量多的事情，让贵的模型干少一点的事情，做一些其他的，比如优化（reg）或者做一些这种节省沟通交互的事情。可能真的再过一年，这些就会变得很可笑，就像我前面讲的，我们在做手机应用的时候，让它怎么去省流量，从网上下载的东西少一点，占的硬盘空间少一点。我们现在回想，那时候想的这些事情就显得很可笑。但是在AI时代，刚才我们讲的怎么能够省一点TOKEN，怎么能够让便宜的模型多干点，贵的模型少干点，怎么能够让多个模型相互搭配起来使用，可能也会变得很可笑。而且，这个时间会来的非常快。

黄仁勋呢，除了讲数据中心业务，就像我们刚才提到的Blackvail，一切都是数据中心业务，这也是现在英伟达核心的收入来源，没有之一。现在，他主要就靠这个业务玩。那么其他的呢？也还在讲，英伟达这家公司特别有意思，它不会说某一个业务特别好，就把所有的身家都压上去。它永远是在所有它认为有趣的地方投注，即使这一个方向很长时间没有结果，它依然会在里面坚持。那么，它肯定还有些其他的业务在做什么呢？

比如说，RTX加载的AIPC，因为前面微软发布的AIPC是基于高通的。现在，英伟达说了，你们使用英伟达的GPU，也可以达到同样的水平。英伟达专门为了AIPC设计了一款很小很轻薄的GPU，而且很省电。但这一块上，它稍微有一点尴尬。为什么呢？你如果真的要轻薄省电，你一定使用ARM的，对吧？就是使用高通的就好了。那你说，我现在稍微费点电也可以，这个英特尔自己也出了，英特尔说，你们就直接用英特尔完整的GPU加上算力核心就完事了，你不用再去单独配独立的GPU，依然可以达到AIPC的能力。包括AMD也是这么干的，AMD自己也产X86的CPU，AMD说：“来哇，你直接买我的APU加我的算力核心，就一次搞定。”

那么，英伟达的RTX这个方案为什么尴尬呢？就是它必须要再搭配一块Intel或者是AMD的X86的CPU，它才可以正常工作起来。这对于强调轻薄便携的AIPC来说，就稍微有些尴尬了。但是，英伟达也强调了，加上他们的技术后，算力是苹果的多少多少倍，主要是与苹果的M系列芯片在比较。在这方面，我们还是要相信老黄的，他的算力确实是靠功率支撑起来的，如果他真想达到某个目标，他有这个实力。

说我在电脑上做Stable Diffusion的，这样出图，速度很快。那一定是配着呼啸的风扇声，以及呼呼转的电表，一起来工作的。除了AIPC之外，还在讲游戏助手。但是这个呢，我觉得大家看着开心一下就可以了。他说我做个助手帮大家打游戏，这个呢，就属于工程师思维——一拍脑袋觉得，“我需要一个这个”。其实，游戏跟这个没有那么大关系。就算是AI应用在游戏里面，应该也不是通过游戏助手的方式去应用的。

另外，还展示了机器人。他说所有跟机器人相关的东西，我们都上，也做了全套的机器人套件。还有，其实VR、AR以及车载芯片，其实都在英伟达的整个路线图里边。再往前走，很多人就会关心，英伟达到底还能坚持多久呢？他真的还差2,000亿美金就追上苹果了，对吧？苹果2.9万亿，他2.7万亿，真的差的不多了。他到底能不能超过苹果，甚至能不能超过微软，成为全世界最值钱的公司？这个其实大家心里都在打鼓。

英伟达呢，跟其他不管是微软也好，苹果也好，有一个特别本质的区别，就是它是一个“轻公司”。这个“轻公司”赶上时代红利是可以的，但是到底能不能长久地坚持下去，这个就很难了。黄仁勋展示现在的成就，未来的路线图，让人充满期待的同时，也不免有几分疑虑。

但是，并没有说我要砸重金进去，变成一个重型公司。大家注意，苹果是个很重的公司，它生产电脑——虽然电脑也是台湾人给他造的——它的手机是富士康，包括比亚迪都在给他造手机。它是这样的一个公司，虽然供应链在外面，但是这些货品、这些设计，包括全球的仓储物流，很多东西都是属于苹果自己的。所以，苹果是个很重的公司。微软其实也是一个很重的公司，微软自己在造Surface，那个东西虽然卖的并没有那么好，但是它也是电脑平板，甚至还有很多其他的硬件，比如说键盘鼠标。微软键盘鼠标其实做得非常好。而且微软其实还有一块很重的资产，那就是云计算中心，它有很多的数据中心。微软现在是全世界可能GPU最多的公司了，因为后边有OpenAI这样的一个“亲儿子”，那你肯定是要靠这么多的GPU去养的。微软现在的GPU，如果大概核算成H100的话，应该有180万块，这都是重资产。

谷歌呢，也是一个很重资产的公司。谷歌紧跟在英伟达之后，他现在是市值第四的公司。谷歌我记得在云计算兴起之前，曾经有一段时间，他拥有全世界大概6%的服务器，这是一个多么恐怖的数字。而现在，虽然应该没有那么多，但谷歌的数据中心依然规模惊人。

也是一块非常非常沉重的业务。而且，另外一点是什么呢？就是我们来看，整个的生态是否稳固，或者说，整个的价值体系是否可以稳定地升级上去。还有一个点可以看是什么？就是你上下游的生态链是否足够稳定。围着你吃饭的人到底有多少？以前我们在学生物的时候讲过一点：在一个自然环境里头，食物链越长，或者说参与到食物链里的动物、植物越多，它整个的生态系统就越稳定。为什么呢？因为其中有一些波动，其他的这些生态位上的人，或者这些动物，就可以慢慢地把它平衡回来，而不是说啊，我的食物链很短，就两三节，参与的动物也不是很多，植物也不是很多，可能中间稍微有一点闪失，这个食物链就崩溃了。

咱们来看看苹果，上下游其实有非常多的人围着他吃饭。我们不说这些果链企业，就光在苹果应用市场里头，做应用的这些人，也有几十万人，对很多人来说，这是他们的收入来源。再看谷歌，像我们现在在这看YouTube，我在这拿着YouTube的广告费，那我们也算是谷歌生态链里边的一环。那是非常多的人靠着谷歌生活。啊，微软那不必说这些靠广告吃饭的，因为微软的广告并没有那么多，但是微软上下游，是有大量的系统集成公司，靠着微软吃饭的。

还有微软云上的大量客户，但是英伟达有没有这么多人靠着它吃饭呢？英伟达虽然一直努力地在打造他的生态链，整个生态环境，但是并没有那么多。所有能战胜英伟达的，像刚才我们说的戴尔、超威等，这些已经都涨疯了。剩下的呢，其实没有那么容易贴上去。虽然有很多人说，“我们拿英伟达的CODA，我们去写这些Transformer的大模型。”但是这些人呢，实际上在整个的生态链里面是非常非常小的一群。现在能够真正把这个东西跑通的人非常少，虽然这个领域的人才工资非常高，但是人数真的不多，它没有真正撬动大众。所以，我从这两个方面来论述，英伟达到目前为止，依然是一个很轻的公司，资产很轻，它的整个生态链其实也是相对短而且相对脆弱的。

那么英伟达现在能够赌的是什么呢？就是这个缩放定律，叫“scoring low”。只要这个东西依然有效，黄仁勋呢，就还可以继续狂飙那么一段时间。“scoring low”是什么东西？就是我堆更多的数据，上更大的模型，上更大的算力去计算，然后得到的模型效果就更好。这个东西只要依然在，还可以大力出奇迹。那么大家就说，那我们就接着老老实实地买他们家显卡。

而且，这种倍速一定是十倍、百倍、千倍这样往上涨，为什么呢？因为如果你说，我英伟达下一代的GPU就比现在快20%，那大家就不更新了。或者说，我干脆去买AMD吧，AMD的比你这还便宜点，算力也没有那么差，只是这个过程稍微麻烦一点——我需要重新去适配AMD的算力卡。大家要注意，因为做这行的人很少，这些人很聪明，对他们来说，适配一个新的算力卡，难度并没有那么高。

刚才我为什么专门讲了苹果的生态链、谷歌的生态链、微软的生态链？因为它们里面有很多低端开发者，对他们这些低端开发者来说，技术迁移的门槛是很高的。你让他重新换一下，比如说，“你原来做安卓的，现在去给我做iOS开发去”，他真不会。甚至说，他学会了以后还能涨些薪水。但是对于英伟达来说，如果他没有办法快速地让算力十倍、百倍、千倍地涨上去，那么大家就会渐渐背离他，对他的忠诚度是相对比较低的。

有可能造成英伟达崩塌的原因有三个，咱们最后总结一下：

第一个就是摩尔定律失效了，缩放定律已经没效果了。大家发现，上更多的数据，配更大的模型，训练完了以后效果提升了。一旦到这样的情况，就不会有人再疯狂地去买他的新显卡了。

第二个中心转移了。突然间，又一个特别赚钱的应用方向爆发起来。大家注意，现在为什么大家都在选择这个？因为“缩放法则”——谁都用不好。大家只能去比谁的模型做得更好，然后去跑这个，跑那个。但是一旦发现，这个模型在做一些特定应用时，效果好得一塌糊涂，而且极其赚钱，那么这个时候，就不会有那么多人继续投入资金去做新模型的研发了。他们可能觉得，现在的模型就够了。这相当于什么呢？就是说，虽然“缩放法则”仍然有效，并没有崩塌，但是没有人愿意再往上堆成本了。因为，尽管“缩放法则”有效，但增加更多的算例、更多的数据，那都是钱。一旦出现特别赚钱的领域，即使“缩放法则”依然有效，增长也会停止。

第三个因素是巨头合作，突破并扩大了垄断。现在，大家离不开英伟达的原因，就在于它推进的这套扩大——可以称之为通用计算方法，具体的名称我不再详查，它是不开源的，而且英伟达拥有专利。因此，大家都在这个基础上进行了应用开发和大模型的训练。之后，想要更换这个技术，就会有一个成本。这个成本，我们要反复讲，不高也不低，为什么会这样呢？

肯定换过去以后会有些兼容性的问题。但是呢，因为你后边真正使用你的H100也好，Blackware也好，都是些什么人？特斯拉、苹果、谷歌、微软、亚马逊——他们可以花最贵的钱，雇最好的工程师，说来咱们今天去改一遍就完事了。这个都是有可能的。但是，这个临界点在什么地方？临界点就是，如果涨不上去了，那咱就改；或者说突然有人说，“我愿意砸一笔更大的钱进来，咱就改。”为什么？詹奥特曼说，“咱们砸一笔大钱啊，1,000亿美金，或者说1,000万块H100算力的这个GPU，我们统一搞一次，做星际之门去。”这个对于英伟达来说，都是比较大的威胁。就是这三个威胁。

英伟达呢，也算是我们现在的一个传奇故事。我相信在整个的AICC大时代里头，我们还可以不断地看到它的故事继续。好啊，今天我们要讲的故事就到这里。感谢大家收听，请帮忙点赞点小铃铛，参加Disco讨论群，也欢迎有兴趣有能力的朋友加入我们的付费频道，再见！

Open AI 免费GPT4大放送，苹果WWDC翻车预警？

Luke Fan — Tue, 04 Jun 2024 00:50:30 +0000

大家好，欢迎收听老范讲故事YouTube频道。今天咱们来讲第一个故事。Open AI进一步开放了GPT-4欧的免费功能和范围，留给苹果的时间真的不多了。所以，这一个话题里我们会讲两件事。

第一个是Open AI进一步开放了很多免费用户可以使用GPT-4，主要是4欧了。另外呢，就是苹果现在的日子并不好过。虽然我们前面反复在想说，大家万众瞩目，万众期待WWDC，6月5号吧，大家都在等这一天。但是，呃，越是大家期待的事情，可能最后啊，越让大家失望。

最近Open AI呢，肯定是消息不断。为什么呢？山伯特曼本人是一个呃，政客或者说他政治手腕非常的强大。前面闹出了很多的负面，比如说伊利尔走人，超级队旗团队的负责人走人，而且这两天呢，超级队旗那个负责人已经去了anceropic，还在跟瓦解，也就是斯嘉丽约翰逊才在这打着官司。各种的负面都很多，所以呢，一定会放出很多消息来，去纠正这些负面信息啊。

先跟大家讲，他们去跟斯加利约翰逊诉讼的这个事情啊，非常有意思啊，因为瓦解说了，说他们来找到我，在这个GPT-4欧里头有很多角色，有一个角色叫sky啊，叫天空啊，说希望用我的声音去做这个sky，但是呢我拒绝了。结果呢，他们就找了一个跟我声音很像的人，去把这个声音录了。现在呢，我们要求他马上下架，而且起诉他。现在呢，是找到了配音的人，也找到了跟他联系的经纪人，整个一串，都找找到了。找到完了以后呢，人家作证说，Open AI找到我们，只是因为我们的声音很好听。在整个的沟通和谈判过程中，以及签协议的里头，没有提到斯嘉丽约翰逊的名字，一次都没提。只要你没有任何的证据证明，说确确实实照着戴着约翰逊的声音样本去找的人啊，那么在诉讼过程中呢，就还是占有一定的优势。现在就是这样的一个情况。当然了，另外一方面呢，Uki已经这个sky这个声音，也就是使用斯嘉丽约翰逊的这个声音，下架了，现在听不到这个声音了。也是教了大家一个漏洞吧，就是下次再想抄谁的声音的时候，你千万不要在纸面上落下任何字了。说因为你的声音像谁谁谁，所以我用你的，对吧？只要落下来，这事就不利啊。

那么现在，open AI放了些什么样的新消息出来呢？第一啊，我们又开始训练下一代大模型了。到现在为止，GPT5咱没看着呢，现在人家说我开始宣传GPT6了。叫什么名字不重要啊，但是消息放出来了，而且呢，以open AI前面做了这么多次的宣传来看，就是他放了消息，大家还是信的啊，不是说你发完消息大家都不信了，所以现在又欢欣鼓舞。

再往后就是GPT4O进一步免费开放。那么现在，到底免费用户可以得到些什么样的东西呢？第一个，我们现在如果拿到一台新的电脑，或者打开一个新的浏览器，里头没有登录过的，你进去以后，你能够看到，上面只有一个标题叫GPT，没有3.5，没有4，没有4O，没有任何标记了，就叫GPT。其他的宣传的功能通通都没有了，但是你可以用GPT，在没有登录的情况下。

下面你去登录或者注册一个新用户，也没有付费的情况下，你呢就会看到一个呢叫GBT4。如果你想选择GBT4，它就要求你去定位plus。如果你不选择，你就使用GBT。实际上就是GBT和GBT4O。你说，我就跟他随随便聊聊天啊，这个是没事的，你就像原来用3.5一样。但是现在3.5已经不再显示了，没有了。

那你说我想用一些新的功能，我想跟他语音对话啊，想去上传照片，让他去给我啊，做一些这个图像识别啊，想去调GPS啊，那个呢就要去遵守它的啊，频度限制。就是你一分钟可以钓多少次。当然了，它这个频度是，比较低的，3个小时16次。这三个小时之内，你调够16次了，他就退回到GPT 3.5。但是呢，这上面不会有任何的变化，你还是在PPT里面啊，他不告诉你哪个版本了。当然呢，3个小时16次这个事呢，稍微有点玄学。因为很多人上去测，去发现呢，有些人用了10次就被踢出来了啊，有些人用了5次啊，还有些人说用的次数更少，或者更多一点。但是应该没有超过16次的。现在呢，官方的数据呢，也不是特别明确，说我3个小时到底让你使多少次。相信呢，应该还是跟用户的热情相关，比如现在用的人少了，我就让大家多用几次；用的人多了，他少用几次。付费用户，像我们这样的plus用户，3个小时呢，可以调用80次，也就是GPT 4。语音相关的功能吧，可以调84啊。但是现在呢，其实4里面啊，这些语音功能，还是用的传统方式啊，就是先做语音识别，后台文字处理，然后再回来做说的部分，并没有真的实现所谓的端到端语音。他的这种开摄像头这个功能对吧，我们看了很多演示，都是开摄像头说哎，这个怎么回事，那怎么回事，对吧这件事情呢，跟大家想象的也还是有一些差别的，并不是这么干的，而是什么呢，你可以用摄像头去拍一张照片，照片传给他，然后他去解释这是怎么回事，这个工作已经可以干了啊。但你说我这个实时摄像头都开着，这事干不了，哈哈，可能未来也未必能干啊。那么现在呢，在免费用户里的还可以用什么，用GPTs啊，就是各种定制开发的这个GPT，你比如说啊，我在里边去开发了一个如何去英语学习啊，如何去比如Canva，或者让他去给我做一些设计。对吧，这些呢，现在都允许去调用了啊。这个是这一次开放出来的新功能啊。但是你调用GPTS的次数呢，也是受刚才我们讲这个39264限制。然后呢，还可以关联应用啊，你可以在GPT里头关联你的Google Drive啊，或者是微软的one drive，可以从这里边去上传文件。你比如说，现在给我做一次数据分析，你可以上传一个文件上去，给我分析下这个文件啊。或者说你让他给你做一个图像识别啊，拿着摄像头拍一张照片上来，哎，这是个什么菜啊。我上次试了一下，出去吃饭啊，拍了一个这个菜，已经吃了，大概还剩一两口了，那个菜拍完了以后问他这什么菜啊，这个我认得好好的，说啊，你这个是酸菜鱼啊。为什么呢？里头有白色的鱼片，绿色的酸菜，金黄色的汤和红色的辣椒，所以这个菜一定是酸菜鱼，还是很厉害的啊。就算你是免费用户，也是可以用到这些功能的，前提是要注册，但是不登录就没有啊，不登录就只有GPT聊天啊，其他的都没有了。这一次，免费用户呢，跟付费用户之间还有一个差别，是什么？不能出图啊，就是你想让他给你画画，这事画不了。你说我3个小时16次也好，3个小时多少次也好，你给我画画去啊，这事不行。它里头有一个GPTS叫达利三啊，包括呃，图像生成这些GPS都是让你使用的，但是呢，你向他下完命令以后，你会看到那个圈儿在转，说我在画图，我在画图画图，然后等这圈儿转完了以后，呃，说对不起，我现在还干不了啊，你去定一个plus吧。对吧，它会给你出这样的提示。你说都已经到这样的状态了，这20美金还值不值得付呢？对吧，我现在是每个月在付20美金，在用这个东西啊。首先要想清楚啊，GPT4欧呢，虽然多模态相对来说要强一些，但是单纯的文字处理能力，其实并没有GPT4强。PT-4还是能力最强的模型。如果你要做一些复杂的工作，还是要用GPT-4。我也在Gemini里试了Gemini Flash和1.5 Flash，虽然很快，但是它的功能是没有Gemini 1.5 Pro强的，还是要差很大一块的。所以，你付了费，可以好好的去使用GPT-4。付费用户呢，GPT-4达到极限次数以后，会降级使用GPT-3.5。这样大家就知道谁强谁弱了。

我有时候使用GPT-4的时候也会超限制，对吧，它就会自动降级。而且呢，20美金还可以画画，还可以自己创建GPTs。你说我想调教一下GPT，让他给我干一些特殊的事情，想上传一些数据，让他给我做一些专门结合这些数据的一些工作，那你就老老实实的去订阅就好了。

前面我们讲的GPT-4，那些免费的用户，他们可以用现有的GPTs，但是你不能自己做，不能自己去定制。另外，使用额度这件事，也还是很重要的。就是三个小时80次这件事，基本上其实是够用的。前几天，我老婆拿这个东西去试验英语口语练习，用免费的版本，发现没聊两句他就被踢下来了，觉得非常不爽。但是他觉得80句呢，可能也差一点，因为拿这个东西做英语口语练习，一个来回就算一次。所以，他那个80句，可能3个小时也不是那么够用吧。但是这块呢，80句至少对于像我这样比较懒惰的学生来说，应该是已经够够的了。聊一会呢，懒得跟他说了。

那么，OpenAI为什么会在这样的一个时间点里头，进一步的推出免费的GPT-4呢？因为GPT-4前面就告诉大家是免费，但是里头很多的功能是没有的，比如上传图片、上传布局文件、使用GPS这些功能都没给大家。为什么现在要来做这件事？呃，先问大家一个问题啊。大家知道云计算厂商赚钱最大的秘密是什么吗？你上了阿里云，上了腾讯云，上了亚马逊云，这里面最大的秘密叫迁移成本太高。你一旦上去以后，你很难搬走啊。云计算厂商基本上靠这件事来挣钱的。所以他们一开始那个价格都很便宜，吸引你去了。等你要搬的时候，费劲了，咱就别搬了，就这么凑合着吧，对吧，将就过吧。

OpenAI也在干这个事啊。就是当用户习惯了OpenAI之后，再想迁移到其他平台上去，就会有巨大的成本。所以呢，现在就一定要来搞。那你说为什么原来不搞？原来呢，他比其他人其实强好大一块，没有任何人能赶上他，所以呢并不着急。但是现在，甭管是Cloud3 Opus，还是GMDI1.5 PRO，已经基本上赶上他了。而且Cloud后边有亚马逊，Gemini后面呢，是有谷歌，有固有的用户群体。万一让大家最后觉得哎，Gemini也挺好使，我就这么使着吧，那他这个用户等于就抢不回来了啊，就没法再去培养这种用户行为习惯了。所以必须要在现在这个时间点啊，要去稳住霸主的话语权。就是他要制定规则，而且呢在现在，大家其实都是按照OpenAI的规则在做事情。

OpenAI其实是在整个的行业里边，是做了很多坏事的，起到了很多非常差的作用。第一个就是上来做对话，所以现在好多人都说，我也要去做对话啊，这个事不那么容易啊。做对话这个方式并不容易去变现，也没有办法去进行深入的用户产品的研发。但是呢，这个OpenAI开了头了，任何人做这个大模型都没办法老老实实的去做对话框去。第二个是什么呢，就是按这个20美金收费啊，一个月收这个月费。这个里头呢，百度就属于被忽悠了，上去收费去了，其他人上来都免费。功能比他那收费的还好。然后第三个，就是按TOKEN收费啊，就是open AI在张掖这些三板斧啊，都不是那么好使。再往后就是什么，就GPS啊，就是第四个GPS，这种模式呢，到底好不好用，我觉得也还有待商榷。因为他太追求什么呢，就是无代码化了。按道理说呢，使用API去做很多东西是挺方便的，但是呢他说不，我不推这个东西啊，我要推GPTS，我要让大家无代码去把各种事做掉。因为我最近也在尝试，各种无代码的方式，使用PT使用各种大模型，哇那叫一个酸爽啊，不不替都费劲了，而且最终的结果很难进行控制。像我们这些程序员，最喜欢干的事是什么，就是结果可控啊，这不对了，我把这数改大点，把这数改小点啊，或者把这个语句怎么调一下顺序，但是你通过GPTS也好，通过流程控制也好，或者工作流也好，你去控制这一大堆大模型，干活的时候你会发现，你的结果每一次都不一样，你想去调试，想去调优，这个真不是一般的费劲。这就是啊，PPT给大家留下了这么多刻板印象，但是呢大家没办法，只能跟啊，现在大家都在这条路上，慢慢的往前跟着往前走。现在GPTS GPT4欧的这种多模态端到端，就是open i希望进一步推进的标准啊。前面它做的这个对话框的啊，做的这个按TOKEN收费的，做的这个一个月20美金的啊，这些标准大家都已经认了啊，现在再推下一步，GPT4O呢迟迟无法交付，现在呢大家也在着急，大家用的还都是语言模型，其实呃我们在国内使用的很多的呃，这种工具，已经接近了GPT4O的这种水平了啊，这个回头有机会再跟大家分享。那现在呢，GP 4 o，最后能不能变成像他们演示的那样，不好说我觉得难度还是蛮大的啊，真的到他那样了，这个东西实实在在开着了。你还能看到后边有没有人走过去。这个对于网络，对于前端算力的要求都是非常高的。现在的GPT搜肯定是达不到啊，或者说，现在我们使用的ChatGPT的这种APP，绝对是达不到的。这是GPT4欧啊，现在免费开放出来的一个原因了。当然还有一个原因是什么，DC越来越近了，PPT4O呢也要站稳自己的脚跟。

这个话是什么意思呢？就是很多新闻都已经讲了，open AI跟苹果之间已经达成协议了，准备呢在手机上实现啊，类似于GPS Siri这样的功能啊。那苹果呢，同时也没有放弃跟谷歌的谈判，来咱接着谈啊，这个Gemini还是有机会的，他并不希望GPT4O在苹果手机上，一家独大，或者成为唯一解决方案。为什么呢？因为你一旦成为唯一解决方案，它这个价格就不好谈了，对吧这两边就可以谈嘛，哎谷歌你现在是一什么价格啊，这个另外一头啊，GPT4O你是一个什么价格啊，咱们就可以来谈功能啊，哪些功能有啊，哪些权限你是不是可以少要一点，对吧大家可以来谈判，有一个平衡的过程。

苹果其实也喜欢干这种，你比如说现在苹果设备上的所有搜索，还是多选一啊，我在这个Safari上我没有一个搜索的，苹果搜索可以用啊，这个是没有的啊，但是呢我可以使用谷歌搜索，可以使用Beam，可以使用达克达go还是什么东，国内你还可以选百度，所以未来的苹果设备上，大模型估计也是这样，大家选就完了啊，我到底是要用谷歌，还是要用open AI你去选，谷歌Gemini如果和苹果的合作也能达成，那这个费用大家就要好好算一下了，对吧假设苹果是向open AI付费的啊，或者苹果是t open AI，向它的用户付收费的啊，叫扣费外接这种服务，一共三种服务方式嘛，谷歌搜索。现在跟苹果的服务方式是什么呢？是谷歌给苹果钱。你只要是苹果设备上，使用了谷歌搜索，点了广告，我这个广告收益我跟苹果分。而这个钱很大，每年可能几十上百亿美金的给。

然后第二种方式呢，就是大家免费。你也别收我钱，我也别收你钱。

然后第三种方式呢，就是苹果说来我付钱。这个钱我苹果付了，你拿去用吧。早期三星是特别喜欢干这个事，跟什么Joe box啊，跟很多这样的公司，三星付了钱，说来只要买了三星手机的第一年，让他们白用这个钱，三星付了以后的钱呢，让他们自己付去。

当然最可能的方式是什么呢，就像icloud这样。比如说苹果出了一个新套餐，叫智慧icloud套餐。原来呢，需要用每个月两美金，或者多少钱，你可以买一个空间。现在你说我还需要用open AI的功能，或者用Gemini的功能，那我还需要再去付一个钱在里头，每个月多付10美金。然后他就把这个东西集成在Siri里，让你去用去了。哎，如果你说我不愿意付，那你买了苹果手机说哎，我给你一个基础的版本可以用，比如说GPT-4，3个小时18次，没准你在苹果手机上，我让你多用10次。这个也可以对吧，这个有可能是未来的一种服务方式。

你说我想敞开的使，我就想拿苹果手机这么使了，行不行啊？那你就再多买一个套餐，买完了以后，苹果自己收一部分钱，扣个30%苹果税，剩下呢跟open AI，跟谷歌的Gemini去分取。这个我觉得是未来比较大可能性的这种复位方式。

那么现在开放出来，这个免费的GPT-4的这些功能在干嘛？其实是告诉谷歌，告诉苹果，你要想搭进去，你至少应该有这些功能，你才能搭进去。而且这些功能，我已经免费可以给大家用了。谷歌你再去签协议的时候，你也得小心点。要钱少要点。现在，其实是在干这样的一个搅浑水的事情。啊，但是呢现在开放出来的免费GPT-4，肯定是不够iOS 18去用的啊。谷歌现在呢，也还是在里边在谈到底怎么弄。但比较悲催的是什么？就是作为iPhone全世界第二消费国的中国，哎呀估计可能是要用百度了啊，因为甭管是OpenAI还是谷歌，我们都用不了，甭管他们是不是在中国落地，中国是不是允许，现在美国政府也不允许他们给咱们用，咱就凑合用百度吧。

苹果其实今年一季度的销售是很烂的，在中国，到4月份就疯狂降价，由苹果官方降价。4月份苹果iPhone在中国区的出货量，比去年同期增长了52%，这也是一个很大的数据啊。那我们疯狂的买完苹果以后，没有OpenAI，这也是一个啊比较悲惨的事情。

苹果今年的WWDC呢，感觉翻车的可能性还是蛮大的。为什么这么讲？因为这边OpenAI还在闹幺蛾子呢，那边呢，谷歌合作协议也还没签下来呢。你等于这边OpenAI搞个幺蛾子以后，苹果谈判代表说来，咱们再谈谈吧。谈呢一般就谈这三件事啊，第一你提供什么功能给我，第二，我给什么权限给你，第三怎么收钱。现在OpenAI做完这个事情以后啊，谷歌那边的谈判就会变难一些。而且大家要知道，往年开WWDC之后啊，马上就该开始干嘛，推送iOS的下一个版本，比如去年吧，iOS 17的第一个测试版，什么时候推的呢？2023年的6月6号。去年可能也是6月5号，6月6号开的WWDC，当天就退。然后正式版什么时候出呢？2023年的9月19号就要出正式版。但今年这事就困难了啊，叫没有困难，我们制造困难也要上，OpenAI就属于制造困难。你想还剩一个礼拜，这会就要开了，开完了以后马上就要发版本。那这边啊，open i还在这说，我今儿免费这个，明儿免费那个，后天改改功能，再后天我再扩充点功能，还得干这事呢。谷歌那边协议还没签下来呢。那你说下礼拜他发的版本里，到底长啥样，这个事真的是不太好说啊。而且就算是他把这版本发出来了，三个月能够做出真正能用的版本，推送给所有人用吗？真不好说啊。所以大家还是要拭目以待一下。

而且苹果内部呢，很多事情推动起来，其实也并没有那么容易啊。他也是这种天微不可测模式。什么叫天微不可测啊？就是你上面有一大老板啊，或者有一皇上，这个皇上有一些喜好啊，你是知道的。你有遇到一些事情，比如说有可能处到皇上逆鳞的时候呢，你说我到底上去问一罪呢，还是不问一罪呢，还是说这事我猜皇上不喜欢这个，我猜皇上喜欢那个，然后我就这么办，去了。这个到底怎么办，这种事情的选择其实也很简单啊，就是如果啊，你上去报一下啊，发现也没什么损失，你肯定上去报。如果你上去报一下，发现损失很严重啊，你比如像以前皇宫里这些太监，知道皇上有可能不喜欢某样东西，你还上去说去哎，这个事是有可能丢性命的。那在这样的威权统治下呢，很多的事情大家都不敢说，怎么办呢，都是猜哎，老板今天喜欢这个吗，喜欢那个吗，啊不喜欢啊，不喜欢我就不干了，我也不告诉老板有这个事啊，很多都是这么干的。

先跟大家讲一故事吧，我原来在盛大创新院，盛大创新院的老板呢叫陈大年，是陈天桥的弟弟。当时呢我们在内部就流传啊，说陈大年不喜欢李开复，咱们就当八卦，我讲的大家都不要太当真。有些时候啊，我们就需要跟创新工厂合作啊，要跟李开复合作。然后这事呢，我们就先去问下边人，哎呀我说这个事情，要跟李开复那边合作一个啊，咱们到底谈不谈啊。通常大家说别弄啊，别弄啊。\n老板不喜欢李海福啊。你这上去不是找骂吗？然后这个事就放弃了。

甚至呢，有很多本身就是谈一个合作，就可以很容易搞定的事情，我们最后没办法，只能绕着走啊，而且连问都不敢问的。这种事情在苹果里头有没有呢？也有啊。举一个案例，大家知道，iPad上马上要发的是iOS 18和iPad OS 18。iPad OS 18里头有一个重大的更新，是什么呢？是加入了计算器。现在反正，已经不是乔布斯时代了。再过一个礼拜开WWDC，现在能够发的东西，其实已经被曝光的差不多了哎。所以iPad OS 18里头有计算器。那你说iPad号称生产力工具，里头为什么没有计算器呢？

2010年iPad一代发布的时候，里面本来是有计算器的啊。但是乔布斯呢，把软件部门的高级副总裁叫过来问，说新设计的计算器在哪啊？他就一直觉得，iPad上的计算器应该有新的，不应该把那iPhone上的计算器，就直接搬过来。结果对方就回答说，没有新设计啊。哎，这就是要发布的版本就长这样。乔布斯就愤怒了，说不行啊，把他给我拿出去，我们不能发布这样的东西啊。咱其实说的，基本上就是这样的一个原话，相对来说也比较模糊。

现在14年过去了，2010年的事情，iPad一代发布，乔布斯呢，是2011年就去世了。这14年里头，iPad就一直没有计算器。为什么你连问的地方都没有？乔布斯已经不在人世了。你现在在问，他说，您看我把这计算器做成这样行不行呢？没地问去了。人家已经说了，我们不能发布这样的东西。那你说这事怎么弄？我们只能理解，乔布斯如果活着的话，他会怎么看这事呢？当然了，2024年了，提姆库克呢，又做出了违反祖宗意愿的事情啊，把计算器又加回去了。这些年呢，其实提姆库克做了不少。这个违反祖宗意愿的事情，比如说把这个iPhone的屏幕做大了。原来乔布斯说，我这个屏幕就必须这么巧，一个手要能操纵得过来啊。但是现在，我们已经可以有这巨大屏幕的iPhone了。但是这个计算器，真的是等了这么多年才加回来。那你说我讲这个故事，跟我们今天讲WWDC，跟我们今天讲AIGC大模型，有什么关系呢？哎，这个就涉及了苹果另外一个祖先的这个遗愿啊。这个遗愿是什么呢？这个故事要从2009年开始说起。

2009年，苹果出了一批Mac电脑，在这个电脑的型号上，加装了英伟达的显卡。结果这些显卡的兼容性很差，散热也不好。就只要是做大型的这种图像渲染的时候，就直接的冒烟，或者说就直接卡顿，就不干了，就死机，出现这样的问题。英伟达呢，一开始拒绝承担责任。苹果、戴尔和惠普等都买了他这款显卡嘛，一起对他提起了集体诉讼。最终，迫使英伟达同意更换有缺陷的GPU。

从此以后，苹果跟英伟达的关系，就可以说是彻底决裂了。苹果再也没有买过英伟达设计的任何产品。苹果甚至选择了这个性能和功耗更差的AMD的GPU——就是苹果有一些MIC Pro里头是有GPU的，它用的是AMD的，包括苹果有时候会让你去带这种叫做外接GPU盒子，但那个里头都是AMD的啊，英伟达的一律没有。后来苹果定制一些GPU，也是去跟AMD去合作啊，这英伟达我就不玩了。

但是现在呢，大模型时代了，这不买H100吗，你不买英伟达的设备吗，这不没得玩了吗，这个事是很大的问题所。以现在大家也明白，为什么苹果电脑从来不能打游戏了，它压根就没法往里头插英伟达的GPU，因为祖宗已经留下这个话了啊，我们这辈子不跟英伟达合作了，他有这样的一个祖训在里头。那你说咋弄？那现在你说苹果怎么办呢？彻底不买吗？这个肯定也不行啊。现在呢，据第三方猜测，苹果还是少量的购买过英伟达的算力卡，就是H100这种东西，组建了自己的算力中心。但是即使买了第一个，数量非常少啊，苹果并没有买很多这个东西。第二呢，偷偷买啊，也不能说啊，自己用一用就算了。但是现在呢，要o in AI了，怎么办？

这个苹果又做了一个特别奇葩的决定，他呢，去订购了一大堆的叫MR Ultra的芯片，嘛呢，拿这个M2 Ultra去填计算中心去啊。这个呢就很危险了啊。大家要知道，M2系列的芯片，应该2022年出来的啊，包括2023年也还卖了一段时间。到2023年，呃，年底的时候就开始出M3系列的芯片，现在的M3 Max都出来了，M3 Max就是最大的这个芯片，一般叫Ultra的，是把两个Max粘一块，那东西叫Ultra啊。这M3 Max呢，现在在MacBook Pro上已经开始卖了。本来呢，按部就班，到今年呢，应该发布M3 Ultra的Mac mini，Mac studio这样的台式机。但是呢，到现在你到苹果官网上去看MacBook Pro，你可以买到M3 Max，你说我现在想买Mac studio，你还只有M2 Ultra，它压根就没有M3 Ultra这个产品，M3 Ultra这个产品型号被取消了，没了。为什么呢？因为太着急，现在iPad都用上M4了，所以也许到明年的这个时候，我们会看到M4 Ultra的Mac studio，但是现在不赶趟了。所以赶快把M2 Ultra再造一批，拿去藏数据中心就完事了。那你说，这个M2 Ultra挂数据中心行不行呢？这个东西在Max studio上，那绝对足够。即使是性能超级过剩的一个芯片，比如将两个M2 Max粘在一块。印象中，一个M2 Max已经非常好用了，在本地做推理完全没有问题。但是，如果你想用它来训练大模型，对不起，搞不定。为什么呢？因为它的内存带宽不够宽。苹果发明了统一内存，将电脑上的内存与缓存合二为一，速度相对较快，能够达到家用游戏显卡的速度，但与真正的算力卡如H100或AMD的MI300相比，差距非常大。而且，它能够挂载的内存数量也不够多。在这种情况下，依靠M2 Max搭建的苹果数据中心，算力堪忧，可能只能勉强完成推理任务。想自己训练新的大模型，基本不现实。苹果可能在研发新的算力芯片，但即使现在开始研究，至少两年后才能用上。而两年后，大模型会发展成什么样，大家已经无需惦记了。苹果可能已经放弃了大模型，但小模型还是会做，就像iPhone手机和Mac电脑上的本地搜索引擎，大型搜索引擎则直接识别。WDC现在感觉翻车的可能性还是有些大，因为剩余时间不多，合作伙伴都不是省油的灯，尤其是谷歌，虽然算是中规中矩的合作伙伴，但也这么多年了。\n也相对稳重一些了。Open AI呢，经常是不按常理出牌，属于性格还不是很稳定的一个公司。你跟他去合作，反正日子不是那么好把握吧。

苹果自己的AI这一块上呢，因为遵从了祖训啊，不跟英伟达合作，后边的日子肯定也不好过啊。你像马斯克的AI，人家还是老老实实的，买了一大堆的英伟达的这个H100，回去做算力中心去了吧。任何的其他人，包括谷歌，你说我有TPU，他也老老实实的去买H100。哎，只有苹果说不，哈哈我不买啊，祖训传下来了。

而且苹果这些年呢，挤牙膏已经挤的太多了，现在有点无处下手了，对吧？现在以大家曝光出来的WWDC上有可能发布的东西来说，呃，我觉得计算器算个惊喜，就是也没有什么惊喜了。这个里头，one more thing，大家都已经在开会之前的一个礼拜都说完了，看看他们到底弄点什么啊。这种WWDC的话，应该不会又整了个什么大地之母出来晃一圈吧，啊我估计应该不会。

我这里头可能唯一可以one more thing的，是不是给题目顾客指令一接班人可以斑驳适应一下，啊，没准大家还可以稍微的开心一点点。好啊，这就是我们今天讲的第一个话题，就是Open AI把GPT-4免费范围放大，苹果WWDC翻车的可能性还是蛮大的。

Elon Musk的xAI融资60亿美金，多还是少？估值达到240亿美元，成为OpenAI之下第二大的AI公司，这一消息让很多人感到震惊。准备买10万块H100，最赚钱的还是NVIDIA的黄老板。

Luke Fan — Fri, 31 May 2024 00:45:07 +0000

大家好。欢迎收听老范讲故事YouTube频道。今天咱们来讲一讲XAI。刚刚得到的60亿美金融资，是多呀还是少啊？这XAI呢，是马斯克的公司啊。这个马斯克是特别喜欢x，所以他现在把推特也改成x了啊。

XAI呢，我们首先要稍微梳理一下。它不属于特斯拉，也不属于推特，是一个独立的公司。就是马斯克下面各个公司都是独立的，他都是老大机。接口特斯拉space x Twitter SOLO city，就是做太阳能板的那个，再加上XAI啊，这都是独立的公司。

XAI呢，其实前面只提供了group，而且group呢是在呃x .com，就是原来的Twitter里边再去工作的。group现在从它的能力来说，并不比现有的这些强。在现有的各个大的模型里头，应该算是不太突出的一个。虽然它开源了，但是也没有引起任何的响动，因为它开源那个模型实在太大，绝大部分人搭不起来，也没法用。

那么在这样的一个情况下，他突然拿了60亿美金的融资，到手现金60亿美金哦，很大的一笔钱。估值一下达到了240亿美金。这个钱真的是很多呀。大家要知道，他一下就成为了全世界所有AI公司里的第二名。第一名是open AI，860亿美金。第二名呢是anceropic，是150亿美金，就是做cloud这家公司。第三名呢，是法国的Mistra，那也是微软投的啊，那是60亿美金，原来是这样的。结果现在好突然，多出一个240亿美金的公司来，他排第二，了直接排到anseropic前面去了。

但是group它的表现，以及在整个行业里边的影响力，比起open AI，比起cloud啊，比起Intra，都差非常非常远啊。那他到底值不值这么多钱呢？一下60亿美金砸身上了。这件事呢，我们要去看看他这个钱要怎么花啊。

第一件事，他这个钱啊，要去买10万块H100，直接先交给黄教主了。H100多少钱一块啊？现在有人讲，说对外报价是4万美金一块，但是也有说，你买的多，稍微便宜点啊，没准3万多美金就能买回来。但是你想10万块多少钱，10万块也是30-40亿美金啊，对吧？那你说我这还剩20亿呢，你想啥呢？那光是买显卡的，你不给他盖房子吗？你不给他配机器吗？你不给他配人吗？你把这些钱都配在一起，你这个60亿美金，你未必够使嘞。

而且大家知道XAI现在有多少人吗？咱们看到open AI在山姆奥特曼离职，大家一起跟他离职，去签这个离职协议，要去微软上班的时候，那个时候open AI有700多人。现在呢，没有最新公布，就算是过了半年，比如他有一千来人，那么这一千来人，撑起了860亿美金的估值，哇，已经算是挺值钱的了。XAI大概就30多个人，或者反正不到50个人吧。为什么就这么点人呢？他们是通过XAI官方账号关注的，多少个人，他就一共关注了34个人，就认为这34个人是XAI员工吧，那么他就30来个人，值240亿美金，那这每一个人都是金疙瘩啊。当然了，按照传统，这个30来个人里头，大概有十几个是中国人。现在拜登政府要求拿着HEB的中国人，去AI公司里面上班，必须要得到特别许可啊，估计要恭喜这些拿着HYB的这些中国人，大概快要有一个快速通道，可以拿到绿卡了。

那么看来，60亿美金光买显卡还不太够啊。那你说这10万块显卡买在这，还不是逮谁灭谁，咱这算力上去了以后不全都有吗？但是呢，大家要知道，梅塔前面讲了，35万块H100直接买下来，而且呢，在小扎立了35块的这个誓言之后，并没有停下来。后来还接着买。他后来可能接着买到了接近50万块。加上扎克伯格手里边的其他各种显卡，现在他手里边的显卡大概相当于100万块左右的H100的算力。所以这是一个非常吓人的事。

那你说梅塔都有这么多了，那微软得有多少啊？他投了open AI啊。而且微软是自己做云计算为外服务的。微软手里有180万块H100真的不少啊。而且呢丹姆奥特曼直接叫嚣1,000万块，我要用1,000万块建立星际之门，这个最大的算力中心。他们起的名字叫Suckgate。对吧，所以10万块H100真的不算多啊。

咱们前面讲了，人60亿美金，是多还是少呢？你看他啥也没做出来，就排名第二了。对吧，才30来个人就值240亿美金，觉得这钱好多呀。然后你到这个显卡军备竞赛里一看，不太够玩的哈。这玩意就跟什么二战之前，日本人要造战列舰似的，说哎英国这么多，咱赶不上啊，咱们是不是跟美国人赶一赶，他在研究这种事情，是不是很有既视感？

那你说在这样的一个状态下，为什么这么多资本愿意给马斯克钱，给他这样的一个估值和这样的一笔钱呢？别人融肯定融不到，马斯克就能融到。这些资本他也不傻，就这么相信马斯克吗？马斯克拿着这笔钱来就能做出来，别人拿着钱做不出来，是不是这样的想法？如果这么想呢，我觉得就稍微的简单了一下。

大家要看到这个时间点，这是5月底了，马上就该6月初了。6月初会发生一件大事，这个大事是什么呢？不是WWC哈，是马斯克的特斯拉要开股东大会了。大家要投票，投票投的是什么？是不是要兑现马斯克的薪水？马斯克前面做了一个薪酬方案，拿了几百亿美金的特斯拉股票，结果呢被他的股东起诉，就是一个很小很小，大概有一股股票的股东起诉了他，然后被特拉华评选法院判了。说你前面那个无效。你要把前面已经拿走，已经花掉的这些薪水再吐回来，这个事就很烦啊。所以马斯克现在在干嘛？说我们再去开一次股东大会啊，让大家去投票。投完票了以后，如果能够通过，我就算是把这个薪水拿到手了。显然，这薪水他已经都拿到手，都花完了啊。这个如果投票不通过，那这钱你说退不退，那是另外一回事啊。投票不通过，他会干嘛呢？把特斯拉里边的人工智能和机器人部门拆出来，然后单独再去玩一趟。所以大家看明白了，这些土豪们，这些有钱人，他们在压这个就是，如果你把特斯拉的做FSD的人工智能部门和机器人部门拆出来以后，很有可能跟x a i合并，对吧？很有可能放在这边。那这个人就算压饱就压中了，对吧？我再提前在你放进之前我先压一笔，你如果放进去之后，这个240亿美金算什么呀，这肯定得涨啊，对吧？所以人家在压这个事情。

那么马斯克呢，这一次很有可能会自导自演，玩个苦肉计，薪水不要了，然后呢，也把造车这个包袱放下来，全身心的投入AI。他一旦是薪水没拿到的话，那特斯拉，他可能就真的没有那么关心了。很多人都在疑惑说哎，这个一帮人录节目，说一些特斯拉的特别大的股东啊，就是手里拥有特斯拉股票非常多的，这些股东都已经明确表态，要投票反对马斯克的薪酬计划。他们觉得不知道为什么说，你们疯了吗？你手里拿了这么多特斯拉股票，然后你现在去反对，你到底是得多恨他，多不理智啊，对吧？大家要想清楚，这些有钱人的处理方式是几个。

第一个，他如果喊了这个，那么特斯拉股票就有可能跌啊，跌完了以后呢，他就可以再逢低吸纳。而且这些人呢，未必说我喊了要反对，最后就真反对，这不一定啊，对吧？这个有可能人就又赚了一笔。另外一种状态是什么呢？他没准另外一头就投了XAI呢。等于是两头下注啊。你如果那头，把特斯拉里头的FSD拆出来，把擎天柱机器人拆出来，我就往那边投钱。那你说特斯拉这东西，拆得出来拆不出来？这玩意也算是上市公司的资产，不能马斯克一句话把它拆走。你也不是最大的股东，就算你是最大的股东，你也不能损害小股东利益，对吧？

但是大家要注意，马斯克是一个很有个人魅力的人。做AI研发需要三个东西：数据、人才、算力。对吧？这边算力已经给你准备好了，人呢？那马斯克就可以坐在另外一边说：“来呀，我们到这边X AI来干活啊。”那这些人咵啦咵啦就去了。而数据呢，我们让特斯拉买吧，它依然是特斯拉的CEO，或者特斯拉的一个很大的股东，签一个同意函，我们用不就完了吗？而且后头还有推特的数据呢。那么XAI可能就一飞冲天了，这是有可能的哟。啊，不需要真的把特斯拉FSD的资产放出来，就FSD的这个版本，可能依然是在特斯拉这边啊，或者版权依然在这边，但是可能未来的新版本，这个特斯拉就再也做不出来了啊，再下一个版本可能就是XAI做了，我们下次就是向XAI去买这个版本就可以了。而且FSD现在不光是特斯拉用啊，其他人也会用啊，那么我们就可以授权给很多的人了，这才是未来真正可以去预期的东西。

那马斯克是不是最适合做AI的人呢？首先我们要想清楚啊，XAI在手里边儿，它的数据肯定是非常多的，它还有FSD在手里的，所以它有各种数据，甭管是文本的数据，图像的数据，视频的数据，因为现在Twitter上面也有大量的短视频在上去，BST又收集了这么多的自动驾驶数据，所以它的数据可能除了OpenAI之外，除了谷歌之外，就属他手里数据多了，对吧？美塔都未必赶得上他手里数据多。而且Facebook是没有现实世界的。\n自动驾驶数据的。那么在这一块上啊，马斯克是有数据优势的。

第二个呢，手里有钱啊。算力呢，虽然跟美塔跟谷歌比，谷歌也买了很多英伟达的H100，而且谷歌手里还有自己做的TPU对吧，所以谷歌的算力也是很高的。然后也没法跟微软这些大厂比，但是他跟其他比都已经算是很高的了。所以他算力也有了。

个别是这一次拿到60亿美金，我就是去买10万块H100去了啊，所以他已经有足够的算力啊，至少排前五没毛病。然后在多模态FSD上积累多年，在这一块上，全世界可能再也没有任何一个公司有它积累得好了。而且还有机器人这样的一个大杀器。而且呢，他的机器人还可以在他的工厂里头，甚至以后到火星上面去，有非常多的应用场景。

马斯克很擅长干一个事情，是什么，他自己创造个场景，然后让这个场景盈利，然后把这个场景上下游的产业链全扬起来。Spacex做的Starlink就是这样的一个事情，他想去火星，去火星得花多少钱啊，我先去做个Starlink，然后Starlink就开始挣钱了，就可以把它的Spacex养起来，这是他比较擅长干的活。

困扰AI发展的下一个节点就是除了算力之外，可能是什么，可能是能源啊，但是我们要知道，特斯拉自己也是一个能源公司对吧，它后边还有Solocity，还有大量的储能电池，还有很多这样的东西在里头，所以在马斯克可能真的是全世界最适合做AI的人，没有之一了啊。

这笔钱到手以后，马斯克的group未来会有什么样的变化？首先呢，从文字处理和生成上来说，我依然坚持我原来的观点，这场战争group已经输了，而且追不上了，战争已经接近尾声，group完败。第二个呢，就是大家现在真正看好的，或者说目光所注视的，是多模态端道端和巨身智能。机器人。而这两块都是在特斯拉这边，对吧？都是有可能未来加入XAI的。而现在XAI也在开始训练多模态大模型，而且还把哲大的一位老兄啊，做LAVA模型的这位老兄拎去，要给他们去做group的多模态。他把LAVA这个模型，其实我在本地也装了，就是专门做图像解释的。你给这张图说，问他说这图画的什么呀，夸夸给你解释啊。这个是一个哲大的老兄做的，这才是未来的方向。

那么group，可能可能最终就是一个名字而已啊。最终你到底是贴在机器人上，贴在火箭上，还是贴在什么地方，关系并没有那么大。那就是马斯克自己可以决定的事情了。现在呢，他肯定要先把架子搭起来，要开始招聘你。毕竟你说你一个240亿美金的公司，三四十人里像话吗？对吧，所以现在要努力招聘啊。当然，招聘的过程中呢，现在也是在跟美塔的科学家在吵架啊。那美塔的科学家说，你一边喊着要监管，然后一边又自己在这推特胡说八道，这合适吗你？马斯克反正也是不怕这个吵架啊，跟跟人慢慢吵着，然后看看在这过程中，能不能把人招回来。马斯克自己的号召力还是很强的啊。

而且呢，现在大家也都在看，说伊利尔团队到底能不能搞过来，或者搞其中的一部分过来，包括伊利尔本人会不会去，大家也在拭目以待。也许能够去，去了以后的话，AI就更加有未来发展的前景了。最终呢，CAI的发展，还是要看6月初特斯拉投票的结果。如果投完了以后，这马斯克的薪水泡汤了，那么XAI就值大钱了啊。这个才是XAI，现在能够突然拿到这一笔钱，到底是多是少，真正大家应该关注的事情。

好，这个故事就跟大家讲到这里。请帮忙点赞，点小铃铛，参加Disco的讨论群，也欢迎有兴趣、有能力的朋友加入我们的付费频道。再见。