NVlink – 老范讲故事｜AI、大模型与商业世界的故事

50亿美金驱动股价暴涨23%！英伟达与英特尔的交易细节却令人不安：看似双赢的背后，一个“无锁定期”条款或早已预示了结局

Luke Fan — Mon, 22 Sep 2025 00:54:51 +0000

英伟达投资英特尔，这背后到底是一个什么样的逻辑？咱们今天来分析一下。

首先，咱们来讲事实的部分和市场的反应。我最先呢，是发现英特尔暴涨，因为美股嘛，它是在晚上折腾的。我早上起来一看手机，当时爆出来，应该是最高峰涨了30%，实际上是涨了23%，就是跳起来有稍微往下掉一点点。

这个事情呢，是在2025年9月18号宣布的，说英伟达要投资50亿美金，认购英特尔增发的普通股。这个里头有两个字叫“增发”。一般投资呢有两种情况，第一种情况呢，叫做增发；第二种呢，叫买老股。买老股呢，就是我花了钱了，有人能够拿到这一笔钱。但是，如果是增发的话，这50亿美金就是一分不少的，会要进到英特尔的账户上去，能够拿到这笔钱的就是英特尔这个公司，没有任何一个老股东说“我可以卖掉一部分股份拿到这个钱”。所以注意“增发”这两个字，是这个交易的核心。

那么占股呢在4%左右，还需要监管的批准。因为这两家公司做什么操作的话，你万一涉及垄断什么也挺讨厌的，所以现在这个事情呢，只是刚宣布了，还等批复。英特尔直接涨了23%，英伟达直接上涨了3%点多，大概不到4%的样子。

第二天呢，依然在高位震荡盘整，就是说第二天没有继续往上冲。因为现在交易都没做完嘛，交易就算做完了以后想要有结果，其实也是一个挺漫长的过程，只是说一个新的可能性摆在了大家面前。原来从来没有人想过，这两家公司还能合作整点什么事，现在一看有可能了，大家认可这种新的可能性所带来的市值上升，所以并没有掉下来，也没有继续往前涨。

从交易细节来看，这件事到底有多认真呢？为什么说认不认真呢？很多的交易细节里头，就可以体现出来两家公司对这个事情未来的一个走向的看法，或者说愿意投入多大精力来去维持这个关系。

首先呢，第一点叫增发股票。

第二个呢，叫不提供除普通股东之外的任何治理权利或信息权利。在他的交易文件里头有这样的一句话，这些话什么意思呢？你花钱成为股东的时候，会有很多其他的权利，比如说治理权。因为股东嘛，最后我要去到股东大会上投票，或者说我可以进入到更高的决策层，他会有这样的一个权利。但是这里写了，只有普通股东的权利，你开股东大会的时候可以去，但是开董事会或者开其他会，你去不了，没有额外的权利。

信息权是什么呢？就是普通股东也有信息权。就是该发财报了，你可以看到财报，你可以在财报会议上去打电话提问题，这个普通股东的信息权。但如果是一些战略股东的话，那会有更高一级的信息权。像我们以前做战略投资，投完了项目以后，都会专门写一份附录，说我们需要哪些信息权，你做什么什么事之前必须要先告诉我，做什么什么事之前需要得到我的同意。这个东西叫一票否决权，以及呢，说哪件事呢，我们要有优先合作权，这个叫战略条款。这些东西呢，通通都没有。

有的时候投资了别人以后，他们这个公司需要进入到我们财报里去，我们还会要求说：“你每个季度要给我发这个财务报表，而且要在哪天哪天之前发。”他那天发不过来，我后面没时间做财报。但是现在写了叫“不提供除普通股东之外的任何治理或信息权利”，所以这个里头就通通都没有。

然后呢，也没有提董事席位的事情。因为英特尔本身的治理结构呢，并不是说你花了钱买了股份，你就是董事了，或者说我买到多少就成为董事，这事也没有。Intel的董事会大概是9-15个人，有时候也是多一点，有时候少一点，但注意一定是个单数，不能两边持平，这是不行的。英特尔规定的是，持有超过3%股份超过3年可以提名。你像这个英伟达拿了4%，这个是够了，但是呢，您今天拿着呀，这事不行，年底连续拿满三年才行。够了三年以后，你可以来提名董事，提名了以后呢，还要股东大会投票来选举，选上了您可以在这当董事，参加董事会；要没选上，对不起，这个跟您没什么关系。它是这样的一个规定。所以呢，没有提及董事席位这个事呢，也确实是符合英特尔当前的一个制度吧。

这个里头最重要的一点是什么？是没有锁定期。一般情况下买了这种股份呢，是应该有锁定期的，你买完了以后不能着急忙慌地把它卖了。现在其实已经赚钱了，已经赚了23%了，按23美金一股买的，现在已经29美金了。所以一旦交易真正批准执行了以后，这边英特尔拿到钱，那边英伟达就可以在股市上卖股票了。这个就是认真程度里头最核心的一个考察点。像我们以前一般签类似这样的协议，都是要有锁定期的，他这里头没写，这个是很奇葩的一个事情。

那么，投资的目的到底是什么呢？刚才咱们讲了，这事没有那么认真，所以咱们来看看到底什么目的。对外讲的目的是什么？

第一，数据中心。英特尔呢，可以直接在CPU上连接Nvlink，由英特尔设计制造、英伟达定制的X86 CPU，并由英伟达集成他们的AI基础平台对外销售。就是英伟达直接把英特尔的这种CPU买回来放在他的这个服务器里，他就可以卖出去了。

但这样的一个事情，可能很多人奇怪，说为什么Nvlink就快，以太网就慢？是不是以太网这个介质有问题？其实没有。就是到了云计算机房里头，Nvlink其实你大家认为，它是一个带有特定硬件的一套协议就可以了，它在传输介质层都不会有太大区别，都是光纤，速度都很快的。但是呢，Nvlink可以跳过以太网的很多，比如路由、交换，还有像什么TCP/IP以及各种的权限认证，所以它的速度会快很多。而且呢，它会跳过主板上的很多的速度限制，它会直接的在芯片跟显存之间建立起这些通道来，所以这个是会快非常非常多的。

为什么这儿还专门提了一下TCPIP？大家知道TCPIP这种协议，就是我们现在使用互联网的底层。TCPIP这个东西是为什么玩意设计的？这玩意是为军队设计的，是一个美国的国防项目。这个协议设计的时候，最核心考察的是什么？不是传输速度，是可靠性。就是我传过去以后，然后校验一下，传错了再传一次，他干的这玩意的一个协议。所以这种协议它快不了的，大家觉得速度挺快，是因为我们没有更快的需求。所以如果能够把这种为了可靠性很高、然后做了非常非常多校验的这种协议跳过的话，是可以极大的提升效率的。这是在数据中心这一头。

另外一个呢，就是在AIPC这一头。AIPC呢，其实大家都在推，但是效果都不好。AI PC就是说，我们可以在PC端直接跑一些本地模型，这些模型呢，可以在本地的GPU上进行一些工作。现在的AIPC的解决方案里头呢，基本上是有几个套路。第一个呢，是英特尔加上英特尔自己的这个GPU，或者我们叫核显吧，就是放在CPU核心里边的这个显卡，由它来去工作。AMD也是AMD的CPU加上AMD的核显来去工作。那么在这一块呢，AMD其实完胜英特尔，因为AMD的GPU本身就比英特尔的好使，而且再加上AMD的这个CPU是在台积电做的，所以它比英特尔的整个的性能都要高，还便宜。所以在这一块呢，英特尔被AMD打的有点抬不起头来。

另外的几种解决方案呢，就是使用英特尔的更小一点的CPU，加上一个英伟达比较小的显卡，这也是一种方案。但是这种方案呢，毕竟没有核显的方案效率高，所以呢，推得并不是很好，而且比较贵。还有一些方案呢，就是arm的CPU加上内部的一些GPU，也可以做AIPC来使，高通其实就推了这样的解决方案出来。

现在呢，英伟达说：“别费劲了，你在这个英特尔的CPU里头，不要再嵌入你自己英特尔的核显了，你嵌英伟达的核显。”等于一个CPU里头，外边这个CPU的部分呢，是英特尔的这个IP，里边这个核显的这部分，嵌的是英伟达的。我们做这种东西出来，这个也算是稍微有一点点想象空间吧。

那么AIPC为什么到现在就是稍微有点鸡肋的一个状态呢？原因很简单，就是本地跑大模型没什么用。为什么要在本地跑？效率又低，发热又很高，又干不了啥事。现在我们看到唯一能够在本地跑的还比较好的模型，其实是嵌入模型（embedding模型），这一块呢，做的还行。但是其他的这种大语言模型也好，或者是图像生成的模型也好，对于本地的设备来说，负担都实在太重了。而且AIPC它们能够嵌入的核显，其实都是这个比较小的核显，你大了以后你就直接上独显了。所以呢，这种稍微大一点点的本地模型，大语言生成模型什么，根本就跑不起来。

英特尔呢，自己会继续保留自己的GPU。原来英特尔也做出了它的GPU的这个设备嘛，也会继续保留它核显的IP。至于未来会不会在这一块逐渐缩减，就使用英伟达的了，现在不知道。如果是一个真正的战略投资的话，英伟达是可以提出要求，说你以后就使我的，或者优先使我的，但是现在他那个协议里头说，你不允许有这种要求。所以这个就继续玩儿吧，看看英特尔未来在自己家的核显和算力卡上到底是做多大投入了。

那市场预期的目的是什么呢？这前面是对外公开的目的。市场预期的目的是，未来是不是可以让英特尔来使用美国英特尔的芯片代工厂，给英伟达造芯片。这个是大家去这个抱有的美好的愿景。但是这件事呢，目前老黄已经出来辟谣了，说我们接着用台积电呢，英特尔现在这些代工厂呢，还要再等，现在到底到一个什么样的状态，谁也不知道。因为呢，你如果真的把这话讲了，台积电那边说：“既然你都可以到英特尔代工了，我是不是先去给博通代代工？我这反正大家都排着队的，你往后排一排，你不够忠诚。”所以老黄一定要跳出来辟谣。

美国政府前面入股了英特尔，但是入股英特尔的先决条件是什么？必须保持代工厂，不能学AMD直接把代工厂扔了，你必须要留着代工厂接着往前走。所以这块呢，是市场希望它未来可以走到这一步吧。

实际可能的结果是什么呢？芯片这种东西，从设计生产整个的周期是很长的，至少是以年计，而且呢，通常是两年往上的一个周期。所以如果审批没毛病，这个交易过了，马上就开始设计新的芯片，可能明年的CES都不可能看到，因为一般CES是在年初嘛，拉斯维加斯的这个消费电子展。2027年的CES上有可能能够看到样片，到2028年呢，估计才会有相应的产品下线。川普在这一任上未必能够看到英伟达跟英特尔合作的芯片真正装到电脑上，卖到千家万户。

AIPC呢，反正本来大家也不是很买账，我也不认为英特尔装上英伟达的核显以后，就能够把AIPC这条赛道盘活，整个的逻辑目前就没走通。

大型的云计算厂商压根都不会买账。因为甭管是亚马逊、谷歌、微软、Oracle、OpenAI，国内的阿里云、字节跳动，这些大型的云计算厂商，他们使用的方式是什么呢？他们喜欢用arm的CPU。因为arm CPU，第一，可以定制。因为arm是一个IP厂商嘛，你只要买了它的IP，你就可以来定制这个CPU，完全给自己去设计一个自己合用的。而且呢，arm CPU最大的特点是，只要是负载比较低的时候它很省电，不像英特尔的CPU似的，甭管你用不用都很耗电，但是用的时候耗电耗的更多。arm CPU就是不用的时候，耗电是非常非常省的，因为这东西最早是给手机设计的嘛。

在这个arm的CPU的基础上呢，再往上挂什么呢？自行设计的ISS的这种定制集成电路。谁给它定制呢？博通。所以刚才我们讲说，如果英伟达对于台积电不够忠诚的话，台积电就有可能排产都排给博通了，这个事也是受不了的。谷歌的云后边用的TPU就是博通给造的，现在OpenAI、Oracle大家都去找博通，说咱们再接着定制吧。现在是这样的一个路子。所以大的云计算厂商都不会买这个方案的。

那谁会买这种方案呢？企业云、政府云，他们会来买这个东西。它用的量也不是很大，而且呢，因为里头有英特尔X86的CPU嘛，还可以去跑一些普通的应用。因为你一旦是arm CPU在里头的话，它还有一些兼容性的问题，有些程序是在这种arm CPU上可以跑的，但未必所有都能跑，特别是一些比较旧的程序，可能未必再让它跑得起来，或者跑的兼容性那么好。就还是英特尔的CPU的兼容性会更好一些。

还有一些小型的云服务商也会去买这样的设备来去使用。为什么呢？它小嘛，所以它上面的很多应用就五花八门的，也比较零碎，甭管拿了什么样的应用回来，我的兼容性都很好。所以这块呢，也会有一定的订单，大型的云计算中心都不会买。

这件事情背后就真实的原因是什么？原因很简单。就是第一，Intel很穷，负债太高，快转不动了。第二，英伟达有钱，而且也没地方投。而且英伟达呢，其实一方面也在回购一点点自己的股票，但是呢，黄仁勋这些高管都在不断的往外卖。他跟马斯克不一样，马斯克是在不断的要求董事会给他发股票，黄仁勋这帮人是不断的想办法把自己的股票变现。

现在呢，一个很穷很缺钱，而且估值不高——英特尔现在真的是估值不高；另外一个呢，是真有钱没地儿投。那他跟投一下吧，投的目的呢，是继续炒作AI基础设施建设的这个概念。至于AI后边能不能挣钱不管，但是芯片你们还是要买的。资本市场对于AI基础设施建设的这个概念呢，还是买账的，所以双方的股票都在涨，涨完了以后呢，也没有掉回去。所以这就是它的真实原因，就是继续投入造AI基础设施。

现在的算力概念是如何的疯狂？这个大家已经看到了，每一个大厂都在宣布增加资本投入，建设这个算力中心。甭管是谷歌、Oracle、微软、亚马逊，国内的阿里、百度、腾讯、字节跳动、华为，所有人都说我们今年不干别的，就是花钱去建数据中心。我宁肯亏钱，我也要去建数据中心。而且呢，你只要喊说我建数据中心了，你的股价就涨。至于说你拿这数据中心到底有没有挣到钱，其实没人管你。你像Meta也是这样的，说我现在建数据中心，我买卡去了，买完卡以后那股票蹭蹭蹭就上去了。所以真的是资本市场吃这套路。

然后各大厂都在自研芯片，大量的这个推理芯片都是自己做的。谷歌我去做TPU去了，Oracle和这个OpenAI说我们去找博通，我们定一个。微软说我也去定一个。亚马逊其实一直也是在自己定制推理芯片。特斯拉说我这叫AI 5、AI 6做去。那边X.AI说我们叫X1，他们也定制了一颗这样的推理芯片。咱们这边阿里，说我们去做平头哥去了。百度叫昆仑什么这东西。字节跳动说我们也去定制一个。还有华为的升腾系列。大家都在自己定制芯片。

你的芯片到底好不好、能不能用？从现在开始喊定制，到最后能把它装上，刚才我讲了，两年往上。但是甭管怎么说，我这边喊定制芯片，那头股价就涨。你们看看阿里的股价，就是这样的一个情况。现在其实已经稍微有些疯狂了。

甚至呢，还有人跑去说投资和建设电站呢。像山姆奥特曼还有一帮人说：“我去投资个核聚变项目吧，我去建电站吧。”特斯拉说：“我现在做Megapack储能电站。”特斯拉这个储能电站概念，把国内所有的这些做锂电池的股价全拉起来了。因为现在他们说：“我们重新把这封闭的锂矿给它开启起来，我们要赶快去造锂电池去。”整个这条路又都盘活了。实际上都是走的算力基础设施建设的这样的一个大逻辑。

当然，所有这些人里头，玩的最花的呢，就是英伟达。英伟达先四处去讲主权AI，各个国家的管理者认为，说必须要有一个AI是听我的，是能够维持我国家主权的一个东西。其实这玩意是扯淡的，任何政府你要想自己去掌握一套AI的话，他们压根就付不起钱去雇佣工程师、去折腾数据，这事他就搞不定。而且这种东西训练成本极高，使用成本其实也很高，而政府的AI，它的使用效率一定是非常非常低下的。所以这个就是一个完完全全的伪命题。但是对于那些得到位置、又不想下去的人来说的话，这件事就太重要了。虽然他们自己也搞不懂，但是我先花钱花着。

而且主权AI这个东西的话，就很适合刚才咱们讲的英特尔的这个方案，使用英特尔CPU加上英伟达GPU，中间使用Nvlink直接连接的这个方案是非常非常合适的。因为它的这个主权AI的大模型，它运作的效率又没有的很高，它这个里头还有很多的这种传统业务，比如说数据库业务、逻辑业务，这些东西都是需要使用CPU的。这些业务的话，在英特尔的X86的CPU上，要比在arm的CPU上效率要好很多，而且兼容性也要好很多。但是呢，大家注意，就是给政府AI做项目的这些团队呢，他的技术可能还不一定特别好，给他一些英特尔的X86 CPU的话，对于他们的系统迁移（因为也有很多旧的项目），也算是一个比较好的消息吧。

除了玩这个之外还有什么呢？就是Codeweave。英伟达绝对尝到甜头了，投资Codeweave，投资完了以后，Codeweave再拿这个钱去找英伟达买芯片，买完了芯片了以后，把算力中心做出来。这种东西你真的做完了以后不好卖，然后英伟达再花钱，再把这个算力中心的整个的算力买下来，再偷偷的租出去。但是这样的一个运作逻辑，等于里外里全是他，这一笔钱赚个两三回，这公司还上市了。2025年3月28号上市，上市的时候价格是40美金，现在价格多少钱？124.86美金。赚死了这个事。

而且英伟达觉得这个事这么赚钱，那咱接着来吧，又整了一个叫拉姆达的公司，这个继续搞。拉姆达也是这种算力的租赁公司，英伟达投钱给他，他拿这个钱上英伟达买芯片，买完芯片建了这个算力池以后，英伟达再去整租这些算力，再把这些算力再投资给别人。因为他有时候直接投资，你反正需要算力吗，我就不给你现金了，我就直接给你这些算力就完事了。他又可以干这样的事情，就是一笔钱要赚个三四次才算是划算。

那你说他把这种算力投给谁谁乐意？他还投了一大堆的这种大模型公司呢，这些公司是乐意的。反正你要投给我钱，那你就干脆给我算力，还打个折扣，我就拿着这个就当钱使了，不就完事了吗？他投资了Cohere，这是一个比较大的模型公司，但是这个模型公司呢，主要做的是各种各样的嵌入模型，这个是ToB的一个大模型公司，很大的。另外呢，就是huggingface，这个公司呢是大模型领域里的GitHub，谁开源了项目都放他那放，所有的开源的这些大模型呢，都可以在huggingface上得到一点点算力去做测试。这些算力是哪来的？英伟达投资投进去的。还有谁呢？就是法国的Mistral，号称是欧洲的OpenAI的这公司，他也是拿了英伟达的钱。那英伟达就不用给他钱，直接给他算力不就完事了吗？这些人就愿意来接收这些东西。

然后还有呢，就是投资机器人公司。Figure AI就拿了这个英伟达的钱，拿了钱以后，就是直接在机器人里头塞英伟达的索尔芯片就完事了，他专门有一个给机器人用的索尔芯片，这个效果也还是不错的，国内造机器人很多也是在用这个芯片。

如果中美关系好，那国内这些大模型厂商、云计算厂商、机器人厂商的话，包括智能汽车的厂商，英伟达估计都能投一遍。因为以前中美关系相对还不错的时候，英特尔的投资部、高通的投资部，在国内都是非常非常活跃的。

现在呢，除了这些算力之外，又有新的概念开始炒起来了。什么新概念？机器人概念开始炒起来了，人形机器人。不说都没做出来的吗？大家都在这表演翻跟头、表演叠衣服、表演这些东西了，有能卖的吗？没有能卖的吧？别着急。

有一家正在做并购停牌的医药公司，突然宣布跟特斯拉签了一份意向书。干嘛呢？购买1万台擎天柱三代。现在马上要量产的下一代叫擎天柱三代嘛，“我买1万台”。为什么要干这事呢？说我们这是医药公司，我未来是要做制药厂的。这个公司在美国，我雇人肯定雇不起，也没有空去培训他。而且呢，医药公司里头需要什么呢？绝对纯净，要干净。那么人呢，肯定没有机器人干净，以后我们这个无人工厂里头全是机器人，就没有人了。他发了这样的一个公告出来了，在他的网站上直接写出“我们跟特斯拉签约了”。

这个事情就被炒作呀，一帮媒体看到，特斯拉的擎天柱被卖掉了，而且一下买了1万台，很多人很开心。这个事呢，马斯克亲自在X上辟谣，这个事是个假的。但是呢，那边也是一个官方消息，说我签了这么个协议。这种辟谣的原因是什么？

第一个呢，他这个协议可能规定的比较模糊，或者而且他这个不叫协议，叫备忘或者说叫意向书吧。另外一方面呢，就是他可能压根就不是跟特斯拉签的。反正马斯克肯定上来辟谣了。第一个原因呢，擎天柱三代现在距离彻底的商业化还很远；第二个是早期商业化的时候，肯定是特斯拉先吃螃蟹，而且最早开始应用擎天柱的这样的公司一定股价还要上涨一下，特斯拉说肥水不能流外人田，一定是我们自己得着的；还一个是什么？如果不按住这种势头的话，那后边冲上来蹭的人会越来越多的，那这个的话会把整个市场搞乱掉了。所以马斯克出来辟谣。这个就是怎么去造概念、怎么去蹭概念的一个故事。

最后总结一下吧。英伟达投资英特尔到底是在干嘛？第一个，咱们讲清楚，这是又一次的炒概念，核心就是炒概念，炒的是AI基础设施建设这个概念。有人买到Intel了，你赚一笔，那你就赚着就完事了。

炒概念你说算不算泡沫呢？其实很多的科技快速发展的时候都是有泡沫的，最后看谁能把坑填上。你没填上，你就是泡沫；填上了，这就是科技发展过程中必然要经历的一些小挫折。包括很多庞氏骗局其实也是这样。所以呢，大家可以相对来说冷静的来分析，英特尔跟英伟达的这个合作到底是一个什么样的故事。

咱们这个频道呢，也从来不做具体的投资意见和建议。赚了是您自己的，赔了也别找我。

好，这就是咱们今天这个故事。感谢大家收听，请帮忙点赞、点小铃铛、参加DISCORD讨论群，也欢迎有兴趣、有能力的朋友加入我们的付费频道。再见。

深度揭秘Grok-2开源：马斯克藏不住的“中国芯”？SGLANG与Deepseek的秘密关系。

Luke Fan — Wed, 27 Aug 2025 00:53:02 +0000

马斯克终于开源了他的Grok-2。虽迟但到，这背后隐藏着哪些不为人知的秘密呢？

大家好，欢迎收听老范讲故事的YouTube频道。

马斯克最终还是开源了他的Grok-2。原来我们还嘲笑过他，Grok-1开源完了，往那一扔就再也不管它了，有任何人提问题，你也不说什么。Grok 4都出来了，现在Grok 2都没开源出来。马斯克说：“那我们下周开源。”当时是这么讲的。然而下周完了以后，好像还是又等了那么一段时间，稍微晚了这么几天吧，Grok 2最终还是开源出来了。而且承诺呢，6个月之内，或者说在年底之前吧，有可能会去开源Grok 3。但是马斯克的话嘛，大家相信，就是他说了的事会做，但是未必按时间做。

马斯克的开源呢，只能算是符合非常广义的开源。这话什么意思呢？开源也是分原教旨主义者的，他们是肯定不会认可马斯克在开源的。第一个，马斯克不是当时发布产品马上开源，而是要过一段时间，甚至是过了一年多才去开源。而且现在他开源出来的这个版本，远远落后于当前主流模型。当然Grok 2呢也不算特别落后，它在当时刚推出的时候，应该是跟GPT-4不相上下的一个水平，但是跟后边4O，以及后边O1、O2这些东西就没法比了。跟当前的主流模型，像什么GPT-5、Grok-4、Claude 4或者是Gemini 2.5这些，它是比不过的。

而且呢，马斯克开源出来的这个大模型，对于部署是非常不友好的。你要想去把它的大模型下载下来，把它部署到自己的服务器上去，这个是非常非常痛苦的。这个大小是500G，需要在Huggingface上做断点续传。Huggingface是大模型领域里边的开源仓库嘛，你需要把这500G的文件从那上头慢慢往下传下来，错了没关系，继续再来几次。他专门给大家写了这样的一个话。

而且运行的时候呢，需要8张40G以上显存的显卡才能跑起来。8张40G以上显存的显卡什么意思呢？在国内合法可以跑的这个显卡是H800、H20、RTX 6000。你说我拿5090D跑行不行？这是为中国专门量身定做的5090，跑不起来。5090D呢是24G显存，把这个D去了，也就是国际上正常的5090是32G显存，也跑着费劲。而且呢，5090跟前面我们讲的H20比，有一个巨大的差异是什么？它没有Nvlink，卡跟卡之间的通信是很慢的。而H20这种专门的算力卡，里边是有Nvlink的，八块卡搁在一起，它还可以快速的跑起来。

当然了，Grok 2呢不是特别不友好，你像在那个当时还有一个跟Grok 2前后脚发布的产品，叫Deepseek V2，那个版本当时开源出来的时候是需要8张80G的显存的显卡才可以跑起来。这个Grok 2只需要8张40G显存的显卡就可以跑起来了。为什么会有这样的差距呢？原因很简单，当时的Deepseek V2是FP16的，而现在的Grok 2的话是FP8的，所以它会要更加的省显存一点点。

现在开源出来的呢叫Grok 2.5，并不是真正的Grok 2。它必须使用叫SGLANG的这样的一个系统来去部署。这个里边呢就会有很多故事了。大家注意，Grok 1并没有这样的要求，Grok 1使用的是Jax系统部署的。Jax是谷歌的系统。咱们待会就围绕这个SGLANG，来讲一讲它这个故事到底在哪。

马斯克的开源跟其他人开源不一样，就是他把东西开出来以后，基本上就不闻不问了。你其他人开源出来以后，你去提意见，说我哪遇到问题了，开源出来的这些公司还是要去修修补补的，调整一些东西的。马斯克就甭管是它前面的Twitter的推荐算法，还是Grok 1开源出来以后，就再也没人说这事了。你提任何事情，他都不理你，也不会做任何更新，就是这样的一种开源。

而且呢，它的开源参数呢也没有完全公开。你像Deepseek这些，都是直接告诉你我有多少参数，如何去部署，怎么去用这个东西，甚至连论文什么一块扔出来。马斯克就是我把东西扔这了，你们自己谁爱用谁用去。现在呢，大家只能通过下载的模型去猜测，它呢应该是一个269B的模型，是一个挺大的模型。

license呢也是严苛的，商务社区版本的license。所有的开源项目，你都是要有开源license，就是我拿这开源项目以后，什么事许干，什么事不许干。它这个Grok 2是不允许商用的。你就算是把它放在自己的产品里用，你说我不商用，没有达到大规模使用的这个程度，你也要在里边写上“powered by XAI”，这个都是要注明的。一旦超过了它一个使用限制以后，这个事就没法整了。Grok 1是阿帕奇2.0的license，还是一个完全开源的产品，但是到Grok 2就不是了，就已经变成了这种商业许可的产品了。

国际上面是有这种商业许可限制的大模型呢，像Llama其实是有限制的，那个也是有规定的，就是你用户量达到多少以上，你就不可以再去使用了。你拿去做一些研究是OK的，但是呢你不可以拿Llama再去训练新的模型。但是这个东西呢，说也是叫防君子不防小人吧，Llama 1开源，全中国的这些开源大模型就如雨后春笋一样夸夸就出来了。所以你去写说不允许训练其他模型，不允许去优化自己产品，不允许去商业使用这些事，反正你说着开心就好了。Grok 2呢也是这样的一份协议，大家说着开心就好了。但是差异在哪呢？就是Llama当时发布的时候是当时最领先的模型，大家会去照着去学习；但是Grok 2发布的时候就已经是去年的模型了，反正你算是开过源了吧，也就如此了。国内的模型呢，像Deepseek、千问这些，基本上都是MIT或者是阿帕奇的这种license，就是你可以拿去使，可以商用，可以自己去修改，拿它去干嘛我就不管了。所以跟他们还是有很大区别的。

咱们后边讲这个SGLANG到底是一个什么样的系统呢？它的名字是一个缩写，叫结构化生成语言。S是structure，G是general，LANG是这个language，它大概是这么三个单词拼在一起了。它的开发者呢，两个主要开发者，一个叫郑连敏，一个叫尹良生，听着像中国人吧？郑连敏呢是上海交大的本科，UC伯克利的博士，他现在就是Xai的工程师，在Xai里头主要就负责SGLANG这个版本的继续推进。明年7月份呢，会加入到UCLA任助理教授，现在UCLA的官网上已经把他的名字写上了。像美国的这些大厂里边的科学家，或者是这种大工程师呢，都会有这种两边来回流动的一个过程，去上两学期课，然后呢回来做一段时间的研究，很多的美国这些大厂的顶尖科学家是这么工作的。另外一个呢叫尹良生，尹良生呢是上海交大的本科，2025年从上海交大毕业，就是今年毕业，已经拿到了UC伯克利的博士生入学许可，准备到那儿接着去读博士了。

他们两个人写的这套系统。那你说老范，你是不是要讲中国人好厉害？比大家想象的可能还要再稍微厉害那么一点点。本身XAI里边这个中国人的比例就非常非常高，咱们这讲的是中国人，不是广泛的意义上的华人，就是从国内去的这帮人，比如清华、北大或者上海交大这些地方学完了去的，他们可能在美国读的博士，然后就在XAI里边去上班了。

但是这个项目还不太一样，咱们去稍微捋一捋这个SGLANG的一个发展历程。他是2023年12月12号发表的SGLANG的论文，当时呢郑连敏应该是在UC伯克利读博士，而尹良生应该是在上海交大还在上本科，他们两个人呢联合署名做了这样的一篇论文。到2024年5月份，Deepseek V2发布，236B的一个大模型，每次激活21B的参数。他们呢就说我们要去升级我们的版本，大概是到9月份，这个SGLANG就升级好了，专门对Deepseek进行了优化。SGLANG是Deepseek最优化的一个运行平台，你在其他平台上跑这个Deepseek都没有在SGLANG上跑得快。到2024年的8月份，Grok-2发布了，269B，每次激活115B。这个时候呢，郑连敏应该已经从UC伯克利博士毕业了，已经到了XAI去上班去了。2024年的12月份，SGLANG继续升级，这个升级是为了支持Deepseek V3的。Deepseek V3呢是2024年12月份发布的671B的一个大模型，包括后边我们讲的Deepseek R1，都是在Deepseek V3的基础上进行训练的。Deepseek最近刚出的V3.1还是671B，所以呢这都是一个系列的模型。2024年12月份还发生了一个什么事呢？grok V3发布。

大家按这个线去捋，你就基本上可以发现，Grok 1做的时候，马斯克还是满眼抓瞎的时候，不知道该怎么弄，拿着这个JAX就开干了。另外一个拿JAX开干的是谁？是苹果。苹果那个时候也是举着JAX就开干了，最后呢做出来的一个产品，但是效果一般。这个时候Deepseek大量的这种MOE模型的开源的东西就出来了，包括后面的论文什么就都出来了。上海交大这两位同学吧，他就开始去写这个SGLANG，专门针对这种MOE的模型进行优化。马斯克觉得这条路不错，那咱就干脆把这个团队招到我这来，你给我去好好维护这个SGLANG的版本，我们也在这个基础上，去训练我们的模型。

你说这个里头有抄袭没有？还是说有借鉴？我觉得说借鉴还是比较合理的。因为你去做新的研究的时候，你总要看论文吧？梁文峰写了那么多论文，你也得看。看完了以后，你说我受这个影响了，照这个方向去往前发展，这个本身没有任何问题。咱们不要老觉得说不是原创就怎么怎么样，别老想着这事。

所以从这看呢，Grok跟Deepseek还是很有缘分的。Grok 2跟Deepseek V2、V2.5，它们之间其实是有非常相近的地方。再到Grok 3跟Deepseek V3，也是有很多相近的地方了，有相互借鉴的地方。可能更多的是Grok去借鉴Deepseek，因为Grok每次出新版本的时候，它不开源也不开放出来，他要过一年以后才开放；而Deepseek每次拿出点什么东西，马上都开放了。所以这个到底谁去借鉴谁，大家自己心里去想。

其实呢，这就是开源生态的一种发展方式。很多人在讲什么“美国人一开源，中国人就自主研发、自主知识产权了”，这可不是这么回事的。开源了，我们就可以在开源协议的允许范围内去使用这些代码，甚至是去修改这些代码，再发行这些代码。他只要是协议允许你干这个事，你就可以去干。我干完了以后，我去注明了，说我是用了人家的代码，我把它写清楚就完事了。就算是前面翻车那盘古大模型，上头也写了“我用了别人东西”。但是中国人有时候没法接受这事，你说你都叫盘古了，你好意思你用别人的吗？前两天华为云内部的架构大调整，把整个的盘古这个团队全开掉了，以后这个丢人现眼的东西咱不弄了。前边别人说盘古去抄袭了，华为还在那义正词严的在那辟谣呢，辟完谣以后沉寂了俩月，直接把团队给开了。你说这玩意叫啥事？

我觉得我们应该很好的去接受这种开源生态，而不是说我一定要原创，我从来没有抄过，我从来没有用过别人，这个是相对来说比较狭隘的。你像Deepseek发了论文，公开了参数，SGLANG呢肯定是以这些公开信息为基础进行了优化。Xai呢也在这个过程中呢转型，在SGLANG基础上用同样的系统进行优化。大家走的路呢又不是完全一样，Deepseek还是要更多的考虑到算力紧张，没有NVlink的情况下，这个性能到底怎么样，到底怎么把它跑起来。Grok那就是土豪家的败家子，有的是卡，最新最好的卡，而且还有工程师爸爸负责部署和实施。他还跟微软、Oracle这些公司不一样，那些公司还需要外包，找别人去给部署。那马斯克干这玩意，肯定是没有任何问题的，因为他从特斯拉的时候就开始部署这种超算的集群，非常非常有经验。所以他可以把最好的卡、最新的卡拎回来进行部署，而且量大管饱。现在马斯克已经说，我们注册一公司叫“巨硬”，准备买上百万块的显卡，接着往前走。

马斯克算迎头赶上了，用Deepseek没有的资源，直接暴力推进。我们前面在讲Deepseek的时候就已经讲过了，马斯克肯定会照着往前冲的。苹果啥也没干，其实苹果在做大模型这块跟XAI是同时起步的，都是从JAX这开始起步的，但是苹果最后啥也没出来，马斯克这边都做出来了。梅塔呢还在老路上面去蹉跎前行，未来到底怎么走还不知道。所以呢，别人都开源了，谁你抄的好、抄的不好，或者在这个基础上到底能不能做出新东西来？我相信Grok还是创新的，我并不是说我就指责了，说“Grok你就是抄Deepseek”，没有说这话。还是得看谁可以把这个工程往前推的更远，这个才是本事。

国内的模型厂商的话，你说他们没有借鉴Deepseek吗？肯定借鉴了。他们只是说太多东西要抄了，到底抄谁的呀？这个是真正国内厂商要去头疼的事情。大家发现了，Deepseek V2的版本其实并没有那么热，到V2.5开始这个热度一下就上来了。就是从Deepseek V2.5开始，很多的国内厂商就开始转型，说我们是不是去看一看，像百度什么，他们就已经开始转型了。等到Deepseek V3出来的时候，其实就已经很热很热了。当然对于整个的行业来说，或者说对于社会来说，圈外的人真正知道Deepseek是从Deepseek R1，就是从今年1月份才开始知道这个事儿。但是从去年12月份的Deepseek V3开始，在这个程序员圈里头，在这个行业内呢，大家就已经普遍认知了，这就是一个当前最好的框架了。所以当时很多的团队就都已经都转过来了。现在Kimi k2、mini Max M1、百度的这个4.5、智谱的4.5，其实都是按照一个模式做出来的。但你说它们都是抄袭的，我觉得大家不要想这个事。大家呢都在同样的看论文，都在一个可能同学圈或者是朋友圈里边去，大家一块可能平时喝个咖啡、聊个天什么的，他是这样的一个环境。

国内大模型厂商也是相互借鉴。你看谷歌、微软，他们肯定也会去读论文，他们去做新的研究、去做新的产品的时候，“这Deepseek写的，中国人写的，我不看”，他们也不会这样的，没有那么狭隘。

今天我其实主要跟大家讲的是这样：开源才是未来的一个方向。不要上来说你抄袭，不尊重原创，这太狭隘了。咱们最后总结一下：开源是当今世界比较先进的全球化、松散协作方式。大家注意我刚才讲的这些定语：全球化、松散协作。开源呢推动了互联网、移动互联网和今天的大模型的整个产业的升级。Deepseek呢在里头起到了巨大的推动作用，包括咱们今天讲的SGLANG，都是在开源大潮里边起到了巨大的作用。

马斯克的Grok开源呢，基本上没有为社区贡献太多的东西，毕竟是去年4月份的东西嘛，还是稍微差一些的。马斯克喊开源呢，主要还是为了要吸引眼球。第一方面呢是恶心OpenAI。当然OpenAI现在人家也开源了，把GPT OSS拿出来了。但GPT OSS要比现在开源的Grok 2要强非常非常多，因为GPT OSS是大家可以用的一个产品，不是像Grok 2这样的，没有人会去用它。为什么没有人用？因为部署起来成本非常高，还是一个旧模型。我花了这么多成本，我去部署Deepseek V3.1不行吗？所以他就不想让别人用，也不想让任何人占他便宜。

马斯克现在想干的活呢，就是让更多的人去用他的Grok服务。而且呢也希望在未来呢，让更多的人呢去用他的这个巨硬的产品。那你说巨硬到底做什么的？前面他专门申请了一个商标叫巨硬，就专门为了恶心微软的，“你叫微软我叫巨硬”。一开始以为马斯克就是开个玩笑，或者说出来嘲讽一下比尔盖茨，没想着他真在里头干活。现在说了，我们这巨硬公司是真的要干活了，而且呢干这方向呢，也是大家熟悉的方向，他要做manos，就是做agent。说以后你微软的这些产品，我通通都拿各种各样的AI agent给你覆盖掉。你做了office，我就给你做个AI agent，跟他说你给我写一PPT或者给我写一什么东西，他吭哧吭哧给我写好了，我就不需要那么复杂的叫做office这些东西了。他是搞了这么一套东西出来。

大模型在不断创造内容的过程中呢，其实也在不断的污染大模型被发明之后的语言环境。所以呢，中国的创业公司跟开发者，也在不断的创造新的技术，创造新的内容。在这个过程中，再通过开发者社区或者通过开源社区，不断的将这些新的思想拿出来，去影响全球的科技发展，为全球科技发展添砖加瓦。不要想着说脱钩断链，说我们不要中国人的思考，我们不要中国人的技术，这个玩意是有毒，这个世界不是这么发展的。

咱们今天通过Grok 2的这个发布，通过Grok 2使用的SGLANG的这个平台的一个历程，你就会看到在这个过程中的话，你需要上海交大的学生来去给你写这些系统，你也需要去借鉴Deepseek的论文、借鉴他的一些思路去训练自己的模型。而且这个节奏是一模一样的，这边出Deepseek V2，那边过几个月出这个Grok 2；然后那边出Deepseek V3，你同一个月出Grok 3。这个就是同样的节奏，一模一样的往前走。所以这是一个进步的过程，别老想着谁抄谁的事。

好，今天这故事讲到这里，感谢大家收听。请帮忙点赞、点小铃铛、参加DISCORD讨论群。也欢迎有兴趣、有能力的朋友加入我们的付费频道。再见。

中美伦敦会谈的桌面之下：任正非借人民日报亮剑，黄仁勋罕见认同华为，揭秘超越芯片硬件的AI标准与电力战争真相。

Luke Fan — Tue, 17 Jun 2025 00:39:43 +0000

黄仁勋与任正非的隔空对话：AI芯片之争。中美伦敦贸易会谈——谁都没说，但谁都真正关心的话题。

大家好，欢迎收听老范讲故事的YouTube频道。今天咱们来讲一讲任正非的人民日报文章，以及黄仁勋给他的回复。6月10号头版头条占了1/3的版面，叫《国家越开放，会促使我们更加进步——对话任正非》。这样的一篇文章登上了人民日报的头版。这个排版的艺术要注意，人民日报呢，一般头版上最多是给你个标题，或者写一小段，后边就跳转到多少版面去了。直接占1/3版面写这样的一篇文章的话，这个是要表明一个态度。而且很重要的是时间点，6月10号这篇文章刷出来的。这是个什么时间点呢？中美伦敦会谈是6月9号到6月13号，这是中美伦敦会谈的第二天。把这样的一篇文章给刷到人民日报头版上去了，所以这个也是我们表明的一个态度：就是你卡我吧，我告诉你卡了我以后会怎么样。

那任正非说了些什么呢？第一个，没有想过，想也没有用。不去想困难，干就完了，一步一步往前走。这是一个大的重点。我记得原来有一本小说叫《绝代双骄》，有人问他说，都遇到这样的难事了，你咋不发愁呢？当时那个主角应该叫江小鱼，他的经典回复是：如果发愁能够有用的话，我早就发愁去了。所以任正非呢，现在也是讲的干就完了，你想这玩意也白想。

第二个讲的，说中国做芯片的公司很多都做的不错，华为只是其中一家。美国是夸大了华为的成绩，华为还没有这么厉害，要努力做才能达到他们的评价。就是说做芯片的好多呢，不光我一个，他们老盯着华为，其实我们也没那么厉害。这个呢，也算是一个小幽默吧。

再往后说，华为单芯片技术仍然落后美国一代，但通过集群计算、算法优化等路径，可在实际应用中达到与国际先进水平相当的效果。这个话什么意思呢？就是说他承认他的升腾910系列的芯片比英伟达的芯片呢还是要落后一代。至于这一代到底是多大的代，咱们就不研究了，反正我们现在承认落后了。但是呢，我一个落后我就可以多来几个吗？我把它并行起来不就完事了吗？很多人说这不行，你并行起来，人家还有Nvlink，还有HBM，还有一堆技术来防止你去并行呢。这个里头是这样，你可以通过算法优化，把原来的给Nvlink，给CUDA写的这些算法整个调整一下，把这个计算序列重新排定一下，让他们可以并行去计算。这个可以部分克服吧，你肯定还是要效率比他低，但是基本上能使。我觉得任正非作为一个了解工程技术的人，说这个话不算是说错。

再往后说，人工智能也许是人类社会最后一次技术革命。中国在电力、通信、网络等领域具备优势。这个话呢，我觉得任老爷子说的是非常有水平。人工智能也许是人类社会最后一次技术革命，再往后就不仅仅是人类自己的技术革命了，可能就是一些新物种了。

而人工智能真正考验的是什么？就是电力和网络通讯的基础设施。你要有电，没有电的话，你说你怎么去算？甭管你是用英伟达的显卡，还是用升腾的显卡，你都得烧电。你用升腾的显卡，可能做同样的事情烧更多的电。我们现在在发电这件事情上，肯定是要领先美国很多的。咱们在国内整个的通信网络，还是相当的先进、相当的发达的。在这一块上，我们已经领先了。

最后呢，他讲了一个在商言商嘛，就是你还是要讲一些对华为有利的事情。国家要形成统一大市场，民营企业需要法制化、市场化环境。这个就是华为给自己要的东西了。好多人一说华为，这不就是国企吗？这不就是背后有什么背景？其实华为是个民企。华为在很多的竞争领域里头，也会被这种大国企、央企，或者是关系更硬的人欺负来欺负去的。所以华为讲了说，还是要好好的法制化。

而且为什么要讲统一大市场呢？中国很多这种政府招投标吧，还是会做这种叫地方保护。说这是我们省的，或者我们市的企业，我们要首先让他活下来。华为你这个我知道你很难，但是你先等一等。所以要去讲统一大市场，在商言商总还是要讲一点。

那么这个文章的意义是什么呢？就是我们不怕美国的芯片封锁。现在我们已经逐渐追上来了。升腾最新的芯片据说已经接近了可能上一代英伟达芯片的这个水平。跟现在什么GB 200这个比起来，肯定还差的比较远。但是你要去比什么H100，已经可以想办法拼拼凑凑能够干活了。这是中美伦敦谈判期间我们发的一个文章。

中美伦敦谈判呢，谈了好像又没谈。大家呢，都有希望达成的结果。美国人想要稀土，中国人想要芯片。而且不光是想要英伟达最好的芯片，我们可能还想自己造芯片。你把那个光刻机卖给我一个。我们想要这些东西，都是需要时间和巨大成本才能够搞定的东西。

美国人说，就搞不定稀土吗？肯定也搞得定。这玩意也没有什么先进技术，就是第一个耗电。因为大量的稀土提炼，实际上都是在电解铝，或者是一些伴生矿的分解的过程中去得到的。所以你要想整这个东西，就是需要大量的电。第二个是什么呢？你需要有很多的这种副产品要消耗。比如说我做出一大堆的这个稀土材料来，那你电解铝那些铝你干嘛去？你也得把它用掉。还有呢，就是要污染环境。

你发了很多电去做电解铝。电解铝本身也是一个挺污染的产业。你愿不愿意在美国土地上发了这么多电去电解铝，再把这个铝卖掉，然后再把环境污染了？你要愿意干，那你就慢慢干。这个事并没有那么大的问题。

至于说中国想要芯片这件事呢，其实是一个道理。你不要说美国人发明了，你发明不出来。我们还是有很多工程技术上的方式可以来绕过这些东西的。我做出来东西可能没有你好，但是我先一步一步往前做。特别是芯片领域，还有像AI领域里头呢，就是你做的越多，积累的经验就越多，你就越往前走。

最后呢，双方达成的是什么叫基本框架？基本上就是原来日内瓦协议的这些东西，我们又稍微的强调了一下。而且呢，都在强调什么？老大定调子，我们继续谈。甭管是美国还是中国，在这一次最后给的公告上基本上是一样的。我们要尊重日内瓦当时达成的协议，要尊重这个精神。我们要在这个精神的指导下继续往前谈，就讲了这么一个东西。

而且我们给出的评论是什么？就是没有写建设性。中文还是很清晰的，建设性成果就说明这事往前走了。但是我们写的是什么？我们写的叫很坦诚。很坦诚的意思就是分歧比较大，这个是要注意。看形容词也能看到。

说这一次在伦敦谈了点什么？美国人的算盘呢其实打的挺响的。日内瓦谈判之后呢，他新加了一大堆的限制。原来我们想日内瓦谈判完了以后咱们坐下来谈，你把日内瓦谈判之前的这些限制，我们两边商量商量，咱们减一减对不对？但是人家美国人不这个，在日内瓦谈判以后新加。加了呢，第一个是核电设备，第二个是EDA软件，第三个是飞机发动机。我把这三个东西都限制掉，希望什么呢？你把那稀土卖给我，我把这新加这几项给你去了，原来那些呢该怎么限制还怎么限制你。他想搞这么一个事，基本上把大家当傻子玩。

现在呢，其实美国还在继续玩。就伦敦谈完了以后又继续了。他这次玩了一什么呢？叫限制乙烷的出口。而且他呢都不是说我就不卖给你了，他是说我们要做许可证一事一议。其实到现在为止H20也不是说不卖了，也是许可证一事一议。包括我们的稀土也不是说不卖了，我们也是许可证一事一议。但是这种所有到政府那一事一议的东西呢，大家就基本上认为就封禁了。就这东西就没了就完了，谁有那功夫每一单跑到你那去审批去？这没有意义的。

那么乙烷是个啥玩意呢？它主要是做塑料的一个原料。中国呢也有这个东西，它就是做石油加工的时候呢的一个副产品。但是中国的油呢含乙烷比较少，咱们的油大概含3%到8%。

美国呢，因为是玩这个页岩油，他们的那个含量是15%。中国的进口量占全球的57%，全球有一半的这东西都卖给中国了。他这边说我们后边一事一议发许可证，马上就有人拿着订单到美国政府去申请许可证去了。这个就没有签发，拒绝签发。美国的出口企业股价应声而落。

这个东西呢，美国人产的便宜，大概300美元一吨，到中国呢就是500美元一吨。因为咱们本身就少嘛，咱们也产这东西，但是呢，我们自己率很低。每年使用的乙烷呢，大概80%是需要进口的。这些乙烷呢，基本上是98%到100%来自于美国，就完全依赖于美国的。

那下次谈判的时候，肯定美国人又想了，说咱能不能拿乙烷来去给你换这个稀土跟石墨呢？他发现前面我禁了你EDA软件了，你就在那头想办法自己研发去了，好像你也能替代。我禁了你飞机发动机了，你那边长江100马上开始挂到运20上去试车去了，好像也没有掐到你的这个腾处。我去禁你的核电设备，你国内好像也要去国产替代去了。这事不行，我一定要找一个你80%都依赖我的一个产业，去给你换稀土。

美国人呢，他有的时候怎么说呀，就真的是很天真的一个思考方式。我们处理的方式肯定是说，不受要挟了。你要禁我的乙烷，我们一方面自己加大生产，另外一方面找韩国找日本，再找一些其他的国家说，你们愿不愿意把这个额度吃下来？美国这些盟友小伙伴们，现在跟美国之间的贸易谈判都没谈完呢，除了英国谈完了以外，其他人都没谈完呢。所以美国如果把这个份额让出来的话，那其他的国家说，这我得着吧，这个都是有可能的。

至于美国的芯片呢，在整个伦敦会谈的时候，我们也没提，他也没提。日内瓦完了以后是有联合记者会的，在这个完了以后没有，各自做了一个表述，谁都没提这事。

中国稀土呢，比美国那个芯片其实还要更绝一点。什么意思？就是美国芯片是专门针对中国的一事一议，中国的稀土是不针对美国的。我们针对全世界所有国家，我们要防扩散，不能让我的稀土去给你造武器去。这个事呢，也是一事一议，甭管是哪个国家到中国来买稀土，我们都是一事一议来审批。

那么在这样的情况下，黄仁勋是怎么回复的呢？黄仁勋在巴黎Vivo Tech技术展期间接受场边采访的时候，回应了任正非的言论。这个是一个非正式的媒体采访，内容呢，通过路透社、彭博社等国际媒体进行传播，随后被南华早报、环球时报等转载。

黄仁勋说，英伟达的芯片技术呢，确实是领先中国一代，但指出了AI呢是并行问题。

不是说我这个芯片快就完事了，还是说我要怎么能够让它并行的一起去工作。如果单台计算机性能不足，增加数量是可以弥补差距的。所以基本上认同了任正非讲的这个观点。而且呢，他认可了任正非提出的中国能源充足，可支撑大规模芯片堆叠的这种论断。因为你到最后要烧电嘛，中国别的不行，这个电肯定还是全世界第一。咱们发电量是美国的好几倍，那你既然要去做AI运算的话，电是一个最大的核心。

黄仁勋认为，中国的技术对本土需求而言已经够了，不需要再去买英伟达的芯片了。警告美国若继续限制对华的出口，华为将吃下中国市场，并覆盖全球其他地区。因为现在华为的升腾系列芯片，还是在快速的向全世界出口。很多国家都会去买这个东西，因为他们也不希望一棵树吊死。今天都买了英伟达的了，过两天美国又有点什么事不开心了，给我制裁一把，我总得有一个备份的方案。这就让华为芯片走向了很多的，特别是一带一路的国家。

而且呢，黄仁勋暗示，中国可能通过市场规模和工程能力，构建独立于美国的技术生态。这个其实是非常吓人的一个东西。因为一旦说我们自己闷着头把这事往前走了，包括我们自己有巨大的市场规模，可能就形成新的标准了。现在全世界已经有一些技术在使用中国标准，比如说超高压输电。现在所有超高压输电都是使用的中国标准，你在全世界任何一个国家和地区，你说我现在要搞超高压输送电路了，超超高压输电了，他那个各种手册什么全是中文的，你就得好好学中文这套东西。

黄仁勋强调了AI开发者的平台绑定效应，这个是非常重要，在AI开发者非常非常重要的一个效应。CUDA为什么强，就是因为大家都爱使，并不是说他的技术上比别人先进多少，只是所有的开发者都在这个台子上练的。就跟原来咱们说相声似的，说你这个得属虎，我给你算命了你属虎，说我不属虎行不行，不行，我就属虎这套词熟，我就给你说属虎。这CUDA就是这么一套东西。那一旦中国形成了自己的标准的话，那未来可能这就会成为全世界的标准。所以如果所有的AI开发者都集中在中国，中国的技术体系就会胜出。这个是黄仁勋说的很重要的一个结论。

美国如果放弃全球50%的AI研究员，将削弱其技术主导地位。因为现在中国人，特别是从大陆受过早期教育的这些中国人，他们发表的AI方面的论文基本上已经占到50%了。这个前面是有人统计过的。在这样的情况下，美国人你自己要想清楚，如果你不跟他们玩的话，他们就自己去抱团形成新标准去了。

现在呢，英伟达已经不再指望美国取消出口限制了。原来他还去争取一下，现在发现这事没法讲了，我也不惦记了。英伟达已经调整了财报预测，不再纳入中国市场收入了。原来他财报里有一块，说我中国市场挣了多少钱，这以后这块没有了。

黄仁勋为什么要这么说呢？他为什么不说英伟达的芯片就是好，你还是要买英伟达芯片呢？因为你再怎么说好，中国人也愿意买，但是美国人不让卖，所以这个事他没法说了。他现在只能说标准争夺之战，这个事是不能输的，特别是AI这个领域里头。我们现在在争夺标准，而且这可能真的是像任正非说的，是人类最后一次技术革命了。这个标准在谁手里边是非常重要的，那么一定是哪边用的多，哪边形成了平台，哪边形成了大的生态，它会成为新的标准。

在这块，中国现在该有的已经有了。趁着我现在还领先，你让我卖，这样的话咱还可以在标准里头占一块。你要不让我卖了，那中国就自己憋屈了，那最后他形成标准了，就把我们的标准淘汰了。最后不会形成两个标准的，一定会形成统一的一个标准的。谁用的多，谁就是标准。所以黄仁勋在喊这个话，并不是说承认了英伟达的芯片就已经被华为的芯片追上了，还是差一代的。但是呢，他在喊美国政府，说赶快开放，再不开放就晚了，也算是在商言商吧。

那么脖子这种东西，到底是怎么被卡住的呢？大家有没有想过？第一个呢，其实是叫成本跟时间差异。你像稀土、石墨，包括刚才咱们讲的乙烷，都是这样的一个状态。你不是造不出来，也不是什么高科技，就是不划算。我造一吨500美金，他造一吨300美金，他那儿划算。而且他是采着石油，这东西就做出来了，我们是要拿石蜡油再重新去做这个玩意，这玩意就费劲。这些东西呢，都是可以靠工程的方式以及一段的痛苦时间，逐渐去找到替代方案的，不是说这事就过不去了。

第二个其实是什么？就是专利限制。这块呢，可能跟很多人想的不一样。很多人说中国人你造不出光刻机来，中国人你做不出EDA软件来，就是设计芯片那个软件。大家要知道，EDA软件这个东西在中国也使了这么长时间了，美国人把这个东西拿到这儿来，也使了这么长时间了。中国人很擅长做的事情是什么？叫逆向工程或者叫破解。就这个东西我们早就把它破开了，里头到底怎么回事，都看得明明白白的了。那你在这样的一个情况下，那你中国为什么做不出来？有版权，有专利，我必须得绕过你，我不绕过你这个事他是违法违约的呀。如果说我们双方开始贸易战了，这个不是一个正常的商业规则。

继续执行下去了，那我为什么还要去尊重你的专利呢？我为什么要尊重你的规则呢？那我就破解呗，我就直接使用你的技术路线，我就往前走呗。前两天我还看一个说德国人发明的二战油桶，那美国人一看，这不错，咱造呗。美国人在整个二战期间也没有付一分钱专利费，直接就把这个汽油桶造了，可能几千万个出来。说这个二战的油桶实在设计的太好了，它这个油桶是好拿，而且非常的结实，堆叠起来以后不破，而且倒的时候还有很好的泄压的这个功能。最后是全世界都在使用这一个油桶。二战结束了以后，甭管是东德还是西德，收到过专利费吗？没有，这事就完了呀。

所以现在美国跟中国玩这个专利战，玩这个贸易战，等贸易战结束了以后，那前面这事怎么办呢？那肯定也是要大家坐下来谈呗，既往不咎也就过去了。所以不要以为说这东西我们是做不出来，好多东西特别是软件的东西，我们是能做出来的。还有一些东西呢就是工程上，你比如说发动机，我们可能在一些基础材料上稍微差一些，工艺上差一些，这个东西我们没有搞明白。那怎么办呢？人家的这个比如说能够使1,000小时，我们这能使500小时，那我就500小时做一次检修呗。我成本上升，跑一段时间以后，我们再在工作的过程中去寻找一些替代方案，或者一些优化的这种方案。因为这个东西好多就是要反复的迭代，反复的往前试，他才可以说找到新的出路。你说我始终不试，做一堆专利，这个就死路一条。

你就像日本的新能源汽车似的，他生产了一大堆专利，但是呢他又舍不得原来那个汽油车的市场，始终不去做大范围的氢能源汽车的推广。那你跟电池汽车来比，那你就打不过他。电池汽车说我现在已经推了多少代了，现在固态电池都要出来了，我们把原来各种各样的问题都已经解决掉了。现在我不断的提高充电的电压，800伏、1,000伏，我一直往上提，我现在充电也充的也可以挺快的，5分10分钟我也可以把电充满。它是这样的一个玩法，所以一定要快速的迭代，快速往前做，才有机会成为标准。现在电动汽车跟新能源汽车的这种竞争，就是这样的一个明显的案例放在我们面前。

那么下面呢就是生态跟标准的限制，这个也是一个卡脖子。CUDA跟Nvlink其实就属于这一类，它属于生态特别好，大家都习惯这套东西了，你让我换这个事成本实在太高了。开放平台用的人多了，自然就会活跃，这些活跃的平台上自然就会形成标准。标准这个东西，千万不要以为这是国家一帮老专家坐在这，关上个门拍脑袋说。

我们制定一个标准，大家来执行吧。没有这个，中国是尝试过几次的，什么TDS、CDMA。以前呢，还有VCD、DVD的一些标准。咱们当时做了一大堆，从来就没有人使。所有的标准都是事实标准，我把这个标准做出来了，用的人多了，它就成为新的标准了，都是这样来的。所以一定要靠活跃的平台，才能产生新的标准。时间跟成本限制的东西找到新的出路，大规模生产之后，就会形成新的生态和标准。

专利限制会阻碍社区和平台的形成。你不要说你看美国人有专利了，日本人有专利了，中国人你搞不定了，别想这个。日本人就是被专利玩死的，日本最后失去了他的互联网时代，失去了他的移动互联网时代，氢能汽车也没搞定，人形机器人也没搞定。为什么？就是一大堆专利把他都绑死了。其他人说我想去发展一下行不行？你先来跟我做专业谈判，你谈不明白的话你就别发展。那大家一看说这事没法整，那就绕开他们这些专利已经封锁的区域，我们在其他地方再单独走出一条路来。

美国人也好，或者中国人也好，已经用一些实际案例告诉了大家，说靠专利封锁这件事，大家就绕开。我们这块是不碰了，我们在其他地方照样走得通，这个已经有很多案例证明了。而AI时代呢，卡脖子要比原来的什么稀土、石墨呀，乙烷这个事要更难。为什么呢？因为AI时代它是建立在开源数据，专利和生态与标准之间的一些竞争，那中间很多东西是非常模糊的，而且这个东西本身发展的非常快。你想禁止我的东西，我把DeepSeek、千问这些东西开源了，那你也去装。现在亚马逊上也把千问的模型都挂上了，亚马逊上现在包括微软上也把什么DeepSeek这些模型都挂上了，大家就一起跑呗。他们也愿意在千问的基础上，在Deepseek的基础上再去做微调，像perplexity就在Deepseek的基础上去调整这个模型，发现也很好使。所以你在这块想卡脖子，基本上不现实。

你想靠国家的法律，想靠专利想靠规则卡脖子，最后卡来卡去。这么多中国人，有一半的研发人员都是中国人，我们就找这种最开放的平台，我们就找没有什么限制的平台，我上哪使去。最后这边形成了新的标准，那这样的话对于英伟达来说，对于现在的美国人来说，可能就会比较痛苦。

最后总结一下，任正非也好，黄仁勋也好，喊的呢都是开放与生态，他们喊的东西是一样的。中美继续慢慢谈吧，这个事也没什么办法。你也不能指望说下一次坐下来，我们就彻底开放了，这个我觉得不太现实，黄仁勋已经放弃这个幻想了。

中美贸易谈判的结果和最终的竞争谁胜谁负的话，其实已经没有什么关系了。只是说在整个的AI发展过程中，到底谁挣到钱了，谁没挣到钱，或者谁先挣到钱，谁后挣到钱。最后只跟这个有关。最终的AI革命谁会胜利的话，我觉得已经无所谓了。这个呢，就是人类最后一次技术革命。这是生态与标准之争，不是芯片之争，不是几纳米之争，也不是什么稀土、乙烷。跟这些东西都没关系。现在政府谈来谈去这些东西，已经没法去阻碍人类进步了。

好，这就是我们今天讲的事情。感谢大家收听，请帮忙点赞、点小铃铛，参加DISCORD讨论群。也欢迎有兴趣、有能力的朋友加入我们的付费频道。再见。

黄仁勋AI时代英伟达GPU革命：一场市值2.7万亿美金的狂欢，COMPUTEX 2024重磅发布Blackware GPU，1.8万亿参数GPT4揭秘！

Luke Fan — Tue, 04 Jun 2024 01:02:00 +0000

大家好，欢迎收听老范讲故事YouTube频道。今天，咱们来讲一讲黄仁勋在COMPUTEX上的狂欢。COMPUTEX是一年一度在台湾举行的计算机大会。黄仁勋，作为现在真正AI时代的当红炸子机，可能是唯一靠AI赚了大钱的人。虽然微软也在赚钱，但是微软整个靠AI挣的钱并没有那么多。真正靠AI赚了大钱的公司只有他一家——英伟达。刚才我看了一下，英伟达现在市值2.7万亿美金。大家知道，再往前就是微软的3.2万亿，第二名是苹果，2.9万亿，还差那么一点点。可能稍微一哆嗦，英伟达就有可能成为世界第二市值的公司了。那么，黄仁勋上面都讲了什么呢？作为网红，肯定还要先暴露一下行业秘密，别人都不知道他知道的事情。上来先说一下他现在讲的是什么——就是GPT-4到底有多少参数。GPT-3.5大家知道是1,700多亿参数，就是一个170多亿级别的模型。但是到GPT-4的时候，OpenAI就再也没有出来说它到底有多少参数。很多人说你是不是超过万亿了，对OpenAI来说，这个数据不是很准确。我来辟谣了，但是具体有多少，从来没有讲过。黄仁勋在前面的GTC，就是GPU技术大会上，每年一次的英伟达自己的开发者大会上，上面也讲了……

说起来1.8T，这个1.8T指的是什么呢？其实就是1.8万亿参数，而且它是一个Moe模型。当时OpenAI并没有对此多说什么，但这一次，在《Computer Text》上，他们又反复强调了这个事情，明确指出GPT-4的训练参数达到了1.8T。这让人们意识到，想要达到GPT-4的水平，还有很长的路要走。尽管现在大家都在努力研发号称能达到或接近GPT-4水平的模型，比如几百亿参数的模型，比如梅塔的拉马3可能会有一个400亿参数的模型，国内也出现了很多一两百亿参数的模型。但事实是，即使提到的1.8T参数，如果考虑到是Moe模型，分成八份来看，那么单个模型可能也就相当于200多亿参数的水平。

这次先通过揭示现状，然后发布新GPU，但对于具体数据——多少核心、多大算力、内存多大、带宽多少，人们似乎已经感到麻木。现在大家更关心的是，如何将这些GPU有效地集成起来，如何把它们拼装成服务器，以实现更强大的计算能力。这背后的提升，不是5%或10%的增长，而是几倍的飞跃。这成了技术关注的新焦点。

如何装到机房里头，统一为别人去服务，这个是现在大家更关心的事情。所以现在呢，他们发布的叫Blackware GPU，而且，它取出来那个板子上是两块GPU和一个CPU，应该是他们自己做的CPU。这是一整块，然后可以装到一个大的服务器里面去。再把这些服务器堆叠在一起，使用它的NV link，让这些GPU可以像一块完整的GPU那样工作。这样说，你就可以去训练更大的模型了。而且，今年是这个Blackville，明年就是Blackville Ocho，再往后是Robin。就是说，往后一代都给你规划好了。再往后一步，是叫Robin Ocho，所有的GPU一直规划到2027年，一定让2027年之前的GPU都给你规划好了。

现在呢，很多大佬还在惦记着买H100。他现在就专门告诉你说，你看我这个艾克威尔跟这个H100比，它强在什么什么地方，好在哪哪哪。但是很多人还想买H100，这是为什么？可能Blackware它的这种工作方式，或者说它可能需要跟更多的设备先行捆绑，而H100的话，相对来说可能兼容性会更高、更好一些。就是你用任何的这种通道服务器，都能相对容易地兼容和使用。

你把它插上去都是可以用的。likerware我倒是真没看到它出这种——就是像原来金砖啊，像我们以前讲的A100、H100这样的，我们管它叫金砖嘛，就是它的卡还是金黄色的，方方的一块，可以插上去的。好像没有看到这样的东西啊。现在呢，基本上都是以两个black Verre在一起，然后头上带一个CPU，是完整的这个配置。

当然了，这些大佬，包括马斯克、扎克伯格，可能也不是说我就一定要去买H100。对于他们来说，H100就算是一种计量单位，就是说啊，他们会算上自己到底买了多少H100，或者说现在手里的算力相当于多少H100。你像扎克伯格之前讲，说他买了35万块，加上他手里现成的有60万了，再加上后面再接着买，现在扎克伯格手里的大概有接近100万块H100，相当的算力。这就跟我们造炸弹的时候说，这个炸弹相当于多少吨TNT啊，最后变成了一种衡量单位了。

老黄（指NVIDIA的CEO 黄仁勋）就告诉大家说啊，你们来买新的吧。而且这种升级是呈几何级数升级的，所以不要去买旧的，去买新的，这样的话才能够保持它的垄断地位。如果说哎，我现在这个GPU再涨上去，涨了10%，涨了20%，那大家就不买它的了，就去买AMD，买英特尔，买其他的这些算力芯片去了。

甚至像高通这样的公司，都能做出一定的算力芯片来。这样一来，人们可能就不会一定买它的产品了。但是现在的情况是，我们谈论的是算力要涨十倍、百倍、千倍，而且每年都要这样增长。为什么呢？因为这成了一场军备竞赛。每个人都害怕落后，就像人们常说的“输在起跑线上”。我们从小让孩子上补习班，是为了什么？就是出于这种害怕，这种焦虑感。老黄就是在给大家制造焦虑：你现在买了旧的，等明年出了新的，你就落后了。你必须去买新的，然后当更新的版本出来时，你又要再买。毕竟，GPU不像软件，软件可以逐年升级，而且升级成本相对较低。但GPU，你需要整块购买，一年后淘汰，再换新的，这成本实在太高了。一片就是4万美金，Blackwell的价格我虽然没查，但肯定不便宜。所以，要让大家每年跟着升级，必须讲出一些更有诱惑力的故事来。目前，从算力成本和能耗几个方面看，确实在全面升级。一方面，算力成千倍增长，成本自然是变贵了。这没什么可争议的。但就单位算力的成本来说，它是下降了。比如，原来的H100卖4万美金，但使用Blackwell之后……

你可能继续达到H100同样的算力，这只需要原来1/10，甚至1%的成本，是这样大幅下降的。能耗方面也是如此，比如说，要达到原来H100的算力，所需消耗的能耗可能也只是原来的1%。如此发展，GPT-4的1.8T训练能耗引人注目，因为之前很多人讨论，GPT-4训练一次的能耗相当于多少个家庭一年的电力消耗，让人担忧AI发展的能源瓶颈。但现在的进展是，重新训练一遍的能耗降低了99.7%，仅为原来的1/350。而进行推理时，即训练完成后用于问答等任务，能耗更是降低到原来的1/45,000。这样的发展速度令人惊叹，从GPT-4推出至今不过一两年，能耗的减少就达到了如此程度。

军备竞赛在AI领域体现为不断制造焦虑，促使各方持续投入。这就像冷战时期的军备竞赛，你有武器，我必须跟进。如今在技术领域，特别是英伟达所处的，情况类似，但效果是整体提升，正如“一人得道，鸡犬升天”。之所以提到这一点，是因为他们还强调了除了芯片本身，还有Vlink技术，能够将服务器像拼图一样连接，整个机房的服务器作为一个单一GPU工作，展示了技术整合带来的巨大效能提升。

因为，这些服务器在一起，你的GPU的算率越大，可以并行处理的东西就越多，与内存和CPU之间的通道越宽，整个进行大模型训练的效果就会越好。所以他说，他可以干这件事情，但在这个过程中，这些服务器，或者其他一些相关的配件，都跟着他“鸡犬升天”了。比如说，像戴尔、超微电子这些给他造服务器的公司，全都因此受益，一路上涨。因为你不能只有GPU，不能只有他们的加速卡，还得把所有配件凑在一起，这些东西才能正常工作。而这些配件，都是值钱的。

在这个过程中，服务器肯定变得更贵了。比如说，原来用的是H100的服务器，现在变成了更高级的查克威尔的服务器，那自然是服务器变贵了。但你想，服务器变贵的过程中，到底是什么东西变贵了呢？其实，只有与H100相关的专利费变贵了。大家要注意，因为大家自己并不造芯片，也不造服务器，他也不造算力中心。他只是设计好GPU，交给台积电去生产、封装、测试，然后下交给板卡厂商制作成板卡，再由服务器厂商组装成服务器，最后等待比如马斯克这样的人购买安装。所以，整个服务器链条上的价格上涨，实际上主要是由于关键技术组件的成本上升，特别是H100相关的专利费用。

除了GPU价格飙升之外，其它相关成本也难免水涨船高。你不能期望其它东西都保持低廉，这显然不合逻辑。我们整体的成本基数提高了，但单位成本可能有所下降。不过，要注意的是，老黄的市场策略极为精准。GPU的知识产权价值多少，或者说它的设计成本是多少，他们心中有数。如果没有竞争对手，价格自然可以定得更高。但即便如此，人们依然能看到成本在以惊人的速度下降，甚至是以十倍、百倍的幅度。然而，GPU的设计价值却在不断提升。

除了NVIDIA本身，那些制造显卡、服务器以及各种配件的厂商，它们的产品也会随之增值。比如，如果你用一个价值4万美金的H100来搭建服务器，仅这一部分就是一笔昂贵的投入。而且，随着Nvlink标准的采用，替代了以往的Pcie标准，意味着新的配件、新的线缆等都将应运而生，价格自然比过去高出许多。

我记得早些时候，为惠普的小型机配备一个简单的支架，就是一个铁质架子，都能卖出数千元的高价。原因在于它专为小型机设计，很多工程师甚至会私下找工厂定制支架，替换官方配件以赚取差价。这背后反映的是，即便是一些看似不起眼的配件，在特定情境下也能变得极其值钱。

大家其实也都知道，那个铁皮的支架，你说能值多少钱？你凭什么一定要买惠普的？他只要是惠普的工程师给你装上，下次他接着给你修不就完事了吗？你跟着这个比较贵的东西一块去卖，他就会卖的很贵。但是这几天呢，戴尔和这个超威的股价，其实已经快有点绷不住了。大家心里也明白，虽然你们跟老黄跟的很紧，但是这个里头真的，你就是个卖支架的，卖个铁皮，卖个机箱的，你跟着里头的GPU一起水涨船高，这件事稍微的有点侮辱大家的智商。

现在呢，是AI工厂时代，现在老黄也讲说我们现在就是AI factory。在这样的一个时代，我们应该如何与时俱进呢？我记得在移动互联网刚开始的时候，我们写很多应用，当时我们在思考说，哎呀，我怎么能够省一点流量，因为那个时候流量很贵。我们都想着如何去节省流量，如何在使用的时候联网，不使用的时候怎么把它断开，想着怎么去省一点电，怎么去做一些其他的节省资源的事情，可以少占一些硬盘的空间，可以交互的时候少交互一些流量。当时的我一位老板就跟我讲，说你们想这个事情是错的，说为什么呢？就是因为很简单，随着时代的发展，这些东西都会变得不值钱的。比如说现在，流量咱们现在……

其实，基本上是没有流量焦虑的。我记得最早开始使用手机，那时候刚进入3G时代，我们都会做什么呢？每天定时打开流量，收完邮件后立即关掉。为什么会这样？因为酷，而且节省。现在，还有人这样做吗？没有了。现在，我们走到哪儿，站在哪儿，就开始刷抖音、看视频。已经很少有人会说，我必须节省流量，等到有WiFi的地方再做这些。绝大部分人没有这个意识了。

电的问题现在也不那么大了。虽然手机应用还需要省电模式，但现在的手机几乎都是一天一充。你的应用再费电，能比微信还费电吗？能比原神还费电吗？所以，这些问题也变得无关紧要。因此，很多以前为了省电而做的操作，实际上已经没有意义了。

再往后说，我们是否会考虑在硬盘或手机上占用更少的空间？以前在猎豹工作时，我们还在研究如何让软件占用空间尽可能小。但现在看看《原神》有多大，看看那些手机游戏的大小，再看看微信在你手机里占了多少空间，就会觉得，我们当初那么精良的考虑，好像都没什么大作用。是的，所以在AI Factory这个时代，也就是AI工厂时代，我们仍在思考如何能省一点TOKEN，情况依然如此。

我怎么能够让它反应得稍微快一点？我怎么可以调用不同的大模型？这个模型贵一点，那个模型便宜点。我尽量让便宜的模型干尽量多的事情，让贵的模型干少一点的事情，做一些其他的，比如优化（reg）或者做一些这种节省沟通交互的事情。可能真的再过一年，这些就会变得很可笑，就像我前面讲的，我们在做手机应用的时候，让它怎么去省流量，从网上下载的东西少一点，占的硬盘空间少一点。我们现在回想，那时候想的这些事情就显得很可笑。但是在AI时代，刚才我们讲的怎么能够省一点TOKEN，怎么能够让便宜的模型多干点，贵的模型少干点，怎么能够让多个模型相互搭配起来使用，可能也会变得很可笑。而且，这个时间会来的非常快。

黄仁勋呢，除了讲数据中心业务，就像我们刚才提到的Blackvail，一切都是数据中心业务，这也是现在英伟达核心的收入来源，没有之一。现在，他主要就靠这个业务玩。那么其他的呢？也还在讲，英伟达这家公司特别有意思，它不会说某一个业务特别好，就把所有的身家都压上去。它永远是在所有它认为有趣的地方投注，即使这一个方向很长时间没有结果，它依然会在里面坚持。那么，它肯定还有些其他的业务在做什么呢？

比如说，RTX加载的AIPC，因为前面微软发布的AIPC是基于高通的。现在，英伟达说了，你们使用英伟达的GPU，也可以达到同样的水平。英伟达专门为了AIPC设计了一款很小很轻薄的GPU，而且很省电。但这一块上，它稍微有一点尴尬。为什么呢？你如果真的要轻薄省电，你一定使用ARM的，对吧？就是使用高通的就好了。那你说，我现在稍微费点电也可以，这个英特尔自己也出了，英特尔说，你们就直接用英特尔完整的GPU加上算力核心就完事了，你不用再去单独配独立的GPU，依然可以达到AIPC的能力。包括AMD也是这么干的，AMD自己也产X86的CPU，AMD说：“来哇，你直接买我的APU加我的算力核心，就一次搞定。”

那么，英伟达的RTX这个方案为什么尴尬呢？就是它必须要再搭配一块Intel或者是AMD的X86的CPU，它才可以正常工作起来。这对于强调轻薄便携的AIPC来说，就稍微有些尴尬了。但是，英伟达也强调了，加上他们的技术后，算力是苹果的多少多少倍，主要是与苹果的M系列芯片在比较。在这方面，我们还是要相信老黄的，他的算力确实是靠功率支撑起来的，如果他真想达到某个目标，他有这个实力。

说我在电脑上做Stable Diffusion的，这样出图，速度很快。那一定是配着呼啸的风扇声，以及呼呼转的电表，一起来工作的。除了AIPC之外，还在讲游戏助手。但是这个呢，我觉得大家看着开心一下就可以了。他说我做个助手帮大家打游戏，这个呢，就属于工程师思维——一拍脑袋觉得，“我需要一个这个”。其实，游戏跟这个没有那么大关系。就算是AI应用在游戏里面，应该也不是通过游戏助手的方式去应用的。

另外，还展示了机器人。他说所有跟机器人相关的东西，我们都上，也做了全套的机器人套件。还有，其实VR、AR以及车载芯片，其实都在英伟达的整个路线图里边。再往前走，很多人就会关心，英伟达到底还能坚持多久呢？他真的还差2,000亿美金就追上苹果了，对吧？苹果2.9万亿，他2.7万亿，真的差的不多了。他到底能不能超过苹果，甚至能不能超过微软，成为全世界最值钱的公司？这个其实大家心里都在打鼓。

英伟达呢，跟其他不管是微软也好，苹果也好，有一个特别本质的区别，就是它是一个“轻公司”。这个“轻公司”赶上时代红利是可以的，但是到底能不能长久地坚持下去，这个就很难了。黄仁勋展示现在的成就，未来的路线图，让人充满期待的同时，也不免有几分疑虑。

但是，并没有说我要砸重金进去，变成一个重型公司。大家注意，苹果是个很重的公司，它生产电脑——虽然电脑也是台湾人给他造的——它的手机是富士康，包括比亚迪都在给他造手机。它是这样的一个公司，虽然供应链在外面，但是这些货品、这些设计，包括全球的仓储物流，很多东西都是属于苹果自己的。所以，苹果是个很重的公司。微软其实也是一个很重的公司，微软自己在造Surface，那个东西虽然卖的并没有那么好，但是它也是电脑平板，甚至还有很多其他的硬件，比如说键盘鼠标。微软键盘鼠标其实做得非常好。而且微软其实还有一块很重的资产，那就是云计算中心，它有很多的数据中心。微软现在是全世界可能GPU最多的公司了，因为后边有OpenAI这样的一个“亲儿子”，那你肯定是要靠这么多的GPU去养的。微软现在的GPU，如果大概核算成H100的话，应该有180万块，这都是重资产。

谷歌呢，也是一个很重资产的公司。谷歌紧跟在英伟达之后，他现在是市值第四的公司。谷歌我记得在云计算兴起之前，曾经有一段时间，他拥有全世界大概6%的服务器，这是一个多么恐怖的数字。而现在，虽然应该没有那么多，但谷歌的数据中心依然规模惊人。

也是一块非常非常沉重的业务。而且，另外一点是什么呢？就是我们来看，整个的生态是否稳固，或者说，整个的价值体系是否可以稳定地升级上去。还有一个点可以看是什么？就是你上下游的生态链是否足够稳定。围着你吃饭的人到底有多少？以前我们在学生物的时候讲过一点：在一个自然环境里头，食物链越长，或者说参与到食物链里的动物、植物越多，它整个的生态系统就越稳定。为什么呢？因为其中有一些波动，其他的这些生态位上的人，或者这些动物，就可以慢慢地把它平衡回来，而不是说啊，我的食物链很短，就两三节，参与的动物也不是很多，植物也不是很多，可能中间稍微有一点闪失，这个食物链就崩溃了。

咱们来看看苹果，上下游其实有非常多的人围着他吃饭。我们不说这些果链企业，就光在苹果应用市场里头，做应用的这些人，也有几十万人，对很多人来说，这是他们的收入来源。再看谷歌，像我们现在在这看YouTube，我在这拿着YouTube的广告费，那我们也算是谷歌生态链里边的一环。那是非常多的人靠着谷歌生活。啊，微软那不必说这些靠广告吃饭的，因为微软的广告并没有那么多，但是微软上下游，是有大量的系统集成公司，靠着微软吃饭的。

还有微软云上的大量客户，但是英伟达有没有这么多人靠着它吃饭呢？英伟达虽然一直努力地在打造他的生态链，整个生态环境，但是并没有那么多。所有能战胜英伟达的，像刚才我们说的戴尔、超威等，这些已经都涨疯了。剩下的呢，其实没有那么容易贴上去。虽然有很多人说，“我们拿英伟达的CODA，我们去写这些Transformer的大模型。”但是这些人呢，实际上在整个的生态链里面是非常非常小的一群。现在能够真正把这个东西跑通的人非常少，虽然这个领域的人才工资非常高，但是人数真的不多，它没有真正撬动大众。所以，我从这两个方面来论述，英伟达到目前为止，依然是一个很轻的公司，资产很轻，它的整个生态链其实也是相对短而且相对脆弱的。

那么英伟达现在能够赌的是什么呢？就是这个缩放定律，叫“scoring low”。只要这个东西依然有效，黄仁勋呢，就还可以继续狂飙那么一段时间。“scoring low”是什么东西？就是我堆更多的数据，上更大的模型，上更大的算力去计算，然后得到的模型效果就更好。这个东西只要依然在，还可以大力出奇迹。那么大家就说，那我们就接着老老实实地买他们家显卡。

而且，这种倍速一定是十倍、百倍、千倍这样往上涨，为什么呢？因为如果你说，我英伟达下一代的GPU就比现在快20%，那大家就不更新了。或者说，我干脆去买AMD吧，AMD的比你这还便宜点，算力也没有那么差，只是这个过程稍微麻烦一点——我需要重新去适配AMD的算力卡。大家要注意，因为做这行的人很少，这些人很聪明，对他们来说，适配一个新的算力卡，难度并没有那么高。

刚才我为什么专门讲了苹果的生态链、谷歌的生态链、微软的生态链？因为它们里面有很多低端开发者，对他们这些低端开发者来说，技术迁移的门槛是很高的。你让他重新换一下，比如说，“你原来做安卓的，现在去给我做iOS开发去”，他真不会。甚至说，他学会了以后还能涨些薪水。但是对于英伟达来说，如果他没有办法快速地让算力十倍、百倍、千倍地涨上去，那么大家就会渐渐背离他，对他的忠诚度是相对比较低的。

有可能造成英伟达崩塌的原因有三个，咱们最后总结一下：

第一个就是摩尔定律失效了，缩放定律已经没效果了。大家发现，上更多的数据，配更大的模型，训练完了以后效果提升了。一旦到这样的情况，就不会有人再疯狂地去买他的新显卡了。

第二个中心转移了。突然间，又一个特别赚钱的应用方向爆发起来。大家注意，现在为什么大家都在选择这个？因为“缩放法则”——谁都用不好。大家只能去比谁的模型做得更好，然后去跑这个，跑那个。但是一旦发现，这个模型在做一些特定应用时，效果好得一塌糊涂，而且极其赚钱，那么这个时候，就不会有那么多人继续投入资金去做新模型的研发了。他们可能觉得，现在的模型就够了。这相当于什么呢？就是说，虽然“缩放法则”仍然有效，并没有崩塌，但是没有人愿意再往上堆成本了。因为，尽管“缩放法则”有效，但增加更多的算例、更多的数据，那都是钱。一旦出现特别赚钱的领域，即使“缩放法则”依然有效，增长也会停止。

第三个因素是巨头合作，突破并扩大了垄断。现在，大家离不开英伟达的原因，就在于它推进的这套扩大——可以称之为通用计算方法，具体的名称我不再详查，它是不开源的，而且英伟达拥有专利。因此，大家都在这个基础上进行了应用开发和大模型的训练。之后，想要更换这个技术，就会有一个成本。这个成本，我们要反复讲，不高也不低，为什么会这样呢？

肯定换过去以后会有些兼容性的问题。但是呢，因为你后边真正使用你的H100也好，Blackware也好，都是些什么人？特斯拉、苹果、谷歌、微软、亚马逊——他们可以花最贵的钱，雇最好的工程师，说来咱们今天去改一遍就完事了。这个都是有可能的。但是，这个临界点在什么地方？临界点就是，如果涨不上去了，那咱就改；或者说突然有人说，“我愿意砸一笔更大的钱进来，咱就改。”为什么？詹奥特曼说，“咱们砸一笔大钱啊，1,000亿美金，或者说1,000万块H100算力的这个GPU，我们统一搞一次，做星际之门去。”这个对于英伟达来说，都是比较大的威胁。就是这三个威胁。

英伟达呢，也算是我们现在的一个传奇故事。我相信在整个的AICC大时代里头，我们还可以不断地看到它的故事继续。好啊，今天我们要讲的故事就到这里。感谢大家收听，请帮忙点赞点小铃铛，参加Disco讨论群，也欢迎有兴趣有能力的朋友加入我们的付费频道，再见！