高性能计算 – 老范讲故事｜AI、大模型与商业世界的故事

别再只盯着星链赚钱了！SpaceX万亿估值的真正底牌曝光：每年百万吨载荷只为构建太空算力网络｜SpaceX 上市太空数据中心马斯克 AI 算力

Luke Fan — Mon, 15 Dec 2025 13:49:43 +0000

SpaceX明年上市？史上最大IPO这次靠谱吗？

大家好，欢迎收听老范讲故事的YouTube频道。

今天咱们来讲一讲SpaceX，据传闻明年要上市了，而且是史上最大IPO，这次靠谱吗？

史上最大IPO的传说与对比

这个为什么叫传说？因为SpaceX一般他自己也不说这种事，都是有别人来去传。据传是1.5万亿美金的市值上市，融资300亿美金。为什么大家都去传？这个史上最大IPO，目前为止被大家所公认的史上最大IPO，应该是阿里上市，大概是5,000亿还是6,000亿美金的上市。但实际上，有一个更大的是1.7万亿的，那个是沙特阿美。

但是沙特阿美的这个一般不太承认。原因有三：

它是在沙特上市的，不是在这种国际上大家都可以去到达的这种交易所上市的。
沙特阿美他在沙特上市的话，数据公开透明这一块要稍微差一些，你为什么值这么多钱，这事说不清楚，而且现在的沙特阿美的话，大概也就是1.5万亿的一个水平。
大家不太愿意承认它是史上最大的IPO的第三个原因是什么？它1.7万亿上市的时候，只募集了290亿美金，它的募集的比例非常非常小，2%点几，所以大家觉得这个是有问题的。

这一次SpaceX据传1.5万亿美金，虽然没有沙特阿美大，但是一定是在美国股市上市，应该算是史上最大的IPO了。另外一个就是它融资300亿美金，这个应该也要比沙特阿美的290亿美金要高一些。

SpaceX与Starlink上市传闻回顾

其实SpaceX也好，Starlink也好，大家都在盼它们上市，只是马斯克自己也不怎么松嘴，SpaceX更是没有任何官宣。过去几年，其实还传出来过SpaceX或者Starlink要上市的这种传闻。

2020年，马斯克自己公开说过，等到Starlink收入增长、现金流更平稳可预测之后，就可以考虑让Starlink上市。当时讲的是把Starlink从SpaceX里拆出来，让它单独上。为什么要拆出来？因为SpaceX这种公司，它经常发射成功了、失败了，实验成功了、实验失败了，今儿放成功了，筷子夹住了，你股市蹭蹭蹭涨，明天没夹着，或者是哪个东西掉进去，直接放烟花了，那可能股市蹭蹭就跌。所以像SpaceX这样的公司上市，还是挺考验大家的心理的。

到2023年11月份，彭博社就说，SpaceX在为Starlink的潜在分拆做资本安排，并且暗示可能在2024年Starlink就会上市，只是后来被马斯克辟谣了。马斯克说我们现在还不准备上市。路透社当时也报道了，马斯克已经自己说了，特斯拉已经实现了现金流平衡（break even），就是我现在挣的钱跟花出去的钱已经差不多了。因为大家注意，好多时候你说我这有利润了，我这有亏损了，这实际上都是做账，只有是现金流平衡了，这个公司才可以相对来说比较稳健。马斯克你2020年说了，只要现金流平衡了你就去上市，那咋不来？那马斯克说我再等等。

为何SpaceX的信息总是零碎不全？

SpaceX跟Starlink的这种上市消息，或者融资消息，包括他的收入、包括他的利润亏损，这些情况都是比较零碎的。为什么？他不是上市公司，也没有接受审计并且披露财报的义务。所以这样的公司，相对来说漏出来的信息就比较零碎。你比如像华为，华为也不是上市公司，但是华为每年还是会去公布一个财报的，至于这个财报是怎么审计的，我们就不去研究了，但是每年还会公布。像SpaceX压根就从来不干这个事儿。

但是马斯克自己又是一个不甘寂寞的人，不断地通过X平台披露各种各样零散的信息，别人就拿着这些信息去拼凑。SpaceX又像是这个房子里的大象，你没法忽略它。全世界向太空发射的载荷里头，它占90%，那你说你怎么可能忽略它？各大媒体都会紧盯着SpaceX，有个风吹草动都会被各种解读，或者是过度解读，而且会不断地放大。

如何梳理与解读SpaceX的上市消息

像这一次号称SpaceX要上市这件事情，就是被很多的媒体拎过来说，他们要上市了，要好多好多钱。我们稍微的把信息归拢归拢，在GPT-5.2的帮助下（GPT-5.2我已经使了一天了，还是很好使的），我梳理一下这一次SpaceX上市的各种消息。我们要分清楚：

哪些是马斯克自己大嘴巴说了的；
哪些是被马斯克否认了的；
哪些是没有被马斯克否认的（大家注意，就是这个也很重要，所有这种他啥也不说的，大家就认为马斯克有可能是默认了）；
还有哪些是被主流媒体报道的，路透社或者是纽约时报，这些就还是要稍微靠谱一点的；
还有一些信息，是社交媒体演绎出来的，像我这样的，相对来说就没有那么靠谱。

所以我们去梳理信息的时候，一定要把它梳理清楚。

本次1.5万亿IPO传闻的来龙去脉

第一轮消息：二级交易与估值

现在传出来的SpaceX明年IPO消息是怎么来的？首先是华尔街日报做了一个报道，12月5日，讲的是SpaceX的CFO在向投资人谈一笔二级交易，这个应该是一个事实。这一笔二级交易，估值是8,000亿美金。彭博社也爆出了另外一个，这个稍微低一点的潜在定价，是5,600亿美金，大概是这么两个价格。

马斯克在这个时候就出来辟谣了，他说8,000亿美金这个事，就是每年两次的职工老股变现。像SpaceX这样的公司，招募人员的时候，它也会是有一部分是工资，有一部分会发股票。但是总有一些员工说，我们想把这个股票卖掉。他们每年会有两次固定的时间点，找到一些投资人去进行老股变现。他把这个统计一下内部有多少人要卖，算一个新的价格，这次就是8,000亿美金，大家按照这样的一个价格把这个老股收走，大概就是做这样的一个工作，每年两次。而且马斯克专门出来辟谣，说SpaceX并不缺钱，我现在没有融资，我们就是在做老股变现。但是老股变现这件事，它也是会有估值的。5,600亿美金应该是今年上半年的，8,000亿的话是这一次新的，12月5号这一次是8,000亿。这是第一轮消息，当时大家就在猜它是不是要上市。

第二轮消息：The Information的跟进报道

到12月10号，The Information又出来报道了，说SpaceX已经开始向投资人、金融机构进行沟通了。沟通什么？计划2026年下半年进行IPO，已经讨论是否整体上市、是否要包含Starlink。就是我上市的时候，是不是把SpaceX跟Starlink一把捆起来上市这件事情。大概率也不是空穴来风，因为这个信息大概率是来自于投资人或者是金融机构。这些投资人和金融机构，有可能是说帮助多多上市的人，还有可能是什么？就是在前面要准备接他老股的这些人。这个人就会问你，我买了这种股票以后，未来的升值前景怎么样？SpaceX的人就跟人承诺了，说明年就上市了，你现在买了只管拿着，没问题的。应该是这样的一个消息在流出来。而且当时也讲，有可能是一整个上去。对于这件报道，SpaceX没有做任何评论，包括前面这个12月5号的报道，SpaceX也没有做任何评论。而这一次的报道，马斯克没有出来辟谣，所以大家就说这回好像是真的了。当然了，马斯克自己也不是每一次说到他都会出来辟谣，所以大家只是猜测，这一次有可能是真的。

1.5万亿市值和300亿融资额的由来

那么1.5万亿市值和300亿美金的融资额，这个数是怎么来的？最开始是路透社的一个版本，说SpaceX 2026年IPO募资超过250亿美金，估值可能超过1万亿美金。而1.5万亿这个数字，目前应该是一些媒体或者叫社交媒体的二次解读。你超过1万亿，那你写个1.5，这个事应该也是稍微有点合理的，介于1.66万亿的Meta和1.4万亿的特斯拉之间，所以给他安排了一个1.5万亿的一个数。如果这个数真的是1.5万亿的话，就超过了美国前六大国防承包商，波音、洛克希德·马丁、通用动力，把它们加一块，这总和都超过了。就跟当时特斯拉上市了以后，比前面多少大的汽车公司加一块的市值还高是一样的。像SpaceX如果能上市的话，应该也会有这样的能力。

至于300亿美金的融资额，应该也是这么来的，也是一次二次解读。因为前边路透社的解读是超过250亿美金。另外一个，300亿美金会超过沙特阿美当时募集的290亿美金，这也是算背后的一个逻辑。自媒体去拍脑袋的时候，也不是瞎拍的，也会有一点点小逻辑的。

SpaceX与Starlink的收入状况

那SpaceX跟Starlink的收入情况怎么样？你都要上市了，你就要告诉大家挣了多少钱了。马斯克零碎地在X上发布了一些收入，SpaceX 2024年收入是133亿美金，2025年是155亿美金，2026年预计是200亿美金。他这个收入，大头来自于800万Starlink的用户订阅。800万用户订阅这个数，也是没有经过审计，只是马斯克又说漏嘴了，但是这个数字还是相对比较可信的。2024年9月份，Starlink的这个用户是400万；2025年6月份是600万；2025年11月份是800万，它确实是在做一个增长。

SpaceX的第二块收入是来自于NASA的各种发射服务的这种订购。除了NASA之外，还有一些其他的人会去订购SpaceX的这种发射服务，这块是他的第二大收入。还有一些其他杂七杂八的收入了。但是现金流肯定是已经达到平衡，甚至还有利润的一个状态了。

剩下一块，就甭管是主流媒体还是社交媒体，剩下一块的着重笔墨都是太空数据中心。马斯克在X里面时不时就提一嘴，我要去做太空AI数据中心，我要让算力上天。具体细节，SpaceX是希望使用什么样的方案，或者使用什么样的工程设计的，这种计划通通都没有，目前为止没有详细的方案。虽然马斯克也讲了一些，但我们后面再去详细讲太空数据中心的部分。

Starlink究竟有多赚钱？

主要收入是800万用户的订阅费。具体买了多少Starlink的这个“锅”，应该是比800万稍微少一些，但是应该也有六七百万只锅在外边飘着，有120亿美金的年化收入。大家注意，我讲的叫年化收入，他可能到这个11月份、12月份，收入已经上10亿美金了，但是前面的肯定少，后边的可能会更多一些，因为它的数据总是在不断上升的。所以有的媒体使用的是78亿美金的数字，因为它这个Starlink应该有两个档位，一个档位是稍微便宜点，一个档位稍微贵一点。如果800万乘以那个稍微便宜点，那个数就是78亿美金。路透社引用一家咨询机构的数据，是写的98亿美金，因为你一年之中的数据总是在来回的变化的过程中的。

全球市场快速拓展

用户数据肯定还在快速地拓展。Starlink的拓展方式是什么样的？不断地开辟新的疆域，不断地开地图。例如：

2025年1月份：利比里亚和图瓦卢
2月份：不丹
3月份：尼日尔、吉里巴斯、亚美尼亚、阿曼和阿塞拜疆
4月份：圭亚那、约旦、圣文森特和格林纳斯丁
5月份：巴林和孟加拉
6月份：刚果民主共和国、多米尼克、马绍尔群岛、几内亚比绍、莱索托
7月份：斯里兰卡、乍得
8月份：索马里、以色列、安提瓜和巴布达，还有哈萨克斯坦
9月份：列支敦士登
12月份：韩国

它就是一个一个国家这么开下来的，你每开一段，他就会多一批用户，在这个新的国家里头就开始呈现一个用户生长和爆发的过程。

印度的话，现在应该是已经拿到牌照了，但是现在还没有开始卖，不知道印度什么时候可以发力。至于韩国为什么12月份突然开了？应该是跟三星有关系，三星对于韩国的掌控力还是很强的。马斯克说：“三星，咱们到德克萨斯来建芯片工厂，我以后的芯片都让你造了。”那三星说：“咱们在韩国推这个。”有三星的推动的话，应该在韩国的数据会快速增长。

新增长点：Direct to Cell手机直连业务

现在SpaceX还在推一个项目，叫什么？叫Direct to Cell，就是手机直连卫星这一块，也在不断地为Starlink带来新的收入。只是它这块收入并不是找个人收的。很多人说，SpaceX四处去买这个频谱和波段了，是不是要自己做手机运营商了？不是这样的。他确实是在全世界收购这个5G频谱资源，但是大家要想使用这个手机直连的话，还是要跟一些特殊的运营商去签约。你比如说在美国，你去跟T-Mobile去签约，他允许你在紧急情况下通过卫星去发送短信、发送位置、发送图文，甚至是有限的语音，这件事都是可以去做的。这个套餐是要给钱的。SpaceX号称有600多颗卫星可以来做这件事情。T-Mobile的这种套餐，如果你买高级套餐，就直接包含这个功能了；如果买这个比较便宜的套餐的话，你可以一个月加10刀，它就给你开通这样的一个直连卫星的功能。你在城市里头是用不着的，但是你到了荒郊野岭了，到了这海上了，或者到了沙漠里了，你就可以使用这个功能来去求助。国内的像华为、像小米，其实很多手机也有类似的功能，只是咱们连的是其他卫星而已。苹果在这一块连接的是另外一套卫星，苹果还专门投资了那个卫星公司，也可以提供相应的服务。在这一块，Starlink在不断地拓展他的收入，能够覆盖到SpaceX的各种发射的成本，所以Starlink还是非常非常挣钱的。

“太空算力中心”：支撑万亿估值的未来故事

大家觉得，如果你只有火箭发射，那这公司可能也就值个可能几百亿或者是上千亿。如果你再加上Starlink，你还能够赚钱了，整个这套东西也许能够再更贵一些。但是一旦有太空算力中心了，就觉得这公司应该值1.5万亿了。

地面算力中心的困境

原来算力中心都是在地面上的。地面的算力中心现在已经开始人人喊打了。Oracle、微软、谷歌，这个财报里头喊说我要投多少钱去建立算力中心，大家看着欢欣鼓舞，但实际上落地的时候很麻烦的，这个是非常被当地社区所排斥的。有点像什么？有点像垃圾回收站，或者是移动运营商的这种基站。你说这东西能没有吗？不能，必须有，但是谁都不希望这种东西在自己家旁边。当时上海这种小区就去举报，说这有一基站，一旦有基站了以后，我们就头疼，我们受辐射了。这个运营商就把基站搬走了，搬走了以后再去投诉我这信号差。是有点像这种东西，大家都想用，但是都不希望放在自己家门口。

为什么？算力中心最讨厌的一个东西是耗水，非常非常耗水。一个比较大型的算力中心，能够相当于一个小城镇一年的耗水量。那算力中心为什么会这么耗水？就是冷却。通过冷却液浸泡，因为现在英伟达的这些算力卡都是非常非常高功率，非常热，它都是直接拿冷却液泡起来。那你说冷却液的这个热量带出来以后怎么办？你就需要做热交换，把水直接蒸发掉是最容易的这种热交换方式。你如果说我水蒸发掉了以后再重新把它回收回来，那成本就太高了。所以他们就直接把自来水挂在这管子上，去喷淋冷却液的这个管道，水就蒸发掉了，这个热量就带走了，但是非常非常耗水。而且这个美国的这些算力中心还都是使用自来水的。为什么？水质不好会把管道腐蚀掉，你的维护成本会很高。美国光2025年第二季度，就有20座算力中心由于社区反对被叫停或者搁置，总投资是980亿美金。黄仁勋曾经抱怨过，一座数据中心在美国落地，从破土动工到服务器上线开始干活，要3年的时间，就是在跟社区的这帮人打仗。

中国，特别是缺水的西部，我们是怎么处理这问题的？因为我们现在“东数西算”，好多数据中心是在西部的。现在中国要求是什么？不许和农业、居民以及生态工程抢水。什么是生态工程？就是沙漠变绿洲那种工程，不允许跟他们抢水。而且他会给这些算力中心专门设置用水指标，他们最后用什么？要用电换水。你多浪费点电我认了，但是你不能浪费水。所以中国的很多这些算力中心是使用风冷的。风冷的话，就要更多的电来去吹这个东西。但是好在什么？这些算力中心都在西北苦寒之地，每年的70%到85%的时间都很冷，直接可以用风冷是可以搞定这件事了。而且中国规定的是什么？就是西部的算力中心是不允许使用自来水的，要使的话就要使用再生水、工业废水、矿坑水，宁肯增加维护成本，管道腐蚀了我就换，但是你不允许用自来水。

太空算力中心的优势与吸引力

这么费劲怎么办？去太空建立算力中心呗。这件事对于美国人来说，肯定要比对于中国人来说要更具备吸引力的。虽然中国也在尝试往太空中发射这些算力中心，但是咱们其实没有那么迫切。因为太空里头是没有环保组织的，也没有社区，没有审批，没有这些乱七八糟事。在加州参观Meta总部的时候，我就当时问他们的一个人，我说：“你这Meta总部周围都是大荒地，你怎么不去建设一下？”在中国，特别像北京、上海这种地方，那地上是不露土的，所有的地没见缝插针都得给你盖上楼。他们就告诉我说，这玩意审批起来可麻烦了，甚至是你建了一片以后，你还要给人恢复多少，必须要保持湿地或者保持绿地，他们就是这样的一个状态。在中国可以玩这个，一声令下，以大局为重。美国的在土地上是不能这么玩的，所以他们更想去太空中建立这个数据中心。

当然了，美国也是比上不足，比下有余了。跟中国比，美国的审批是很痛苦的，但是跟欧洲比，美国又可以笑了。所以马斯克也是可以在美国建大型的超级工厂造特斯拉，你到德国柏林造完了以后就天天有人找他抗议，这事就很烦。

当前面临的挑战：发射载荷与成本

现在太空算力中心其实有点像量子计算。为什么这么讲？大家都知道这条路，也都知道这玩意是好东西，只要敢出来吹，牛也都是可以忽悠到韭菜的。但是具体实施的话，三年之内基本上不太可能。为什么三年之内不可能落地？因为人类还没有办法把这么多的载荷发射到轨道上去，而且发射上去也实在是太贵了。

过去两年，全球向太空中发射了多少东西？2024年发射了2,629吨，2025年2,850吨，就是每年也就能发个2,000多吨上去。这个里头，SpaceX大概占90%。当然这个90%这个数，也是马斯克在X平台上放出来的零散消息，没有经过审计。但是这点载荷，你说放两颗卫星还凑合，你说我现在想上太空算力中心，这就想的太多了。

而且当前的发射成本也不够玩太空算力中心的。前面我跟土拨鼠做过一期节目，讲过发射成本的事情，当时往上发的是Star Cloud，他们公司往上发了一颗带有H100芯片的这样的一个算力卫星上去。Star Cloud做过测算，当每公斤的发射成本降低到50-100美金的时候，太空算力中心就划算了。如果是超过这个数就不划算，还不如在地上慢慢跟这些社区的人泡蘑菇。

现在最便宜的发射就是马斯克的猎鹰9号。如果一级火箭回收的话，它的这个发射成本是2,939美金一公斤。那你按照接近3,000美金一公斤的这个发射成本，太空算力中心这个生意是没法做的。SpaceX是不是会让这件事情变成可能？这是可能的，但是一定要等什么？靠猎鹰9这事肯定没戏，一定要等星舰。星舰目前为止还在一次一次实验，还没有彻底成功地发射过任何东西。星舰飞船如果能够发射成功，并且一级、二级，就是超重助推器跟星舰飞船都可以回收复用的情况下的话，发射载荷入轨的成本就可以降到66美金一公斤，对于太空算力中心的这个发射成本就已经满足要求了。

马斯克的太空算力构想

马斯克到底对于太空算力中心说过一些什么话？SpaceX首先说，他啥也没说过。但是马斯克在X上面零零散散地一直在说，我就要把算力芯片发到太空中去。主流媒体，我忘了是路透还是谁了，马斯克陆陆续续说的这些话都汇集在一起了，最后发现马斯克说过，三年以后，SpaceX的发射将达到每年100万吨。现在一年还不到3,000吨。如果一颗卫星的功率是1千瓦的话，可以发射100GW的算力。按照这样的算法的话，就相当于是100万颗算力卫星，每颗一吨。这就是马斯克现在所拍脑袋讲的这个东西，但是这个东西并没有经过非常严谨的去验证，SpaceX也没有出来证实过这件事情。

大家要知道，Starlink的1.0的卫星大概是200多公斤还是300公斤，大概是这样的一个数字。后来发了很多Starlink 2 MINI这样的卫星，大概是780公斤，就已经快接近一吨了。如果是Starlink V3的卫星，现在还没有发射，以后星舰上来以后就要去发这个Starlink V3的卫星。他们现在设计的Starlink V3的话是两吨一颗，1.9吨到2吨左右。那么有可能就是Starlink V3带上马斯克自己做的AI5或者是AI6芯片，这种芯片应该是马斯克跟三星一块去合作，马斯克负责设计，三星负责代工生产，以后要用到特斯拉和擎天柱机器人上的，他们就准备把这种东西直接发射到太空中去。这种芯片本身是上车、上机器人的，不会特别特别耗电。这应该就是SpaceX未来准备去做的事情。

核心技术难点：散热问题

那太空算力中心的难点在哪？第一个就是发射载荷，你真的要把这么多东西发上去，到目前为止人类还办不到，只是我们可以慢慢地进行实验了。第二个叫发射成本，现在这个还搞不定。而且当前的这种发射成本，都是按照在这个赤道附近发射，发完了以后在赤道附近的轨道上跑。但是像卫星这种，就是算力中心，都是要到太阳同步轨道上去的，基本上跟南北极那边的轨道差不多的那个角度。你要想让卫星去那边的话，要多加燃料，发射的重量就要下降，发射成本肯定还会上升一些。

然后最大的痛苦是散热。看很多人说：“老范你不懂，太空中就是一个冰窖，绝对零度，到那边散热可好了。”温度确实很低，但是你散热这件事，传导、对流、蒸发和辐射，应该算四种模式散热。传导就是拿这个冷却液泡着这个芯片，再把这个冷却液倒出来，让这个冷却液再去散热。蒸发就是咱们在地面上的算力中心一般就是这么干的，冷却液出来以后拿水淋在那管子上，把这个水蒸发掉。第三种就是对流，我拿风吹它，也算是一个对流，或者叫传导对流的一个过程。那最后一种就是辐射，我用一个很热的东西，把它伸出来以后，它这个热量会慢慢地辐射到周围去。因为太空中没有其他物质，没有水也没有空气，没有办法快速地把这些热量带走，所以只能靠辐射。辐射这个东西是很慢的，而且需要巨大的面积才可以把它辐射出去。所以散热还是非常非常麻烦的。

当前主流有两种方案：

谷歌和Star Cloud的方案：建造一个4×4公里的太阳能板，16平方公里的太阳能板，然后做集中式的算力中心。一颗卫星发上去以后，到这样的一个16平方公里的太阳能板附近，把这个卫星再接上去。
SpaceX的方案：分散的算力卫星，每一颗卫星1千瓦，每一颗卫星1千瓦，我发个100万颗上去。

这件事情，目前为止真正做过尝试的，实际上是中国人。中国现在已经发了几颗这样的算力卫星上去了，马斯克自己目前还没有。星链V3的卫星现在还没有发射成功，因为它要等它的Starship，就是这个星舰实验成功了以后，才有可能把这种卫星放上去。但是不论走谁的方案，SpaceX的星舰都是绝对垄断，绝对绕不过去的。计算SpaceX估值的时候，就可以把每年人类发射到轨道上的重量乘以300多倍，从现在的3,000吨直接提升到100万吨。反正马斯克吹了这个牛了，但是马斯克这个人吹完牛以后，他还就真实现了，这个是他这个比较神的地方。这就是所谓的太空算力中心的故事，这个也算是跟大家讲的比较透的一次了。

上市的利与弊

上市的好处

获得巨额资金：突然多一大笔钱，你比如说SpaceX上市，明年下半年一下多300亿美金出来，这个对于马斯克来说肯定是有好处的。他可以加大实验的力度，可以造更多的火箭，可以造更多的星舰。你像沙特阿美这个完全不缺钱的人，也在股市上拎了290亿美金回来。拿300亿美金这个钱，到别人那可能出去吃喝玩乐了，到马斯克手里大家不用担心，都能用到正地方去。
增加融资渠道和手段：一旦公司上市了以后，会增加很多的融资渠道和手段。比如说可以用股票对价去投资，像我以前经常干这种事，我去投资一个项目说：“我给你500万。”但这500万里头，有100万是现金，剩下400万是上市公司股票。有些人就会愿意接受这样的情况，因为这些股票是上市公司的流通股，并不是说你没上市公司的这种一级市场股票，流通股就是别人拿到了以后随时就可以卖。而且你还可以拿这个股票去招聘，说我这个招一个大牛。像这两天扎克伯格去四处挖人，号称是什么1亿美金薪水、10亿美金薪水，他不是给现金的，都是给股票的。而且你上市了以后，还有很多其他的融资渠道。猎豹移动上市的时候，有一次三星就找到我们，说我们想买你股票行不行，你单独发行一笔股票卖给我们，然后我们一起合作。他有很多这样的合作可以去做。但是后来我们没有卖给他，原因是三星要求不允许有锁定期，就是他拿到了以后可以随时卖，这个我们是不允许的。你要是买走了以后，你必须要锁定一段时间。上市流通的股票价格，通常是更容易被认可的，拿这个股票去质押，或者说去做一些其他的这种投融资，都会更容易一些。
利好消息快速体现于市值：各种的利好消息，可以更快地在市值上获得体现。我原来一年发射3,000吨的货物上去，我现在发射1万吨了，发射2万吨了，发射100万吨了，或者太空算力中心已经建起来了，登月了，登火星了，这个市值就开始直接往上翻。所以上市是有很多这样的好处的。

上市的坏处

合规成本几何级数上升：审计成本上升，或者合规成本上升，而且是呈几何级数上升。其实全都跟大家讲过，就猎豹移动没上市之前，大概也就十几二十个会计，等到上市以后有200多人。因为你要需要做各种合规，那个非常非常麻烦，而且每年需要向什么四大会计师事务所交钱，让他帮你做审计。而且你说你给了他钱，他还天天挑你毛病，很讨厌的这帮人。而且这个钱不是一次性的，从你上市那天开始，每年你都要交，这个是持续性的输出。而且不光是花钱，还有什么？就是因为合规了以后，很多的商业模式的运作成本会上升，运作效率会下降。很多事情原来我们就很简单的，直接的就把它做掉了，但是你要合规的方式做的话，你就需要绕来绕去，各种留痕，这个就很讨厌。
负面消息同样快速体现于市值：刚才我们讲上市的好处里有一条，叫各种利好消息可以更快地在市值上获得体现。那负面消息也可以快速地在市值上体现。你比如说小米把人烧死了，那马上那个市值夸夸就掉下去了。SpaceX发射失败了，你也会哗啦哗啦的股价下跌。还有就是可以被人针对、被人做空，特斯拉就一直在被比尔·盖茨做空，很多的基金都是跑去做空特斯拉。原来你说我只管发卫星，或者做做我自己的事情就完了，现在你就可以被人做空，这个也很讨厌。
容易引起股东的集体诉讼：这是美国上市的一个特色。美国上市、香港上市跟中国上市之间的差别是什么？美国上市基本上没人管你，你就直接注册制已经上去了，也没有人什么审批，但是你出点任何事情就集体诉讼。香港属于是居中，虽然也是注册制，上去也相对来说比较容易，但是要比美国难。另外一个，就是你要想去在香港诉讼上市公司，也要比美国要费劲一些。在中国就属于是你上市上不去，他有指标，我什么时候想让你上才能上去。然后你要想诉讼上市公司，基本上不可能，因为上市公司好多都是大央国企，这帮小股民凭什么诉讼他？所以还可以随便做假账。这就是不一样的地方。

当然，SpaceX必然是在美股上市，上去没有任何问题，但是上去了以后，被股东集体诉讼这件事他应该是逃不掉的。美国的股东诉讼这个上市公司不需要任何理由，只要股价下跌，我就敢诉讼你；或者我有任何觉得不顺眼的地方，我就诉讼你。马斯克的薪酬计划，就有一个人买了一股也把他告了，告完了还告赢了，把马斯克的薪水给告没了。这个上市公司你就要去承担这些东西。所以上市有好处有坏处。当然美股上市公司，特别是像SpaceX这样体量的，就不要想着去割韭菜了，一堆律师像狼一样盯着。

这次SpaceX上市的消息到底有多靠谱？

SpaceX当前的估值已经很难跟特斯拉去合并了。特斯拉是1.4万亿，他如果明年能够按1.5万亿去上市的话，这样俩公司，你说谁合并谁？SpaceX当前是正向现金流，但是如果要在三年以后达到100万吨的轨道投放能力的话，必然缺钱，它现在这点钱绝对不够它烧的。所以SpaceX应该是希望能够通过上市获得一笔现金。

股东结构与上市意愿

SpaceX的股东们肯定也是希望上市，因为你一旦上市了以后，我就可以拿这个股票自由地去交易，或者去质押，甚至于派息。SpaceX有哪些股东？

埃隆·马斯克：持股42%，投票权占79%，所以他基本上一言堂，他说了全算。但是他如果上市了以后，马斯克就不会再有这么高的投票权了，股份制改革了以后，他应该是跟他股份相一致的这种投票权。
创始人基金 (Founders Fund)：这个创始人基金的老大叫彼得·蒂尔，就是PayPal黑帮的掌门人，现在做Palantir的那个公司的老大，它占10.4%。
富达基金 (Fidelity)：占10.2%。
Alphabet (谷歌母公司)：占6.99%到7.5%。
员工持股：10%到15%。

与其他“马斯克系”公司的关系

前面我们讲过的，特斯拉开股东大会的时候，大家都希望特斯拉能把SpaceX、xAI这些公司都合进来。现在看合SpaceX确实是有点难了。SpaceX有8,000亿-1.5万亿美金之间的一个估值。xAI的估值现在是2,300亿美金，也已经很贵了。脑机接口公司还比较小，那个Neuralink只有90亿美金，基本上可以忽略不计，如果不挣钱的话，回头找一公司直接把它收了就完了。

xAI现在其实也是缺钱的时候，他现在还需要跟OpenAI、跟谷歌、跟Anthropic去抢人、抢算力，所以这个xAI的亏损额是非常非常高的。路透社曾经预测过，2025年第一季度，xAI的营收是5,200万美金，亏损3.41亿美金。路透社引用了彭博社的这个报道，是xAI 2025年应该烧了130亿美金进去。所以xAI现在应该日子没有那么好过。当然了，马斯克也出来辟过谣，说xAI资金充足，但是也没有否认xAI是亏损的这个事实。

那你说这些公司能合并吗？这种公司合并通常发生在什么时候？就是其中有一家公司现金紧张了，没钱了。有钱肯定是各自融资、各自发展、各自上市。如果你把这一大堆东西捆在一起，那这个你再去融资就会比较麻烦。当时马斯克就觉得OpenAI玩不下去了，就惦记把OpenAI合并进特斯拉，被山姆·奥特曼给婉拒了。所以合并这种事情，只有在没钱花的时候才会。短期内应该不会发生。

上市的窗口期

从SpaceX和xAI当前的发展阶段来看，SpaceX上市的动力应该还是比较强的。上市还有一个什么标准？就是行业稳定的时候，进入稳定期了，没有办法在高速发展的时候，企业也会选择上市。原来能够做回收火箭的只有SpaceX一家，现在亚马逊的蓝色起源也已经成功实现了一些火箭回收，跟他的猎鹰9号算是基本追平的一个状态。而且亚马逊自己的Leo系统，就是亚马逊的Starlink，现在也在准备开始投入运营了，要跟Starlink去竞争了。所以在这样的一个时候选择去上市，应该也不是一个很坏的一个选择。因为一旦别人真的追上来，你可能就不值这么多钱了。现在你是90%的绝对垄断，那你这个时候上市的话，大家会给你更高的溢价。至于中国火箭回收的话，估计明年还会有更进一步的进展。在中国火箭实现回收之前上市，对于SpaceX来说应该是一个不错的选择。

SpaceX上市的话，马斯克的首富位置是不是就更加稳定了？马斯克本来就是一骑绝尘的首富，遥遥领先的首富，第二名连他的一半都不到。所以有没有SpaceX上市，马斯克都是首富，这块不会有什么变化的。至于他的这个资产是第二名的一倍还是两倍，这件事本身没有那么重要。

总结

最后总结一下，SpaceX近期传出了要上市的这种传闻，顺手跟大家总结一下SpaceX上市的各种信息，以及太空数据中心到底是什么样的一个故事，还有就是Starship星舰飞船，这个才是真正的未来方向。后续再有这个星舰飞船的发射实验，我应该还会伙同土拨鼠一起来开直播，跟大家去同步相关的信息。希望埃隆·马斯克这个可爱的灵魂，可以给我们带来更多有趣的故事。

好，这就是今天要讲的内容。

深度揭秘Grok-2开源：马斯克藏不住的“中国芯”？SGLANG与Deepseek的秘密关系。

Luke Fan — Wed, 27 Aug 2025 00:53:02 +0000

马斯克终于开源了他的Grok-2。虽迟但到，这背后隐藏着哪些不为人知的秘密呢？

大家好，欢迎收听老范讲故事的YouTube频道。

马斯克最终还是开源了他的Grok-2。原来我们还嘲笑过他，Grok-1开源完了，往那一扔就再也不管它了，有任何人提问题，你也不说什么。Grok 4都出来了，现在Grok 2都没开源出来。马斯克说：“那我们下周开源。”当时是这么讲的。然而下周完了以后，好像还是又等了那么一段时间，稍微晚了这么几天吧，Grok 2最终还是开源出来了。而且承诺呢，6个月之内，或者说在年底之前吧，有可能会去开源Grok 3。但是马斯克的话嘛，大家相信，就是他说了的事会做，但是未必按时间做。

马斯克的开源呢，只能算是符合非常广义的开源。这话什么意思呢？开源也是分原教旨主义者的，他们是肯定不会认可马斯克在开源的。第一个，马斯克不是当时发布产品马上开源，而是要过一段时间，甚至是过了一年多才去开源。而且现在他开源出来的这个版本，远远落后于当前主流模型。当然Grok 2呢也不算特别落后，它在当时刚推出的时候，应该是跟GPT-4不相上下的一个水平，但是跟后边4O，以及后边O1、O2这些东西就没法比了。跟当前的主流模型，像什么GPT-5、Grok-4、Claude 4或者是Gemini 2.5这些，它是比不过的。

而且呢，马斯克开源出来的这个大模型，对于部署是非常不友好的。你要想去把它的大模型下载下来，把它部署到自己的服务器上去，这个是非常非常痛苦的。这个大小是500G，需要在Huggingface上做断点续传。Huggingface是大模型领域里边的开源仓库嘛，你需要把这500G的文件从那上头慢慢往下传下来，错了没关系，继续再来几次。他专门给大家写了这样的一个话。

而且运行的时候呢，需要8张40G以上显存的显卡才能跑起来。8张40G以上显存的显卡什么意思呢？在国内合法可以跑的这个显卡是H800、H20、RTX 6000。你说我拿5090D跑行不行？这是为中国专门量身定做的5090，跑不起来。5090D呢是24G显存，把这个D去了，也就是国际上正常的5090是32G显存，也跑着费劲。而且呢，5090跟前面我们讲的H20比，有一个巨大的差异是什么？它没有Nvlink，卡跟卡之间的通信是很慢的。而H20这种专门的算力卡，里边是有Nvlink的，八块卡搁在一起，它还可以快速的跑起来。

当然了，Grok 2呢不是特别不友好，你像在那个当时还有一个跟Grok 2前后脚发布的产品，叫Deepseek V2，那个版本当时开源出来的时候是需要8张80G的显存的显卡才可以跑起来。这个Grok 2只需要8张40G显存的显卡就可以跑起来了。为什么会有这样的差距呢？原因很简单，当时的Deepseek V2是FP16的，而现在的Grok 2的话是FP8的，所以它会要更加的省显存一点点。

现在开源出来的呢叫Grok 2.5，并不是真正的Grok 2。它必须使用叫SGLANG的这样的一个系统来去部署。这个里边呢就会有很多故事了。大家注意，Grok 1并没有这样的要求，Grok 1使用的是Jax系统部署的。Jax是谷歌的系统。咱们待会就围绕这个SGLANG，来讲一讲它这个故事到底在哪。

马斯克的开源跟其他人开源不一样，就是他把东西开出来以后，基本上就不闻不问了。你其他人开源出来以后，你去提意见，说我哪遇到问题了，开源出来的这些公司还是要去修修补补的，调整一些东西的。马斯克就甭管是它前面的Twitter的推荐算法，还是Grok 1开源出来以后，就再也没人说这事了。你提任何事情，他都不理你，也不会做任何更新，就是这样的一种开源。

而且呢，它的开源参数呢也没有完全公开。你像Deepseek这些，都是直接告诉你我有多少参数，如何去部署，怎么去用这个东西，甚至连论文什么一块扔出来。马斯克就是我把东西扔这了，你们自己谁爱用谁用去。现在呢，大家只能通过下载的模型去猜测，它呢应该是一个269B的模型，是一个挺大的模型。

license呢也是严苛的，商务社区版本的license。所有的开源项目，你都是要有开源license，就是我拿这开源项目以后，什么事许干，什么事不许干。它这个Grok 2是不允许商用的。你就算是把它放在自己的产品里用，你说我不商用，没有达到大规模使用的这个程度，你也要在里边写上“powered by XAI”，这个都是要注明的。一旦超过了它一个使用限制以后，这个事就没法整了。Grok 1是阿帕奇2.0的license，还是一个完全开源的产品，但是到Grok 2就不是了，就已经变成了这种商业许可的产品了。

国际上面是有这种商业许可限制的大模型呢，像Llama其实是有限制的，那个也是有规定的，就是你用户量达到多少以上，你就不可以再去使用了。你拿去做一些研究是OK的，但是呢你不可以拿Llama再去训练新的模型。但是这个东西呢，说也是叫防君子不防小人吧，Llama 1开源，全中国的这些开源大模型就如雨后春笋一样夸夸就出来了。所以你去写说不允许训练其他模型，不允许去优化自己产品，不允许去商业使用这些事，反正你说着开心就好了。Grok 2呢也是这样的一份协议，大家说着开心就好了。但是差异在哪呢？就是Llama当时发布的时候是当时最领先的模型，大家会去照着去学习；但是Grok 2发布的时候就已经是去年的模型了，反正你算是开过源了吧，也就如此了。国内的模型呢，像Deepseek、千问这些，基本上都是MIT或者是阿帕奇的这种license，就是你可以拿去使，可以商用，可以自己去修改，拿它去干嘛我就不管了。所以跟他们还是有很大区别的。

咱们后边讲这个SGLANG到底是一个什么样的系统呢？它的名字是一个缩写，叫结构化生成语言。S是structure，G是general，LANG是这个language，它大概是这么三个单词拼在一起了。它的开发者呢，两个主要开发者，一个叫郑连敏，一个叫尹良生，听着像中国人吧？郑连敏呢是上海交大的本科，UC伯克利的博士，他现在就是Xai的工程师，在Xai里头主要就负责SGLANG这个版本的继续推进。明年7月份呢，会加入到UCLA任助理教授，现在UCLA的官网上已经把他的名字写上了。像美国的这些大厂里边的科学家，或者是这种大工程师呢，都会有这种两边来回流动的一个过程，去上两学期课，然后呢回来做一段时间的研究，很多的美国这些大厂的顶尖科学家是这么工作的。另外一个呢叫尹良生，尹良生呢是上海交大的本科，2025年从上海交大毕业，就是今年毕业，已经拿到了UC伯克利的博士生入学许可，准备到那儿接着去读博士了。

他们两个人写的这套系统。那你说老范，你是不是要讲中国人好厉害？比大家想象的可能还要再稍微厉害那么一点点。本身XAI里边这个中国人的比例就非常非常高，咱们这讲的是中国人，不是广泛的意义上的华人，就是从国内去的这帮人，比如清华、北大或者上海交大这些地方学完了去的，他们可能在美国读的博士，然后就在XAI里边去上班了。

但是这个项目还不太一样，咱们去稍微捋一捋这个SGLANG的一个发展历程。他是2023年12月12号发表的SGLANG的论文，当时呢郑连敏应该是在UC伯克利读博士，而尹良生应该是在上海交大还在上本科，他们两个人呢联合署名做了这样的一篇论文。到2024年5月份，Deepseek V2发布，236B的一个大模型，每次激活21B的参数。他们呢就说我们要去升级我们的版本，大概是到9月份，这个SGLANG就升级好了，专门对Deepseek进行了优化。SGLANG是Deepseek最优化的一个运行平台，你在其他平台上跑这个Deepseek都没有在SGLANG上跑得快。到2024年的8月份，Grok-2发布了，269B，每次激活115B。这个时候呢，郑连敏应该已经从UC伯克利博士毕业了，已经到了XAI去上班去了。2024年的12月份，SGLANG继续升级，这个升级是为了支持Deepseek V3的。Deepseek V3呢是2024年12月份发布的671B的一个大模型，包括后边我们讲的Deepseek R1，都是在Deepseek V3的基础上进行训练的。Deepseek最近刚出的V3.1还是671B，所以呢这都是一个系列的模型。2024年12月份还发生了一个什么事呢？grok V3发布。

大家按这个线去捋，你就基本上可以发现，Grok 1做的时候，马斯克还是满眼抓瞎的时候，不知道该怎么弄，拿着这个JAX就开干了。另外一个拿JAX开干的是谁？是苹果。苹果那个时候也是举着JAX就开干了，最后呢做出来的一个产品，但是效果一般。这个时候Deepseek大量的这种MOE模型的开源的东西就出来了，包括后面的论文什么就都出来了。上海交大这两位同学吧，他就开始去写这个SGLANG，专门针对这种MOE的模型进行优化。马斯克觉得这条路不错，那咱就干脆把这个团队招到我这来，你给我去好好维护这个SGLANG的版本，我们也在这个基础上，去训练我们的模型。

你说这个里头有抄袭没有？还是说有借鉴？我觉得说借鉴还是比较合理的。因为你去做新的研究的时候，你总要看论文吧？梁文峰写了那么多论文，你也得看。看完了以后，你说我受这个影响了，照这个方向去往前发展，这个本身没有任何问题。咱们不要老觉得说不是原创就怎么怎么样，别老想着这事。

所以从这看呢，Grok跟Deepseek还是很有缘分的。Grok 2跟Deepseek V2、V2.5，它们之间其实是有非常相近的地方。再到Grok 3跟Deepseek V3，也是有很多相近的地方了，有相互借鉴的地方。可能更多的是Grok去借鉴Deepseek，因为Grok每次出新版本的时候，它不开源也不开放出来，他要过一年以后才开放；而Deepseek每次拿出点什么东西，马上都开放了。所以这个到底谁去借鉴谁，大家自己心里去想。

其实呢，这就是开源生态的一种发展方式。很多人在讲什么“美国人一开源，中国人就自主研发、自主知识产权了”，这可不是这么回事的。开源了，我们就可以在开源协议的允许范围内去使用这些代码，甚至是去修改这些代码，再发行这些代码。他只要是协议允许你干这个事，你就可以去干。我干完了以后，我去注明了，说我是用了人家的代码，我把它写清楚就完事了。就算是前面翻车那盘古大模型，上头也写了“我用了别人东西”。但是中国人有时候没法接受这事，你说你都叫盘古了，你好意思你用别人的吗？前两天华为云内部的架构大调整，把整个的盘古这个团队全开掉了，以后这个丢人现眼的东西咱不弄了。前边别人说盘古去抄袭了，华为还在那义正词严的在那辟谣呢，辟完谣以后沉寂了俩月，直接把团队给开了。你说这玩意叫啥事？

我觉得我们应该很好的去接受这种开源生态，而不是说我一定要原创，我从来没有抄过，我从来没有用过别人，这个是相对来说比较狭隘的。你像Deepseek发了论文，公开了参数，SGLANG呢肯定是以这些公开信息为基础进行了优化。Xai呢也在这个过程中呢转型，在SGLANG基础上用同样的系统进行优化。大家走的路呢又不是完全一样，Deepseek还是要更多的考虑到算力紧张，没有NVlink的情况下，这个性能到底怎么样，到底怎么把它跑起来。Grok那就是土豪家的败家子，有的是卡，最新最好的卡，而且还有工程师爸爸负责部署和实施。他还跟微软、Oracle这些公司不一样，那些公司还需要外包，找别人去给部署。那马斯克干这玩意，肯定是没有任何问题的，因为他从特斯拉的时候就开始部署这种超算的集群，非常非常有经验。所以他可以把最好的卡、最新的卡拎回来进行部署，而且量大管饱。现在马斯克已经说，我们注册一公司叫“巨硬”，准备买上百万块的显卡，接着往前走。

马斯克算迎头赶上了，用Deepseek没有的资源，直接暴力推进。我们前面在讲Deepseek的时候就已经讲过了，马斯克肯定会照着往前冲的。苹果啥也没干，其实苹果在做大模型这块跟XAI是同时起步的，都是从JAX这开始起步的，但是苹果最后啥也没出来，马斯克这边都做出来了。梅塔呢还在老路上面去蹉跎前行，未来到底怎么走还不知道。所以呢，别人都开源了，谁你抄的好、抄的不好，或者在这个基础上到底能不能做出新东西来？我相信Grok还是创新的，我并不是说我就指责了，说“Grok你就是抄Deepseek”，没有说这话。还是得看谁可以把这个工程往前推的更远，这个才是本事。

国内的模型厂商的话，你说他们没有借鉴Deepseek吗？肯定借鉴了。他们只是说太多东西要抄了，到底抄谁的呀？这个是真正国内厂商要去头疼的事情。大家发现了，Deepseek V2的版本其实并没有那么热，到V2.5开始这个热度一下就上来了。就是从Deepseek V2.5开始，很多的国内厂商就开始转型，说我们是不是去看一看，像百度什么，他们就已经开始转型了。等到Deepseek V3出来的时候，其实就已经很热很热了。当然对于整个的行业来说，或者说对于社会来说，圈外的人真正知道Deepseek是从Deepseek R1，就是从今年1月份才开始知道这个事儿。但是从去年12月份的Deepseek V3开始，在这个程序员圈里头，在这个行业内呢，大家就已经普遍认知了，这就是一个当前最好的框架了。所以当时很多的团队就都已经都转过来了。现在Kimi k2、mini Max M1、百度的这个4.5、智谱的4.5，其实都是按照一个模式做出来的。但你说它们都是抄袭的，我觉得大家不要想这个事。大家呢都在同样的看论文，都在一个可能同学圈或者是朋友圈里边去，大家一块可能平时喝个咖啡、聊个天什么的，他是这样的一个环境。

国内大模型厂商也是相互借鉴。你看谷歌、微软，他们肯定也会去读论文，他们去做新的研究、去做新的产品的时候，“这Deepseek写的，中国人写的，我不看”，他们也不会这样的，没有那么狭隘。

今天我其实主要跟大家讲的是这样：开源才是未来的一个方向。不要上来说你抄袭，不尊重原创，这太狭隘了。咱们最后总结一下：开源是当今世界比较先进的全球化、松散协作方式。大家注意我刚才讲的这些定语：全球化、松散协作。开源呢推动了互联网、移动互联网和今天的大模型的整个产业的升级。Deepseek呢在里头起到了巨大的推动作用，包括咱们今天讲的SGLANG，都是在开源大潮里边起到了巨大的作用。

马斯克的Grok开源呢，基本上没有为社区贡献太多的东西，毕竟是去年4月份的东西嘛，还是稍微差一些的。马斯克喊开源呢，主要还是为了要吸引眼球。第一方面呢是恶心OpenAI。当然OpenAI现在人家也开源了，把GPT OSS拿出来了。但GPT OSS要比现在开源的Grok 2要强非常非常多，因为GPT OSS是大家可以用的一个产品，不是像Grok 2这样的，没有人会去用它。为什么没有人用？因为部署起来成本非常高，还是一个旧模型。我花了这么多成本，我去部署Deepseek V3.1不行吗？所以他就不想让别人用，也不想让任何人占他便宜。

马斯克现在想干的活呢，就是让更多的人去用他的Grok服务。而且呢也希望在未来呢，让更多的人呢去用他的这个巨硬的产品。那你说巨硬到底做什么的？前面他专门申请了一个商标叫巨硬，就专门为了恶心微软的，“你叫微软我叫巨硬”。一开始以为马斯克就是开个玩笑，或者说出来嘲讽一下比尔盖茨，没想着他真在里头干活。现在说了，我们这巨硬公司是真的要干活了，而且呢干这方向呢，也是大家熟悉的方向，他要做manos，就是做agent。说以后你微软的这些产品，我通通都拿各种各样的AI agent给你覆盖掉。你做了office，我就给你做个AI agent，跟他说你给我写一PPT或者给我写一什么东西，他吭哧吭哧给我写好了，我就不需要那么复杂的叫做office这些东西了。他是搞了这么一套东西出来。

大模型在不断创造内容的过程中呢，其实也在不断的污染大模型被发明之后的语言环境。所以呢，中国的创业公司跟开发者，也在不断的创造新的技术，创造新的内容。在这个过程中，再通过开发者社区或者通过开源社区，不断的将这些新的思想拿出来，去影响全球的科技发展，为全球科技发展添砖加瓦。不要想着说脱钩断链，说我们不要中国人的思考，我们不要中国人的技术，这个玩意是有毒，这个世界不是这么发展的。

咱们今天通过Grok 2的这个发布，通过Grok 2使用的SGLANG的这个平台的一个历程，你就会看到在这个过程中的话，你需要上海交大的学生来去给你写这些系统，你也需要去借鉴Deepseek的论文、借鉴他的一些思路去训练自己的模型。而且这个节奏是一模一样的，这边出Deepseek V2，那边过几个月出这个Grok 2；然后那边出Deepseek V3，你同一个月出Grok 3。这个就是同样的节奏，一模一样的往前走。所以这是一个进步的过程，别老想着谁抄谁的事。

好，今天这故事讲到这里，感谢大家收听。请帮忙点赞、点小铃铛、参加DISCORD讨论群。也欢迎有兴趣、有能力的朋友加入我们的付费频道。再见。

中美伦敦会谈的桌面之下：任正非借人民日报亮剑，黄仁勋罕见认同华为，揭秘超越芯片硬件的AI标准与电力战争真相。

Luke Fan — Tue, 17 Jun 2025 00:39:43 +0000

黄仁勋与任正非的隔空对话：AI芯片之争。中美伦敦贸易会谈——谁都没说，但谁都真正关心的话题。

大家好，欢迎收听老范讲故事的YouTube频道。今天咱们来讲一讲任正非的人民日报文章，以及黄仁勋给他的回复。6月10号头版头条占了1/3的版面，叫《国家越开放，会促使我们更加进步——对话任正非》。这样的一篇文章登上了人民日报的头版。这个排版的艺术要注意，人民日报呢，一般头版上最多是给你个标题，或者写一小段，后边就跳转到多少版面去了。直接占1/3版面写这样的一篇文章的话，这个是要表明一个态度。而且很重要的是时间点，6月10号这篇文章刷出来的。这是个什么时间点呢？中美伦敦会谈是6月9号到6月13号，这是中美伦敦会谈的第二天。把这样的一篇文章给刷到人民日报头版上去了，所以这个也是我们表明的一个态度：就是你卡我吧，我告诉你卡了我以后会怎么样。

那任正非说了些什么呢？第一个，没有想过，想也没有用。不去想困难，干就完了，一步一步往前走。这是一个大的重点。我记得原来有一本小说叫《绝代双骄》，有人问他说，都遇到这样的难事了，你咋不发愁呢？当时那个主角应该叫江小鱼，他的经典回复是：如果发愁能够有用的话，我早就发愁去了。所以任正非呢，现在也是讲的干就完了，你想这玩意也白想。

第二个讲的，说中国做芯片的公司很多都做的不错，华为只是其中一家。美国是夸大了华为的成绩，华为还没有这么厉害，要努力做才能达到他们的评价。就是说做芯片的好多呢，不光我一个，他们老盯着华为，其实我们也没那么厉害。这个呢，也算是一个小幽默吧。

再往后说，华为单芯片技术仍然落后美国一代，但通过集群计算、算法优化等路径，可在实际应用中达到与国际先进水平相当的效果。这个话什么意思呢？就是说他承认他的升腾910系列的芯片比英伟达的芯片呢还是要落后一代。至于这一代到底是多大的代，咱们就不研究了，反正我们现在承认落后了。但是呢，我一个落后我就可以多来几个吗？我把它并行起来不就完事了吗？很多人说这不行，你并行起来，人家还有Nvlink，还有HBM，还有一堆技术来防止你去并行呢。这个里头是这样，你可以通过算法优化，把原来的给Nvlink，给CUDA写的这些算法整个调整一下，把这个计算序列重新排定一下，让他们可以并行去计算。这个可以部分克服吧，你肯定还是要效率比他低，但是基本上能使。我觉得任正非作为一个了解工程技术的人，说这个话不算是说错。

再往后说，人工智能也许是人类社会最后一次技术革命。中国在电力、通信、网络等领域具备优势。这个话呢，我觉得任老爷子说的是非常有水平。人工智能也许是人类社会最后一次技术革命，再往后就不仅仅是人类自己的技术革命了，可能就是一些新物种了。

而人工智能真正考验的是什么？就是电力和网络通讯的基础设施。你要有电，没有电的话，你说你怎么去算？甭管你是用英伟达的显卡，还是用升腾的显卡，你都得烧电。你用升腾的显卡，可能做同样的事情烧更多的电。我们现在在发电这件事情上，肯定是要领先美国很多的。咱们在国内整个的通信网络，还是相当的先进、相当的发达的。在这一块上，我们已经领先了。

最后呢，他讲了一个在商言商嘛，就是你还是要讲一些对华为有利的事情。国家要形成统一大市场，民营企业需要法制化、市场化环境。这个就是华为给自己要的东西了。好多人一说华为，这不就是国企吗？这不就是背后有什么背景？其实华为是个民企。华为在很多的竞争领域里头，也会被这种大国企、央企，或者是关系更硬的人欺负来欺负去的。所以华为讲了说，还是要好好的法制化。

而且为什么要讲统一大市场呢？中国很多这种政府招投标吧，还是会做这种叫地方保护。说这是我们省的，或者我们市的企业，我们要首先让他活下来。华为你这个我知道你很难，但是你先等一等。所以要去讲统一大市场，在商言商总还是要讲一点。

那么这个文章的意义是什么呢？就是我们不怕美国的芯片封锁。现在我们已经逐渐追上来了。升腾最新的芯片据说已经接近了可能上一代英伟达芯片的这个水平。跟现在什么GB 200这个比起来，肯定还差的比较远。但是你要去比什么H100，已经可以想办法拼拼凑凑能够干活了。这是中美伦敦谈判期间我们发的一个文章。

中美伦敦谈判呢，谈了好像又没谈。大家呢，都有希望达成的结果。美国人想要稀土，中国人想要芯片。而且不光是想要英伟达最好的芯片，我们可能还想自己造芯片。你把那个光刻机卖给我一个。我们想要这些东西，都是需要时间和巨大成本才能够搞定的东西。

美国人说，就搞不定稀土吗？肯定也搞得定。这玩意也没有什么先进技术，就是第一个耗电。因为大量的稀土提炼，实际上都是在电解铝，或者是一些伴生矿的分解的过程中去得到的。所以你要想整这个东西，就是需要大量的电。第二个是什么呢？你需要有很多的这种副产品要消耗。比如说我做出一大堆的这个稀土材料来，那你电解铝那些铝你干嘛去？你也得把它用掉。还有呢，就是要污染环境。

你发了很多电去做电解铝。电解铝本身也是一个挺污染的产业。你愿不愿意在美国土地上发了这么多电去电解铝，再把这个铝卖掉，然后再把环境污染了？你要愿意干，那你就慢慢干。这个事并没有那么大的问题。

至于说中国想要芯片这件事呢，其实是一个道理。你不要说美国人发明了，你发明不出来。我们还是有很多工程技术上的方式可以来绕过这些东西的。我做出来东西可能没有你好，但是我先一步一步往前做。特别是芯片领域，还有像AI领域里头呢，就是你做的越多，积累的经验就越多，你就越往前走。

最后呢，双方达成的是什么叫基本框架？基本上就是原来日内瓦协议的这些东西，我们又稍微的强调了一下。而且呢，都在强调什么？老大定调子，我们继续谈。甭管是美国还是中国，在这一次最后给的公告上基本上是一样的。我们要尊重日内瓦当时达成的协议，要尊重这个精神。我们要在这个精神的指导下继续往前谈，就讲了这么一个东西。

而且我们给出的评论是什么？就是没有写建设性。中文还是很清晰的，建设性成果就说明这事往前走了。但是我们写的是什么？我们写的叫很坦诚。很坦诚的意思就是分歧比较大，这个是要注意。看形容词也能看到。

说这一次在伦敦谈了点什么？美国人的算盘呢其实打的挺响的。日内瓦谈判之后呢，他新加了一大堆的限制。原来我们想日内瓦谈判完了以后咱们坐下来谈，你把日内瓦谈判之前的这些限制，我们两边商量商量，咱们减一减对不对？但是人家美国人不这个，在日内瓦谈判以后新加。加了呢，第一个是核电设备，第二个是EDA软件，第三个是飞机发动机。我把这三个东西都限制掉，希望什么呢？你把那稀土卖给我，我把这新加这几项给你去了，原来那些呢该怎么限制还怎么限制你。他想搞这么一个事，基本上把大家当傻子玩。

现在呢，其实美国还在继续玩。就伦敦谈完了以后又继续了。他这次玩了一什么呢？叫限制乙烷的出口。而且他呢都不是说我就不卖给你了，他是说我们要做许可证一事一议。其实到现在为止H20也不是说不卖了，也是许可证一事一议。包括我们的稀土也不是说不卖了，我们也是许可证一事一议。但是这种所有到政府那一事一议的东西呢，大家就基本上认为就封禁了。就这东西就没了就完了，谁有那功夫每一单跑到你那去审批去？这没有意义的。

那么乙烷是个啥玩意呢？它主要是做塑料的一个原料。中国呢也有这个东西，它就是做石油加工的时候呢的一个副产品。但是中国的油呢含乙烷比较少，咱们的油大概含3%到8%。

美国呢，因为是玩这个页岩油，他们的那个含量是15%。中国的进口量占全球的57%，全球有一半的这东西都卖给中国了。他这边说我们后边一事一议发许可证，马上就有人拿着订单到美国政府去申请许可证去了。这个就没有签发，拒绝签发。美国的出口企业股价应声而落。

这个东西呢，美国人产的便宜，大概300美元一吨，到中国呢就是500美元一吨。因为咱们本身就少嘛，咱们也产这东西，但是呢，我们自己率很低。每年使用的乙烷呢，大概80%是需要进口的。这些乙烷呢，基本上是98%到100%来自于美国，就完全依赖于美国的。

那下次谈判的时候，肯定美国人又想了，说咱能不能拿乙烷来去给你换这个稀土跟石墨呢？他发现前面我禁了你EDA软件了，你就在那头想办法自己研发去了，好像你也能替代。我禁了你飞机发动机了，你那边长江100马上开始挂到运20上去试车去了，好像也没有掐到你的这个腾处。我去禁你的核电设备，你国内好像也要去国产替代去了。这事不行，我一定要找一个你80%都依赖我的一个产业，去给你换稀土。

美国人呢，他有的时候怎么说呀，就真的是很天真的一个思考方式。我们处理的方式肯定是说，不受要挟了。你要禁我的乙烷，我们一方面自己加大生产，另外一方面找韩国找日本，再找一些其他的国家说，你们愿不愿意把这个额度吃下来？美国这些盟友小伙伴们，现在跟美国之间的贸易谈判都没谈完呢，除了英国谈完了以外，其他人都没谈完呢。所以美国如果把这个份额让出来的话，那其他的国家说，这我得着吧，这个都是有可能的。

至于美国的芯片呢，在整个伦敦会谈的时候，我们也没提，他也没提。日内瓦完了以后是有联合记者会的，在这个完了以后没有，各自做了一个表述，谁都没提这事。

中国稀土呢，比美国那个芯片其实还要更绝一点。什么意思？就是美国芯片是专门针对中国的一事一议，中国的稀土是不针对美国的。我们针对全世界所有国家，我们要防扩散，不能让我的稀土去给你造武器去。这个事呢，也是一事一议，甭管是哪个国家到中国来买稀土，我们都是一事一议来审批。

那么在这样的情况下，黄仁勋是怎么回复的呢？黄仁勋在巴黎Vivo Tech技术展期间接受场边采访的时候，回应了任正非的言论。这个是一个非正式的媒体采访，内容呢，通过路透社、彭博社等国际媒体进行传播，随后被南华早报、环球时报等转载。

黄仁勋说，英伟达的芯片技术呢，确实是领先中国一代，但指出了AI呢是并行问题。

不是说我这个芯片快就完事了，还是说我要怎么能够让它并行的一起去工作。如果单台计算机性能不足，增加数量是可以弥补差距的。所以基本上认同了任正非讲的这个观点。而且呢，他认可了任正非提出的中国能源充足，可支撑大规模芯片堆叠的这种论断。因为你到最后要烧电嘛，中国别的不行，这个电肯定还是全世界第一。咱们发电量是美国的好几倍，那你既然要去做AI运算的话，电是一个最大的核心。

黄仁勋认为，中国的技术对本土需求而言已经够了，不需要再去买英伟达的芯片了。警告美国若继续限制对华的出口，华为将吃下中国市场，并覆盖全球其他地区。因为现在华为的升腾系列芯片，还是在快速的向全世界出口。很多国家都会去买这个东西，因为他们也不希望一棵树吊死。今天都买了英伟达的了，过两天美国又有点什么事不开心了，给我制裁一把，我总得有一个备份的方案。这就让华为芯片走向了很多的，特别是一带一路的国家。

而且呢，黄仁勋暗示，中国可能通过市场规模和工程能力，构建独立于美国的技术生态。这个其实是非常吓人的一个东西。因为一旦说我们自己闷着头把这事往前走了，包括我们自己有巨大的市场规模，可能就形成新的标准了。现在全世界已经有一些技术在使用中国标准，比如说超高压输电。现在所有超高压输电都是使用的中国标准，你在全世界任何一个国家和地区，你说我现在要搞超高压输送电路了，超超高压输电了，他那个各种手册什么全是中文的，你就得好好学中文这套东西。

黄仁勋强调了AI开发者的平台绑定效应，这个是非常重要，在AI开发者非常非常重要的一个效应。CUDA为什么强，就是因为大家都爱使，并不是说他的技术上比别人先进多少，只是所有的开发者都在这个台子上练的。就跟原来咱们说相声似的，说你这个得属虎，我给你算命了你属虎，说我不属虎行不行，不行，我就属虎这套词熟，我就给你说属虎。这CUDA就是这么一套东西。那一旦中国形成了自己的标准的话，那未来可能这就会成为全世界的标准。所以如果所有的AI开发者都集中在中国，中国的技术体系就会胜出。这个是黄仁勋说的很重要的一个结论。

美国如果放弃全球50%的AI研究员，将削弱其技术主导地位。因为现在中国人，特别是从大陆受过早期教育的这些中国人，他们发表的AI方面的论文基本上已经占到50%了。这个前面是有人统计过的。在这样的情况下，美国人你自己要想清楚，如果你不跟他们玩的话，他们就自己去抱团形成新标准去了。

现在呢，英伟达已经不再指望美国取消出口限制了。原来他还去争取一下，现在发现这事没法讲了，我也不惦记了。英伟达已经调整了财报预测，不再纳入中国市场收入了。原来他财报里有一块，说我中国市场挣了多少钱，这以后这块没有了。

黄仁勋为什么要这么说呢？他为什么不说英伟达的芯片就是好，你还是要买英伟达芯片呢？因为你再怎么说好，中国人也愿意买，但是美国人不让卖，所以这个事他没法说了。他现在只能说标准争夺之战，这个事是不能输的，特别是AI这个领域里头。我们现在在争夺标准，而且这可能真的是像任正非说的，是人类最后一次技术革命了。这个标准在谁手里边是非常重要的，那么一定是哪边用的多，哪边形成了平台，哪边形成了大的生态，它会成为新的标准。

在这块，中国现在该有的已经有了。趁着我现在还领先，你让我卖，这样的话咱还可以在标准里头占一块。你要不让我卖了，那中国就自己憋屈了，那最后他形成标准了，就把我们的标准淘汰了。最后不会形成两个标准的，一定会形成统一的一个标准的。谁用的多，谁就是标准。所以黄仁勋在喊这个话，并不是说承认了英伟达的芯片就已经被华为的芯片追上了，还是差一代的。但是呢，他在喊美国政府，说赶快开放，再不开放就晚了，也算是在商言商吧。

那么脖子这种东西，到底是怎么被卡住的呢？大家有没有想过？第一个呢，其实是叫成本跟时间差异。你像稀土、石墨，包括刚才咱们讲的乙烷，都是这样的一个状态。你不是造不出来，也不是什么高科技，就是不划算。我造一吨500美金，他造一吨300美金，他那儿划算。而且他是采着石油，这东西就做出来了，我们是要拿石蜡油再重新去做这个玩意，这玩意就费劲。这些东西呢，都是可以靠工程的方式以及一段的痛苦时间，逐渐去找到替代方案的，不是说这事就过不去了。

第二个其实是什么？就是专利限制。这块呢，可能跟很多人想的不一样。很多人说中国人你造不出光刻机来，中国人你做不出EDA软件来，就是设计芯片那个软件。大家要知道，EDA软件这个东西在中国也使了这么长时间了，美国人把这个东西拿到这儿来，也使了这么长时间了。中国人很擅长做的事情是什么？叫逆向工程或者叫破解。就这个东西我们早就把它破开了，里头到底怎么回事，都看得明明白白的了。那你在这样的一个情况下，那你中国为什么做不出来？有版权，有专利，我必须得绕过你，我不绕过你这个事他是违法违约的呀。如果说我们双方开始贸易战了，这个不是一个正常的商业规则。

继续执行下去了，那我为什么还要去尊重你的专利呢？我为什么要尊重你的规则呢？那我就破解呗，我就直接使用你的技术路线，我就往前走呗。前两天我还看一个说德国人发明的二战油桶，那美国人一看，这不错，咱造呗。美国人在整个二战期间也没有付一分钱专利费，直接就把这个汽油桶造了，可能几千万个出来。说这个二战的油桶实在设计的太好了，它这个油桶是好拿，而且非常的结实，堆叠起来以后不破，而且倒的时候还有很好的泄压的这个功能。最后是全世界都在使用这一个油桶。二战结束了以后，甭管是东德还是西德，收到过专利费吗？没有，这事就完了呀。

所以现在美国跟中国玩这个专利战，玩这个贸易战，等贸易战结束了以后，那前面这事怎么办呢？那肯定也是要大家坐下来谈呗，既往不咎也就过去了。所以不要以为说这东西我们是做不出来，好多东西特别是软件的东西，我们是能做出来的。还有一些东西呢就是工程上，你比如说发动机，我们可能在一些基础材料上稍微差一些，工艺上差一些，这个东西我们没有搞明白。那怎么办呢？人家的这个比如说能够使1,000小时，我们这能使500小时，那我就500小时做一次检修呗。我成本上升，跑一段时间以后，我们再在工作的过程中去寻找一些替代方案，或者一些优化的这种方案。因为这个东西好多就是要反复的迭代，反复的往前试，他才可以说找到新的出路。你说我始终不试，做一堆专利，这个就死路一条。

你就像日本的新能源汽车似的，他生产了一大堆专利，但是呢他又舍不得原来那个汽油车的市场，始终不去做大范围的氢能源汽车的推广。那你跟电池汽车来比，那你就打不过他。电池汽车说我现在已经推了多少代了，现在固态电池都要出来了，我们把原来各种各样的问题都已经解决掉了。现在我不断的提高充电的电压，800伏、1,000伏，我一直往上提，我现在充电也充的也可以挺快的，5分10分钟我也可以把电充满。它是这样的一个玩法，所以一定要快速的迭代，快速往前做，才有机会成为标准。现在电动汽车跟新能源汽车的这种竞争，就是这样的一个明显的案例放在我们面前。

那么下面呢就是生态跟标准的限制，这个也是一个卡脖子。CUDA跟Nvlink其实就属于这一类，它属于生态特别好，大家都习惯这套东西了，你让我换这个事成本实在太高了。开放平台用的人多了，自然就会活跃，这些活跃的平台上自然就会形成标准。标准这个东西，千万不要以为这是国家一帮老专家坐在这，关上个门拍脑袋说。

我们制定一个标准，大家来执行吧。没有这个，中国是尝试过几次的，什么TDS、CDMA。以前呢，还有VCD、DVD的一些标准。咱们当时做了一大堆，从来就没有人使。所有的标准都是事实标准，我把这个标准做出来了，用的人多了，它就成为新的标准了，都是这样来的。所以一定要靠活跃的平台，才能产生新的标准。时间跟成本限制的东西找到新的出路，大规模生产之后，就会形成新的生态和标准。

专利限制会阻碍社区和平台的形成。你不要说你看美国人有专利了，日本人有专利了，中国人你搞不定了，别想这个。日本人就是被专利玩死的，日本最后失去了他的互联网时代，失去了他的移动互联网时代，氢能汽车也没搞定，人形机器人也没搞定。为什么？就是一大堆专利把他都绑死了。其他人说我想去发展一下行不行？你先来跟我做专业谈判，你谈不明白的话你就别发展。那大家一看说这事没法整，那就绕开他们这些专利已经封锁的区域，我们在其他地方再单独走出一条路来。

美国人也好，或者中国人也好，已经用一些实际案例告诉了大家，说靠专利封锁这件事，大家就绕开。我们这块是不碰了，我们在其他地方照样走得通，这个已经有很多案例证明了。而AI时代呢，卡脖子要比原来的什么稀土、石墨呀，乙烷这个事要更难。为什么呢？因为AI时代它是建立在开源数据，专利和生态与标准之间的一些竞争，那中间很多东西是非常模糊的，而且这个东西本身发展的非常快。你想禁止我的东西，我把DeepSeek、千问这些东西开源了，那你也去装。现在亚马逊上也把千问的模型都挂上了，亚马逊上现在包括微软上也把什么DeepSeek这些模型都挂上了，大家就一起跑呗。他们也愿意在千问的基础上，在Deepseek的基础上再去做微调，像perplexity就在Deepseek的基础上去调整这个模型，发现也很好使。所以你在这块想卡脖子，基本上不现实。

你想靠国家的法律，想靠专利想靠规则卡脖子，最后卡来卡去。这么多中国人，有一半的研发人员都是中国人，我们就找这种最开放的平台，我们就找没有什么限制的平台，我上哪使去。最后这边形成了新的标准，那这样的话对于英伟达来说，对于现在的美国人来说，可能就会比较痛苦。

最后总结一下，任正非也好，黄仁勋也好，喊的呢都是开放与生态，他们喊的东西是一样的。中美继续慢慢谈吧，这个事也没什么办法。你也不能指望说下一次坐下来，我们就彻底开放了，这个我觉得不太现实，黄仁勋已经放弃这个幻想了。

中美贸易谈判的结果和最终的竞争谁胜谁负的话，其实已经没有什么关系了。只是说在整个的AI发展过程中，到底谁挣到钱了，谁没挣到钱，或者谁先挣到钱，谁后挣到钱。最后只跟这个有关。最终的AI革命谁会胜利的话，我觉得已经无所谓了。这个呢，就是人类最后一次技术革命。这是生态与标准之争，不是芯片之争，不是几纳米之争，也不是什么稀土、乙烷。跟这些东西都没关系。现在政府谈来谈去这些东西，已经没法去阻碍人类进步了。

好，这就是我们今天讲的事情。感谢大家收听，请帮忙点赞、点小铃铛，参加DISCORD讨论群。也欢迎有兴趣、有能力的朋友加入我们的付费频道。再见。

DeepSeek开源力量爆发！Flash MLA登场，英伟达的精准刀法遇到重大挑战！

Luke Fan — Wed, 26 Feb 2025 00:47:10 +0000

DeepSeek开源周第一炮打响，这次英伟达可真的有的愁了。大家好，欢迎收听老范讲故事的YouTube频道。DeepSeek号称要做开源周，也就是在这一周里边，连续5天发布5个开源项目。那么第一炮打的是什么呢？这个产品叫Flash MLA，这是一个MIT协议的开源项目。待会我们再去讲什么是MIT协议。一天上来就直接获得了几千个星星，就是你把项目发布到GitHub上以后，如果有人喜欢的话会打一个星星。打了星星以后的话，这个项目未来有各种的更新和迭代，我们是会收到通知的。所以很多的开源项目，是用星星的数字来衡量自己项目的受欢迎程度的。

这个项目呢，其实对于绝大多数的使用者来说，短期之内是不会有影响的。什么叫短期？可能就是几个月的时间之内，不会有特别大的变化。但是，可能过了这几个月，这个变化就会逐渐的显现出来。英伟达这次到底能不能挺得住，是会变得好还是会变得坏？这就是我们今天要讲的故事。

英伟达面对Flash MLA这样的一个项目呢，应该有点哭笑不得。为什么呢？这个是必须在英伟达Hopper系列芯片上使用的一个技术，也就是离开英伟达芯片你跑不了。所以这玩意是给英伟达芯片再去做优化。但是呢，这里有个问题，英伟达的H100是被美国禁运的，中国是不可以购买的。中国只可以购买H800，也就是英伟达经过精准的刀法裁切以后的这个版本。它在H800的这个基础上呢进行了提速，这就是这一次的Flash MLA真正给出来的东西。

理论上的H100应该也可以提速，因为它都是Hopper的架构嘛。但是英伟达现在正在推的GB200，它就不是Hopper的这个架构了，它呢是Blackwell黑景架构的。那么在这个上面就不起作用，或者说没有经过Blackwell芯片的这种兼容性测试，不知道在车上好不好使。这种GB200的芯片，第一个现在到底有没有交货，或者交了多少了，其实谁也说不太清楚。

虽然这个山姆奥特曼说：“我在微软机房里看到了。”但是没有那么大的感觉说，这个东西真的改变了什么。第二个呢，就是中国不允许买嘛。既然不允许拥有GB200，那我凭什么去给GB200做优化？即使DeepSeek手里边有一些GB200，我做了优化了，那我也不能说出来。我不能告诉你说：“我偷了一个这玩意回来，我优化了再给你公布出来。”这个与理不合，对吧？这就是对于英伟达的一个小影响。这个东西上来以后，大家没有那么踊跃的去买GP200了，他还接着去买H100、H800去了。

还有一个问题是什么？就是H800的越狱的问题。美国政府限制的是什么呢？你这个东西算力有多少他其实不管，他主要管的是内存带宽，也就是GPU的芯片，跟GPU的这个HBM内存之间，每秒钟到底可以传多少数据。它是限制了这个东西。对美国政府给出的限制呢，是2000GB每秒，也就是两T每秒的这个速度。H100呢是3.35TB，肯定是已经超过了。H800呢，老黄精准一刀，它就是2TB的。虽然有的时候可能大家跑不到，但是人家的标称就是两TB，是符合出口要求的，可以卖给中国。现在上了Flash MLA之后，它的速度就提高到了3TB，这个就稍微有一点点尴尬了。这个以后到底还能卖还是不能卖，还是怎么办？我估计够老黄头疼一阵了。这个是为什么说，英伟达遇到了这样的一个Flash MLA以后，稍微有一点点哭笑不得。你确实给我的显卡做了提速了，但是提速完了以后呢，不太符合某些规定了。

那么说到这了，Flash MLA到底是什么？咱们这一块要后说，因为呢可能很多听故事的人，对于这一部分就没有那么大兴趣了。咱们尽量用简单的方式来讲。这个东西呢全称呢，叫高效多层注意力解码内核。这个名字反正有说没有懂，每个字都认识，放在一块不知道什么意思。他呢其实干了三件事。第一件事呢叫分页式间值缓存，这意思是什么呢？就是我们在内存里有很多的数据，本来我要去读这些数据的时候呢。

应该是叫随机读取。就是我得到一个地址，然后我到这个地址上，把这个数据读出来或者写进去。但是这样的话效率就会很差，为什么？因为你这个内存很大嘛。而且我今天分配了一块内存，待会我把这个内存释放掉了。如果是随机的去做的话，那就会出现很多碎片，不连续的这种内存会存在里头，这个会降低读写的速度。

Flash MLA说，咱们这样：以64个内存单元为一个页面，咱们进行分页管理。每一次我就不再分给你具体的多大多小的，我就是按多少页给你分。我想要多少字节的内存，或者多少位的内存，我原来是可以随便分的，现在不行，必须是64个数一页，你必须按整数页分。他用了这样的一个简单的方法，就可以极大的提高内存的分配、释放的效率，以及读写的效率，还可以极大地降低显存碎片的产生。就是你再产生碎片，也是64个数放在一块的一个碎片。这个对于未来的这种使用，就会方便很多。因为碎片这个东西有时候很讨厌，比如说我现在有一份文件，我这份文件的前5页存在一个地儿了，后3页存在一个地儿了，中间几页我再存在一个地儿了。等你需要取这数据的时候，要上三地去把这数据取出来，那这事不就费劲了吗？现在说，哎，我按整页算，哪怕你用不完我浪费一点，剩一块不要了没关系，但是我每次分配、每次释放都是一整页。那这个就是大家理解的，他干的第一个事。

第二个事是干嘛呢？他做了一个叫BF16精度的一个知识。咱们看很多的这种大模型，后边都是有一数，都是FB什么FB什么，FB32、FB16、FB8，甚至还有FB4的这样的数据。但是这一次呢，他玩了一个叫BF16，什么意思？咱们正常情况下呢去训练大模型都是用一个完整的浮点数，就是FP32。什么意思呢？f呢就是float，P呢是point，浮点32意思就是说，我这一个数是一个32位的一个空间。32位就是32个010101，这样放在一起这是一个数。在这个数里头呢有一位代表正负，有8位呢是代表指数。

剩下的23位代表的是精度。我们写很多的叫科学计数法，都是先是正的或者负的，然后是3点多少多多。这个是长度代表精度的，小数点后边越长，你精度就越高。最后乘上10的多少次方，一般代表浮点数是这样来写的。后边有8位是代表10的多少次方的，这个东西叫指数。有23位是代表精度，也就是点后边有多少位，再加上一个正负，这就是传统的FP32。

正常的一般使用的是FP16。就是你都用FP32去使用的话，等于你每一次进行比较，进行搬运，进行运算都很慢，而且非常非常消耗资源。所以呢，很多时候，这个大模型工作是工作在FP16的这个基础上的。FP16什么意思呢？它这个里头还是有一位是代表符号的，代表精度的是有10位，代表指数的有5位。这个呢就会发生一个问题，就是它的精度降低了。FB32那个是有23位代表精度的嘛，那这个只有10位了。还有一个很大的问题是什么呢？就是它的范围变小了。什么叫范围？就是乘以10的多少次方，这个数是它的范围。原来呢（FB32）是有8位来去代表范围的，现在呢（FB16）只有5位了，使得很多的模型的规模就会受到限制。

那么这一次呢，DeepSeek给出了这个东西叫BF16。它们呢使用的是什么？就是它的指数依然是8位，跟FP32这个是一样的。还有一位是代表符号，这个正负你必须还得留着。剩下的呢就剩的就比较少了，他只有7位来去代表精度。所以他把精度降低了，但是呢指向的这个数据范围，其实跟FP32是一样。它是通过这样的一个方式，让这个大模型可以在精度下降，但是呢指向范围不变的情况下去进行运作，效率有极大的提升。

这是第二个。第三个是什么呢？就是叫分块调度与并行计算。将计算任务分解为多个小块，进行并行处理，充分利用GPU的并行计算能力，提升吞吐量。这个就是刚才我们讲的3TB每秒的，这个GPU跟显存之间的带宽，就是从这里来的。实际上这一次主要就是给了这么三个东西。那你说这个东西算不算创新呢？

每一次中国人给出东西来，一堆人说：“哎呀，这个创新了，这个抄袭了。”首先要讲说灵感来自于叫Flash attention 2和3，以及有一个叫COT LASS这样的两个论文，或者两个开源项目，叫CUDA-LESS。CUDA-LESS应该也是CUDA上面做的一些什么优化的这种东西。这两个项目呢，是英伟达自家的开源项目，就是英伟达自己就把它开源了，然后也是MIT协议。咱们现在讲一下MIT协议什么意思，叫允许用户自由使用、修改和分发代码，但是需要在修改后的代码中或者软件中保留原来的许可声明。就是你可以拿着代码回来改，也可以自己去用，自己去分发，但是呢，我原来声明了，说我这是一个MIT的项目，你在新的软件里你必须要留着它。这一次的Flash MLA也是一个MIT协议的开源软件，所以呢它是完完全全符合开源规范和道德的一种创新。就是我从哪来的，引用写好了，我在这个基础上遵守原来的协议，我又把它开源了，大概就是这样。

那么说个人话吧，讲了这么半天这东西到底干什么呢？这数据到底怎么算呢？估计大家稍微有点头晕了，咱们讲一故事。比如说吧，有一家这个跑车的公司，我造跑车的，我出了很多很多的手册，告诉你这个跑车应该是怎么去做的，然后有哪些参数可以调整，如何去优化。有一大堆的修车厂，这些修车厂或者叫改车厂吧，他们呢会使用这些手册做一些车厂允许或者不允许的改装。你只要到改车厂了以后嘛，肯定有一些修改是超出车厂允许范围之外的，这个没有办法。修改完了以后呢，突然有一家特别大的这个改车厂决定把自己改车并且夺得冠军的方法给公开出来，这就是我们今天看到的东西。他们现在使用的Flash MLA这个东西，已经在这个DeepSeek自己家的服务器上得到验证了，说这东西确实好用，然后把这个拿出来了。那么其他改车厂呢，就可以拿着这个已经公开出来的这个标准继续跟进，接着往前跑了。现在麻烦是什么呢？

第一个修改方案是针对旧发动机的修改方案，那么它影响了新发动机的销售。然后，第二个方案在优化之后，与某些交管部门的规定相互冲突了。这就是这一次Flash MLA发布对于英伟达可能的一些影响。

那么，谁会用这个玩意呢？就是这个Flash MLA到底对什么样的系统有帮助？它主要是用于推理的，不是用于训练的。所以呢，它主要是优化VMRM系统，或者叫高效的大模型推理架构。像我们使用的各种聊天系统，实际上背后你都是要有一套这种推理架构，然后再去挂模型才可以用起来。包括像Mistra、XAI这样的，它们背后都是要有这样的推理架构的。

然后，一些小型的LM推理架构呢，可能也会有提升。比如像Huggingface、Transformers或者是Llama CPP，这些小型的系统应该也会得到优化。优化了以后的话，在原来的H系列的GPU上，甭管你是H100还是H800，你都可以极大的提升效率。

那你说对于国产和非英伟达系列的芯片，会不会有提升呢？很多人再去讲说英伟达的垄断被打破了，这个国产芯片看到机会了。首先咱们要讲思路可以借鉴，就是他给了你这样的一个思路。但是呢，要注意Flash MLA是基于CUDA干活的。前面他引用的说我借鉴了谁呢，也是借鉴了英伟达根据CUDA去做的一个开源项目的这个思路，在这个地方修改的。所以直接用是用不了的。

这周应该还会有很多有趣的东西要发布，通过开源的方式不断的打破封锁，打败这个精准的刀法。这就是我们这一周有可能会看到的东西。那么精准的刀法是怎么起作用的，大家知道吗？肯定呢是有大量的门会要关上，就是我设计这个项目的时候，里面一定有很多的开关和门。那我关上其中一部分的门，就可以实现刀法精准了。但是呢，大家去设计这个系统的时候，他不是为了关门设计的，还是为了提高效率设计的。所以有很多的论文开源项目，他都会去讲说我这个东西当时是怎么设计，为什么就能够提效。

这些东西都是公开的。大部分人其实是不会去读这些文档，即使是读了这些文档，也没有能力自己去修改这个东西。就像我们比如去买车，买完车的时候人家告诉我，这个发动机最高可以到什么样。或者说我去买这个电脑，人说这个电脑可以超频，可以去加液冷，可以进行改机，爆改都可以。但是我们谁真的买回电脑来去改吗？其实很少有人改这东西。但是总有一些人说，我们就去给你爆改电脑，给你个电脑CPU超频，给你去做这样的事情。做完了以后，我还给你公开出来，这个东西到底是怎么改的。

在最后呢，跟大家分享一个小故事吧。好会计和律师分几个阶段，可以去思考一下现在Deepseek在里边能够站到哪一位置。为什么讲会计和律师呢？都是在规则之下去工作的。他们在规则之下工作，但是呢又会不断的去接触很多灰色的东西。第一类就是最差的是什么呢？自己也搞不明白各种规则是怎么回事，还在这儿不懂装懂。其实大量的会计跟律师都是在这个层次上，就是你所有看那个说话特别强硬的，这种会计和律师，他一般都是掩盖他们自己的无知的。第二类呢就是自己也搞不太明白，但是呢还是愿意承认的，说这个事我可能稍微差一点，那个事可能也差一点，我们可以去问一下谁，或者怎么去讨论一下。我们见过的比较好一点的律师和会计呢，都是这样的，他不会把任何话给你说满。然后第三个是什么呢？就是相对来说要明白一点了，但是呢只会刻板办事，规定就是这样的，我不能给你改，那那个地方就是这样规定的，我不能给你动。再往后呢就是很明白了，而且可以利用各种规则的边缘，解决问题了。这个就是我们认为比较高端的会计师和律师了。当然最高端的是什么样呢？就是我不但可以利用这些规则把问题解决掉，还可以公开标准，修改和优化规则。这个是最高一级的。现在DeepSeek就已经站到最高一级了。这只是DeepSeek 5天开放周的第一天内容，让我们进一步期待这一周后面的四天到底都开源出。

一些什么东西出来。如果有一些比较有趣的，我自己还能讲得明白的，我会继续跟大家分享。好，这一期就跟大家讲到这里。感谢大家收听，请帮忙点赞、点小铃铛，参加Discord讨论群，也欢迎有兴趣、有能力的朋友加入我们的付费频道。再见。

【独家剖析】最高或被罚27亿美元！英伟达在华遭遇反垄断调查的台前幕后，一场AI芯片领域的国际博弈

老范讲故事 — Wed, 11 Dec 2024 00:45:16 +0000

英伟达突然被中国进行了反垄断审查，这事他冤吗？大家好，欢迎收听老范讲故事的YouTube频道。今天咱们来讲一讲，这家AI时代最赚钱的公司，在中国突然遇到审查了，究竟是怎么回事？

首先呢，英伟达不光是在中国受到审查，欧盟和美国也在对他进行反垄断审查。法国呢，主要是在今年7月份，对他去投资一个叫Coreweave的公司进行审查。Coreweave干嘛的？他是买了很多的英伟达的显卡，去做算力中心出租的。你说OpenAI，我用微软的就行了，或者谷歌用自己的，亚马逊也用自己的，但总还有一些小一点的公司说，我们想要零散的去租一些英伟达的算力，去进行模型的训练、微调或者推理。Coreweave就专门干这个的，而且他应该是在这一块做了最大的一家，英伟达在里边进行了大量的投资。法国政府说，我调查一下你里头有没有一些其他的问题。

12月7号呢，欧盟也展开了对英伟达的反垄断审查。审查的是什么？叫捆绑销售，就是你买了英伟达的算力卡，你必须要再买我其他的哪些东西。这个其实跟这一次中国对英伟达展开的反垄断调查基本是一个原因。美国商务部呢，对英伟达是提出了质询，但是呢并没有正式立案。原来呢讲说美国商务部对英伟达立案进行反垄断审查了，英伟达呢出来辟谣了，说他们质询了，我们愿意配合调查，我们有信心，完全都是开放的。大家选择我们的产品，是因为我们的产品质量好，因为我们的产品性能好，而不是因为我们进行了捆绑销售。

这块呢是美国也没消停，现在呢中国说来，咱们也调查一下。这次中国的反垄断调查的原因具体是什么呢？首先公开的原因，大家猜测的原因咱后讲，先讲公开的。2019年，英伟达收购了一家以色列公司，叫麦洛斯。当时呢到中国来进行审核，中国说我同意吧，但是呢我有些附加条件，你只要遵守这些附加条件，我就同意。现在呢我们发现他里头有一些附加条件遵守的不够好，所以对他展开了调查。那么你说中国政府，你管得着人家吗？

人一美国公司买了一以色列公司，你在这多啥事呢？原来英伟达尝试去收购Arm的时候，中国政府也是来审批，欧盟也在这审批，美国也在这审批。那你说，美国审批一下，这是合理的，英伟达是一美国公司。欧盟呢，至少英国吧，英国人家审批是合理的，英国不算是欧盟里面的。欧盟你说你去审批他干嘛，跟你也没啥关系？中国你审批他干嘛，跟你也没啥关系？

大家注意，全世界各个国家的反垄断法里头呢，都会有一些对跨国公司的审查条例。什么意思？中国的反垄断管辖权规定是这样的：两个公司合并，全球的销售额如果超过100亿人民币，在中国的销售额超过4亿人民币，你就需要到中国来审批。不管你是美国公司还是别的什么公司，只要是合并了，超过这个数，你上我这来审批一下。

很多国家实际上都有类似的法律，不是说你这个收购公司和被收购公司都不在我这国家里头，或者不在我这个管辖区内，我就不管你，都是要管的。

麦洛斯这个2019年被英伟达收购的以色列公司，它到底干嘛的呢？它做高性能的网络设备，包括网卡和交换机。那你说这样的一公司，被英伟达收购下来会有什么问题呢？在收购之前，麦洛斯就已经在这个领域里头有70%的市场份额了，它本身就是一个具有一定垄断能力的公司，算是个隐形冠军。大家可能没听说过这公司，因为他们产的设备基本上是在数据中心里用，咱们家里不用这个玩意，家里边用的都是家用路由器，家用交换机，实际上家里一般都没有交换机这种东西。咱们的网卡一般都是在电脑里头直接配的，不会专门再去买网卡。

那么他为什么要在数据中心里专门去做这种设备呢？原因也很简单。我们来思考一个问题：当一个数据从一台电脑的内存到另外一台电脑的内存之间是一个什么样的过程？直接命令网卡把这东西拿走行不行？首先，这个数据在内存里，谁来命令网卡呢？CPU。CPU要去告诉网卡说，现在请到哪一块内存区间里边去取数据，取完了数据以后呢……

这个网卡通过交换机把这个数据拿走了，然后到下一台电脑里头去。再通过网卡把这个数据交给CPU。CPU看到这个数据以后说，现在请再写到哪个哪个内存里头去。大概是这样的一个过程。

但是呢，使用麦洛斯的这个网卡和他们的交换机，他就不是这么干的。他不需要经过CPU，自己网卡就找到了相应的内存区间，把那数据拿走，然后呢再通过交换机交换了以后，到下一台电脑的相应内存里，直接给你写进去了。这个过程是不过CPU的。那你说就省这么点时间有用吗？太有用了。

咱们刚才只讲的是硬件上面的这种过程，还有很多软件方面或者是权限方面的流程咱还没讲呢。有人来上我这申请数据来了，那么CPU首先要干嘛？先到这个权限库里头去看一看，他允不允许干这个事情。允许了以后，我们再把这个数据拎出来，检查一下完整性，有没有丢失，有没有错漏，然后再把这数据扔出去。

等到那边收到数据了以后，也是先看说你这个有权限没有。有了权限以后，我再在内存里头开辟一块空间，再把这个数据检查一下完整性，然后再把它放进去。为什么要检查完整性？你万一中间有坏人呢，给你混一点别的乱七八糟东西，这不就麻烦了吗？所以这个是一个完整的流程。

这个过程是很慢的。对于传统的网络系统来说，这个事可以接受，但是对于AI运算来说，这件事是完全不可接受的。你想，这个数据一开始是在哪呢？这个数据一开始还不在内存里头，这个数据一开始是在这种HBM的这种高速显存里边。正常的你要想把这个数据从这个电脑拿出来，然后拿到下一个电脑去，你要干嘛？CPU先要说，请把这个数据从这个HBM里头拿出来，放到内存里，再进行权限审核、数据完整性检查，然后再告诉这个网卡说，你现在可以拿数据了。

等到那头也是一样，再把这个数据接收到，数据完整性检查、权限检查，放到内存里去，再告诉CPU说行了，数据完整了。CPU再拿这些数据到HBM里头去，再告诉显卡说来，接着算吧。

那这个过程是对于AI来说完全不可接受的。英伟达说，我把这些都买下来，跟我的算力卡搁在一块，咱们来进行一个整合。这样的话，黄仁勋就可以上来吹牛了：我有这么多的显卡装在一台电脑里，我把这么多的电脑搁在一起，大家可以像使用一块显卡那样去工作，不会再去说“哎，有什么权限检查、完整性检查”这些东西，直接就是把所有数据打通了。前提就是必须要有麦洛斯的所有这些设备和这些协议、软件，要一起配合，他才可以去工作起来。

在没有收购麦洛斯之前，英伟达在整个的数据中心业务里头，占比大概也就是30%。收购了麦洛斯之后，当然还要赶上AIGC的东风了，英伟达现在在整个数据中心里边的占比已经达到了80%多了，绝对是快要一统江湖的状态了。

那么，中国政府当年做出的是一个什么样的决定？说我们同意你去收购了，但是呢，我们有附加条件。哪些附加条件呢？第一个，向中国市场销售的英伟达GPU加速器和麦洛斯高速网络互联设备，不得以任何形式强行进行搭售。你不能说我买你显卡，你必须要再去买麦洛斯他们家的东西，或者我去买麦洛斯他们家的这个设备的时候，你再强制给我搭售显卡。咱们要单独买，也不得在服务水平、价格和软件能力上歧视这种单独购买的用户。你说我就买了显卡，我没有买麦洛斯他们家这个设备，我呢做了一些其他的设备在里头，你要保证你的服务是一致的。

第二个，依据公平合理无歧视原则，向中国市场继续供应英伟达GPU加速器、麦洛斯高速网络互联设备和相关软件与配件。因为后面还涉及到美国的制裁，所以这件事未必那么好遵守。

第三个，继续保证英伟达GPU加速器与第三方网络设备、麦洛斯网络高速设备与第三方的这个GPU加速器都是可以互相操作的。英伟达显卡，你可以跟别的网络设备操作，麦洛斯的这个高速网络设备，你也可以适配其他GPU。

第四个，继续保证麦洛斯网络高速互联设备的点对点通信软件和集合通信软件的开源承诺。因为大家要知道。

他需要去对内存进行这种跨机 CPU 的操作。如果我不需要经过 CPU 的这种操作的话，那么它一定会有很多的系统要跟 Linux 内核、底层操作系统内核打交道。在这一块，麦鲁斯原来有一些软件是开源的，现在你必须要继续开源，我们也还要继续用的这些开源软件，这个你也得承诺。

第五个，对于第三方 GPU 和网络互联设备制造商的信息，采取保护措施。你不能说跟你们家的设备连接了，你就把本人信息拿走了，这事不行。这是五个。据说后面还有两条保密的条款在里头。当年的这个条件也还是有一些期限的，不是无限的。这些限制条件自生效日起六年后，交易双方和合并后的实体可以向市场监管总局提出解除条件的申请。这个是2019年做的收购，2020年我们批复的，所以这个事应该是在2026年之前必须要执行。2026 年以后，他们可以来申请，问我们能不能解除。市场监管总局根据市场竞争状态，做出是否解除的决定。未经解除，双方应该老老实实地去履行这些约定。当时大概我们给他下了这么一个紧箍咒吧。

那么现在我们认为，这些条件他并没有去执行或者没有完全执行，所以现在对他进行调查，这是公开的理由。那么，阴谋论的声音是什么呢？第一个，中国自己想去做一些自主替代，信创产业，也就是一堆的 GPU 公司、算力卡公司，做了一大堆，包括地平线、摩尔线程、华为，这些都是在做类似的生意。但是现在因为被美国制裁，这些生意做不下去了。别看这两天地平线的股价还在涨，但是这个后面都是很难以为继的。为什么？因为他们都是做 7 纳米芯片，而这些芯片原来都是台积电代工的，包括华为的芯片，都是通过曲线救国的方式让台积电给做的。

那么现在台积电说了，因华为你骗我，其他的像什么摩尔线程、地平线这些芯片，我也不给你做了。万一我给你做完了以后，你一倒手把这芯片卖给华为了，华为就又遥遥领先了。

这事受不了。这是一个问题。第二个问题是什么呢？就是所有这些芯片都是需要配HBM的这种缓存才能去使用的。现在美国禁运了，说哎，所有这个HBM缓存中国都不许买，甭管你是什么样的公司，都不许买了。那么这些算力卡的项目在国内呢，只能是赔本赚吆喝，因为你做不出来了吧。那你说这个能不能到中芯科技那边去做去？不是完全不行，但是良品率非常非常低，这个成本价格就非常非常感人了。

还有一种声音呢，是这个英伟达最近跑到越南去做了一大堆的动作，让我们觉得稍微有一些丢面子。这是现在的两个阴谋论的声音。那么英伟达在越南到底干嘛去了呢？前两天，黄仁勋跑到越南，跟这个越南总理两个把臂言欢，跑到这个街边小摊上，喝着啤酒唱着歌。你居然可以不戒烟不封路，一个是世界上市值最高公司的老大，一个是一个国家的总理，居然就敢与民同乐去了。这个事有点太过分了，你打谁的脸呢？

英伟达在越南呢，确实还是有很多生意的。首先，英伟达的代工厂很多都在越南是有生产基地的。那你说英伟达的代工厂不应该是台积电吗？台积电是在台湾，但是呢，台积电做出来的东西就是那个芯片。你光有芯片，这个东西是不能放到这个电脑里去的，也不能放到数据中心和机房里去，都搞不定这事。你还是要把它做出板卡来，就是我们说的什么H100这个东西呢，指的是那一块卡，并不是说H100单单只是一个芯片。这个卡上还包括HBM的这种缓存，还包括很多其他辅助的芯片，这个东西搁在一起，才是可以往服务器上面去插的。

那么这些做卡的公司呢，基本上都在越南了，包括广达电脑、富士康、捷普科技、华硕、技嘉。他们主要在给英伟达做代工。这些公司里头呢，除了这个捷普科技之外，都是台湾企业。他们呢原来在大陆都是有这个代工厂的，就是以前很多这些设备实际上在大陆生产，现在呢都跑到越南去设置了代工厂。那么未来这些设备呢，就应该到越南去生产，因为大陆还是有很多禁运嘛，这个芯片不许进来，那个HBM的缓存不许进来。

你要想在这生产这个东西就比较麻烦，所以干脆咱就到越南去生产。那边是没有禁运的，咱们可以把所有的东西都汇集在一块，到越南咱们拼上就完了。

还有是什么呢？越南现在AI云计算的算力中心其实在大力兴建。很多公司都跑到越南去建这种算力中心去，第一个叫阿里云，第二家呢华为云，第三个亚马逊，然后微软、谷歌、Oracle云都在越南建立了算力中心。后边还有吗？还有腾讯云也都去了。就中国做的这种大型云计算公司，基本上都跑到越南那边去设立计算中心去了。

为什么？其实很简单，越南是可以买到不受限制的算力卡的，又离中国相对来说比较近。当我们有一些什么样的算力需求的时候，直接调用越南的算力中心的这些资源，就可以去进行运算了，这不就够了吗？

而且越南跟印度、墨西哥这种国家比，还有一个巨大优势是什么？越南他有电，不是自己发电，因为越南离中国近，所以他直接向中国买电，中国就直接可以把电线拉到越南去。你就可以用着中国的电，为中国的企业提供算力支持了。

像他们这些算力中心里，什么阿里、华为、腾讯都在里头折腾，原因也很简单，就是他们有很多中国用户需要在越南进行高密集度算力的这种运算。所以呢，越南这个位置就比较得天独厚了，有需求、有电，然后所有的这些配件厂商也都在身边。台湾原来做显卡的、做这个算力卡的、做主板的，这些厂商就在身边。

然后还是CPTPP的成员国，一方面是这些设备进来是没有关税的，另一方面呢可以很方便地连接和访问美国的各种互联网服务和资源。他不像中国似的，还有一个墙的问题，他还没有这个。

至于越南还有什么其他东西呢？咱就不能胡说八道了，这个就不能讲了。英伟达到底是不是违背了当年的承诺呢？首先我们要讲说英伟达这事，他冤不冤嘛？英伟达自己讲的说，我们肯定没有违背承诺，当时承诺我们都做了。你愿意选英伟达的显卡，不选麦洛斯的这个网络设备，没问题，你可以去买；你选了麦洛斯的这个网络设备，你不选英伟达显卡。

你去选AMD的显卡也没毛病，我们都支持，这个是没问题的。因为美国现在也在查着这个事，欧盟也在查着这个事。但是英伟达有另外一个问题是什么？它叫一卡难求，大家都在这排队的。我先给谁后给谁，英伟达说了，如果你买英伟达全家桶，我就先给你卡，还有这样的一个政策在里头。

所以呢，他这一次被全世界做反垄断调查，这事呢一点都不冤枉。他确确实实是在通过一些市场领先优势地位，强迫别人去买他们家的全家桶。这个里边实际上干嘛呢？就是销售他的周边设备。原来我们经常讲，说苹果你们家内存是金子做的吗？就是这样的一个原因。说我如果买其他的这种内存放到苹果手机里头去，或者硬盘都是很便宜的。但是一旦是苹果原装出来，就特别特别贵。很多人还是会去买苹果的，这叫周边设备的捆绑销售。

像我们去商场里边买各种各样的这种电子设备的时候，他们在砍价的时候都是愿意跟你讨论的。但是呢，后边要注意，他们会想办法搭售给你一堆的小配件。那个玩意都是很贵的，而且质量未必有那么好。所以英伟达现在也在干这么个事，后边网络设备、配套的软件，甚至机架，你说我后边这个铁皮的架子，我都要全家桶一起卖给你。

所以英伟达现在干的是什么劲？一边喊着说用户选择我们的设备是因为我们设备好，另外一边呢，对于优先购买英伟达全家桶的用户，你可以提前得套显卡。他搞了这么一个事情，所以大家现在都在对他喊打。那么这个事情可能的处罚和结果是什么呢？到底咱罚他多少钱合适？

首先说很多事情，黄仁勋自己其实也决定不了。为什么呢？他的很多承诺，因为美国对中国禁运的事情，他是没法实现的。比如说你要持续的给我交付你的显卡，持续的交付你新的产品，这个事已经跟美国制裁相冲突了。所以这件事他未必能搞得定。其他的这些设备，你不是因为拿设备，你说我现在想拼这个摩尔线程的设备进去，造不出来了，这个事情跟他没关系。但是也确实是导致他实质上的一个垄断。

不是在讲英伟达自己的事情，而是这一次的调查，是中美博弈之间的一个砝码。会拖一段时间，看看后边怎么弄。那么具体罚多少钱呢？按照中国的反垄断法第58条规定，若企业在收购过程中违反承诺，且行为具有排除限制竞争效果，可能会面临上一年度销售额10%以内的罚款。咱们中国的法律呢，通常都是设一个上限。你说少罚点，没问题，咱商量，看你这个改正的效果怎么样。

当然还有一条是什么呢？这个反垄断法的第六十三条规定，违反本法规定，情节特别严重，影响特别恶劣，造成特别严重后果的，国务院反垄断法执行机构可以在本法第五十六条、五十七条、五十八条、六十二条规定的罚款数额的两倍以上、五倍以下确定具体的罚款数额。这个是什么意思呢？就是你如果太过分了，我还可以在刚才咱们讲的第58条嘛，是10%。我还可以在这个基础上，再做两到五倍的这个乘数上去。

其实呢，中国要的钱算是少的。为什么这么讲？第一个，我们是规定上限的，到头10%完了。另一个是什么呢？我们只算中国境内的销售额。在欧洲卖了，在美国卖了，不管你这些事情。欧盟当时算各种罚款的时候，经常一看罚苹果多少亿欧元，罚谷歌多少亿欧元，欧盟是按照全世界的销售额来算，这个是不一样的。

那么英伟达在中国到底卖了多少呢？2023年，英伟达在中国地区的销售额是54亿美金。如果按照顶格处罚去年的销售额的10%，再按照第六十三条乘个5倍的话，就是27亿美元，也就是去年在中国的销售额的一半。即使他吐出这些钱来，其实因为他依然是挣钱的。这就是这一次中国对英伟达进行反垄断调查到底想做什么的一个事情。

当然我们肯定希望通过跟英伟达的这种拉扯，我们也不想要他这27亿美元，看不起谁呢？我们希望还是可以让中国自己的这些算力卡厂商能够得到一定的喘息之机。大家可以说，我们把面子要了，以后我们国产替代了。你台积电是不是还给我们这个正规的，比如说摩尔线程、地平线这些公司给我生产芯片？至于华为这个制裁呢。

你别给他生产就算了。咱们大家呢，都睁一只眼闭一只眼。HBM这些芯片呢，咱们看看能不能拿一些回来，咱们接着使。这个是中国真正希望看到的。至于未来到底怎么发展呢，这个事一天两天完不了。咱们还是那句话，拭目以待。好，这个故事跟大家讲到这里。感谢大家收听，请帮忙点赞、点小铃铛，参加Discord讨论群。也欢迎有兴趣、有能力的朋友加入我们的付费频道。再见。

一年亏损50亿美元，OpenAI压力山大：再不推出GPT5，可能没有机会了——GPT-4面临Anthropic Claude 3.5 Sonnet和Meta的LLama 3.1 405b的挑战

Luke Fan — Sun, 28 Jul 2024 00:47:20 +0000

GPT5如果再不出的话，可能就没有机会了。大家好，这里是老范讲故事的YOUT5频道。今天咱们来讲一讲OpenAI现在身上的压力到底有多大。再不出GPT5，可能真的要出事儿了，因为前面吹过的牛实在太多了，特别是Sola这样的模型，号称可以直接生成长的视频出来，到现在已经半年了，还没有真正拿出来，只是每个月放出几个视频而已。而其他各个公司，按照Sora方向做的产品，已经都开始在公众测试了，这对他们来说一定是巨大的压力。

前一段时间发布的Anthropic Claude 3.5 Sonnet，也把压力给到了OpenAI，因为这个模型的效果已经非常好，而且极其便宜。更不要说昨天刚刚发布的Llama3.1405B这样的一个开源模型。前面咱们讲的Anthropic的模型还是闭源的，而Llama可是个开源模型。405B的话，在各个层次上，都赶超了OpenAI的Chat GPT-4。老大的位置有可能会丧失。

大家注意，OpenAI这样的一家公司，可能不会轰然倒下，但对于一个领域的开拓者来说，丢失老大的位置是非常非常可悲的，基本上跟死掉了没有太大的区别。所以现在对于OpenAI来说，他们最害怕的就是把老大的位置丢了。

目前的应对方式也很怪，头一天先发了GPT-4欧MINI，第二天人家Llama3.1405B就开始偷跑。是谁在偷谁的家？我们现在看到了一个叫互相偷家的故事。

就是每一边都是在对方最强大的地方打了一根钉子。GPT-4o mini是打的Llama这样的小模型。原来很多人图便宜啊，我要用这种8币的模型，用70币的模型去进行微调，去进行各种各样的定制化开发，以后满足特定场景需求。那么好了，我现在推出GPT-4o mini啊，把这个市场抢过来。这边一个嘴巴子扇过去了，那头一看说：“哎，还有这事呢，老师来，我给你上个大的。你们原来不是说大模型厉害吗？PPT4O厉害，对吧？我直接给你上一个拉嘛，3.1405B超越你的碳模型。”所以叫相互偷家。

咱们还记得谷歌I/O开始的前一天，OpenAI在干嘛吗？啊，他发布了GPT-4o 端到端的语言训练模型。其实到现在为止，我们依然没有看到端到端的语言模型。现在看到的GPT-4o 依然是啊，要给它进行语音识别，处理完了以后，再给我们念回来的一个过程。这个端到端的模型，包括加上视觉的模型这一部分，现在也没拿出来。但是，就是要赶在谷歌I/O之前发，提前一天，导致了谷歌I/O上发布的Gemini 1.5 Flash，本来是做类似事情的模型一下就显得不香了，对吧？

那么这一次呢，我们看到的是非常神奇的GPT-4o mini，应该是啊，计划好了进行发布。阿克伯格那边说：“哎，我们原来虽然没计划好，但是咱们表演一个偷家吧，直接把磁力链放到Reddit里头，就直接偷跑出来了。”所以这一次呢，应该算是OpenAI被梅塔抄了后路了。

OpenAI GPT-4o mini 这样的一个模型，最初想去偷梅塔拉嘛的，后加的时候还有后续的动作出来。这个后续动作是什么呢？免费微调啊。什么意思呢？就是我们发布的这种预训练模型，如果想让它按照你所期望的方式去工作，是需要去微调的。微调这种模型本身是比较贵的，原来 GPT3.5 和 GPT4 都是允许微调的。

这个怎么干呢？就是说你上传一个文件上去，这个文件就是我说什么你回答什么，大概是这样的一个格式。当你把这个文件上传上去以后，就可以请求这个文件给你微调一个版本出来。那么这个版本的模型，是只有你自己能用的。原来也有这样的功能，现在到 GPT-4o mini 这儿，我们不是要抢Llama 38B 这样的生意吗？来，微调免费了，至少在一段时间内，微调是限时免费的。

本身这种小模型的微调就比较便宜，GPT-4o mini 就算是过完了限面，开始收费了。它的调试成本也是相对来说比较低的，100 万 TOKEN 的调试可能是 3 美金还是 5 美金。但是微调以后的那个模型，你再去使用就要贵一些了。GPT-4o mini 正常的输出 100 万 TOKEN 是 60 美分，而微调过的版本，因为这个版本只给你一个人用或者只给你一个团队来使用，这个成本就都要你自己来承担，100 万 TOKEN 是 1.2 美金，价格翻了一倍。这就是直接放出来的价格，这就是要抄家了。

大家知道Llama3这种东西的微调成本是多少吗？你说自己有显卡啊，或者说我用谷歌的云上，谷歌云上是可以薅羊毛的啊。你是可以免费开一个云主机，快速的调完了把它关掉，这个过程是不用付钱的。咱们不去参考这个价格，咱们看看gather上的价格是什么样的啊。

Llama3.18B的模型啊，咱们不要去调那个405B啊，那个东西很贵的。咱们调这个8B的模型，100万TOKEN，10次以内的迭代。因为你微调的时候，它会让你选你到底是调几次，10次以内的迭代，5美金啊，基本上是在同样的价格。所以我也在猜测GPT-4o mini的大小，应该也就是8币9币这样的一个程度，否则的话，这个价格是没法去比对的。

因为Llama3.18币啊，输出100万TOKEN的价格大概是0.9美金，微调100万TOKEN的价格是5美金。那GPT四O Mini输出100万TOKEN的价格是0.6美金，微调的话是3美金。当然现在是限免啊。

稍微在这里讲一下微调跟RAG之间的差别。以前我们讲了很多跟RAG自我、本地知识库相关的这种知识。那么什么时候上微调，什么时候上RAG呢？举一个简单案例吧，就是现在来了一个新的毕业生。微调相当于什么呢？叫入职培训。你来了以后，我先给你做个入职培训，看到领导要鞠躬，看到客户要说，先说你好，然后呢再给你一个入职手册，先把这东西都背下来。你以后就按照这个方式去工作。微调了以后，这样的版本。

我们经过了入职培训以后的版本。你问他相关的问题，就是入职手册写过的问题，他都会对答如流，按对入职手册回答给你，没有任何问题。而且呢，按照你要求的格式来输出。看见领导鞠躬，他会干的。

微调有一个问题是什么呢？就是超出手册的东西就没有了，这就是微调干的活。那你说RAG是干什么呢？RAG相当于给你发了一本字典，你随时需要查，随时可以查。说我现在需要查一下这个问题怎么办？那个问题怎么办？你随时在字典里去查。

我们一个新员工入职了，比如某位同学大学毕业，到公司上班来了，入职培训要做，对吧？字典也要发。这就是微调跟RAG之间的关系。RAG其实对于OpenAI来说，对于Llama来说没有太大的区别，大家都可以做。但是呢，微调原来GPT这块是要贵很多的，这个模型也贵。你微调了以后，整个微调的过程也都相对来说比较贵。

现在，OpenAI就在这一块跟Llama彻底找齐了。你说我们去调那个405B去，其实意义不大。一般微调就是调小模型，你去找一个大模型出来调，这实在太贵了。咱们还是以刚才这个新员工入职的过程来讲微调。你去找一个应届毕业生，让他做新员工入职培训，这个效果是相对来说比较好的。

对，我找猎头公司，从别的公司挖一大牛回来，或者我从其他公司挖一CEO回来，让他坐在这给新员工培训，这不扯淡吗？就这样，微调大模型的效果就是这样，又费劲效果还未必好。

所以，一般微调都是调小的。那么，OpenAI到底挣不挣钱呢？今天看了一些数据，OpenAI是真的不挣钱啊。前面还有人讲说OpenAI的收入已经很厉害了，今年可以达到30亿美金了。30亿美金的收入对于很多公司来说，是完全可望而不可及的一个数字。作为一个新创建没几年的公司，能够入账30亿美金的收入，这个非常厉害。

但是，挣的多，人家花的更多。花了多少钱呢？因为OpenAI不是一个上市公司，所以大家只能去根据各种蛛丝马迹去算它到底花了多少钱。基本上算下来的，它的成本大概是80亿美金，所以它一年亏50亿美金。

这80亿美金怎么算出来的呢？每年交给微软的钱就是去买算力的钱，大概是40亿。这个是微软内部的一些人，或者说了解OpenAI向微软付款的一些内部员工透露的，这个数基本认为是靠谱。第二块是什么呢？就是OpenAI还需要购买很多数据，比如说上Reddit里去买数据，包括一些其他的数据集，去购买和清洗加工，这个钱他是要去花的。

还有一块的钱是什么呢？人家那么多新员工，对吧？现在有1500人了，而且还在快速扩张，现在还有200个职位开着，准备再接着招人呢，这个也是一大笔钱。所以呢，他现在每年的成本大概在80亿美金左右，而且这个成本还在快速上升之中。你想，他还在疯狂的招人进来，前面还吹了那么多牛皮，还没有抹上呢。你要想把前面吹的牛皮补上，要干嘛？接着开足马力训练大模型啊。

Scaling啊，scaling low啊，接着跑啊。我进一步扩大模型的规模，进一步整更多的数据，然后整更多的人回来。而且现在整个行业已经热起来了啊，他这一千几百口的人，那一定得给到比较高的薪水，比较高的这种收益才可以啊，要不然别人会挖人的。全世界都在盯着他的人吧，哪怕是一个街边扫地的。你说我在OpenAI扫过地，那其他人说我把你请回来，是不是多给你点钱啊？OpenAI的人员成本一定是不低的。

微软呢，其实已经算是对OpenAI很好了啊，为什么呢？就是微软给OpenAI机房的价格应该是一个成本价，并没有真正的按照微软云的那种啊，对外报价去找OpenAI收钱，已经算是非常非常支持了。销售呢，这个没办法，特别是B端销售，大家都有KPI，谁也不能让着谁。所以微软在B端销售上，包括在Windows客户端的Copilot的这种产品的竞争上，肯定是跟OpenAI有一定的约定的啊。B端销售各打各的，你要能卖掉是你的，我要能卖掉是我的，Windows客户端你别碰啊，这个是我的。

所以现在OpenAI只有Mac版的客户端，没有Windows版的客户端啊，那边是留给微软自己家亲儿子Copilot的。作为一个公司来说呢，微软对OpenAI已经是非常非常好了啊，那么对比起Anthropic，OpenAI算是好的。这个玩意叫不患寡而患不均，那你说Anthropic后边是谁？是亚马逊。

微软对OpenAI好，这一定要有对比，那就要对比亚马逊对Anceropic。推理成本肯定是不低的，而且Anthropic其实并没有跑那么多的大模型。新的模型训练、新的模型的推理没有做这么多，而且用户量也没有OpenAI高。可是呢，以亚马逊找Asopic收的钱是不少的。

另外一个Anthropic，如果通过亚马逊云赚到了钱，比如说我把这个产品卖掉了一些弊端的用户买了我的产品，亚马逊是要在里边抽成的。所以Anthropic跟OpenAI比起来，属于过得更凄惨一点。Anthropic收入的话，大概是OpenAI的1/5。刚才我们讲了OpenAI是30亿美金，它大概有个五六亿美金的样子吧。

因为都不是上市公司，所以大家都不会说这个事。亏损也亏，他亏多少呢？亏大概是OpenAI的一半。OpenAI大概亏50亿美金，他亏25亿美金，就是这样的一个比例。所以前面我们也讲过，Isopic现在也快玩不下去了，玩不下去的话，亚马逊可以落袋为安了。

我记得以前有一个故事，电影院想去卖饮料，怎么能够把饮料卖得更多一些呢？我把空调开的小一点，让电影院里稍微热一点，这样我就可以多卖一些饮料出去。看看亚马逊跟Anceropic之间的故事，是不是有点像这个？当然了，OpenAI现在也很渴，也需要去买饮料喝了，像微软爸爸去买，现在山姆奥特曼的应该正在努力地找钱。

愿意给钱的人肯定不少啊，这个不用担心。毕竟是开拓一个新领域里边的老大，那这个时候肯定很多人都愿意给钱。那你说愿意给钱不就没事了吗？拿着钱接着烧呗。不那么容易啊，为什么？因为你要问微软同不同意。微软占49%，给了130多亿美金进来了。你现在再找，说我让苹果给钱啊，苹果愿意给，那微软说不行啊，这个必须排他。

像我们以前签很多这样的协议，进去的时候，特别是我成为大股东的时候，一定会有排他条款的，对吧？你让我的竞争对手进去，这事不行啊。微软就是说，我虽然愿意看着你努力成长，但我也更愿意看到你落到我的口袋里，在我这再多买些饮料。我说算了，我卖身给你得了，这个也是微软乐见其成的事情。

所以并不是谁的钱他都可以去拿的。一些微软的竞争对手，比如谷歌，比如说苹果是愿意给钱的时候，他就需要做微软的工作，说求求你让他们进来吧，他就会变成这样。那么下一个问题是什么呢？到底估值是什么样的？估值涨到多少，这个事微软才能乐意啊？其实还是跟微软有关。

现在OpenAI的估值是860亿美金，这个估值是OpenAI上一次进行内部的股票兑现的时候，或者说一些内部员工股票变现的时候的估值，并不是一个正式的估值。正式的估值的话，我觉得他现在有个大概两三百亿应该是合理的。嫁一个人进来，到底按什么样的估值进去，这个就很难去平衡。为什么？因为这个数已经很大了。嫁一个人，你说我为什么进去，投资这样的公司的目的。

一定是说你以后能够长得更高啊。然后呢，你去上市，我能够啊，多少倍啊，能够退出，至少是3-5倍能够退出，因为这么高的估值嘛，承担这么高的风险，一定希望能够尽快的按更高的倍数退出。现在已经是两三千亿了，你再往上翻这个数就不好翻了。而且如果真的是几千亿的估值，又拿了钱了，你上市怎么办？股市能不能支撑得住这样的公司？几千亿美金的公司上市，还是有一些难度的。

像AM上去，也就是几百亿上去，虽然上去了以后快速在增长，但是你说我直接就是按照几千亿，没准这一轮再上去了以后，大家就希望他上1万亿美金去上市。这个纽交所也好，纳萨克也好，虽然是注册制，只要是你提交的申请文件符合格式，你就可以去上市。但是这些地方啊，这些基金们啊，因为所有的美股大量的都是基金盘，很多基金经理会去看你这个产品到底值不值这么多钱，所以这个事对于所有人来说都是很有压力的。

那么现在怎么办呢？比当前的估值直接上市也许就是唯一的解决方案了。坚持到年底，Open I的业绩还是有爆发的可能性的。于现在，大家虽然预估他一年挣三十几亿美金，这事儿是怎么算出来的呢？是他每个月大概能挣到两点几亿美金，这两点几亿美金里头大概2亿美金，是他去卖那个20美金一个月的Plus的费用，在七八千万美金吧，是卖API的费用啊。他是这样来算的。那么，为什么到年底的时候会业绩大爆发呢？咱们想一想，9月份会发生什么大事情？9月份iPhone 16发布。

iPhone 16如果发布了，虽然它的成本会进一步上升，因为所有用iPhone的至少在国外吧，就可以去访问GPT-4了。但是，另外一方面，这些用户会大批量地转换成OpenAI Plus用户。那么它的收入也会爆炸式增长一下。所以到今年年底，还可以再大涨一波。

苹果算是OpenAI的一个救命稻草。如果它能够坚持到年底，数据再大涨一波，为所有的股民展示一下未来美好的前景，然后直接去上市，这个事还是有得救的。现在行业的心态肯定也是很矛盾的，竞争跟追赶这是必须的。甭管是谷歌、Anthropic还是Meta，都是在努力的竞争与追赶。但是谁也承担不起一个后果，就是老大倒下。

这是一个全新的行业，在全新的行业里头，一旦老大倒了，对于整个行业来说都是巨大的打击。每次开新行业的时候，有几件事是比较害怕的。第一是老大废了，一旦老大废了以后，就相当于是老大证明了跑得最快的人没跑出来，拼命往前跑，跑到头上是一条死路，撞在墙上，磕地上了。那后边紧追不舍的人该咋办，这事是很危险的。

另外一个是什么呢，就是老大上市了。上市了以后，发现业绩一般，因为大家一般在上市之前会冲业绩嘛。上市了以后，你要公布财报，很多东西变成公开透明了。那么下面的人也会觉得很危险。这就是一个新行业的宿命，至少要验证行业有未来。在这之前，老大是不能倒下的。如果说没有验证，直接就趴下了。

那么，整个行业都很麻烦啊。开天辟地的这种新行业，肯定都是非常困难的。这个呢，分几种情况。

第一种情况叫大企业开创新市场。举一个案例，比如说亚马逊，开创云计算这个新市场。这就是大企业开创新市场。但是，亚马逊也很痛苦。在开始的很长一段时间里，顶着非常大的压力，再往前走，也是用了好几年的时间，才慢慢地验证了说，云计算这个市场是一个真正的方向，大家要去向这个方向前进。这是大企业开创新方向。

当然，也有走得不是那么好的例子。比如说，梅塔做的梅塔Wars，原来叫Facebook，后来改名叫梅塔。他去做元宇宙这件事呢，就不是那么好。一直到现在，虽然名字还没改回来，但他得挂在那，挂上了还没有死掉。可是，他挂在那，所有人看着。在这么大一只半死不活的尸体挂在这个枝头上，所有人在想去做元宇宙的时候，都要稍微掂量掂量。而且，现在这个枝头上，还挂了另外一颗叫Vision Pro的东西，也挂在那了。在剩下的人就在这看着，在下面驻足观望，再也没有人敢往上冲了。这就是大企业开创的两种结果：坚持到底能够成功，或者跨在上面挂着。

那么，小公司开创新天地是什么样的呢？比如说，特斯拉、SpaceX，都是一开始的小公司。马斯克冲上来说，我要开创新天地了，开创一个新赛道出来。那是什么？就是耐心的，经历很长时间的亏损，十几年的亏损，不停地融钱，所有人都不看好，独自前行，慢慢把这个项目做起来。那你说，再举个失败的例子。

失败的例子没有啊。那么是不是小企业开创新天地就都能成功？错了，你只能看到成功的，剩下的全都不见了。我们没有机会看到，所以小企业开创新天地，我们只能看到幸存者。这是一种幸存者偏差。那你说一群人一拥而上，大家看好了方向，大家全上。这种事呢，通常是发生在商业模式创新上。如果是技术创新的话，这个机会不是特别大。

这种方式呢，也有成功的。你比如像国内的千团大战，最后就跑出了像美团这样的公司；滴滴共享单车大战，最后也是跑出来一些结果，是有能成功的案例的。但是呢，也有一些最后失败的，比如像刚才咱们讲的VR，所有人都冲，最后什么也没剩下。

现在的OpenAI呢，有点儿是骑虎难下的状态。按道理说呢，它应该是小公司，独自慢慢发展。但是它一下把这个热度炒太高了，现在搞成什么了？现在搞成一群人一拥而上了。这种乱拳打死老师傅的状态呢，一定是最危险的。

所以为了稳住阵脚，现在OpenAI必须拿出重量级的拳头产品出来，也就是咱们开篇时候讲的GPT-5，一定要拿出这种产品。如果在今年年底之前GPT-5还出不来的话，它的老大位置真的是危险了。而且它一旦倒下的话，可能整个行业都要至少颤三颤。不能说整个行业会为它陪葬，但颤抖一下是跑不了的。

好，这一期就讲到这里。感谢大家收听，请帮忙点赞，点小铃铛，参加Discord讨论群。也欢迎有兴趣有能力的朋友加入我们的付费频道，再见。