<?xml version="1.0" encoding="UTF-8"?><rss version="2.0"
	xmlns:content="http://purl.org/rss/1.0/modules/content/"
	xmlns:wfw="http://wellformedweb.org/CommentAPI/"
	xmlns:dc="http://purl.org/dc/elements/1.1/"
	xmlns:atom="http://www.w3.org/2005/Atom"
	xmlns:sy="http://purl.org/rss/1.0/modules/syndication/"
	xmlns:slash="http://purl.org/rss/1.0/modules/slash/"
	>

<channel>
	<title>算力芯片 &#8211; 老范讲故事｜AI、大模型与商业世界的故事</title>
	<atom:link href="https://lukefan.com/tag/%e7%ae%97%e5%8a%9b%e8%8a%af%e7%89%87/feed/" rel="self" type="application/rss+xml" />
	<link>https://lukefan.com</link>
	<description>这里是老范讲故事的主站，持续更新 AIGC、大模型、互联网平台、商业冲突与资本市场观察，帮你看清热点背后的底层逻辑。</description>
	<lastBuildDate>Mon, 15 Sep 2025 10:56:18 +0000</lastBuildDate>
	<language>zh-Hans</language>
	<sy:updatePeriod>
	hourly	</sy:updatePeriod>
	<sy:updateFrequency>
	1	</sy:updateFrequency>
	<generator>https://wordpress.org/?v=7.0</generator>

<image>
	<url>https://lukefan.com/wp-content/uploads/2026/03/cropped-jimeng-2026-02-28-5245-用图一的人物形象，替换图二中的人物，使用图二的风格。文字替换：老范讲故事，Yo-32x32.jpeg</url>
	<title>算力芯片 &#8211; 老范讲故事｜AI、大模型与商业世界的故事</title>
	<link>https://lukefan.com</link>
	<width>32</width>
	<height>32</height>
</image> 
	<item>
		<title>一天首富体验卡背后：4450亿合同多数2027年才兑现，86%负债率的豪赌是新神话还是史上最大泡沫？｜OpenAI、3000亿美元交易、云计算、合作伙伴关系</title>
		<link>https://lukefan.com/2025/09/15/oracle-openai-rpo-ai-cloud-surge/</link>
		
		<dc:creator><![CDATA[Luke Fan]]></dc:creator>
		<pubDate>Mon, 15 Sep 2025 10:56:18 +0000</pubDate>
				<category><![CDATA[AIGC]]></category>
		<category><![CDATA[AI泡沫]]></category>
		<category><![CDATA[AI算力]]></category>
		<category><![CDATA[IOE时代]]></category>
		<category><![CDATA[OpenAI合作]]></category>
		<category><![CDATA[Oracle云计算]]></category>
		<category><![CDATA[Oracle数据库]]></category>
		<category><![CDATA[Oracle股价暴涨]]></category>
		<category><![CDATA[RPO]]></category>
		<category><![CDATA[XAI]]></category>
		<category><![CDATA[世界首富]]></category>
		<category><![CDATA[云计算]]></category>
		<category><![CDATA[人工智能]]></category>
		<category><![CDATA[企业软件]]></category>
		<category><![CDATA[储能产品]]></category>
		<category><![CDATA[剩余履约义务]]></category>
		<category><![CDATA[博通]]></category>
		<category><![CDATA[去IOE]]></category>
		<category><![CDATA[埃隆·马斯克]]></category>
		<category><![CDATA[拉里·埃里森]]></category>
		<category><![CDATA[擎天柱机器人]]></category>
		<category><![CDATA[数据库迁移]]></category>
		<category><![CDATA[星际之门计划]]></category>
		<category><![CDATA[特斯拉]]></category>
		<category><![CDATA[百度昆仑芯片]]></category>
		<category><![CDATA[科技公司负债率]]></category>
		<category><![CDATA[科技股]]></category>
		<category><![CDATA[算力芯片]]></category>
		<category><![CDATA[美股分析]]></category>
		<category><![CDATA[股票回购]]></category>
		<category><![CDATA[自研芯片]]></category>
		<category><![CDATA[芯片定制]]></category>
		<category><![CDATA[英伟达]]></category>
		<category><![CDATA[财务造假历史]]></category>
		<category><![CDATA[阿里云]]></category>
		<guid isPermaLink="false">https://lukefan.com/?p=2531</guid>

					<description><![CDATA[🔥81岁老头首富体验卡到期！6小时首富游，我笑裂了！🤯

家人们！Oracle股价原地起飞，拉里·埃里森81岁高龄坐上首富宝座——结果第二天就溜了？！就6小时！首富の一日游实录👉马斯克：这波我先撤，特斯拉股价默默反超😂

真相炸裂：靠4450亿美金“未来收钱合同”（RPO）吹爆！OpenAI承包3000亿，老头持股41%直接躺赢💰但负债率86%？！利息比我的奶茶钱还贵（每月一杯芋泥波波警告）！更离谱的是——Oracle云永久免费！我博客@lookfan.com就挂它家，白嫖党狂喜，一杯奶茶钱跑两台主机，真香到哭😭

AI泡沫要炸？TOKEN烧钱速度几何级暴涨，但收入？呵呵…OpenAI挣得越多亏得越猛！ TOKEN黑洞+中国开源模型搅局，这波韭菜割到银河系🌌

💥灵魂拷问：你信AI能撑到2027年？还是等泡沫炸了捡漏？速评！点赞过万拆解“星际之门”骗局（划掉）神操作👇
#科技吃瓜 #AI泡沫 #首富凡尔赛 #男生理财日记 💻🚀

一天首富体验卡背后：4450亿合同多数2027年才兑现，86%负债率的豪赌是新神话还是史上最大泡沫？｜OpenAI、3000亿美元交易、云计算、合作伙伴关系

甲骨文创始人一日首富的背后，是一份与OpenAI签订的价值数千亿的未来云计算交易。本文深度剖析其财报魔法RPO的真相，回顾这家科技巨头在人工智能(AI)浪潮中的惊人转型，并探讨这场由“星际之门”计划引爆的算力军备竞赛，究竟是机遇还是泡沫。]]></description>
										<content:encoded><![CDATA[
<figure class="wp-block-embed is-type-video is-provider-youtube wp-block-embed-youtube wp-embed-aspect-16-9 wp-has-aspect-ratio"><div class="wp-block-embed__wrapper">
<iframe title="一天首富体验卡背后：4450亿合同多数2027年才兑现，86%负债率的豪赌是新神话还是史上最大泡沫？｜OpenAI、3000亿美元交易、云计算、合作伙伴关系" width="900" height="506" src="https://www.youtube.com/embed/uFH2kpAVOrA?feature=oembed" frameborder="0" allow="accelerometer; autoplay; clipboard-write; encrypted-media; gyroscope; picture-in-picture; web-share" referrerpolicy="strict-origin-when-cross-origin" allowfullscreen></iframe>
</div></figure>



<p class="wp-block-paragraph">大家好，欢迎收听<a href="https://youtube.com/@StoryTellerFan" target="_blank" rel="noopener">老范讲故事的YouTube频道</a>。</p>



<p class="wp-block-paragraph">Oracle突然暴涨，Oracle创始人拉里·埃里森在世界首富的位置上坐了一日游，突然成为首富，超过了埃隆·马斯克。其实不到一天就又掉下来了，比马斯克稍微少那么一点点。因为到第二天呢，Oracle的股价下滑了应该是6%吧，马斯克的特斯拉股价在上升，因为马斯克也在说一些话嘛，大家都在画饼。</p>



<p class="wp-block-paragraph">欧美股市，特别是美国股市，跟中国股市有一个特别大的区别，就是中国股市呢，比较相信一些这种短期内的，比如说你的业绩很好。美国股市呢，会比较相信你未来三到四年的以后的一个想象空间。如果你说我未来两三年，有一个大家都能看得懂、都能够理解的方式，能够赚一大笔钱，它就会涨上去。所以Oracle的暴涨呢，就是这样的一个逻辑。</p>



<p class="wp-block-paragraph">它公布了一个什么东西呢？叫RPO 400。RPO呢就是未来的一个已经签好的合同，未来的一个收益，这个是4,450亿美金，已经远远超出了它现在的这种营收。那这个4,450亿美金里头呢，OpenAI占了3,000亿，剩下的呢应该是XAI和字节。</p>



<p class="wp-block-paragraph">拉里·埃里森呢是Oracle的创始人，现在呢应该是CTO，他的首席技术官。他CEO呢是有另外一个人再去担任，他在二零一几年的时候就已经从CEO的位置上退下来了。所以81岁的老头不是CEO。马斯克成首富也好，拉里·埃里森成首富也好的原因其实都很简单，就是持股比例巨大。他超过马斯克的时候，整个的Oracle市值也不到1万亿美金，但是呢，拉里·埃里森个人持股41%，直接就奔着首富就去了。</p>



<span id="more-2531"></span>



<p class="wp-block-paragraph">那啥是RPO呢？这个呢叫剩余履约义务。这个就是什么意思？你签了合同了，但是我还没有履约，还没有给人提供服务呢，这个东西呢叫做RPO。那你说我提供了服务还没收钱的，那东西叫应收账款，就不叫RPO了。2018年呢这个制度才开始有，以前是没有RPO这种东西的。2018年全面实施的美国会计准则和国际财务报告准则里边要求必须要去披露RPO。</p>



<p class="wp-block-paragraph">它要求什么呢？你必须要披露金额和构成。这个金额里头包括两种，一种叫已开票的延迟收入，应收账款也是写在这里头的；然后包括未开票但是已签约的收入，我还没有给你开发票呢，但是呢我合同签了，这个也算在里头。但是呢哪一部分是多少，你一定要分开了说清楚。第二个呢，你必须要说清楚时间分布，就是未来12个月的和12个月以后的，必须要分开说。你像Oracle这个RPO 4450亿里头呢，其实大部分是在12个月以后的，就2026年里头能够见着的钱其实是很少的。他甚至可能为了这笔钱，还要好好的去花一笔钱出去。大部分是从2027年开始，每年可能600亿或者几百亿美金这么收进来。然后是叫高管责任和审计要求，CEO跟CFO是需要签署声明的，保证RPO披露真实。如果发现作假，最后发现不是这么回事，最高可以判20年有期徒刑，罚款最高500万美金，这是非常非常重的一个处罚，所以一般人不敢在里头做这种假。除了CEO跟CFO签署了这个声明之外，还需要四大会计师事务所进行审计背书。Oracle的财报呢，是经过德勤和普华永道论证过，才通过SEC的审核的。</p>



<p class="wp-block-paragraph">如果完不成怎么办呢？如果是商业风险，你提前披露了，这个不需要承担任何法律责任。你像Oracle里边也写了，我们有一部分的RPO可能因为客户的战略调整而延迟。他也没说取消，就是有可能OpenAI手里的钱不太够，可能晚晚一段时间执行，但还是会有的。如果是作假的，对不起，去坐牢和罚款。</p>



<p class="wp-block-paragraph">Oracle呢是一个挺老的公司，咱们稍微回顾一下Oracle的故事。在我们那个年代呢，有三个公司是名字连在一起的，叫IOE。I呢是IBM，O呢是Oracle，E呢是EMC。一个呢是数据库巨头，一个是主机的巨头，还有一个是存储设备的巨头。特别是在2000年玩千年虫的时候，EMC一把就起来了，你必须把数据存好，要不然你的数据丢了。所以这三家呢，是当时所有系统建设里头都是离不开的。</p>



<p class="wp-block-paragraph">Oracle呢是这个里边唯一的一个软件公司。IBM虽然也做软件，但是主要还是卖主机的。当时我们接触到的这种数据库，或者这种大型的企业级数据库呢，老大就是Oracle。Oracle之外的才是一帮小兄弟们在那打来打去，但是他们几个可能加起来的份额，也就是让Oracle稍微瞅一瞅就算了。这里头可能比较倒霉的是Sybase，Sybase当时跟微软去谈了个合作，你们没有数据库，我帮你去做一下。微软就一边合作一边自己偷偷开发，把Sybase的人再挖走一批以后，做出了SQL Server，Sybase就差不多挂掉了。微软其实经常干这种事情，微软的DOS也是这么做出来的，当时是IBM委托他去开发，一开始叫PC-DOS，后来他自己做MS-DOS。后来呢微软说咱们再接着再来一次吧，IBM这个孩子就不太听劝嘛，又来了一次，说IBM咱们做图形操作系统吧，我们做OS/2，你跟我们一块去做。微软在这边给IBM合作开发OS/2的时候，自己在偷偷开发Windows，Windows啪一发布，OS/2直接死了。所以以后IBM就不再跟微软这么玩了，吃了两回亏了。</p>



<p class="wp-block-paragraph">国内的银行、电信、保险公司、医疗，绝大部分都是Oracle。如果有个别的客户说我们不选择Oracle，那会给大家带来巨大的困扰。为什么呀？因为你的程序都是拿Oracle写的，或者都是针对Oracle写的。你如果说遇到了一个别的数据库，你需要做大量的迁移，那个成本非常非常高。我们甚至遇到过一次，什么呢？就是IBM的主机装的DB2的这个数据库，IBM自己家的数据库，那费劲，我们真的是在那写了可能差不多一夏天，才把Oracle上的各种存储过程，因为它有很多代码是写在这个数据库服务器里边了，然后再重新搬到DB2上去。搬上去以后还各种各样的bug，烦死我了。所以除非是上边这个甲方拿了太多的钱了，否则他们都是会老老实实选择Oracle的，因为选择其他东西实在是风险太高。Oracle那个时候就跟现在的CUDA似的，换一个平台，整个迁移成本实在受不了。我们当时只要看到谁家的数据库选择不是Oracle，他们一定是领导拿钱拿疯了。买Oracle数据库的这帮人也拿钱，但是呢还是会有点底线的。对于Oracle来说，反正我知道你必须选我，我也不会给太多钱。但是对于IBM或者其他几个数据库公司来说，一定要给足够的钱人才会选你。就是当时就是这么一个状态。</p>



<p class="wp-block-paragraph">Oracle呢在1990年呢，其实干过一次比较丢人的事，干嘛呢？财务造假，被这个SEC罚过一次。他呢怎么做财务造假呢？当时还没有这个RPO这东西，但是Oracle的手段其实跟这一次是差不多的。他呢做了叫收入确认欺诈，将尚未提供的咨询服务确认为收入了，未签订合同的情况下直接给人开发票，虚构客户已经接受服务的证明文件，等于就好多收入是假的吧。就是1990年就被人警告过一次。然后呢做重复记账和虚假交易，同一笔销售业务重复开票，虚增收入规模。客户呢升级软件的时候，Oracle会把以前的旧合同，没有注销的旧合同，继续开这个服务发票。比如说我买了Oracle 5，你升级到Oracle 6了，原来Oracle 5的那个后续服务的发票，我又给你开出来了。虽然你钱肯定收不着了嘛，客户不傻嘛，但是发票开了呢，你也可以算应收账款，可以挂，你的股价是应该涨的嘛。而且呢他有时候对同一个收入重复开发票开好几次，就干了好多这样的事情。当时股价是暴跌了60%。但是呢在后面一段时间呢，Oracle逐渐的把Informix和Sybase干掉了，股价才慢慢起来。所以呢今天干这个事呢，Oracle 90年的时候就干过，只是现在呢有法律保障了，说你们都签过字了，这事是真的。90年的时候就属于活还比较糙，拉里·埃里森可能自己还是稍微草莽了一点吧。</p>



<p class="wp-block-paragraph">这哥们是真辍学。他跟像比尔·盖茨、扎克伯格这帮人还不太一样，这些人呢是要创业了，所以书没有读完直接就融资，直接成大老板了。这个拉里·埃里森是辍学了以后出去打零工了，实在上不下去了，四处打了很长一段时间零工了以后，才逐渐的开始写软件成为程序员，给人去写这个数据库系统。他写的第一个数据库系统是给CIA写的，当时那个项目叫Oracle项目，应该叫“预言”吧，所以后来这就成为它的正式的产品的名字。而且它推出的时候就是Oracle 2.0，还是耍了这么一个稍微的小花招。像我在2000年前后开始接触Oracle的时候呢，Oracle正好是企业软件的一个黄金时代，因为当时的甲方是大企业。</p>



<p class="wp-block-paragraph">再往后一段时间呢，互联网时代起来了，我们就轰轰烈烈的干了一啥事？叫去IOE化。那我们不要IBM，不要Oracle，不要EMC。首先IBM的服务器跟现在的互联网服务器就完全两种东西。IBM的服务器是第一很贵很大，第二个呢它里边每样东西都是成双成对的：两个电源、俩CPU，甚至CPU都是插在板上，CPU板一个板上俩CPU，插两块板，然后你随时都可以热插拔、热热换，包括网卡硬盘都是俩的。他们要求的是什么？就是不停机的时候我可以把电源换了，甚至他说我可以在不停机的情况下把整个电脑都换一遍新的，整个的服务没停下来。所以那机器奇贵无比，维护起来也很麻烦。但是你现在去看看，咱们云计算机房里的这些服务器，全都是什么刀片服务器。它的价格很便宜，没有哪样东西是双备份的，但有一些可能有双电源的，但是里头有很多东西并不要求你热插拔它，实在不行我就把这个机器整个拔下来，然后再换个新的上去就完了。后来是通过软件的问题，把不掉线可用性的问题解决掉了。我们发现这个服务器不行了，我们就可以快速的从镜像启动一台新的服务器，然后就可以把这台硬件的服务器把它干掉，重新再去维修，更换一个新的上来。所以现在的这些机架服务器是非常便宜的。哪怕你现在去买戴尔的服务器，买华三的服务器，就算是比较大的，比如24盘位这种服务器，也就是几千块钱，绝对不是当时买IBM那种几十万甚至上百万的一个价格，都两回事的东西。</p>



<p class="wp-block-paragraph">EMC呢现在更是完全没必要的东西。现在的存储完完全全不需要EMC，都是专门的硬盘阵列的这种服务器直接就挂上就完事了。而且呢都是直接通过TCP/IP走的，EMC原来做的那些自己专门做的一些私有协议，现在全废掉了，没有人用了。Oracle呢被MySQL、PostgreSQL，包括后来的一些这种非关系型数据库给替代了。因为我们并不需要你这个数据这么安全，这么复杂的相互之间的关系，我们需要的是快速的读写，可以进行多机的备份，哪怕是说错了一点没关系，它可以通过一些软件的方式把这些错误处理掉。阿里当时他们的一帮人就出来搞这个，叫去IOE化。我记得当时他们去改造的第一个项目是什么？第一个最著名的项目就是12306，买火车票的。12306的系统最早是联想给他们做的，就是IOE这套东西做出来的，然后发现根本就不行，你赶上春运，赶上所有这些大的节假日的时候，直接崩菜。阿里这帮人上来说，来我给你改吧，我们就要容忍这些错误，买错了一张票就错了呗，这有什么关系呢？原来都是这种问责体系，谁要担责任，大家就是为了自己的屁股下的位置，为了脑袋上的帽子，都是买IOE。第一个有回扣拿，还可以出国考察；第二个出了问题，你看IBM都出错了，你还能说我啥？我已经没办法买更贵的东西了。以前的大企业买单是这么干的。但是互联网化以后就不费这个劲了，说咱们这个错点就错点，我们容忍一定的错误率完事了。</p>



<p class="wp-block-paragraph">后面很多的企业订单呢，也发生变化了。企业已经不是说我自己吭哧吭哧整个做一整套系统了，现在很多的企业服务走到SaaS服务去了。这就是企业软件向互联网软件时代进化的一个过程。Oracle实际上就在这个过程中被打得很惨。</p>



<p class="wp-block-paragraph">Oracle呢去IOE化以后在干什么呢？就是疯狂的买买买模式。因为它前面挣钱挣太多了，买BEA、PeopleSoft，最后还把Sun买下来了。Oracle在上市以后这段时间里，大概进行了超过100次的并购。所以后来呢，Oracle已经从一个提供基础的数据库的公司，到了一个提供完整系统的公司，最后整个系统它替你做去，它什么系统它都有，各个行业的软件，包括医疗软件什么全全有。</p>



<p class="wp-block-paragraph">然后呢Oracle为了维持股价，为了把这个股价一直推上去，还做了一个很疯狂的操作是什么呢？就是不断的做股票回购。反正利润足够高嘛，我挣的钱很多，我就直接再把它买回来就完事了。通过股票回购呢，让拉里·埃里森手里边的持股比例从21%上升到41%。这玩意咋干的呢？就是回购股票注销掉，回购股票注销掉。埃里森自己又不怎么卖股票，他是通过这样的方式持股比例不断上升。所以Oracle股价一涨，他就成世界首富了。</p>



<p class="wp-block-paragraph">而且Oracle呢，是科技公司里负债率最高的一公司。谷歌的负债率是比较低的，只有5%。特斯拉的负债率是39.27%，作为一个做汽车的公司来说，这个是非常非常难能可贵的。原来我们讲过比亚迪大概是百分之七八十了。微软的负债率是44.51%，亚马逊的负债率是51.07%，因为亚马逊后头还有仓储物流，所以它的负债率要稍微高一些。Oracle的负债率86.33%，非常非常高。每年光利息付四十几亿美金出去。他呢很多长期债，就是我能说清楚我未来要干什么，我就借钱，借完钱回来以后呢，再借新还旧呗。他呢并购肯定是需要钱，前面做了100多次并购嘛；回购你也需要钱，我不停的去回购这些股票，我也需要钱；做云计算的机房的基础设施建设，你还是需要钱。现在呢更是名正言顺了，我要做芯片，我要买英伟达，我要做算力中心，这都是钱，所以接着借钱接着补。</p>



<p class="wp-block-paragraph">Oracle的云计算呢，算起步比较晚，他2016年才开始做云计算，但是呢足够狠。他算是海外最便宜的云，咱们普通用户上去是可以申请免费主机的，而且是永久免费主机。亚马逊你可以申请免费，但是只能使很短的一个时间。谷歌、微软对新用户的免费时间都很短。谷歌大概是每个新用户注册上去以后有300美金的额度，必须在一年之内花完。我其实有一年是花了我的那个300美金的。Oracle这个就是永远永久免费。我自己就是Oracle用户，<a rel="noreferrer noopener" href="https://xn--lookfan-jk7mu05be5jcj9b.com/" target="_blank">就是我的lookfan.com</a>的那个博客站就是在Oracle云上，那不要钱嘛，那为什么不用呢？我的Dify，N8N什么的都布在Oracle云上去，还是非常非常方便的。当然你有的时候还要稍微买点存储或者买点其他东西，我每个月可能还是要稍微付一点钱的，大概付一杯奶茶钱，挂着两台主机在那每天替我干活，还是非常非常爽的。</p>



<p class="wp-block-paragraph">Oracle呢，是所有云计算里头价格最便宜的。而且现在呢AI时代了，它的算力报价也要比别人低很多，它要比微软和谷歌的算力报价低非常多。OpenAI原来跟微软签的协议是，你必须使用微软的。后来说你看Oracle比你便宜这么多，我要用Oracle的。那微软也就只能同意了呗。最近的Oracle还逼的亚马逊进行价格调整，亚马逊现在可能叠加各种优惠券以后，它的某一类品类的这个算力要比Oracle稍微便宜那么一点点。比如说H100，亚马逊可能叠加优惠券以后比Oracle的稍微便宜点，或者基本持平吧。但是其他的A800或者A100或者什么这样的算力的话，就还是Oracle便宜。而且我看做云计算的厂商进来越晚，基础成本就越低。你像Oracle的大量主机是Arm的CPU的，它等于新买的嘛，它没有那么多的AMD CPU或者英特尔CPU的这些主机，所以它本身成本它就是比别人低。</p>



<p class="wp-block-paragraph">而且Oracle呢，现在叫符合这个时代的宏大叙事。他去参加“星际之门”计划，也在为TikTok提供服务器，还准备收购TikTok的美国业务。特朗普说我支持Oracle收购，挺好的呀。但是这部分还没有落地，我估计还要再等一等。现在呢还跑去找博通说我们定制算力芯片吧。所有云计算厂商都要去定制算力芯片。谷歌、Meta、字节跳动是现在博通已经披露的，说我们已经有三个找我订购的智谱芯片投入量产了。因为谷歌的TPU是唯一的一个自己训练出大模型的博通的芯片，其他的呢现在还没有自己训练出大模型的战绩出来。但是呢博通在这块确实是很猛，现在全世界的算力芯片里头，大概博通占10%，老大肯定是英伟达，这没什么好说的，老二是博通。谁需要，我给你定制去。博通另外一个已经签了单子的、准备量产的，应该就是OpenAI。OpenAI现在也在找博通定制它的专属的这个算力芯片吧。苹果呢现在据说已经跟博通签协议了，应该也写在RPO里头了，2026年苹果的算力芯片也会量产。前面咱们讲过，苹果跟英伟达是有夙愿的，所以苹果从来不买英伟达的东西。所以这一次呢Oracle暴涨，博通也在涨，虽然涨的没有Oracle那么夸张吧，英伟达呢当时还小幅下跌了一下。</p>



<p class="wp-block-paragraph">那你说Oracle砰砰砰涨上去了，拉里·埃里森超过了埃隆·马斯克，成了世界首富，那埃隆·马斯克也不能闲着呀。特斯拉也没闲着，赶快发布产品。第一个呢发布的是储能产品。人家讲的是什么？我们现在电网的设计是怎么设计的呢？是按照峰值设计的。最高峰要用多少电，我们就要储备多少电力，因为这东西没法存嘛。但是绝大部分时候，这个电网真正运行的效率大概只有这个峰值的可能30%、40%这样的一个水平。如果我们上了算力中心，那我们这个用电量继续上升，你只能是扩充电网。所以特斯拉说别费劲了，我给你用这个储能吧，把这个电发出来以后给你存下来，我们就不需要把电网做那么大了。等你需要有高峰用电的时候，我就从电池里头把这电给你放出来，不就完事了吗？另外一个就是擎天柱3已经定型了。原来擎天柱2就说要量产嘛，后来说不行，我们要再改一改。说现在擎天柱3已经定型了，马上就要出来大批量投产了。</p>



<p class="wp-block-paragraph">而且呢特斯拉肯定也得宏大叙事一下嘛，定制芯片去，这个也不能少了。而且大家注意，特斯拉跟XAI是定制的两个不同的芯片。特斯拉定制的芯片叫AI5和AI6。特斯拉第四代的芯片呢叫HW4，Model 3、Model Y就是HW4的这个芯片，这个芯片其实是三星给它做的。这个AI5呢是由台积电给它做，到AI6的话应该又回到三星去给它做，但是呢应该是三星在美国的工厂去给它做。XAI定制那个芯片叫X1，这个呢大概率也是三星给它做的。</p>



<p class="wp-block-paragraph">很多人就奇怪，说特斯拉你疯了吧，人家都上台积电定芯片，你咋上三星定芯片呢？而且一下就跟三星签了好多合同。原因其实也很简单，特斯拉使三星使的比较习惯。这些芯片里头，有点像英伟达的GB200长那个样子。什么意思呢？它中间有一个CPU，两边是两颗算力芯片，它是以三个芯片成为一套的。而特斯拉比较习惯使的是谁的CPU呢？他比较习惯使用三星的猎户座CPU。所以呢是三星猎户座CPU的IP再加上它自己的一个算力芯片凑在一起，去形成完整的一个算力核心吧。它的HW4就是猎户座。AI5呢因为三星的制程搞不定了，所以呢它现在使用的是RISC-V的一个CPU，跑去找台积电做3纳米代工去了。它的AI6呢又回到三星猎户座IP，接着重新让三星去代工，而且在那个时候呢应该是2.5纳米。</p>



<p class="wp-block-paragraph">算力的故事依然在延续，Oracle呢只是其中的一个环节而已。Oracle也要走AI喽，也去定制芯片喽，未来签了大单了，大概是这么干的一个事情。前几天阿里股价暴涨，其实干的也是一样的事。阿里也要去定制芯片了，而且我们这次定制的芯片呢，不上台积电代工，我们在国内就可以搞定，7纳米可以搞定。博通也是这样，大家都在我这定制芯片，我的股价也暴涨。XAI哈，也准备上自研芯片，它叫X1，这个芯片应该也是使用的三星猎户座的CPU以及XAI自己的算力芯片。这个芯片应该是在三星美国的工厂去生产，而且计划采购多少呢？未来5年采购相当于英伟达H100 5,000万颗的算力。这也就是XAI自己不是上市公司了，这要上市公司的话不涨疯了。现在XAI把X收进来以后，一轮一轮往上融资，已经是把当时买Twitter的钱全都挣回来了。甚至就算是咱们很少提及的百度，最近也在宣布要去做芯片了，做那芯片叫昆仑P800。这话喊完了以后股价涨4%。只要谁喊说我们去做芯片了，我们自己自研推理芯片，这股价就往上涨。</p>



<p class="wp-block-paragraph">英伟达当然也得应对一下。英伟达的应对方式是什么呢？它发布了一个叫Robin XPU这样的这个芯片出来。它正常的应该是Robin GPU，它XPU是专门做推理的。因为呢刚才咱们讲的这些自研芯片，基本上都是专门的推理芯片，但是训练有的行，有的稍微差点意思吧，或者说跑通的不多。英伟达说算了，咱也别顶着这个GPU往前走了，GPU太贵，我们也做一个量大管饱的，我去跟你竞争一把去。所以英伟达前两天也发布了一个新的，叫Robbing XPU的一个东西。</p>



<p class="wp-block-paragraph">再往后，Oracle这次到底是不是泡沫？这可能是大家比较关心的事。这要看“星际之门”到底执行成什么样了。如果孙正义给钱，中东土豪给钱，那么这个事呢，就应该还可以往前走。但是这些钱呢，你说只记录一次，他肯定不太划算。GDP那个计算方式一样，GDP咋算的？你给我5块钱，然后呢我给你3块钱去买一什么东西，然后你再给我两块钱买一服务，这个GDP的话是需要计算十块钱的，因为它需要把所有的来回的交易都算上。“星际之门”也是这么样的一个计算方式，也是需要去运转的。所以呢这个钱进来了以后，先给OpenAI，然后OpenAI跟Oracle成立了一合资公司。Oracle提供技术，OpenAI其实也是提供技术。OpenAI去采购Oracle的服务。Oracle跟OpenAI呢，再去博通定制新的芯片，建立机房，把OpenAI的算力需求给它消耗掉。这个就算是可能转个四五圈，最后算完了一下，GDP涨好多好多，但实际上钱就是一笔钱。应该是这么去干的一个事情。所以Oracle找博通定制的芯片跟OpenAI去找博通定制的芯片可能是同一个芯片，也有可能是Oracle跟OpenAI去做的这个合资公司去定制芯片。所以每个人都可以写一遍，大家都可以股价上升，没有任何问题。</p>



<p class="wp-block-paragraph">在整个这个过程中，到底是不是泡沫呢？实际上有两个关键点。第一个关键点是初始资金到不到位。孙正义他其实也不想给真金白银，他还想拿Arm的IP去抵钱呢，因为里头都是要使一个CPU的，所以呢一般是使用Arm的CPU。至于Arm自己的这个GPU或者算力核心的这些IP的话，在这儿呢应该不是特别有竞争力。中东土豪呢大概率还是会给钱的，人家除了钱也没什么别的东西了。银行呢也愿意借钱，你只要把前面那故事给我讲圆乎了，我们也愿意借钱给你花去。而且股价涨了以后的话，你整个市值上去了，你有更多的融资空间，我也能借的到钱。特朗普呢还在让各个盟友过来投钱呢。日本、韩国肯定是投芯片了，或者投算力。日本同意了，说我们给你5,000亿美金。那孙正义说我这投的5,000亿美金，“星际之门”算不算？韩国三星电子上美国去建芯片厂，这钱算不算？如果韩国人再是拿着旅游签证进去，说进了这个芯片厂拿出笔记本开始上班的话，还是会被美国移民局冲上门把人都铐走的。所以初始资金不塌房的话，应该还是可以到位的。</p>



<p class="wp-block-paragraph">第二个问题是什么？就是最终买单的人。OpenAI今年的收入是100多亿美金，甚至是可能会超过200亿，收入涨得还很快。原因也很简单，因为AI Agent让TOKEN的消耗量飞增。原来我们跟OpenAI聊天，其实聊不出太多TOKEN来。但是现在你一旦上了AI Agent，上了上下文工程这些东西，那这TOKEN就没边了，直接就起飞了。现在呢各种的多模态的模型也绝对是TOKEN黑洞。你说我画个图、做个视频、生成的声音、做什么语音识别、图像推理什么的，那都是要烧TOKEN的。现在这个TOKEN使用的数据肯定是从几何级数数量往上涨。另外一方面呢，就是现在各行各业对AI的接受程度也越来越高了。所以OpenAI呢到2027年，在Oracle云上消耗600亿美金的TOKEN，我觉得并不是什么特别大的问题，甚至可能还不够。从TOKEN消耗的速度上来讲的话，5,000亿美金的“星际之门”算力真的未必够用。现在都开始奔着万亿或者2万亿的这个规模去画更大的饼了。</p>



<p class="wp-block-paragraph">TOKEN消耗和这个收的钱其实是两回事。因为TOKEN消耗量一边在快速上升，另外一方面呢，是TOKEN的价格在不断的下降，而且这里头还有中国的开源模型在里头不断的把水搅浑。所以OpenAI呢，消耗掉这么多TOKEN没问题，消耗掉这么多算力也没什么问题，但是OpenAI未必能挣到钱。因为OpenAI每年花掉的钱要比它挣到的钱要多很多，属于挣得越多，花的更多的这样的一个玩法。Sam Altman呢还在惦记不断的找钱，不断的融资来解决这个问题。如果他不去把自己弄塌房了，这个事情还是有可能最终会有人买单的吧。</p>



<p class="wp-block-paragraph">那你说AI大潮到底会不会回调呢？AI大潮到现在为止其实没有经历过大的回调。虽然我们看着它有涨有跌，但是呢真的没有大回调过。什么叫大回调？首先我们要承认泡沫是存在的，AI这里头一定是有泡沫，我们透支了非常非常多未来有可能的这些收入。这些收入的话，目前呢还没有办法去确认到底是怎么回来的。当然从英伟达这没毛病，大家把芯片都买走了；到Oracle这也有人去把单子签了，这都是OK的。但是这个东西到底是最后怎么为最终用户解决问题的，让整个社会的经济往上走的，这件事情现在其实谁也说不清楚。所以泡沫肯定是在。当有大批的AI公司倒闭的时候，那个时候泡沫就破灭了。咱们就要看看到底哪一天会到，可能也许在今年的晚一些时候，也许在明年的某一个时间点里头，这个AI泡沫的回调还是会发生的。我不相信这个事情会一直这么涨上去，最后肯定还是要破一下。而且呢有时候一些万众瞩目的利好最终到来的时候的话，可能也会发生巨大的波动。</p>



<p class="wp-block-paragraph">这就是我们今天讲的一个故事，Oracle快速的6小时首富游，背后大概就是这样的一个情况。</p>
]]></content:encoded>
					
		
		
			</item>
		<item>
		<title>黄仁勋AI时代英伟达GPU革命：一场市值2.7万亿美金的狂欢，COMPUTEX 2024重磅发布Blackware GPU，1.8万亿参数GPT4揭秘！</title>
		<link>https://lukefan.com/2024/06/04/%e9%bb%84%e4%bb%81%e5%8b%8bai%e6%97%b6%e4%bb%a3%e8%8b%b1%e4%bc%9f%e8%be%begpu%e9%9d%a9%e5%91%bd%ef%bc%9a%e4%b8%80%e5%9c%ba%e5%b8%82%e5%80%bc2-7%e4%b8%87%e4%ba%bf%e7%be%8e%e9%87%91%e7%9a%84%e7%8b%82/</link>
		
		<dc:creator><![CDATA[Luke Fan]]></dc:creator>
		<pubDate>Tue, 04 Jun 2024 01:02:00 +0000</pubDate>
				<category><![CDATA[AIGC]]></category>
		<category><![CDATA[英伟达，黄仁勋的故事]]></category>
		<category><![CDATA[1.8万亿参数]]></category>
		<category><![CDATA[2.7万亿美金]]></category>
		<category><![CDATA[AI]]></category>
		<category><![CDATA[AIPC]]></category>
		<category><![CDATA[AI工厂]]></category>
		<category><![CDATA[AI工厂时代]]></category>
		<category><![CDATA[AR]]></category>
		<category><![CDATA[Blackware]]></category>
		<category><![CDATA[COMPUTEX]]></category>
		<category><![CDATA[GPT-4]]></category>
		<category><![CDATA[GPT4]]></category>
		<category><![CDATA[GPU]]></category>
		<category><![CDATA[GPU技术大会]]></category>
		<category><![CDATA[GPU核心]]></category>
		<category><![CDATA[GTC]]></category>
		<category><![CDATA[H1]]></category>
		<category><![CDATA[H100]]></category>
		<category><![CDATA[MoE]]></category>
		<category><![CDATA[NVIDIA]]></category>
		<category><![CDATA[NVlink]]></category>
		<category><![CDATA[RTX]]></category>
		<category><![CDATA[scoring low]]></category>
		<category><![CDATA[SERVER]]></category>
		<category><![CDATA[stable diffusion]]></category>
		<category><![CDATA[TOKEN]]></category>
		<category><![CDATA[TX]]></category>
		<category><![CDATA[VR]]></category>
		<category><![CDATA[云计算]]></category>
		<category><![CDATA[人工智能]]></category>
		<category><![CDATA[内存]]></category>
		<category><![CDATA[军备竞赛]]></category>
		<category><![CDATA[分析]]></category>
		<category><![CDATA[参数]]></category>
		<category><![CDATA[参数量]]></category>
		<category><![CDATA[台积电]]></category>
		<category><![CDATA[合作伙伴]]></category>
		<category><![CDATA[商业]]></category>
		<category><![CDATA[垄断地位]]></category>
		<category><![CDATA[大模型]]></category>
		<category><![CDATA[工程师]]></category>
		<category><![CDATA[市值]]></category>
		<category><![CDATA[应用开发]]></category>
		<category><![CDATA[开发者]]></category>
		<category><![CDATA[微软]]></category>
		<category><![CDATA[戴尔]]></category>
		<category><![CDATA[技术大会]]></category>
		<category><![CDATA[投资人]]></category>
		<category><![CDATA[推理]]></category>
		<category><![CDATA[推理能耗]]></category>
		<category><![CDATA[支架]]></category>
		<category><![CDATA[数据中心]]></category>
		<category><![CDATA[显卡]]></category>
		<category><![CDATA[机器人]]></category>
		<category><![CDATA[机箱]]></category>
		<category><![CDATA[模型]]></category>
		<category><![CDATA[模型训练]]></category>
		<category><![CDATA[游戏助手]]></category>
		<category><![CDATA[版本]]></category>
		<category><![CDATA[生态链]]></category>
		<category><![CDATA[用户]]></category>
		<category><![CDATA[硬件]]></category>
		<category><![CDATA[科技]]></category>
		<category><![CDATA[移动互联网]]></category>
		<category><![CDATA[竞争]]></category>
		<category><![CDATA[竞争对手]]></category>
		<category><![CDATA[竞争者]]></category>
		<category><![CDATA[算力]]></category>
		<category><![CDATA[算力成本]]></category>
		<category><![CDATA[算力芯片]]></category>
		<category><![CDATA[缩放定律]]></category>
		<category><![CDATA[股价]]></category>
		<category><![CDATA[能耗]]></category>
		<category><![CDATA[芯片]]></category>
		<category><![CDATA[英伟达]]></category>
		<category><![CDATA[苹果]]></category>
		<category><![CDATA[行业秘密]]></category>
		<category><![CDATA[计算机]]></category>
		<category><![CDATA[计算机大会]]></category>
		<category><![CDATA[训练能耗]]></category>
		<category><![CDATA[设计]]></category>
		<category><![CDATA[谷歌]]></category>
		<category><![CDATA[贷宽]]></category>
		<category><![CDATA[超威]]></category>
		<category><![CDATA[车载芯片]]></category>
		<category><![CDATA[软件]]></category>
		<category><![CDATA[铁皮]]></category>
		<category><![CDATA[黄仁勋]]></category>
		<guid isPermaLink="false">https://lukefan.com/?p=1286</guid>

					<description><![CDATA[大家好，欢迎收听老范讲故事YouTube频道。今天，咱们来讲一讲黄仁勋在COMPUTEX上的狂欢。COMPUT ... <a title="黄仁勋AI时代英伟达GPU革命：一场市值2.7万亿美金的狂欢，COMPUTEX 2024重磅发布Blackware GPU，1.8万亿参数GPT4揭秘！" class="read-more" href="https://lukefan.com/2024/06/04/%e9%bb%84%e4%bb%81%e5%8b%8bai%e6%97%b6%e4%bb%a3%e8%8b%b1%e4%bc%9f%e8%be%begpu%e9%9d%a9%e5%91%bd%ef%bc%9a%e4%b8%80%e5%9c%ba%e5%b8%82%e5%80%bc2-7%e4%b8%87%e4%ba%bf%e7%be%8e%e9%87%91%e7%9a%84%e7%8b%82/" aria-label="阅读 黄仁勋AI时代英伟达GPU革命：一场市值2.7万亿美金的狂欢，COMPUTEX 2024重磅发布Blackware GPU，1.8万亿参数GPT4揭秘！">阅读更多</a>]]></description>
										<content:encoded><![CDATA[
<p class="wp-block-paragraph"><br></p>



<figure class="wp-block-embed is-type-video is-provider-youtube wp-block-embed-youtube wp-embed-aspect-16-9 wp-has-aspect-ratio"><div class="wp-block-embed__wrapper">
<iframe title="黄仁勋AI时代英伟达GPU革命：一场市值2.7万亿美金的狂欢，COMPUTEX 2024重磅发布Blackware GPU，1.8万亿参数GPT4揭秘！" width="900" height="506" src="https://www.youtube.com/embed/AOpATS-sitc?feature=oembed" frameborder="0" allow="accelerometer; autoplay; clipboard-write; encrypted-media; gyroscope; picture-in-picture; web-share" referrerpolicy="strict-origin-when-cross-origin" allowfullscreen></iframe>
</div></figure>



<p class="wp-block-paragraph">大家好，欢迎收听老范讲故事YouTube频道。今天，咱们来讲一讲黄仁勋在COMPUTEX上的狂欢。COMPUTEX是一年一度在台湾举行的计算机大会。黄仁勋，作为现在真正AI时代的当红炸子机，可能是唯一靠AI赚了大钱的人。虽然微软也在赚钱，但是微软整个靠AI挣的钱并没有那么多。真正靠AI赚了大钱的公司只有他一家——英伟达。刚才我看了一下，英伟达现在市值2.7万亿美金。大家知道，再往前就是微软的3.2万亿，第二名是苹果，2.9万亿，还差那么一点点。可能稍微一哆嗦，英伟达就有可能成为世界第二市值的公司了。那么，黄仁勋上面都讲了什么呢？作为网红，肯定还要先暴露一下行业秘密，别人都不知道他知道的事情。上来先说一下他现在讲的是什么——就是GPT-4到底有多少参数。GPT-3.5大家知道是1,700多亿参数，就是一个170多亿级别的模型。但是到GPT-4的时候，OpenAI就再也没有出来说它到底有多少参数。很多人说你是不是超过万亿了，对OpenAI来说，这个数据不是很准确。我来辟谣了，但是具体有多少，从来没有讲过。黄仁勋在前面的GTC，就是GPU技术大会上，每年一次的英伟达自己的开发者大会上，上面也讲了……</p>



<p class="wp-block-paragraph">说起来1.8T，这个1.8T指的是什么呢？其实就是1.8万亿参数，而且它是一个Moe模型。当时OpenAI并没有对此多说什么，但这一次，在《Computer Text》上，他们又反复强调了这个事情，明确指出GPT-4的训练参数达到了1.8T。这让人们意识到，想要达到GPT-4的水平，还有很长的路要走。尽管现在大家都在努力研发号称能达到或接近GPT-4水平的模型，比如几百亿参数的模型，比如梅塔的拉马3可能会有一个400亿参数的模型，国内也出现了很多一两百亿参数的模型。但事实是，即使提到的1.8T参数，如果考虑到是Moe模型，分成八份来看，那么单个模型可能也就相当于200多亿参数的水平。</p>



<span id="more-1286"></span>



<p class="wp-block-paragraph">这次先通过揭示现状，然后发布新GPU，但对于具体数据——多少核心、多大算力、内存多大、带宽多少，人们似乎已经感到麻木。现在大家更关心的是，如何将这些GPU有效地集成起来，如何把它们拼装成服务器，以实现更强大的计算能力。这背后的提升，不是5%或10%的增长，而是几倍的飞跃。这成了技术关注的新焦点。</p>



<p class="wp-block-paragraph">如何装到机房里头，统一为别人去服务，这个是现在大家更关心的事情。所以现在呢，他们发布的叫Blackware GPU，而且，它取出来那个板子上是两块GPU和一个CPU，应该是他们自己做的CPU。这是一整块，然后可以装到一个大的服务器里面去。再把这些服务器堆叠在一起，使用它的NV link，让这些GPU可以像一块完整的GPU那样工作。这样说，你就可以去训练更大的模型了。而且，今年是这个Blackville，明年就是Blackville Ocho，再往后是Robin。就是说，往后一代都给你规划好了。再往后一步，是叫Robin Ocho，所有的GPU一直规划到2027年，一定让2027年之前的GPU都给你规划好了。</p>



<p class="wp-block-paragraph">现在呢，很多大佬还在惦记着买H100。他现在就专门告诉你说，你看我这个艾克威尔跟这个H100比，它强在什么什么地方，好在哪哪哪。但是很多人还想买H100，这是为什么？可能Blackware它的这种工作方式，或者说它可能需要跟更多的设备先行捆绑，而H100的话，相对来说可能兼容性会更高、更好一些。就是你用任何的这种通道服务器，都能相对容易地兼容和使用。</p>



<p class="wp-block-paragraph">你把它插上去都是可以用的。likerware我倒是真没看到它出这种——就是像原来金砖啊，像我们以前讲的A100、H100这样的，我们管它叫金砖嘛，就是它的卡还是金黄色的，方方的一块，可以插上去的。好像没有看到这样的东西啊。现在呢，基本上都是以两个black Verre在一起，然后头上带一个CPU，是完整的这个配置。</p>



<p class="wp-block-paragraph">当然了，这些大佬，包括马斯克、扎克伯格，可能也不是说我就一定要去买H100。对于他们来说，H100就算是一种计量单位，就是说啊，他们会算上自己到底买了多少H100，或者说现在手里的算力相当于多少H100。你像扎克伯格之前讲，说他买了35万块，加上他手里现成的有60万了，再加上后面再接着买，现在扎克伯格手里的大概有接近100万块H100，相当的算力。这就跟我们造炸弹的时候说，这个炸弹相当于多少吨TNT啊，最后变成了一种衡量单位了。</p>



<p class="wp-block-paragraph">老黄（指NVIDIA的CEO 黄仁勋）就告诉大家说啊，你们来买新的吧。而且这种升级是呈几何级数升级的，所以不要去买旧的，去买新的，这样的话才能够保持它的垄断地位。如果说哎，我现在这个GPU再涨上去，涨了10%，涨了20%，那大家就不买它的了，就去买AMD，买英特尔，买其他的这些算力芯片去了。</p>



<p class="wp-block-paragraph">甚至像高通这样的公司，都能做出一定的算力芯片来。这样一来，人们可能就不会一定买它的产品了。但是现在的情况是，我们谈论的是算力要涨十倍、百倍、千倍，而且每年都要这样增长。为什么呢？因为这成了一场军备竞赛。每个人都害怕落后，就像人们常说的“输在起跑线上”。我们从小让孩子上补习班，是为了什么？就是出于这种害怕，这种焦虑感。老黄就是在给大家制造焦虑：你现在买了旧的，等明年出了新的，你就落后了。你必须去买新的，然后当更新的版本出来时，你又要再买。毕竟，GPU不像软件，软件可以逐年升级，而且升级成本相对较低。但GPU，你需要整块购买，一年后淘汰，再换新的，这成本实在太高了。一片就是4万美金，Blackwell的价格我虽然没查，但肯定不便宜。所以，要让大家每年跟着升级，必须讲出一些更有诱惑力的故事来。目前，从算力成本和能耗几个方面看，确实在全面升级。一方面，算力成千倍增长，成本自然是变贵了。这没什么可争议的。但就单位算力的成本来说，它是下降了。比如，原来的H100卖4万美金，但使用Blackwell之后……</p>



<p class="wp-block-paragraph">你可能继续达到H100同样的算力，这只需要原来1/10，甚至1%的成本，是这样大幅下降的。能耗方面也是如此，比如说，要达到原来H100的算力，所需消耗的能耗可能也只是原来的1%。如此发展，GPT-4的1.8T训练能耗引人注目，因为之前很多人讨论，GPT-4训练一次的能耗相当于多少个家庭一年的电力消耗，让人担忧AI发展的能源瓶颈。但现在的进展是，重新训练一遍的能耗降低了99.7%，仅为原来的1/350。而进行推理时，即训练完成后用于问答等任务，能耗更是降低到原来的1/45,000。这样的发展速度令人惊叹，从GPT-4推出至今不过一两年，能耗的减少就达到了如此程度。</p>



<p class="wp-block-paragraph">军备竞赛在AI领域体现为不断制造焦虑，促使各方持续投入。这就像冷战时期的军备竞赛，你有武器，我必须跟进。如今在技术领域，特别是英伟达所处的，情况类似，但效果是整体提升，正如“一人得道，鸡犬升天”。之所以提到这一点，是因为他们还强调了除了芯片本身，还有Vlink技术，能够将服务器像拼图一样连接，整个机房的服务器作为一个单一GPU工作，展示了技术整合带来的巨大效能提升。</p>



<p class="wp-block-paragraph">因为，这些服务器在一起，你的GPU的算率越大，可以并行处理的东西就越多，与内存和CPU之间的通道越宽，整个进行大模型训练的效果就会越好。所以他说，他可以干这件事情，但在这个过程中，这些服务器，或者其他一些相关的配件，都跟着他“鸡犬升天”了。比如说，像戴尔、超微电子这些给他造服务器的公司，全都因此受益，一路上涨。因为你不能只有GPU，不能只有他们的加速卡，还得把所有配件凑在一起，这些东西才能正常工作。而这些配件，都是值钱的。</p>



<p class="wp-block-paragraph">在这个过程中，服务器肯定变得更贵了。比如说，原来用的是H100的服务器，现在变成了更高级的查克威尔的服务器，那自然是服务器变贵了。但你想，服务器变贵的过程中，到底是什么东西变贵了呢？其实，只有与H100相关的专利费变贵了。大家要注意，因为大家自己并不造芯片，也不造服务器，他也不造算力中心。他只是设计好GPU，交给台积电去生产、封装、测试，然后下交给板卡厂商制作成板卡，再由服务器厂商组装成服务器，最后等待比如马斯克这样的人购买安装。所以，整个服务器链条上的价格上涨，实际上主要是由于关键技术组件的成本上升，特别是H100相关的专利费用。</p>



<p class="wp-block-paragraph">除了GPU价格飙升之外，其它相关成本也难免水涨船高。你不能期望其它东西都保持低廉，这显然不合逻辑。我们整体的成本基数提高了，但单位成本可能有所下降。不过，要注意的是，老黄的市场策略极为精准。GPU的知识产权价值多少，或者说它的设计成本是多少，他们心中有数。如果没有竞争对手，价格自然可以定得更高。但即便如此，人们依然能看到成本在以惊人的速度下降，甚至是以十倍、百倍的幅度。然而，GPU的设计价值却在不断提升。</p>



<p class="wp-block-paragraph">除了NVIDIA本身，那些制造显卡、服务器以及各种配件的厂商，它们的产品也会随之增值。比如，如果你用一个价值4万美金的H100来搭建服务器，仅这一部分就是一笔昂贵的投入。而且，随着Nvlink标准的采用，替代了以往的Pcie标准，意味着新的配件、新的线缆等都将应运而生，价格自然比过去高出许多。</p>



<p class="wp-block-paragraph">我记得早些时候，为惠普的小型机配备一个简单的支架，就是一个铁质架子，都能卖出数千元的高价。原因在于它专为小型机设计，很多工程师甚至会私下找工厂定制支架，替换官方配件以赚取差价。这背后反映的是，即便是一些看似不起眼的配件，在特定情境下也能变得极其值钱。</p>



<p class="wp-block-paragraph">大家其实也都知道，那个铁皮的支架，你说能值多少钱？你凭什么一定要买惠普的？他只要是惠普的工程师给你装上，下次他接着给你修不就完事了吗？你跟着这个比较贵的东西一块去卖，他就会卖的很贵。但是这几天呢，戴尔和这个超威的股价，其实已经快有点绷不住了。大家心里也明白，虽然你们跟老黄跟的很紧，但是这个里头真的，你就是个卖支架的，卖个铁皮，卖个机箱的，你跟着里头的GPU一起水涨船高，这件事稍微的有点侮辱大家的智商。</p>



<p class="wp-block-paragraph">现在呢，是AI工厂时代，现在老黄也讲说我们现在就是AI factory。在这样的一个时代，我们应该如何与时俱进呢？我记得在移动互联网刚开始的时候，我们写很多应用，当时我们在思考说，哎呀，我怎么能够省一点流量，因为那个时候流量很贵。我们都想着如何去节省流量，如何在使用的时候联网，不使用的时候怎么把它断开，想着怎么去省一点电，怎么去做一些其他的节省资源的事情，可以少占一些硬盘的空间，可以交互的时候少交互一些流量。当时的我一位老板就跟我讲，说你们想这个事情是错的，说为什么呢？就是因为很简单，随着时代的发展，这些东西都会变得不值钱的。比如说现在，流量咱们现在……</p>



<p class="wp-block-paragraph">其实，基本上是没有流量焦虑的。我记得最早开始使用手机，那时候刚进入3G时代，我们都会做什么呢？每天定时打开流量，收完邮件后立即关掉。为什么会这样？因为酷，而且节省。现在，还有人这样做吗？没有了。现在，我们走到哪儿，站在哪儿，就开始刷抖音、看视频。已经很少有人会说，我必须节省流量，等到有WiFi的地方再做这些。绝大部分人没有这个意识了。</p>



<p class="wp-block-paragraph">电的问题现在也不那么大了。虽然手机应用还需要省电模式，但现在的手机几乎都是一天一充。你的应用再费电，能比微信还费电吗？能比原神还费电吗？所以，这些问题也变得无关紧要。因此，很多以前为了省电而做的操作，实际上已经没有意义了。</p>



<p class="wp-block-paragraph">再往后说，我们是否会考虑在硬盘或手机上占用更少的空间？以前在猎豹工作时，我们还在研究如何让软件占用空间尽可能小。但现在看看《原神》有多大，看看那些手机游戏的大小，再看看微信在你手机里占了多少空间，就会觉得，我们当初那么精良的考虑，好像都没什么大作用。是的，所以在AI Factory这个时代，也就是AI工厂时代，我们仍在思考如何能省一点TOKEN，情况依然如此。</p>



<p class="wp-block-paragraph">我怎么能够让它反应得稍微快一点？我怎么可以调用不同的大模型？这个模型贵一点，那个模型便宜点。我尽量让便宜的模型干尽量多的事情，让贵的模型干少一点的事情，做一些其他的，比如优化（reg）或者做一些这种节省沟通交互的事情。可能真的再过一年，这些就会变得很可笑，就像我前面讲的，我们在做手机应用的时候，让它怎么去省流量，从网上下载的东西少一点，占的硬盘空间少一点。我们现在回想，那时候想的这些事情就显得很可笑。但是在AI时代，刚才我们讲的怎么能够省一点TOKEN，怎么能够让便宜的模型多干点，贵的模型少干点，怎么能够让多个模型相互搭配起来使用，可能也会变得很可笑。而且，这个时间会来的非常快。</p>



<p class="wp-block-paragraph">黄仁勋呢，除了讲数据中心业务，就像我们刚才提到的Blackvail，一切都是数据中心业务，这也是现在英伟达核心的收入来源，没有之一。现在，他主要就靠这个业务玩。那么其他的呢？也还在讲，英伟达这家公司特别有意思，它不会说某一个业务特别好，就把所有的身家都压上去。它永远是在所有它认为有趣的地方投注，即使这一个方向很长时间没有结果，它依然会在里面坚持。那么，它肯定还有些其他的业务在做什么呢？</p>



<p class="wp-block-paragraph">比如说，RTX加载的AIPC，因为前面微软发布的AIPC是基于高通的。现在，英伟达说了，你们使用英伟达的GPU，也可以达到同样的水平。英伟达专门为了AIPC设计了一款很小很轻薄的GPU，而且很省电。但这一块上，它稍微有一点尴尬。为什么呢？你如果真的要轻薄省电，你一定使用ARM的，对吧？就是使用高通的就好了。那你说，我现在稍微费点电也可以，这个英特尔自己也出了，英特尔说，你们就直接用英特尔完整的GPU加上算力核心就完事了，你不用再去单独配独立的GPU，依然可以达到AIPC的能力。包括AMD也是这么干的，AMD自己也产X86的CPU，AMD说：“来哇，你直接买我的APU加我的算力核心，就一次搞定。”</p>



<p class="wp-block-paragraph">那么，英伟达的RTX这个方案为什么尴尬呢？就是它必须要再搭配一块Intel或者是AMD的X86的CPU，它才可以正常工作起来。这对于强调轻薄便携的AIPC来说，就稍微有些尴尬了。但是，英伟达也强调了，加上他们的技术后，算力是苹果的多少多少倍，主要是与苹果的M系列芯片在比较。在这方面，我们还是要相信老黄的，他的算力确实是靠功率支撑起来的，如果他真想达到某个目标，他有这个实力。</p>



<p class="wp-block-paragraph">说我在电脑上做Stable Diffusion的，这样出图，速度很快。那一定是配着呼啸的风扇声，以及呼呼转的电表，一起来工作的。除了AIPC之外，还在讲游戏助手。但是这个呢，我觉得大家看着开心一下就可以了。他说我做个助手帮大家打游戏，这个呢，就属于工程师思维——一拍脑袋觉得，“我需要一个这个”。其实，游戏跟这个没有那么大关系。就算是AI应用在游戏里面，应该也不是通过游戏助手的方式去应用的。</p>



<p class="wp-block-paragraph">另外，还展示了机器人。他说所有跟机器人相关的东西，我们都上，也做了全套的机器人套件。还有，其实VR、AR以及车载芯片，其实都在英伟达的整个路线图里边。再往前走，很多人就会关心，英伟达到底还能坚持多久呢？他真的还差2,000亿美金就追上苹果了，对吧？苹果2.9万亿，他2.7万亿，真的差的不多了。他到底能不能超过苹果，甚至能不能超过微软，成为全世界最值钱的公司？这个其实大家心里都在打鼓。</p>



<p class="wp-block-paragraph">英伟达呢，跟其他不管是微软也好，苹果也好，有一个特别本质的区别，就是它是一个“轻公司”。这个“轻公司”赶上时代红利是可以的，但是到底能不能长久地坚持下去，这个就很难了。黄仁勋展示现在的成就，未来的路线图，让人充满期待的同时，也不免有几分疑虑。</p>



<p class="wp-block-paragraph">但是，并没有说我要砸重金进去，变成一个重型公司。大家注意，苹果是个很重的公司，它生产电脑——虽然电脑也是台湾人给他造的——它的手机是富士康，包括比亚迪都在给他造手机。它是这样的一个公司，虽然供应链在外面，但是这些货品、这些设计，包括全球的仓储物流，很多东西都是属于苹果自己的。所以，苹果是个很重的公司。微软其实也是一个很重的公司，微软自己在造Surface，那个东西虽然卖的并没有那么好，但是它也是电脑平板，甚至还有很多其他的硬件，比如说键盘鼠标。微软键盘鼠标其实做得非常好。而且微软其实还有一块很重的资产，那就是云计算中心，它有很多的数据中心。微软现在是全世界可能GPU最多的公司了，因为后边有OpenAI这样的一个“亲儿子”，那你肯定是要靠这么多的GPU去养的。微软现在的GPU，如果大概核算成H100的话，应该有180万块，这都是重资产。</p>



<p class="wp-block-paragraph">谷歌呢，也是一个很重资产的公司。谷歌紧跟在英伟达之后，他现在是市值第四的公司。谷歌我记得在云计算兴起之前，曾经有一段时间，他拥有全世界大概6%的服务器，这是一个多么恐怖的数字。而现在，虽然应该没有那么多，但谷歌的数据中心依然规模惊人。</p>



<p class="wp-block-paragraph">也是一块非常非常沉重的业务。而且，另外一点是什么呢？就是我们来看，整个的生态是否稳固，或者说，整个的价值体系是否可以稳定地升级上去。还有一个点可以看是什么？就是你上下游的生态链是否足够稳定。围着你吃饭的人到底有多少？以前我们在学生物的时候讲过一点：在一个自然环境里头，食物链越长，或者说参与到食物链里的动物、植物越多，它整个的生态系统就越稳定。为什么呢？因为其中有一些波动，其他的这些生态位上的人，或者这些动物，就可以慢慢地把它平衡回来，而不是说啊，我的食物链很短，就两三节，参与的动物也不是很多，植物也不是很多，可能中间稍微有一点闪失，这个食物链就崩溃了。</p>



<p class="wp-block-paragraph">咱们来看看苹果，上下游其实有非常多的人围着他吃饭。我们不说这些果链企业，就光在苹果应用市场里头，做应用的这些人，也有几十万人，对很多人来说，这是他们的收入来源。再看谷歌，像我们现在在这看YouTube，我在这拿着YouTube的广告费，那我们也算是谷歌生态链里边的一环。那是非常多的人靠着谷歌生活。啊，微软那不必说这些靠广告吃饭的，因为微软的广告并没有那么多，但是微软上下游，是有大量的系统集成公司，靠着微软吃饭的。</p>



<p class="wp-block-paragraph">还有微软云上的大量客户，但是英伟达有没有这么多人靠着它吃饭呢？英伟达虽然一直努力地在打造他的生态链，整个生态环境，但是并没有那么多。所有能战胜英伟达的，像刚才我们说的戴尔、超威等，这些已经都涨疯了。剩下的呢，其实没有那么容易贴上去。虽然有很多人说，“我们拿英伟达的CODA，我们去写这些Transformer的大模型。”但是这些人呢，实际上在整个的生态链里面是非常非常小的一群。现在能够真正把这个东西跑通的人非常少，虽然这个领域的人才工资非常高，但是人数真的不多，它没有真正撬动大众。所以，我从这两个方面来论述，英伟达到目前为止，依然是一个很轻的公司，资产很轻，它的整个生态链其实也是相对短而且相对脆弱的。</p>



<p class="wp-block-paragraph">那么英伟达现在能够赌的是什么呢？就是这个缩放定律，叫“scoring low”。只要这个东西依然有效，黄仁勋呢，就还可以继续狂飙那么一段时间。“scoring low”是什么东西？就是我堆更多的数据，上更大的模型，上更大的算力去计算，然后得到的模型效果就更好。这个东西只要依然在，还可以大力出奇迹。那么大家就说，那我们就接着老老实实地买他们家显卡。</p>



<p class="wp-block-paragraph">而且，这种倍速一定是十倍、百倍、千倍这样往上涨，为什么呢？因为如果你说，我英伟达下一代的GPU就比现在快20%，那大家就不更新了。或者说，我干脆去买AMD吧，AMD的比你这还便宜点，算力也没有那么差，只是这个过程稍微麻烦一点——我需要重新去适配AMD的算力卡。大家要注意，因为做这行的人很少，这些人很聪明，对他们来说，适配一个新的算力卡，难度并没有那么高。</p>



<p class="wp-block-paragraph">刚才我为什么专门讲了苹果的生态链、谷歌的生态链、微软的生态链？因为它们里面有很多低端开发者，对他们这些低端开发者来说，技术迁移的门槛是很高的。你让他重新换一下，比如说，“你原来做安卓的，现在去给我做iOS开发去”，他真不会。甚至说，他学会了以后还能涨些薪水。但是对于英伟达来说，如果他没有办法快速地让算力十倍、百倍、千倍地涨上去，那么大家就会渐渐背离他，对他的忠诚度是相对比较低的。</p>



<p class="wp-block-paragraph">有可能造成英伟达崩塌的原因有三个，咱们最后总结一下：</p>



<p class="wp-block-paragraph">第一个就是摩尔定律失效了，缩放定律已经没效果了。大家发现，上更多的数据，配更大的模型，训练完了以后效果提升了。一旦到这样的情况，就不会有人再疯狂地去买他的新显卡了。</p>



<ol class="wp-block-list"></ol>



<p class="wp-block-paragraph">第二个中心转移了。突然间，又一个特别赚钱的应用方向爆发起来。大家注意，现在为什么大家都在选择这个？因为“缩放法则”——谁都用不好。大家只能去比谁的模型做得更好，然后去跑这个，跑那个。但是一旦发现，这个模型在做一些特定应用时，效果好得一塌糊涂，而且极其赚钱，那么这个时候，就不会有那么多人继续投入资金去做新模型的研发了。他们可能觉得，现在的模型就够了。这相当于什么呢？就是说，虽然“缩放法则”仍然有效，并没有崩塌，但是没有人愿意再往上堆成本了。因为，尽管“缩放法则”有效，但增加更多的算例、更多的数据，那都是钱。一旦出现特别赚钱的领域，即使“缩放法则”依然有效，增长也会停止。</p>



<p class="wp-block-paragraph">第三个因素是巨头合作，突破并扩大了垄断。现在，大家离不开英伟达的原因，就在于它推进的这套扩大——可以称之为通用计算方法，具体的名称我不再详查，它是不开源的，而且英伟达拥有专利。因此，大家都在这个基础上进行了应用开发和大模型的训练。之后，想要更换这个技术，就会有一个成本。这个成本，我们要反复讲，不高也不低，为什么会这样呢？</p>



<p class="wp-block-paragraph">肯定换过去以后会有些兼容性的问题。但是呢，因为你后边真正使用你的H100也好，Blackware也好，都是些什么人？特斯拉、苹果、谷歌、微软、亚马逊——他们可以花最贵的钱，雇最好的工程师，说来咱们今天去改一遍就完事了。这个都是有可能的。但是，这个临界点在什么地方？临界点就是，如果涨不上去了，那咱就改；或者说突然有人说，“我愿意砸一笔更大的钱进来，咱就改。”为什么？詹奥特曼说，“咱们砸一笔大钱啊，1,000亿美金，或者说1,000万块H100算力的这个GPU，我们统一搞一次，做星际之门去。”这个对于英伟达来说，都是比较大的威胁。就是这三个威胁。</p>



<p class="wp-block-paragraph">英伟达呢，也算是我们现在的一个传奇故事。我相信在整个的AICC大时代里头，我们还可以不断地看到它的故事继续。好啊，今天我们要讲的故事就到这里。感谢大家收听，请帮忙点赞点小铃铛，参加Disco讨论群，也欢迎有兴趣有能力的朋友加入我们的付费频道，再见！</p>
]]></content:encoded>
					
		
		
			</item>
	</channel>
</rss>
