<?xml version="1.0" encoding="UTF-8"?><rss version="2.0"
	xmlns:content="http://purl.org/rss/1.0/modules/content/"
	xmlns:wfw="http://wellformedweb.org/CommentAPI/"
	xmlns:dc="http://purl.org/dc/elements/1.1/"
	xmlns:atom="http://www.w3.org/2005/Atom"
	xmlns:sy="http://purl.org/rss/1.0/modules/syndication/"
	xmlns:slash="http://purl.org/rss/1.0/modules/slash/"
	>

<channel>
	<title>美国放行H200 &#8211; 老范讲故事｜AI、大模型与商业世界的故事</title>
	<atom:link href="https://lukefan.com/tag/%e7%be%8e%e5%9b%bd%e6%94%be%e8%a1%8ch200/feed/" rel="self" type="application/rss+xml" />
	<link>https://lukefan.com</link>
	<description>这里是老范讲故事的主站，持续更新 AIGC、大模型、互联网平台、商业冲突与资本市场观察，帮你看清热点背后的底层逻辑。</description>
	<lastBuildDate>Mon, 18 May 2026 12:16:43 +0000</lastBuildDate>
	<language>zh-Hans</language>
	<sy:updatePeriod>
	hourly	</sy:updatePeriod>
	<sy:updateFrequency>
	1	</sy:updateFrequency>
	<generator>https://wordpress.org/?v=6.9.4</generator>

<image>
	<url>https://lukefan.com/wp-content/uploads/2026/03/cropped-jimeng-2026-02-28-5245-用图一的人物形象，替换图二中的人物，使用图二的风格。文字替换：老范讲故事，Yo-32x32.jpeg</url>
	<title>美国放行H200 &#8211; 老范讲故事｜AI、大模型与商业世界的故事</title>
	<link>https://lukefan.com</link>
	<width>32</width>
	<height>32</height>
</image> 
	<item>
		<title>英伟达H200解禁后的中国算力博弈</title>
		<link>https://lukefan.com/2026/05/18/nvidia-h200-china-sales-cuda-huawei-ascend/</link>
		
		<dc:creator><![CDATA[老范 讲故事]]></dc:creator>
		<pubDate>Mon, 18 May 2026 12:16:41 +0000</pubDate>
				<category><![CDATA[AIGC]]></category>
		<category><![CDATA[英伟达，NVIDIA，黄教主，GPU]]></category>
		<category><![CDATA[CUDA生态与国产算力]]></category>
		<category><![CDATA[H200与昇腾950对比]]></category>
		<category><![CDATA[H200解禁]]></category>
		<category><![CDATA[中国AI算力]]></category>
		<category><![CDATA[中国购买H200]]></category>
		<category><![CDATA[昇腾950 FP4优化]]></category>
		<category><![CDATA[美国放行H200]]></category>
		<category><![CDATA[黄仁勋]]></category>
		<guid isPermaLink="false">https://lukefan.com/?p=3781</guid>

					<description><![CDATA[本文拆解H200解禁对中国AI算力、英伟达CUDA生态和国产算力替代的影响，判断谁短期受益、谁承压。围绕75万片H200采购上限、10家企业名单、华为昇腾950与H200对比，以及DeepSeek V4的FP4优化路线，分析中国大模型公司是继续依赖CUDA，还是转向昇腾生态。文章也解释英伟达为何可能成为最大赢家，以及中小算力卡面临的市场压力。
]]></description>
										<content:encoded><![CDATA[
<figure class="wp-block-embed is-type-video is-provider-youtube wp-block-embed-youtube wp-embed-aspect-16-9 wp-has-aspect-ratio"><div class="wp-block-embed__wrapper">
<iframe title="H200解禁背后：黄仁勋追上的不只是订单！" width="900" height="506" src="https://www.youtube.com/embed/DoEPwx0b9Vc?feature=oembed" frameborder="0" allow="accelerometer; autoplay; clipboard-write; encrypted-media; gyroscope; picture-in-picture; web-share" referrerpolicy="strict-origin-when-cross-origin" allowfullscreen></iframe>
</div></figure>



<figure class="wp-block-image size-large"><img decoding="async" src="https://pictures.lukefan.com/nvidia-h200-china-sales-cuda-huawei-ascend/blog_1.jpg" alt="一枚写着H200的绿色芯片放在中美两面抽象棋盘之间，旁边有云计算机房、美元票据和国产芯片小方块围成博弈构图，浅色背景的商业评论版橡皮泥平面信息图的统一风格。"/></figure>



<p>大家好，欢迎收听老范讲故事的 YouTube 频道。今天咱们来讲一讲：<strong>H200 解禁，中国到底是赢了还是输了</strong>。</p>



<p>H200 解禁，表面上是一条芯片新闻。美国批准了一批中国企业购买英伟达 H200，大约 10 家中国企业在名单里，每家理论上最多可以买 7.5 万片，合计 75 万片，而且好像还有一个要求：不允许转卖。</p>



<p>但这件事情真正重要的，并不是批没批，或者怎么批。真正重要的是：谁能买、买多少、货怎么进来，买完以后，中国 AI 公司是继续留在 CUDA 生态里，还是转向国产算力？</p>



<h2 class="wp-block-heading">先说结论：短期中美都赢，最大赢家是英伟达</h2>



<figure class="wp-block-image size-large"><img decoding="async" src="https://pictures.lukefan.com/nvidia-h200-china-sales-cuda-huawei-ascend/blog_2.jpg" alt="天平左侧放着中国AI公司和算力缺口，右侧放着美国订单和美元，中间一枚英伟达芯片站在最高处，背景有CUDA生态环形箭头，浅色背景的商业评论版橡皮泥平面信息图的统一风格。"/></figure>



<p>咱们先把结论放前头。H200 解禁，中国短期内肯定赢了，美国短期内也赢了，因为美国把东西卖掉了。</p>



<p>这一次可以看到，飞机买了，石油买了，农产品买了，英伟达芯片也买了。至于马斯克到底卖了什么东西，我估计 FSD 应该快要落地了。该买的东西，咱基本都买了。</p>



<p>至于美国人要的东西，中国做了一个叫“非敏感物品清单”的东西，在这个清单里就可以随便买。过去没有这个单子，每一件事来了以后，我们都可以说：你这有问题，我查一查；那有问题，我查一查。现在等于给了这样的单子，所以美国人也赢了一把。</p>



<p>今天还有一个消息：我们已经跟国际足联 FIFA 签了字，应该是 1.1 亿美金，好像是买了两年的转播权。今年 6,000 万，下一届 5,000 万。所以美国短期内也赢了。</p>



<p>那么谁比较倒霉？华为昇腾开始承压，国内的中小算力卡应该准备面对斩杀线。但真正赢了的，是黄仁勋的英伟达，那才是整个交易最后的最大赢家。</p>



<p>为什么？因为英伟达的 H200 并不是一个普通芯片，它背后是 CUDA 生态，是英伟达服务器、NVLink，以及一整套生态体系。你买了他的芯片，就相当于继续留在这个生态里，而不是说“我干脆整点自己的，能用就算了”。</p>



<p>所以问题不是简单地问：中国买 H200 是不是赢了？而是要问：中国买了 H200 以后，是补上了短期算力缺口，还是重新被英伟达生态捆回去了？</p>



<span id="more-3781"></span>



<h2 class="wp-block-heading">美国限制英伟达芯片的几个关键时间点</h2>



<figure class="wp-block-image size-large"><img decoding="async" src="https://pictures.lukefan.com/nvidia-h200-china-sales-cuda-huawei-ascend/blog_3.jpg" alt="一条横向时间轴从2022到2026，A100、H100、A800、H800、H20、H200芯片卡片依次被红色禁令印章和绿色许可印章标记，浅色背景的商业评论版橡皮泥平面信息图的统一风格。"/></figure>



<h3 class="wp-block-heading">2022 年 10 月：第一轮重拳，限制 A100 和 H100</h3>



<p>2022 年 10 月，美国开始系统性限制 AI 芯片流向中国，重点是 A100 和 H100，这两个芯片不允许到中国去。</p>



<p>这轮限制的核心逻辑，是不让中国获得最先进的 AI 训练能力，不让中国轻易建设超大规模训练集群，不让高端 GPU 服务于军事、情报和先进科研方向。</p>



<p>于是英伟达做了第一轮中国特供版，也就是 A800 和 H800。它们是在 A100 和 H100 上做了一些限制，不是完全不能用，而是在互联带宽、集群能力方面做了降级。美国堵了 H100，英伟达就做出 H800，这实际上是一轮猫鼠游戏。</p>



<h3 class="wp-block-heading">2023 年 10 月：A800、H800 也不允许卖了</h3>



<p>美国很快发现，只堵原来的 H100 不够。中国公司买了 A800、H800 之后，一样可以组成超大型集群，只要数量够，照样能够训练大模型。</p>



<p>于是 2023 年 10 月，美国进一步收紧规则。这一轮不只看单卡算力，还要看芯片互联能力，以及能不能组建大规模集群。结果 A800、H800 通通被干掉。</p>



<p>英伟达随后又精准降级，做出了 H20。H20 是为了继续合法卖进中国市场而做出来的产品。它的特点是可以进中国，但是性能被压住了，对训练不够理想，对部分推理和商业部署还是能用的。</p>



<h3 class="wp-block-heading">2025 年 1 月：拜登推出 AI Diffusion Rule</h3>



<p>2025 年 1 月，拜登在特朗普上台之前推出最后一招，叫 AI Diffusion Rule。这一招对中国最狠，因为它把全世界分成三类：</p>



<ul class="wp-block-list">
<li>第一类是美国最信任的盟友，可以无限制购买 AI 芯片，比如五眼联盟。</li>



<li>第二类大概是 120 个国家，可以购买一部分芯片，但有额度限制。</li>



<li>第三类是中国、俄罗斯、伊朗、朝鲜这样的国家，直接不卖。</li>
</ul>



<p>如果这个政策真的执行，中国现在的算力就会非常费劲。</p>



<h3 class="wp-block-heading">2025 年 5 月：特朗普撤销分级框架</h3>



<p>好在川普上来以后，第一时间把这个框架干掉了。2025 年 5 月，特朗普撤销了分级框架。</p>



<p>为什么？因为他当时要去中东，看那些王爷们。如果有这样的框架，中东这些王爷们就没有办法买显卡了。</p>



<p>他当时带着黄仁勋，也带着微软的萨提亚，去了以后疯狂卖各种显卡和算力中心。这一步非常关键。虽然当时还没有向中国开放，但是中国大量云计算企业可以在中东、东南亚以及其他不受限制的地方投资建设机房，然后使用这些算力。甚至有一些算力、维修配件，可能拆吧拆吧就送回来了。</p>



<p>所以在特朗普做出这次决定以后，对于中国的算力围剿，其实已经算是结束了。</p>



<h3 class="wp-block-heading">2025 年 8 月：H20 重新拿到许可证</h3>



<p>2025 年 8 月，H20 又重新拿到了许可证，但是最强的 Blackwell 和最新的 Rubin 都不给。Rubin 现在已经做出来了，但还没有量产。美国大厂真正开始买的是 Blackwell，一般叫 B200，现在可能还有 B300 这样的机器。</p>



<p>现在真正主力卖的 H200，是英伟达当前主力出货的卡。</p>



<p>特朗普前面说过要卖 H200 给中国，但双方一直没有理顺：到底谁能买、谁不能买、卖多少、商务部是不是还要批。</p>



<p>所以从特朗普开始说要卖 H200 到中国，到现在一片都没卖过。2026 年 4 月 23 日，美国商务部长鲁特尼克说过，到目前为止，没有任何一片 H200 到了中国。</p>



<h2 class="wp-block-heading">黄仁勋赶飞机：H200 不是普通商业订单</h2>



<figure class="wp-block-image size-large"><img decoding="async" src="https://pictures.lukefan.com/nvidia-h200-china-sales-cuda-huawei-ascend/blog_4.jpg" alt="一架写着空军一号意象的白色飞机停在跑道边，黄仁勋造型人物拖着行李箱奔向舷梯，手里拿着H200芯片登机牌，远处有中美谈判桌剪影，浅色背景的商业评论版橡皮泥平面信息图的统一风格。"/></figure>



<p>这一次还有一个非常戏剧性的事情，就是黄仁勋赶飞机。</p>



<p>中国报道里说，在特朗普出发之前四五天，有一个名单，当时黄仁勋在上面。但在特朗普出发前两天，上了一个新名单，黄仁勋没了，马斯克来了。原来那名单上没有马斯克，说法是马斯克换了黄仁勋，上了飞机。</p>



<p>等特朗普起飞以后，据说特朗普看了新闻媒体报道，说黄仁勋居然没带，这有问题，于是赶快打电话让黄仁勋来赶飞机。飞机已经起飞了，黄仁勋就急急忙忙飞到阿拉斯加，在那里上了飞机。其实从美国飞到中国中间是不需要加油的。</p>



<blockquote class="wp-block-quote is-layout-flow wp-block-quote-is-layout-flow">
<p>黄仁勋接受采访时说，是特朗普亲自给他打电话，要求他来，而且能够参加这样的盛会，实在太荣幸了。</p>
</blockquote>



<p>这话说得非常明面上，就是完完全全给川普站台。</p>



<p>这个戏剧性事件正常应该是怎么发生的？前面没谈明白，最后美国财政部长贝森特跟中国的何立峰在韩国应该是谈明白了这件事。因为是在特朗普落地之前，他们两个在韩国首尔谈。谈明白了，黄仁勋就可以上飞机；谈不明白，谁打电话也没用。所以这个交易一定是在韩国谈好的。</p>



<p>贝森特这次也到国内来了，但他肯定没有在空军一号上。他的行程应该是在韩国跟何立峰谈完以后去了日本，到日本以后跟高市早苗说，你们要加息，不能去减债。因为日本现在想着不加息、想缩表，但美国希望的是扩表然后加息。日本的操作跟大哥要求相反，这事不行。他是从日本飞到国内来的，应该是跟特朗普前后脚落到首都机场。</p>



<p>黄仁勋上飞机说明什么？H200 不是一个普通商业订单，黄仁勋也不是一个普通 CEO。5.7 万亿美元公司、全球第一市值公司的老板，已经变成中美 AI 交易里的关键人物。</p>



<h2 class="wp-block-heading">黄仁勋必须同时说服三批人</h2>



<figure class="wp-block-image size-large"><img decoding="async" src="https://pictures.lukefan.com/nvidia-h200-china-sales-cuda-huawei-ascend/blog_5.jpg" alt="黄仁勋造型人物站在三角形讲台中央，三条箭头分别指向美国政府大楼、中国云计算客户机房和资本市场上涨曲线屏幕，浅色背景的商业评论版橡皮泥平面信息图的统一风格。"/></figure>



<h3 class="wp-block-heading">说服美国政府：把商业问题讲成国家利益</h3>



<p>对于美国政府，黄仁勋要讲国家利益：</p>



<ul class="wp-block-list">
<li>不卖给中国，中国会自己做。</li>



<li>不卖给中国，美国公司会丢市场。</li>



<li>不卖给中国，CUDA 会失去中国开发者。</li>



<li>不卖给中国，美国反而会失去全球 AI 标准的影响力。</li>
</ul>



<p>他不能只说“我想挣钱”，他一定要说：让英伟达继续卖给中国，是美国继续定义全球 AI 标准的一部分。</p>



<h3 class="wp-block-heading">说服中国客户：不要放弃 CUDA</h3>



<p>对于中国客户，他要讲稳定供应。他要告诉中国厂商：不要急着放弃 CUDA，不要彻底迁移到昇腾。H20 回来了，H200 也能回来，英伟达仍然愿意服务中国市场。</p>



<p>还有一个记者问得特别神：</p>



<blockquote class="wp-block-quote is-layout-flow wp-block-quote-is-layout-flow">
<p>“你会把芯片卖给华为吗？”</p>
</blockquote>



<p>黄仁勋想了半天说：</p>



<blockquote class="wp-block-quote is-layout-flow wp-block-quote-is-layout-flow">
<p>“你为什么会问这么奇怪的一个问题呢？”</p>
</blockquote>



<p>这个问题确实没法回答。</p>



<p>特朗普走了以后，黄仁勋就跑到小吃街表演喝豆汁、喝蜜雪冰城、吃炸酱面。意思就是：特朗普在的时候，我是美国人；特朗普走了以后，你看看，别人都不行，只有我可以来干这个事。他就跟中国人没什么区别了。所以黄仁勋还是非常能屈能伸的。</p>



<h3 class="wp-block-heading">说服资本市场：中国市场没有丢</h3>



<p>对于资本市场，黄仁勋需要讲一个新故事：中国市场没有丢。</p>



<p>英伟达过去在中国 AI 芯片市场非常强大，但出口限制以后，中国公司开始更多转向华为等国产方案。黄仁勋必须向市场证明，中国不是永久丢失的市场，英伟达还在想办法回来。</p>



<p>这个效果很好，英伟达股票这两天涨得很明显。一个 5.7 万亿美金的公司，每天还能这样涨，连续这么多天往上涨，这就是大家用钱、用脚投票的结果。</p>



<p>所以他追上的不是一架飞机，他追上的是中国 AI 生态的入口。</p>



<p>这非常重要，不是说中国 AI 就多厉害，而是说全世界做 AI 相关的工程师，大概有一半甚至一多半都是中国人。一旦中国开始走其他路线，对于黄仁勋来说绝对是灭顶之灾。</p>



<p>比如现在中国做高压输变电做得最好，标准都是中文写的。如果一个美国电工想学高压输变电，对不起，学中文吧。最后中国成为国际标准。对于黄仁勋来说，这种情况绝对不能接受。</p>



<h2 class="wp-block-heading">75 万片 H200 到底有多少？</h2>



<figure class="wp-block-image size-large"><img decoding="async" src="https://pictures.lukefan.com/nvidia-h200-china-sales-cuda-huawei-ascend/blog_6.jpg" alt="75万片H200被画成高高堆叠的绿色芯片山，旁边是中国全年400万片AI加速卡的环形占比图和华为出货量对比柱状图，浅色背景的商业评论版橡皮泥平面信息图的统一风格。"/></figure>



<p>75 万片这个数听起来很多，而且要注意，H200 可能是 4 万到 5 万美金一块。</p>



<p>目前的说法是：10 家企业，每家 7.5 万片，理论上限是 75 万片。但现在并没有进行交接，因为还有很多东西没说清楚。</p>



<p>去年全中国部署的 AI 加速卡大概是 400 万片，其中：</p>



<ul class="wp-block-list">
<li>英伟达占 55%，约 220 万片。</li>



<li>AMD 占 4%，约 16 万片。</li>



<li>中国本土厂商占 41%，约 165 万片。</li>
</ul>



<p>本土厂商里：</p>



<ul class="wp-block-list">
<li>华为：81.2 万片。</li>



<li>阿里平头哥：26.5 万片。</li>



<li>百度昆仑芯和寒武纪：各 11.6 万片。</li>



<li>其他基本可以忽略不计。</li>
</ul>



<p>这里要注意，这是厂商口径，不是具体型号。</p>



<p>75 万片 H200 如果落地，相当于中国全年 AI 加速卡市场的五分之一左右。按去年的数来算，接近中国本土厂商全年出货量的一半，也和华为全年出货量差不多在同一个数量级。</p>



<p>但不能简单说：H200 的 75 万片买回来以后，昇腾 950 的 75 万片就卖不出去了。其实都能卖掉，不用太担心这件事情。</p>



<p>还要注意，这 75 万片只是 H200。可能还会有 H20 进来，也会有走私货进来。刚才讲的去年 400 万片是不包括走私货的，都是可以写发票的。</p>



<p>中国有没有走私的 H200？一直就有。很有意思的是，京东上一直都有 H200 芯片在卖，可以下单买，而且上午买下午送来。当然这东西很贵，几万美金一块，不可能有人没事随便买，但它一直挂着。</p>



<p>特朗普快来的时候，京东把这个产品下架了。意思是面子还是得给：人家来谈这事，你市场上挂着 H200、H100、A100 在卖，就太不给人面子了。</p>



<p>现在 10 家企业可以买 75 万片了，京东链接马上就恢复了。当然，京东上卖的绝不是这 75 万片里的，这 75 万片到目前为止应该还没有正式签协议、正式进来。但它的意思是告诉你：我们有走私的，或者有其他来源的芯片。你敢下单，京东就真的给你发货。</p>



<h2 class="wp-block-heading">对国产算力的压力：华为有压力，小厂更危险</h2>



<p>这件事情对于国产算力肯定有压力。对于华为来说，压力有，但没有那么大；对华为之外的厂商，就比较麻烦。</p>



<p>华为是全村最靓的仔，很多场景必须买它、要爱国，这个没办法。阿里平头哥是阿里云自己买自己的，自产自销，不跟别人竞争。百度昆仑芯也是百度云自己用，自己玩自己的，也没太大问题。</p>



<p>但其他公司，比如寒武纪这些，就比较麻烦，有可能会被 75 万片 H200 直接打到很难受。</p>



<p>中国现在真的那么缺芯片吗？其实没有那么缺。中国资本在新加坡、马来西亚、中东运营了大量云计算中心，里面跑的都是 H200、B200 这样的芯片。这些芯片在特朗普来之前，我们就已经有了。</p>



<p>至于这些芯片是在土豪王爷的机房里，还是偷偷弄回国内，其实没那么重要。最近美国好像又在调查一个新案子：从泰国建设数据中心以后，芯片不见了，可能转两圈以后从京东直接卖出去了。</p>



<h2 class="wp-block-heading">H200 与昇腾 950：不是谁秒杀谁，而是谁定义工作负载</h2>



<figure class="wp-block-image size-large"><img decoding="async" src="https://pictures.lukefan.com/nvidia-h200-china-sales-cuda-huawei-ascend/blog_7.jpg" alt="左侧H200芯片连接CUDA、NVLink和全球工程师图标，右侧昇腾950连接国产服务器、CANN和政企客户图标，中间是一条写着工作负载定义权的分界线，浅色背景的商业评论版橡皮泥平面信息图的统一风格。"/></figure>



<p>下面稍微比较一下 H200 和昇腾 950，也就是真正可以跟它竞争的芯片。中国其他算力芯片跟 H200 没有任何可比性。</p>



<p>这里不是谁秒杀谁的问题，而是谁定义工作负载的问题。</p>



<h3 class="wp-block-heading">H200 的优势</h3>



<p>英伟达官方数据里，H200 配置是 141G 的 HBM3E 显存，显存带宽是 4.8TB。它非常适合做大模型训练、多模态应用、高并发云服务，以及成熟数据中心部署。</p>



<p>H200 的优势包括：</p>



<ul class="wp-block-list">
<li>单卡能力极强。</li>



<li>软件生态非常成熟。</li>



<li>CUDA 迁移成本低。</li>



<li>大规模集群部署经验丰富。</li>



<li>全球工程人才熟悉。</li>



<li>商业客户信任度高。</li>
</ul>



<h3 class="wp-block-heading">昇腾 950 的优势与限制</h3>



<p>昇腾 950 这个芯片，其实是瞄准 H20 做的，在各种性能属性上相对接近 H20。</p>



<p>昇腾 950 里面没有 HBM，因为 HBM 也是禁运的。它自己做了一种类似 HBM 的缓存，速度应该比 HBM3 慢，所以带宽只有一点几 T。H200 的显存带宽是 4.8T，昇腾 950 大概只有 H200 四分之一的显存带宽。</p>



<p>它真正要做的是：国产芯片、国产服务器、国产集群、国产软件栈、国产模型适配，以及国产推理成本模型。所以它和 H200 是两个不同产品。</p>



<p>昇腾 950 大概是一万多美金一块。它的优势是：</p>



<ul class="wp-block-list">
<li>国产可控，随时要随时有。</li>



<li>政策支持，购买可能还有补贴。</li>



<li>可以服务政企和关键行业，比如央企、国企、军队。</li>



<li>可以围绕中国模型做深度优化，有机会形成自己的软硬件闭环。</li>
</ul>



<p>真正的分歧不是谁跑分高。H200 跑分肯定比昇腾 950 高很多。真正的分歧在于：中国大模型公司未来优化工作负载的时候，到底是先适配 CUDA，还是先适配昇腾。</p>



<p><strong>如果优先适配 CUDA，英伟达就赢了；如果围绕昇腾做模型框架、算子和集群优化，国产算力就有机会。</strong></p>



<h2 class="wp-block-heading">什么叫针对昇腾芯片做优化？</h2>



<figure class="wp-block-image size-large"><img decoding="async" src="https://pictures.lukefan.com/nvidia-h200-china-sales-cuda-huawei-ascend/blog_8.jpg" alt="DeepSeek模型方块经过vLLM和SGLang两条软件管道流向昇腾服务器机柜，旁边工程师把算子补丁插入代码层，另一侧CUDA路线形成对照，浅色背景的商业评论版橡皮泥平面信息图的统一风格。"/></figure>



<p>现在我们首先有模型，比如 DeepSeek、MiniMax、ChatGPT。另一个东西叫推理系统，比如 vLLM、SGLang。然后才是芯片，或者说装着这些芯片的服务器。</p>



<p>要做的不是改模型去适应芯片，而是修改推理系统。vLLM 是开源的，SGLang 也是开源的。华为、DeepSeek 这些团队去跟 SGLang、vLLM 沟通，提交代码，把华为昇腾芯片相关优化补充到这些推理系统里。</p>



<p>只要云计算服务商买了华为昇腾芯片服务器，再部署这些开源推理系统，就可以得到不错的效果。</p>



<p>我们老在吹 DeepSeek V4，说它根据昇腾做了专门优化。原因是：它不用优化就可以在英伟达上跑得很好，但到昇腾上就需要专门优化。这个优化非常关键，也是黄仁勋最不希望看到的。</p>



<h3 class="wp-block-heading">FP4 优化为什么关键？</h3>



<p>DeepSeek V4 做了一个 FP4 优化。英伟达芯片不会专门对 FP4 做优化，因为虽然优化后可以提升效率，但会带来很多其他问题。英伟达的逻辑是：我有的是算力，不需要做 FP4 优化，直接跑就完了。</p>



<p>而国内像昇腾 950 这种芯片，是专门在 FP4 精度上做了很多优化。DeepSeek V4 之所以拖了这么久才发布，就是专门去对 FP4 精度做优化。</p>



<p>所谓 FP4，就是四位浮点。它的逻辑是：精度更低，显存占用更小，带宽压力更低。</p>



<p>昇腾 950 最大的问题是显存带宽只有 H200 的四分之一。它的推理吞吐更高，但工程难度非常大。要让一个大模型在 FP4 上还能跑起来，这件事很难。</p>



<p>中国为什么重视 FP4？因为硬件约束很现实。如果拼 FP8、FP16，中国拼不过英伟达。所以只能专门优化 FP4 芯片。没有先进制程，没有 HBM，集群互联也受到限制，单卡性能短期追不上英伟达，只能用模型架构和软件优化来弥补硬件短板。</p>



<p>所以 DeepSeek V4 加上昇腾 950 的意义，不是说昇腾 950 全面超过 H200，而是国产模型在 DeepSeek V4、昇腾 950 上运转时，昇腾 950 和 H200 之间的差距会缩小。原来可能差几十倍，现在可能差三五倍。</p>



<p>而且 H200 是 5 万美金一块，昇腾 950 是 1 万美金一块。如果差四五倍，多买几块不也够了吗？可以通过这种方式追平。</p>



<h3 class="wp-block-heading">FP4 的代价</h3>



<p>但训练成 FP4 是有代价的：</p>



<ul class="wp-block-list">
<li>量化更复杂，因为要重新做模型量化。</li>



<li>部分任务可能出现精度损失。</li>



<li>算子适配更麻烦，需要做各种优化。</li>



<li>工程维护成本很高。</li>



<li>为昇腾优化越深，想迁移回 CUDA 就越困难。</li>
</ul>



<p>这就像有人是真天才，有些人是紧急培训班出来的。FP4 出来的就像紧急培训班，应付日常任务没问题，但一些复杂任务可能搞不定。</p>



<p>一旦大家都朝这个方向走，黄仁勋就该哭了，因为他根本不愿意往 FP4 方向优化。</p>



<p>DeepSeek 被称为“国运级产品”，如果 DeepSeek V4 做了架构升级，其他国内大模型就会抄它的架构，因为架构是公开的。国产大模型又开源、又便宜，如果都能在 FP4 上有很好的优化，这就是黄仁勋真正不希望看到的东西。</p>



<h2 class="wp-block-heading">谁能买这批 H200？公布了 6 家，还有 4 家没说</h2>



<figure class="wp-block-image size-large"><img decoding="async" src="https://pictures.lukefan.com/nvidia-h200-china-sales-cuda-huawei-ascend/blog_9.jpg" alt="十张企业采购席位卡围成半圆，六张写着阿里、腾讯、字节、京东、联想、富士康并露出芯片图标，四张用问号和灰色幕布遮住，浅色背景的商业评论版橡皮泥平面信息图的统一风格。"/></figure>



<p>这一次一共是 10 家企业可以买这些卡，但特别有意思的是：公布了 6 家，剩下 4 家没说。</p>



<p>公布的 6 家里，有阿里、腾讯、字节、京东，还有联想和富士康。</p>



<p>前四家都是自己做大模型、做云计算。京东自己也有云计算，可以做算力出租，也可以做内部算力应用，这都能理解。</p>



<p>联想和富士康是做服务器的。别说 H200 服务器，Blackwell 服务器和 Rubin 服务器，联想和富士康都会帮助英伟达生产。只是它们生产 Blackwell 和 Rubin 服务器的工厂可能不在国内，可能在中国保税区，也大概率在台湾、墨西哥、越南，甚至美国。</p>



<p>剩下四家是谁？不知道，没有宣布。</p>



<p>美国更希望这些芯片能够老老实实做它能知道的事情，比如最终客户是谁、最终使用地点在哪、序列号怎么流转、售后怎么维护，不能转卖，不要拿去做军用。至于军队，作者认为中国军队才不会采购这玩意，因为有标准，只采购华为。</p>



<p>要注意，没有披露的这四家，才有可能是在这个交易里真正起作用的。如果是知名大厂，肯定就公开了。如果是电信运营商，比如中国移动、中国联通，也会公开。</p>



<p>这些没公开的 4 家企业，作者判断大概率可能是合资公司、新的皮包公司、新的壳公司。</p>



<h2 class="wp-block-heading">交易还没真正落地，中美内部都不是铁板一块</h2>



<p>这个交易到目前为止只是说两边批了，但最后能不能落地，还不知道。美国是不是要抽 25% 的税，不知道。中国芯片厂商也有各自诉求，也会承受压力，有些可能会死，所以他们也会拼命折腾，甚至可能把项目折腾黄。</p>



<p>所以现在不要太高兴。</p>



<p>中美两国内部都不是铁板一块。不是“美国想卖，中国想买”这么简单。</p>



<h3 class="wp-block-heading">美国内部的不同利益</h3>



<ul class="wp-block-list">
<li>国家安全派：不想让中国拿到好卡。</li>



<li>商务派：希望美国公司挣钱。</li>



<li>华尔街派：希望英伟达继续涨。</li>



<li>产业链企业：希望 AI 服务器订单不断。</li>



<li>政治人物：希望把交易包装成“我又赢了”。</li>
</ul>



<p>川普最喜欢讲“我又赢了，赢麻了”。</p>



<h3 class="wp-block-heading">中国内部的不同利益</h3>



<ul class="wp-block-list">
<li>大模型公司想用好的算力。</li>



<li>云计算厂商想买好的算力再卖出去。</li>



<li>英伟达卡维护、部署肯定比昇腾省事。</li>



<li>国产芯片厂商不想让英伟达进来，会想办法找麻烦。</li>



<li>地方政府想建数据中心和 AI 项目，但要研究买谁家的东西。</li>



<li>监管部门希望平衡安全、产业和外交。</li>
</ul>



<p>但无论中国内部还是美国内部，各方都不会实话实说，都会讲冠冕堂皇的理由。</p>



<p>美国可以说：把卡卖给中国，是为了让中国继续跟着美国标准走。也可以说：限制中国买卡，是因为中国一旦买了卡，在 AI 领域就会超过美国。</p>



<p>中国这边也一样。有人会说：一定要有 H200，买了以后大模型就可以超过美国。国产卖卡公司也会说：不能买他们的卡，他们不安全。</p>



<p>讲的都是冠冕堂皇的事情。</p>



<h2 class="wp-block-heading">郑和下西洋的类比：真正推动事情的是利益集团</h2>



<figure class="wp-block-image size-large"><img decoding="async" src="https://pictures.lukefan.com/nvidia-h200-china-sales-cuda-huawei-ascend/blog_10.jpg" alt="古代宝船与现代集装箱芯片货轮并排航行，船舱里一边是银锭一边是AI算力卡，岸边士绅、皇帝私库和现代投资人形成利益链条，浅色背景的商业评论版橡皮泥平面信息图的统一风格。"/></figure>



<p>这件事有点像当年郑和下西洋。最后为什么被停掉？公开理由是太烧钱，烧了太多民脂民膏，没有带来好处，所以停掉。</p>



<p>但作者认为，郑和下西洋其实非常挣钱，只是挣的钱没有进国库，也没有进江南士绅手里，而是进了皇帝的私库。</p>



<p>皇帝拿这些钱迁都、翻修北京城、几征蒙古。要是其他人干这些事，早把国家玩废了。但他拿郑和下西洋的钱，把这些事都干了。</p>



<p>有些人不会说：“皇上把钱拿走了，这事不行，你得拿出来跟我们士大夫分。”这样说太 low。人家讲的是民脂民膏，说花了以后没有收益，应该停掉，还把郑和下西洋所有图纸、文献通通烧了。</p>



<p>烧完以后，南方士大夫就可以自己走私，把钱挣得盆满钵满。每一圈都有自己的利益。</p>



<p>所以没有公开的几家公司，才有可能是关键。</p>



<p>作者推测，川普带着儿子来，中国也有红三代愿意做这种生意。现在没有比 AI 算力更挣钱的生意。过去红二代、红三代做房地产，是吃时代红利；现在的时代红利就是 AI 算力。</p>



<p>如果这些公司背后有这样的既得利益者，他们就会推动事情往前走。别人再怎么说这事对中国不好，可能也挡不住有人要挣钱。美国那边也一样，川普的儿子觉得好，就会跟他爹说把卡卖过去。</p>



<p>所以有些时候，事情前进或后退，跟民族大义没太大关系。民族大义常常是拿出来包装利益的，真正有关系的是小团体到底谁能把这事说明白。</p>



<h2 class="wp-block-heading">回到标题：谁输了，谁赢了？</h2>



<h3 class="wp-block-heading">第一，中国短期赢了</h3>



<p>中国最缺的是先进算力。H200 一旦合规进入中国，哪怕不是一次性交付上线，只要落地一部分，对于大模型公司来说就是补血。</p>



<p>而且还有一个重要作用：可以“掺沙子”。合法合规的 H200 进来了，走私进来的 H200 也可能名正言顺摆到桌面上。</p>



<p>这些芯片能够帮助中国模型大厂训练下一代模型，部署更多模型应用，降低推理成本，承接企业 AI 客户，稳定云计算算力供给。</p>



<p>所以短期内，中国肯定赢了。不是面子赢，而是算力账赢了。</p>



<h3 class="wp-block-heading">第二，美国短期也赢了</h3>



<p>川普回去以后一定会说：我又赢麻了。</p>



<p>美国可以讲：</p>



<ul class="wp-block-list">
<li>我没有放弃国家安全，只是卖了 H200。</li>



<li>我还做了限制：就这 10 家，没有别人。</li>



<li>每家上限 7.5 万张。</li>



<li>不允许相互转卖。</li>



<li>我守住了底线，你们不能批评我。</li>



<li>我让美国公司挣到了钱。</li>



<li>我还把中国 AI 继续留在美国技术生态里。</li>
</ul>



<p>所以这件事情美国也赢了。</p>



<h3 class="wp-block-heading">第三，华为昇腾开始承压</h3>



<p>真正被 H200 正面顶上的，是昇腾 950。但昇腾毕竟还在打爱国牌，大家会希望它赶快做出下一代，真正对标 H200，而不是只对标 H20。</p>



<p>华为昇腾真正需要考虑的压力是：还有没有那么多人愿意转它的 CANN 协议。CANN 是跟 CUDA 对标的协议。如果没有那么多人愿意转 CANN，没有那么多人愿意对 FP4 做优化，这才是华为昇腾真正要承担的压力。</p>



<p>至于阿里平头哥、百度昆仑这样的芯片，自产自销，别人爱干嘛干嘛，跟它们关系不大。</p>



<p>但中国那些小算力卡就面临斩杀线了。它们比昇腾更危险，因为生态非常混乱。昇腾至少还有一个相对较大的生态，而这些小算力卡没有生态，也没有相互兼容的东西。</p>



<p>华为还有芯片、服务器、云、运营商、政企客户，以及 DeepSeek V4 适配的故事。那些小公司，可能只是卖了几万块、出了一些样卡、做了一些跑分、拿了一点地方项目和融资材料，有些已经上市了。H200 一旦进来，可能就真的没人买它们了。</p>



<h3 class="wp-block-heading">第四，真正赢家是黄仁勋的英伟达</h3>



<p>真正的赢家只有一个，就是黄仁勋的英伟达。</p>



<p>英伟达赢的不是一批 H200 订单，而是三件事：</p>



<ol class="wp-block-list">
<li><strong>赢回了中国客户</strong>：阿里、腾讯、字节、京东都可以继续采购 H200。</li>



<li><strong>赢回了 CUDA 标准</strong>：模型继续适配 CUDA，推理继续用 TensorRT，集群继续用 NVLink，工程师继续按照英伟达路线优化。</li>



<li><strong>赢回了国产替代的时间窗口</strong>：国产芯片最怕的不是英伟达永远先进，而是客户刚准备迁移，英伟达那边突然又能卖了。</li>
</ol>



<p>道理很简单：有稳定的，我们肯定先用稳定的；如果实在没有稳定的，再想其他办法。现在英伟达又能卖，客户就不愿意费劲迁移。</p>



<p>所以黄仁勋最厉害的地方，是把商业问题讲成国家利益问题。他真正卖的不是 H200，而是美国继续定义全球 AI 标准的能力。</p>



<h2 class="wp-block-heading">最后结论：H200 是下一轮算力战争的开始，不是结束</h2>



<p>最后的结论是：<strong>H200 是下一轮算力战争的开始，不是结束</strong>。</p>



<p>第一，H200 能不能真实交付，才是真正要看的事情。</p>



<p>第二，DeepSeek V4 加上昇腾 950 这套 FP4 优化，是否会在国内成为样板并整体推起来，也很关键。</p>



<p>如果 H200 没有交付出来，如果这么多方利益没有把交易推起来，那么国产 FP4 路线就可能继续往前走。不是说因为各方想做，就一定能做成。利益纠葛太多，有可能做不下来。而且到 11 月以后，特朗普可能会变成少数派总统，他前面批的很多东西会出现问题。</p>



<p>第三，真正让黄仁勋害怕的事情到底会不会发生？现在只是 DeepSeek V4 做了相应适配，做了 FP4 优化。如果后面所有国产模型都向这个方向走，那就非常危险。</p>



<p>因为这些国产模型并不是只有中国人用，全世界的人都在用。如果大家发现用上这套东西以后挺好使，比英伟达还便宜，效果虽然有差异，但大部分人看不出来，那黄仁勋就该哭了。</p>



<p>这就是今天讲的故事。</p>
]]></content:encoded>
					
		
		
			</item>
	</channel>
</rss>
