在中国,到底是谁在爆买英伟达显卡?揭秘中国企业疯狂购买英伟达显卡的背后真相:中国移动领衔—国内GPU市场大揭秘。
9 月 06
AIGC, 英伟达,黄仁勋的故事 4090显卡, A800显卡, AIGC, AI差距, AI进步, B W 200, BAT, Blackwell芯片, Daniel Naily, EFC, GPU采购, H20显卡, H800显卡, IBM, IOE, Oracle, Scaling law, SemiWiki, 中国企业, 中国电信, 中国移动, 中美AI对比, 云计算, 云计算机房, 人才, 光缆, 全球GPU市场, 半导体自媒体, 半导体行业, 华为, 台湾, 台湾显卡市场, 合规成本, 商业逻辑, 大基建, 央企, 字节跳动, 小公司, 巨头, 带宽资源, 应用场景, 微信聊天记录, 技术升级, 技术维护, 政府拨款, 政策解读, 数据中心, 数据中心建设, 数据训练, 数据质量, 文学作品, 新加坡, 新加坡显卡购买, 显卡需求, 比较优势, 电信运营商, 百度, 短视频, 算力云, 算力分散, 算力卡数量, 算力市场, 缩放法则, 美云计算, 腾讯, 英伟达显卡, 英伟达股价, 资源整合, 转租显卡, 阿里云 在中国,到底是谁在爆买英伟达显卡?揭秘中国企业疯狂购买英伟达显卡的背后真相:中国移动领衔—国内GPU市场大揭秘。已关闭评论
到底有哪些企业在购买英伟达的显卡?这个跟大家想象的可能不太一样。中国只有这些显卡吗?跟大家想的可能也不太一样。另一方面,中美之间的AI差距到底在什么地方?
大家好,这里是老范讲故事的YouTube频道。最近网上流传了一张图,直接把大家给看懵了。这张图写的是什么呢?就是到底哪些数据中心买家在买英伟达的显卡。我们不算是大家打游戏去买4090,或者是普通的一些小公司买了一堆4090去干活,这不算。我们算的是数据中心的,这到底是什么人在买?
在这个图上显示,在2023年Q2、Q3到Q4,实际上每一个季度,中国人从英伟达买的显卡数量都是快速上升的。到2024年呢,有所下降。2024年Q1的话,大概比2023年的Q2还要再少一些,但是到Q2继续在上升,应该是达到2023年Q2的一个同等水平了。
那么在所有的这些买家里头,排第一的是谁呢?不是BAT,也不是字节跳动,这个公司叫做中国移动。每一个季度,虽然大家买的显卡总量是有这样的一个区别,但是比例上,基本上中国移动永远是第一,甚至有可能已经接近了小一半的这样的一个比例。
第二名是谁呢?第二名是中国电信。第三名是不是联通?这里头没有联通啥事,第三名叫遥遥领先,也就是华为。第四名是腾讯,第五名是阿里。其实原来我一直以为阿里应该占的量是比较大,现在说中国有一半的大模型跑在阿里云上,结果阿里云其实买的并没有那么多。下一名是字节跳动,再下一名是百度,其他的基本上就排不上号了。
中国爆买GPU的,跟大家的想象是不是有一些差异?那么从这张图上看,中国移动、中国电信真的是很强啊。这其实也很简单,比较好理解。什么呢?他们建算例中心了嘛,其他人跑到那去租了。你比如说像阿里云,没准说我上中国电信的机房里去租了一些,你已经买到手的这种H20或者是A800、H800这样的显卡,我来去把阿里云部署上去去用,不也是可以的吗?电信运营商的云计算机房。
他就是这样的一种东西。以前我们在盛大网络的时候,其实跟这些电信运营商就是这么打交道的。怎么干呢?我们有网络游戏,电信营商有机房,我们就跑到那去说:“来吧,你就成为我的代理商吧!你用你的机房入股,只要把我的点卡卖掉了,在你那把它消耗掉了,咱们就直接来分钱就完事了。”现在应该很多的算力云也是这么在去操作。
那么,中国联通去做什么了?这事稍微有些好奇。因为你想,移动电信都这么猛,联通没有什么事,这也很奇怪。那你说华为这个遥遥领先,自己还造显卡,他买这么多英伟达干嘛?自己家的升腾910B难道它不香了吗?原因其实也很简单,华为其实是个系统集成商,它会给很多的机构单位、政府去搭建这种算力中心。在搭建的过程中,可能有很多的显卡就会从华为这边进口买进来。甲方要什么他就给什么,他也不能说:“我有升腾910,甲方说不,我一定要买英伟达。”但是我就不卖给你,这事人家也不会干。
中国基础设施建设的红利呢,英伟达肯定是吃到了,而且量还很大。所谓的基础设施建设,也就是大基建。这是咱们原来做东数西算,英伟达在这个时代就算是新的IOE了。IOE是什么?就是IBM、Oracle和EFC。为什么叫IOE?这是这一品类里边最好的品牌。你只要买了这个品牌的东西,出了任何问题,你怪不到我头上来。所有这个品牌的东西,或者符合IOE规律的这种品牌的东西,只有一个缺点,其他全是优点。这唯一的缺点是什么?贵。
你只要是把钱花掉了,剩下的出了任何问题。你比如说你在我的机房里头发现不兼容了,或者出现事了,那你找到我,你这为什么买了他们家的东西?英伟达都出错了,你要买别的更烂了,这肯定是这样的。国家会有一些拨款,直接拨下来做这种算力中心建设。在各个大会小会,从年初开到年终,所有的会上国家都在喊:“说我们的基础设施建设里头,要去建这个算力中心。”所以这块是有大量的拨款下来的啊,哪一个企业,哪一个地区,如果没有把这拨款给你花掉。
那他们会觉得亏死了。你不花,别人会花。而且这些大的央企,特别是电信企业,他们自己也有巨大的现金储备,或者说很低廉价格的现金渠道。什么意思?他借钱的利息都比你借的低。所以在这样的情况下,干脆他就动用他背后的现金储备,或者是他的信用,直接从银行拿到无息、低息,或者各种贴补的贷款,他就可以来干这个事了。要比普通的企业做这个事,肯定要方便得多。
那真正的这些大厂,比如说BAT这些厂,我租就好了。我为什么要一下把现金都占压在这里,把我的信誉都变成显卡堆在这里?不划算。而且英伟达那边还在更新换代、升级。我万一买一大堆这个东西,旧了以后,你说我到底是更新换代,还是不更新换代?这个事太麻烦了。咱还是吃大户的就完了。所谓大户呢,也就是国家的。所以他们就直接租。
而这个小厂,他们有些时候就直接转租大厂。什么意思?租这种云设备,如果说我租一个比较小的单位,比如说我租个两天、租个两台,它是比较贵的,成本也比较高。所以一般的这种大厂,像阿里、百度、腾讯这些大厂,他们会一次性打包一大堆东西给他一起租下来。租完了以后,再在这个里边切分划分,划好了以后再分别包给这些小厂。而且他在这个过程中,还给你上了BAT的服务,BAT相应的软件系统都给你做好了。这个呢,对于小厂来说,你不需要那么高的技术维护能力,就可以直接用起来了。
所以这就是在国内正常的玩法。而且呢,在国内要注意,有很多生意只有官家来做才方便。普通人你做这个事是很痛苦的,做不了。为什么?第一个,各种证书你要想去申请,你申请得到吗?特别是跟ICP、ISP这种算力中心相关的证书,你是申请不到的。就算是阿里云、腾讯云,他们很多也是跟各地政府一起去合用这些证书,或者说我挂靠,或者通过一些收购的方式,能够有一些证书去使用。
所以在中国,第一个就是证书你搞不定;第二个,什么外汇?你如果手里有美元,你敢说你有?你为什么没有从国外结汇结回来?
如果你把这个外汇结回来,变成人民币了。你说我现在再想用美金,到海外去买伟达显卡,那你看看是不是又要去搞批文,要重新做进口,这事很麻烦的啊。但是对于这种大型的央国企来说,处理这个事就比较简单。你说我现在需要很大的一笔外汇,到那边是进口,去买价值可能几千万美金或者上亿美金的这种英伟达显卡回来,对于他来说是比较好做的。但是你对于其他人就费劲了。
而且呢,还有什么,接口跟带宽,这事也是一种政府资源。什么叫接口和贷款?以前啊,很多这种云计算的公司,其实他也不算公司,他们是什么,比如什么张家口电信啊,有的时候会找我们。找你干嘛呢?我们最近啊,整到了一个特别紧俏的资源。我说什么资源啊?一个什么万兆网口,或者是最近有一些什么其他的这种接口资源、带宽资源,整这个你们谁要用一下子,咱们把它分一分,把它用掉。
作为一个普通的企业,你想搞到这种东西是很麻烦的。而且就算你搞到了,你也必须在他的监督下去使用,这个不是一般人能用的了的东西。所以呢,直接让移动他们买完了,大家租是最方便的。这些生意,咱们就留给官家去做,普通的商家就别碰了,就完事了。
而且还有什么,很多政策的制定解读和相关政策执行过程中的辩解和保护,这件事,咱们跟这些大的央国企比起来,也是不具备任何优势的。什么意思呢?很多相关的政策去制定的时候,实际上就是这帮央国企自己在定,他们就有专家。像我们以前也参加过类似这样的标准制定,是安全公司嘛,企业安全的标准,我也会去开会。那会场上的人就是工信部的人、电信移动的人、猎豹、什么360、BAT的人,大家坐在一个屋子里,开始谈说这个东西该怎么弄。
所有这种规则的制定,三大运营商的人都是在场的。而且这些规则,别看BAT人也在场,最终话语权最重的还是第一个是官方,就是工信部,第二个实际上是三大运营商,其他人都是提供参考意见而已。但是吵架时,我们下边这帮人吵得凶啊,总还是要表现一下存在感啊。
最后,都是这些不言声的人。人家把规则标准定下来,定完了以后呢,真正的最后执行跟解读的时候,就没有其他人什么事了。三大运营商还是可以跟工信部去稍微的去挑战一下,去搞一下,争取一下,或者说我们执行的过程中,哪一个地方松一点,哪一个地方严一点,最近有什么新的风向,他们还能搞明白。
这个一般的企业,即使是BAT这样的大厂,通常也没有那么明白。那么,这个图到底哪来的,靠不靠谱?咱们说这么热闹,这个图是海外一个专注于半导体行业的知名自媒体那来的。一看自媒体,这事肯定不靠谱,但这个呢还可以啊。他应该叫Semi Wiki,这个维基呢,后边的博主叫Daniel Naily吧。这位老兄呢,是半导体行业的一位知名人士,从业40多年了,也是写了很多书,写了非常多的文章,所有跟半导体相关的事情,大家还是喜欢去参考他的这个自媒体,或者你说它就是一个大的这种百科全书,大家还是喜欢去参考的。
SEMI Wiki的内容跟数据呢,也还是相对来说比较靠谱。从2011年上线到现在,一共更新了7000多篇博客,有350万读者在读,就是所有跟半导体相关的一个权威,大家认为是杂志也好,或者是一个维基吧。这个图呢,是来自一篇专栏文章,这个专栏呢叫半导体商业智能,估计应该主要是讲英伟达和各种算力芯片。
然后,这个专栏里头写了一篇文章,叫做“英伟达被拉出了黑井啊”,Blackwell。Blackwell是英伟达最新造的这个算力芯片B W 200。但是呢,现在传说B W 200有一些问题,需要迟后交付,导致了英伟达的股价下跌。他写了一篇很长的一篇文章,力挺英伟达,说你们不用担心,这个东西可厉害了,大家不要慌。
那么,这个权威人士的内容也是靠谱的,数据呢我们也认为是靠谱的。中国就只有这些GPU嘛,这是我们需要讨论的下一个问题。这个文章里头还有另外几幅截图,咱们看一下,这个截图呢是购买国家分布。
就是到底有哪些国家在购买英伟达的显卡?这个里头呢,第一名肯定是美国,第二名是台湾,这个也很有趣。美国的话,我按照最新的一个季度,2024年Q2的这个季度来看,他大概是买了全世界可能43%这么多的显卡。而台湾呢,是买了接近20%的比例的显卡。第三名是谁?还不是中国,因为中国现在毕竟是在禁运嘛。第三名是新加坡,买了全世界18%的显卡,然后中国是12%。剩下其他所有国家加在一块是7%。中国大陆在被限制的这么死的情况下,我们去买H20、A20、A800、H800这样的显卡,也能够买到整个英伟达销量的12%,这个是非常吓人的一个数据啊。
这个图呢,还可以看出一点什么,就是英伟达的销量是从2023年的Q2开始爆发的。再往前,其实它的销量是相对来说比较稳定的,到2023年Q2就直接就喷了,基本上是一条直线上去,而且这个线还很陡。英伟达卖掉的显卡都是哪些型号?因为他讲,我们不要看Blackwell怎么样,咱们去看看其他型号卖怎么着。它里头呢,有一大块收入是网络收入(network),我估计应该是在英伟达卖机房的时候,里面进行一些网络连接,什么NW link,可能相关的软硬件给它带来的收入。真正的销售大头其实是H100,大家现在非常疯狂努力地在买H100。剩下的呢,还有极个别的开始买GB 200,就是Blackwell 200,还有一些A100现在也还在销售。
这是英伟达现在整个的收入,大概能够占到我觉得60%往上70了,都是H100。所以他那意思就是说,大家不用那么担心,Blackwell搞不定了怎么办,现在H100大家觉得够使,还在努力的买着。咱们看到了这么三张图之后,大家觉得中国还是只有这点显卡吗?能够被统计的按道理来说,就是刚才咱们讲中国移动、中国电信、华为,他们买的这些显卡应该是H20,特别是到2024年了,肯定都是H20。那么大家有没有想过一个另外的问题?
台湾跟新加坡,他们需要这么多显卡吗?他们会买这么多显卡,把它堆起来吗?这些显卡有多少通过走私渠道到了中国呢?台湾的20%,新加坡的18%,这一部分到底去哪里了?是不是会有些人感到困扰?其他国家真的能买得起7%的显卡吗?这东西好贵的。
还有人说不要看不起欧洲的AI,他们现在融资很厉害。咱们看看谁买多少显卡,就知道他到底是真的是假的,是不是在吹牛。我们相信还有相当一部分显卡是通过台湾、新加坡以及很多其他国家,或者东南亚的一些国家回流到中国来了。
特别要注意的是新加坡,为什么呢?因为大家知道,在咱们经济开始稳中向好之后,大量的中国企业,特别是VIE企业,他们喜欢把运营总部放在新加坡。在新加坡这个地方去进行各种全球性的贸易,跟美国、跟台湾、跟各个地方去交易,都是在新加坡交易。所以新加坡买了很多东西,未必是用在新加坡的。
另外,新加坡就是一个城市国家,你在这样的一个国家里头寸土寸金的,盖一大堆机房在里头塞显卡,而且还是个热带地方,你还要烧了空调。算算力中心,这个事儿他不划算。所以新加坡大量的跑货,都应该是转口到其他地方去了。
新加坡,你不要说地贵、电贵,或者其他这些资源贵,只有一样东西他就搞不定,那就是人。在新加坡建立一个机房,让一堆的技术人员、维护人员去维护这些机房,他得多贵。所以在那个地方去建算力机房这件事,在商业上是完完全全不符合逻辑的。
但你说新加坡一点没有吗?也不至于,新加坡还有这么多大学,他们可能还是有那么一小部分的算力云什么在那儿。但是我真不认为他们可以买到全世界18%的算力卡,在那个地方去吭哧吭哧地算。这些算力卡应该大量还是流回到中国了。
那你说这些卡哪去了?除了中国电信之外,这些卡去哪了?大家注意啊,除了移动电信,各个省市其实都是有计算中心的。咱们的这种计算中心也算是一种资源,每一个行政机构,甭管是横管还是竖管,他都会说我们自己是不是整一个。
哪怕说:“哎,我这是交通部,我这是铁道部。”我们是不是整个集团中心?所以这些卡可能就彻底被分散到了各个国有企业、央企或者一些政府机构里边去。那么这些卡是哪来的呢?或者怎么进来的?
最近,超微电脑正在被做空,做空的理由是账目混乱,导致出口管制没有很好地被执行。这是做空机构给他写的做空信。超微电脑也很神奇,不说承认,也不说反驳,什么也没说,给了一个回复,说:“我这个财报晚两天再发。”这个大家自己品就好了。
所以我觉得,中国大陆拥有全世界第二多的英伟达各个型号的显卡,还是存在一定的合理性的。而且在这个里面,有大量的是美国政府禁止出口的。中国的显卡实际上都禁了啊,即使是算允许进口那部分,中国也可以在全世界所有的国家里头排到第四:美国第一,台湾地区第二,新加坡第三,中国第四。
那么最后一个问题,我们在AI领域里头跟美国到底差多少呢?原来老说我们没有算例,现在我告诉大家,有!我们有算力,而且算力其实并不少。正常情况下,我们现在做AIGC需要三样东西:人才、算力和数据。人才这个事我从来不认为中国缺,特别是这种工程技术人员。咱们在这块一定是全世界最好的。
算力,刚才按照我们的分析,中国应该也没有那么缺算力。我们算力肯定没有美国多,这个事是确认的,但应该是第二多,估计应该拥有全世界可能20%多,甚至接近30%的算力卡。这个事是相对来说合理的,美国大概拥有40%多,咱们大概拥有30%多,剩下的所有国家和地区去分,剩下的可能百分之二三十的这种算力卡。
数据,其实我们也不缺,我们产生了大量数据。至于说数据质量高低这件事,我觉得没什么可讨论的。英文数据质量确实是要有一些很有质量的,比如说论文这个东西,也不是说咱就拿不到,咱也可以拿到回来去训练嘛。中文的数据也有大量的,你不能说大家每天去做政治学习文章就低质量。你写了很多出来以后,还是可以学出一些不一样的东西来。
再加上中国这么多人产生了这么多的文学作品、这么多的小说、这么多的短视频、这么多的微信里的聊天记录,这些东西它都是内容。那么这些内容一样是可以作为数据去跑大模型的,这个都是没有问题。所以数据我从来不觉得咱们缺。
那你说咱们啥都不缺,那到底跟美国人之间差哪了?有什么东西?咱是不是还有点优势?我们有些地方还有优势,就是应用场景跟收益这一块,我们其实更好一点。什么意思?在中国很多新技术来了以后,不管是国有企业还是政府机构,他们都属于可以义无反顾地去用起来的。这帮人没有那么多的说:“哎,我这以前刚用过,或者刚升级过,我是不是用一段时间再升级。”他们从来不抢这个,哎,又有机会花钱了,我要赶快去花一把。这个是国内的很多政府机构和大企业习惯性的思路。
他们还干嘛叫“拉锁路”?我这个路挖开了,铺根管子进去,待会再挖开了再铺根线进去,再待会挖开了再铺根光缆进去。他们为什么干这事?你不停的折腾,不折腾哪有钱?所以中国人在应用AI的角度上说,在这个全世界范围内,我们应该是跑得比较快的。而且从投入产出来说,我们其实也还算划算。为什么?因为我们工程师便宜,而且人还多。收益,因为大家愿意用,你还是有一定收益。没准一些企业就可以直接在这活下去了。
那同样的事情,你在美国未必活得下来,因为他工程师贵,大家去采购这种项目的时候,也相对来说要比中国的政府和这种大企业要谨慎。所以这块咱们还有些优势。
那你说中国到底有什么劣势啊?那照我这说法,咱们是不是又厉害了我的国了?咱们也有一些劣势。第一个劣势就是合规成本不可控。这个什么叫合规成本呢?咱这就不再详细讲了,听我节目的人应该是知道啥叫合规成本的。那为什么叫不可控,而不是说合规成本高这个事呢?很有意思啊,咱们是分两个方面来去理解这件事。第一方面,所有ToC的应用合规成本都是很高的。什么叫ToC应用?就是个人用户来使用的这些项目,它的合规成本很高。
说错了话就要拔网线,或者有很多人要受到巨大的处分,或者要受到巨大的经济损失。这件事是非常危险的。另一方面,所有对政府和对商业的这种方面,我们的各种应用是百无禁忌的。你在美国,比如说我们想上一个什么医疗系统,想上一个监控系统,那麻烦死你,我告诉你,他不允许,各种的保护隐私。但是在国内,上呗,这有什么?我只听我老板的,其他的都不重要。领导的看法是第一大法的,所以他们完完全全肆无忌惮。咱们的合规成本在这块,对一部分来说很高,对一部分来说基本上可以忽略不计。
那么,中国真正的劣势在哪?合规算是一部分,但也不是完全负面的。有一部分是正面的。咱们做的很多监控软件和一些奇奇怪怪的软件,我们做的是要比美国人好的,因为没有那么多条条框框。咱们真正的劣势在于算力太分散。什么叫算力太分散?你想,马斯克的XAI有多少算卡?非常多,十万块还是多少万块算卡。他拿这些算力卡可以集中力量办大事,可以把他的这个grok的版本一级一级往上推。OpenAI有多少算力卡?他可以拿着微软的算力卡去疯狂的计算。谷歌有多少?亚马逊有多少?Anthropic跑的是亚马逊的这个算力卡,他们都是几十万块的往上跑。他们等于非常集中的算力卡,才可以去维护一个什么东西,叫做缩放法则。
因为现在大家冲的就是缩放法则,我用更多的数据,用更多的算力卡集中在一起进行一次的这种运算,他可以推出更好的不一样的模型来。而这些算力卡一旦分散开了,比如我现在都到云计算中心去了,都交给中国移动、中国电信了,或者交给各省市,再加上交通部、航天航空,每间都买一堆,那这个就分散掉了。以后你就没有办法说我现在想要十万块H100,我们去推一个grok2出来,你就没有这个能力了。这个是我们现在真正缺的。所以,中国需要的是巨头,这样才能够去追赶Scaling law。如果像现在这样,我们整了一大堆的算力卡进来,四处分散,撒了胡椒面了。或者说,我搁在云计算机房里头。你租5块,他租10块,大家都做一大堆实验型的这种小模型出来。那个是会跟美国越拉越远的。
好,这就是我们今天主要讲的内容:中国到底有哪些大企业在去买美国的英伟达的显卡?中国是不是真的只有这么多显卡?以及中国跟美国之间,AI到底差在什么地方?
好,感谢大家的收听。请帮忙点赞,点小铃铛,参加Discord讨论群。也欢迎有兴趣、有能力的朋友加入我们的付费频道。再见。