在中国,到底是谁在爆买英伟达显卡?揭秘中国企业疯狂购买英伟达显卡的背后真相:中国移动领衔—国内GPU市场大揭秘。
到底有哪些企业在购买英伟达的显卡?这个跟大家想象的可能不太一样。中国只有这些显卡吗?跟大家想的可能也不太一样。另一方面,中美之间的AI差距到底在什么地方?
大家好,这里是老范讲故事的YouTube频道。最近网上流传了一张图,直接把大家给看懵了。这张图写的是什么呢?就是到底哪些数据中心买家在买英伟达的显卡。我们不算是大家打游戏去买4090,或者是普通的一些小公司买了一堆4090去干活,这不算。我们算的是数据中心的,这到底是什么人在买?
在这个图上显示,在2023年Q2、Q3到Q4,实际上每一个季度,中国人从英伟达买的显卡数量都是快速上升的。到2024年呢,有所下降。2024年Q1的话,大概比2023年的Q2还要再少一些,但是到Q2继续在上升,应该是达到2023年Q2的一个同等水平了。
那么在所有的这些买家里头,排第一的是谁呢?不是BAT,也不是字节跳动,这个公司叫做中国移动。每一个季度,虽然大家买的显卡总量是有这样的一个区别,但是比例上,基本上中国移动永远是第一,甚至有可能已经接近了小一半的这样的一个比例。
第二名是谁呢?第二名是中国电信。第三名是不是联通?这里头没有联通啥事,第三名叫遥遥领先,也就是华为。第四名是腾讯,第五名是阿里。其实原来我一直以为阿里应该占的量是比较大,现在说中国有一半的大模型跑在阿里云上,结果阿里云其实买的并没有那么多。下一名是字节跳动,再下一名是百度,其他的基本上就排不上号了。
中国爆买GPU的,跟大家的想象是不是有一些差异?那么从这张图上看,中国移动、中国电信真的是很强啊。这其实也很简单,比较好理解。什么呢?他们建算例中心了嘛,其他人跑到那去租了。你比如说像阿里云,没准说我上中国电信的机房里去租了一些,你已经买到手的这种H20或者是A800、H800这样的显卡,我来去把阿里云部署上去去用,不也是可以的吗?电信运营商的云计算机房。
他就是这样的一种东西。以前我们在盛大网络的时候,其实跟这些电信运营商就是这么打交道的。怎么干呢?我们有网络游戏,电信营商有机房,我们就跑到那去说:“来吧,你就成为我的代理商吧!你用你的机房入股,只要把我的点卡卖掉了,在你那把它消耗掉了,咱们就直接来分钱就完事了。”现在应该很多的算力云也是这么在去操作。
那么,中国联通去做什么了?这事稍微有些好奇。因为你想,移动电信都这么猛,联通没有什么事,这也很奇怪。那你说华为这个遥遥领先,自己还造显卡,他买这么多英伟达干嘛?自己家的升腾910B难道它不香了吗?原因其实也很简单,华为其实是个系统集成商,它会给很多的机构单位、政府去搭建这种算力中心。在搭建的过程中,可能有很多的显卡就会从华为这边进口买进来。甲方要什么他就给什么,他也不能说:“我有升腾910,甲方说不,我一定要买英伟达。”但是我就不卖给你,这事人家也不会干。
中国基础设施建设的红利呢,英伟达肯定是吃到了,而且量还很大。所谓的基础设施建设,也就是大基建。这是咱们原来做东数西算,英伟达在这个时代就算是新的IOE了。IOE是什么?就是IBM、Oracle和EFC。为什么叫IOE?这是这一品类里边最好的品牌。你只要买了这个品牌的东西,出了任何问题,你怪不到我头上来。所有这个品牌的东西,或者符合IOE规律的这种品牌的东西,只有一个缺点,其他全是优点。这唯一的缺点是什么?贵。
你只要是把钱花掉了,剩下的出了任何问题。你比如说你在我的机房里头发现不兼容了,或者出现事了,那你找到我,你这为什么买了他们家的东西?英伟达都出错了,你要买别的更烂了,这肯定是这样的。国家会有一些拨款,直接拨下来做这种算力中心建设。在各个大会小会,从年初开到年终,所有的会上国家都在喊:“说我们的基础设施建设里头,要去建这个算力中心。”所以这块是有大量的拨款下来的啊,哪一个企业,哪一个地区,如果没有把这拨款给你花掉。
那他们会觉得亏死了。你不花,别人会花。而且这些大的央企,特别是电信企业,他们自己也有巨大的现金储备,或者说很低廉价格的现金渠道。什么意思?他借钱的利息都比你借的低。所以在这样的情况下,干脆他就动用他背后的现金储备,或者是他的信用,直接从银行拿到无息、低息,或者各种贴补的贷款,他就可以来干这个事了。要比普通的企业做这个事,肯定要方便得多。
那真正的这些大厂,比如说BAT这些厂,我租就好了。我为什么要一下把现金都占压在这里,把我的信誉都变成显卡堆在这里?不划算。而且英伟达那边还在更新换代、升级。我万一买一大堆这个东西,旧了以后,你说我到底是更新换代,还是不更新换代?这个事太麻烦了。咱还是吃大户的就完了。所谓大户呢,也就是国家的。所以他们就直接租。
而这个小厂,他们有些时候就直接转租大厂。什么意思?租这种云设备,如果说我租一个比较小的单位,比如说我租个两天、租个两台,它是比较贵的,成本也比较高。所以一般的这种大厂,像阿里、百度、腾讯这些大厂,他们会一次性打包一大堆东西给他一起租下来。租完了以后,再在这个里边切分划分,划好了以后再分别包给这些小厂。而且他在这个过程中,还给你上了BAT的服务,BAT相应的软件系统都给你做好了。这个呢,对于小厂来说,你不需要那么高的技术维护能力,就可以直接用起来了。
所以这就是在国内正常的玩法。而且呢,在国内要注意,有很多生意只有官家来做才方便。普通人你做这个事是很痛苦的,做不了。为什么?第一个,各种证书你要想去申请,你申请得到吗?特别是跟ICP、ISP这种算力中心相关的证书,你是申请不到的。就算是阿里云、腾讯云,他们很多也是跟各地政府一起去合用这些证书,或者说我挂靠,或者通过一些收购的方式,能够有一些证书去使用。
所以在中国,第一个就是证书你搞不定;第二个,什么外汇?你如果手里有美元,你敢说你有?你为什么没有从国外结汇结回来?
如果你把这个外汇结回来,变成人民币了。你说我现在再想用美金,到海外去买伟达显卡,那你看看是不是又要去搞批文,要重新做进口,这事很麻烦的啊。但是对于这种大型的央国企来说,处理这个事就比较简单。你说我现在需要很大的一笔外汇,到那边是进口,去买价值可能几千万美金或者上亿美金的这种英伟达显卡回来,对于他来说是比较好做的。但是你对于其他人就费劲了。
而且呢,还有什么,接口跟带宽,这事也是一种政府资源。什么叫接口和贷款?以前啊,很多这种云计算的公司,其实他也不算公司,他们是什么,比如什么张家口电信啊,有的时候会找我们。找你干嘛呢?我们最近啊,整到了一个特别紧俏的资源。我说什么资源啊?一个什么万兆网口,或者是最近有一些什么其他的这种接口资源、带宽资源,整这个你们谁要用一下子,咱们把它分一分,把它用掉。
作为一个普通的企业,你想搞到这种东西是很麻烦的。而且就算你搞到了,你也必须在他的监督下去使用,这个不是一般人能用的了的东西。所以呢,直接让移动他们买完了,大家租是最方便的。这些生意,咱们就留给官家去做,普通的商家就别碰了,就完事了。
而且还有什么,很多政策的制定解读和相关政策执行过程中的辩解和保护,这件事,咱们跟这些大的央国企比起来,也是不具备任何优势的。什么意思呢?很多相关的政策去制定的时候,实际上就是这帮央国企自己在定,他们就有专家。像我们以前也参加过类似这样的标准制定,是安全公司嘛,企业安全的标准,我也会去开会。那会场上的人就是工信部的人、电信移动的人、猎豹、什么360、BAT的人,大家坐在一个屋子里,开始谈说这个东西该怎么弄。
所有这种规则的制定,三大运营商的人都是在场的。而且这些规则,别看BAT人也在场,最终话语权最重的还是第一个是官方,就是工信部,第二个实际上是三大运营商,其他人都是提供参考意见而已。但是吵架时,我们下边这帮人吵得凶啊,总还是要表现一下存在感啊。
最后,都是这些不言声的人。人家把规则标准定下来,定完了以后呢,真正的最后执行跟解读的时候,就没有其他人什么事了。三大运营商还是可以跟工信部去稍微的去挑战一下,去搞一下,争取一下,或者说我们执行的过程中,哪一个地方松一点,哪一个地方严一点,最近有什么新的风向,他们还能搞明白。
这个一般的企业,即使是BAT这样的大厂,通常也没有那么明白。那么,这个图到底哪来的,靠不靠谱?咱们说这么热闹,这个图是海外一个专注于半导体行业的知名自媒体那来的。一看自媒体,这事肯定不靠谱,但这个呢还可以啊。他应该叫Semi Wiki,这个维基呢,后边的博主叫Daniel Naily吧。这位老兄呢,是半导体行业的一位知名人士,从业40多年了,也是写了很多书,写了非常多的文章,所有跟半导体相关的事情,大家还是喜欢去参考他的这个自媒体,或者你说它就是一个大的这种百科全书,大家还是喜欢去参考的。
SEMI Wiki的内容跟数据呢,也还是相对来说比较靠谱。从2011年上线到现在,一共更新了7000多篇博客,有350万读者在读,就是所有跟半导体相关的一个权威,大家认为是杂志也好,或者是一个维基吧。这个图呢,是来自一篇专栏文章,这个专栏呢叫半导体商业智能,估计应该主要是讲英伟达和各种算力芯片。
然后,这个专栏里头写了一篇文章,叫做“英伟达被拉出了黑井啊”,Blackwell。Blackwell是英伟达最新造的这个算力芯片B W 200。但是呢,现在传说B W 200有一些问题,需要迟后交付,导致了英伟达的股价下跌。他写了一篇很长的一篇文章,力挺英伟达,说你们不用担心,这个东西可厉害了,大家不要慌。
那么,这个权威人士的内容也是靠谱的,数据呢我们也认为是靠谱的。中国就只有这些GPU嘛,这是我们需要讨论的下一个问题。这个文章里头还有另外几幅截图,咱们看一下,这个截图呢是购买国家分布。
就是到底有哪些国家在购买英伟达的显卡?这个里头呢,第一名肯定是美国,第二名是台湾,这个也很有趣。美国的话,我按照最新的一个季度,2024年Q2的这个季度来看,他大概是买了全世界可能43%这么多的显卡。而台湾呢,是买了接近20%的比例的显卡。第三名是谁?还不是中国,因为中国现在毕竟是在禁运嘛。第三名是新加坡,买了全世界18%的显卡,然后中国是12%。剩下其他所有国家加在一块是7%。中国大陆在被限制的这么死的情况下,我们去买H20、A20、A800、H800这样的显卡,也能够买到整个英伟达销量的12%,这个是非常吓人的一个数据啊。
这个图呢,还可以看出一点什么,就是英伟达的销量是从2023年的Q2开始爆发的。再往前,其实它的销量是相对来说比较稳定的,到2023年Q2就直接就喷了,基本上是一条直线上去,而且这个线还很陡。英伟达卖掉的显卡都是哪些型号?因为他讲,我们不要看Blackwell怎么样,咱们去看看其他型号卖怎么着。它里头呢,有一大块收入是网络收入(network),我估计应该是在英伟达卖机房的时候,里面进行一些网络连接,什么NW link,可能相关的软硬件给它带来的收入。真正的销售大头其实是H100,大家现在非常疯狂努力地在买H100。剩下的呢,还有极个别的开始买GB 200,就是Blackwell 200,还有一些A100现在也还在销售。
这是英伟达现在整个的收入,大概能够占到我觉得60%往上70了,都是H100。所以他那意思就是说,大家不用那么担心,Blackwell搞不定了怎么办,现在H100大家觉得够使,还在努力的买着。咱们看到了这么三张图之后,大家觉得中国还是只有这点显卡吗?能够被统计的按道理来说,就是刚才咱们讲中国移动、中国电信、华为,他们买的这些显卡应该是H20,特别是到2024年了,肯定都是H20。那么大家有没有想过一个另外的问题?
台湾跟新加坡,他们需要这么多显卡吗?他们会买这么多显卡,把它堆起来吗?这些显卡有多少通过走私渠道到了中国呢?台湾的20%,新加坡的18%,这一部分到底去哪里了?是不是会有些人感到困扰?其他国家真的能买得起7%的显卡吗?这东西好贵的。
还有人说不要看不起欧洲的AI,他们现在融资很厉害。咱们看看谁买多少显卡,就知道他到底是真的是假的,是不是在吹牛。我们相信还有相当一部分显卡是通过台湾、新加坡以及很多其他国家,或者东南亚的一些国家回流到中国来了。
特别要注意的是新加坡,为什么呢?因为大家知道,在咱们经济开始稳中向好之后,大量的中国企业,特别是VIE企业,他们喜欢把运营总部放在新加坡。在新加坡这个地方去进行各种全球性的贸易,跟美国、跟台湾、跟各个地方去交易,都是在新加坡交易。所以新加坡买了很多东西,未必是用在新加坡的。
另外,新加坡就是一个城市国家,你在这样的一个国家里头寸土寸金的,盖一大堆机房在里头塞显卡,而且还是个热带地方,你还要烧了空调。算算力中心,这个事儿他不划算。所以新加坡大量的跑货,都应该是转口到其他地方去了。
新加坡,你不要说地贵、电贵,或者其他这些资源贵,只有一样东西他就搞不定,那就是人。在新加坡建立一个机房,让一堆的技术人员、维护人员去维护这些机房,他得多贵。所以在那个地方去建算力机房这件事,在商业上是完完全全不符合逻辑的。
但你说新加坡一点没有吗?也不至于,新加坡还有这么多大学,他们可能还是有那么一小部分的算力云什么在那儿。但是我真不认为他们可以买到全世界18%的算力卡,在那个地方去吭哧吭哧地算。这些算力卡应该大量还是流回到中国了。
那你说这些卡哪去了?除了中国电信之外,这些卡去哪了?大家注意啊,除了移动电信,各个省市其实都是有计算中心的。咱们的这种计算中心也算是一种资源,每一个行政机构,甭管是横管还是竖管,他都会说我们自己是不是整一个。
哪怕说:“哎,我这是交通部,我这是铁道部。”我们是不是整个集团中心?所以这些卡可能就彻底被分散到了各个国有企业、央企或者一些政府机构里边去。那么这些卡是哪来的呢?或者怎么进来的?
最近,超微电脑正在被做空,做空的理由是账目混乱,导致出口管制没有很好地被执行。这是做空机构给他写的做空信。超微电脑也很神奇,不说承认,也不说反驳,什么也没说,给了一个回复,说:“我这个财报晚两天再发。”这个大家自己品就好了。
所以我觉得,中国大陆拥有全世界第二多的英伟达各个型号的显卡,还是存在一定的合理性的。而且在这个里面,有大量的是美国政府禁止出口的。中国的显卡实际上都禁了啊,即使是算允许进口那部分,中国也可以在全世界所有的国家里头排到第四:美国第一,台湾地区第二,新加坡第三,中国第四。
那么最后一个问题,我们在AI领域里头跟美国到底差多少呢?原来老说我们没有算例,现在我告诉大家,有!我们有算力,而且算力其实并不少。正常情况下,我们现在做AIGC需要三样东西:人才、算力和数据。人才这个事我从来不认为中国缺,特别是这种工程技术人员。咱们在这块一定是全世界最好的。
算力,刚才按照我们的分析,中国应该也没有那么缺算力。我们算力肯定没有美国多,这个事是确认的,但应该是第二多,估计应该拥有全世界可能20%多,甚至接近30%的算力卡。这个事是相对来说合理的,美国大概拥有40%多,咱们大概拥有30%多,剩下的所有国家和地区去分,剩下的可能百分之二三十的这种算力卡。
数据,其实我们也不缺,我们产生了大量数据。至于说数据质量高低这件事,我觉得没什么可讨论的。英文数据质量确实是要有一些很有质量的,比如说论文这个东西,也不是说咱就拿不到,咱也可以拿到回来去训练嘛。中文的数据也有大量的,你不能说大家每天去做政治学习文章就低质量。你写了很多出来以后,还是可以学出一些不一样的东西来。
再加上中国这么多人产生了这么多的文学作品、这么多的小说、这么多的短视频、这么多的微信里的聊天记录,这些东西它都是内容。那么这些内容一样是可以作为数据去跑大模型的,这个都是没有问题。所以数据我从来不觉得咱们缺。
那你说咱们啥都不缺,那到底跟美国人之间差哪了?有什么东西?咱是不是还有点优势?我们有些地方还有优势,就是应用场景跟收益这一块,我们其实更好一点。什么意思?在中国很多新技术来了以后,不管是国有企业还是政府机构,他们都属于可以义无反顾地去用起来的。这帮人没有那么多的说:“哎,我这以前刚用过,或者刚升级过,我是不是用一段时间再升级。”他们从来不抢这个,哎,又有机会花钱了,我要赶快去花一把。这个是国内的很多政府机构和大企业习惯性的思路。
他们还干嘛叫“拉锁路”?我这个路挖开了,铺根管子进去,待会再挖开了再铺根线进去,再待会挖开了再铺根光缆进去。他们为什么干这事?你不停的折腾,不折腾哪有钱?所以中国人在应用AI的角度上说,在这个全世界范围内,我们应该是跑得比较快的。而且从投入产出来说,我们其实也还算划算。为什么?因为我们工程师便宜,而且人还多。收益,因为大家愿意用,你还是有一定收益。没准一些企业就可以直接在这活下去了。
那同样的事情,你在美国未必活得下来,因为他工程师贵,大家去采购这种项目的时候,也相对来说要比中国的政府和这种大企业要谨慎。所以这块咱们还有些优势。
那你说中国到底有什么劣势啊?那照我这说法,咱们是不是又厉害了我的国了?咱们也有一些劣势。第一个劣势就是合规成本不可控。这个什么叫合规成本呢?咱这就不再详细讲了,听我节目的人应该是知道啥叫合规成本的。那为什么叫不可控,而不是说合规成本高这个事呢?很有意思啊,咱们是分两个方面来去理解这件事。第一方面,所有ToC的应用合规成本都是很高的。什么叫ToC应用?就是个人用户来使用的这些项目,它的合规成本很高。
说错了话就要拔网线,或者有很多人要受到巨大的处分,或者要受到巨大的经济损失。这件事是非常危险的。另一方面,所有对政府和对商业的这种方面,我们的各种应用是百无禁忌的。你在美国,比如说我们想上一个什么医疗系统,想上一个监控系统,那麻烦死你,我告诉你,他不允许,各种的保护隐私。但是在国内,上呗,这有什么?我只听我老板的,其他的都不重要。领导的看法是第一大法的,所以他们完完全全肆无忌惮。咱们的合规成本在这块,对一部分来说很高,对一部分来说基本上可以忽略不计。
那么,中国真正的劣势在哪?合规算是一部分,但也不是完全负面的。有一部分是正面的。咱们做的很多监控软件和一些奇奇怪怪的软件,我们做的是要比美国人好的,因为没有那么多条条框框。咱们真正的劣势在于算力太分散。什么叫算力太分散?你想,马斯克的XAI有多少算卡?非常多,十万块还是多少万块算卡。他拿这些算力卡可以集中力量办大事,可以把他的这个grok的版本一级一级往上推。OpenAI有多少算力卡?他可以拿着微软的算力卡去疯狂的计算。谷歌有多少?亚马逊有多少?Anthropic跑的是亚马逊的这个算力卡,他们都是几十万块的往上跑。他们等于非常集中的算力卡,才可以去维护一个什么东西,叫做缩放法则。
因为现在大家冲的就是缩放法则,我用更多的数据,用更多的算力卡集中在一起进行一次的这种运算,他可以推出更好的不一样的模型来。而这些算力卡一旦分散开了,比如我现在都到云计算中心去了,都交给中国移动、中国电信了,或者交给各省市,再加上交通部、航天航空,每间都买一堆,那这个就分散掉了。以后你就没有办法说我现在想要十万块H100,我们去推一个grok2出来,你就没有这个能力了。这个是我们现在真正缺的。所以,中国需要的是巨头,这样才能够去追赶Scaling law。如果像现在这样,我们整了一大堆的算力卡进来,四处分散,撒了胡椒面了。或者说,我搁在云计算机房里头。你租5块,他租10块,大家都做一大堆实验型的这种小模型出来。那个是会跟美国越拉越远的。
好,这就是我们今天主要讲的内容:中国到底有哪些大企业在去买美国的英伟达的显卡?中国是不是真的只有这么多显卡?以及中国跟美国之间,AI到底差在什么地方?
好,感谢大家的收听。请帮忙点赞,点小铃铛,参加Discord讨论群。也欢迎有兴趣、有能力的朋友加入我们的付费频道。再见。
Both comments and pings are currently closed.