TPU – 老范讲故事｜AI、大模型与商业世界的故事

DeepSeek R2难产真相！金融时报爆料：华为昇腾芯片训练失败，揭秘国产AI算力的“卡脖子”困境。

Luke Fan — Mon, 18 Aug 2025 13:35:27 +0000

8月14号，英国金融时报发了一篇报道，说Deepseek R2模型之所以难产，是因为在使用华为升腾芯片训练的时候，持续遇到了技术问题，最后被迫改用了英伟达芯片。甚至透露华为曾经派出一支救火队，常驻在Deepseek，手把手帮忙调教升腾服务器，但仍然无法完成训练。无奈之下，Deepseek只能退回老路训练，重新切换回性能更加可靠的Nvidia的GPU，升腾芯片仅退居辅助，用于模型推理环节。

虽然没有华为和Deepseek官方的回应，也没有他们的辟谣，但是呢，据说是援引了三位知情人士的一些说法，也进行了很多交叉验证，所以这个事情呢，大概率是真的。

国运跟国运相碰撞的时候，升腾也号称是国运级产品，Deepseek肯定是国运级产品，为什么是升腾不灵呢？升腾芯片是可以替代的，也还有一堆竞争对手，所以出现问题以后，他的竞争对手会帮他去宣传。而Deepseek虽然在国内也有模型在追赶，但是地位是不一样的。升腾和国内的其他算力芯片，以及其他那些大模型，从来没有像Deepseek那样震动过世界。所以呢发生碰撞的时候，必须是升腾不行了，不可能是Deepseek不行了。

大家为什么会这么期待Deepseek R2呢？现在又有千问3，也有Kimi、Mini Max，还有豆包等，有一大堆的这些模型出来，怎么就只有Deepseek才行呢？其他人为啥都不行呢？其实现在呢，很多新的这些模型已经并不比Deepseek R1的性能差了，基本上是可以替代使用的。但是大家依然在期盼Deepseek R2，而且你只要讲Deepseek要出R2了，就会有流量。这个原因其实很简单，因为我们在跟国外的大模型竞争中打不过了。

国外已经进入了10万级芯片的训练时代了。Llama4，40万块H100训练出来的。虽然Llama4翻车了，但那也是10万块。而马斯克XAI的Grok 4，20万块H100训练出来的，效果相当不错。GPT5的话，现在推测也是20万块H100训练出来的。Anthropic的Claude 4，据说呢是40万块H100，但是呢它这个数并不是那么准确，40万块H100呢是一个部署的数量，并不是精确的训练的数量。另外一个没说的是Gemini 2.5。Gemini的2.5是没有公开数据，因为他们家使的TPU，其他人都是使的GPU，所以呢没有办法去比较，但应该也是几十万块H100的一个算力，才有可能训练出Gemini 2.5来。

以前是一个国外大模型特别强，特别是GPT4压着所有的模型的时候，我们终于期盼到了Deepseek R1一出来，觉得我们好像又可以了。但是现在我们发现，国内的大模型跟国外这些明显有差距了。我们只能再去期盼Deepseek，因为其他这些肯定是追不上的。那没有20万块H100，这个日子就没法过了。国内的算力芯片呢，大家也都知道不是那么靠谱。这个时候大家期待的就是奇迹了。

Deepseek V3、Deepseek R1，他们呢号称使用了2,048块H800，还不是H100。他们这个算力转换，可能也就是1,000多块H100。拿这样的算力就直接训练出来了，大家觉得你们可以用很少的卡训练出来，还可以震惊世界。现在我们还搞不定20万块的H100，是不是依然可以期待Deepseek再创造一次奇迹呢？

Meta花了好多钱收入进去的亚历山大王曾经在接受采访的时候说，Deepseek手里头有5万块H100，压根就不是他讲的几千块就给这事搞定的事。而且呢，新加坡3月份还抓了一些向大陆走私英伟达芯片的人，有传闻说这些芯片的采购方里边包括Deepseek。

Deepseek呢也正式做出过回应，2025年2月份做了回应。Deepseek强调，仅使用了2023年合法采购的H800芯片，其他我都没用。但是讲完了这个以后，甭管你原来这个东西到底有还是没有，你讲这个话以后肯定就不能再用了吧？所以呢现在大家期待说，这个反正你们原来是这么讲的，我们就这么信了。那以后呢创造奇迹也只能是等着你了。哪怕是使用H20芯片，用很少的芯片训练出来，堪比20万块H100芯片训练结果的这种奇迹，也不是完全不可能吧？这个怎么说呢，人有多大胆，地有多大产吧。我们总还是要有一些希望吧。

新的模型没有出来，但是新的论文呢，Deepseek其实一直不断在产生。在V3跟R1之前，Deepseek也没做什么铺垫，这不也就突然蹦出来了吗？他是这样去期待这个Deepseek的。

原来讲是8月15号到30号之间要发新版本，最后Deepseek自己出来辟谣说：“对不起，我们发不出来。”英国金融时报出来说，被这个升腾给拖累了。那这消息是怎么传出来的呢？Deepseek原来是有没有说过自己要去发Deepseek R2这件事呢？

首先呢，是Deepseek R1震动了世界，应该是在2025年春节前后的时候，我印象里特别深刻。Deepseek R1出来以后，我还连续做了很多天的直播来跟大家讲这个事情。国际大厂呢，在Deepseek R1的这种搅动之下，纷纷转向。转向什么呢？主攻数学、科学与编程，然后呢是长上下文、工具调用和agent，以及指令依从、降低幻觉。

数学跟科学这块呢实在太难了，这个咱们不擅长，而且那个你真的是需要可能10万块、20万块卡，你才可以把这事搞定，咱们没有。那编程呢基本可用，国内的这些模型做编程，肯定没有Anthropic的Claude 4好用，但是呢也基本上可以跑。长上下文、工具调用和agent这块呢，包括指令依从这一块呢必须要有，这一块其实国内的大模型基本上已经追上了。剩下的呢降低幻觉这事咱们就不谈了，反正有幻觉还是可以甩锅的事情。全面开源，这个是国内大模型真正卷的地方。千问直接把200多b的模型直接就开源出去了，Deepseek 600多b的模型直接开源出去了。这件事情我们在努力的往前走，所以各有所长吧。基础设施这块、数学科学这部分实在是费劲，大家就期待Deepseek来再创辉煌了，其他人就不管了。

Deepseek发R2这件事呢，其实传了两回。一回呢5月份，风起云涌。每一次说Deepseek要出R2的时候呢，都是风起云涌的时候，大家都在上新模型，说呀Deepseek你也得上，所以就会开始给他传这个事儿。

今年5月份，发生了一些什么样的事情呢？首先呢Claude 4、Opensource和sonnet这些模型直接出来了，王炸。5月份开谷歌IO，Gemini 2.5 Pro和Gemini 2.5 Flash直接发布，这个其实现在已经是我的主力模型了。GPT呢当时倒是没有什么特别大的动作，上了一个Deepseek 4.5，但是呢也没有引起特别多的响动。大家就说Deepseek你们也该来了。但其实呢Deepseek没有去出R2，而是把Deepseek R1的模型稍微的小步更新了一点点。

6月26日，the information就做了一个报道，说Deepseek R2原来计划是5月份发布的，但是呢因为梁文峰对于Deepseek R2表现的性能不是很满意，决定推迟了。路透社呢也引用了the information的这个报道，国内的媒体呢也纷纷去引用。但是这件事呢，并没有得到Deepseek官方的回应。Deepseek这个公司就是这样，他基本上不怎么回应大家的这个响动。你们猜吧，猜完了以后我也不理你，除非是有一些太过分的，否则他一般不说什么。

Deepseek呢也不是说没更新，就是做小版本更新。像Deepseek V3出了0324版，也就是2025年3月24号出了一个版，把分数又往上刷了刷。因为每一次去更新这些模型，一定要刷分数上去。代码能力，特别是前端代码能力呢，有所提升。拿这玩意写个网页没什么问题，但你说我要做一些大的架构，或者做一些这种后端的东西，可能就要稍微费劲一点。做算法的东西要费劲一点。为什么？因为它Deepseek有一个问题，就是它的上下文比较短，想去做一些大的架构上的东西，你必须上下文长，你得能把整个代码塞进去才行，这块还是要费点劲的。然后他把中文写作能力做了一些提升，Deepseek其实一直在努力的方向，就是中文推理。因为在海外的这些模型，很多都是使用英文推理，然后再翻译成中文的。他说我们直接用中文推理这个事，是不是OK？他们一直在努力干这件事情。使用体验上呢也有所提升，特别是function call更加准确了。在做AI agent的时候，其实核心就是function call的能力，就是我们先描述一堆的功能，然后交给大模型，大模型在完成整个的语言生成的过程中呢，去根据你描述进来的这些function，去决定我要调哪个、不调哪个，或者如何去调用、什么时候调用。Deepseek V3 0324呢，就在这一块做了一些增强。

Deepseek的R1呢，其实也更新了一个版本，就是0528。大家在传说Deepseek要出R2，讲的其实就是0528的这个版本。而这个版本呢，其把这个分又往前刷了刷，减少生成的一些错误信息。因为Deepseek最大的让大家无法忍受的东西是什么呢？就是胡编乱造，他太喜欢瞎编了。所以在这一块呢，稍微做了一些调整，但是依然胡编乱造的很厉害。Deepseek 210528呢，还支持了Json输出和function coding，提升了调用的准确度，但是呢不能叫R2。这就是5月28号的这个版本。

紧跟着就开始传说了，说8月15号到8月30号，要准备发布Deepseek R2了。这个消息是怎么来的呢？首先肯定还是要风起云涌一下。8月份发生了些什么事情呢？马斯克XAI的GROK4发布了，Anthropic又发布了Claude 4.1 Opensource，OpenAI发布了GPT5。GPT5这东西到底好不好使，大家各自去领会。大家可以认为说，GPT5是一个划时代的产品，但是也可以认为说，GPT5就是山姆奥特曼为了要去忽悠融资去搞的一个事情。因为GPT5出来以后，OpenAI的估值已经正式从3,000亿美金提升到5,000亿美金了，而且是孙正义要去买这个单，说您这5,000亿美金我认了，我去买去。

所以呢8月份风起云涌了。那么空穴来风呢，你这事怪不得别人。在Reddit上有人发了个帖子，这个帖子特别有意思，他说他去问了Deepseek R1：“Deepseek R2什么时候发布？”他等于是把这个东西交给Deepseek R1了。但是大家注意，Deepseek R1这个大模型呢，它并不代表Deepseek这公司的一些官方的观点，只是说这个模型给你生成了这样的一个结果。Deepseek R1回答了：“8月15号到8月30号之间发布。”而且号称呢是引用了雪球和东方财富等可信的信源，而且进行了多个渠道的证实。

Deepseek R1的幻觉其实一直都是很严重的，虽然经过0528的调整以后，但依然很吓人。而且Deepseek R1的最大幻觉是什么？就是编造可信的信源。说我从哪哪引用了，你点进去以后，压根就没有这篇文章。但是甭管怎么说，这个文章就在Reddit上就贴出来了，随后呢这个消息就逐渐的被传播和放大了。国内的很多的媒体、自媒体就开始引用这篇消息，特别呢是华为下边的一些科技媒体进行了转载。而且呢在标题里边还夹带了私货，讲的是什么呢？讲的是深度求索，就是Deepseek这个公司，“升腾芯片版本Deepseek R2预计在本月发布”。它讲的就是说，它是使用升腾芯片来去做训练的。

华为都说了，两大国运级产品强强联合了，那信吧，这事怎么办呢？国内一帮的媒体就冲上去说：“我们信了，确实是有这事了。”到8月14号，英国的金融时报出来报道，说升腾芯片拖累了Deepseek 2。然后动点科技、腾讯科技就出来辟谣，原引自公司内部人士，也就是Deepseek这公司里边的人说了，说8月份不会发布Deepseek R2。所以呢，8月15号到30号之间发布Deepseek R2的一个消息，实际上是Deepseek R1自己编出来的，其他人把这个编的信息信了，直接截了个图发到这个Reddit上，以此来发酵出来的一个过程。

那么Deepseek R2到底遇到了一些什么样的问题呢？首先升腾芯片确实是有问题的。升腾910C的这个芯片，虽然单芯片的算力在部分指标上呢，已经达到了H100的水平，但是呢显存的带宽不够，想从显存里调数据回来，速度是没有H100快的。而且最大的问题是什么？就是多个芯片之间的速度，就是我需要把数据在多个芯片之间进行流通的时候，这个速度是相对来说比较差的，而且差的很远。你要想去做同样的训练的话，你就需要更多的时间全功率的去运转。因为你想，人家都已经达到20万块H100这样的集群的规模再去训练新的模型了，你没准就是需要这个50万块或者60万块升腾910C串在一起，才能达到人家那个算力，而且你需要很长的时间去连续的运作，这个对于升腾910C的这种考验来说就比较大了。

这样的芯片，其实是没有办法长时间稳定地去运行的。并不是说训练一个模型，这头输入进去数据，过三个月去开盖看结果。中间每过一段时间，可以取得阶段性成果，再继续往下训练。但是中间这个过程呢，你是不能停的。你中间比如说准备了一批数据，你去训练了，如果这批数据没有训练完，升腾910C就直接冒烟了，就不干活了，这一波呢就白干了，你必须要从这个节点接着往后干。这个玩意有点像什么？有点像打怪升级，你一定要打死这个妖怪才能存盘，你没打死这个妖怪就不让你存盘。升腾910C在这块差一点。

那为什么差呢？升腾910C呢，是两个910B堆叠在一起的，散热肯定会出问题。就算是上了液冷以后，依然是搞不定这个事情。

其实同样的坑，英伟达也踩过。大家还记得H100独挑大梁好久了吗？很多人应该还是有印象的。甚至呢到现在为止，H100已经成为一种计量单位了。现在我们再去算说：“你这个算力相当于多少英伟达芯片呀？”我们都是以H100的这个算力作为一个计量单位的。就是因为H100挺长时间在那孤独一只。为什么它会孤独一只呢？本来计划替代H100的这个产品叫B100，叫Blackwell黑井100，这个芯片直接就跳票了。研究完了以后开了发布会，开完了以后，这个芯片压根就没有大规模的部署，也没有交付。为什么呢？就是他做的就是这种堆叠技术，导致散热失败。散热失败了以后会直接把版卡烧掉，这压根就没有办法去交付。到H200出来了以后说：“那这咱交付这个呗。”但是一开始依然是受困于散热问题，导致了大规模交付的延迟，一直到今年才开始去交付H200。

后面的工艺呢不断的进步，再加上全面液冷。H100这些机器是可以进行风冷的，你拿风扇吹它是OK的。但是到H200这个机器开始交付的时候，你必须是液冷。而且这种液冷呢，还不是种普通的液冷，叫完全浸泡式液冷。见过这种游戏主机装机视频的这些人，会知道他们那个液冷是怎么做的。他在芯片外面给你涂散热的胶，然后呢把这个液冷管贴上去，靠这个液体呢快速的把你热量带走到外边，再去找风扇把这个水给你吹凉了，再重新循环，它是这样来工作的。但是这种工作方式对于H200来说还是不行的，它必须是全浸泡式的，就是把整个的H200的芯片，或者包括它整个的板卡，一起泡在这个液体里头。这就肯定不是水了嘛，是一些不导电的水，整个泡在里头，才能够达到散热的这个能力。

当然了，甭管是英伟达也好，还是升腾也好，散热都是有问题的，导致什么呢？就是液冷概念股都涨疯了。你只要说我这公司是做液冷的，就赶快涨。而且现在都是浸没式液冷，就把整个板卡都泡里头。A股上强瑞科技、英维克、深林环境、飞龙股份，大概有十来家公司，都是专门做液冷的。飞龙股份是专门给升腾这个384超节点做液冷的。美股那边的话，有一个叫VERTIV的一个公司，它的代码是VRT，是专门给英伟达做液冷的公司，这个公司的股票也是涨的可好了。

讲回来，910C这个芯片连续的做长时间训练的话，液冷也压不住，直接把板卡烧掉。即使是有大量的华为的工程师坐在Deepseek公司里头，出来我帮你调，他也调不过去。实际上这些华为工程师能调什么呢？他们只能调一件事，就是CUDA里头没有实现的部分，我来帮你去实现一下。华为的这个升腾910C，他们使用的训练相关的代码的话，是华为自己开源的一套训练框架。这套框架据说是可以实现CUDA 70%的功能，但是还有30%你是实现不了的。那这一部分由华为的工程师到现场来搞定。再怎么搞，该冒烟、该着火、机器直接停摆，这个事它是解决不了这问题的。

另外一个传闻，DEEPSEEK R2出不来的原因是什么呢？是数据标注的质量跟速度不过关。这个呢也没有得到官方的证实，也是坊间在流传。因为在中国嘛，很多的数据肯定还是需要去审核一下的，这个审核的过程是相对来说比较麻烦的。

而且Deepseek呢，其实一直也是一个比较低调的公司。提前预热，不停的出来吹牛，这件事呢是容易翻车的。山姆奥特曼每次出来讲GPT5，说：“我太震惊了，我从来没见过这么棒的。”等GPT5发布的时候，大家说：“这就能让你震惊了？您到底是眼皮子有多浅？”马斯克在发布GROK4之前，也在说：“这是我所见过的最聪明的大模型。”也有人认为老马吹的有点过头了。

其他的公司都必须不断的发模型，跟着一起卷，不断的来吹牛，这个事是有原因的。为什么？因为这些公司是需要融资的。马斯克发GROK4发完了以后，马上就给XAI去融资。山姆奥特曼GPT5发完了马上融资，这公司直接值到5,000亿美金了，他现在已经是没有上市公司里头最贵的一家了。第二家应该是SpaceX，再往后是3,000多亿的字节跳动。但是大家注意，字节跳动的收入现在好像已经超过Meta了，这个是非常吓人的一个事情。所以这些人他有融资的需求，你就必须得不断的出来炒这个热点。不炒的话，你说我现在想提高估值，融资这事费劲了。而且现在Anthropic也在融资，而且是要按照1,500亿美金的估值要去融资，我估计他们后边的日子不是那么好过，现在他们的CEO应该已经奔中东，找中东土豪去给钱去了。

谷歌呢虽然不需要融资，但它后边有股市、有股价、有市值这些东西，所以呢不能落后，所以谷歌也必须要不停的推陈出新。实在做不出来东西呢，确实哪块也做的不太行，怎么办呢？你还可以像扎克伯格那样，表演抢人大戏这种行为艺术。我发2亿美金的薪水，我把人抢回来。虽然你的Llama4像屎一样，Llama再往后怎么走谁也不知道，但是看到你表演行为艺术表演的这么热闹的话，Meta的股价涨的也还可以。所以大家必须不停地去表演。

但Deepseek自己，他没有这种融资的需求，所以呢也并不太需要出来表演，自己踏踏实实做自己的事就好了。至于说他到底做成什么样，咱们也只能在外边来看。

大家有没有想过这样的一个问题：到底是谁家的芯片能够训练大模型呢？训练跟推理是完全两个不同的概念。训练你是必须要长时间高强度的工作，而且在中间是不允许停的。而且在训练的过程中，我们需要在更多的芯片之间进行数据的调度，更更大规模的这种协同。国内的这些算力服务器都搞不定这件事情，他没有办法说让这么多的芯片相互之间进行协调的情况下，这么长时间稳定的工作下去。推理的话相对来说要简单一些，可能只要几个芯片读出很少的数据来，他就可以把这事干完。比如说我们去提了一个问题，他给我们过了几秒钟做了一个反馈，反馈完了以后呢，他就可以再给我们分配其他芯片了。在这个过程中，芯片出现任何的问题，过热了或者说你对资源进行切换了，它是不影响的。所以呢推理咱们国内的这套系统是可以的，但是训练搞不定。

那么到底谁家的芯片可以做训练？英伟达这个必然是可以的。除了英伟达之外，还有哪些芯片可以进行大规模的这种模型训练呢？你说我这个芯片训练了一个10B的、20B的模型，这不算。或者说你说我这个虽然能够训练，但是我训练的模型从来没有人用过，这个也不算。现在唯一证实了可以进行大规模训练的，而且是训练这种大模型的，还被大家普遍接受和使用的，猜猜是谁？

很多人可能会猜是不是AMD？AMD MI300，或者现在应该是MI三百零几了吧，这样的一个芯片。不是他们。现在唯一的一个能干这个活的人，是谷歌的TPU。Gemini大模型是在上面训练出来的，Anthropic的Claude模型有部分声称是在TPU上训练的。除了英伟达之外就是他们了，再没有第二家了。

那老牌厂商像AMD、英特尔，号称我这个芯片是可以进行大规模的模型训练的，也给出了一些用他们的芯片训练大模型的实例，甚至呢还训练了一些不太流行的小模型拿出来去开源，但是他们训练出来的模型也没人用。AMD跟英特尔呢，一般大概也就是10B或者20B以内的这些小模型。另外一个呢就是富士通，富士通用一款ARM的CPU呢，也训练过一点可能也是10B以内的这种小模型吧，也没有听说过谁去用他们。

其他的一些ASIC芯片呢，也是号称自己能做。所谓ASIC芯片呢叫专用集成电路，像升腾、谷歌TPU呢都属于ASIC。亚马逊、阿里、百度呢，也都号称可以进行训练，但是呢没有实例。亚马逊号称是我拿自己的ASIC芯片呢，做了一些训练，也有几个模型，但是呢谁都没用过。OpenAI的模型，有些据说是在亚马逊上进行训练，但这个事呢，也没有得到最终的证实。百度呢是号称自己设计的ASIC芯片可以去进行训练，但是反正百度自己家的模型烂的跟屎一样，我们就不去评论了。

至于华为的升腾芯片呢，科大讯飞号称是在上面训练的。但是呢也有朋友跟我讲说，科大讯飞其实是在英伟达上训练出来的，只是呢对外宣称是在升腾上训练的，这个我们就不去做考证了。只是科大讯飞的模型，其实也没有那么普遍，除了一些教育领域里头有些人会去用，其他的让你自由选择的时候，很少有人会去选择用科大讯飞的模型。华为呢自己号称是在升腾模型上训练了盘古大模型，但是呢前面被内部的人指责蒸馏、指责抄袭，之后就不再有任何声音了。所以现在华为已经不再提他的盘古大模型这事了，估计是准备装一段时间的死狗以后，再次遥遥领先。所以华为的升腾模型，其实没有证实过训练成功过任何的大模型。Deepseek R2呢，应该是真的尝试过，但是败下阵来。

华为跟Deepseek官方呢，都没有出来证实，就既没有出来说我用了，也没有出来说我没用。所以呢升腾芯片，没有成功的训练出过任何一款大家普遍使用的模型。

那么国内的算力芯片是怎么样去竞争的呢？英伟达大概占54%，就一半多。升腾呢占28%，其实已经占的非常非常多了。像寒武纪等等其他的一些芯片公司的，所有的加在一起，可能还加上AMD的吧，一共占18%。这个大就是国内整个的算力芯片的一个分布情况。

国产的芯片呢，目前来看都是可以去做推理了，但是呢没有哪一个真的跑出来模型过。所以国内的算力芯片，基本上是没有办法做训练的。

现在呢还有一群的“赢学家”在鼓吹英伟达芯片里头有追踪器。但是这些“赢学家”呢，现在有点吹不下去了。他说呀：“这个英伟达的芯片里头，是不是在集装箱里装追踪器了？”还有人说：“是不是在包装箱里装追踪器了？”或者是说：“在服务器里边装追踪器了？”因为他们也知道，在这个芯片里头是装不上的。还有人说：“H20这里头肯定没有追踪器，但是呢H100、B200这个里头有追踪器。”这个呢都想多了。因为中国人是经历过挖矿的，我们是完完全全可以把芯片整个扒下来，重新拿新的版卡去焊。而且大量的，其实做英伟达版卡的公司就在国内，所以我们完全可以拿他的版卡，自己回来去加工这个事情。装追踪器这个事是没用的。

中国官方对于H20的态度呢，也很暧昧。有人就到外交部的新闻发布会上就问：“说你们是不是要准备禁售H20？”外交部的新闻发言人回答是：“没听说过这件事情。”中国的这些官员回答，一般都不会说是或者不是，通常回答是：“请你看以前的表态”，或者“请你看有关部门的表态”，或者说“我不知道”、“没有听说过”。所以他这一次的回答叫“没听说过”。

中国政府呢，也没有明令禁止说我们去销售H20或者谁去买这东西。但是呢潜规则就是这样去运营的。多家媒体，比如说Bloomberg、Marketwatch就做了些报道，说中国的监管部门针对H20芯片表达了强烈的不信任和谨慎态度，尤其是强调相关芯片可能存在后门的风险和数据隐患，建议企业回避在政府或敏感用途使用H20。所以呢这些H20可能最后去做训练就完了，推理的这块就通通交给国内的升腾384超节点就OK了。

还有报道说字节跳动、腾讯、百度等企业被召集，这些人是准备去买H20的。国内的有关部门把你们都召集一块说：“你们为什么要买这东西？买多少？”给他们开这样的会。监管侧重国家安全与网络安全审查，并未提出商业禁令，就是我们还是让你买，但是你买之前呢，我们得把你拎来稍微恶心恶心。所以现在都约谈过了。

总结一下吧。Deepseek R2呢确实是难产了，肯定的没有出来。国内的算力芯片目前呢，也无法进行大规模的模型训练，可以进行推理这个事没问题了，但是训练搞不定。20万块H100量级以上的大模型训练，国内很难突破。如果20万块串在一块可以训练大模型的话，我们可能至少需要40万块或者50万块，比如像升腾910C这样的芯片凑在一起，而且我们所需要消耗的电和时间，可能都是要呈几何级数上升的。因为我们卡之间的联通的速度是相对来说比较慢的。所以比如说H100，它也不是说一直就不坏，它可能工作个20个小时或者是40个小时都会坏一次，会出现问题，对于老外来说就可以去接受了。对于我们来说呢，我们可能要求要连续坚持500个小时不出问题，才能够回收回来数据了，因为算的慢嘛，真的达不到。大概就是这样的一个情况。

国内算力卡的这些供应商呢，很有可能会阻碍中国大模型的进展和训练。为什么呢？自己做不好，你又不让别人买H20，可能中国的大模型再往下一步走，就会变得非常非常困难了。

未来国内算力卡是不是可以训练大模型呢？反正一两年之内呢稍微有一些困难吧。国内的大模型到底能不能用呢？基本还是能跑的。高深的数学、科研研究、物理学或者这些基础学科，我们不去研究了。就是让你去做一些信息整理，现在国内大模型基本上都是可以用的。

还是稍微耐心地等待一下Deepseek的慢慢发展吧，它反正中间只要不需要融资，它也不需要出来吆喝，万一有惊喜呢？这个也不好说。这就是我们今天要讲的故事。

中国AI力量崛起：DeepSeek如何成为国运级创新的代表，搅动全球AI格局？

Luke Fan — Tue, 11 Feb 2025 12:05:47 +0000

第二个故事：DeepSeek到底是不是国运级的创新呢？国运级创新这个事呢，是游戏科学的创始人兼CEO冯骥他去讲的。DeepSeek是一个国运级的创新。游戏科学，就是黑神话悟空的这个开发商。DeepSeek呢，也确实让美股市值蒸发了很多很多钱。而且还有一位美国的参议员说：“我们要下最严格的法令来禁止DeepSeek。谁敢下载DeepSeek判20年，哪个企业敢去用DeepSeek罚1亿美金。”

这个是个共和党参议员叫Josh Holy，写了一个法案，叫2025年美国人工智能能力与中国脱钩法案。禁止技术交流与使用，禁止美国公民、企业与中国开展任何AI技术合作，包括研发、投资、数据共享等。非美国公民若涉及技术转移，可以驱逐出境。然后切断资本与人才流动，禁止美国资本对中国AI企业投资，并限制美籍科研人员参与中国AI项目。任何与中国高效实验室合作的美国机构将面临重罚。违反本法案的个人将被视为严重犯罪分子，可能影响其移民身份、绿卡申请和入籍资格。美国公司不能直接或间接向中国企业提供AI技术支持或者服务。但是这个法案呢，因为太过极端已经被搁置了。

先讲一下使用DeepSeek的方式到底是什么样的。如果你在美国使用DeepSeek，那千万千万不要去DeepSeek网去挂，那是根本得不到服务的。最好是什么呢？就是去在美国的云主机上去使用。现在DeepSeek自己的网站基本上是半瘫痪状态，聊两句就趴菜。我基本上是第一句能聊，第二句能聊，第三句你再怎么跟他聊都趴。他是这样的一个状态。你可能明天再跟他聊，还可以聊两句。API调用的话非常非常慢。而且呢，现在禁止充值了。整个春节期间，API调用的这个页面就打不开了，把整个API后台给你封掉了。现在的话是后台重新有了，但是不允许充值。现在呢，国内是各种云上都有，国内的是阿里云、腾讯云、华为云。华为云的DeepSeek呢。

通过硅基流动可以使用起来，京东云也整起来了。上面也有DeepSeek、百度智能云。我就不知道，李彦宏怎么会有脸干这个事，前面还发表演说，说开源不如闭源，你们就好好使用闭源就好了。人家DeepSeek来了以后，百度也部署了DeepSeek，也给大家去使用，还要收费。然后，火山引擎，火山引擎是字节跳动的，现在是我的主力服务商了，速度还可以，而且现在限时免费，就是你现在上去使用它的DeepSeek，这些模型是不要钱的。它设置起来相对麻烦一点，就是所有这种云计算厂商，你去设置大模型都比较麻烦，但是比BAT还是要简单。

然后，中国移动、中国联通、中国电信，他们参加的云也都有DeepSeek的部署，也都可以上去用去。360智能云上头也有DeepSeek。海外的话，亚马逊AWS、微软Azure，还有一个叫GMI、Claude、together、grok，但是grok上面部署的是蒸馏模型，它就没有布这个满血模型，together上是有满血模型的。英伟达上面也是有满血模型可以去用的。所以如果你在海外说我想去用这个东西怎么办，你就要去这些平台上去使用了。

DeepSeek的这些概念股，我们一说这个东西，国运之战嘛，他一定是有一些概念股的。首先从港股来看，金山云直接涨停板，我去问我说金山云跟这玩意到底有啥关系，没有任何关系。DeepSeek到现在为止，都没有部署到金山云上去。但是呢，大家觉得，这个云计算一旦有了这种通用的可用的开源大模型以后，一定会涨，所以金山云在港股上就直接涨停板了。美图也涨停了，美图其实跟DeepSeek可以也没什么关系，但是他做AI的嘛。腾讯、阿里、百度都在涨。阅文集团，也就是起点中文，做小说类网站，直接涨停板，为什么？因为推出了使用DeepSeek的作者助手以后，作者可以使用DeepSeek来去写小说，可以进行各种的架构设定，各种的环节设定，效果很好的。

我试了一次用DeepSeek R1这种大推理模型去做各种设定的配置，效果非常好，导致其他科技股也跟着上涨，包括地平线、中国软件国际、微盟、联想和中兴国际。

在A股市场上，第一个上涨的是每日互动。每日互动之所以上涨，是因为它有一个联合创始人叫徐进，这个人曾是九章资本（即换方量化）的股东。然而，他现在应该已经从每日互动离职了，与公司完全没有任何关系，只是蹭了这样一个共同的联合创始人的名头。每日互动表示，未来准备使用DeepSeek的大模型进行一些应用，但目前没有任何直接的关系。

第二个DeepSeek概念股是安凯威。这家公司主要生产录音笔。虽然做录音笔与DeepSeek看似没有直接关系，但录音笔录制的内容需要处理，而安凯威的后台使用的是DeepSeek大模型进行处理，因此安凯威也作为DeepSeek的概念股涨停了。

青云科技和Ucloud也涨停了，因为它们都是专门为企业部署私有云的服务商，它们都部署了DeepSeek，并开始为这些企业提供服务。

还有一个公司叫宝兰德，这家公司是由以前Borland的一帮老同事创业成立的，创始人都是我在Borland的同事。他们在国内起名叫宝兰德，主要从事系统集成项目，底层集成的是DeepSeek大模型，因此也涨停了。

比亚迪这两天也涨停了，但它们与DeepSeek的关系应该没有那么大。比亚迪现在称要发布“天神之眼”，原来讲比亚迪自己准备做大模型，大家不信，但有了DeepSeek以后，大家说比亚迪没准也能做出来，于是开始相信。

万兴科技、360和昆仑万维也都擦边跟涨，特别是360，大概连着涨了两个涨停板。但360这事有些乌龙，它确实部署了DeepSeek，但需要在360纳米AI搜索里边使用。

他是不开放出来给别人用的。周鸿祎这一段时间不停地在喊话凑热闹，上来说：“我要给DeepSeek保驾护航。有黑客去攻击DeepSeek了，我要去提供免费的支持服务，我有什么专线，我怎么去做这个事情。”喊得特别特别热闹。喊完了以后，两个涨停板之后，他是需要出来解释的。360出来发了个公告，说与DeepSeek后边的深度求索公司之间，没有任何业务往来和合作。这个整完了以后，大家就觉得说：“你喊了半天到底在干嘛？”所以我在前面想，攻击DeepSeek的这些美国IP，后边有可能是360吧？但是这个咱们只是说猜测，没有任何事实依据。反正他喊得非常非常欢。

那么，到底什么是国运级的创新呢？让美国暴跌，让中国股票暴涨。而且刚才我们讲的这些，好多都是连着出涨停板的这种股票。这是不是就是国运级的创新了呢？我觉得已经有一些这样的苗头了。第一个就是DeepSeek干了一个很重要的事情，叫统一思想。原来有一大堆的公司、研究所，都在那儿做大模型，像刚才我们讲的中国移动、中国联通、中国电信，三大运营商自己都惦记做自己的大模型。实际上就是一帮人拿着什么Llama呀，拿着这些东西再给他调来调去的。现在别费劲了，我们已经不用再去追究你是不是浪费钱了，是不是把钱揣自己口袋里了。现在有DeepSeek，大家一起使呗。原来那个东西做的没有DeepSeek好，这个也没有什么可值得怪罪的地方。这个钱就相当于打水漂就没了，我们就通通都去使用DeepSeek就完事了。因为谁用DeepSeek谁涨停板，就这么简单的一个问题。那干脆赶快都去用吧。

第二个就是什么？他划时代了。国运级的创新一定是要划时代的。原来是各自为战，大家都在做自己的模型，都在互相比较互相踩，说我这个做的比他哪哪好，他那个呢怎么怎么不行。现在没有了，大家都是DeepSeek。我们原来那个还差一点，不丢人，都变成这样了。那么现在的话，底层用DeepSeek可没毛病。

包括像百度李彦宏这样的人，他都把DeepSeek部署上去了。而且我原来也碰到过华为的人，就是他们的盘古大模型，其实他们也不怎么使。他们在内部其实早早就是DeepSeek。所有大厂都装了。从模型逐鹿中原，进化到模型统一了，底层统一了，一起搞应用就完事了。这个事情，我们现在已经把这步迈过去了。那么他也搅动了国际局势，说东升西降这个扯淡了，这个咱们就开个玩笑。美国股市肯定是被搞得动荡不安了一下，而这几天在慢慢的修复吧。A股跟港股呢，正好赶上春节这几天休市，就是最恐慌那段时间，咱们都休息了。而等开市呢，情绪稳定了，咱们就一起跟着涨就完事了。

那么，DeepSeek之后的这个格局，会是什么样的呢？第一个，国内的六小虎都危险，没有哪一个不危险。大家注意，六小虎里头不包括DeepSeek，因为他原来比较低调，排六小虎的时候没给他排进去。原来你有自己的模型，它算是一个竞争上的加分项。原来你有独立模型，还有一个很高的估值，因为我需要很多的钱去做预训练嘛。现在都不用了，大家都是DeepSeek了。你为什么要有这么高的估值？就有这样的问题。

以DeepSeek V3作为基座模型，用DeepSeek R1直接蒸馏微调迁问，肯定要比他们自己的模型还好使。原来那些必源模型还扭扭捏捏的出来说：“你想私有化部署吗？我再收你点私有化部署的钱吧。”现在DeepSeek直接开源免费了，那你还好意思找人收钱吗？大厂呢，可能还会坚持，但这些小厂就六小虎肯定都完蛋了。

现在各大厂有些呢，还会投进去，比如说千问，就是阿里的千问，其实还是很有价值的。另外一个就是字节的豆包，还会继续往前走。但是腾讯的浑元是不是接着做，这个要看了。华为的盘古大模型估计也可以休息了。至于百度的文新一言，从开始那天就是个笑话，一直笑到最后。

国际上呢，现在各国实际上都在开始进行DeepSeek部署，全都在干这事。英国说我又行了，印度说我也行了。

他们都说我有DeepSeek，我就可以自主创新了。别人一开源，我就自主创新，自主知识产权。这事不光是咱们中国人干，全世界人都是这么看的。有了DeepSeek加持的中国，软件厂商也可以去大杀四方了。因为有了基础模型以后，再往后的事情就是卷了。那卷这个事，他们还是卷不过咱们的。

很多AI agent的公司，都可以自己训练自己的大模型了。比如说Perplexity，比如说Cursor，或者是其他的一些AI agent的公司，现在都可以去搞这件事情。而且他们都是底层，直接挂DeepSeek。很多的AI agent的公司有自己模型了以后，他们就可以去买英伟达的显卡，他就可以去部署自己的云服务了。当大家都开始部署自己大模型的时候，就要去买英伟达。

那你说为什么不去买博通？为什么不去买阿斯克芯片？咱们这稍微的岔开一点点。咱们平时看到的芯片基本上是三个：塞斯克芯片叫CISC，瑞斯克叫RISC，阿斯克呢就是ASIC，这是三个不同的词。博通中间有一段时间涨得很猛，就是因为它做的阿斯克芯片，做推理效果巨好。

什么是ASIC芯片呢？CISC芯片是叫做丰富指令级芯片，就是它的指令非常长，而且指令很多。RISC芯片的话，咱们最常见的RISC芯片就是ARM芯片，手机芯片都是RISC芯片，它叫短指令级芯片，而且它指令很少。而这个ASIC芯片呢，它其实不是固定意义上的这种有IP的芯片，它是什么呢？叫专用集成电路。这个东西有一个特殊的名字，它不是处理器，它叫专用集成电路。谷歌的TPU就属于是ASIC，Grok做的那个叫LPU语言处理模块，它们呢也是ASIC。

博通为什么要涨那么猛？博通涨得猛的原因就是，谷歌也好，亚马逊也好，自己去做这个专业推理芯片的时候，都是博通代为设计，台积电代为生产，大家都是这么来的。所以博通就涨吧。如果大家都集中在一起，就是说我们都是使用亚马逊云、谷歌云、微软云。

他们是有动力去使用ASIC芯片。我专门自己去设计一个新的芯片，然后装在自己的服务器上去。这样的话，我统一来维护。他们有这个动力。但是一旦分散了，你这个部署的是DeepSeek，它部署的Llama，那个部署的是这个微调以后的模型。大家都分散了以后，那就只能用英伟达，就没法使用这个ASIC。这个就非常非常麻烦。为什么？因为ASIC芯片你一旦做出来以后，你需要重新去做适配，重新去做很多兼容性方面的调试。而且做完了以后，你还有很大的可能性不稳定，挂上去以后会出问题。为了最大的稳定性，为了最大的兼容性，就通通都是英伟达。所以为什么说这一步出来以后，英伟达巨大利好。这就是对于国际上的一些影响吧。

那么结论是什么呢？这个DeepSeek到底是一个什么样的创新呢？还记得瓦特发明蒸汽机的故事吗？其实瓦特并没有发明蒸汽机。瓦特干的事情是什么？叫改良蒸汽机。它提升了效率。原来比如说我需要烧4吨煤能干的活，我现在烧一吨煤就干出来了。然后增强了动力。原来这个蒸汽机是上下动的，现在它可以进行转动了。这个动力变得很强，而且稳定运行广泛应用。就是瓦特以后，蒸汽机可以广泛应用。瓦特改良蒸汽机，被视为工业革命的重要里程碑。

那么转过来看，DeepSeek能不能成为像瓦特改良蒸汽机这样的一个重要里程碑呢？至少在中国，DeepSeek肯定是瓦特这样的里程碑了。因为甭管是OpenAI、Gemini还是Claude，它不给你使，那你只能是使用DeepSeek。从国际上看的话，还有机会是谁呢？就是Llama 4。如果今年Llama 4出来，有一个革命性的飞跃，在DeepSeek基础上还能再飞跃一次，那可能Llama 4会成为瓦特发明蒸汽机，或者瓦特改进蒸汽机上的那个里程碑。如果Llama 4出来了以后，跟DeepSeek差不多，那么对于全世界来说，DeepSeek就是整AI革命的这个里程碑了。

就像当年的瓦特改进蒸汽机那样，闭源模型是没有办法参与这种竞争的，这个肯定就不用想了。微软、谷歌他们其实也有开源模型，但都是小模型。微软的模型叫Phi，谷歌的模型叫GEMMA。这两个模型都是小模型，就是在客户手机、PC上使用的，他们是没有这种开源大模型。XAI呢，号称是开源，但是呢，那就是个假开源。到现在Grok 2没出来，开源版本没放出来。而且开源出来以后，他什么也不讲，你上去提任何问题，他不理你，那就是个假开源。

所以，现在唯一有可能能够站住这个里程碑位置的人，除了DeepSeek之外，剩下就是Llama。咱们希望杨立昆也好，扎克伯格也好，再努力努力，多砸一些钱进去，让大家可以看看美国人能不能站住这个里程碑。好，这就是我们今天讲的第二个故事：DeepSeek到底是不是国运级的创新？从我的角度上来说，从中国角度上来说，它应该算是一个国运级的创新了。

扎克伯格和黄仁勋，除了换皮衣，还聊了些什么？探秘扎克伯格和黄仁勋的SIGGRAPH访谈：两位科技大咖如何看待AI革命与苹果的未来冲突

Luke Fan — Tue, 06 Aug 2024 13:19:20 +0000

扎克伯格跟黄仁勋凑一块，除了换皮衣，还讲了点什么呢？他们是在SIGGRAPH大会上进行的访谈。黄仁勋是访谈主持人，而扎克伯格是被邀请的嘉宾。因此，在他们的访谈中，扎克伯格是逗哏的，黄仁勋是捧哏的，这一点首先要搞清楚。

这一次访谈，主要是扎克伯格在输出。SIGGRAPH大会是一个历史非常悠久的大会，叫计算机图形图像特别兴趣小组（Special Interest Group on Computer Graphics），小组成立于1967年，1974年第一次开会。今年是第50届，参会的人中有90%都是博士。当我看到这个消息时，一开始想，黄仁勋应该是个博士吧？扎克伯格是中途退学的。后来查了一下，发现并不是。黄仁勋是硕士，而扎克伯格是2002年入学于哈佛的心理学和计算机科学专业，2004年辍学，实际上上了两年学，之后在2017年被哈佛授予了荣誉法学博士学位。他好像跟某位伟人的学位差不多。

正常来参加这种活动的人，主要是引擎公司，比如Unreal、Unity，图形软件的公司Photoshop、Adobe，以及显卡公司AMD、英伟达。原来Meta也参加过，大概参加了有十几年了，他们以前是作为VR、AR公司来参加的。这一次则是出来抢AI的。

老黄跟扎克伯格算是天作之合，为什么呢？因为只有开源模型，才是英伟达显卡的绝配。

那你说微软不也买了好，OpenAI也在用，对吧？但是呢，大厂的必元模型啊，它是有能力去招聘一帮叫适配工程师或者叫配置工程师。他们可以绕过扩大算法这个事，是可以跑的。增加的这点成本对于他们来说是可以去承担的。只有开源模型的应用者，通常是支付不起这些配置工程师的工资的，所以他们会老老实实地使用英伟达的显卡，是吧？所以他们俩绝对是天作之合。

扎克伯格自己访谈的资格，也是因为买了足够多的H100才换来的。他是号称拥有60万块H100的男人。老黄就问扎克伯格说：“你是怎么来的呀？”而我是作为VIP客户，专门被黄日勋邀请来的，就是显卡买太多啊，被请来了。而且他在恨苹果这件事上来说，俩人绝对有共同语言啊。就是黄仁勋也好，扎克伯格也好，现在所有的CEO里头，所有的这种创业者里头，最恨苹果的两个大概就是他们了，找不出其他人了。

扎克伯格在会上飙脏话啊，直接说了一个f word，甚至说有可能直播都会被掐掉的这种脏话。其实骂的不是OpenAI，骂的其实是苹果。为什么要去骂苹果？OpenAI做了半天，未来有没有可能伤害Meta，伤害扎克伯格，有可能，但是现在其实没有给扎克伯格带来任何的伤害。而苹果当时是差点没把Facebook给玩死。扎克伯格自己也讲，Facebook最早是个网站嘛，我们是完全开放的啊，没人管，我们在里头爱干嘛干嘛。然后移动时代呢，发现要到苹果上面去啊，发布软件。

苹果这也不让你做，那也不让你做。关键是把他们进行精准广告推送所需要的用户信息给他屏蔽了。以广告收入为基本收入的 Facebook 差点没被他弄死。扎克伯格痛定思痛，说：“我一定要去做一个新的平台，绝对不能靠 APP 这种东西，而让苹果把我掐死。”所以他才做元宇宙，才把公司从 Facebook 改名叫 Meta。他做了所有这些事情，实际上都是为了应对苹果。这是扎克伯格为什么恨苹果，为什么恨这种封闭的大平台。

说英伟达为什么恨苹果呢？就是英伟达跟苹果之间是有恩怨的。英伟达给苹果提供过一款显卡，后来这个显卡不是特别稳定，被苹果直接起诉了。一开始苹果要他退钱，老黄不退，后来苹果直接起诉了老黄。苹果是在所有的应用里头都不使用英伟达显卡，而这个梁算截下来了。

而这一次，苹果直接给大家演示了用谷歌的 TPU 去训练大模型。这个消息传出来以后，英伟达的股价直接崩了。当然，英伟达的股价崩掉了，还有很多原因在里头，包括老黄自己在疯狂的套现，以及他到 120 以上的这个价格，大家觉得确实有泡沫了，直接崩掉了。但是英伟达昨天晚上涨了 13%，整个又窜起来了。

为什么苹果可以用 TPU 去干活呢？就是它是自己大厂，我只要招够足够的工程师，我就可以去改底层算法，让这些模型在 TPU 上运作。苹果演示了这件事情以后，谷歌、OpenAI 上都可以往这个方向走。这对于英伟达来说就是非常危险的。

英伟达一定要来找一个更恨苹果的人，找到Meta，找到扎克伯格。说来咱俩聊一下。扎克伯格呢，就是因为被卡过脖子，所以必须开源啊。看到别人作弊源啊，想要成为新的基座平台，就open i想做这个啊。那么想做规则的制定者啊，所以只能气得骂街了啊。这就是两个最恨苹果的人，天作之合，凑在一起。

那么Meta呢，对于大模型的开源是有非常大的贡献的。当然，最大的贡献并不是拉玛。咱们一直都说啊，拉玛1、拉玛2、拉玛3算是奠定了开源大模型的基础，但是Meta做的最大的贡献是另外两个东西。一个东西呢，PyTorch。PyTorch是现在非常主流的一个大模型，本地把它架起来的一个架构框架，这个东西是Meta开源出来的。现在在很多的服务器上，大家开始进行本地部署的时候，都是用的这个东西啊。

PyTorch的基金会里头大佬云集，哎，大型的开源的项目都是有基金会的。他们的大佬里头，Meta自己是啊，他贡献了代码，那么他是大佬。第二个呢，就是芯片厂商都在里头，英伟达、AMD、英特尔都在里头。然后所有云计算厂商都在里头啊，谷歌云、微软云、亚马逊云都在里头啊。再往后，新生的AI社区与工具，Hugging Face、Lighting AI啊，都在里头。

还有两个全能型拳手在里头，一个叫IBM啊，他所有的都做，也做云也做主机，也做芯片，什么他都干，所以他也是基金会的高级会员啊。还有一个高级会员是大家所熟悉的，遥遥领先啊，华为。

就PyTorch基金会里头，唯一的一个中国会员就是华为。在这一点上，我觉得华为做的还是很厉害的。它在各种开源的基金会里头，老老实实地交钱，老老实实地去遵守规章制度。它不像国内很多的公司，比如百度，使用所有的开源东西，但却偷偷使用，使用完了以后直接一闭源，啥也不看了，然后下一个。

Meta对AI做的贡献是什么呢？OCP（Open Computer Project）叫开放计算工程，这是什么呢？就是自己有大量的服务器，而这些服务器应该如何构造、如何去建设、如何去连接，这也是一个开源项目，这是Meta开源出来的。现在英伟达推出的NVIDIA HGX，就是在这个模块上去拓展出来的，已经都用上了。这是对整个开源事业真正做的两大贡献。

第三大贡献，才是刚才我们讲的拉玛模型，拉玛1、拉玛2、拉玛3、拉玛3.1，这才是第三大贡献。而且我觉得他所谓的拉玛模型的贡献，真正改变的其实是中国，彻底追上来了。可以拉着中国的一众小伙伴，把这OpenAI打翻在地，这个我觉得是可以的。

扎克伯格也为未来指明了方向，而且他指的这些方向，我觉得还是非常有价值的。第一个，他讲到了一点是原来我们很多人没有想到的，就是要去修改推荐算法。因为互联网的最底层其实就是推荐算法。推荐算法是什么？就是过滤与排序，你到底应该看这个还是不应该看这个，谁排前头，谁排后头。

这就是整个互联网的底层逻辑。在信息过载之后，我们只能依靠推荐算法来工作。在推荐的时候，它只能是说：“我按照一些大家的喜好，或者做协同过滤，做一些传统的AI的推荐。”现在就不一样了，它可以通过Transformer的模型，通过嵌入来重构整个算法，这是一大创举。而且这个东西真正运转起来以后，可能我们会看到完全不同的信息流。

在推荐的时候，他们也希望直接在信息流里进行总结与归纳。原来我们在Facebook和Instagram里看到的所有信息都是用户生成的，那么以后可能我们看到的一些信息就是归纳的一些信息。比如说，你最近有三个朋友感冒了，你最近有五个朋友感冒了，而这些朋友你可能连名字都想不起来。如果真的给你发一条说这个朋友感冒的信息，在信息流里你也不想看到，但是你又希望知道这朋友里边感冒的人多不多。

会把信息分层处理。什么叫分层处理？就是跟我关系最好的人，你们要把这个信息完整地展现出来。大家讲的就是150个人之内的，我们可以互相叫出名字，可以知道他的喜怒哀乐。这些我们可能希望知道他所有的信息。然后朋友的朋友就是中层圈子，可能只是需要知道一个概况就可以了。再往外层的话，可能有一些大事件发生的时候，我们需要知道一些国际大事，也就可以了。它需要分层处理，那么分层处理就可以对这些内容进行总结归纳，并可以发出来。

而且在这个过程中，推荐算法就会有更大的权利。这是什么意思？原来肯定是看你关注了谁，你跟谁是好友，你可以看到谁的信息更多。不可能，你虽然关注了一个人，但你未必看得到他的信息。如果你们之间很少互动，他就认为这可能就是一个普通的朋友。他的一些大事你知道一下，小事你可能就不需要知道了。他会通过这样的方式来过滤你的信息。

包括我们现在在推特里边也是这样的，可能看到一些大事的时候，我们会看到，那一些小事可能就看不到了。后面的话，Meta准备统一他的推荐系统。原来推荐系统是什么呢？就是各个分支，比如我要先看到朋友的，然后看到这个朋友的朋友的，再看到国际大事的和重要媒体的，所有的这些推荐的东西搁在一起，然后再进行混合。以前是这么工作的，而现在上大模型，我们要让整个的系统用统一的模型进行推荐，一次性给你推出来。

这个也是一个很大的创举，可能以后我们就会看到一个完整的模型推荐出来的图文信息、视频信息都混在一起的，而不像现在似的，Instagram就是Instagram，Threads就是Threads，Book就是分开的。以后，我们可能就在一个统一的信息流里看到所有的一切了。这是真正会改变互联网底层逻辑的事情。Meta、谷歌、Twitter、TikTok基本都是靠这个东西活着的。如果真的能够把大模型应用到推荐算法里边去。

我们可能就真的会看到新的一次AI革命，真正能够产生效益了啊。这是非常重要的啊。这是讲的第一点啊。第二点是什么呢？就是AI studio啊。他也要上一个AI studio，因为AI studio谁都上啊。微软有AI studio，谷歌有AI studio，Meta也做了一个AI studio。而Meta做的AI studio就干一件事啊：给每一个人做一个自己的AI助手。使用社交媒体的时候啊，直接用Meta自己的内容进行训练，微调一个小模型，再配合RAG或者叫做本地知识库，可以不断地补充新的信息，拿这个小模型去替我们回答问题啊。

像我现在，我每周会去处理一次大家的评论，周三下午一般会处理。处理完了以后跟大家念一遍。如果我有了这样的一个工具，我就可以随时随地地处理大家的评论。我出去玩的时候，AI机器人都可以给大家回复啊。我们的Disco群有这么多的分支，我没有办法在里边去照顾到每一个分支。这样，我就可以让我的AI助手在里边去回复。哪怕说他不回复，我过一段时间总结一下，最近大家都在聊这几个事呢，你是不是要去参与一下啊？或者他可以来征得我的同意，或者在我的授权之下进行回复啊。

这件事我就替你回答了啊。那件事情你准备怎么回答，还是说就不说了。这样的话，我就可以更多地千手千眼、无处不在地参与到各种社区的讨论里头去。这个真的是我很需要的一个东西啊。

每个人呢，其实都需要分饰不同的AI角色，有不同的AI助理模型。你比如说，在Facebook的回答问题里头有一个，在Discord里头有一个，是不是在Twitter里应该再有一个？这个可能才是真正我需要的东西。甚至未来我可能照了照片以后，就直接把这些照片都放在优酷里，让它自己去挑选好的照片，给我发到Instagram上去，这个不也是一个挺有趣的事情吗？这个是非常有用的。

那么在所有的平台里边，就会成一个新的风向，就是大家开始把这种AI机器人用起来。以后是什么呢？就是所有的平台都会变得热闹起来，因为每个平台都有我们的替身在替我们回答问题。所有的平台都会产生信息大爆炸，所有的平台也就都失去壁垒。

我们经常有人说：“哎，你有Telegram没有？你有微信没有？你有这个Twitter没有？”那以后这些东西我都有。你们在任何地方提了问题，我可能都可以去回答。这是多么有趣的一个事情！他们就不可能说再把一个人限制在某一个特定的小平台里头。当这些小平台失去壁垒之后，这些大平台就可以依靠成本和变现能力直接把小平台都挤死，对吧？这也对于Meta来说是有商业利益的吧。

在网络上，每一个人都可以依靠这种小模型的帮助，成为超人。这也是在不久的将来就可以实现的东西。扎克伯格也讲了，未来他的这种AI触手不会是文字，而应该会成为虚拟形象。你们以后可能再去聊天的时候就发现……

长坐着一个长得像老范一样的人，在这跟你回答各种问题了。甚至他可以开出这样的直播，挨着把大家的评论都点出来，挨着跟大家解释。这也是一个很有意思的事。

这是第二点。第三点是什么呢？第三点是开源是未来，不受限制的构建，恢复开放的黄金时代。这是他讲开源的内容，我们就不在这里详细去讲开源到底好在哪，坏在哪。这对于中国的AI行业来说，没有拉玛，就没有中国AI现在的风起云涌。如果没有PyTorch，中国的整个AI体系也是难以发展的。

它开的这个叫Open Compute Project，对整个中国的互联网云建设都是有重大意义的。再往后一个讲的是模型不会一家独大，从小到大的模型都有应用场景。OpenAI就认为你都应该在我这儿用，不要用其他人的。虽然它有GPT-4O Mini这样的模型出来，但它还是说你都要在我这儿用。

现在Meta就讲了说没必要，405B的模型我们就是做这种相对来说比较复杂的任务。当然，405B也给英伟达提供了一个非常大的考验，因为405B这种模型在英伟达的单块显卡上跑不起来。你还是要用NV Link这样的成熟技术，才可以把这些显卡连接起来，把这个405B跑起来。黄仁勋也是乐得嘴都合不上，跑405B就老老实实到英伟达来买显卡来。

势币的基本上处理各种业务是够的，因为我前一段时间也是使用各种大模型，基本上到70B。

绝大部分的问题都可以解决了。8B的在各种的AIPC里就可以用了。微调之后可以成为各种专材，比如说编程的，法律咨询，AI客服，绝对够了。今天谷歌还新发了两币的模型，叫JMAR2，两币，这个叫2B，在AI手机上完全可以跑起来，效果还不错。

这是讲的第二块，就是不同步大小的模型，大家自己去用。而且大家要去用八臂的模型，去训练各自的专用模型。只要这样，才会有不同的模型去完成不同的事情。

然后呢，讲的是叫segment everything two。是这样的，一个大模型又更新了，更新到第二版。这个模型叫做分割一切。这个segment everything呢，在去年是发布过一版，做的事情就是你给他一张照片，不需要标注，不需要训练，他就可以把照片里的所有物体都识别出来，挨着个儿给你列出来。

而everything to呢，它是可以把所有视频里的内容直接都给你分拆出来。说这个是牛，那是马，这个是猪，那是羊，他都给你认得清清楚楚的。扎克伯格还在现场炫富，他说：“你看啊，现在认出了一个视频上面这些牛，叫考艾岛牧场的牛，是扎克伯格自己牧场上的牛。”对吧，把这些牛认出来以后，伯格跟这个黄仁勋准备把这个牛杀掉了，好好吃一顿。

这种可以分割和识别视频内容的大模型，未来是有非常大的应用场景的。而且注意啊。

Segment Everything Two是开源模型，大家现在就可以当下来使用了。扎克伯格在现场举的案例是什么呢？就是监控能力可以极大提升。以前，公司丢东西的时候，我是去看过监控的，那经历实在是太可怕了，对吧？你需要长时间盯着监控去找这个片段，这非常困难，因为视频是线性的。

现在，当你有了这种分割一切模型以后，你就可以直接问模型：“什么时间点你看到有人进来了？”或者“什么时间点这个门动了？”他就可以直接通过语言和文字对视频进行检索。这是非常强大的，很多工业上的东西可以被极大赋能了。

前一段时间，马斯克其实也演示过一个视频，在他的推特账号里，演示了用AI模型观察一个咖啡店。他会算好哪个店员在聊天，哪个店员做了几杯咖啡，哪个店员在休息，对吧？店员和顾客之间是如何沟通的，这看起来有点吓人。

当然，这种模型肯定会被中国的厂商第一个拿来用。用完以后，就可以让这些牛马们老老实实地干活，没有任何私下里的自由空间，这完全可以实现。所以，中国一定会快速应用起来。

再往后，两个老直男讨论了一下时尚问题。为什么讨论时尚呢？因为扎克伯格去做智能眼镜了，眼镜上有摄像头。他说这个东西很漂亮，而且可以不停地换衣服，始终穿一件，但这个眼镜可以换来换去。

这就是两个老直男对于时尚的理解吧。这一次呢，他们两个人还是换了皮夹克。黄仁勋标准款的皮夹克给了扎克伯格，扎克伯格呢，这一次用的是自己那种很厚的半长的皮衣，戴帽子的这种，比较宽松。这就是两个直男对于时尚的所有观点。

最终的总结是什么呢？就是扎克伯格还算是为AI指明了方向。而且扎克伯格指明的这几个方向，都是AI未来有可能挣到钱的地方，有可能能够在这块有正常的商业模式的地方。这个是非常可贵的，它比山姆·奥特曼的那种大空话还是要落实得多。

那么新的时代就要到来了，互联网的底层真的要被AI重构了。原来互联网底层是没有被AI去改变的，还是推荐算法。现在AI要进入互联网底层了。一个人都可以被AI赋能，这也是非常棒的一件事情。所有的场景都可以被AI渗透，对世界的理解也可以进一步给各种系统赋能。当然，也可以给中国这血汗公司赋能，或者给中国政府赋能。

我发现做监控这件事情上，中国如果说是第二，全世界没有任何国家敢说是第一。这块我们还是做得最好的。全世界大概绝大部分的监控摄像头都是中国人造的。最终呢，大家都去买英伟达的显卡，都去用Meta的开源系统。这就是他们两个进行了一晚上的访谈所得出的最终结论。好，这就是我们今天讲的第二个故事。

ARM状告高通，阻击AI PC，为了不让高通的X Elite一家独大，哪怕拖慢AI PC的进程，也要阻击高通

Luke Fan — Wed, 19 Jun 2024 00:52:05 +0000

大家好，欢迎收听老范讲故事YouTube频道。今天我们来讲一讲AM作妖，让苹果的M系列芯片可以继续在AIPC领域里头独霸天下的很长一段时间的故事。刚刚结束的WWDC，大家还看到了Apple Intelligence。有些人觉得在挤牙膏，有些人觉得很震惊，但是有一点是确认的，就是苹果演示了大量可以在本地顺畅运行的模型，以及这些模型可以跟操作系统结合在一起，极大地改进用户体验。这件事情大家还是觉得非常棒的。

那大家有没有想过，所谓的Apple Intelligence，这些可以在本地运行的模型，它的底层到底是什么啊？它的底层就是苹果的M系列芯片。所谓的苹果M系列芯片，是苹果专门为了应对PC工作，在AM的许可标准下，自己定制的一款芯片。现在我们有M1、M2、M3、M4啊，最新的是M4系列芯片。这个芯片呢，跟传统的手机芯片不一样，它的算力会更强，但是跟X86芯片也是不一样的。X86芯片的话，它的耗电啊，它的发热都是很厉害的，而M系列的芯片啊，它的耗电，它的发热都是有极大的改善。因为这种芯片本身是为移动设备开始设计的，所以很省电。在没有非常大的算力要求的时候，它可以关闭大量的核心，非常非常省电。那么省了电它就肯定不发热了嘛，你也不需要再去散热。

那我们去看到什么游戏本，当你去看这种算力工作站时，不要去研究它的大小，只要听听那个声音，风声呼呼呼的声音，你就知道它耗电量有多大，散发了多少热量。而在苹果的电脑上，只有在大型模型运行时才能听到风扇的声音，平时这个东西非常安静，就像在旁边放了一个iPad一样。下面我们也要搞AIPC，微软也要干，联想也要干，所有的这些人都要干。我们不能把AIPC的这条发财之路完全让给苹果，所以我们要换这个CPU，换一个和苹果的m系列芯片长得差不多的芯片。那么这样的芯片是什么呢？你需要一个AM的CPU核心，AM的计算核心，然后要有一个算力核心和它一起工作，不管是GPU、TPU还是NPU，这些都叫做算力核心，实际上它们长得都差不多。GPU是图像处理器，TPU叫向量处理器，一般谷歌出来的都叫TPU，因为它们叫Tinsen floor嘛，然后NPU叫神经处理器，实际上都是差不多的东西。我们要把这些东西集成在一个芯片里，然后再加上统一内存，这就是我们需要的AIPC的CPU。苹果设计统一内存这件事也是一个很天才的想法。以前我们在买笔记本时都会想，到底是要买独显还是集显，所谓的集显就是这个显卡是集成在CPU上的。

坐在计算内核里面的叫核显。核显有一个很大的问题，就是它没有独立的显存，而是使用计算机内存来工作，因此速度会慢很多。而独显则有独立的显存，速度快得多。苹果解决了这个问题，他们采用了统一内存的设计，速度相对较快，但价格稍微贵一些。

很多人会问，为什么苹果的内存价格在官网上要比其他地方贵很多。在淘宝、京东等地方看到的内存条价格可能只是你购买整个内存的价格的几分之一。这是因为苹果采用了统一内存的设计，而且苹果电脑无法单独升级内存，只能更换整个计算核心才能升级内存。所以，如果你想要更大内存的苹果电脑，唯一的途径就是在苹果官网上选配更大内存的电脑，没有其他办法。

微软也加入了这个行列，他们也要做ARM CPU。在微软发布会上，他们与高通合作演示了Xelit，这将是微软未来Surface系列电脑中所采用的ARM CPU。
它是Three Letter Acronym（三字缩写）的简称，用于描述一种特定的授权协议。而Ala则是Another Licensing Agreement（另一种许可协议）的缩写。这两种授权协议都是由ARM公司提供的，用于授权其他公司使用其技术和设计制造芯片。这些授权协议详细规定了受许可方可以使用ARM技术的范围、限制和条件。

叫技术许可协议，沟通拿到的就是这种东西。你要是拿到这样的许可协议呢，就可以拿着AM的公版的计算核心。什么叫公版？就是说我设计好了，这就是公开的版本，然后大家拿出去用。千万不要改，就只能使用。这个修改的权利你没有，这叫公版的。而苹果拿到的呢，是Ala，叫架构设计许可。这个东西是什么？就是你只要架构跟我一样就完了。里头到底长什么样，没关系你可以自己改去。苹果拿的是这样的一种协议。所以，苹果可以拿这个协议自己去改核心，可以去定制核心。不管是A系列芯片还是M系列芯片，实际上都是在AM的公版核心基础上修改过的。它就更适合苹果操作系统。那高通说我也得改啊，我不能用这公版呢，你那公版那个是给手机设计的。我也得改去，对吧？但是高通手里没这协议，让AM去买。AM说我不卖给你，你必须使用这个架构许可协议。高通就想了一个小招数，干嘛呢？他去买了一家公司，这家公司叫NUVIA。把这家公司买下来了。比如说这个公司手里头啊，也有LA的这个许可协议，就是叫架构许可协议。我买下来我不就可以用了吗？为什么苹果手里有这个协议？别人没有，NUVIA手里为什么有这个协议？这个原因很简单，AM基本上是苹果一手带大的，就是AM的第一个订单就是苹果的。

而且，ARM一开始创立的时候，苹果是给钱的。所以，ARM基本上是苹果一手养大的孩子啊。苹果在ARM手里头，各种各样的协议都是比较宽松的，想怎么玩怎么玩啊，想怎么折腾怎么折腾。而这个纽约的创始团队呢，完完全全是苹果A系列芯片的设计核心团队。是这样的一帮人，从苹果离职之后去做的公司。所以呢，他也跟ARM谈了一个ALA的协议回来啊，就是加购许可协议。这个公司一创立就被苹果告，说你们这帮人违反敬业，违反职业操守。你不但是从我这走了以后，去设计同样的芯片，你还从我这挖人，不停的挖人出去啊，做你们的纽约的这个公司啊，就一直在被苹果起诉。后来这起诉到什么时候结束呢？一直到高通花了14亿美金把这个纽约买下来，苹果才算是说结束了，说我不告诉你了，这个事咱和解了，拉倒了。那苹果为什么给高通面子呢？这是另外一段小恩怨。苹果一直想要摆脱高通的限制。苹果虽然里头A系列芯片是自己的，但是里头还有很多的芯片是使用高通的。而且高通卖芯片其实挺黑的，它呢是先要交一遍专利费，然后再按照每一个芯片多少钱再给钱。所以高通卖的芯片，相对来说是比较贵的。苹果不希望被高通限制啊，就想办法做一些小花招，什么小花招呢？就是我先买着你高通的芯片，买完了以后呢，我也问你说这玩意咋做的呀。啊，苹果呢，因为它需求量很大。

有点特大气垫的样子。就是我买这么多东西，高通你得来给我服务来。然后高通就上去知无不言，言无不尽。去说去了，说完了以后呢，苹果一扭脸，然后把这事告诉Inter了，说Inter啊，你给我做芯片啊，高通是这么这么干的，你照这样给我做。然后这良品率就上升了，功耗就下降了，高通就不乐意了，就把苹果给告了啊，你们这太过分了啊，你拿了我的技术秘密，去跟我的竞争对手Inter去分享去了啊，这事不行。苹果呢本来也很硬气啊，在这硬诉到了一段时间以后呢，苹果自己翻车了啊，他翻了一什么车。苹果有一段时间，想去做自己的基带芯片，就是我们iPhone上能够去连接4G 5G信到的那个芯片，叫基带芯片。结果做来做去呢，自己没做出来，那怎么办呢，那只能低下头来说，那高通对不起，我错了，我接着买你们家芯片吧，回来认错来了，咱就和解吧，该赔钱赔钱，该怎么弄怎么弄啊，把这个项目给和解了。然后和解的时候呢，就顺手这高通就说了，说你看我这还一小兄弟呢，你这还告诉他呢，我把他买下来，你是不是一块。和解了就算了，就这个纽约事情，那苹果说，那算了吧，谁让咱们这自己不争气呢，自己做基带芯片没做出来，为了下一步发iPhone，我还得买高通的芯片，那我们就和解了吧。所以呢，高通算是从纽约手里头得到了一张Ala的他们许可证啊。

又往前走了一步，但是高通光买这个项目花了14亿美金。你以为他跟苹果和谐，把这个事情搁在里头，他肯定也是算成本的。被这一张许可证，高通应该也是花了几十亿美金了。肯定是跟苹果那边也是放弃了一些利益，才让苹果放弃了对纽约的诉讼。那么在这种情况下，高通肯定得把这钱挣回来啊。那高通咋办呢？跑到微软那去说，你不是要去做MPC吗，我给你做啊。但是呢，这个前期投入很大，你看我已经花了这么多钱了。对你跟我签一家独家供应协议。以后呢，只要是Windows出的这种AMPC，必须独家使用沟通的芯片。这事你干不干啊？微软说那别人都不愿意干，就你愿意干这事。而且诚意满满，钱都花了，那我就干吧。就跟他签了这么一个独家协议。这个就是我们现在讲的叫XA lit。这个芯片就诞生了。这个芯片是由从苹果那边离职的，创始人纽维亚的创始人，用着纽维亚从arm那边拿到的Ala的许可协议，做出来的沟通芯片。这个芯片是这么来的啊，很曲折这么来法。但是来了以后呢，有点名不正言不顺。为什么呢？因为am又把高通跟纽威尔又给告了啊，说我确实是给纽威尔发了ala的局克协议啊。你确实可以在我的许可范围内去做自己定制的核心，不用我的公版核心。但是呢，你只要是公司被并购了，这个协议就失效了。你不能把这个协议传递给沟通。你只要去了就就失效。

而且呢，IM也正式宣布说，我取消了你这个授权了，以后你们就不再拥有权利，可以自己定制核心了。必须使用我的公版核心。哎，整了这么一出，那么现在呢，两边还在法院上在打着呢。昭通说我花了14亿美金，没有这张协议，我为什么花14亿美金去买它？而且我现在芯片也做出来了，微软发布会也开了，我就准备卖了。你现在给我摁，这事不行，AM也说不行啊。我，我就是卖标准的，你在我这标准里的分叉，这事我也不允许。所以两边呢，现在镶在这了。现在这个X Elite芯片呢，虽然我们还没有见到，这个芯片具体跑成什么样，但是据高通自己说，已经可以在很多指标上超越苹果的M3了。现在M4肯定它还达不到，或者M3后边的什么Pro Ultra Max这些东西，它现在还达不到。但是M3说据说已经可以达到了。那么高通呢，你说花钱买呗，我虽然从有view这边拿到的许可证，协议AM你不乐意给我，那我再花一份钱啊，再重新买一个协议行不行啊？不卖给你啊啊啊，是打死也不卖给你。为什么啊？维持的就是它的标准的统一。你一旦卖了这张协议出去，这个标准就不统一了。待会咱们再去讲标准统一的故事。现在这个诉讼到什么样的状态了呢？双方肯定是沟通，希望赶快审完，完事了。UP说咱等等啊，不要着急，我这还有一些证据要补充。等到什么时候开庭呢？

2024年年底要开庭。大家注意，2024年年底还有一个事要发生呢，就是高通跟微软签的那个独家协议，2024年年底也到期了。等到了明年，很多其他的芯片厂商也可以去做MPC了，不需要在你高通一棵树上吊死了。微软也有更多的选择了。高通也是担心说，哎呀到了明年其他人都能上来了，我这个独家权就没有了，怎么办呢？所以他们才打这样的一个时间差。那么有没有人想过，am为什么自毁长城，再怎么着，m系列芯片也是am的，高通的illate这个芯片也是am的，而且这些芯片销售的过程中都是要给am交钱的。如果am PC这个东西起来了，就是Windows form这个东西跑起来了，那么am整个的收入肯定会上升很大一块的。那么up为什么要把高通摁在这，摁在地上摩擦不许走，对吧？大家要注意，up不是一个芯片公司，arm是干嘛的呢？arm是卖芯片设计专利的一个销售公司，他只卖专利，只卖授权的这张纸，他是不卖具体的任何芯片的。以前我们总讲一个话，什么呢，叫底层的公司卖产品，中间的公司卖专利，顶油的公司是卖标准。am的其实是一个顶油公司。大家有没有想过说am这样的公司为什么一开始他自己不做芯片？原因其实很简单，因为很多的芯片公司都需要做这个芯片，那每家做出芯片了以后就会有一个问题，什么呢，兼容性问题。

比如说安卓，我今天选了高通的芯片了，明天选了联发科的芯片了，后天我选了华为的海思芯片了。那么在这样的情况下，我做安卓操作系统没法做，每家芯片都不一样，这会咋弄啊？

那好了啊，我们都使用AM标准啊，使用AM的工版核心，我们在这个基础上稍微调调改改，我去做一个芯片出来。最后我们买的是高通的芯片，买的联发科的芯片，买的啊华为的芯片，但是呢，软件标准都是一致的，这样就省事很多啊。我们实际上就看这样的一个活，他说我不断地去研发新的计算核心，研发新的标准，你们就拿我的工版核心去拼拼改改。比如说啊，中间这个核心设计，你必须用我的啊，你说我是用6个用8个，用大小核还是用怎么着，这个你们随便，只要你这个核心是我的就没关系啊。这是AM就干这件事情。然后导致什么呢？就是我们的所有的安卓手机，只要写一遍应用，就可以在所有的芯片上跑，甭管你是高通芯片啊，联发科芯片，英伟达什么Tiger芯片啊，或者是其他的这种AM芯片，都可以跑，都没毛病。他就跟大家所有人收专利费。AM真正希望的是什么呢？就是大家做芯片都使用AM标准啊，安卓厂商，软件厂商都按照标准来做就完了。那苹果呢？他不管他为啥，第一个咱们讲了i’m，基本上是苹果一手养大的孩子，孝顺你还是得有的，你不能到这翻脸不认人。另外一个什么就是苹果自己玩自己的。

你做的跟别人不兼容，这事没关系。反正都是苹果系统，他也不会说我。苹果把a系列的芯片卖给别人了，把m系列芯片卖给别人了，导致苹果的这个标准外溢。不会的，他不会跟am去抢生意。所以对于苹果来说无所谓。你说那我高通我也买一个不行吗？那不行啊。一旦高通买了这样的一个标准出来，它相当于什么叫标准分叉了。就相当于是你分裂了一个巨大的领土。啊，我分出一块去裂土封王了啊。这事是绝对不允许的。为什么你一旦分出去了以后啊，你还成了老大了？因为高通跟微软签了独家供应协议嘛，成了老大了。那么你一旦成了老大了以后，我这个标准就不值钱了啊。标准值钱的前提是什么？一定是很多芯片厂商都要去做同一个标准的芯片啊，满足兼容性。那这个时候我的标准太值钱，那最后大家都买你高通的芯片了，其他的联发科什么，他们就不买这种芯片标准去做了，不去做PC了。那我这标准就没人买了。这个事是绝对不允许的。所以一旦是高通一家独大，这个标准就没人买了。再举一个例子啊，这个例子是英伟达。英伟达就是属于一家独大。你以为在这块上没有公开的标准吗？有的，就是GPU也好，或者是他这种算力核心也好，都是有公开标准的。就是AMD、英特儿和谷歌微软等一堆人啊，联合在一起做了一个公开的标准，还是开源的。但是没用，因为他一家独大了。这种标准就没人使用。

也没有人愿意说，我去依照这个标准去做什么芯片啊？做出来也没人买。但是变成这样，ARM肯定不希望走这条路，所以一定要卡死了。说高通啊，你这个不行，必须拖到明年。拖到明年了，你这个独家协议过期了，那么其他人可能就会愿意跟我一块去啊，生产新的这种PC上用的芯片，你就没法一家独大了。大家还得在我这个标准下走，最后就会可能是不遵守ARM协议的，沟通和一大堆遵守ARM协议的小伙伴，比如说华为海思，联发科海全制啊，一堆的这样的芯片设计公司，就跑来说，我们继续跟着ARM的大标准一起往前走，最后大家竞争就好了。这是真正的ARM的诉求。所以呢，AIPC之路还很长啊。如果ARM和解了，ARM说我放你一马，咱们就这么干吧，高通的AMPC可能就会一家独大，高通的价值就会大涨。如果拖过了年啊，联发科这些芯片公司都跟上来了，那么ARM的价值就会大涨啊。我们来去做一些股市预测啊，但是还是要强调啊，我们不做任何的投资建议啊，你买了赔了赚子跟我没关系。如果高通守住了阵地，这个可能性到底大不大，要跟大家讲，这个可能性其实还是很大的。为什么这么讲？因为全世界有哪些使用ARM芯片的？这些就是给他交钱的这些人呢，苹果、高通，然后再往后一个是谁啊，再往后一个其实是三星，其他的联发科国内其实有非常多。刚才我们讲的珠海全智。

华为的麒麟海思，他们都是向高通支付授权费用的。在这个过程中，很大一部分的ARM设计师都是以这种方式工作的。为什么会称之为设计师呢？因为高通并不自己生产芯片，他们使用ARM的授权，设计好芯片后交给台积电、三星或者英特尔等代工厂去生产。目前，高质量的CPU基本上只有这三家厂商能够生产，而台积电的良品率最高。另外，目前只有英特尔拥有最高精度的2纳米光刻机，其他厂商还没有推出2纳米产品。然而，英特尔目前也没有发布2纳米产品。在这种情况下，PC厂商如联想以及其他大量的CPU设计师都位于中国大陆。由于地缘政治原因，他们面临一些新的问题。例如，联想可能会遇到一些问题，比如说他们计划定制一款CPU，但是他们需要确认美国是否允许他们使用这样的产品。华为也面临类似的问题，他们有能力设计自己的芯片，并且已经购买了一些ARM的授权。他们可能会考虑定制自己的芯片，但是他们需要找到代工厂来生产7纳米或5纳米的芯片。目前还没有厂商能够满足这个要求。

这是一个很大的问题。当这样的问题发生的时候，那我们是不是都买高通的，或者都买谁的，这个也很麻烦。因为大量的PC厂商也都在国内，那最后美国人说我们不允许你买啊，啊不如去买，提这事咋弄？这事也都很麻烦，对吧？所以在这样的一个情况下，其他的这些PC厂商也好，这些芯片厂商也好，再想去做相应的投入，就会有些犹豫，说我现在是不是马上要投入进来，干这个事，花很多的钱去干这个事情。万一投完了以后干了，因为一些原因，比如说联发科这个PC芯片做出来了，大陆的厂商不让买，或者做完了以后，大陆那边去销售的时候啊，说不允许使用进口芯片啊，这个芯片我卖不掉，这事咋弄？他们现在都会有这样的犹豫。沟通是已经把东西做出来了，你没办法，我必须铁头也得往前走，其他还没做出来，就会比较犹豫。那么在这样的大家犹犹豫豫的情况下，没准沟通，最后还是可以守得云开见月明的啊。所以呢，高通我觉得最后垄断AIPC或者暗PC的份额的机会，还是比较大的，只是呢过程会相对曲折一些。这是我们对这个事情的一个预测吧。啊至于到底会不会成真啊，咱们拭目以待。好，这个故事跟大家讲到这里，感谢大家收听。请帮忙点赞，点小灵通啊，请大家点赞，点小铃铛，参加Disco讨论群，也欢迎有兴趣，有能力的朋友加入我们的付费频道。再见。

被OpenAI的GPT-4o截胡的 Google I/O：与 indigo11 一起聊聊，AI技术变革与未来趋势，庞大的官僚机构Google，面对新生事物OpenAI，还行吗？

Luke Fan — Sun, 19 May 2024 00:38:02 +0000

大家好，欢迎收听老范讲故事的YouTube频道。今天我们又请到了老朋友尹迪狗，给我们介绍一下刚刚召开完的谷歌艾欧。这一次到底发布了什么。而在谷歌艾欧之前的一天，OpenAI我觉得算是故意捣乱截胡，发了个GP4欧出来。我们就正好趁这个时机呢，把这两个发布会或者两两个产品吧，一起来总结一下。首先呢，我想先问一下，GBT4O到底算不算是划时代的产品。嗯，至少模型啊，分成两部分，它发的是PPT是o是模型混合模态嘛，他把语音视频和文字一块训练的嘛，可以同时输入和输出嘛。这个相当于是，嗯，也不叫划时代吧，就是他之前所有的工程技术的沉淀。嗯然后呢，做了一个特别好的一个交互形式，就是语音交互。而且那个语音交互的很大一个特点，发完之后不是马上就有人升级吗，一搜我的这个APP上面的模型以及GPT，搜了然后大家都想打开。那那个耳机，点上去之后呢，可以跟他聊聊天。实际上，那个聊天并不是他发布会上的那种APP，那个还是回合制的，用那个rest接口聊天。我，发出去然后回来，这个回合制的，但是呢，他在发布会上演示的是完全stream的，就是像就像我们现在一样，我们录节目，我们用的是Web RTC协议嘛，streaming，就是你的Server端，它的那个TOKEN，它就不停的接收是吧，做实时处理。这个特别耗流量，耗TOKEN，耗算力的。嗯现在还没用到这个模型，所以大家感受不到，所以我记得第二天还第三天的时候m奥特曼还是他们官方账号，发了一个说明嘛，说哎你们大家用的现在还不是，发布会上也是这个，哈哈哈，一堆人说说这一直完完全不对，这么慢的响应，我觉得借手报了一下，就是他是非常natural，非常自然。可能就是大家第一次用起来 GPT 的感觉，一样哎。哇哦，是他没这样回答问题。就是他确实是有那个时候的一个感觉。

对，我们看到很多划时代的产品，其实并不是技术上的创新，而是用户体验和交互上的创新。对你像 iPhone，包括呃，足以吃就任天堂的很多东西。你说他发的时候，大家也都是觉得啊，这个又变天了。但其实你拿那个产品回来看，他在当时的技术条件下并不算创新，但是他把所有东西拼的很好，然后一下让大家在用户体验上说哎，已经变得完全不一样了。这个挺直接，挺直接粗暴的，就是直接干，是对。

但这个也和他的技术路线有关系，因为，从估计从詹姆奥特曼的角度，他想做一个智能体嘛，就是 engine，是 AI engine，核心就是能够和人类进行语音交互嘛，就 Herre 嘛，就 Herre 一样的，就是我什么输入我什么界面都不需要，你坐在我对面，我跟你聊天就好了。然后你，你能看到我，我能看到你，你能听到我，能听到你，你看到我所看到的就够了。这种交互最简单的，最 later 了。

你是不是买了前面所有号称这个 AI 硬件的这几个东西？哈哈，对，是的。那你说这个东西出来以后，是不是就把这些翻车的 AI 硬件就救活了呢？AI 硬件算 rapid 算，这不叫翻车吗？那个基本上就不靠谱，哈哈。

实际上大家看到的这个 GPT four o，我们可能叫 GPT4O 哦，4O，对这样子的一个一个模型，包括它后面也也是产品，大家很快就能想到，如果说大家是做硬件或者做软件同学，我是不是可以给他很快给他套个壳。他有什么智能体对，我家里，我搞一个特别什么真人联网的设备，是吧？你又不用我本地计算，然后说你只要能联网，我找破了手机就可以了，就可以实现这种效果。他演示的，只要我有个摄像头就能看得到。然后有个有个有个麦，有个有个speaker，嗯就可以了。然后有个这个联网连Internet。我昨天前天的时候我不是有张Tesla嘛，IPSD嘛，开始FSD的时候呢，我就把把7S GPT打开了，打开这个语音模式。我把它放车上，连上车上蓝牙。然后我们说话，车在跟我说话，是吧？嗯感觉，但是它是通过7S GPT的。嗯而且呢，还在自动驾驶，感觉就是很科幻啊。对不对，我就2024，是的是科幻来的太快了。所以在商业模式上，可能真的还是会有一些影响，会出来的，商业模式还不好说。我知道从交互模式上会有很多新的应用形态出来，而且你这种智能体，你可以附着在任何的，你独立的硬件也行你在电脑里面的一个程序也行。那上面也是两个，一个Mac APP是吧，大家我应该有同学也可以装了，装上去了，然后他可以监视你的屏幕啊和你互动嘛，就是他看你屏幕，然后有一个iPad APP，iPad它也可以监视你的屏幕，然后给你做互动教学嘛，子涵的那个，对不对？这个我觉得是想象空间挺大的应用场景，他能够变成事实之后，不可能，应该又一次吧，还没有发布的产品先拿出来给大家售，就跟上次Sora似的，他是不是就是专门给这个骨骼贴个赌，因为我就提前你一天吗，对是的，这绝对是的，上一次也干了一次，因为谷歌的东西都是很早，集合好大公司，官僚公司官僚，是是是这样子的，我很早就宣布了，我有这么多部门，我们说下谷歌，谷歌发了20多个产品，记得他发了哪个吗，你最后记不住啊。我大概除了那个叫 Project Astral，其他的 Gemini 1.5 后来但是我这两天看了，好像没有什么太大变化。做了一个 Flash，其他的就真记不住了，对剩下的都不记不住了吧。VOY 是吧？那个叫视频是吧，大堆这种东西，大公司吧。你想想 Google 这么大的公司是吧，这种官僚。我觉得 Google 这两年啊变化还挺大的，一家大公司，大公司并。我也我有朋友在 Jimmy 的团队，然后也吐槽了公司。其实公司现在呢，战略是清晰的，但是公司太大了，执行上就有人乱乱阵脚。公司高层下指令呢，工程去推，他们去完成目标，嗯。高度整合完全围绕杰瑞来做，嗯全公司。他这个调动速度还挺快的，对。这么大一个组织来说，这次发布会之前就说了嘛，这个 video 看这个 video，我们以 Google 已经进入到 Gemini area，嗯，我们进入了 Gemini 纪元的，所以全部围绕 Gemini。对，是从上到下各个部门。这个时候公司也做了很多裁员，也做了很多调整，大家说是很痛苦的。我最近在重新写程序，各种的 API，呃 open AI 的 API，让 Google 的 API 都接起来。我发现接 Google API 实在是一个折磨人的过程，因为他你就想去调 Gemini，他大概有三四个部门的 API 可以调进去。每一个部门进去了以后，你最后面对了都是巨多的模型、巨多的接口，还都不一样哦。烦死我了，无语的。我也看到了，我刚才连连可以连线之前我我也看，我也申请了两个 key 嘛，然后我一看 Google Cloud 控制台里面也有 AI，那个什么 Vaxto 吧，这个东西里面也有，到处都是入口，就是到处都是入口。是。那么，今年的谷歌 IO 上到底发了些什么东西，我是稍微粗略的看了一下，最后导致自己印象不深刻，你是很认真的看了之后，你可以告诉我。我是认真看了一下，我认真看了一下。怎么说呢，第一个印象比较深刻就是他的。AI Infra，这个他发的那个 TPU 嘛，six 嗯对。6，这个芯片比上一代要快很多嘛，4.7 倍嘛，这个还挺厉害的。他加速他的训练嘛。其实 Google，那应该算是这
些巨头里面私藏赚利最多的公司，就是 GPU。Reach 是吧。它不管有 GPU，它还有 TPU，其他几个公司都在做推的芯片，只有 Google 做得最早，他的芯片也是他在他最先来就是的概念嘛，所以说他是算力最强的，包括 m 总和微软的。微软现在也在恶补啊，恶补芯片。而且 Google 就是他便宜，他自己做他自己的设计的，比如说他是算的溢出的，他可以很便宜的给别人去用。对，这个是他的优势。然后第二个呢，他就发了杰米莱，杰米莱就发了一系列，他还围绕杰米莱打来打。先说杰米莱，杰米莱呢，就做了一些更新是吧，更新了一些开源模型，然后发了一个杰米莱 1.5 的。这个 Flash 我们申请呢，5 月底才能够打开。底使用嘛，我现在这个叫什么 Flash 是可以直接调的，在 API 里头，因为我自己有写程序嘛，我已经应该是可以把它调起来开跑了，在沙河里面吧。你正式调用不行吧，可以可以，看看没正式打开啊。我我今天还看了的正式版没有，它是这样的，就是说你只要是通过谷歌的 API 进去了以后，你可以选那个模型，可以跟它对话了。你通过写程序是可以搞的，然后。我记得好像是在在沙盒界面上面才行，sandbox 上面，你是在那个 AI studio 里头吗，啊对，呃我是在外面，我是用的有一个东西叫 lobby，OB Chat 是开源的一个项目，它就直接可以挂上了。到，我我。OK 我们说回来，对接面来，就是应该它最主要的嘛。啊嗯，有一些规划。其实我以为他今年可能会发一个什么1.5UCHA是吧，嗯或者预告一下2.0结果没有，没那么快。嗯，后来就把他们的这个杰米莱的负责人CEO这个叫出来了，是吧那个define，发了一个Jackson Astra。嗯，其实如果说没有前一天open i那个会，他会很遗憾的。结果open i打了一个正着把他，对因为这个，他要发什么喜事应该都知道嘛，因为这么大的公司，他不可能不落风，他不是苹果。那苹果现在的发布会都基本上是吧，都落干净了，发布会之前你问一下Gulu，他就把推出所有的谣言Rumor给你总结了一遍。所以说，这个东西就被打了嘛，被打了一下子大家觉得没有新奇感了，本来他是这个项目，想想放到前面让他惊爆一下，结果没有了。嗯但是呢，两家公司都走的是同一个方向。当你的这个处理能力变快之后，多博泰之后，那很自然的就是idol能感知嘛，之前只是说用语言方式去理解输入输出，厉害了，也能听也可以，可以说是吧。然后模型训练到一块去了，多模态训练出来的，听说模型会比另外的技术的结构要好，你说出来的话更自然，他知道有感情有表情怎么去表达。然后呢他也能看还可以画，有这几个能力之后，我们再把它居民实时化啊，那你只要有足够大的算力，能扛得住这么实时数据流有足够快，这个应该是嗯两家公司速度同归是吧，都在做研究。我看Google这个，他写的视频下面写的PROTOTYPE是个原型，但是呢应该快他可能下个月就能给你用了。我觉得open i那个，可能也还得等，嘿嘿。对，他可能会有一个比较稠，稠一点的版本吧，可能你可以感受。是是是啊，大概我觉得是，这两个都要正好撞车了嘛，就open i有意踢馆吧，故意踢馆。是是，是把他最最有特点的一个东西发布，给踢掉了，然后呢这个也判定出两家公司认为的智能体。因为一个月之前，Google Cloud做了一个发布会，也是讲了all in engine嘛。所以他们在嗯，这cloud里面，他就跟你做你的这个digital的员工嘛。然后有各种各样的engine。这一次就在他大发布会上，发了一个最大的智能体，是吧就是嗯HR。那么这个东西基本上，我觉得也是各种技术汇合点的一个。如果说你想让广大用户来使用，怎么说呢，你受众最广泛，那它就变成ng的意思，使用起来最简单的。这个是很明显的。不过是我个人来用它，是欠GPT，或者说你Google界面呢，它以后都是一个安全，它能够帮你来做这样的个人的助理。

这个东西，我觉得是，呃差不多2024年安静元年开始了啊，这个模型在往下面走，交互界面就可能跳出这个对话框了。嗯大家可能就直接能看能说。这一事情呢，我觉得是很大的一个起点吧，经典的一个起点。这有个好处啊，这个起点你知道他是极其好算命，嗯，这个里面什么 GPU 的需求啊，啊算力的需求啊，电啊这都是，是吧急需的，那就对 VDR 还是还是 OK 的对不对，哈哈哈哈，就就担心这个 GPU 开发商没人用，不可能的对吧？这个是很好的一个趋势。

然后第二个呢，Google 后面又发了一些围绕揭秘了相关的。所以说它的 Workspace，我不知道，在国内的朋友，可能用 Google Workspace 用的不多，但是我嗯，我基本上我重度用户，我们在这边，我家庭小孩学校基本上都是在用 Google Workspace，就是说嗯微软的 Office 套件还用的比较少，但是 Google 老师，嗯所有人都用的，所以说我们对 Workspace 的这个界面的继承，这个是我们觉得还很 exciting 的。这个事情。嗯，而且他他上次也预告了，但是这次没什么新意。大家都知道他有继承了，他只是说了个时间点，什么时候会继承。说下个月要什么时候，对，这是一个 workspace 继承，然后另外一个还有一个是 Gemini，在 social 上改进是吧，在 social 上继承 search with 这个 Gemini，加了一个 overview。Overview 对 overview，就是基本上瞄着那个 proplexity 里去的嘛。Seven corps，不是很彻底，因为他 overview 在你的搜索栏的上面，占了一块。嗯，你下面还是会出搜索界的广告。对，该放广告的地方还得放啊。谷歌靠这玩意活着的，但是我觉得这也是开始吧。对他至少能够这样做的嘛。

然后第二个呢，嗯，广告还做了一个 plan 功能嘛，还有一个用一个 market staff 的这个 search 嘛，自动的帮你把任务给分解了，这也是按键的功能。它相当于是有个小按键，在 search 背后用界面的驱动的，然后帮你把你的任务分解成多个子人物，然后他的 plan 一下，帮你去调用 Google 不同的服务，去完成这个界面，这个特别好。比如 Google 有 map，呃世界上最好的应用，它的 map 是极其好的，一个商业化很好的，它可以调用它的 shift。它有 shift 功能，嗯。

Google show 好像就没有人用吗，在你们那，呃就是，它还是导流，它以导流为主，他只是说把商品展示在小卡片点过去，他这个是要费佣的啊。他最后他自己管履约吗？就是什么物流履约这部分他做吗，支付都不做。不管不管，他，他没有，他没有封装军，他包括订酒店也是的。加油嘛，再不执行这个交易部分嘛，但是他就是会把这个东西包装的更像。这个商品放在前面，你提高点击率嘛？对，这是Google soft。然后Google map，以及Google的EMIGI search。Google的Lens也在里面。所以他们都打包之后，这个规划做的就有意义了。

对，我问你一个问题，他能够做一个长城规划吗？嗯，包括完成很多工作。我觉得这个是有意义的，而且这个可以把很多现在的商业化东西给卷进去，我觉得是可以的。我看到这一块也是觉得蛮有感触的，因为谷歌有全家桶，就是office、邮件、地图，然后电商、照片，所有东西都有。我现在靠AI把它串起来，这个事情其实确实是很强大的一个东西。

对，全世界有全家桶的就是谷歌，微软、苹果三家覆盖能力就全统的三家，但是投放能力最强的是谷歌。另外三个就是我，一个谷歌Meta，打一个苹果，三种投放方式不一样，就是促打，让一个产品能够快速触达用户。

Google是最强的，Google要three billion，30亿用户，30亿啊，对这是最大的。Facebook可能大概在15亿到20亿之间，apple差不多也有10多亿吧。这三家公司有惊人的投放能力，微软稍微差一点，微软大到毕竟还只有office和Windows，这个是没有移动端，所以说这是比赛比较吃亏的啊。

所以说，Google的模型虽然可能不是最好的，嗯，它只要能保持在第一梯队里面，完成这种任务就足够了。对，现在就是帮我做个plan，搞个地图什么，这个看个东西。我不需要那么高的智能，我不需要跟GPT4去比最后的那个比分，那差距太大了。不需要，是是是。加上它的这个30亿用户规模投放能力，它很可怕的。

所以说，现在看到了一个数据。下1GPT的数据是平的，几个月的没涨呢，北美还有所下滑。嗯，但是Google是一直在加美两是一直在涨。嗯，匀速上升。其实，只要是把他自己的这些原来边边角角的东西挂进去，他就长一点。挂进去一个就长一点。对他之前挂的很含蓄，他都没挂。实际上他的搜索是现在。我现在打开Google，Google iPhone上，Google APP上多了个揭秘来。刚刚升级的挂的很慢。嗯，我，我还没看到。对，我待会去试试哈哈。所以大家都在笑Google啊。对Google，这个不能笑他。Google哪怕是万联老二。反安卓也是老二。然后是AI模型能力肯定是老二。但是架不住他人多。这个产品的粘性还和matter不一样，和iPhone也不一样。因为iPhone嘛，它就一个终端是吧，它就把你的入口给卡住了是吧，他的那个他的很厉害。主要是iPhone。然后说，但是进去之后呢，可能用的东西并不一定用苹果。对，进去还是要用搜索型还是用Google的，office套件还是用Google的。我基本上，应该没人会用苹果那个什么icloud，办公吧不会的，呃i was估计也有人用吧，就是什么number。我估计应该用的最多的，没什么没什么，没什么人，but kinot应该用的多，然后其他的多，剩下几个都不行了。然后配置和那个number，估计没人有。所以说，我觉得Google的这个覆盖是从工作到，就是个人效率，就个人的设计，个人的productivity，还有在你的团队工作日常的所有的东西都是他。所以说至少在北美是这样子的。或者欧洲也是这样子的。所以说，他的这个投射能力会强于另外几家，是会强于Facebook。但是Facebook现在也整合进去他的MYTA整到那个什么WhatsApp啊，整到Instagram啊。嗯，也有效果啊。反正他的可以，可以看到他数据的上涨。

那如果是苹果真的跟open i去签了约，那么微软肯定最后是挂open i的东西进去，然后再加上苹果。如果也挂上open i的东西的话，那这个其实还是有一战的这个事情。嗯，这，这个很好玩。我看了一个4O的时候，想的第一个东西就是这个东西，应该叫GPT Siri哈哈哈。对对对对对，我们也是这样想的。其实我看了一下这个，有一篇文章我忘了标题，写的是Sam Altman的这个拳速用的很好，这哥们左右平衡，是左右互搏是吧。他永远跟微软若即若离的是吧。我，欧文i最缺的是欧文i为什么现在会出现这么大的问题，于奢求出走，那就是因为公司在一些战略重点上有矛盾吧和团队。

嗯，如果研究团队需要20%和25%以上的这个算例，但是他要支撑这么大的这个GPT或者企业应用的规模根本支撑不起的。他就只要这么多算例可以用是吧。他要不就做linement，要不就做应用服务，要有个选择。所以说就就掰了呗，这这个价值观就是里面的方向不一样，价值观不一样。所以说他永远是一个比较矛盾的地方，然后他从微软这边拿到了这么多算力，微软其实也在另起门户啊，微软也没有100%的信赖open i是这东西，就像一个三国志一样。嗯是吧，open i出出来搅局的，然后呢微软的苹果在这样子，现在产业三国局面。但这个基本上就把Google排除到外了，因为Google全部都有嘛自己啊。这两个都缺。然后呢现在是微软自己拉了个团队他把那个inflection收购了。嗯，我们叫做，我们叫伪收购，是吧伪收购。哈哈，只是说inflection沉浮于微软呢。
从一个完全独立的公司，然后帮他去做新的，从头开始做模型，因为这个团队做好了嘛，想揭秘了，出来了嘛。
对，微软的野心肯定是要另起炉灶的。微软说分了open AI 100亿的这个这个算力，实际上这个算力他自己也在拿，训练自己的新模型，他没有100%给OPPO来用。
嗯所以三方的觉得不爽啊，对吧，然后他现在要跟苹果去合作。
嗯打死你，这个平衡，那不然就会未来是吧，掐着脖子玩了是吧。
嗯，然后我找一个，我找一个，能够帮我快速放大用户量的一家公司，那之前想想去通过微软的这个什么Capacat Windows是吧。is嗯，量太小了，放不上去，那必须找苹果放，找Siri放。
所以说，我觉得这个相当于是有个平衡点的，那苹果也也是有好处的，再来说他可以快速的拥有这个能力，但是苹果是做的，苹果从来不会说，我把这一棵树叫肥肉，让给你一个人吃，是吧，肯定不会是，苹果一定会后面会这个明修栈道暗渡陈仓的。
这这几家公司都是在明修栈道暗渡陈仓，对各各种的这个博弈啊在里面，这很精彩的这里面，但是你有没有想过这样的一个问题？谷歌，原来比如到苹果那里去上搜索引擎，默认的时候每年是给苹果好多钱的，对苹果赚钱，那么现在比如说，我们在苹果里面再去挂大模型的话，到底谁给谁钱呢？
我估计这个可以这样来分，看open i有没有能力做一个本地版，在iPhone里面好。
嗯，有一个本特别light的一个模型，那苹果自己也能做啊，苹果自己也有，就是这个东西呢，它能够POS到这个这个GPT4的各种，因为GP4肯定o下面肯定会，不同的版本嘛，它已经做了这个区分了啊，不同不同模模型规模的。
那么呢。就是说，Siri是会在本地有运行，他不可能所有的联网。那可能，因为苹果的设备是很多情况下是不可以不用、不用联网工作的。嗯，然后呢，简单问题，比如本地的一些检索啊、启动APP啊，惠达他可以每个月做。那么呢，我想让这个Siri完成更好的，比如说我拿出Siri来，你帮我看一下周围有什么东西，帮我做一些解答这种问题，这种很符合他。画面演示的一样，就是我们在星期一的时候的这个发布会上，演示的一样。嗯，帮我做作业啊，帮我解题呀，帮我做这种翻译啊。是吧，打开摄像头帮我看。嗯，或者说更复杂的推理，帮我录屏幕，忙干这种事情。那很很简单，那苹果说你买我一个，那个服务吧，Siri plus啊嗯，对不对，那这个里面Siri plus苹果可以用，相当于是在用gptplus挣的钱，他来挣钱的嘛，苹果来卖。嗯，那比OPPO i自己卖好。嗯，可能苹果的分一点钱，open iPad会这样来做的，对或者说，苹果出一部分这个计算算力给open iPad，苹果自己我不知道有没有。嗯，可能会这样来做的对。无论是像product Astra还是像GPT4O，从语音这部分，我觉得像传统的方式，直接把所有的声音进行一定的压缩以后，然后传回服务器去干活，这事是OK的。但是视频的部分，我不认为他们可以完全传回服务器去干活去。肯定还是在本地，还是要收拾一下，呃要的还传。应该是直接传开服务器的，那本地魔镜出入不了视频能力。但你这个流量是非常吓人的，你像咱们虽然可以去做直播，但是如果大家每人举着手机说来，我们开始往服务器上传东西，你实时给我反应回来。我估计会冒烟的。所以说不知道，不知道他们会户外会怎么做，可能是机器怪吧。现在甭管是呃open AI也好或者是谷歌也好，大家都在推APP。你推APP的话，就是可以在本地封装一些闭元模型去干一些事情。嗯嗯，因为这一次谷歌IO上呃Gemini模型给我的两个印象。除了他在呃服务端去做1.5 Flash之外的话，另外一个就是他们裁剪了一个比较小的模型放到了手机上，安卓上面。对，还裁剪了一个更小的模型，据说是cdform里。嗯，Nano在Chrome里面。对是的，Chrome现在就有了这个。我觉得这个，谷歌的发布会上有一个很好的一个很好的一个产品，就是Chrome怎么执行engine。嗯，相当于是Jimmy就直接把Chrome接管了。是。然后他可以自己导航，自己去网站，网站这个能力。我觉得这太爆强了。所以说，接下来很多cloud插件就没有意义了，Google真的有太多的优势了。他自己有这么多终端的这种应用。对，可以把界面来放进去。所以我觉得不好说啊，如果说真的，这个智能增长到拼就是说推理能力到了一定的平台期了，剩下就拼这个用户量，占有了投放能力了。嗯，那嗯，包括大家吃亏的，用户毕竟不是他自己的，要么是苹果的，要么是微软的，要么是Google，那他就抢Google，抢Google呗，哈哈哈。是。那咱们看看，就是呃，谷歌IO上除了protect Ultra，除了Gemini之外，它发的另外那些模型有哪些你有印象的，比如说什么图像啊视频啊这些东西啊。其实那些都发过了，然后image 3。嗯，基本上到了majority six的水平了，是吧。嗯，就是上一次他imaging two的时候出了一个很大的错嘛。这个呃对，各种正确的图片出来了。哈哈哈，对对对，这也显示在这公司里面。有alignment及其观点哦，搞得模型都很官僚。但这个所有的模型对比模，就Google的模，JJ是最官僚的，是最没有灵活度的，虽然他做了好多那个level是吧，你可以控制这输出的这个危险程度，但是我还是觉得比较官僚，什么敏感词都不敢处理，这个里面胆子再大的，估计是Grouk了，他的能力很弱。嗯，Grook。现在他允许我们用了嘛，就是像我们这种交八八美金的已经可以用了。嗯我去使了使，发现可能真的是查新闻最好使。对，朋友每天我问一下我，不清楚的问一下，是是是而且经常剧透，像在这个open i的发布会之前两个小时我就问他，我说open i今天发什么，说的都挺对的，对对对，因为rumor很对的嘛，他猜采集rumor好嘛。对哈哈哈没错，这个挺好玩的。对，回头我们可以聊一下刚才说到的那个呃模型的官僚性。刚才我觉得这个杰米莱诞生于大公司，它就有大公司这些信在里面，训练方法的问题。这几个公司的训练模型风格不一样，像open i肯定是走的最早，肯定走的比野的，是是是，风格他胆子大，敢往前冲，garbage呢。嗯接触过他们，以前人就是比较小心的，但是技术也是很不错的，cloud 3的这些人，是吧，嗯对对，cloud cloud其实非常好。cloud对于这个instruction，你的指示的理解能力和控制稳定度，我觉得还是比GPT4好，当然，可能有的推理上面弱一点点了，差看看不出什么差别来了，但是他这个instruction理解能力真的要比要比GPT4好，这是为什么呢？这是因为，他们把这个对于这个东西的理解从一开始在pretending，这个价格就觉得不一样。对，这个Eleven的价格觉得不一样。所以说，他是会更稳稳一些。这个模型对我现在也是感觉是 cloud 3 的。这个 Opus 是我用的所有模型里边理解能力最强、最好的。但是最贵的就是它的 TOKEN 实在是太贵了。我有时候会让 PPT4 这么大 1.5 和 LOUD3 一起去做一个任务。什么呢？就是我把我的视频的字幕扔给他说，来，你给我出总结，然后出这个分段。嗯，GPT4 就经常偷懒。就是 GPT4 偷懒这个问题现在基本无解。嗯，然后呢，真奈，可以很老老实实的把这个任务完成。但是呢，他经常的就很工程师那种感觉，就一点不唯一。对然后做的最好的就是 cloud。他的那个语言表达比较好。对，但是干做同样的事情，GYMNA 1.5 现在是免费的。cloud 的话可能做处理一个 20 分钟的字幕大概需要花掉我可能两三美金或者更高一些就非常贵那个玩意。我可能总共就六七千字的这个文字加上可能时间戳再加上其他东西可能能有个 1 万多字输入输出的话可能有个两三千字的水平然后一下子美金就不见了。那么你觉得对于程序员和创业公司来说，我记得在早期每年谷歌 IO 开的时候我们都是要认真学习领会，然后看看明年一年的精神是什么。嗯，那么从今年的谷歌 IO 开完了以后，你觉得给我们指明了什么样的方向？嗯。他都我用 Jimmy 来了嘛，对吧 Jimmy NI 也是纪元到了嘛。那对主力来讲，我们都用过他的模型嘛，对吧？JPL 模型有有好处就是在过了这个巨大的这个算力红利之下就是资源之下他应该能够把价格做到极其便宜的。速度很快这是他的优势就是说基本上。我觉得他能够在第一梯队里面，是个能用的水平。嗯，你处理那种比较暴力的任务啊，很繁重的任务啊，你可以拿他来用就是某个煎饼奶Flash，又快又便宜。嗯，这是一个比较好的。所以说我就围绕这个东西呢，大家可以考虑把一部分工作交给他了嘛。
嗯，特别你就要考虑这个推理能力啊，要很好表达很好，可以在他之后再套个GPD4O或者说cloud 3。另外一个，你可以看得到，呃Google的全线产品，因为他今年没有发布他的这个安卓手机的东西，没有任何东西。
对说了一下，他会有个安卓版的界面的APP，嗯然后里面有个live模式，打开是跟那个一样的，可以看嘛。但是嗯，我感觉他在接下来之后，在他的安卓手机里面的这些应用的Gemini的唤起会很方便，就是你可以作为一个第三方的APP，可以很方便的把它的这个智能服务给呼唤起来啊，这个也是可以的，让他来帮你完成一份工作，那你可以直接调这个API呀。
嗯，这是一个比较大的一个变化。我觉得最重要还是呃，从Google的和open i这一次的发布会上能看得到我们能看得到未来一两年左右智能体就是这样的一个给普通用户用的这种AI交互界面的方式就会朝向这样的一个语音和视频交互的方式去走了。而且在这个方式之下呢，我们能看到他接下来的下一个版本的这种模型，API开放之后让我们可以解锁非常多的能力，就是你的应用也能够有用他这个能力完成一些特别工作，你可以做个很简单的小应用，然后打开一个，帮我看一。一个什么东西啊，英文的简化成这个样子了，而且他可以变成。如果说你能够持续的帮你去监视一些场景再来看什么东西是吧。嗯那这个，那这个实现起来智能，你只需要写prompt就好了，什么都不用做了对。
但是这个其实有一个问题啊，你到这个时候，你为什么还要写一堆应用呢，他跟你处。你就用他这个，用他就够了。嗯，对啊，我只是说的是好处。就是说，他已经这么通这么放话了，还要做英雄干嘛？对不对嗯。但是呢，我个人觉得呢，身边不可能只有一种助理。我们这样理解，如果说我们接下来就不叫应用了，我们再过两三年我们不叫开发应用，我们都叫开发助理。那开发engine，对，开发engine，开发这种assist是吧？或者engine是开发智能体。以后都不叫 APP，以后都叫智能体好吧。现在最泛化的智能体呢，最通用的智能体就是哎，哦，拆 GPT 是一个智能体，嗯，超级贴身小助理是吧。然后呢，Jimmy 也是一个贴身小助理，但是我觉得 Jimmy 它要贴身起来还是很好，因为我所有数据都估过了，太牛逼了。我基本上所有数据都是他的。如果杰米莱稍稍聪明一点点是吧，那我觉得我用它也可以的，只要它不贵。Gmail 的总结啊什么的也很方便，但是我还有一些专业的。我觉得其实并没有说打死很多 AI 硬件，其实会给很多 AI 硬件做一些很新的机会了。嗯可以做一个那种放在桌上了是吧，就是没事跟他聊聊天的这种好玩的。嗯，这种硬件，苹果之前不是有个项目吗，他们公司做了一个，企划了一个项目，但现在不是那个酷狗也报告了吗？说他们把车的这个团队的人裁了，放到这个 AI 组里面去了，会恢复这个项目，跟那个 teams 一样，Tesla 家用机器人，他们之前设计了一款可以走的 iPad。对，但四年前还是五年前，其实可以自己走，会议室里面溜达的 iPad。你跟他说话，然后我来看着你，对，然后你跟他说话，嗯，他也可以自己去看周围的东西，就是办公室里面的，这种可以移动的秘书，现在这东西有了这样的 AI 之后，那不那不就完全就实现了吗？以硬件和设计能力。再配上一个很好的f，那不就是？是吧，这种新产品出来了嘛。这只是在家庭会议室里面、办公场景里面，还有各种各种外面那些硬件啊，需要这种这种地方其实都可以了。我觉得会迎来一个——在人形机器人普及之前，这种智能设备加上这种感知和语音对话大升级，都要智能体他。他们可能会冲破手机，以后手机会设计会变得更简单了。

打开iPhone，喊Siri我要干什么、干什么，然后Siri把这个界面放掉出来，搞完之后就结束了。你这APP都不用打开，喊喊一下就好了。而且苹果的这种设备，因为apple也可以登一些apple的专利嘛，就是我觉得。

嗯，我们可能接下来真的要忘掉什么叫。其实，现在已经很忘掉什么叫移动应用了，现在应该带的应用器都是Web应用，因为他都是效率工具，都是帮你提高生产力啊，帮你做图，帮你搞字幕，帮你截视频，然后帮你写文档。这东西必须用电脑拿，手机没人干这个，对不对？所以说现在这一批AI创业，大家都叫什么？AI应用外部应用，Web system这样的东西，嗯，就手机上东西并不多，手机上做到现在就一个翻译，加一个太恰的PPT，那接下来可能东西会更少了，打开一个Siri就结束了，走不下去。

可能，我觉得接下来在做的就是做一些tools，给Siri调用就好了，就是你做一些手机上的工具，让手机上智能体给它调用就好了，嗯。做出来的东西肯定并不是给人用的，这就是我们应用的变化，可以重新思考到底去怎么结合这种类似于呃GPT4O和比如说呃Gemini 1.5 Flash，然后结合所有的数据，能够做出一些新的应用场景出来。这是大家可能是一个2024年真正需要思考的问题，如果如果说，我觉得嗯，包括这两个东西。两大手机厂商安卓和iOS，他们一定会做的就是见面奶，也是一个智能体嘛。你打开Google，你说嘿Google在，见面奶出现了，然后见面奶说哎，你帮我查一下今天的这个天气，然后我要安排一个什么路线，我要去滑雪，然后这个路线怎么样，你告诉我这个门票多少钱，我什么时候去合适。他就在iPhone里面把三个应用都调出来了。如果说我有一个专业的去查这个雪山天气，因为我装的应用是滑雪，我一定需要有专业的天气预报。就是说，用Google的和苹果默认的天气应用没有意义的，我必须得专业的内容，这种trail的应用。那么这种应用，他接下来就把数据直接给了他，都不用提供应用，他提供一个这个注册一下，在苹果里来注册一下哦。我是一个提供专业滑雪数据的服务提供商。当你的个人助理想去问什么东西时候，我给你这个服务就好了，登记一下OK。这个就像上上架了，然后就其实也很像之前在GPG里面做tools一样嘛。但是这个东西一直告诉你的，能助理以后我要查专业的滑雪天气，那你查就好了是吧。以后说查这个东西要花钱，那你自动从我账户里扣我吧，我跟Siri说就好了，我给你两块钱给我，结果就好了，全部都被Siri代理了。

在Siri或者Google这样的上面就全代理了，然后我觉得这个呃，真的就变成了交互的这种形式，应用的形式会非常非常大的变化，而且给了新的硬件很多的机会。大部分时候我们走路的时候，开车的时候会戴着耳机嘛。实际上我iPhone都不用拿出来，我不会拿iPhone出来在口袋里边，或者在家里头iPhone放着充电，我就戴上我的耳机就很。而且苹果也在耳机里面做了很多脑波识别的东西，是吧？嗯，更敏感的感受到。以后得带上iPhone，iPod 就好了，apple watch 10。然后你跟他说话就好了。实际上我觉得苹果不应该做微信Pro，他应该马上做一个apple plus。我戴上了眼镜、耳机、手表，iPhone 就不用在我身上了。iPhone 放了我家也当个小服务器就好了。我看到的是你看到的。我最近各种 iPhone 说话，然后什么都结束了，就完成了。我觉得这个东西可能两两三年就会做的，而且 Google Glass 已经官宣要复活了。啊，Google Glass 要复活啊？对，要复活了。我还印象很深刻，当年戴上的时候烫伤了哈哈哈，特别舒服。不一样啊，线线线技术不一样了。对，现在还做这个东西，应该会的。我觉得这一波可能会最快催生的就是，首先耳机是很重要的一个输入设备。会有大量的新形态的耳机出现。除了这个之外，第二个眼镜，耳机眼镜手表都会被增强。嗯，到时候你把手机放到口袋里面，不用拿出来了。或者放到手机，变成一个叫随身小服务器。对，手机就是随身小服务器，输入输出，交互，已经完全可以像这个叫可穿戴设备，移动了。我想打游戏，或者我想办公，我想 Office，我要打开电脑，怎么样就好了。那你觉得像呃 GPT4O，其实，它更多的给大家看到的是情感的陪伴，或者情绪的这种输出。谷歌其实出的所有产品都是一种工程师范，就是很浓浓的那种穿着格子衬衫，秃头的那种感觉。但是呃 GPT4O 就是让你觉得哎，他还这个有点害羞，还有点兴奋，还有很多这样的东西。那么这种情绪价值的输出的话是不是也会给大家带来一些新的、不同的思考？对，我觉得他提高联性嘛。嗯，就那天，我说我在车上。我打开，如果说我真的是有像演示这样GPT，他有情绪陪我聊天多好玩。我就开车，我都不用开车了。我旁边没人，我就跟车聊天呗。嗯，我就把他开着，然后我车自动驾驶的时候，我就跟他聊天就好了。因为我估计下GPT也是看的Sam、奥特曼他们，也是看的现在在这个里面最好的这个character的点、AI character。AI对数据量用户流程比他们好多了。

嗯下GPT，那就是因为他有陪伴价值。对，所以说肯定想干这个事情，他一定会把Karak的AI这个市场抢过来，他千方百计地要提高流程，提高用户的占有量，在这一块上的话。其他人是不是也可以调用GPT4O，比如说在自己的应用场景里头，加入这种情感相关的、这种预值、然后呢让自己的留存上升。特别是像游戏啊，或者是这种应用里面。应该是的，应该是，但是成本会比较贵。

未来肯定会有的，而且我说了，智能体不会只有一种的，记住嗯，OPPONI提供一个GPCD，就是其中你最贴身的一个智能体。但是OPPONI最后还有什么，就是GPT four o或者GPT five，或者什么什么样，这样的不同的模型给你调用。而且还有定制化的模型，还有其他家也会提供的模型，这个模型它就会提供其他智能体的背后的智能嘛。

嗯也可以做朋友智能体吧，游戏里面需要游戏的嘛，可能某一个游戏厂商，他开发了一款特别好的游戏，我觉得游戏是很好的一个，也会得到极大升级。但只是这样服务成本太高了啊，如果说你在游戏里面去玩，又能够玩这种像这种看到电脑电脑屏幕的、配这种3A游戏是吧，或者说手机这种很简单的手机游戏，这个里面把你带入情景之后的角色，也是会很好玩，他就陪伴你，情景陪伴吧。

我创造一个虚拟的。这个是挺好的，而且还有一个呢。你账号后面走，这种VR设备也会。所以我觉得，毕竟Pro这个产品还是发早了。咱们刚才讲到了，BREAKER AI有可能会被干掉。你觉得咱们从GPT4欧和谷歌艾欧的两场发布会，其实谷歌艾欧很少干掉其他的项目，而欧盟AI的发布会，基本上是每一次都会干掉一批项目的。那你觉得还有谁会被干掉？现在他不是已经干了一批的陪聊了吗？这一次对伴侣的是吧，助理的啊詹姆奥特曼？他也不是在最新的一期采访里面说了吗，就是说他建议创业者绕着他们走，就是说对于一个像GPT这样的，一个他要解决通用问题的这种事情上面去，你就别做了啊。通用就是最个人紧密的个人上这种东西的，你要去做你产生单独有业务流的事情去。嗯这垂直到一个句子生意场景里面去或者是去处理用户一些特别的数据上面去，去做这些事情就通用的对话呀陪聊啊这些东西，其实是没必要的。对大家如果在企业端啊或者在一个人的一些特殊数据处理上面，可能会有一些作用我觉得。随着他的这个智能越来越快速度，而且他功能也越来越强，你看他可以连接Google啊，连接Gmail啊。当然他已经侵入到了Google地盘上去了。看看电子表格啊，帮你去写了PPT。以后他也可以写PPT。他可以控制PPT，他写不了，他可以控制。我觉得现在有一个特别搞笑的问题，就是说现在有一大批去做这种深层PPT的软件，是吧？回头，那现在做的最好的还是大家用的就是Kilo的，很好是吧。他就是个纯工具，他不要AI。没关系啊，我用AI控制你，帮你完成就行了，你不用去做一个新的一个PPT工具了。我的engine的可以控制我的电脑屏幕，控制权在里边。屏幕共享在里边。

嗯，你自己去做就好了吧。

嗯，我现在用WPS用的挺多的。现在WPS后边挂的那个应该是Mini Max的，这个大模型效果还挺好的。要告诉他做个PPT，咔咔给你做。做完了以后说：“这一页我不喜欢，给我换一个。” 咔咔再给你重新换一遍。

所以说，我觉得嗯，怎么说呢，有的做工具挺惨的，嗯做工具的就比较费劲了。

对对对，我觉得有一个特点，你以前做的工具做得很好，你有很大的市场量。你像Adobe，嗯，你会继续很好，你会继续很好，因为AI在增强。你如果说：“我想用一个很投巧的AI的方式来替代你，现在太难了，除非你创建了一个完全不一样的工作流。”

嗯嗯嗯，现在像这种AI搜索，比如像proplectity这两种东西，你觉得会被干掉吧？

我觉得概率很大呀，因为甭管是open AI还是谷歌，实际上都是在向他的地盘在清洗。

对啊，对啊，对，我觉得，我本来只是现在还没有觉得，他这个需求，没有，没有，现在这个智能体看出来那种wow感觉，是吧，哦对。

我们先把这个放出来，我觉得先放智能体就是为了堵这个Google，而且一个堵Google，第二个呢，应该是他们在6月10号左右在苹果的发布会上会有一个很大的一个更多的浪去事情，嗯，啊，在Siri上面会有更大的一个浪，就是WWDC。对对对，这个才是它主要的，三米奥特曼会上场的，现在三米奥特曼都没出来嘛，这他现在还是要把这个伊利尔撤退，完了以后导致的各种混乱，再抹一把。才能再往前走。对，所以说我觉得他的Alimon团队撤退其实损失挺大的，因为你后面的模型在训练啊。再往前面进实际上就是靠Alimon团队的，其实Alimon，对齐整个去掉了以后，它需要重新建这一块。嗯，或者说是它核心的很多research都走了，但是我觉得这也正常吧，这个理念不一样吧，或者说发展的一个公司发展的一个阶段，他自己的成长他也需要。嗯，也是这样的，转型和幻觉，所以我们现在看到整个市面上的一个格局，嗯，open i目前还是最好的，有一颗新星自然诞生的一路mask的XDNI吸引了好多人才，因为系统有这个，iPhone的人就已经奔特老马了。然后呢，还有一部分去Antopic，Antopic也在捡漏，未来其实也在捡，嗯，未来，这样的换血其实是好事，他让流动起来就好了，不然不用被一家公司给霸占着，他分散之后，可能又会长出新的概念出来，我觉得硅谷的神奇之处就在这。

谷歌这边，我觉得可能他这一次就未必会有那么多的收益了，就是这些团队出来，应该没有人再惦记回去了，可能都待过，都待过XAI这一块，虽然说又去融资，然后又去扩大算力，但是真的看不太出来这样的一个产品，据说它底层应该也是微软的GIX啊，不是谷歌的GIX，然后呢，做的Moe做的在这样的一个基础上，其实我并不认为它能够做出什么新奇东西来，嗯，应该是没有太多新的，但是呢，我觉得这些模型公司都背后有靠着自己的生态在嗯点燃很明显，有生态它有tutor嘛，是这个这个，它从用途和数据燃上，它能够解决很多问题，第二个，它有一个更可怕的一个，他要做多博泰，他有优势他有SLF，嗯FSD挂上，哎呀，不是FSD，是他不能这么搞吧，是因为他FSD是属于克拉的嘛，你看那个group 1.5 Preview版本里面，嗯Excel下面有一个比较的一个图，他让那个group 1.5去看这个图片，问这个路车过不过得去，这个open i，open i说过不去，他说过得去是吧，因为他他的这个训练数据不一样嘛。他有空间感知能力，而且他这个感知能力就是实际的。应该会从FSD这边共享一些自然过来来做这个。嗯，就是，他肯定在这一块上会有一定的差异，因为你毕竟特斯拉是个上市公司，你FSD属于特斯拉，包括这个擎天柱机器人也属于特斯拉。你要想把这一块拆出来单独放到呃XAI里边去，就跟马斯克说的是，你不给我批薪水，我就把他拆出来单搞。哈哈哈哈。

现在我投票了，支持他千万别拆出去了。哈哈哈哈。好吧，到底是特斯拉股东。他如果拆出来，特斯拉就不值钱了。我觉得一下猜不出来，但是这个东西他肯定是他平衡嘛，两边左手右手都是杏儿子，是吧，不一样。对，左手右手都是杏儿子，就是你哪边愿意多给我一些这个控制权和收益的话，我就把这个鸡蛋多往哪边篮子里放一些。嗯。

但是，我觉得这个XNI的发展方向还是个语言模型的方向，多模态模型。它这个综合语言模型，综合智商，然后FSD是驱动动作的，FSD做的是视觉到动作的一个反馈，就是recent to action，包括那个机器人也是一样的。嗯，他做这个的，然后呢，这两个模型最终可能会通过一些很好巧妙的架构会合体的。嗯。

那我们最后再探讨一下他们这个。提前一天，我觉得算是很戏剧性的这种抢戏。OpenAI跟谷歌，你比较一下，你觉得他们有可比性吗，还是说在未来他们会如何去发展。哦，这两个公司完全不一样的公司嘛，可比性呢，你要怎么比呢，一个巨无霸是吧，然后另外一个是创新公司是吧，这个新锐公司里面最值钱的。所以说这两个公司企业风格不一样，而且，我觉得说，如果真的看执行力，肯定OpenAI执行力更好，公司结构远，然然后呢，有三位奥特曼，一个我们，我可以把它叫生意人，有野心，Ambition很强。但是这样一个人，能不能够带领大家更好的走向AGI，那我就不确定了。嗯，至少是他能够。现在各种搞法、各种平衡方法，这种政治权术。嗯，还包括蛊惑人心的那个能力，都很强。他能够在这一段时间里面让都，既不是技术能力，也不是工程能力，刚才讲的所有的斗鸡，他都不是。但是他是有危险的，他是有野心的，有眼光，有蛊惑能力的。这人才吧。所以说呃，那他跟印度马斯克不一样。印度马斯克虽然说是，也是一样有野心，但印度马斯克是个真工程师。接触过人都知道，他是美国工程院院士吧。对，这个真工程师他真懂得。所以说这两个公司这执行力都很好。Google的执行力略差，因为它是一个大企业，它是一个观点，大企业来自CEO不是创始人，对吧CEO是，是吧，后续打工仔嘛，跟那个库克一样。嗯，不是创始人，嗯。所以这样的都会减减分，但是你说这个微软的CEO不是创始人，微软CEO很牛逼啊。这个不一样，也不能再来评价。所以说我觉得，嗯，怎么说呢，我觉得要看这个产品的打法和产品的这个突破性。我们更好的看高分i，他总能够带来很多的东西，而他人才密度也足够高，嗯且同时有野心。但是呢，这个市场他能不能够100%吃下来，嗯不一定。而且我觉得Google在后面，后续是市场能力会比OPPO还强，嗯。对Google只要我保持万年老二的方式，嗯哼，他就可以把市场强到50%以上，是是是，这个我是能够相信的。微软其实在整个互联网时代里头，嗯就没有特别大的生意，对对。但是你到今天AI时代，一看来说这个巨头活的还好好的，然后市场都是他的。微软的这个操作系统和office，还都把市场都占在那了，就是占有量嘛，他的客户张金量就在那。对，因为微软的云也是因为他有office。所以说，他企业销售这个走得特别好啊。很多企业的云端因为通用他呀，所以说这个。这个没办法，他之前这个长期积累的用户不是那么容易就被丢掉了。所以说，Google里绝对不能小看他，而且他潜力很大。他只要是别掉队太远，或者说他只要在第一梯队里面就行，就别哪天JPL号GPT5出来之后，JPL2或者JPL2.5根本就被他甩不见呢。那我觉得这个不可能，在全方面同一个架构下面，谷歌只要守住基本盘，守住他的用户，守住他的安卓，守住这个呃，比如说Workspace，那么只要是他的大模型在这个叫一定基准之上，他就还可以接着往前走。

对，对的。哪怕傻一点没关系吗，是吧？你就完成我们这些，完成我们酷狗里面那些多任务就够了吗？因为他不需要那么情感化交流吗，我我就是打工的吗，啊我就是打工的。这个观点还是非常棒的，嗯，对。因为微软其实已经用自己的这个过去的经历证明了这件事，我只要自己基本盘没丢，没问题对吧，下一次我还可以乘风而上，对。对，所以说现在Opni很着急啊，他要傍一个更牛逼的人就苹果，对。他必须找一个更大的入口，所以说一定是牺牲了很多条件跟苹果谈成，是嗯，对，但是苹果也不吃素的嘛，苹果肯定会把它价值榨干，然后呢甩，把它甩掉。

苹果，我觉得反正怎么说呢，他跟谷歌做了这么长时间的搜索引擎捆绑，其实我在上个月的时候在硅谷正好聊了一个离开了这个苹果的persona团队的一个人就软件功能做persona的，离开创业去了。然后他给我介绍了一下他，他在苹果里面呆了两年多，他第一感觉就是，他最深的印象就是苹果在苹果公司里面软件工程师地位最低的。嗯，其次是硬件工程师。设计师最牛逼啊，就是做任何设计的设计师产品经理。这个设备里面，产品就是抵战性驱动的这种文化。底战驱动的，对抵战驱动文化，我一切要以优雅好看这个体验好为主，这是他的核心。然后我所有的硬件工程师就是为了满足这个设计的。我把硬件做到极致，我的硬件才能极其牛逼。他说苹果硬件极其牛逼，苹果一般。你看微信Pro，它完全是软件拖后腿，硬件已经把软件甩了。看不见嗯，软件可能不知道怎么发挥硬件这么牛逼的能力。硬件做过头了，硬件太厉害了。结果我现在拿到了这个iPad Pro，新款一样，这个在我这旁边。嗯，超薄，很漂亮，现在大家都在研究怎么撅这个东西呢，怎么把它撅折。这个东西性能这么强，软件发挥不出来。哎，苹果是故意的，苹果故意不把Mac放上面去，就是为了让那些有钱的买MacBook的人买两台设备。所以说，他的硬件把软件甩到后面去了，苹果软件在，工程师在，软件在苹果地位里是最低的，导致苹果忽略了AI，这是基因造成的。嗯，当然，如果苹果补不上，他可能就真的得靠着OPPO AI了，他不可能靠杰米来了，因为这两个竞争嘛。但是这个，你像苹果靠了这么多年的谷歌搜索，也就这么混过来了吗，也没有说我要做一个，或者说把别人带进来，混进来混过来对对对。所以说，苹果只要你买的好，他把自己擅长的事情做好就完事了，只是我觉得，像现在Vincent Pro遇到的问题呢，就是大家已经玩了太多年了，特别闲的煤炭，玩了太多年了。

嗯，像iPhone，其实iPhone一里头是没有APP store的。嗯，直到iPhone应该是3G里头才开始有这个APP store，是第二个版本才开始有。iPhone 2之后才有的iPhone 3。嗯，33才有嘛。但格局就这样了，我觉得格局就是这样。对，今年6月份，今年最劲爆的发布会应该就是苹果。苹果那个发布会之后呢，智能手机上的AI怎么玩，就全全算了。你要等着指明方向了，这指明方向了。苹果还带路的，要怎么玩，那跟着Google就上了。Google永远是万年老二，哈哈哈哈哈哈。

行，那这个我们这一期差不多聊到这里，等着wwdc完了以后咱们俩再约起来去聊一下PK这个问题，大家很多看点看点。

好，那我们今天就聊到这里。好，感谢大家收听，也感谢大家去关注一下影帝购的频道。你现在频道还在做吧？我就发我的直播，我没有发那个短视频，在做在有，有关注，关注关注，可以啊。你回头你在群上发一下就好了，好好没问题。

那行，我们先到这里再见。我发一句像孵化机一样啊，我大概我听说过这个，我让你给我钱给我。以苹果自己的这种一流的AI，嗯。\n

Google I/O，如期举行。王炸Project Astra被OpenAI的GPT-4o截胡，其他零零散散在各条战线上都和OpenAI打得有来有回。感觉就像一个地大物博的老大帝国，啥都有点。就是老了

Luke Fan — Thu, 16 May 2024 01:23:07 +0000

大家好，欢迎收听《老范讲故事》YouTube频道。今天咱们来讲一讲Goole I/O，又一次如期举办了。为什么使用了这样的一个词呢？因为提前一天，Open AI已经把风头都抢走了。大家要知道，在往年的Goole I/O啊，一直都是被认为是互联网科技圈里的一次技术盛会。我曾经去过一次，2014年，我是到旧金山，到现场去参加过一次啊，那真的是一场科技盛会。所有的技术媒体，在这之前就要整装待发，我们要在这等着，等什么呢？传达好Goole I/O，向全世界互联网技术圈传达的方向。对吧，大家要好好学习。今年指明的方向是什么？每年都要干这样的一个事情。甚至呢，还有很多的小公司，会在Goole I/O的会场外面举办各种小型沙龙。2014年我就去干这个事情，在Goole I/O外面啊，租了一个小的酒吧。但是，你不敢在他正式开会的时候开会啊，那个时候是抢不到人的。我们都会在他开会散了以后，晚上在周围的小酒吧里边开一些小型的沙龙，跟我们坐下来，我们来讲一讲这个——当时在猎豹移动，是猎豹移动啊，在谷歌里头都干了些什么事情。我还记得那一年我们坐在台下，听着皮查伊在上面讲，提了多少次猎豹移动，大概提了4次还是5次。我啊，还有很多猎豹移动的员工，包括各种老板们，都在下面听着热血澎湃。但是今年，热度全都被Open AI释放掉了。你想，大家都在等着，等着，等着，说哎，Open AI还提前一天来，说我们给大家看一个不一样的。我记得以前有一个这样的故事，是滴滴也是跟另外一家公司去抢，那家公司还比滴滴融的钱多，然后每天在北京交通台做广告，说啊，还有10天，我要告诉你们一个重大消息，还有5天，我要告诉你们一个重大消息，反正每天倒计时往前数。然后滴滴呢，大概提前了一天发布，说不用等了。今儿我就告诉你吧，人家等于是花了30天的钱，滴滴只花了一天的钱，还可以截胡了啊。现在Open AI也干了这么个事，Open AI在提前一天发布了GPT-4，这样一个产品。这个产品呢，从外在表现上说，你说它划时代吗？又好像没有那么划时代。它人性化的很强，就是大家觉得那是一个人了。而且从技术上说呢，也确实有一个进步，什么进步？原来都是说语音识别，内容处理，或者是叫文字处理，然后再到语音输出，原来是这样的输出方式。现在是端到端，我这头进去就是语音，出来的也是语音。这个产品让大家眼前一亮，让这些等了很长时间的技术媒体们，一把把热情全都释放掉了。什么划时代呀，什么“Wow”，还有各种各样的溢美之词，就直接都在它身上释放掉了。这也是很神奇的一个事情。

Goole I/O里边发布的第一个产品是什么呢？叫Project Astra，这个产品呢，我觉得算是草草发了一下就完事了啊。因为现在肯定不敢是现场演示，都是给大家看一个视频就完事了。至于说这个产品是不是真的没有准备好，还是说已经准备好了，只是说我们要再等一等，再磨练一下，回炉一下再给大家看，不知道啊。现在对外面说的是，这个产品现在只有原型，还要再打磨一下才可以给大家看。因为这个产品，完完全全是被GPT-4干掉的。这个叫谷歌版贾维斯，他其实干的活跟GPT-4是很像的。这个里头呢，一个是贾维斯，另外一个是Her，虽然前面GPT-4出来的时候，也有人在喊贾维斯，但是呢，更多的人喊的是Her，而且山姆·奥特曼自己喊的也是Her。这个角色有什么差别呢？贾维斯呢…
是钢铁侠带的AI助手，干的是什么呢？你给工程师做的AI助手，它可以给你处理各种工程事务。而Her呢，是一个科幻电影里面的，是情感服务——它要跟他去谈男女朋友，要恋爱的一个东西。所以，谷歌发布的产品跟Open AI发布的产品之间的差异，一个更有用，更能够解决各种工程问题；另外一个是更能够提供情感价值，更像一个人。但甭管是贾维斯还是Her，甭管是Project Astra还是GPT40，其实呢，这两个产品都为我们指明了共同的方向：这个共同的方向就是要高速响应，调用摄像头啊，也就是要有视觉，更像是Siri 2.0的一个产品。原来，甭管我们是Siri也好，还是其他的各种的谷歌助手，或者其他手机AI助手也好，这都是上一代的产品了。现在结合大模型以后，如果能够有高速响应，如果能够有视觉的反馈，这就是未来啊。甭管是GPT40还是Project Astra，指明了这个方向。

当然了，晚了一天，我们就完全无法判断Project Astra到底做成什么样子了。而且，它有可能是按照传统的方式做的，就是先进行语音识别，然后再进行文字处理，最后再语音输出。现在可能叫回炉重造了啊。最后，我们能够看到的是一个什么样的产品，就不好说了啊。我觉得在这一点上来说，Open AI的策略实在是太成功了啊，完完全全是打了谷歌一个措手不及。而且，昨天在Goole I/O大会开始之前，我们在Twitter上开玩笑说，皮彩是不是回去连夜改PPT去了。那么，改PPT这部分，应该就是关于“Project Astra”的部分了。正确的是，谷歌把所有的产品和方向都对标了一遍。先把Gemini升级，Gemini现在是100万上下文，我们把它升级到200万。然后，出了一个新的模型，叫Gemini 1.5 Flash。像我们现在用的很多是Gemini 1.5 Pro。那么，“Flash”什么意思？闪电啊，就是速度要非常非常快，是为Project Astra准备的。这样的后台模型拿出来用了。视频模型，对标Sora的模型也拿出来了。音乐的也有，然后图片生成的，现在叫Imagine 3，原来是Imagine 2。但是这个到底怎么用，我还没太搞明白。因为Imagine 2当时推出后，几天内把所有人都化成了黑人，之后他们又取消了，说几个礼拜后再拿出来给大家看，结果到现在也没再拿出来。所以，后面这个产品到底什么样，不知道了。

其他的，包括TPU也要拿出来说，哎，我们也都升级了。所谓TPU，就是谷歌自己做的算力芯片，特别是服务端的算力芯片。这一次主要发布的是服务端的算力芯片。手机端的算力芯片，他们通常是会跟着他们最新的手机一起发布。那么，谷歌的真正看家本领是什么？其实不是刚才我们讲的这些东西。刚才讲的这些东西都是，别人有什么，我就拿什么东西来应对。就像常说的，如果我出这一招，请问你如何应对？谷歌说，来，我这里也有做的。但是，谷歌真正的看家本领是什么？就是搜索。对吧，它在搜索上加了一个叫“Overview”，就是综述一下，我把前面几个我认为比较准确的、比较重要的搜索结果，写一个综述给大家看一下。这个产品呢，又不像是AI搜索，为什么呢？它是一个折中方案。谷歌主要的收入来自于搜索广告，如果你真的做成AI搜索，就算一个人收20美金，这钱挣不回来。谷歌是把全世界绝大部分的广告费都攥在手里的，所以它没法放弃这块收入。因此，它的“Overview”现在只能在美国使用，可能只能在英语里头用。它离真正的AI搜索产品还是差得比较远的。而且，谷歌是有全家桶的，为了对抗微软，谷歌专门做了全家桶。咱们所谓全家桶，是指你有Office，有照片，有通讯录，有邮箱，有日历等，所有这些东西都包括在内。全世界有全家桶的公司其实并不多，或者说使用比较普遍的这种全家桶公司，实际上就三个：一个是微软，它自己有日历、网盘、邮箱、通讯录、全套的Office，因为人家有Windows，有整套的操作系统，这是完整的，也有搜索；然后是苹果，它有全套的，包括Mac OS、iPhone（iOS系统），还有苹果全套的Office，称为iWorks，以及苹果的网盘、邮箱、通讯录、日历，一整套；谷歌也是一整套，称为Workspace，包括Gmail、谷歌通讯录、谷歌日历，甚至还有谷歌地图、谷歌相册。在这三家里，当与Gemini打通，或者说刚与一个AI的系统打通后，它确实是会迸发出空前的想象力来。比如，我现在可以搜一下机票里头有什么样的信息，问它过去半个月里头有没有人给我发机票信息，或者说给我总结一下最近邮箱里头有哪些特定类型的信息。
他就可以干这件事情了。他不但可以把《机妙》都读完了以后，还可以把里边的附件都读一下，甭管这个附件是PDF还是视频，他都可以读出来然后进行分析。你也可以说，“哎，把我的Google Drive里头，包括我的Google Bookspace里面的，所有的这些文档给我找一找，里头有什么相关的信息，给我找一找。”对吧，这个是可以干的。微软也是要这么干，就是它跟所有的Office捆绑在一起，跟Windows捆绑在一起，说，“给我去找一下这里头有什么东西。”对吧。现在苹果呢，呃，看来是要跟Open AI再去合作。说来，呃，我苹果的整个的全栈统一类，它也需要加这么一套东西。苹果到底是做Ajax，还是说我们先拿Open AI先顶上再说，这个不好说。或者也有可能，以苹果使用搜索引擎的调性来说，他应该是两边都支持，因为你如果只支持一边的话，容易被反垄断案影响，对吧。但是现在传出的是，苹果跟Open AI走的要更近一些。现在呢，谷歌的Gemini，就是“我来，通通都打通了。”啊，我把我的这个相册给你打通了，你可以问，“哎，我这些照片里头，有哪些是跟儿子有关的，或者跟我的车有关的？”你就可以提这样的问题。然后，他会把你所有的照片进行一些总结，归纳了以后说，“哎，你这有多少个阶段啊，每一个时间节点是什么样的，然后在这个时间节点，你发生了一些什么样大的事情，你有照片为证。”他会干这样的事情。这个呢，还是比较让人兴奋的，因为要知道，Open AI自己是没有全家桶的，这些想象空间它都没有，它只能跟微软在一起，在微软的全家桶上去玩。现在有可能，在苹果的全家桶上去玩。另外一头就是谷歌，“哎，我在全家桶里上GYMNA。”谷歌推的另外一个东西呢，是Gemini on Android。其实，在安卓系统里头，要去嵌入Gemini的这种小型的模型。即使在大模型小型化这块，谷歌一直走在世界的前列。原来做TensorFlow的时候，他们有专门一个产品，叫TensorFlow Lite，应该是谷歌中国团队这边很努力地去研发，在做这样的一个产品。所以，他们一直在干这件事，就是希望能够在安卓端直接进行一定程度的这种大模型的操作。Gemini说安卓出来以后，那么以后的安卓系统，可以进行更多的本地智能操作，这就会变得更加强大。但是，这对于国产的移动操作系统来说，就会比较痛苦，比如说MIOS，或者是OPPO、vivo，至少在国内卖的这些产品来说，就比较难搞了。当然，他们到国外卖的产品，应该会搭载Gemini for Android，这个是没有任何问题的，因为所有的这些安卓设备，一定要捆绑谷歌全家桶——你的地图、相册、日历、通讯录、邮箱，还有谷歌Space，要捆绑在一起，它才好使，否则差异很大。

Mini-Android虽然它没有特意强调，但我相信应该是捆绑了GMS，就是Google Mobile Service。要知道，在国内卖的这个安卓手机，哪怕是小米的，里头的GMS都是不完整的。另外，鸿蒙这个，我们只能期待它给我们惊喜，肯定跟安卓，特别是带了大模型以后的安卓，差异会越来越大。那么，小米、OPPO、vivo国内的产品，估计会各自为战，因为小米自己有自己的大模型，OPPO、vivo自己也做了自己的大模型，但是这一块，可能跟这个Gemini就会差得比较远。虽然Gemini可能跟OpenAI比起来，它是有差距的，但是碾压小米和OPPO、vivo自己家的模型，应该还是没有任何问题的。

最后，咱们要讲，对于谷歌来说，现在是不是已经是廉颇老矣，尚能饭否的时代了呢？有点像了。谷歌现在可以在所有的战线上都进行拉扯，每一块都有OpenAI所谓的端到端整合大模型路径，我把所有东西都会整合在一个模型里头去，然后我尽量端到端。这头输入什么，那头就直接有输出啊。做这样的事情，谷歌呢，现在可以干。在每一个侧面，也都好像还有一战之力啊。但是呢，他们整合是很困难，因为这公司实在太大了。每一个小部门说：“我们都很强啊，我们都有能力再去研发一个自己的模型，自己去应用啊。我们一定要去可以替换，不能让任何一个呃模块变得不可替换，变成唯一的这种关键点。”不能干这个事情，那么导致呢，就是各自为战。而且呢，各自呢，会有很多的这种规则啊，这个就会比较难看，相互之间拉扯。最后在基座大模型升级的时候，比如说GPT4升到GPT5的时候，那么，谷歌可能就又会显得比较难看一点。现在的谷歌呢，有点地大物博和老大帝国的影子了。咱们想一想，这些地大物博的老大帝国，都是怎么讲的啊？说：“老子当年富过啊。”谷歌现在也有这样的感受，哎，啥都不缺，地大物博嘛，我啥都有啊，每样事情都有。所以你看谷歌IO发布的这个会上，对吧，所有的方向，只要OpenAI有的方向，我们全都有，每一样我都应对上了。然后各种的制约和规矩众多，一旦跌了跟头就爬不起来，就跟那个Imagine II，当时因为正式正确被人骂了以后，下去就再也没回来过。而OpenAI呢，完完全全是下一个时代的产品。真正干掉老大帝国的，永远不是另外一个老大帝国，就像苹果呀，微软，你说哎，我们把谷歌干掉没有那么容易，对吧？真正要干掉他的，一定是一个他从来没见过的东西。对吧，这就是OpenAI。所以谷歌现在其实是比较危险的，虽然尚能挣扎，没有在任何一个战线上完全被人打得溃不成军啊，但是他的底层逻辑是错的。底层逻辑是：我每一块拎出来都还可以再比划两下，但是啊，你真的跟一些新生事物，你是打不过的啊。这就是谷歌IO啊，给我看完了以后的感受。这期讲到这里，感谢大家收听。请帮忙点赞并点小铃铛，参加Disco讨论群。也欢迎有兴趣、有能力的朋友加入我们的付费频道。再见。