杨乐坤出走创业,Meta反成股东,这场“和平分手”背后是路线的彻底决裂:世界模型vs大语言模型,谁在赌对未来?Yann LeCun、Meta、AI、launch startup、world model

杨乐坤出走创业,Meta反成股东,这场“和平分手”背后是路线的彻底决裂:世界模型vs大语言模型,谁在赌对未来?Yann LeCun、Meta、AI、launch startup、world model已关闭评论

杨乐坤出走Meta:一场关于战略、用人和未来的博弈

大家好,欢迎收听老范讲故事的YouTube频道。

这一天还是来了。前面我们已经猜测了很久,说杨立昆到底什么时候会离开,因为所有人都眼睁睁地看着Meta的AI战略转换方向。亚历山大·汪进入Meta,一个28岁的辍学生,在管理65岁的大学教授和图灵奖得主,这个事一定不能长久。而且前面还对杨立昆手下的FAIR部门进行了600人的裁员。

靴子落地:杨乐坤宣布离职

现在靴子终于落地了。2025年11月19日,当地时间13:20,杨立昆发了一个长文宣布离职了。在这个文章里边,他回顾了一下在Meta待了12年,感谢了小扎和一堆高管,然后准备要去做他的AMI。他这个AMI呢,叫做“高级机器智能”,说:“我在Meta期间就一直在干这件事,现在呢我准备出去了以后接着干。”而且新公司呢,Meta依然还有参与,具体的情况后续再公布。他呢,也终于可以不受Meta的限制,去研究自己的世界模型了。

杨立昆也要去做世界模型,跟李飞飞有些相近。最后咱们再说一下,他的世界模型跟李飞飞的世界模型到底有什么差别。

Meta呢,应该在这个里边还是给了钱的。你请这样的一位大神出去,而且大神在发文的时候还感谢了扎克伯格,那一定还是要给钱的。所以杨立昆未来的公司里头,Meta应该还是一位重要的股东。但是到底给了多少钱,占了多少股份,可能还要等未来Meta的官宣,现在应该公司还在注册过程中吧。

谁对谁错?一场责任的追问

我们普通人呢,真正关心的不是这些事。我们关心的是,这些大神们斗来斗去了以后,到底谁对谁错呢?

  • 有些人讲了,扎克伯格短视了,不听老人言,找了一个年轻小伙子过来,你把这个图灵奖大学教授给放走了,这一定是要吃亏的。
  • 还有人呢说,Alexander Wang抢班夺权,给扎克伯格进了谗言了。这是中国人比较喜闻乐见的一种论调,为什么呢?总是“清君侧,不能斩昏君”,皇上做出什么错误的决定,一定是下边人进谗言了。这个28岁学生整了这么一公司,进来以后就把老教授给挤跑了,一定是他的错误,扎克伯格只是被他一时蒙蔽了。
  • 当然呢,也有一些人,特别是像傅盛这样的人呢,就出来说杨立昆耽误了Meta,如果没有他的话,Meta早就行了。这种呢就属于站在CEO的角度上,CEO的角度呢,通常都是不会承认自己有错的,都是下边人是坏蛋。而杨立昆呢,站在这样的一个位置上,把持了这么多的资源,又没有把这些资源真正的变成Meta能够挣钱的商业利益,那么一定是他错了。

扎克伯格的决策失误

从我个人的角度来分析,当一定要有一个人来承担责任的时候,这个人一定得是老大,也就是扎克伯格自己。扎克伯格在这件事情上到底做错了什么呢?是不是听信谗言了?是不是不听老人言了?是不是选错方向呢?还不是。扎克伯格真正做错的是决策错误。

哪样的一个决策错误?就是你去找杨立昆这样的一个人来,纽约大学的教授,图灵奖得主,算是人工智能三教父之一,这样的一个人你把他招来,这个决策没毛病。但是你招来让他干嘛?这个事就错了。你真的让他整了一个研究所,叫FAIR (Facebook AI Research),这样的一个机构,说:“你们自己研究去吧,研究完了这些东西,你们去发论文吧,你们去开源吧,我们在后边支持你。”他去干这件事情,其实是有问题的。

如果你说你前面就下了这么一个决心,说:“你就干吧,我就不管你了,你们给我赚名声就完了。”也行。那你后边自己该去产品化的地方,该去做工程实施的时候,你要组建另外一套班组去干活去。结果呢,扎克伯格后边那一半事没办,他把前面那半截干了。最后导致什么?杨立昆他们研究出来的很多东西,在Meta里头没有办法落地,还没有办法给Meta带来实际的利益。而且呢,在各种的竞争里,他还落后了。

如何正确“使用”顶尖科学家?

这是扎克伯格犯的错误。就这种大佬请回来干嘛使?

  1. 招牌效应:人工智能三巨头我请回来一个,那三个人里头,有一个是被谷歌直接把公司收购了,收谷歌去了;另外一个呢,每天在外边吵吵,说要去做人工智能监管;杨立昆呢,被Meta收下来。首先你这个招牌是有了。
  2. 人才磁场:作为一个大学教授,你就应该是把他的学生都拎回来。谷歌也是这么干的,把一个哥们拎回来以后,就天天的拉着他的各种学生,拉着他的师兄师弟,上谷歌干活来。这个应该也是杨立昆真正能够给Meta带来的东西。

至于杨立昆真正研究的东西,其实这种大学教授真正研究的东西,对于公司来说通常是没用的。为什么?就是离变现太远了,离具体的实际使用太远了。

结果呢,Meta是前面不够果断,把杨立昆找回来了,但是你该继续投入的时候,就不够果断了。因为FAIR这个团队这么多年,这十几年可能总共花了十几亿、二十亿美金的样子。那你说这也不少钱了,老范你又这个拿钱不当钱了是吧?十几亿、二十亿你就一张嘴就来了。你看看微软花了多少钱,你看看谷歌花花了多少钱。想去跟大家竞争的、平起平坐的扎克伯格,他花的钱真的算少的。而且在这个过程中,主要还是去发论文、发开源,并没有真正的去工程落地这件事。因为工程落地,你还要花更多的钱。

所以呢,杨立昆到了Meta,让不合适的人去承担了错误的预期。你找了一个大学教授回来,你希望他把整个这一套事都干完:竖招牌、再招人、再到科学研究、工程实施和产品化。你希望他一个人把这事都干掉,这是不可能的。

正常的应该是什么?你把这位大神请回来养着他,他想干什么你让他干,他花不了太多钱。剩下的呢,你再让他的学生挑一摊,把后边真正的跟公司有关的研发做掉,把跟公司有关的工程化、产品化的事情做掉。这才是应该干的活。什么时候缺人,你就让徒子徒孙们继续上,继续进来填坑。这才是这种大神正确的用法。

新旧团队的冲突与杨乐坤的出局

所以这一次杨立昆的出走,就是扎克伯格前面在用人方面用错了。等到最后呢,扎克伯格发现我们落后了,没有达到他一开始的预期。他没有去检查自己犯了什么错误,而是大刀阔斧地开始是1亿美金、10亿美金去招人去了。他有这钱,你多给杨立昆点,没准还能做出点东西来。到后边“七嚓咔嚓”整了一大堆人进来,找了一个叫亚历山大·汪的人。

亚历山大·汪最后能干成什么样,现在去猜测还为时过早。但是呢,杨立昆这一摊,他就实在维持不住了。亚历山大·汪这帮人进来了以后呢,跟杨立昆他们之间的分工还有很多是重合的。那就怎么办?内部关系一定摆不平,就要开始抢夺资源。那一定还是要立起一个“正宫娘娘”来,其他的小三什么的,你们就先朝后站一站就完事了。那么杨立昆呢,就这样出局了。

所以这里头谁对谁错?杨立昆没错,亚历山大·汪也没错,这里头唯一犯错的就是扎克伯格。他犯错误了。

FAIR的遗产:对中国AI产业的巨大贡献

杨立昆在Meta期间做的这个FAIR,到底给世界,特别是给中国的AI产业,做出了什么样的贡献呢?巨大的贡献。没有杨立昆,就没有今天中国的AI产业,完完全全可以这么讲。

他们做了两个非常、非常重要的产品出来。

  • 第一个叫PyTorch,现在绝大部分的AI平台都在这上面跑,这是一个开源的系统。当然了,PyTorch的负责人现在也离开了Meta,他要比杨立昆走的稍微早几天。这哥们呢,现在加入了Thinking Machine Lab,叫TML。这个公司是谁创建的呢?大家还记得OpenAI有一年闹宫变,当时有一个美女CTO,他后来离开OpenAI以后,创建的这个公司叫Thinking Machine Lab,就是这个公司。当时扎克伯格想去找人顶杨立昆的时候,在找亚历山大·汪的同时呢,也在找这个TML,说我把你收购下来吧。当时人家不同意,说我们要自己发展,不愿意被你收购。所以呢,他就把亚历山大·汪找回来填坑来了。
  • 另外一个巨大的贡献就是Llama大模型,开源的Llama大模型。Llama1、Llama2,绝对是给中国早期的开源模型奠定了基础。没有Llama1、Llama2,甚至是Llama3的这些开源,就不会有中国今天百花齐放的大模型。所以这个FAIR对于整个世界,特别是对于中国的AI产业,是做出了巨大贡献的。

杨乐坤为何在Meta混不下去?

杨立昆为什么在Meta混不下去了呢?亚历山大·汪来的时候,他还说我们好好合作一下吧,当时还是很有求生欲的,但是现在还是混不下去了。

原因一:科学家与CTO的角色冲突

第一个原因很简单,他呢是要去做长期研究的。通常大学教授都是做长期研究的,他是没有明确的工程化和产品化压力的。我今天做了一研究,这东西到底最后怎么工程化,或者在我的整个内部怎么去改进,他从来没想过这事,科学家也不想这事。或者说我把这东西做成一个什么产品给大家提供出来,他们也不会思考这个问题。他们真正追求的是什么?更多的经费,研究更遥远的未来的事情,以及呢,发表更多的论文。而且科学家的本质呢,从来就没有改变过。

那你说CTO跟科学家之间到底有什么区别呢?CTO,你是为股东负责的,你是要为董事会负责,什么该说什么不该说,你心里应该有数,你每说一句话都会影响股价的。而科学家就是只为自己心中的梦想去负责:“你们那些乱七八糟东西,不要来给我捣乱。”

那你说杨立昆跟作为Meta AI里头的领衔科学家,到底说了什么不该说的话呢?作为一个CTO他肯定不合格。总喊着“大语言模型是死路一条”,这玩意咋搞?我们现在招人做产品、做工程化,老大在这天天喊:“这个这是死路一条,你们再往前走就死了。”而且他还喊:“现在的所有大模型,跟一只猫比起来都不行。”OpenAI也好,谷歌也好,都说我们的模型可以顶博士了。说:“你把它装机器人里,你看看它有猫灵活吗?”肯定没有。这就是他的一个论断。你作为科学家你可以这么喊,而且你越这么喊,越容易搞到经费。但是你作为一个企业里面的领军人物,也是Meta的AI领军的科学家,但你天天喊“大语言模型是死路一条”,这事肯定是不行的。

原因二:商业压力与战略落后

他呢,一直准备去做世界模型。世界模型这个事呢,肯定是巨大的天坑。因为大语言模型这件事,大家已经走通了,知道怎么往前走……虽然挣钱还难一点,但是怎么去骗股民,怎么去骗基金,怎么去骗华尔街,这条路其实已经通了。那对于Meta来说,人家已经验证成功的路,我们得走下去,该捡的果子我们得捡起来。你不能在这个时候再喊说,我要去做世界模型。世界模型这个东西到底怎么做,做完了以后会达到什么效果,谁也不知道。我要靠这个东西去忽悠别人给钱,是非常非常难的。

这里呢,也会体现出Meta跟谷歌他们的差异。谷歌就是我这头挣着钱呢,那头呢,我还投入了很多的钱,去研究各种各样现在大家看不出结果的东西出来。而Meta现在不行了,我必须要马上见着钱,我没有那么多钱让你们去放飞自我了。

Meta现在呢,明显在AI领域里头落后了。Meta自己的商业化模式其实是有问题的。为什么呢?大家看看现在所有做大模型的公司,或者AI这类的公司,英伟达那是做芯片卖铲子,其他几家其实现在也都是卖铲子的。微软、谷歌他们虽然也做芯片,但是他们芯片卖的量并不大,就是只是自己用而已。他们卖什么?他们卖云计算呢。谷歌云上提供了这些大模型的东西,“你来买买我谷歌云吧”。微软也是这样,“我微软云上提供了OpenAI的全套东西,你来买我微软云吧”。大家每次去看财报的时候,只管看谷歌云的收入涨了,虽然可能其他的收入有些波动,但是你只要谷歌云的收入是呈两位数上涨的,我们就认你的市值了。他是这样的一个逻辑。微软也是如此,亚马逊和Oracle走的都是这条路,他们是卖云服务的。

那你说Meta呢?Meta缺云,他自己是不卖云服务的。Meta 97%的收入全是广告收入,他就讲不了那故事了。那他怎么办呢?他只能是实打实地做出产品来,大家很喜欢这个产品,用户量很高,只能干这条路。另外一条路是什么?就是我通过AI的改造,我的广告收入上升了。广告收入这种事情呢,它是跟用户数和用户时长相关的,你最后的转换率会有优化,但是优化起来是非常难,即使加上AI以后,也很难说我就一下有这种质的飞跃。所以Meta很难证明自己真的做的这些东西是有用的。

而另外一方面呢,他做的Llama4也翻车了。Llama4全面被千问赶超。原来Llama1、Llama2、Llama3还是遥遥领先的一个位置,但是等到Llama4的时候,第一个是做各种评分的时候呢刷题,就是他做了一些学术不端的行为,想把自己想做成那种“小镇做题家”似的,我把题刷完了以后去刷成绩,这个事是不行的。在他们这个领域里头,这是非常非常丢人的,虽然中国模型都这么干,但是呢对于美国大公司来说,这个是不可接受的。另外一个是什么?就是他的Llama4只出了几个特别大的模型,底下这些小模型都没做。Llama3还是从小到大做了一遍,大家还可以在Llama3的各种层级的模型上,去做自己的微调,做自己的行业应用。而Llama4只做了个最大的。那在这块填补空白的呢,就是千问。千问是从0.6b开始做到200多b,中间所有的层级全都做了。这个就是绝对是超越Llama4的一个状态。

原因三:扎克伯格的“亲自部署”

扎克伯格呢,觉得我必须要生死一搏了,原来这种慢慢悠悠的玩法不成了。为什么扎克伯格这么聪明的人,会让AI这么重要的事情慢慢悠悠往前晃荡呢?原因很简单,他的注意力还在元宇宙上呢,注意力没在这上头。我觉得我这才是正经事,我这个一定是最终出结果的,大语言模型只是中间的小波浪而已。

跟大家讲一个当时猎豹的故事。傅盛这帮人原来在360是怎么做出来的?周鸿祎当时是跑去做搜索去了,他认为只有搜索才是对的,这是互联网里唯一的出路。所以他带着大量的人去做搜索,傅盛、徐明这帮人呢,说这留着一摊子咱看着,那算了,咱们做一个360吧,做个安全助手吧,安全管家吧。等做着做着做起来了,周鸿祎在外边做搜索碰了个一鼻子灰,说玩不下去了。那一回头一看,这块你们做起来了,那我亲自指挥、亲自部署一下吧,就把傅盛他们直接从公司里扔出来了。

所以现在就遇到了这样的一个情况,扎克伯格决定回来说,元宇宙一时半会搞不定,咱们还是要在大语言模型上见真章。那么他的处理方式是什么呢?就是招募了亚历山大·汪,组建新团队。而这个新团队马上开始跟FAIR争夺资源,这个事情是由汪涛说了算的。所以在这件事情上,汪涛要去替扎克伯格背锅,要去挡雷。比如禁止随便去开放源代码了,禁止随便去发表论文了。你现在想去发表论文,必须要在内部走一个审核流程,走完了以后你才可以去发表。如果审核的过程中,发现这个东西我们可以变现,马上就能用得上的东西,你这发表了别人就用了,我们先不发表。他现在有这样的一个审核机制。再加上呢,裁了600多人,基本上把FAIR的下面的很多直接干活的人给裁了。杨乐坤就没办法了,实在混不下去,只能离开了。

世界模型之争:杨乐坤 vs. 李飞飞

最后呢,咱们聊一下世界模型吧。杨立昆出去要去做世界模型,还有谁在做世界模型?李飞飞也在做世界模型。那杨立昆跟李飞飞的世界模型,到底有什么一样的地方,有什么不一样的地方?

杨乐坤的JEPA架构

杨立昆要做这个东西呢,叫JEPA,联合嵌入预测架构。它呢,是非生成式的。大家注意,这个非常非常重要。什么是非生成式的?咱们的大语言模型也好,李飞飞做的东西都是生成式的。生成式的就是,我要生成下边最有可能的这个词,或者下边最有可能的这个场景,这个东西叫生成式。而非生成式呢,不注重生成未来的预测,不关心未来会变成什么样,它要生成的是什么?是未来的一个动作。我们要在这个世界里做什么?他要去找到现在这个状态跟未来这个状态之间的一些规则,我们应该如何来做这个决策。

这呢,稍微有一些抽象,后边我们再去讲他到底跟李飞飞这个差在哪。杨立昆这个世界模型呢,分为感知模块、世界模型模块、成本模块、记忆模块,以及行动模块和一些配置器。它要把整个这东西配在一起,基本上像一个机器人似的东西凑在一块,才是它这个JEPA。它是一个可学习的、端到端的可微调的一个主动智能体架构,在抽象状态空间里边,预测未来可能的世界状态,而不是直接生成图片和视频。

李飞飞的空间智能

而李飞飞的呢,它不叫世界模型,它这个东西叫“空间智能”,让AI真正理解和操作物理世界,就必须要能够在3D空间中感知、想象和交互。世界模型是一个生成式的、多模态的、交互式的。

相同点与差异点

它们的相同点呢:

  • 都认为光靠大语言模型这事走不通,这是死路一条。
  • 而且呢,面向未来的预测器和推理引擎,不应该是单纯的生成器。
  • 他们都认为呢,需要做自监督的学习,需要大规模的观测数据。
  • 都相信他们现在所做的事情,是通向未来具身智能和机器人的一个正确路径。

那他们的差异点在哪呢?

  1. 研究空间不同:杨立昆研究的叫“抽象表征空间”,它这个东西是抽象成一大堆的数值的,而不是一个多模态空间。李飞飞那个是一个具象化的多模态空间,他最后出来的是视频,是3D模型,而杨立昆研究的是一大堆的数字。
  2. 生成方式不同:刚才咱们讲了,李飞飞玩的是生成式的,杨立昆玩的是非生成式的。
  3. 核心目标不同:杨立昆研究的是通用的自主智能,而李飞飞研究的是空间智能。那你说这两个词我都听懂了,到底差异在哪儿没想明白。说白了,杨立昆研究的是怎么做“人”,而李飞飞研究的是怎么做“世界”,这就是他们两个最主要的差别。所以你看杨立昆的这个大模型里头,它是有感知模块的,有世界模型、有运动模块、有记忆模块,这个东西基本上是个人。而李飞飞那个模型,就是在一个3D空间里头,来预测下一帧的画面是什么,他最后出来的东西是世界。所以这是对于世界模型的两个不同的前进方向。杨立昆搞的是抽象的表征世界,人看到当前的世界以后怎么去做决策,这个过程不是靠看图说话来的,你是要在这个人的内部形成一大堆的这种抽象指令,然后在这个过程中去往前走的。这就是他们之间的差异。

未来展望

最后呢,让我们来展望一下Meta跟杨乐坤的未来吧。Meta呢,现在必须要完成AI的应用和商业化,如果这个故事讲不通的话,他可能在七姐妹里边掉队。投资并且继续控制杨乐坤,对于Meta来说呢,也算是名声没有塌房。而杨乐昆的话,我们还要继续等待其后续的成果,看看后续是不是有其他的投资人参与。对于大学教授创业,我一直观点是一致的,就是他们会指明方向,会带领很多人去做研究,但是最后成为CEO的那个人,通常不是他们。但是杨立昆现在想做的事情还是比较有趣的。


好,这个故事就跟大家讲到这里,感谢大家收听。请帮忙点赞、点小铃铛,参加Discord讨论群。也欢迎有兴趣、有能力的朋友加入我们的付费频道。再见。

Comments are closed.

退出移动版