杨乐坤出走创业,Meta反成股东,这场“和平分手”背后是路线的彻底决裂:世界模型vs大语言模型,谁在赌对未来?Yann LeCun、Meta、AI、launch startup、world model
11 月 21
AIGC, Meta的故事 Advanced Machine Intelligence, AI pioneer, AI research, AI Startup, AI strategy, AI商业化, AI教父, AI科学家, Alexander Wang, chief AI scientist, Facebook AI, FAIR, godfather of AI, JEPA, launch startup, Llama大模型, machine intelligence, Meta, Meta AI, Meta AI战略, PyTorch, world model, Yann LeCun, Yann LeCun leaves Meta, 世界模型, 人工智能, 具身智能, 图灵奖得主, 大语言模型, 扎克伯格, 李飞飞, 杨乐坤, 杨乐坤离职, 非生成式AI 杨乐坤出走创业,Meta反成股东,这场“和平分手”背后是路线的彻底决裂:世界模型vs大语言模型,谁在赌对未来?Yann LeCun、Meta、AI、launch startup、world model已关闭评论
杨乐坤出走Meta:一场关于战略、用人和未来的博弈
大家好,欢迎收听老范讲故事的YouTube频道。
这一天还是来了。前面我们已经猜测了很久,说杨立昆到底什么时候会离开,因为所有人都眼睁睁地看着Meta的AI战略转换方向。亚历山大·汪进入Meta,一个28岁的辍学生,在管理65岁的大学教授和图灵奖得主,这个事一定不能长久。而且前面还对杨立昆手下的FAIR部门进行了600人的裁员。
靴子落地:杨乐坤宣布离职
现在靴子终于落地了。2025年11月19日,当地时间13:20,杨立昆发了一个长文宣布离职了。在这个文章里边,他回顾了一下在Meta待了12年,感谢了小扎和一堆高管,然后准备要去做他的AMI。他这个AMI呢,叫做“高级机器智能”,说:“我在Meta期间就一直在干这件事,现在呢我准备出去了以后接着干。”而且新公司呢,Meta依然还有参与,具体的情况后续再公布。他呢,也终于可以不受Meta的限制,去研究自己的世界模型了。
杨立昆也要去做世界模型,跟李飞飞有些相近。最后咱们再说一下,他的世界模型跟李飞飞的世界模型到底有什么差别。
Meta呢,应该在这个里边还是给了钱的。你请这样的一位大神出去,而且大神在发文的时候还感谢了扎克伯格,那一定还是要给钱的。所以杨立昆未来的公司里头,Meta应该还是一位重要的股东。但是到底给了多少钱,占了多少股份,可能还要等未来Meta的官宣,现在应该公司还在注册过程中吧。
谁对谁错?一场责任的追问
我们普通人呢,真正关心的不是这些事。我们关心的是,这些大神们斗来斗去了以后,到底谁对谁错呢?
- 有些人讲了,扎克伯格短视了,不听老人言,找了一个年轻小伙子过来,你把这个图灵奖大学教授给放走了,这一定是要吃亏的。
- 还有人呢说,Alexander Wang抢班夺权,给扎克伯格进了谗言了。这是中国人比较喜闻乐见的一种论调,为什么呢?总是“清君侧,不能斩昏君”,皇上做出什么错误的决定,一定是下边人进谗言了。这个28岁学生整了这么一公司,进来以后就把老教授给挤跑了,一定是他的错误,扎克伯格只是被他一时蒙蔽了。
- 当然呢,也有一些人,特别是像傅盛这样的人呢,就出来说杨立昆耽误了Meta,如果没有他的话,Meta早就行了。这种呢就属于站在CEO的角度上,CEO的角度呢,通常都是不会承认自己有错的,都是下边人是坏蛋。而杨立昆呢,站在这样的一个位置上,把持了这么多的资源,又没有把这些资源真正的变成Meta能够挣钱的商业利益,那么一定是他错了。
扎克伯格的决策失误
从我个人的角度来分析,当一定要有一个人来承担责任的时候,这个人一定得是老大,也就是扎克伯格自己。扎克伯格在这件事情上到底做错了什么呢?是不是听信谗言了?是不是不听老人言了?是不是选错方向呢?还不是。扎克伯格真正做错的是决策错误。
哪样的一个决策错误?就是你去找杨立昆这样的一个人来,纽约大学的教授,图灵奖得主,算是人工智能三教父之一,这样的一个人你把他招来,这个决策没毛病。但是你招来让他干嘛?这个事就错了。你真的让他整了一个研究所,叫FAIR (Facebook AI Research),这样的一个机构,说:“你们自己研究去吧,研究完了这些东西,你们去发论文吧,你们去开源吧,我们在后边支持你。”他去干这件事情,其实是有问题的。
如果你说你前面就下了这么一个决心,说:“你就干吧,我就不管你了,你们给我赚名声就完了。”也行。那你后边自己该去产品化的地方,该去做工程实施的时候,你要组建另外一套班组去干活去。结果呢,扎克伯格后边那一半事没办,他把前面那半截干了。最后导致什么?杨立昆他们研究出来的很多东西,在Meta里头没有办法落地,还没有办法给Meta带来实际的利益。而且呢,在各种的竞争里,他还落后了。
如何正确“使用”顶尖科学家?
这是扎克伯格犯的错误。就这种大佬请回来干嘛使?
- 招牌效应:人工智能三巨头我请回来一个,那三个人里头,有一个是被谷歌直接把公司收购了,收谷歌去了;另外一个呢,每天在外边吵吵,说要去做人工智能监管;杨立昆呢,被Meta收下来。首先你这个招牌是有了。
- 人才磁场:作为一个大学教授,你就应该是把他的学生都拎回来。谷歌也是这么干的,把一个哥们拎回来以后,就天天的拉着他的各种学生,拉着他的师兄师弟,上谷歌干活来。这个应该也是杨立昆真正能够给Meta带来的东西。
至于杨立昆真正研究的东西,其实这种大学教授真正研究的东西,对于公司来说通常是没用的。为什么?就是离变现太远了,离具体的实际使用太远了。
结果呢,Meta是前面不够果断,把杨立昆找回来了,但是你该继续投入的时候,就不够果断了。因为FAIR这个团队这么多年,这十几年可能总共花了十几亿、二十亿美金的样子。那你说这也不少钱了,老范你又这个拿钱不当钱了是吧?十几亿、二十亿你就一张嘴就来了。你看看微软花了多少钱,你看看谷歌花花了多少钱。想去跟大家竞争的、平起平坐的扎克伯格,他花的钱真的算少的。而且在这个过程中,主要还是去发论文、发开源,并没有真正的去工程落地这件事。因为工程落地,你还要花更多的钱。
所以呢,杨立昆到了Meta,让不合适的人去承担了错误的预期。你找了一个大学教授回来,你希望他把整个这一套事都干完:竖招牌、再招人、再到科学研究、工程实施和产品化。你希望他一个人把这事都干掉,这是不可能的。
正常的应该是什么?你把这位大神请回来养着他,他想干什么你让他干,他花不了太多钱。剩下的呢,你再让他的学生挑一摊,把后边真正的跟公司有关的研发做掉,把跟公司有关的工程化、产品化的事情做掉。这才是应该干的活。什么时候缺人,你就让徒子徒孙们继续上,继续进来填坑。这才是这种大神正确的用法。
新旧团队的冲突与杨乐坤的出局
所以这一次杨立昆的出走,就是扎克伯格前面在用人方面用错了。等到最后呢,扎克伯格发现我们落后了,没有达到他一开始的预期。他没有去检查自己犯了什么错误,而是大刀阔斧地开始是1亿美金、10亿美金去招人去了。他有这钱,你多给杨立昆点,没准还能做出点东西来。到后边“七嚓咔嚓”整了一大堆人进来,找了一个叫亚历山大·汪的人。
亚历山大·汪最后能干成什么样,现在去猜测还为时过早。但是呢,杨立昆这一摊,他就实在维持不住了。亚历山大·汪这帮人进来了以后呢,跟杨立昆他们之间的分工还有很多是重合的。那就怎么办?内部关系一定摆不平,就要开始抢夺资源。那一定还是要立起一个“正宫娘娘”来,其他的小三什么的,你们就先朝后站一站就完事了。那么杨立昆呢,就这样出局了。
所以这里头谁对谁错?杨立昆没错,亚历山大·汪也没错,这里头唯一犯错的就是扎克伯格。他犯错误了。
FAIR的遗产:对中国AI产业的巨大贡献
杨立昆在Meta期间做的这个FAIR,到底给世界,特别是给中国的AI产业,做出了什么样的贡献呢?巨大的贡献。没有杨立昆,就没有今天中国的AI产业,完完全全可以这么讲。
他们做了两个非常、非常重要的产品出来。
- 第一个叫PyTorch,现在绝大部分的AI平台都在这上面跑,这是一个开源的系统。当然了,PyTorch的负责人现在也离开了Meta,他要比杨立昆走的稍微早几天。这哥们呢,现在加入了Thinking Machine Lab,叫TML。这个公司是谁创建的呢?大家还记得OpenAI有一年闹宫变,当时有一个美女CTO,他后来离开OpenAI以后,创建的这个公司叫Thinking Machine Lab,就是这个公司。当时扎克伯格想去找人顶杨立昆的时候,在找亚历山大·汪的同时呢,也在找这个TML,说我把你收购下来吧。当时人家不同意,说我们要自己发展,不愿意被你收购。所以呢,他就把亚历山大·汪找回来填坑来了。
- 另外一个巨大的贡献就是Llama大模型,开源的Llama大模型。Llama1、Llama2,绝对是给中国早期的开源模型奠定了基础。没有Llama1、Llama2,甚至是Llama3的这些开源,就不会有中国今天百花齐放的大模型。所以这个FAIR对于整个世界,特别是对于中国的AI产业,是做出了巨大贡献的。
杨乐坤为何在Meta混不下去?
杨立昆为什么在Meta混不下去了呢?亚历山大·汪来的时候,他还说我们好好合作一下吧,当时还是很有求生欲的,但是现在还是混不下去了。
原因一:科学家与CTO的角色冲突
第一个原因很简单,他呢是要去做长期研究的。通常大学教授都是做长期研究的,他是没有明确的工程化和产品化压力的。我今天做了一研究,这东西到底最后怎么工程化,或者在我的整个内部怎么去改进,他从来没想过这事,科学家也不想这事。或者说我把这东西做成一个什么产品给大家提供出来,他们也不会思考这个问题。他们真正追求的是什么?更多的经费,研究更遥远的未来的事情,以及呢,发表更多的论文。而且科学家的本质呢,从来就没有改变过。
那你说CTO跟科学家之间到底有什么区别呢?CTO,你是为股东负责的,你是要为董事会负责,什么该说什么不该说,你心里应该有数,你每说一句话都会影响股价的。而科学家就是只为自己心中的梦想去负责:“你们那些乱七八糟东西,不要来给我捣乱。”
那你说杨立昆跟作为Meta AI里头的领衔科学家,到底说了什么不该说的话呢?作为一个CTO他肯定不合格。总喊着“大语言模型是死路一条”,这玩意咋搞?我们现在招人做产品、做工程化,老大在这天天喊:“这个这是死路一条,你们再往前走就死了。”而且他还喊:“现在的所有大模型,跟一只猫比起来都不行。”OpenAI也好,谷歌也好,都说我们的模型可以顶博士了。说:“你把它装机器人里,你看看它有猫灵活吗?”肯定没有。这就是他的一个论断。你作为科学家你可以这么喊,而且你越这么喊,越容易搞到经费。但是你作为一个企业里面的领军人物,也是Meta的AI领军的科学家,但你天天喊“大语言模型是死路一条”,这事肯定是不行的。
原因二:商业压力与战略落后
他呢,一直准备去做世界模型。世界模型这个事呢,肯定是巨大的天坑。因为大语言模型这件事,大家已经走通了,知道怎么往前走……虽然挣钱还难一点,但是怎么去骗股民,怎么去骗基金,怎么去骗华尔街,这条路其实已经通了。那对于Meta来说,人家已经验证成功的路,我们得走下去,该捡的果子我们得捡起来。你不能在这个时候再喊说,我要去做世界模型。世界模型这个东西到底怎么做,做完了以后会达到什么效果,谁也不知道。我要靠这个东西去忽悠别人给钱,是非常非常难的。
这里呢,也会体现出Meta跟谷歌他们的差异。谷歌就是我这头挣着钱呢,那头呢,我还投入了很多的钱,去研究各种各样现在大家看不出结果的东西出来。而Meta现在不行了,我必须要马上见着钱,我没有那么多钱让你们去放飞自我了。
Meta现在呢,明显在AI领域里头落后了。Meta自己的商业化模式其实是有问题的。为什么呢?大家看看现在所有做大模型的公司,或者AI这类的公司,英伟达那是做芯片卖铲子,其他几家其实现在也都是卖铲子的。微软、谷歌他们虽然也做芯片,但是他们芯片卖的量并不大,就是只是自己用而已。他们卖什么?他们卖云计算呢。谷歌云上提供了这些大模型的东西,“你来买买我谷歌云吧”。微软也是这样,“我微软云上提供了OpenAI的全套东西,你来买我微软云吧”。大家每次去看财报的时候,只管看谷歌云的收入涨了,虽然可能其他的收入有些波动,但是你只要谷歌云的收入是呈两位数上涨的,我们就认你的市值了。他是这样的一个逻辑。微软也是如此,亚马逊和Oracle走的都是这条路,他们是卖云服务的。
那你说Meta呢?Meta缺云,他自己是不卖云服务的。Meta 97%的收入全是广告收入,他就讲不了那故事了。那他怎么办呢?他只能是实打实地做出产品来,大家很喜欢这个产品,用户量很高,只能干这条路。另外一条路是什么?就是我通过AI的改造,我的广告收入上升了。广告收入这种事情呢,它是跟用户数和用户时长相关的,你最后的转换率会有优化,但是优化起来是非常难,即使加上AI以后,也很难说我就一下有这种质的飞跃。所以Meta很难证明自己真的做的这些东西是有用的。
而另外一方面呢,他做的Llama4也翻车了。Llama4全面被千问赶超。原来Llama1、Llama2、Llama3还是遥遥领先的一个位置,但是等到Llama4的时候,第一个是做各种评分的时候呢刷题,就是他做了一些学术不端的行为,想把自己想做成那种“小镇做题家”似的,我把题刷完了以后去刷成绩,这个事是不行的。在他们这个领域里头,这是非常非常丢人的,虽然中国模型都这么干,但是呢对于美国大公司来说,这个是不可接受的。另外一个是什么?就是他的Llama4只出了几个特别大的模型,底下这些小模型都没做。Llama3还是从小到大做了一遍,大家还可以在Llama3的各种层级的模型上,去做自己的微调,做自己的行业应用。而Llama4只做了个最大的。那在这块填补空白的呢,就是千问。千问是从0.6b开始做到200多b,中间所有的层级全都做了。这个就是绝对是超越Llama4的一个状态。
原因三:扎克伯格的“亲自部署”
扎克伯格呢,觉得我必须要生死一搏了,原来这种慢慢悠悠的玩法不成了。为什么扎克伯格这么聪明的人,会让AI这么重要的事情慢慢悠悠往前晃荡呢?原因很简单,他的注意力还在元宇宙上呢,注意力没在这上头。我觉得我这才是正经事,我这个一定是最终出结果的,大语言模型只是中间的小波浪而已。
跟大家讲一个当时猎豹的故事。傅盛这帮人原来在360是怎么做出来的?周鸿祎当时是跑去做搜索去了,他认为只有搜索才是对的,这是互联网里唯一的出路。所以他带着大量的人去做搜索,傅盛、徐明这帮人呢,说这留着一摊子咱看着,那算了,咱们做一个360吧,做个安全助手吧,安全管家吧。等做着做着做起来了,周鸿祎在外边做搜索碰了个一鼻子灰,说玩不下去了。那一回头一看,这块你们做起来了,那我亲自指挥、亲自部署一下吧,就把傅盛他们直接从公司里扔出来了。
所以现在就遇到了这样的一个情况,扎克伯格决定回来说,元宇宙一时半会搞不定,咱们还是要在大语言模型上见真章。那么他的处理方式是什么呢?就是招募了亚历山大·汪,组建新团队。而这个新团队马上开始跟FAIR争夺资源,这个事情是由汪涛说了算的。所以在这件事情上,汪涛要去替扎克伯格背锅,要去挡雷。比如禁止随便去开放源代码了,禁止随便去发表论文了。你现在想去发表论文,必须要在内部走一个审核流程,走完了以后你才可以去发表。如果审核的过程中,发现这个东西我们可以变现,马上就能用得上的东西,你这发表了别人就用了,我们先不发表。他现在有这样的一个审核机制。再加上呢,裁了600多人,基本上把FAIR的下面的很多直接干活的人给裁了。杨乐坤就没办法了,实在混不下去,只能离开了。
世界模型之争:杨乐坤 vs. 李飞飞
最后呢,咱们聊一下世界模型吧。杨立昆出去要去做世界模型,还有谁在做世界模型?李飞飞也在做世界模型。那杨立昆跟李飞飞的世界模型,到底有什么一样的地方,有什么不一样的地方?
杨乐坤的JEPA架构
杨立昆要做这个东西呢,叫JEPA,联合嵌入预测架构。它呢,是非生成式的。大家注意,这个非常非常重要。什么是非生成式的?咱们的大语言模型也好,李飞飞做的东西都是生成式的。生成式的就是,我要生成下边最有可能的这个词,或者下边最有可能的这个场景,这个东西叫生成式。而非生成式呢,不注重生成未来的预测,不关心未来会变成什么样,它要生成的是什么?是未来的一个动作。我们要在这个世界里做什么?他要去找到现在这个状态跟未来这个状态之间的一些规则,我们应该如何来做这个决策。
这呢,稍微有一些抽象,后边我们再去讲他到底跟李飞飞这个差在哪。杨立昆这个世界模型呢,分为感知模块、世界模型模块、成本模块、记忆模块,以及行动模块和一些配置器。它要把整个这东西配在一起,基本上像一个机器人似的东西凑在一块,才是它这个JEPA。它是一个可学习的、端到端的可微调的一个主动智能体架构,在抽象状态空间里边,预测未来可能的世界状态,而不是直接生成图片和视频。
李飞飞的空间智能
而李飞飞的呢,它不叫世界模型,它这个东西叫“空间智能”,让AI真正理解和操作物理世界,就必须要能够在3D空间中感知、想象和交互。世界模型是一个生成式的、多模态的、交互式的。
相同点与差异点
它们的相同点呢:
- 都认为光靠大语言模型这事走不通,这是死路一条。
- 而且呢,面向未来的预测器和推理引擎,不应该是单纯的生成器。
- 他们都认为呢,需要做自监督的学习,需要大规模的观测数据。
- 都相信他们现在所做的事情,是通向未来具身智能和机器人的一个正确路径。
那他们的差异点在哪呢?
- 研究空间不同:杨立昆研究的叫“抽象表征空间”,它这个东西是抽象成一大堆的数值的,而不是一个多模态空间。李飞飞那个是一个具象化的多模态空间,他最后出来的是视频,是3D模型,而杨立昆研究的是一大堆的数字。
- 生成方式不同:刚才咱们讲了,李飞飞玩的是生成式的,杨立昆玩的是非生成式的。
- 核心目标不同:杨立昆研究的是通用的自主智能,而李飞飞研究的是空间智能。那你说这两个词我都听懂了,到底差异在哪儿没想明白。说白了,杨立昆研究的是怎么做“人”,而李飞飞研究的是怎么做“世界”,这就是他们两个最主要的差别。所以你看杨立昆的这个大模型里头,它是有感知模块的,有世界模型、有运动模块、有记忆模块,这个东西基本上是个人。而李飞飞那个模型,就是在一个3D空间里头,来预测下一帧的画面是什么,他最后出来的东西是世界。所以这是对于世界模型的两个不同的前进方向。杨立昆搞的是抽象的表征世界,人看到当前的世界以后怎么去做决策,这个过程不是靠看图说话来的,你是要在这个人的内部形成一大堆的这种抽象指令,然后在这个过程中去往前走的。这就是他们之间的差异。
未来展望
最后呢,让我们来展望一下Meta跟杨乐坤的未来吧。Meta呢,现在必须要完成AI的应用和商业化,如果这个故事讲不通的话,他可能在七姐妹里边掉队。投资并且继续控制杨乐坤,对于Meta来说呢,也算是名声没有塌房。而杨乐昆的话,我们还要继续等待其后续的成果,看看后续是不是有其他的投资人参与。对于大学教授创业,我一直观点是一致的,就是他们会指明方向,会带领很多人去做研究,但是最后成为CEO的那个人,通常不是他们。但是杨立昆现在想做的事情还是比较有趣的。
好,这个故事就跟大家讲到这里,感谢大家收听。请帮忙点赞、点小铃铛,参加Discord讨论群。也欢迎有兴趣、有能力的朋友加入我们的付费频道。再见。