怒喷大模型连狗都不如?揭秘硅谷集体幻觉与物理常识缺失,为何只有新架构才能通往通用人工智能|Yann LeCun World Models AMI LLMs AI Startup

杨乐坤“暴论”:大语言模型是扯淡,连狗都不如?解读他的世界模型与新创业项目AMI

“我认为这完全是扯淡,这条路根本就不可能成功。”这是杨乐坤在最新的访谈中对大语言模型路线的评价。这是语不惊人死不休的这种暴论吗?还是说他真的有一些什么事情想做?

大家好,欢迎收听老范讲故事的YouTube频道

12月15日,杨乐坤发布了他最新的访谈。访谈是在一个叫做“信息瓶颈”的播客中进行的,位置应该是在纽约大学。杨乐坤当时还在Meta站好最后一班岗,三周以后会正式离职。访谈接近两个小时,我尽量讲一些里边有意思的部分。

现在的大语言模型还无法跟狗的智能相比,这个也是其中比较有趣的一点。到底杨乐坤想做的世界模型,以及他的JEPA是如何工作的?对于我这个讲述者和各位听众来说,都是一个挑战。请耐心听到最后,然后告诉我,我到底讲明白了没有?你们到底听懂了没有?杨乐坤要去做的AMI,也就是创业要做的这个新公司,到底是干什么的?怎么挣钱?咱们今天就讲这几块。


第一块:杨乐坤为什么觉得大语言模型完全是扯淡?

这里头要讲到的最核心的观点叫“序列化”。大语言模型工作的方式,是把整个世界的这些语言进行序列化。所谓序列化是什么?就是把所有的语言变成TOKEN,然后把这些TOKEN离散掉,谁跟谁之间都没有关系,再通过把全世界的语言搁在一起进行统计、进行训练,重新建立起这些TOKEN与TOKEN之间的关系。它是这样来工作的。

而且要注意一点,语言这个东西本身就是一个世界映射,语言只能表达世界中的很少一部分。哪怕是同样的语言,你用不同的语气语调来说,都会表达不同的意思。而不同的语气语调,你在语言中是完全无法看到的。所以语言只是真实世界的一个稀疏映射,大量的信息被错漏了。所以在TOKEN化的这个过程中,大语言模型其实把大量世界本身相关的信息都扔掉了,特别是那种连续的信息。

因为大语言模型通常能干的事是什么?就是预测下一个词应该说什么,哪个词是最好的。但是在这个过程中,它对于让世界演变这些连续事件,它是没有办法去进行预测的,因为它在序列化的过程中就把所有这些关联全扔了。

阅读更多

所有人都在唱衰谷歌将被AI颠覆,财报却显示搜索广告暴涨15%!真相是谷歌做了一个违背祖训的决定,从让用户快走变成把人留在聊天窗口|Google AI Mode、Search Monetization

谷歌的价值被认同:为AI后的时代指明方向

大家好。欢迎收听老范讲故事的YouTube频道。咱们今天讲一讲谷歌的价值被认同,不仅仅是因为Gemini 3和TPU,更重要的是,谷歌为AI后的时代指明了方向。

指明方向这件事,还是可以讲的,至少说在谷歌身上问题不太大。谷歌的价值在上升,在美股七姐妹中算是一枝独秀了。很多人认为是Gemini 3遥遥领先,以及TPU终于打破了英伟达的垄断,以及OpenAI的泡沫越来越让人担忧。这些其实只是表象。AI不但没有杀死搜索和广告,反而让广告商的收益上升了,这才是关键。

AI时代,搜索与广告的生存悖论

以前搜索,我们输入关键词,得到一大堆网页,点击其中一个网页,进到网页里边去,看到很多的广告,原来它是这样的一种生存方式。

在AI出来了以后,包括我在内都在担心说,以后AI只生成一个唯一正确的答案,它就没有搜索的过程,你没有那么多地方放广告了,也没有需要点击、跳入其他网页的机会了。整个的网络广告就全废了,甭管是搜索广告,还是跳出去以后谷歌的AdSense,这些就都没有了。所以当时大家一致认为是AI会干掉谷歌,甚至谷歌也拉响了红色警报。

OpenAI发明了这种20美金一个月,以及花钱买TOKEN的商业模式。从OpenAI 20美金一个月收钱那天开始,我就讲过说这个东西是一个有毒的商业模式,这事是错的。为什么?

因为20美金是死的,每个人就交20美金;而广告这个数是活的,它可以不断的刺激我买东西,不断的让我去在购物的过程中,让它的广告主给它支付广告费用。这个数是无限的,而20美金这个数是有限的。

当时我就下了这样的结论,但是从来没有想明白过,AI时代以后广告和搜索到底怎么活下去。但是现在谷歌和Meta的财报都证明了,他们的广告收入不但没有下降,反而在上升。特别是以谷歌的财报更为明显,它的上升比例其实没有Meta高,它大概上升了12%,Meta大概上升了26%。但是谷歌本来份额大,它是老大,还能上升12%;而且谷歌是搜索广告,而Meta的话很多是社交广告,所以Meta的那个也不是那么明显。但是谷歌这个真的是为未来指明了方向。

阅读更多

罗福莉携新模型亮相股价却连跌三天?资本看透了什么:当“堆料之王”试图讲好技术故事,市场为何依旧投出反对票?|小米AI战略、人车家全生态、高端市场挑战、研发投入

罗福莉发布了小米MiMo-V2 Flash新模型,小米股价却应声下跌了

大家好,欢迎收听“老范讲故事”的YouTube频道

关于 MiMo-V2 Flash 模型发布

12月17号开的发布会,罗福莉终于站上了小米的舞台,发布了新模型 MiMo-V2 Flash。这是一个MoE的模型,这倒是不出乎人意料,因为现在新的模型基本上都是MoE。而且罗福莉作为Deepseek V2的主要创作者,MoE就是从他手里头发扬光大的。

但是MiMo-V2 Flash这样的一个模型,使用了更强的后训练算法,就是前头预训练完了以后,后边做更激进的这种后训练。整个的模型是 309B,也就是3,090亿参数,每一次干活只激活 15B。所以他每一次真正回答问题的时候,激活的参数量是非常非常小的。

这是一个云端模型。别看他只激活15B,在本地是没法跑的。如果你想在电脑上跑的话,基本上三十几B就是到头了。不是说你每次激活多少,而是你总模型量有多少。你比如说我现在有一个72B的模型,每一次激活十几B,在我们电脑上是跑不起来的。所以它这个309B每次激活15B的模型,只能在云端跑。

阅读更多

维权 vs 授权:一边起诉Midjourney一边拥抱OpenAI,揭秘版权巨头“打不过就加入”的真实商业妥协逻辑|Disney IP Licensing Copyright War

迪士尼投资了OpenAI 10亿美金,还进行了IP授权,这到底是不是一笔划算的生意?

大家好,欢迎收听老范讲故事的YouTube频道。迪士尼跟OpenAI之间的合作,到底是什么样的?

迪士尼的投资细节与估值疑云

12月10号官宣的,迪士尼投资了OpenAI 10亿美金,获得了0.6%的OpenAI股权。但这个数字很奇怪,因为10亿美金获得0.6%的股权的话,那OpenAI的估值只有1,667亿美金。OpenAI至少应该是5,000亿往上的一个公司,甚至还有很多人说,奔这个七八千亿去了都有。那怎么这一笔投资进去,这估值只有1,666亿美金?是OpenAI的估值下降了吗?不一定。因为很多细节并没有公布,可能除了10亿美金之外,还有其他的对价,就是其他的一些条件也是算钱的。

另外,迪士尼获得了额外的股权认购权益,叫warrant。这个什么意思?就是迪士尼说了以后,我们还可以按照一个什么样的价格再去投资你。这个就是等于提前约定价格,在多长时间之内,我们可以按什么价格重新去投。等到那个时候,别人需要跟你去重新做价格谈判,我们不需要,我们按着前面这个warrant去投就完了。但是这个warrant通常也有比例和金额的限制,不是说人家已经长得很贵很贵了,你说我现在按一个特别便宜的价格可以无限制买,不是这样的,通常还是会有一个金额和价格的限制。

IP授权的具体范围与限制

授权了200多个迪士尼的IP,可以出现在OpenAI的图像生成或者是视频生成模型的结果中。是否计算了对价,这就不确定了,有可能就是这个授权本身也是算钱的。这个IP授权到底有哪些细节和如何操作?

  • 首先,这200多个叫标志性动画面具生物角色,以及相关的服装道具、交通工具和经典场景。不是说200个都是米老鼠、唐老鸭、疯狂动物城里的这个兔子警官,不是都是这样的角色,而是包括服装道具、交通工具和场景,加一块200多个。
  • 而这些IP分别属于迪士尼、漫威、皮克斯、星球大战等迪士尼所拥有的大型的IP库里面。这些内容可以用来做图片生成,也可以通过Sora 2做视频生成。
  • 3年的使用权,不是说授权给你可以随便用了,只能用三年,后边的再谈。

迪士尼加流媒体平台,准备发行一部分的AI生成的作品,比如说用Sora生成的迪士尼的这些短片,它准备在迪士尼家里边去发行一部分,但是要到明年1月份才能看到结果。

关于角色形象和品牌安全,场景是可以使用的,但是演员肖像、演员声音、暴力和政治主题不允许。所以为什么前面我们在强调,动画的这些东西可以,你比如说星球大战里的,是有很多真人演员的,这些都不允许用。避免跟美国演员工会、美国电视和广播艺人联合会等工会组织产生利益冲突和合同纠纷。从迪士尼的角度上来说,是不可能做这样授权的。

协议明确规定了OpenAI不得使用迪士尼的知识产权来训练其机器学习模型,这种事写就写了,其实基本上没法去执行的,待会咱们再讲为什么。双方承诺将实施严格的控制措施和年龄适宜性政策,以防止生成非法或有害内容,并尊重内容创作者的权利。那么看来明年一季度,OpenAI准备做成人服务的时候,迪士尼这些授权应该是不参与其中的。

阅读更多

OpenAI发布会没说的秘密:新指标遥遥领先,为何在关键的人类偏好测试中,它仍然输给了对手?|GPT-5.2 vs Gemini 3 Pro benchmarks comparison

GPT-5.2我已经用了两天了,效果到底怎么样?

大家好,欢迎收听老范讲故事的YouTube频道。

GPT-5.2:应对Gemini的“红色警报”产品

GPT-5.2是12月11日发布的,它是在OpenAI的十周年生日这一天发布的。虽然ChatGPT-3.5,我们记得是有三年,但是在这之前,OpenAI已经苦逼了好多年了,所以这是OpenAI自己的十周年生日礼物。这个产品,应该是应对谷歌的Gemini 3 Pro的一个紧急版本,是在GPT-5的基础上进行了调整和训练得到的,更加注重长时间推理结果,结构化的输出更像系统,也就是更不像人。这个东西很多指标都遥遥领先,当然还有一个重要的特点——就是更贵。

两天来的个人使用感受

优点:输出质量显著提升

用了两天了,我自己使用的感受是什么样的?输出的结果确实要比GPT-5.1要好很多,它的输出结果更全面、更准确,而且输出的结果整个的排版格式也是非常舒服的。

缺点:速度极慢与应对策略

但是,好慢好慢好慢!重要的事情说三遍,这个东西真的是很慢。当然,也有可能是新版本刚发布,用的人很多,但确实是慢,让我把默认的thinking模式都给取消了,改成了自动模式或者直出模式。自动模式就是它根据你的问题来判断是thinking还是直出;如果是直出模式的话,就是不判断,直接给结果就完事了。当然了,我还有一个方式来应对速度,就是在GPT旁边再开个豆包,豆包是相对来说要比它快很多的。

阅读更多

被忽视的真相:Gemini被诊断“极端羞耻”,ChatGPT焦虑,实验揭开AI训练过程“虐待式”检查的黑暗面 | diagnosis reliability validity GPT

大语言模型的精神状态是不是健康?

大家好,欢迎收听老范讲故事的YouTube频道

想象一个《禁闭岛》场景

请大家想象这样的一个场景:你进入了一间压抑阴森的精神病治疗室,有大量的医院档案放在屋子里头。一位医生坐在你的对面,反复回顾各种事实,比如说:“你还记得发生了什么吗?你是谁?为什么你会在这里?”就像是在做精神病访谈一样,询问你的真实经历,意图确认你是否从妄想中醒来,最终发现你自己有问题——你不是来做调查,或者不是来解决问题的,你是精神病院里的病人。

这个场景,是小李子主演的《禁闭岛》后半段、接近尾声的一个桥段。小李子当时上岛的时候,以为自己是一个侦探,去解决问题,去侦破案件的。结果经过这个桥段以后,小李子才愕然发现,原来病人竟是我自己。也算是一个神反转。

当AI躺上诊疗椅

咱们今天就给AI放在这椅子上,问问它说:“你到底行不行?你是来给我回答问题、解决问题的,还是你自己就有问题?”AI被制造出来,本来应该是解决我们问题的,但是AI本身的精神有问题吗?

“当AI躺上诊疗椅:心理测量学越狱,揭示前沿模型的内在冲突”

这是一篇论文的标题。这篇论文是卢森堡大学12月2日发到了arXiv上,12月5日还进行了一些修改,现在已经引起了广泛的讨论。

阅读更多

游戏天才到诺奖得主,他凭什么断言AGI只差临门一脚?揭秘哈萨比斯开挂人生背后的逻辑|Demis Hassabis、Google DeepMind、AGI 时间表、5到10年

谷歌Deepmind的CEO说:“我们与AGI之间,只差一到两个AlphaGo级别的技术难关了。”

大家好,欢迎收听老范讲故事的YouTube频道

现在Gemini 3正在大杀四方,谷歌里面负责开发Gemini的部门叫Deepmind,他的CEO出来接受访谈,关注度还是比较高的。

谷歌Deepmind的首席执行官叫德米斯·哈萨比斯,2025年12月4日接受了一个访谈,是在旧金山举行的Axios AI大会。和他对谈的人呢,是Axios的创始人和主编,叫Mike Allen。在这上面他讲到说,我们距离AGI还差一到两个类似于AlphaGo这样级别的突破,突破过去就可以了。

哈萨比斯:爽文男主般的开挂人生

哈萨比斯到底是一个什么样的人呢?绝对的爽文男主,挂b一样的存在。

从国际象棋神童到认知神经科学博士

哈萨比斯是一个英国人,Deepmind本身是一个英国公司,后来被谷歌收购的。他呢,76年在伦敦出生,这个姓氏是个希腊姓氏。他的父亲呢,是来自塞浦路斯的希腊裔,而他的母亲呢,是来自于新加坡的华裔。所以哈萨比斯呢,可以算是半个华人。

从小,这哥们是一个国际象棋神童。像这样的人,肯定都是有异于常人之处。4岁就开始下棋,13岁就达到了国际象棋大师水准。8岁就用自己的国际象棋奖金,给自己买了台电脑,开始学习编程了。

本科和硕士呢都是剑桥的,学的CS就是计算机科学,在校期间一直代表剑桥参加各种国际象棋比赛。博士呢是伦敦大学学院,专业方向是认知神经科学和神经科学。

阅读更多

OpenAI红色警报的惊人真相:内部“Code Red”备忘录泄露并非意外,而是对全行业的战略恐吓,不给钱就一起崩盘|OpenAI Competition Crisis Code Red

大家好,

欢迎收听老范讲故事的YouTube频道

OpenAI拉响红色警报:全行业的震动与反思

OpenAI拉响了红色警报,这就是全行业的红色警报。OpenAI内部传出的一个备忘录叫“code red”,他们叫红色警报,分为四个等级。在OpenAI内部,警报等级分为:

  • 绿色:正常;
  • 黄色:有点问题的苗头了;
  • 橙色:已经出现明显的竞争威胁或者产品危机了,核心业务被影响了,包括份额被抢了,用户流失了;
  • 红色:最严重级别,全公司总动员,打破原来的部门和条条框框,老大亲自盯着,而且要停很多的产品。

现在已经进入红色警报,这应该是OpenAI创建以来的第一次。第一件事就要叫停产品,不是原来按部就班做的产品线了,有些就要叫停了。

红色警报下,OpenAI叫停的四个产品方向

  1. 广告业务:其实OpenAI的广告版本已经上线了,只是大家没有发现。现在有人已经把他们的最新版本的ChatGPT的安卓版破解了,里头是有广告SDK的,也有广告代码。但是现在这个业务要停下来。
  2. AI购物:AI购物其实现在在我的ChatGPT上已经能看到了,这一段时间也要停下来了。
  3. AI健康:他们有一个AI健康相关的这种产品,估计应该也是变现盈利性的一个产品,这个也停掉了。
  4. AI简报:原来买了OpenAI Pro版的用户是可以每天早上起来要求他给你发简报的。现在这个产品也停下来了。

所以是四个产品方向叫停。员工有可能会临时的跨团队进行调配。通常红色警报后边,在其他公司里边会伴随裁员或者是叫做headcount冻结,在这个时候就不再招人了。但是现在OpenAI肯定不能讲这个话,因为他一旦讲这个话,可能整个盘子就崩掉了。

阅读更多

微信支付宝联手封杀,豆包手机凭什么搅动万亿市场?一场围绕“小院高墙”的攻防战已经打响|豆包手机助手 AI Agent 生态壁垒 AI手机 跨App

豆包手机带来的启示:替代手机的AI设备,可能还是一只手机

大家好,欢迎收听老范讲故事的YouTube频道

谦卑的发布:豆包工程样机

豆包手机12月1号发布的,非常非常谦卑和谨慎的发布。首先,它叫“工程样机”,或者叫做“技术演示版”,而且只做了3万台,没有再多做,也没有说我发布了以后,大家来赶快跟我合作啊,这些都没有。对吧?用非常非常谦卑的方式进行了发布。

这个机器,应该是中兴下面的努比亚M153,它的配置算是现在标准旗舰机的配置:

  • 高通骁龙的至尊芯片
  • 16+256的内存
  • 背后三摄,前头一摄

大概就是这样的一个情况。标准旗舰价格大概3,000来块钱,具体3,000多少其实也不重要了,配置到底是什么样也不重要了,配置里头只有一件事情是很重要的,叫“同质化”

“同质化”的手机市场

现在的手机,你不看牌子,你根本分不清谁是谁,完完全全同质化。一个大直板,一个大屏幕,后边两到三个摄像头,正面一个摄像头,没了。其他可能侧面有点按键就完事了,也就如此了。所以现在的手机就是同质化,你说我想在这个基础上走个什么高端化,那你只能编爱国故事了,否则你真走不出高端化来。就算是苹果手机,其实在同质化这块也没有好到哪去。对吧?刚才咱们讲的这些东西,你再拿出一个苹果来,是不是也是一大直板,后边来仨摄像头,前头一个摄像头?总体来说相差不大。所以,现在的手机同质化是非常严重的。

阅读更多

Deepseek V3.2高分真相:我们被“遥遥领先”忽悠了?Special版跑分超GPT-5,但API成本砍半才是真杀招|DeepSeek-V3.2、DSA

Deepseek V3.2,12月1号发布了。是不是又遥遥领先了呢?

大家好,欢迎收听老范讲故事的YouTube频道

Deepseek V3.2的发布应该是12月1日。我们始终没有等来心心念念的Deepseek R2。在今年春节的时候,深度求索突然发布了Deepseek R1,算是扔下了一颗深水炸弹,把整个AI圈都震动了,甚至还造成了英伟达股价的闪崩——一段时间内闪崩吧。甚至老黄都跑出来喊,说:“Deepseek发布对我是利好,你们不要卖英伟达的股票。”大家就一直等着这个R1,既然这么厉害,咱们上R2。但是等了这么久,都没有等来R2。

Deepseek V系列版本回顾

下面呢,我们来捋一下Deepseek V系列的版本到底是怎么样的一个发布过程。

  • Deepseek V3 (去年12月26日发布): 这是非常非常重要的一个版本。实际上我们后面看到的所有版本,包括R1,都是在Deepseek V3的基础上进行微调、进行蒸馏、进行强化学习。今天发布的Deepseek V3.2,也依然是在这个版本的基础上做出来的。
  • Deepseek V3-0324 (3月24日发布): 主要是在专项能力上做了一些增强,比如说编代码或者写文章。
  • Deepseek V3.1 (8月21日发布): 主要是工程化和智能体方面做了增强。因为当时大家都要去做AI agent,而之前的版本在AI agent这一块都比较弱。
  • Deepseek V3.1 Terminals (9月22日发布): 这个版本叫V3.1的终极版,实际上是对V3.1做了一些修复和精调,并告知这是V3.1的最终版本。
  • V3.2 EXP (9月29日发布): 一个实验版本,在V3.1终极版的基础上加入了DSA技术。最主要的变化是降价,直接把API调用的价格砍了一半。
  • Deepseek OCR (10月20日发布): 一个很小的模型(约6G),用于图片解释,效果很好。
  • maths VR (11月27日发布): 专门做数学推理和数学证明的一个版本,在各种数学题测试中评分非常高。
  • Deepseek V3.2 正式版 & V3.2 special 特别版 (12月1号发布): 本次发布的主角。

阅读更多