12 月 23
Luke FanAIGC Abstract World Models, Advanced Machine Intelligence, AGI, AI Startup, AI创业, AI未来, AMI, Autonomous Driving, Deep Learning Limitations, Dog Intelligence, Future of AI, Intelligent Agents, JEPA, LLM Dead End, LLMs, Meta AI, Minimum Cost, Open Source AI, Physical AI, Physics & Planning, Robotics, Safety Alignment, Spatial Intelligence, System 2 Reasoning, World Models, Yann LeCun, 世界模型, 大模型死胡同, 大语言模型, 开源AI, 抽象世界模型, 智能体, 最小消耗, 机器人技术, 杨乐坤, 深度学习局限, 物理AI, 物理与规划, 狗的智能, 空间智能, 系统2推理, 联合嵌入预测架构, 自动驾驶, 通用人工智能
杨乐坤“暴论”:大语言模型是扯淡,连狗都不如?解读他的世界模型与新创业项目AMI
“我认为这完全是扯淡,这条路根本就不可能成功。”这是杨乐坤在最新的访谈中对大语言模型路线的评价。这是语不惊人死不休的这种暴论吗?还是说他真的有一些什么事情想做?
大家好,欢迎收听老范讲故事的YouTube频道。
12月15日,杨乐坤发布了他最新的访谈。访谈是在一个叫做“信息瓶颈”的播客中进行的,位置应该是在纽约大学。杨乐坤当时还在Meta站好最后一班岗,三周以后会正式离职。访谈接近两个小时,我尽量讲一些里边有意思的部分。
现在的大语言模型还无法跟狗的智能相比,这个也是其中比较有趣的一点。到底杨乐坤想做的世界模型,以及他的JEPA是如何工作的?对于我这个讲述者和各位听众来说,都是一个挑战。请耐心听到最后,然后告诉我,我到底讲明白了没有?你们到底听懂了没有?杨乐坤要去做的AMI,也就是创业要做的这个新公司,到底是干什么的?怎么挣钱?咱们今天就讲这几块。
第一块:杨乐坤为什么觉得大语言模型完全是扯淡?
这里头要讲到的最核心的观点叫“序列化”。大语言模型工作的方式,是把整个世界的这些语言进行序列化。所谓序列化是什么?就是把所有的语言变成TOKEN,然后把这些TOKEN离散掉,谁跟谁之间都没有关系,再通过把全世界的语言搁在一起进行统计、进行训练,重新建立起这些TOKEN与TOKEN之间的关系。它是这样来工作的。
而且要注意一点,语言这个东西本身就是一个世界映射,语言只能表达世界中的很少一部分。哪怕是同样的语言,你用不同的语气语调来说,都会表达不同的意思。而不同的语气语调,你在语言中是完全无法看到的。所以语言只是真实世界的一个稀疏映射,大量的信息被错漏了。所以在TOKEN化的这个过程中,大语言模型其实把大量世界本身相关的信息都扔掉了,特别是那种连续的信息。
因为大语言模型通常能干的事是什么?就是预测下一个词应该说什么,哪个词是最好的。但是在这个过程中,它对于让世界演变这些连续事件,它是没有办法去进行预测的,因为它在序列化的过程中就把所有这些关联全扔了。
More
6 月 04
Luke FanAIGC, 互联网商业故事 2025AI预测, 2030年AGI, AGI, AI, AI与就业, AI个性化推荐, AI内容生成, AI原生代, AI商业模式, AI基础设施, AI开发者生态, AI智能助手, AI知识获取, AI算力, AI编程开发, AI行业变革, AI趋势报告, ChatGPT, OpenAI, YouTube解读, 中美AI竞争, 互联网发展, 互联网女王, 人工智能, 十大AI应用, 开源AI, 投资参考, 报告解读, 未来预测, 玛丽·米克尔, 科技评论, 科技趋势, 老范讲故事, 行业分析, 行业圣经, 趋势分析, 通用人工智能
互联网女王每年发布的、被全行业当圣经一样解读的趋势报告,时隔6年再次发布。大家好,欢迎收听老范讲故事的YouTube频道。
互联网女王的互联网每年一度的趋势报告再次发布了。这位互联网女王呢,她叫玛丽·米克尔。1995年开始,她每年发布一份互联网趋势报告,到2019年疫情前发了最后一份。前面应该是发了20多份吧。隔了五六年以后,2025年的5月30号,她再次发出了最新的报告。
这份报告叫《人工智能趋势报告》,340页的PPT。他这个趋势报告每年都是一份,基本上都有300多页。形式呢全都是PPT,每一页都是图表,没有那么多字,大量的是各种各样的趋势图。它是通过行业数据,就是一些已经发生的数据。它很少说我去预测这个数据,也有,但是它会标的很清楚,哪部分是预测的,哪部分是已经发生的。
More
5 月 14
Luke FanAIGC AGI, AI伦理, AI全球化, AI公共服务, AI医疗, AI地缘政治, AI基础设施, AI应用, AI投资, AI教育, AI本地化, AI模型定制, AI治理, AI生态, AI监管, AI竞争, AI算力, ChatGPT, DeepSeek, GPU, MGX, OpenAI, OpenAI国家计划, Oracle, Qwen通义千问, 一带一路, 专制AI, 中国AI, 中美科技战, 主权AI, 云计算, 价值观输出, 华为云, 国家AI战略, 大语言模型, 字节跳动, 山姆·奥特曼, 巨额投资, 开源AI, 数据隐私, 星际之门, 民主AI, 盟友国家, 科技霸权, 算力中心, 老范讲故事, 腾讯云, 英伟达GB200, 软银, 闭源AI, 阿里云, 霸权AI, 黄仁勋
OpenAI的星际之门和民主AI,到底要对抗谁呢?
大家好,欢迎收听老范讲故事的YouTube频道。山姆·奥特曼亲临德州星际之门工地,现场指导工作去了。他在德州阿比林市星际之门工地现场做了一些现场指示,这就是他们星际之门的第一期工程。项目花费呢,首期投入是1,000亿美金,未来四年共计消耗5,000亿美金。但后边的事大家就别太当真了,因为后面还有很多钱可能需要各国政府去掏,待会我们再去讲。
第一期建设呢,主要是软银掏钱。Oracle负责设计、施工和建造,所以现场拍到的照片,大家穿的小背心、安全帽上面都是写的Oracle的字样。计划部署6.4万台英伟达GB 200 GPU,首期的1.6万台英伟达GB 200 GPU应该是在今年夏天就可以完成安装,就可以投入使用了。
More
4 月 23
Luke FanAIGC, OpenSource 70 billion parameters, 70B模型, AI Security, AI多语言处理, AI安全性, AI技术, Artificial Intelligence, Baidu, ChatGPT, Claude, Facebook, GPT3.5, GPT4, Instagram, Li Yanhong, LLama2, LLama3, Meta, Multilingual AI, OpenAI, Tech Innovation, Technology Breakthrough, WhatsApp, 业界影响, 人工智能, 大语言模型, 开源AI, 扎克伯格, 技术突破, 技术讨论, 文心一言, 李彦宏, 百度, 科技创新, 通义千问
大家好,欢迎收听老范讲故事YouTube频道。今天咱们来讲第一个故事。
Llama3发布了,李彦宏是不是被打脸了呢?Llama3突然发布,又是一个遥遥领先。它呢,发布了8B和70B的两个版本。8B就是80亿参数,70B呢就是700亿参数。8B的,我其实已经试过了,就在本地已经装上了。这个某些方面,接近了原来,或者超过了原来的Llama2的70B。包括一些咱们在本地跑的这种30多B的,这种就是300多亿参数的模型,它已经都超过了。而且速度还飞快。
啊,70B呢,据说已经超越了cloud 3的中量级模型。Note 3是有三个模型的:一个是特别微小的,就是可以在手机上跑;一个是中等量级的,是可以在PC本地跑的;然后还有一个是那种特别大的,特别大的,是可以对标GPT4的。70B的基本上已经超过这个中等量级了,也超越了GMINI 1.5 Pro。现在大家想去试GMINI 1.5 Pro的,可以到AI studio.google.com上去试,那个是可以免费用的。也超越了现在70B发布出来的版本。普遍他们自己讲的是超越了GPT3.5,但是呢,还达不到GPT4。这在所有测试数据上都是这样。我相信梅塔应该不会像咱们似的,专门做一些调优以后去跑分,不像咱们这么无聊。
More