12 月 23
Luke FanAIGC Abstract World Models, Advanced Machine Intelligence, AGI, AI Startup, AI创业, AI未来, AMI, Autonomous Driving, Deep Learning Limitations, Dog Intelligence, Future of AI, Intelligent Agents, JEPA, LLM Dead End, LLMs, Meta AI, Minimum Cost, Open Source AI, Physical AI, Physics & Planning, Robotics, Safety Alignment, Spatial Intelligence, System 2 Reasoning, World Models, Yann LeCun, 世界模型, 大模型死胡同, 大语言模型, 开源AI, 抽象世界模型, 智能体, 最小消耗, 机器人技术, 杨乐坤, 深度学习局限, 物理AI, 物理与规划, 狗的智能, 空间智能, 系统2推理, 联合嵌入预测架构, 自动驾驶, 通用人工智能
杨乐坤“暴论”:大语言模型是扯淡,连狗都不如?解读他的世界模型与新创业项目AMI
“我认为这完全是扯淡,这条路根本就不可能成功。”这是杨乐坤在最新的访谈中对大语言模型路线的评价。这是语不惊人死不休的这种暴论吗?还是说他真的有一些什么事情想做?
大家好,欢迎收听老范讲故事的YouTube频道。
12月15日,杨乐坤发布了他最新的访谈。访谈是在一个叫做“信息瓶颈”的播客中进行的,位置应该是在纽约大学。杨乐坤当时还在Meta站好最后一班岗,三周以后会正式离职。访谈接近两个小时,我尽量讲一些里边有意思的部分。
现在的大语言模型还无法跟狗的智能相比,这个也是其中比较有趣的一点。到底杨乐坤想做的世界模型,以及他的JEPA是如何工作的?对于我这个讲述者和各位听众来说,都是一个挑战。请耐心听到最后,然后告诉我,我到底讲明白了没有?你们到底听懂了没有?杨乐坤要去做的AMI,也就是创业要做的这个新公司,到底是干什么的?怎么挣钱?咱们今天就讲这几块。
第一块:杨乐坤为什么觉得大语言模型完全是扯淡?
这里头要讲到的最核心的观点叫“序列化”。大语言模型工作的方式,是把整个世界的这些语言进行序列化。所谓序列化是什么?就是把所有的语言变成TOKEN,然后把这些TOKEN离散掉,谁跟谁之间都没有关系,再通过把全世界的语言搁在一起进行统计、进行训练,重新建立起这些TOKEN与TOKEN之间的关系。它是这样来工作的。
而且要注意一点,语言这个东西本身就是一个世界映射,语言只能表达世界中的很少一部分。哪怕是同样的语言,你用不同的语气语调来说,都会表达不同的意思。而不同的语气语调,你在语言中是完全无法看到的。所以语言只是真实世界的一个稀疏映射,大量的信息被错漏了。所以在TOKEN化的这个过程中,大语言模型其实把大量世界本身相关的信息都扔掉了,特别是那种连续的信息。
因为大语言模型通常能干的事是什么?就是预测下一个词应该说什么,哪个词是最好的。但是在这个过程中,它对于让世界演变这些连续事件,它是没有办法去进行预测的,因为它在序列化的过程中就把所有这些关联全扔了。
More
4 月 24
Luke FanAIGC, 字节跳动,故事多 AI Agent, AI应用, AI竞争格局, Anno 1800, Anthropic, API接口, Baidu, ByteDance, Claude 3.5, Coze Space, Coze Space评测, DeepSeek R1, Gemini 2.5 Pro, Google, GPT-4o, Llama 4, LLM, Manus, MCP (模型控制插件/标准), Meta, OpenAI, PPT生成, Token消耗, Waiting List, 产品体验, 产品对比 (Coze vs Manus vs Grok vs XinXiang), 产品评测, 代码生成, 任务拆解, 优劣势分析, 免费试用, 内容生成, 功能演示, 可视化网页生成, 呼伦贝尔自驾, 复杂任务处理, 大语言模型, 字节跳动, 工具调用 (内部/外部), 市场调研, 心想APP, 扣子空间, 扣子空间使用, 搜索质量, 数据调用, 文档生成, 旅游攻略, 智能体, 游戏攻略, 现象级产品, 用户分析, 用户反馈, 电动车充电, 百度, 简历筛选, 自动化, 自我规划, 行程规划, 表格生成, 访谈记录整理, 豆包大模型, 通义千问, 邀请码, 阿里, 高德地图, 黑神话悟空
Manus的后劲来了。百度、字节都有了自己的agent产品上线。
大家好,欢迎收听老范讲故事的音乐节目频道。字节上线了扣子空间,百度上线了心想APP。Manus的光环不再。Manus本身就属于意外爆火,当时它突然火了以后,咱们还做了直播,说这个东西没有什么技术门槛,只是产品设计的很有意思。
Manus跑去跟阿里合作了之后,那字节、百度说这不行,咱们也得有自己的产品上线。又不是有多难做的东西,那就做呗。我呢,搞了一个字节扣子空间的邀请码,咱们呢试一试,看看这个产品到底怎么个用法儿。
Manus呢,到现在我也没用上。原因也很简单,我去申请测试,等了很久,到现在都已经开始收费了,也没有收到说你可以来玩一下的这个邀请。所以也就别费劲了。我自己呢也没有特别着急,我要特别着急想用的话,随便找两个人去要一些邀请码,也还是可以搞得定的。既然没有那么热心的话,也就没有上心去找嘛。
More
11 月 19
范, 路AIGC AI Agent, AIagent, AI创新, AI发展路径, AI商业化, AI商业探索, AI工具, AI市场, AI平台, AI技术, AI方向, AI模型调用, AI生成, AI竞争, AI节目主持, AI落地应用, AI行业, AI行业评论, AI视觉生成, AI革命, AI项目, IRAG, IRAG系统, OpenAI, Scaling law, Sora, Token计费, YouTube频道, 中国AI, 中国式创新, 云计算, 产品发布, 创新保守, 创新挑战, 前沿科技, 发展趋势, 商业逻辑, 图像RAG, 图像技术, 多模态, 大企业应用, 市场策略, 市场需求, 幻觉问题, 快手, 技术发展, 技术定向, 技术路线, 抖音, 搜索增强生成, 政府应用, 文心一言, 文心智能体, 文心研, 无代码工具, 智能体, 智能体平台, 智能技术, 智能生成, 未来展望, 未来技术, 李彦宏, 消除幻觉, 涌现, 爱奇艺, 现有需求, 百度, 百度AI战略, 百度AI技术路径, 百度世界大会, 百度发布会, 百度应用, 百度战略分析, 百度技术展示, 百度智能眼镜, 百度的未来, 百度视频平台, 确定性创新, 科学家质疑, 科技前沿, 科技评论, 秒哒, 老范讲故事, 规模法则, 视觉数据库, 视频模型, 超级APP, 超级智能体
百度为什么不做Sora?是不是吃不到葡萄就说葡萄是酸的呢?大家好,这里是老范讲故事的YouTube频道。
11月12号,百度世界大会上就透露出来说,百度从来就没有想去过做Sora这样的世界模型,或者叫视频模型,从来没想过。百度呢,是一直希望走自己的多模态道路,不希望去跟OpenAI这样的公司卷入世界模型的竞争。虽然到现在为止,Sora也没出来,但是跟在后面跑的人还是很多的,特别是抖音、快手,都推出了各自的视频模型,还有很多国际上的厂商也在视频模型上争先恐后地往前跑。
但百度说,我不干这个事,我有更重要的事情在做。这是百度李彦宏亲口说的。那么,百度努力的方向到底是什么呢?百度努力的方向是消除幻觉。大模型都是有幻觉的,百度呢说,我们作为一个中国公司,你可以不说话,但是说错了是很麻烦的,所以我们不能产生幻觉,保证我们说的都是对的。而且这个是在各种角度上,所有的评判标准来看,都得是对的,不能有任何问题。因为有的时候,你说的你觉得对了,但别人觉得不开心,这也是不行的。
More
7 月 10
Luke FanAIGC AIGC, AIGC应用, AI大模型, AI工具, AI技术, AI时代, AI时代盈利, AI革命, CEO, Facebook, Instagram, Open AI, OpenAI模型, QQ, TikTok, WhatsApp, 上海人工智能大会, 严弘, 中国AI市场, 中国市场, 人工智能, 人形机器人, 内容创作, 出海, 合规成本, 商业模式, 图像识别, 基础模型, 大企业, 字节跳动, 安卓, 小企业, 工具革命, 广大用户, 开发者, 微信, 思维定势, 抖音, 持续创新, 提示词工程师, 支付宝, 收入低, 数据标注师, 新兴职业, 新创职业, 智能体, 李彦宏, 海外市场, 淘宝, 熊猫博士, 猎豹移动, 王坚, 生态构建, 生态系统, 用户体验, 用户使用时长, 用户粘性, 用户群体, 电商, 百度, 百度地图, 百度搜索, 百度文心, 百度网盘, 百度贴吧, 盈利模式, 短视频, 移动时代, 算力, 经济前景, 职业变化, 职业消失, 自媒体市场, 苹果, 视频生成, 词语生成, 语音识别, 谷歌全家桶, 超级应用, 超级应用生态, 辅助驾驶, 逻辑思维, 金融支付, 门槛, 阿里, 阿里云, 阿里云王坚
在上海人工智能大会上,我们目睹了中国AI发展的新高度。今天,我们将引用两位业界大佬的讲话,并附上一些个人见解。首先,李彦宏提到,无需担忧AI会夺走人类的工作,当前的AI技术,如百度的“文心”,更多地扮演着辅助角色,如辅助驾驶,而非完全取代人力。他指出,尽管某些职业可能会消失,但新兴职业,如数据标注师和提示词工程师,将应运而生。这些职业虽然门槛不高,但对逻辑思维有较高要求。然而,值得注意的是,消失的职业数量远不及新创职业,且“门槛不高”往往意味着收入也相对较低。
接着,严弘提出了避免陷入“超级应用陷阱”的观点。他解释道,移动时代的思维定势认为,超级应用是关键,但在AI时代,那些具有强大功能的应用,即便用户量不及10亿日活跃用户(DAU),也可能对产业和应用场景产生更大的价值。严弘的这一观点,或许反映了百度在超级应用领域的局限性,正如俗语所说,“吃不到葡萄说葡萄酸”。李彦宏强调,AI时代的核心仍旧是搜索,这是百度的强项。然而,百度自身从未成功打造出超级应用,这一直是其心中的痛。在AI时代,百度虽有雄心,但若无法突破超级应用的瓶颈,其盈利前景将受到限制。
总的来说,中国AI的发展正迎来新的挑战和机遇,而如何在AI时代找到自己的定位,对于企业来说至关重要。
More
5 月 19
Luke FanAIGC, Google的故事 AI Infra, AI交互, AI市场, AI平台竞争, AI应用, AI技术变革, AI硬件, ChatGPT, Gemini, Google cloud, Google I/O, GPT-4, GPT-4o, Ilya, iPhone, OpenAI, Project Astra, RAG图像生成, Sam Altman, TPU, Workspace, 任天堂, 企业用户, 创新战略, 多模态训练, 大模型, 技术发展, 搜索引擎, 政府用户, 智能体, 智能设备, 未来趋势, 杰米莱, 游戏, 用户体验创新, 电商, 算力, 语音交互, 谷歌IO
大家好,欢迎收听老范讲故事的YouTube频道。今天我们又请到了老朋友尹迪狗,给我们介绍一下刚刚召开完的谷歌艾欧。这一次到底发布了什么。而在谷歌艾欧之前的一天,OpenAI我觉得算是故意捣乱截胡,发了个GP4欧出来。我们就正好趁这个时机呢,把这两个发布会或者两两个产品吧,一起来总结一下。首先呢,我想先问一下,GBT4O到底算不算是划时代的产品。嗯,至少模型啊,分成两部分,它发的是PPT是o是模型混合模态嘛,他把语音视频和文字一块训练的嘛,可以同时输入和输出嘛。这个相当于是,嗯,也不叫划时代吧,就是他之前所有的工程技术的沉淀。嗯然后呢,做了一个特别好的一个交互形式,就是语音交互。而且那个语音交互的很大一个特点,发完之后不是马上就有人升级吗,一搜我的这个APP上面的模型以及GPT,搜了然后大家都想打开。那那个耳机,点上去之后呢,可以跟他聊聊天。实际上,那个聊天并不是他发布会上的那种APP,那个还是回合制的,用那个rest接口聊天。我,发出去然后回来,这个回合制的,但是呢,他在发布会上演示的是完全stream的,就是像就像我们现在一样,我们录节目,我们用的是Web RTC协议嘛,streaming,就是你的Server端,它的那个TOKEN,它就不停的接收是吧,做实时处理。这个特别耗流量,耗TOKEN,耗算力的。嗯现在还没用到这个模型,所以大家感受不到,所以我记得第二天还第三天的时候m奥特曼还是他们官方账号,发了一个说明嘛,说哎你们大家用的现在还不是,发布会上也是这个,哈哈哈,一堆人说说这一直完完全不对,这么慢的响应,我觉得借手报了一下,就是他是非常natural,非常自然。可能就是大家第一次用起来 GPT 的感觉,一样哎。哇哦,是他没这样回答问题。就是他确实是有那个时候的一个感觉。
More