11 月 21
Luke FanAIGC, Meta的故事 Advanced Machine Intelligence, AI pioneer, AI research, AI Startup, AI strategy, AI商业化, AI教父, AI科学家, Alexander Wang, chief AI scientist, Facebook AI, FAIR, godfather of AI, JEPA, launch startup, Llama大模型, machine intelligence, Meta, Meta AI, Meta AI战略, PyTorch, world model, Yann LeCun, Yann LeCun leaves Meta, 世界模型, 人工智能, 具身智能, 图灵奖得主, 大语言模型, 扎克伯格, 李飞飞, 杨乐坤, 杨乐坤离职, 非生成式AI
杨乐坤出走Meta:一场关于战略、用人和未来的博弈
大家好,欢迎收听老范讲故事的YouTube频道。
这一天还是来了。前面我们已经猜测了很久,说杨立昆到底什么时候会离开,因为所有人都眼睁睁地看着Meta的AI战略转换方向。亚历山大·汪进入Meta,一个28岁的辍学生,在管理65岁的大学教授和图灵奖得主,这个事一定不能长久。而且前面还对杨立昆手下的FAIR部门进行了600人的裁员。
靴子落地:杨乐坤宣布离职
现在靴子终于落地了。2025年11月19日,当地时间13:20,杨立昆发了一个长文宣布离职了。在这个文章里边,他回顾了一下在Meta待了12年,感谢了小扎和一堆高管,然后准备要去做他的AMI。他这个AMI呢,叫做“高级机器智能”,说:“我在Meta期间就一直在干这件事,现在呢我准备出去了以后接着干。”而且新公司呢,Meta依然还有参与,具体的情况后续再公布。他呢,也终于可以不受Meta的限制,去研究自己的世界模型了。
杨立昆也要去做世界模型,跟李飞飞有些相近。最后咱们再说一下,他的世界模型跟李飞飞的世界模型到底有什么差别。
Meta呢,应该在这个里边还是给了钱的。你请这样的一位大神出去,而且大神在发文的时候还感谢了扎克伯格,那一定还是要给钱的。所以杨立昆未来的公司里头,Meta应该还是一位重要的股东。但是到底给了多少钱,占了多少股份,可能还要等未来Meta的官宣,现在应该公司还在注册过程中吧。
More
11 月 13
Luke FanAIGC 4D空间智能, AI发展方向, AI教母, AI的下一个前沿, Fei-Fei Li, LLM局限性, World Labs, 世界模型, 交互式AI, 人工智能, 具身智能, 内容创作, 大型语言模型, 推理, 时序一致性, 机器人技术, 李飞飞, 物理世界, 物理感知, 状态预测, 生成式AI, 科学发现, 科技评论, 空间智能, 视频生成, 计算机视觉
李飞飞的万字长文,讲述空间智能的未来
大家好,欢迎收听老范讲故事的YouTube频道。
李飞飞呢,最近发了一篇文章,指出AI的下一个方向。AI的下一个发展方向就是空间智能。这个文章呢是11月11日发表的,非常非常长,上万字。标题呢是《从词语到世界:空间智能是AI的下一个前沿》。教授的长文,读起来还是稍微有一点点吃力,我还是认真地把整个文章读完了。教授呢,未必能够准确预测未来,那是算命先生的工作。但是,教授对未来的预测,还是值得认真研读一下的,特别是这位教授,还是当前AI浪潮的开拓者之一。
文章的结构之美:值得学习的写作范本
第一个特点就是非常的工整。她的文章结构,大家需要去学习一下。哪怕你说我看不懂这文章说什么,还是应该学习一下人家文章怎么写的。上来第一件事是提出问题:现在有些什么样的问题?然后呢,是核心概念的一些解释,对吧?啥叫空间智能?再往后呢,是方法论的一个架构:我准备怎么干?然后呢,是技术实施的一些细节和方法。最后呢,是应用的路径:我这个实施了以后能干嘛使?它是这样的一个完整架构。
每一个大标题下面呢,会有3到5个小标题,每个小标题下面,均匀地分布着描述和说明。它不会像有些人写文章,在某一个小标题下写非常长的内容,其它的显得干巴巴的,不会是这样的,很均匀。学习一下教授的写作方法,还是非常非常有价值的。
More
10 月 02
Luke FanAIGC AI内容创作, AI生成视频, AI社交平台, AI视频, Deepfake风险, iOS应用, MidJourney, OpenAI, Sam Altman, Sora 2, Sora 2邀请码, Sora app, TikTok竞品, YouTube Short, 世界模型, 个性化推荐, 数字分身, 文生视频, 用户形象授权, 短视频, 社交视频应用, 视频创作社区, 视频生成器, 邀请制社交
Sora 2 发布了,谁有邀请码给一个?
大家好,欢迎收听老范讲故事的YouTube频道。昨天晚上深夜,Sora 2 就突然发布了,山姆·奥特曼还跑上去祝贺了一下,但是他是远程的。现在我们也搞不清楚,他这个祝贺视频到底是他自己拍的,还是Sora 2 生成的,因为现在已经很难分出真假来了。
上来先放了用Sora 2 做的各种各样炫酷的视频。这一次呢,确实是看到了物理上基本都合理了,像原来物理上不合理的地方,现在少很多了。另外呢,就是人可以直接进到场景里去了。原来都是说先画一个人出来,这个人怎么动,而且人动的时候,衣服或者什么还要换。现在看到的演示,已经基本上没有这种问题了。
三个小哥呢,坐在那里刷了半天视频,他们整个的演示过程,实际上就是在刷视频,让你看看Sora 2 做的各种各样的东西是怎么样的。大家注意一点,这次刷的视频大部分是竖屏的,因为呢他们做了一个类似于TikTok这样的软件,展示这些Sora 2 的内容。既然是TikTok类型的嘛,在iPhone手机上一定是竖屏内容为主。
More
6 月 30
Luke FanAIGC AIGC, AI绘画, AI编程, AI视频, AI视频一致性, AI视频工具对比, Gemini CLI, iPhone实况照片, Live Photo, makelive, MidJourney, Midjourney Video, Midjourney Video评测, Midjourney用法, MP4转Live Photo, Pika, Ruby脚本, Runway, Sora, 世界模型, 为什么Midjourney Video没火, 产品分析, 人工智能, 代码生成, 使用技巧, 创意内容生成, 动图分享, 动图制作, 可灵, 命令行工具, 图生视频, 小红书动图, 市场反响, 技术教程, 正确使用方法, 生成式AI, 社交媒体素材, 视觉特效, 视频拼接, 谷歌Gemini
大家期待已久的Midjourney video,为什么在发布之后很快就没有声音了?今天咱们来讲一讲。
大家好,欢迎收听老范讲故事的YouTube频道。我个人呢,也是下了很大的决心才录了今天这条节目,因为Midjourney video真的是万众瞩目。因为他作图做得非常非常好,在美学上、在各种细节上、在氛围渲染上,到目前为止,所有的图像生成模型里头,Midjourney是最好的。前面他说我要去做视频的时候,一大帮人就在等,很多人都非常期待。产品发布了,突然就没声音了,见光死。这个是什么样的一个情况?
首先呢,跟大家一个结论,就是Midjourney video做出来的视频非常惊艳、非常炫酷、非常美。但是这个产品做出来的视频放在哪都不太合适,这个东西做出来没什么用处。可能呢,是大家没有正确的找到Midjourney video产出的视频的用途。我今天之所以敢跟大家录这个视频,是我觉得我好像找到这种视频的一个使用方法了。
今天呢,讲几个部分:先做一个Midjourney video的简单介绍;为什么没有形成传播,这个我们要稍微分析一下;Midjourney video到底能拿来干嘛;以及我们要去实现Midjourney video的最终使用,可能还要稍微写点小程序。顺手呢,把最近很热的另外一个工具也给大家介绍了,这个叫Gemini Client(CRI吧,因为要用它编程嘛)。咱们用这个Gemini CLI编完成序以后,把生成的视频最后处理成大家可以用的样子。
More
4 月 18
Luke FanAIGC AI发展趋势, AI局限性, AI幻觉, AI应用, AI易用性, AI普及, AI未来, AI模型发布, AI编程, AI视觉, AI记忆 (Memory), AI评测, API, API代理 (Open Router), API定价, ChatGPT Plus, Function Calling, Github Copilot, GPT-4o, GPT-5展望, Greg Brockman, IDE集成, Mark Chen, Meta data分析, O3, O4 mini, OpenAI, OpenAI发布会, Sam Altman, Scaling law, Sora, TikTok直播带货话题生成, YouTube话题推荐, 一站式AI服务 (Total Solution), 世界模型, 人工智能, 内容创作, 图片推理 (Image Reasoning), 大语言模型, 实时交互, 实用AI, 工具调用 (Tool Calling), 强化学习, 推理模型, 搜索集成, 模型对比 (OpenAI vs 竞品), 潭柘寺图片识别, 科技评论, 跨模态AI
GPT-3和O4 mini发布了,这次绝不再仅仅是科学家们的玩具了。大家好,欢迎收听老范讲故事的YouTube频道。
本来GPT-3和O4 mini发布呢,我并没有抱太大的期望。为什么呢?因为前面O1和O3 mini发布的时候呢,看得我头晕眼花的。我记得应该是在去年12天连续发布会的时候发布的O3 mini,实在是太不明觉厉了。各种的复杂科学问题,咔咔就给解决了,然后各种的排名都排得很高。但是呢,我自己其实并不怎么用。
为什么呢?第一个,ChatGPT Plus用户里边呢,它是有用量限制的,并不是随便让你用的。所以在有用量限制的情况下,你就得省着用,而且你也感觉不出有太大差异来。你说你用它干嘛?据说编程很强,但是它没法跟IDE结合,基本上也就放弃了。你是可以出一大堆的代码,但是你还得向IDE里边去考来考去的,很麻烦。那你说我通过API调用吧,直接使用O1和O3 mini这些模型,实在是贵,所以就放弃了。
More