计算机视觉 - 老范讲故事｜AI、大模型与商业世界的故事

李飞飞的万字长文，讲述空间智能的未来

李飞飞呢，最近发了一篇文章，指出AI的下一个方向。AI的下一个发展方向就是空间智能。这个文章呢是11月11日发表的，非常非常长，上万字。标题呢是《从词语到世界：空间智能是AI的下一个前沿》。教授的长文，读起来还是稍微有一点点吃力，我还是认真地把整个文章读完了。教授呢，未必能够准确预测未来，那是算命先生的工作。但是，教授对未来的预测，还是值得认真研读一下的，特别是这位教授，还是当前AI浪潮的开拓者之一。

文章的结构之美：值得学习的写作范本

第一个特点就是非常的工整。她的文章结构，大家需要去学习一下。哪怕你说我看不懂这文章说什么，还是应该学习一下人家文章怎么写的。上来第一件事是提出问题：现在有些什么样的问题？然后呢，是核心概念的一些解释，对吧？啥叫空间智能？再往后呢，是方法论的一个架构：我准备怎么干？然后呢，是技术实施的一些细节和方法。最后呢，是应用的路径：我这个实施了以后能干嘛使？它是这样的一个完整架构。

每一个大标题下面呢，会有3到5个小标题，每个小标题下面，均匀地分布着描述和说明。它不会像有些人写文章，在某一个小标题下写非常长的内容，其它的显得干巴巴的，不会是这样的，很均匀。学习一下教授的写作方法，还是非常非常有价值的。

昨天，Sora短暂的泄露。但是，我们真的还需要等待Sora吗？大家好，欢迎收听老范讲故事的YouTube频道。在今年2月份，Open AI公布了他们的Sora大模型之后，大家一直在等待这个产品的正式发布。但是，等到了现在，已经到年底了。很多跟随Sora的产品都已经上线，都已经有很多用户开始使用了，Sora自己还遥遥无期。

在这样的一个时间点里，突然有一群艺术家将Sora的这个接口公开到了Hugging Face上面去，短暂的开放了一段时间。这些艺术家呢，还发表了一封公开信，表达了自己对于Open AI的各种剥削的不满。Open AI呢，及时发现，在一小时之后封闭了接口，说你们就到这吧；然后也出来做了一些解释，表示这些艺术家们都是跟我们一起去合作的，他们都是自愿参加的，没有什么强迫。大概也是讲了一些这种片汤话。

至于Sora什么时候能发布，人家也没有再继续提供更进一步的信息。那么，这一次泄露出来的呢，是Sora的Turbo版本。Turbo是轻量级快速的版本，就是不是一个全尺寸的模型，参数呢也并不是很突出。2月份，Sora当时号称自己是世界模型，可以仿真出世界来的，当时是可以出一分钟的视频的。虽然一分钟视频并没有那么大的用处，超过一分钟都属于超长镜头，电影里头用这种镜头其实也不是那么多。这一次呢，只提供了1080P、720P、360P三种的分辨率，然后时长呢就是5到10秒钟。其实跟我们现在可以使用到的大量的这种视频生成模型参数是一样的，现在的视频生成模型基本上都是5到10秒钟。

AI教母李飞飞万字长文戳破LLM泡沫：生成语言只是起点，无法理解真实世界才是致命伤｜空间智能 Fei-Fei Li 世界模型人工智能 AI的下一个前沿

李飞飞的万字长文，讲述空间智能的未来

文章的结构之美：值得学习的写作范本

Sora接口短暂泄露，艺术家们揭示Open AI的剥削内幕，是公关噱头还是真心合作？