技术创新 – 老范讲故事｜AI、大模型与商业世界的故事

阿里Qwen3重磅发布：是超越Llama 4的划时代的胜利，还是性能未达预期、被过度炒作的技术翻车现场深度剖析？

Luke Fan — Sun, 04 May 2025 00:47:42 +0000

Qwen3发布了。这到底是划时代的胜利，还是翻车了呢？

大家好，欢迎收听老范讲故事的YouTube频道。Qwen3真的是千呼万唤始出来。前面好几周就已经不断有传言说Qwen3要发布，要多么多么强大。突然发布之后，当然也肯定是伴随着一大堆的评测数据了。官方评测数据呢，永远是我超越了谁、超越了谁。但是很多评测的人呢，觉得好像差那么一点点意思，没有达到预期。所以今天我们来讨论一下，这到底是又一次划时代的胜利，还是翻车。

Qwen3呢是凌晨发布的，4月29日凌晨上线，在Github上全面开放。我呢已经开始用上了。使用的方法有几种：

第一种是本地部署。我是MacBook Pro，M2 Max的芯片，32G内存。其他的不重要，你到底有多少硬盘，这个事没有那么重要。本地使用OlAmA部署，我使用了8B、32B和30B-A3B。最后这个是什么意思？最后是一个MOE的模型，它是30B-A3B，就是说它每一次干活的时候激活3B，也就是30亿参数。它是这样的一个标注。就这三个版本的模型，在我本机都可以跑，速度呢都是还可以接受。

云端，第一个你肯定上阿里他们自己家玩去。阿里云百炼平台，使用支付宝或者淘宝账号刷一下，就可以进去使用了。价格还是很便宜的，特别是一些很大的模型，还是要在这个上面才能去跑起来。然后open Router永远是最快的。4月29号凌晨发布的，4月29号白天就可以在这个平台上用上了。硅基流动稍微晚一点，大概到5月1号可以去使用了。

那么Qwen3有什么样的特性呢？第一个是全配置，这个非常非常重要。什么叫全配置？就是它从很小的模型到很大的模型，所有的配置都是完整的。首先它提供了稠密模型，不是MOE，就是单个的这种稠密模型，从0.6B、1.7B、4B、8B、14B、32B，这些都提供了。MOE模型提供了30B-A3B和235B-A22B。235B-A22B这种模型什么意思？就是说一共是2,350亿参数，每一次激活220亿个参数。它是这样的两个MOE模型。

全场景。你在移动端0.6B到4B这样的模型，在移动端没有任何问题都可以跑。说我在终端推理，或者是在PC端跑一跑，做一些商业应用，8B、14B、32B都是可以跑的。你说我有一些复杂任务，或者做一些AI agent开发，30B或者是235B的两个MOE模型非常好用。而且呢是全语种，它支持119种语言。不过这块有人在吐槽。

这119种语言，好像除了中文、英文和常见的几种语言之外，其他什么斯瓦西里语这种奇奇怪怪的语言，支持的并没有那么好。

训练的过程呢，稍微的跟大家展开讲一讲。预训练用了36T的数据。LLAMA4的预训练数据的话是30T，Qwen3的话，比LLAMA4的训练数据集还要再大一些。

它的第一阶段呢，是使用了30T的数据，训练了一个基础语言模型出来。第二阶段用5T的数据呢，去强化STEM，也就是这种科学相关的能力，以及编程相关的能力。到第三阶段呢，就是扩大上下文。一开始这个上下文是比较小的，经过第三阶段的扩大以后：

– 4B以下的模型，也就是刚才我们说的0.6B、1.7B、4B这三个模型，它们的上下文呢达到了32K。
– 大于4B的模型，也就是8B、14B、32B，以及MOE的两个模型30B和235B这几个模型，他们的上下文呢都已经达到了128K。
– 在一些特殊情况下，可以达到256K的上下文。

这块呢，有待继续提升吧，因为LLAMA4的上下文是10兆，要比它大很多。

数据来源，就是拿什么数据来训练的这个东西：
– 60%的数据呢，是互联网原生数据。
– 25%呢，是专业领域的数据，包括GitHub上面的代码、数学公式、科学数据。
– 还有15%呢，是合成增强数据，就是拿其他的大模型去生成的一些数据，用的是Qwen2.5的一些模型生成了一些数据。这块呢，主要是做一些推理链的训练，而且也可以做多语言的对齐。

这就是它的数据来源。这块呢，跟LLAMA4就有很大的区别。LLAMA4大量的使用的都是合成数据，而这个Qwen3的话，使用的大量是原生数据。

在预训练之后，还会进行后训练。后训练的话，实际上是对模型做微调了。他呢，在分四步对Qwen3进行微调：
1. 第一步是长思维链冷启动的训练，注入数学、代码等领域的常推理数据。
2. 第二步呢，是强化学习探索强化学习，就是你给我生成结果，我们来打分，然后你根据我的打分来决定说这个结果对不对。它是基于规则奖励，提升复杂推理能力的一个训练。
3. 第三步呢，是模式融合。这个东西特别好玩，它是一个融合模式的推理模型。什么意思呢？因为我们使用推理模型的时候，有一个特别讨厌的东西，就是有些特别简单的东西呢，给你推理半天，甚至推理的TOKEN还消耗了很多。对于Qwen3来说呢，它里头有一个参数，就是你是不是要打开推理。同一个模型呢，你可以在这设说你不要打开推理，他就快速的给你出一结果。你说你给我做推理。

就给你啰里八嗦的去想去了，这个也算是个创新吧。原来都是推理模型，就是必须要推理。他是做了这样的一个训练，然后第四步呢是进行通用校准，特别是覆盖20多个领域的强化学习，修正一些不良行为。他等于做了预训练之后，还做了大量的微调后训练。

那么，Qwen3的技术创新到底有哪些呢？

第一个就是它这个混合推理架构。就是你到底想不想让它推理，你告诉他就完了。他给你去推去，或者是直接给你一个答案。

第二个技术创新呢，就是它的MOE的参数效率极大提升了。它的235B的模型里头，每一次激活只激活22B的参数。它要比DeepSeek R1激活的参数要少很多，只有DeepSeek R1 1/3的参数。它整个的模型尺寸也只有DeepSeek R1的1/3。所以呢它的部署成本要比DPC卡R1要低很多，推理的效率也要高非常多。

第三个呢就是多语言和多模态的支持。第一次支持了119种语言，2025年内将推出Qwen3-Vl多模态版本。现在的Qwen3还不支持多模态，你给他张图片他还是认不出来的。这块还是比LLAMA4要差一点。LLAMA4是你给他个视频，他都可以给你进行推理。

最后，Agent能力增强。它呢是直接支持MCP，原生支持MCP协议，工具调用准确率提升40%，API代码量减少70%。这个是Qwen3在这一个时代里头，必须要去实现的功能。这也是它比LLAMA4强的地方。

对Qwen3的期待、评分以及使用感受方面，还是有一些落差的。各项评分一定是高的吓人。因为你现在说，我今天推出一个新模型出来，你一定会自己做一大堆评测，然后跟模型一起推出。如果你说我自己做的评测就比谁都差，那这事你还推它干嘛？一定是说我现在评测了，比大家都强了，我才可以推出来。所以评分一定都比大家强。这块呢，就不跟大家详细去列举说那个评分是多少了，没有什么意义。

但是呢，这个里头比较好玩的是什么？就是它是一个田忌赛马的故事。大家知道什么叫田忌赛马吗？用我们的比较差的马，跟人家那个最好的马比，我输掉了。然后呢我用我的最好的马去跟人家的中马比，我赢了。用我的中马去跟他的最差的马去比，我又赢了。等于三局两胜，我赢两盘。他是很多做这样的这种比较。

为什么Qwen3有田忌赛马的这个能力呢？你比如说，8B的模型可以达到人家的32B的效果。我现在是32B的模型，我可以达到原来72B的效果。他等于做了很多这种错位的比较，我用更小的模型。

达到了以前必须用更大规模模型才可以达到的效果。当然，田忌赛马呢，也未必都是好事。为什么？因为很多人会对这种小参数模型抱有不切实际的期望。一堆人拿来说：“我拿这个8B的模型跑一跑试试，看看我去做一些很复杂的任务，到底效果怎么样？”肯定效果不好。千万不要认为你用8B的模型就可以跑出非常非常好的效果来，这个肯定还是有一些差距的。它可能会在某些特定的领域，或者经过一些微调和训练之后，可以达到32B的效果。

绝大部分人对大模型的认知都是停留在什么GPT-4O这个水平的。你要想拿8B的模型去跟这样的模型去比的话，没有任何可比性。那你说我使用这些32B的模型呢？就属于在大部分情况下可以接近GPT-4O这样的一个水平。咱不研究多模态那些东西，就是正常的内容生成，算是接近。至于说它的235B呢，现在距离Gemini 2.5 Pro还是有一些差距的。但是呢，相对于其他的模型来说，基本上算是跑在同一个基准线上了，不比别人差了。

Qwen3 235B-A22B的这个最大模型在数学、代码、Agent等方面都是全面超越了DeepSeek R1。部分场景呢，接近Gemini 2.5 Pro。这什么意思？就是全部的场景肯定离Gemini 2.5 Pro还是有一定的差距的，但是有一部分场景接近了。但在复杂语义理解，就特别复杂的情况下，还是有一些差距的。特别是一些复杂的逻辑分析，它是有问题的。真实使用的感受呢，算是能用。比起DeepSeek R1强吗？其实感觉不太出来，基本上可以达到DeepSeek R1的水平。

指令依存方面呢，肯定还有一点点欠缺。让他做一个很复杂的动作，他有的时候还是会丢三落四一些。这块我自己试过的，网上也有很多吐槽的人。第一个，复杂推理中的逻辑断层和幻觉生成的问题。所有推理模型身上都有这样的问题，Qwen3即使是最大的模型235B，在这块呢，也不比别人好多少。第二个呢，就是过度思考跟效率问题。有些人发现说：“我给他一个很复杂的问题，他自己开始进行推理了，推理来推理去，直接死在里头了，彻底推不出来了。”这种情况现在也还是存在的。

但是呢，也不用太着急。他既然可以进行后训练，可以进行微调，那我相信大家有各种问题去提就完了。Qwen应该会快速的微调出不同的版本出来的。多语言支持的不均衡，你说119种语言，那些小语种支持的肯定没有那么好，因为语料也没那么多嘛。但这一块你想让它提高支持的话。

也很简单，拿足够多的语料去微调就完了。他也是可以去支持的。然后还有一些伦理跟隐私方面的风险，因为它可以有非常非常小的模型。所以你可以把这种模型，比如部署在你们家洗衣机里，或者部署到一些很奇奇怪怪的这种角落里面。他的能力还很强。而且这种全开源的模型，还有一些人微调了以后，是可以把他的一些安全限制去掉的。这个就会比较吓人，所以大家对这块呢也有一些担心。

还有呢，就是模型对齐和偏好上面的一些问题。比如说吧，生成内容有时候会偏离用户的意图。它对一些指令的依从，还是会稍微差一些的。那么给出一个简单的结论吧，这到底是一次划时代的成功呢，还是翻车呢？我个人的感受呢，这又是一次划时代的胜利。

Qwen3真正在跟谁竞争？大家要想清楚：LLAMA 4、DeepSeek R1、Claude 3.7、Gemini 2.5、GROK3、GPT O3 O4这样的模型，到底在跟谁竞争？实际上真正去跟Qwen3竞争的只有一个，就是LLAMA4。其他的都不在同一个起跑线上。

LLAMA4呢，是翻车了。它怎么翻车的？第一个是数据造假，或者叫过拟合。拿直接去跑分的题目进行训练，这样跑分效果特别好，但是实际使用的效果差异巨大。这是LLAMA4翻车的一个最根源的原因。

咱们从另外一个角度上来讲，LLAMA4自己其实是有一些问题的。第一个是什么？就是它公开的模型太大，占资源很多，放弃了绝大多数的场景。他就开源了一个104B，一个400B的模型。普通人你拿他没办法，像我的电脑根本跑不起来。你就算部署到云端的话，它占资源也是占的非常多的。就对于这个经济性来说，一点优化都没做。你说我想在手机上跑，想在嵌入式设备上跑，没做这个准备，他就不惦记。甚至还有一个两T的模型，压根都没有发布出来。他就发布了一个109B，一个400B，其他都没有了。

而且这么大的模型，你想去微调那太痛苦了。就是你想微调一个模型，模型越小越好调。你模型越大的话，你调起来甭管是你的数据还是算力，都是非常巨大的成本。现在看的LLAMA，应该是准备走XAI这条路。

XAI是什么路？假开源。为什么马斯克的XAI叫假开源呢？就是我确实把东西开出来了。他承诺的是什么呢？就是我发布新版本，我就把旧版本开源。而且呢，开出来的东西，你要想调用的话，你也调不了。为什么？我只把那最大的模型出来，哐昌往那一扔就完了。各种的文档，各种东西都很少，你部署上去也不划算。

所以呢，我开源了吗？开了，东西也放这了。能用吗？没法使。你提任何问题、提任何要求，说哪给我改一东西，也没人理你。这就是XAi的玩法。

你要想调用这些东西怎么办？到我服务器上来调用XAI的API，这个是没问题的。我现在也在Grok的服务器上去调用它的API，效果也还可以。但是你说有没有第三方去部署Grok模型，然后让大家去调用呢？没有。因为你现在开源出来的版本低，它的效果没有那么好。你要想使用最新的，你只能在他的服务器上使。以后呢，Meta估计也要走这条路。

那你说为什么没有人骂XAi呢？原因很简单，因为XAi一直就这样。从x开放出来的这个推荐算法，开放出来以后，就再也没有更新过任何代码。你提的所有问题，连回复都没有人回复。XAi更新出来的Grok开源模型也是如此，开源出来啪往那一扔，彻底没人理你了。所以它一直这样。

而LLAMA呢，原来是比较开放的。现在大量的模型都是在LLAMA基础上做出来的，包括Qwen早期的模型，都是在LLAMA基础上做出来的。那现在呢，有点越来越回去了，所以有点怒其不争。大家要骂一骂他，看看能不能把他骂回来。

然后另外一个，LLAMA4被人骂的原因是什么？他不支持MCP。现在是一个做Agent的时代，你不支持MCP，你模型能力再强，你也搞不定各种场景。现在即使是你使用GBT 4O或者GBTO 3这样的模型，你没有一些外接的组件，你根本就跑不出结果来。所以你不支持MCP，这事肯定不行。

还有呢，就是LLAMA对用户是有限制的。LLAMA虽然是开源模型，但是呢，不能进行商业使用。你只能拿去做研究。你说我拿这东西做商业使用了，对不起，你会收到律师函的。而且如果你是一个大公司，月活用户数超过7亿的公司，你如果想使用LLAMA4或者LLAMA早期版本，你需要向Meta做单独的申请。申请通过了以后你才可以去使用，否则不让用，就做了很多限制。

这个反面典型讲完了，咱们讲一讲Qwen3跟LLAMA4比较起来是怎么样的。Qwen3完全开源，你爱干嘛干嘛去，想怎么调怎么调。第二个，体积小，参数少，规格全，性能高。从0.6B就开始，所有的都给你发一遍，爱用哪个版本用哪个版本。这些小体积的模型，经过微调之后应该会一统江湖。

什么意思？就是现在在hugging face上，绝大部分的模型都是拿Qwen2.5、Qwen2这些各个尺寸的模型调出来的。

早期的LLAMA还是各个尺寸都有的。现在到LLAMA4，前面那些小的模型就不出了。Qwen3又把所有的模型都出了一遍，那大家就拿来微调呗。你说哪块不满意，我就专门把它调一调，训练一下上去使不就完事了吗？所以一定会一统江湖的。

而且，Qwen3是原生支持MCP的。我在本地部署了OLAMA 8B的模型，使用Cherry studio测试了一下，支持没有任何问题。但是呢，支持的并不是那么顺畅。30B和32B的模型我在本地也装了，完美支持MCP，没有任何问题。

那你说什么叫支持的不顺畅？什么叫支持的顺畅呢？在这跟大家讲一讲使用MCP的过程。其实很简单，MCP也是描述一下工具，说我这有一工具，这工具叫什么什么名字，输入的参数是什么，输出的参数是什么，能干什么。大概是有这样的一个描述文件，你把这描述文件给到大模型以后呢，大模型会根据你提出的要求，来生成一个调用这个工具接口的代码。

这个8B的模型呢，有时候生成的代码会有点小错误，导致呢调用失败。那调用失败了以后呢，他会换一个方式，再调另外一个接口，然后会得出一个需要的结果出来。你使用32B模型，或者30B的Qwen3模型的话，你把一大堆的描述扔给他以后，他就会正确的找到需要使用的接口，需要使用的工具，然后生成调用代码直接调。调完了以后得到结果，需要再调用的话，还可以在一次推理里头多次调用，然后得到结果。

因为我是放的高德地图的MCP进去，说来给我规划一个旅游路线，这个效果好极了。完完全全在本地，当然高德地图那个服务器不在本地。其他的，他的Qwen3，OLAMA，Cherry studio都是在本地跑起来了，所以这块效果好极了。

现在呢是大模型密集发布的一个周期。前面我们看到了Gemini 2.5 Pro，Gemini 2.5 Flash，GPT也在快速的连续发布。后边还会很快看到一些新东西，包括马斯克下周要发布的Grok 3.5。Qwen3出来以后，如果有哪些方面超越了它，那它是肯定是要更新的嘛。GPT5应该也快了，这就是这样的一个风起云涌的大时代。

好，总结一下吧。Agent时代一定要有一个对Agent友好的模型发布出来，才会被大家叫好，才算是一次成功的发布。体积小，参数少，规格全，性能高，只要可用性不退步，方便微调，这些特性都具备的话，再加上前面的MCP的功能，Qwen3绝对是一次划时代的成功。好，这就是今天讲的故事。

大家赶快去玩耍起来！好，感谢大家收听。请帮忙点赞，点小铃铛。参加DISCORD讨论群。也欢迎有兴趣、有能力的朋友加入我们的付费频道。再见！

马斯克的超级APP梦：微信式生态系统能否在西方成功复刻？

老范讲故事 — Mon, 20 Jan 2025 01:39:19 +0000

马斯克到底能不能做出超级APP呢？大家好，欢迎收听老范讲故事的YouTube频道。咱们呢还是从马斯克的推文开始。如果你是一名资深软件工程师，并且想要打造一款超级应用程序，请你将最出色的作品发送到code@X.com，加入我们。而且呢，后面还写着说，我不管你是不是在学校上过学，是在什么学校上过学，或者是不是有这种大厂工作经验，只要你的代码写得好，就来找我们。

这个里边呢讲到了两点。第一点呢就是说不计出身，只招程序写得好的。第二点呢，其实是讲的他要做超级APP。马斯克理解什么是超级APP吗？他用的英文呢，叫everything APP，或者叫全场景APP。在中文翻译的时候呢，就把这个东西翻译成了超级APP，这是豆包翻的，估计豆包也是有同样的野心。

那马斯克呢，也曾经在收购推特的时候表示过，说我很喜欢微信，微信呢可以做所有的事情。它既是即时通讯软件，又可以做社交社区、电商、视频、支付，所有应用和游戏的入口都可以在微信里做。所以看吧，叫everything APP，超级APP。现在有哪些超级APP呢？咱们既然讲超级APP，咱们先数数呗，中国的超级APP，微信、抖音，所有事情都做不一定，但是绝大部分事情呢，抖音跟微信都是可以做的。

主要还是看用户量和用户使用时长，因为我们经常讲的一句话，叫高频打低频，就是两个APP进行竞争的时候，高频使用的APP是可以绝对碾压性地干掉低频使用APP的。所以超级APP必须是高频应用。你说我是不是场景必须全，是不是everything APP这个事情呢？最好是，但是也没有那么绝对。不过如果你是个低频APP，那你就不要讲了。

还有一些准超级APP，没有达到超级APP，就是微信跟抖音这样的程度，但也在向这个方向努力发展。这个里头有滴滴、美团、淘宝。为什么说他们叫准超级APP呢？不够高频，就这么简单的一个事情。你像高频打低频，咱们举一个案例，抖音总惦记美团盘子里那点事。

说我也要做外卖，我也要去送餐，我也要去做团购。抖音其实失败过很多次，每过一段时间我又来了，过一段时间我走了，做不过你，然后又过一段时间我又来了。为什么呢？他抖音可以这么干，因为抖音是高频应用。他只要守住基本盘，就随时可以说：“哎，我又杀回来了。”我在你这块低频应用的原来的应用场景里边，我去搅和一下。搅和完了以后说：“嗯，好像不是很好搞，我回去了，我不玩了。”这就是高频打低频的打法。

抖音天天在美团那捣乱，美团拿他也没有什么办法。但是美团想要在这个基础上去搞高频挺难的。美团也在做短视频，也在做直播，但是你想去跟抖音抢用户，抢用户时长，非常非常难。滴滴、美团跟淘宝现在都是这样，就是频度不够高，但是功能性很全。

美国有没有超级APP呢？其实严格意义上讲，美国是没有超级APP的。为什么呢？美国的应用要么是高频应用，但是使用的场景非常少，要不然就是使用场景虽然高，但频度不够高。美国呢，有一些准超级APP，比如说Facebook家族。为什么这么讲呢？Facebook的这么多软件里头，每一个使用频度都很高，但是他们的场景相互不覆盖。他有Facebook，有Instagram，有WhatsApp，还有Facebook message，一大堆其他的乱七八糟软件。大家都在这儿，你一榔头，我一棒槌的在这儿折腾。它不像微信似的，只有统一的一个入口。你进到微信里头以后，你就再也不出来了。

所以你说Facebook，它的用户使用时长、用户量很大呀，它也是一个非常高频的应用。但是它的整个的“everything APP”这件事做得不够好，就是各自干各自。然后TikTok在美国呢算是一个准超级APP，就是它还是跟美国政府之间折腾。如果不折腾的话，其实是超级APP了。它的用户时长很高，用户的场景也相对来说比较完善，但是比国内的抖音还是要差一点点，它的电商还有整个的内容生态。

这还有待发展。等他发展起来以后，就算是超级APP了。然后Uber，Uber的话其实是滴滴跟美团的结合。它不光是打车的，它还有Uber Eat，还可以送餐。所以它呢，功能性很强，但是呢，它的频度不够高。你不会说我既不打车也不点餐的时候，我每天拿个5本在这刷来刷去的。所以它是个低频应用。

还有呢，像YouTube，YouTube它的频度很高，用户使用时长，用户量都非常大。但是呢，它的使用场景太单一。他也想去做直播带货，但是这块没做起来；也想去做电商，这块也没做起来。YouTube呢，也在努力的向超级APP的方向前进。

还有一个就是X，也就是马斯克手下的这个原来的Twitter。它呢，频度也不够高，应用场景也不够广，或者说应用场景再努力的搭建，但是还是深度差一些。待会儿我们再去详细的讲X。马斯克现在就是想把X变成一个超级APP，变成像微信那样的东西。

那么咱们给超级APP下一个简单的定义吧。第一个，一定是高频应用；第二个，场景尽可能的完整。初始的场景，甭管是社交，像Facebook、Twitter、微信这样的，或者是娱乐场景为初始场景的抖音、TikTok，或者是一些功能性的初始场景，比如滴滴、Uber、美团、淘宝，这都属于是功能性场景。他们一定是从这些初始场景开始，然后尝试横向拓展，逐步发展出全领域全场景的这种应用。

微信也不是一开始就是这样，微信一开始只是一个即时通讯工具，它连社交的功能都不是那么强。Facebook最开始就是一个社交软件，它的什么即时通讯什么，都是后来加进去的。在初始场景基础上，比如说美团说：“我是不是也去做个打车呀？”Uber说：“我是不是做个送餐？”抖音说：“那我是不是也去送餐，或者我去做个电商？”微信说：“我从这个即时通讯，我去做个社交，我去做个游戏，我去做一个内容分享的社区，然后我再去做一个短视频，我再去做一个视频号，再去做个直播，再去做电商。”反正我把所有东西都做完了。所以他一定是从初始场景开始。

然后横向拓展，在超级APP里头，还有一个很奇葩的特性，刚才没有讲到的是什么，就是内部生态系统要逐渐完善，并形成飞轮效应。

什么叫内部生态系统？比如说，一帮写公众号的人，完完全全是生活在微信平台上的。这帮人就是写公众号、做小程序的。这些人可以去上市，可以形成一套自己的产业链。抖音上一帮MCN机构，他们也可以去上市了，也可以把公司做得很大，甚至那个生态链还很长。我这边做MCN的，那边还有供应链系统，还有各种广告平台。而这个是可以让整个的超级APP生态系统稳定、健康地运转下去的一个方式。

怎么讲这个事呢？我记得我们小时候生物课讲过，一个生态系统里面食物链的环节越长，它就越稳定。如果这个生态系统里头只有一节，就是狼吃羊，羊吃草，这个就非常非常危险，因为你中间稍微有一点闪失，这个系统就会崩溃。但是如果它是一个非常长的生态链，即使中间某些环节出现问题，其他环节也会尝试把整个生态链重新修复起来，所以它会稳定很多。

所以注意，超级APP里的最后一个特性是要有内部的生态系统。那么超级APP到底是怎么产生的呢？技术是不是很重要呢？因为这一次马斯克说来，你们代码写得好的人把代码送上来，我还挑些人，咱们去做抄袭APP了。这件事到底有多重要呢？还是有一定重要性的，特别是一些特殊新场景的满足和创造，这个过程是需要技术人员进去的，而且需要非常强的技术人员加入，只有这样才能做出来。

但是如果你就是说，别人已经做好了东西，我就在这个基础上跟人家去拼一下执行力。那么在这种事情上，超级程序员其实，或者说很强的程序员，作用不是那么大，就是比较一般了。真正超级APP产生，是需要天时地利人和的。天时其实是最重要的。

什么是天时？就是新场景要产生。甭管是抖音还是微信，都是有新场景。有人说了，抖音这个新场景我们能够理解，短视频原来没有这个场景，现在有这个场景了，特别是4G普及以后，大家需要在手机上去看视频了。

这个场景原来没有。那么微信难道是个新场景吗？不就是大家聊天嘛，IM嘛，就是即时通讯工具嘛。原来有QQ，甚至有手Q手机QQ，那为什么一定要有个微信呢？这到底是一个什么样的新场景？跟大家讲一下，应该是2010年、2011年的时候，大家发现说在手机上，大家沟通交流的方式是不一样的。不再像PC上我们使用QQ或者OICQ，或者微软的MSN，或者Skype这样的工具去交流了。我们要在手机上交流，我们要使用手机号码，或者使用这个手机通讯录直接去联系，像发短信一样去沟通。

当时的一个最典型的应用是WhatsApp。这个东西一出来以后，大家说：“哦，原来有一个新场景。”大家到了手机上以后，特别是以前很多从来没有用过电脑的人，他们需要一个新的沟通方式。他们不需要像电脑上似的，我把整个的通讯录都自己管起来，然后还起上昵称，搞得那么复杂，搞得这么麻烦的一种通讯，不要了。咱们要简单。

所以当时呢，很多人就都去抄袭WhatsApp。国内呢，比如说像米聊，还有几个什么CCTALK，我忘了名字了，就还有几个。微信不是第一个出来的，微信是后来者。确实是有一个时间点说，有个新场景原来没有，现在出现了，原来没有被满足，现在被满足了。一一定要这样的一个天时，这是产生超级APP最重要的一个因素。

然后第二件事是什么呢？第二件事是地利。地利是什么呢？每一个封闭的市场里面，超级APP都可以诞生一次。比如说美国有WhatsApp，有Facebook Messenger，中国就有微信。如果中国彻底放开了，说：“哎，我们就直接使吧。”那中国没准WhatsApp也一统天下了，那就没有微信啥事了。像我们以前专门投资出海项目，我们讲的是什么？每一个封闭场景里头，这个机会都有一次，你都可以再试一回，这个是地利的问题。

第三个是人和。人和呢，就是超级APP的建立一定是巨大资源，特别是人力，巨大的人力投入，这个事你是少不了的。像马斯克这种。

把8,000人的推特裁到1,500，你要想再把这个超级APP做出来，8,000人都不够使。我告诉你，不是说靠个一两千人，或者两三千人，就可以做出超级APP来了。咱不光是说你有多少用户，Twitter可能有多少亿用户，TikTok有多少亿用户，跟这也没关系。就是你自己的员工数必须得上去，而且一定是上万人的员工，否则你做不出来。

你说为什么呀？字节那手里头抖音超级APP，TikTok超级APP，他这玩意咋做出来的？咱不说他有多少工程师，多少运维，你知道字节跳动有多少销售吗？好几万销售。这东西如果没有的话，刚才咱们讲的全生态全场景，内部形成生态系统自循环，这玩意哪来的呀？这都是需要靠人把它搭建起来，需要靠人去销售的呀。

你到XAI上，你去注册他们的账号，或者是你去下载一个XAI的Grok APP，回来你看看XAI或者Twitter会不会给你打电话。如果你是去下载了Lark，或者是下载了飞书，24小时之内电话打到你手机上，这个非常非常快。我那次在日本，我的一个朋友当场下载了这个Lark，大概十几个小时不到，10个小时不到吧，电话就打进来了，用日语打进来说：“哎，我发现您下载了我们的软件，您准备怎么用？”这玩意你没有足够大的销售团队，你搞得定吗？搞不定的。

你像我现在注册了豆包大模型的这个API，每个礼拜给我打电话说：“哎，您好，那个我发现您注册了，您使的怎么样？有什么意见没有？您希望怎么去修改？您在什么样的场景下用？您觉得我们还需要做哪些的变化？”你以为马斯克能够招出这么多的销售团队来干这个事吗？他应该从来没干过。他从做特斯拉，再做SpaceX，再包括前面卖掉那几个公司，再到现在做推特，他从来没有做过这种销售和运营密集性的项目。所以这个呢还是有一点点难度的。

那么真正造就超级APP的东西到底是什么？刚才我们说了技术也重要，但没有那么重要。但是真正造就它的到底是什么呢？其实说白了，贪婪。

要特别特别贪婪才能做出超级APP来。这个事是很难的，不是说一个道德很高尚的人说：“我可以哪一件事都可以放弃一点，有钱大家赚。”这样的人他做不出超级APP来的。一定要记住这句话：超级APP一定是不断的扩张，只要看着有能够挣钱的场景，都要上去蹭一下。

基本场景奠定之后，要不断地去拓展内部生态，建立和培育发展。这些都是需要靠极其贪婪的运营方式和运营手段，才有可能出得来的。而且呢，即使屡战屡败，也要屡败屡战，才要这样来去做这个事情。

为什么这么讲？就还记得刚才我讲的那个抖音侵蚀美团的故事吗？就是我上来了，我失败了，再过几天我又来了，我又失败了。他反而只要基本盘在，大家还在这刷短视频呢，那我就随时可以看好任何一块我喜欢的或者挣钱的场景，冲进去搅和一下。甭管是搅屎棍也好，还是怎么样也好，这次没搅和明白，没关系，过两天我再来。这是做超级APP的方式。

那马斯克的X到底能不能成为超级APP呢？咱们先看看X的现状。它的用户跟时长呢，属于勉强合格，但是还有待增长。什么意思？X上面的用户量其实是够的，包括它上面的内容，图文内容和视频内容是够的。但是呢，X这个产品的用户使用时长不够。像我每天可能更多的时间是给抖音、给YouTube，包括给头条，我都会分配一些时间，还有小红书。X我也每天会上，但是分配的时长相对来说是比较短的。

而马斯克本人呢，也不希望用户在他的X上停太长的时间。他说：“你来了，看一下，处理完了就走呗。”他在这点上，我觉得是受了谷歌的毒害，因为谷歌就属于是用户量巨大，功能也非常强大，但是它时长很短。YouTube的时长很长，谷歌搜索的时长非常短。他们希望你能够快速找到你要的东西。如果你在谷歌的页面上停留的时长太长，只说明一个问题：就是谷歌没有把最正确的答案给你。这对于他们来说是服务失败了。

马斯克也觉得：“我这个是不是应该也这么干？”这块呢还要看，因为马斯克至少口头上是这样表达的。

微信呢，张小龙也说过，我们不要让用户停在微信上，要尽量让他们出去。这个话呢，他说可以这么说，但是咱们自己想一想，特别是国内的朋友们，你每天用多少个小时微信？现在X上的已经有的场景是什么？社交其实已经有了，图文短视频也都在了。聊天室就现在可以在X上开space，在里边一堆人凑着聊天。就这几个场景，相对来说用的算多一些的。

需要补足的部分是什么呢？就是直播。X场现在是有直播了，但是它整个的直播体验是非常非常差的，比这个YouTube要差非常远，更不要说跟抖音这种妖怪来比啦。然后订阅这件事呢，X上也有，但是我现在呢，X上的关注数还比较少，没有用到这个东西。我现在X上大概2.9万，大概差个几十个到3万，始终就到不了了。我现在也对X基本上失去耐心了。

但是到底有多少人在X上靠订阅这件事挣到钱了？我到现在还没有看到谁出来说。就算是有人挣到钱了，其实收入呢也是非常非常少的，并没有得到他影响力所对应的这个钱，这块所以有待加强。然后是广告，X上一直都有广告，但是我的X广告收入好像有半年没来了。就来的时候呢，估计也就是个10块20块的。我估计他应该是够20美金发一次，反正我的X的阅读量比较小，所以这一块一直都没有什么收益。

你像我所有的这个信息都是在X上发，在YouTube上发，我YouTube上就可以每个月都有收益，但X上可能多少个月都不会有一次收益，所以这块呢还是差比较远。另外，马斯克准备去推音视频通话，我还没有试过他们家的音视频通话。马斯克甚至说：“哎，我要把我的手机号注销掉，我以后不要手机号，我就使用X的音视频通话，我们就把用户都留在这就完事了。”这一块呢，我觉得用户行为习惯还需要调整。

我们很习惯在微信里边的音视频通话，现在我太太也好，包括我儿子也好，他们给别人打电话，都不是拿起电话号码来打，都是在微信里找到，直接微信语音了。就是微信对这个手机运营商的侵袭已经完成了。

我自己的话，也经常是WhatsApp、Telegram或者是Discord直接跟人语音通话或者是视频通话，这个做的也是蛮多的。他们不但是把移动运营商的市场吃掉了，还把一大块的视频会议软件的市场吃掉了。如果你人多了，你去开Zoom或者是开Google Meet；如果人少的话，直接拎起来WhatsApp，就直接跟人聊不就完事了嘛。

这块呢，马斯克也还有待增强。那么，欠缺的场景是什么呢？电商没有支付，据说马斯克想做，甚至有可能是跟区块链或者是加密货币相关的一些支付准备放进去，但是现在还没做。出行他现在没碰，快递现在没做，这个我觉得对于马斯克来说，还是有一点难度的。然后，团购现在也还没有做。

至于他的API平台接口这块的话，也完完全全没有起来。为什么要专门强调这个呢？甭管是微信也好、YouTube也好，还是抖音也好，这样的大平台后边是有一个巨大的，第一个是数据分析平台，或者说叫管理后台，这个是要有的。然后另外的话，是有非常丰富的API接口，可以让这些在上面形成自己生态的厂家在里边去做定制开发。在这块呢，X上基本上还没做。他的统计分析的接口也非常非常的简陋，不能说简单了，就是简陋。他的API这一块呢，也还没有做起来，所以整个这些都还差得比较远。

而这个缺失的场景里头，有一些呢在特斯拉里边在干。什么呢？出行，他准备上Cybercab或者叫robotaxing，在特斯拉里边，它是可以打通出行的。如果X起来以后，说我这个做超级APP了，everything APP了，它可以把特斯拉的出行挂在里头。既然你已经可以出行了，是不是送个外卖也没啥毛病？特斯拉这车里给我做一擎天柱，到那最后把外卖给我放上去，或者把快递给我送上去。团购既然Uber可以做Uber Eats，那特斯拉的这个运营起来，是不是也可以把美食给我送回家去？所以他有几块呢，是有机会起来的。至于电商支付这一块的话……

反正，马斯克呢，电商没有说过，支付他肯定是说过他要做的。这几块还是会逐步起来。至于内部生态的话，现在完全没起来，因为我们也会去问这些MCN机构，或者做各种内容分发的机构。你比如说，推特上，或者叫X上，有这个订阅功能，付费订阅。那么是不是就可以把国内这帮做微信公众号的团队吸引过去，让他们把大量的内容发上去？他们没有什么兴趣，为什么？挣钱挣太少，不够折腾的呢？一定是说你挣到的钱，要跟他付出的劳动、付出的成本要能够相匹配。这一块现在这个土壤还不成熟。

至于说算法，马斯克要去做超级VP，招最强程序员。算法在这里头到底起什么作用？呵呵，这个里头呢，其实稍微有一点点小尴尬。不是说算法不起作用，而是什么呢？算法要随着每一块功能的附加，不断地调整。你比如说，抖音一开始呢，是让大号可以被人看到，我们需要更多的用户，所以我们一定要把最吸引用户的东西推荐出去。然后呢，我们要慢慢地分散这些流量，让很多新的东西可以被看到，让每一个新进入抖音的人都可以分配到流量。

再往后呢，说：“哎，我要开始卖东西了。”我要把更多的流量分配给这些卖东西的人，分配给这些电商直播，或者直播带货的这些直播间。然后我们再要把这些流量分给GMV高的项目，或者是下单频次高的项目，要这样来去，不断地调整他的流量分配方式。而这个是算法在里边起到的作用。有作用，但是呢，刚才听明白我讲的内容了没有？算法是听运维的，他们需要做运维的工具，然后能够让运维在里边快速灵活地去调整，而且可以很清晰地去检查我调整的效果到底是怎么样。这个是算法工程师在里边要干的事情。

所以甭管是抖音也好，TikTok也好，还是微信也好，是有巨大的工程师团队。真正的超级程序员其实没几个，大量的人在里边，其实是做各种工具、平台、产品，或者我们叫control panel，叫控制台。一大堆人在这干这个的。这些人，你说真的需要这种天才程序员吗？这个咱们存疑。而且这个里边大量的事情呢。

根本就不是程序员来搞定的。他是靠什么？他是靠这个运维人员、销售来搞定的。在超级APP诞生的过程中，东西方是有明显差异的。西方超级APP，我们叫Facebook全家桶吧，这种东西呢，它首先是技术比较领先。在很长的一段时间里头，也没有什么人去做这一块。他就七差咔嚓开始做起来了。然后呢，他们喜欢做这种叫自助服务系统。

什么叫自助服务系统？你像亚马逊的云，就是个自助服务系统。你要登到他的这个平台上去，自己去申请，自己去交钱，自己去把需要的各种模块确认下来，然后让他执行起来。这就是亚马逊云的一个工作方式。我到YouTube来发视频，我也要到YouTube后台 studio.YouTube.com 这样的一个网站上去，自己去设置好，说我的频道叫什么名字，首页上应该看哪些视频，应该画什么背景图，然后几点几点放什么视频上去。这叫自助服务。这是西方做超级APP的人特别喜欢干的事情。

然后呢，他们全球运营，这件事呢，其实现在国内的应用也开始去做全球运营了。再往后一个事情，就是东西方差异最大的。西方团队呢喜欢叫耐心积累，我要稍微等一等。像Facebook这样的公司，包括像Twitter这样的公司，都是需要漫长的时间，逐渐地积攒用户、积攒口碑，再去逐渐地成为超级APP。东方呢叫技术可用，咱们就别讲领先的事情了，至少可用。可能西方已经做出样板来了，咱只要照着去执行就完了。

然后巨大的销售和运营团队，靠人上去，堆人海上去，绝没有说1,500人就可以把东西搞定的，开什么玩笑呢？现在TikTok的成功、Temu的成功、Shein的成功，包括这一次小红书的成功，让更多的国内的这些运营平台看到了，说哎，我们也可以去。哪怕像小红书这样，在图标上就写了三个中国字，进去了以后还全是中文界面，老外也上去玩去了，没什么问题。所以现在更多的中国超级APP平台会出海。最后一个差异，老外是耐心积累嘛，中国人喜欢叫疯狂买量，直接冲上去。

把这个Facebook的流量狠狠地投一把，把谷歌的流量狠狠地投一把。到苹果那，赶快，我要投广告。这个是中国人喜欢干的，而西方人在这一块差得比较远。他们不会这么疯狂地进行广告投放，甚至我们投放的时候，可以完完全全亏钱投放。西方在这一块的话，还是差得非常非常远的，或者说不同的路径吧。

最终呢，做一个结论吧。马斯克想要把X变成超级APP，或者叫everything APP，这件事呢，非常困难。为什么呢？它的场景基本上已经固定了。想要再向其他的场景去拓展的话，它的这个用户使用频度不够高。你再想去侵蚀和拓展其他的这种领域，就会难一些。

像现在马斯克在很多领域里做的尝试呢，也都是浅尝即止。因为你再往前走，需要的东西，不知道马斯克是不是愿意投入。需要什么？大量的人员。你可能整个几万人的公司挂在这，再整一个巨大的投放预算放在这。这个事情马斯克愿不愿意投，这个不好说。

因为以中国人的经验来看，你不投入几万人，甚至是十几万人的这种研发、运维和销售团队的话，你就做不出超级APP了。你每年不去投个可能几十亿美金的广告投放，你的超级APP就没有人用。这个事情就是中国人的路径依赖。

但你说马斯克最后能不能另辟蹊径，靠这个最强的技术，摸索出新的场景来，逐渐做出新的超级APP来，这件事呢，我觉得还是可以有一定期待的。毕竟他是马斯克，我们只是坐在这吃瓜的群众。如果我坐在这一拍胸脯说：“哎，以我的经验他没戏”，这个呢就有点太狂妄了。

希望马斯克在打造超级APP的路上呢，做更多的尝试。他只要敢试，中国团队就敢抄。抄完了以后再加上大力出奇迹，哈，甭管是人力的还是财力的。我觉得没准他的很多实验，会在中国的某些APP上，最后发光发亮。哈哈，这个是今天讲的故事，马斯克的超级APP到底能不能做出来。好，这期就讲到这里。感谢大家收听，请帮忙点赞，点小铃铛，参加Discord讨论群。也欢迎有兴趣、有能力的朋友加入我们的付费频道，再见。

雷军千万年薪挖AI天才少女，到底值不值？

Luke Fan — Mon, 06 Jan 2025 00:44:28 +0000

雷军千万年薪挖回来的AI萝莉，到底值不值呢？大家好，欢迎收听老范讲故事的YouTube频道。今天咱们来讲一讲，雷军花了千万年薪挖回来的天才少女，到底价值几何的故事。

首先，这个消息并不是小米官方放出来的，而是证券时报等一大堆媒体报道出来的。报道出了这样的一个故事之后，肯定就会被舆论热炒。第一个，AI现在肯定是全村最靓的仔，跟AI相关的事情更容易被媒体所报道。第二个，小米跟雷军本身就是顶流，任何事情只要沾着小米，沾着雷军了，都会被过度的炒作。

现在这位AI天才少女叫罗福莉，号称是雷军亲自下场捞的人。这个事情到底有多亲自呢？不好说。很多记者也去找小米核实，问有没有这么个事情，是不是有千万年薪，雷军到底是怎么谈的这个事情呢？目前为止，小米没有给出官方确认。但是，如果千万年薪是真的，那这个事雷军必须是要签字确认的。如果不签字的话，这样高的薪水是开不出来的。

这是一方面，另外一方面，Deepseek V3也是现在的顶流。新的模型出来以后，包括美国很多AIGC圈的老大，都给出了很高的评价。国内一定是说，哎呀，你看我们做出来的东西被别人夸奖好了，这个事情我们与有荣焉一下。这位天才少女从Deepseek这边出来的，也成为了整个事件炒作中的一个推手。1,000万年薪，加上小米最近在宣传的万卡集群，也算是这个事件能够不断在热搜上停留的催化剂。

而且前几天超级小爱演示的翻车，你也需要一些AI相关的新闻出来中和一下吧。所以这个事情被舆论热炒了。小米官方刚才我们讲了，并没有正式的回应这件事情，原因也很简单。第一个是薪资，在小米这样的公司里边，她应该是保密的。如果有谁把这个薪资泄露了，肯定还是要受到一定处罚的。第二个，这个人如果真的去了，炒的太热了是没法干活的。这个人就是千万年薪的AI萝莉，那剩下的这些没挣到1千万的人，你咋跟她一块配合干活嘛？中国人向来都不是喜欢。

把薪资贴在脑门上的，而且有些人说呀，说你能干啥呀？就雷军亲自去请你，我不服气，她会有这样的事情。所以这个人就算是真的去了小米了，为了未来能够干活，为了能够跟团队合作。所以小米估计在回应的时候，也会相对比较谨慎。

记得当年遇到过一个擦桌子故事。什么呢？就是我原来是清华同方的员工。有一次清华同方的一位，应该叫事业部经理吧，说：“哎，我为咱们事业部找了一个销售大牛回来，这个人可厉害了。”这位事业部经理在入职之前，就跑去把人桌子给擦了一遍。

清华同方呢，有一点跟其他地方不太一样。什么呢？就是这帮事业部经理在当时，97年98年的时候，都是清华大学里边的老师，很多是系里边的比较大的老师，一些教授，一些副教授，在当事业部经理。然后她下边的很多员工呢，是她的学生。所以这帮学生一看，哎，这个老师到底是怎么回事呢？招了一个什么神奇的人回来？来之前你还把人桌子擦了。我们跟着你坐了这么多年，也没看你给谁擦过桌子呀。

这个人进来，我们一定要好好称量称量她。这哥们入职了以后呢，大概没两个月就离职了。甭管她自己的能力怎么样，你进来了以后，所有人都要看看你说：“哎，这个老师给你擦过桌子，你到底是个什么样的人？”所以这样的人这么高调加入团队以后，相对来说是比较难以去开展工作的。

那么罗福莉到底是何许人也呢？从网上公开的信息来看，95后小镇做题家，她是四川宜宾市第一中学清北班毕业的。就在这样的学校里头，专门会有这种尖子班，她们叫清北班。然后呢，去了北师大计算机系上大学，算是第一次接触电脑，以前没接触过，所以呢，一开始成绩并不好。

大三呢，去了北大语言计算实验室实习，三个月自学Python，选择了NLP方向。NLP叫自然语言处理，就是向语言学的方向，或者计算语言学的方向转移了。开始呢，在别人的论文上署名了，就别人写的论文上头，已经开始有她名字了，这时候还没有大学毕业呢。然后保研到了北大，在北大的语言计算实验室里边。

继续深造。2019年，在ACL大会上发表了8篇文章，这个大会叫国际计算语言学年会，简称ACL。其中有两篇是第一作者，剩下的算第二作者。第一作者的文章中，第一个是《在文本和语音中检测隐藏信息》。意思是什么呢？就是说，如果我们的语音具备某些特征的时候，这个人可能在信息里边隐藏了一些东西。比如说在隐瞒信息的时候，讲话者的最大音高强度和语速增加，而讲话持续时间减少。这些特征与欺骗检测研究中的发现相似。如果你突然声音变大了，语言变短了，就有可能在骗人。

如果是语言特征，前面是语音特征，后边是语言特征的话，隐瞒信息的文本中，认知过程词汇，比如说“我认为怎么怎么样”、确定性词汇和正面情感词汇的使用频率更高。这表明隐藏信息可能增加认知负荷，同时伴随着更高的自信水平。这个有点像《Lie to Me》，谁说谎了是不是？这是一篇。

另外一篇是《将AMR解析视为序列到图的转换》。这个AMR的意思是抽象意义表示有向无环图。什么意思呢？就是我们说了一句话以后，在计算机要去处理之前，要把整个这句话变成一个有向无环图。什么叫有向无环图？就是她有方向，从前到后；而无环呢，就是她最后不是循环的，是这样的一个顺序的，由点和线连接出来的一个图，有这个正确的方向，但不能循环。她做的这个论文是在这种有向无环图上进行一些数学变化，变化了以后可以进行进一步的训练或者进行进一步的识别，而且在识别率上会有一些变化。这就是她作为第一作者的两篇论文。

研究生期间，总共发表了20多篇论文。看来这个北大还是很厉害的。2021年毕业后，加入了阿里达摩院。当时，她还写了一个公众号，告诉大家要选择有科研也有业务的公司。如果选择这种完全没有科研的公司，只做业务的，那么大概率只会去做一些边缘业务，这是没有办法在科研领域里继续深造的。所以，她当时在一堆的顶流offer里，挑中了阿里达摩院。

觉得这边还是可以做一些科研的。2022年呢，这就是在阿里达摩院里头待了一年，跳槽去了换方量化。据说呢，也是在这一年里头领证结婚，夫妻两个在杭州还买了房。幻方呢，在2023年分拆深度求索，也就是开始做Deepseek的这个公司。那么这位罗福莉呢，也就跟着去了深度求索。罗福莉在Deepseek Coder这个论文上作为第六作者，也是署名的。幻方以及深度求索，其实发的各种文章还是很多的。而且呢，她们会很大方的将所有贡献者都写在作者名单里头，或者叫贡献者名单里头。

比如说最近大火的Deepseek V3里边儿，大概是有200个贡献者。这200个贡献者呢，有150个是工程师，还有一些其他的支持人员，还包括10名已经离职的人员。罗福莉的名字呢，是在为Deepseek V3做贡献的已经离职人员这个里面还是有的。号称呢，她是参与了Deepseek V2版本的开发。当然了，这些都是大家的描述，具体在里边参与了什么，其实并没有表述。

2024年年底跳槽去了小米，这就是她整个的一个履历。那么下面我们就要去看千万年薪到底值不值的问题了。其实挖技术大牛回来，我们到底应该如何评价其价值呢？这个一直是很多的投资人，包括一些大老板需要去思考的问题。你挖回来以后是给钱呀，给期权呀，然后给她各种的资源呀，还是给她一个大的团队，一个很好的研发环境，你到底给她什么，这都是我们要先对人的价值进行评估的一个过程。

在挖人回来的时候，科研能力到底重不重要？如果这是一个科研院所，我们需要再去国家申请经费，再去做一些更新的科研研发的时候，那她的科研能力可能是重要的。但是对于小米这样的一个产品型的公司来说，这个挖回来的人科研能力到底有多大，其实没有那么重要。那么这种技术带头人呢，她们需要的能力是什么？第一是对前沿的理解和认知。你真挖一个人回来，说这个最前沿的东西是什么，我说不清楚，我看不懂，谁在搞这个事我不知道。

这个事是不允许的。而且这种认知呢，是真的可以去跟最前沿研究的人进行面对面的沟通和讨论的。我们也见过很多，比如说像猎头公司这些人，对这个最前沿的发展也是有一定认知的。但是呢，她一旦是跟前沿的这些人去沟通的时候，就会露馅。像罗福莉在这块应该还是可以的。

工程技术能力呢，这块要看你具体要她干什么。你比如说，有些人说：“我真的是需要有一个人回来替我解决一个很难的难题。”那么在这个时候呢，就需要有工程技术能力的人回来。她能够管理团队、能够面试团队，甚至能够挖角原来的团队，可以带出一个团队出来，这个是工程技术能力，还有人脉资源。

但是人脉资源呢，一方面是说你能不能忽悠起一帮人来跟你干活，另外一方面的话，就是你做出来的产品是不是可以让顶流的圈子快速去认可。因为任何人，只要做出这种高精尖的东西来，她的这种认可的速度或者认可的成本都是挺高的。认可的速度都不会那么快，但一旦是有一个自己人，大家都已经熟悉了，你就是这圈子的人，你也做出过相应的成绩来。那你说：“我继续在发表相应的论文或者发表相应的成果。”那么别人就会优先选择相信你，所以这也是人脉的一个很重要的点。

最后呢，就是她的IP价值，这个人是不是有一定的影响力。通过这几个方面来评估一个技术大牛的价值。从能够公开找到的信息呢，其实没有办法去评定罗福莉具体都做过些什么东西。这个事现在发出来的信息比较少，不是写了什么论文就会什么东西。刚才我们说了她写了哪些论文，我们认为说她就会这几样东西，这个事一定是非常片面的。她可能研究的涉猎非常广泛，而且最前沿的很多科学与技术其实是相通的。只是可能这几个点，它是适合出来写论文的，剩下的点呢，虽然不适合出来写论文，但你要在Deepseek这样的参与到里边去，你还是要去解决或者还是要去做事情的。所以呢，并不能认为说她就会这个自然语言的这点东西。

罗福莉呢，应该还是一个语言学方面的研究型人才。罗福莉的价值到底应该如何去评价呢？第一个，它的IP价值呢，现在还算是拉满了。为什么叫还算是拉满呢？因为有的时候，就叫“花花轿子人人坐，人人抬”。现在这样的一个消息出来了以后，她也借助了Deepseek的光环，以及小米和雷军的光环，有大量的媒体出来炒作，来捧这个事情了。

这个人在她的行业内，到底有什么样的名声，我们不去管她，但至少在公众视角里头，这已经算是一个很厉害的人了。当然了，以深度求索的这种招聘以及用人原则来说呢，像罗福莉这样的履历的人，其实在里面还是蛮多的，因为里面各种清华、北大、德大这些人其实是蛮多的。而且这些人呢，好多还没有毕业，就是可能在里边做博士实习，或者做很多这样的事情，她们就都已经开始在各个论文里边去署名了。

所以呢，并不是说以这个论文量，以她的师从，或者是北大的这个学历，她是个硕士嘛，还不是博士，她就已经是站到一个什么顶流上了，其实距离那个还是有一点点差距的。只是呢，现在通过炒作的方式，让她站得比较靠前。

在Deepseek里面呢，毕业了一两年的人呢，就可以在里边挑大梁干事了。真正负责的呢，可能是有个四五年经验的一些人。而以罗福莉的这个资历，进去的时候呢，有可能能够负责一个项目，但也未必，因为呢它属于是相对来说比较专项的科学家，并不是工程方面的这种专家。因为工程专家是写不出这么多论文来的。

在科研能力上，至少是语言学方面的，罗福莉应该还是有所建树的，写论文绝对好手。工程技术能力的话，没有验证。人脉资源的话，大家注意，工程技术方面的人脉资源跟学术圈的人脉资源是完全两回事。她有可能在学术圈有人认识了，知道这个名字，她可能参加各种会，很多的会议上的这些教授，这些大拿也都能跟她聊得来。但是呢，你说真正能够拉起一帮人来，把事干出来的，那是完全另外一拨人。

至于她能不能做工程技术方面的事情，有没有工程技术方面的人脉，这件事呢？

我只能说，没有验证过，不知道。那么小米到底想干什么呢？大概率呢，也没指望罗福莉真的能做出什么来。因为小米自己也是有AI实验室，而且成立了很长时间。这个AI实验室自己也是有完整的体系架构。你不可能说我招了一个新人，然后你现在就给你另起一摊，或者说我把原来的架给我打散了，现在你就是老大了。她肯定还是要在小米的AI实验室里边，在她相应的位置去进行工作和研究的。

Deepseek这样的模型应该也不是小米追求的，因为如果要部署和训练Deepseek这样的模型的话，罗福莉应该是可以给出一些指导的。你毕竟原来在一个屋里，把东西做出来的。通常的科研和工程是两条线，罗福莉未必能够有能力挖角组建面试带领工程团队。像我们以前也招过这种工程老大，那就是招完了以后就问她说：“你能不能带回团队来？”像以前你前面几家老板的这个团队，你能不能找得来？如果找不来的话，那给你机会去面试，你能不能去面试一堆能干活的人出来？

等你把这个团队组建起来以后，你能不能带着这个团队去把这个事干出来？这个是对于工程老大的这种要求，这不是对于科研老大的要求。

小米最近还在说：“我们就训练端侧模型小模型。”这都是雷军最近说的话。当然了，说什么并不重要，做什么呢其实也不重要。那什么重要呢？就是为什么这么说，这个才是最重要的。小米毕竟是个卖手机的，你不这么说怎么让用户下单去买那个更贵的、更高端的手机呢？所以她一定会去喊说：“我们不去关注这种大模型，我们要关注端测小模型。”

但是呢，我相信小米也还是会照着Deepseek的这个套路，自己在训练一套云端模型。当然这个训练的应该也算是一个技术储备吧。像小米这样的公司，更大概率会在国内的各个大模型厂商之间进行平衡。就是什么字节、百度、阿里，包括Minimax，她可能都会用那么点，包括Deepseek可能都会去用一点点，然后在不同的应用里边去调用不同的模型。这应该是小米的一个策略。

然后自己同时训练一个模型呢，算是有一个技术储备，可以跟这些大模型厂商进行平等对话的一个东西。在中国就是这样，如果别人发现你不懂的话，总是要在你身上咬一口的。所以小米在这块呢，应该还是会做。

另外，对于小米来说，超级小爱的翻车，这个热度也还是要压一下的。讲到这呢，你说我们的结论，这个1,000万的年薪到底值不值？这个事情我觉得，大家自己去做判断就好了。你让我现在来给大家下一结论，说这事太值了，反正我没看出来；说这事肯定不值，咱们了解的信息呢也不够充分，也就只能是这样的一个情况。

我只能说以这个罗福莉现在从外界可以披露的公开信息来看，这个1,000万的年薪呢，稍微有一点点存疑。但是我相信呢，小米这个事情，甭管是她有意做的，还是无意做的，她的目的已经实现了。她的目的是什么呢？她股价涨了。除了卖车之外，现在我们还做AI了，还有一个万卡集群了，还从现在当红炸子鸡Deepseek挖了人出来了，号称雷军亲自下手，给了千万年薪了。

小米现在已经接近1万亿港币的市值了，她现在的市值是9,097亿港币，可能到周一开盘的时候，就直接冲万亿就过去了。所以我觉得小米呢，这个事情肯定已经好处落袋了，这个市值已经收获了，收获的还是很高的一个市值。

至于未来罗福莉到底能够在小米里边做什么东西出来，或者她到底能够在小米里边混多久，或者说小米未来到底会如何对此事进行官方回应，我觉得还是可以拭目以待的。未来也许还有新的瓜可以去吃。

好，这一期就跟大家讲到这里，感谢大家收听，请帮忙点赞，点小铃铛，参加Discord讨论群。也欢迎有兴趣、有能力的朋友加入我们的付费频道，再见。

马云重返舞台：支付宝独立发展与上市新征程，好日子是不是回来了？

老范讲故事 — Fri, 13 Dec 2024 00:39:01 +0000

马云回归支付宝，准备再次渡劫飞升。大家好，欢迎收听老范讲故事的YouTube频道。支付宝和蚂蚁集团20周年大会在2024年12月8日举办。马云非常非常罕见地上台，发表了3分48秒的演讲。为什么要数到秒呢？因为实在太短了。马云每一次在任何地方露头或者被人偷拍到，都可以上头条，阿里的股价也会跟着涨一涨。这么大的公司，只要马云露面，股价就涨。这一次马云露面，阿里的股价依然在上升，而且支付宝里边光余额宝的数值就快速地上升了一截。

上一次马云公开讲话还是2022年双十一。当然了，还不是一次真正面向媒体、面向大众的讲话。他只是在阿里园区里头，跟员工做了一些交流。所以现在马云基本上算是深居简出，能够正儿八经站到台上讲个话非常难。而且大家注意，马云去讲话的地方不是阿里集团，他是去支付宝讲话了，这个意义非同凡响。

咱们要讲一下，现在的蚂蚁集团已经大不如前了，现在的估值只剩下原来的不到一半。这个是怎么来的？因为它的利润急剧下滑。2020年它的利润有575.3亿元人民币，2021年快速上升。为什么？因为2020年底原来计划上市了，所以很多的数据都做出来了。2021年有730亿人民币的利润（口误）。到2022年就只剩下312亿了，2023年还剩下238.2亿。2024年稍微企稳回升了一些，2024年上半年193.8亿，2024年全年应该能够到400亿左右吧，会比2023年要高一些了。

支付宝跟淘宝切割之后，或者说支付宝跟阿里切割之后，很多的业务都在发生变化。比如说淘宝接入了微信支付，支付宝上的很多东西也要独立再做一次。比如说阿里那边在做通义千问大模型，而支付宝自己做了一个叫百灵大模型，说你做我也得做。大家知道，训练大模型这个事情其实很贵的。这百灵大模型下面还做了一个应用，叫支小宝。据说还有一个支小助。支小宝我已经在我手机上装了，实际上是什么呢？跟我们用的通义千问或者是百度文心一言一样的。

一个聊天工具，你可以在里边跟他做各种各样的对话。但是在对话的过程中，其实他并不能去调用你的支付宝信息。因为我问他，我说我有多少支付宝信用分，他说对不起，你要回到支付宝里边去查询。虽然支小宝我是使用支付宝账户登录的，授权了，但是他依然不能去给我做查询。

所以这样的一个应用，未来到底能有多大的前景，不知道。支小助应该是在支小宝的基础上做了一些改进。支小宝你可以拿他订餐，或者是做一些支付相关的沟通和咨询。而支小助，主要是做一些投资理财方面的研究和咨询，做这两块的。其他的，应该还有一些类似的小产品在准备推。

除了他在AI这块跟阿里完全独立开来，自己训练模型，自己出APP之外，还干了什么呢？就是支付宝短视频。支付宝应用现在是一个短视频平台了，你可以在上面刷短视频。

支付宝其实一直有一个很困扰他的事情，那就是它有一个工具属性。这对于很多的应用来说都很麻烦。什么叫工具属性？就是它有一个特定的功能。你想起用这个功能的时候你就来，你不想用这功能的时候你就不来。它不像是微信似的，它是个社交属性。别人给你发消息了，或者说你想去跟别人讨论一个事情的时候，你都要在上面呆着。

包括像抖音，它是娱乐属性，甭管有没有什么事要在上面呆着。哪怕是淘宝，淘宝都不是工具属性，因为淘宝有时候说我现在啥也不想买，我就想在上面逛逛行不行？也行。但是支付宝原来一直是很强的工具属性，你没有支付的时候，没有这种投资理财的时候，你是不会想起用这玩意的。所以它是个低频应用。

在互联网也好，移动互联网里头也好，一直都有一个说法叫高频打低频。你那个应用是高频应用，这个应用是低频应用。那么在进行竞争的时候，低频应用一定会吃亏的。那么跟支付宝竞争的是谁？微信支付啊，那妥妥的是一高频应用。每个人每天在微信上，可能得耗8个小时，那个夸张了点，但还是很长的。

但是支付宝这种应用，其实就跟我们使用的银行APP是一样的。

你就算是今天想起来用一次，有个5分钟、10分钟就行了呗。你非要在支付宝里头耗一个小时，那一定是应用做得不好。你在里头找不着东西了，才会耗很长的时间。所以支付宝一直会有这种困扰。他为了解决这个困扰，怎么办？自己在里加短视频，这个也不知道是谁出的馊主意。

支付宝收益是什么？就是靠啥玩意赚钱。第一个是非金融收益，这个是广告。他既然有短视频了，可以上广告。而且我们打开支付宝以后，里边是有很多的广告页面的啊，这个可以直接推送商品。第二个就是短视频，这该怎么挣钱？直播打赏或者是上广告都可以。第三个是电商，但是他主要在电商上的收入是给淘宝跟天猫提供技术支持。然后是生活服务，什么呢？叫餐啊、叫车呀，什么这些东西叫生活服务、技术服务。

你说我有一些支付场景，或者我有一些其他的相应的应用，不会玩的怎么办？你可以向支付宝去买，他来替你搞定这事也行。还有国际业务这块，这些年其实是不知道做得怎么样了，可能还萎缩了一些。这是支付宝的非金融收入，这个其实算是比较小的一部分。

还有一块就是金融收入。这个支付服务你通过支付宝去支付了，它是要收手续费的。理财，你说我拿着支付宝的余额宝也好，或者其他的存到支付宝里边的钱也好，我可以去买各种理财产品。保险、信贷，你可以从里头去借钱。还有信用服务，什么东西？我们有支付宝信用分，你可以拿这些信用分再去租车、租房，或者是做旅游的时候，可以去免租金去住酒店，还有很多这样的服务在里头。

还有一些就是小微金融服务，这个算是一些把零七八碎的一些，比如说企业之间的一些借贷，或者一些企业提供的一些小的金融服务，都放在这里头。这是这两块大的收入，一个是非金融服务，一个是金融服务。

那么这一次马云讲了点什么？他一共讲了3分48秒。刚才咱们讲了，所有解读的媒体跟自媒体，也都有些巧妇难为无米之炊的感觉，因为讲的东西实在是不多，就三分多钟，还讲得抑扬顿挫，也不是很快。

所以里头不会有特别多的那种。首先先是回顾与赞赏，说我们不是为过去20年来的，是为未来20年来的。肯定继往开来一下还是要讲的，也讲了一些心得体会。不经历风雨，怎么见彩虹？也是讲了一下，叫雷霆雨露皆是君恩。虽然前面把我摁下来了，但是我们还是在努力的活着，讲了这样的话。

然后呢，是未来展望。这个演讲的重点，其实是展望未来20年的发展。特别强调了AI时代带来的机遇与挑战，呼吁员工要抓住AI时代的这种机会。他讲AI里头有一句话是大家都在去讲的，是什么呢？让AI赋能我们的情怀，我们也要让情怀去赋能我们的AI。所以他在这个里头，是把AI跟情怀搁在一起了。其实现在的AIGC，你真让他做一些特别严肃的事情，他未必做得对。现在AIGC实际上主要提供的是情绪价值。

那么我觉得马云讲的还是很透彻的，而且马云提出了新的slogan或新的口号。原来阿里集团的口号是什么？叫天下没有难做的生意。做了20多年，一直在这个口号下去前进。现在讲了一个新口号，说我们今天能做的和未来能做的，是让科技给普通老百姓的生活带去幸福和改变。这个，我觉得应该是像阿里这样的大集团应该有的这种口号的水平。

那马云到底去干嘛去了？马云上一次跑到阿里去搞1+6加n，现在跑到支付宝去，到底去干嘛？支付宝说了，我们已经准备再次渡劫飞升了。马云上一次渡劫飞升，被临门一脚给踢回来了，这个没有经得住天雷滚滚，最后上市失败。这次说我们又准备去上市了。支付宝上一次的上市失败，基本上可以被认为是一个时代的终结。

前面的日子其实已经比较难过了，因为支付宝要上市的时候是2020年11月。你想2019年12月份疫情都开始了。所以到2020年11月的时候，前面日子不太好过。但是很多人还是抱着希望，觉得这可能只是一个暂时的困难，疫情过去了以后大家还是可以往前走的。而且那是一个英雄辈出的时代，有马云、马化腾、李彦宏、雷军、周鸿祎等一大堆的这种英雄人物。

或者是草莽英雄也行吧，各种各样的英雄人物在这个里边，你方唱罢我登场。这个风起云涌的时代，在支付宝上市失败的这个节点上就终结了。到此结束了，这个时间节点是什么样的？原来计划是2020年11月5日，A+H股同步上市，也就是在上交所和港交所一起来上市。但是到2020年11月3日，提前两天的时候，突然被叫停一下就结束了。然后马云再也没有声音了，英雄们变成了万恶的资本，杭州的房价都崩了。

在这个之前，其实大家不太相信房价会出现问题。在这个之前，房价是只能涨不能跌的。你到现在你再去问说房价怎么样，大家都在想说我们怎么救房地产。当时还没有这个啊，房价下跌，基本上是从蚂蚁集团上市失败开始的。因为很多分到蚂蚁原始股的这些员工，都在杭州买了房，或者是付了定金再去付贷款的情况下，突然发现不行了，上市失败了，你手里的这些股票没法变现，房贷还不上了。他一下房价就下来了。

当时为了上市，专门整了一个CEO上来，他是上任一年的投行背景CEO，也匆匆离职了。这个人叫胡晓明，他的花名叫孙权。2019年12月接任蚂蚁集团CEO，但是2021年的3月因个人原因辞职。这个人是2015年加入的阿里，曾经是中国建设银行网络金融部的总经理。你说突然整这么一个人出来当CEO，上市失败，2020年的11月3号上市失败，2021年3月份他就离开了。他就是来上市来的。

现在支付宝又重新准备上市了，希望恢复好时光。现在又整了一个新的CEO上来，因为马云出来演讲了，演讲完了以后马上说新CEO上来，叫韩歆毅。他来担任CEO，他是2011年加入的阿里，在阿里里头做企业融资部资深总监，参与并完成了阿里巴巴香港上市公司私有化、阿里和蚂蚁金服之间架构重组等多个重要任务。他曾经任职于中国国际金融有限公司，也就是咱们讲的中金公司，投资银行部，主要从事互联网、铁路、电信等行业的投行业务，完成了多个IPO、增发债务融资以及并购项目。

现在我们看到了，2019年12月份上来了一个投行背景的CEO。2020年11月份计划去上市，现在2024年12月份又整了一个投行背景的CEO上来。那么应该是2025年的，可能到下半年或者年底的时候，蚂蚁金服就真的要去上市了。

但是现在的支付宝跟当时2020年已经不一样了。2020年计划上市的时候的估值是2,000亿美金，也就是1.4万亿人民币。到2024年重新估个值，还剩多少？5,671亿人民币，还不到原来的一半。你说这个1.4万亿吧，你一半应该是7,000亿，他现在还不到6,000亿。这个数是怎么来的？是2023年7月，蚂蚁集团宣布以自有资金回购了部分的股份。这是一个回购对价。在公司上市以后，你是有市值的。在公司没有上市之前，大家都使用估值，而估值就是最后一次你去公开的处理这些股份的时候，对价是什么样的，就是多少。

现在的股东结构其实跟2020年的时候没有太大的变化。支付宝的最大的股东其实是员工持股平台，然后是阿里集团，再往后是什么中国社保基金、什么人保等一大堆这样的公司，还有很多这种国资在里边。但是所有这些加一块，大概也就是百分之十几。他这个公司的核心的股东是自己员工的持股平台以及阿里集团，阿里集团大概30%多，自己员工的持股平台50%多，它是这样的一个结构。

所以为什么当时支付宝要上市，最后上市失败的时候，那么多人是要去卖房，或者说要去毁约不再买房，这个事情因为很多人都分到股票了。那么现在的支付宝跟原来的变化是什么呢？就是没有实际控制人了。这个原来的实际控制人是马云，他通过支付宝的员工持股平台在这个里边去占股。他等于是所有员工持股平台跟马云签的是一致行动人，那么马云可以控制支付宝。现在呢进行了调整，马云不再是支付宝的一致行动人了。他的投票权重百分之五十几，现在大概下降到6%点多，有一些人可以去制衡他的权利了。

支付宝要再次踏上征程，再次去渡劫飞升，去上市了。无实际控制人的蚂蚁集团，你还是要让马云回来做演讲，才能够说新CEO上任，我们准备继续往前冲了。那么到底有没有实际控制人，大家自己心里明白。那么好日子到底还能不能回来？这么多媒体、自媒体都在努力传播马云的回归，为什么？不是大家多么喜欢马云，而是呼唤原来的好日子呢？

我们希望，当时马云在这里搅风搅雨的时候，那个日子能回来。那个时候大家才能看到希望，看到增长的一个时代。现在肯定时过境迁，沧海变桑田，这个好日子是不太容易按照原来那个方式回来了。但是马云是不是还可以带着支付宝、带着阿里继续去闯出新天地呢？廉颇老矣，尚能饭否，对吧？并不是说马云有什么变化了，只是现在马云已经身娇肉贵，身上有这么大的资产，还有这么多人在跟着他吃饭。他已经不能像以前那样说：“我们完全是光脚的，可以去做一些以前没有人敢做的事情。”这个其实我们这样去期待马云，就已经对他要求太高了。

那么马云到底能做些什么呢？再多顶几天，多发声、多露脸，多吸引注意力，年轻人们会跟上的，也会超过去的。如果说马云就是这个时代的高峰，其他人再也超不过去了，那也是一个很悲哀的事情。还是希望他能够发出一些声音，能够有新人再重新冲上去。

好，这就是我们这一次讲的故事。马云在蚂蚁集团20周年的大会上发表演讲，整个社会都觉得好日子又有回来的希望。好，这一期就讲到这里，感谢大家收听，请帮忙点赞、点小铃铛，参加Discord讨论群，也欢迎有兴趣、有能力的朋友加入我们的付费频道。再见。

在全球竞争中比亚迪遭遇下行挑战，供应链降价10%引发车企未来担忧！特斯拉副总裁字字诛心：比亚迪在供应链风波中艰难求生，未来将何去何从？

老范讲故事 — Mon, 02 Dec 2024 00:42:46 +0000

比亚迪要求供应商降价10%的事情还在发酵。比亚迪要完了吗？还是说比亚迪的车质量就彻底不行了呢？

大家好，欢迎收听老范讲故事的YouTube频道。事情的起因是11月26号有一封邮件曝光，邮件的标题是“2025年比亚迪乘用车降本要求”，落款是比亚迪集团执行副总裁、乘用车首席运营官何志奇。这是一位有名有姓的人。

邮件里面有些什么样的内容呢？说2024年11月18日，在比亚迪成立30周年之际，比亚迪汽车成为全球首家达到1,000万辆新能源汽车下线的车企。2024年10月，比亚迪汽车销量突破50万辆，1-10月份累计销售超过325万辆，同比增长达到36.5%。预计全年将突破420万辆销售大关。

比亚迪汽车销量的不断突破得益于技术创新、规模化优势和低成本供应链。2025年新能源汽车迎来重大机遇的同时，市场竞争也将更加激烈，进入大决战淘汰赛。为增强比亚迪乘用车竞争力，我们需要整个供应链共同努力，持续降本。因此，我提出如下要求：贵司所供货产品，从2025年1月1日起降价10%。请你和团队务必认真对待，切实挖掘降本空间，积极推动要求达成，尽快对接比亚迪资源开发团队，在12月15日前通过SRM系统将降后价格报给我司。

大概就是这样的一封邮件。他这个里边写得非常强硬，叫我提出如下要求贵司提供货品，从2025年1月1日起降价10%。我也没跟你商量，请你和团队务必认真对待，自己去挖掘去，然后向我们对接的部门去报价。

到目前为止，并没有确切的报道到底是谁把比亚迪内部发给供应商的这种邮件发出来了。据比亚迪内部的相关人士回应，将降价邮件公开并非供应商的公司行为，而是供应商的一个员工私下行为。这个非常有意思啊，人找着了，比亚迪也逮着人了。这个公司呢认错了，内部可能杀鸡儆猴。你看啊，这个人他干的，我把他开除了，剩下的咱们合作还是要接着做下去，10%我们认了，一定是这样的。

如果是这个供应商说这10%我不认的话，那他不会说这是一个个人行为。比亚迪呢应该说：“哎，我看你的认错态度还不错啊，这个肇事的人也被开除了，我们接着用你们家的零配件吧。”大概也是如此的一个情况。

这个事情为什么说到现在为止依然没有消停呢？按道理来说，比亚迪作为一个民族品牌，出了这样的事情应该快速地就会把声音都压下去，但是这一次并没有。因为有很多的媒体在跟进，讲说：“哎呀，比亚迪是不是品质就没有保障了？你今年降10%，明年降10%，明年再降……”
这不就要偷工减料吗？这是不是以后的比亚迪车的质量就会越来越差呢？还讲说是不是劣币驱逐良币了，对不对？这个能降价的人，或者愿意降价的人，愿意生产劣质产品的人，比亚迪就采用他们的产品了。其他的，那个造得好的零部件你就不采用了，那比亚迪的车是不是越来越差了呢？

这种声音现在还在有啊，但其实这些人不是混汽车圈的啊。汽车圈里头不这么讲话。比亚迪采购的所有零部件，他自己是需要进行检验的，不是说你用了更便宜的东西出来，我就将就了。拿回来以后，不符合比亚迪的质量管控的要求的话，你再便宜东西比亚迪也不要，也不会给你付钱的啊。

所以在这件事情上，比亚迪原来有多烂，现在还有多烂啊，不会比原来更烂，但是也不会比原来更好，这是必然的。但是绝不会因为每年降价，就导致比亚迪的车的质量越来越差。那么真正在汽车圈里面的人是怎么回应这件事呢？之所以现在这个事还没有过去，是因为汽车圈里边的人回应了。现在这个回应的人是特斯拉全球副总裁陶琳。她给出了一个回应，但是她并没有讲比亚迪什么事，但她后边讲的所有的话，叫字字诛心。

她讲的核心的话题是什么呢？就是说我们特斯拉很努力，我们把付款周期缩短了，从90天缩短到60天。然后讲的每一段话，咱们来看看。第一段话叫该省省，该花花，这个很大白话。什么意思？就是该省钱的地方你得省钱，该花钱的地方你得花钱，不能把其他人都逼死。这个样的话讲的就是比亚迪了。

然后说给供应商快速回款，并不意味着需要提高产品的价格。成本控制是怎么做的呢？是技术革新提高效率，加上减少一切不必要的花费。你们不要老惦记说压榨供应商，或者压榨工人，压榨其他的这些经销商。其实比亚迪是上下游所有人都在压榨啊。我们应该干嘛？应该技术革新。另外应该减少不必要的花费。什么叫不必要呢？豪华的接待中心、广告费、高管的办公室，比亚迪可以自己去研究一下自己是不是有这些东西。

还有一个呢，讲的是什么？说最大的浪费是错误的商业和技术决策所带来的损失。你推出这么多车型，推出的车型未必能够盈利，借这么多的钱快速的扩张很多东西，这个其实才会带来巨大的损失。保障供应商利益的同时，我们的研发和生产上持续投入，而这是人家特斯拉在这讲的话。他要给消费者更好的价格和产品，因为特斯拉最近刚降价，所以他也讲这样的一个话。上海超级工厂95%以上的零部件都是本土供应商，后边我们要加快付款周期。
从90天缩短到60天，所以基本上呢，是每一条都是对着比亚迪讲的，但是又没有带你的名字。大家看明白了，纷纷的开始对着比亚迪群起而攻之了。甚至这一次呢，再去讲比亚迪的时候，就已经不再是说你的质量怎么样了，而是说比亚迪你的付款周期是什么样的呢？而且比亚迪你是不是快完蛋了？为什么有好多人说比亚迪快完蛋了呢？原因很简单啊，因为比亚迪的这个资产负债率是非常非常高的，待会咱们来详细的看一看。

那么大家的付款周期和付款节奏都是什么样的呢？特斯拉现在说我承诺60天，原来90以后就是60了。小米的是60天的，小米的付款周期还是比较短的，因为小米的供应链大量都是雷系公司，就是雷军自己投资的公司。你这个手心手背都是肉，你不能说小米这汽车挣钱了，把你投资的所有项目都坑死了，这事不行。

还有一个干得比较好的是谁啊？是塞力斯，就是给华为造车的，他们的付款周期呢是86天，其实已经算不错了。然后理想200天，蔚来220天，小鹏230天，比亚迪250-300天，比亚迪是所有的这些车型里的付款周期最长的。国产车呢还有一个特点是什么叫逐年延长，就是每一年的付款周期都比前一年长，因为他们的账面资金越来越少啊，整个的运转其实是弦绷得越来越紧的一个状态。

你像蔚来啊、理想啊，前面可能还是可以在180天付款，后边就变成200天，然后就变成220天，他们是不断的往后拖的。而特斯拉是逐年减少啊，他一开始也是100多天，后来呢变成90天，过了年以后我们变60天啊，他是这样的一个态势。小米呢现在还看不出来啊，因为刚第一年，明年看看是变长还是变短吧。

真正成熟的汽车厂是什么样的？比如宝马，宝马的这个付款周期是45天。这些新能源，就算是特斯拉，其实跟宝马呀、跟这什么BBA、跟这些比，还是有提升空间的啊。对于零部件厂商来说，最难的其实不是不停的降价，最难的点其实有两个，第一个叫账期，第二个呢叫自主替代。

什么是账期？比亚迪咱们就以他为例吧，他的账期是90天。哎，不对啊，刚才你不是讲吗，比亚迪账期是250天到300天，怎么到这变90天了？比亚迪呢是90天以后给钱，但是他给的不是现金，给的那叫商票。这个商票是180天呢，什么意思？商票实际上是以比亚迪公司的信用给你开的一个金融票据，它后边不是银行的信用啊，是公司的信用啊。就是180天以后，你可以拿着比亚迪的商票去比亚迪的整个的结算中心去结算这笔钱。
所以你看，90+180，这就是270天了。而在这个过程中呢，90天未必能拿到这张商票，拿到商票180天以后，未必能付到钱。所以，他们经常是到300天，甚至拖过年都是很正常的一个状态。那你说，我现在着急用钱，180天的商票我受不了了，我必须要马上拿出钱来，怎么办呢？你可以找比亚迪自己家的金融公司，说我现在希望提前把这个商票兑出钱来，可以啊，再扣5%。所以这个里头就本身是有5%的利息在里边了。实际上，按年息算的话，像180天商票，他可以扣5%的话，这个年息是至少10%。而且你可能未必到180天，你比如说我已经等了100天了，剩80天我这个实在受不了，要钱了，他也给你扣5%。那这个利息是非常高的啊。

就是使用商票的，除了比亚迪之外，还有一个是吉利，也是90天之后给180天商票。其他的那些呢，比如说像蔚小李，有些是给一半现金的，剩下的呢要给他承兑汇票。这个跟商票就有区别了，商票是由公司来去担保的，而承兑汇票是由银行来担保的。这个钱呢，比如也是180天之后你可以来拿，但是呢，这个钱是到银行来拿，而且银行保证你拿到这个钱。如果他付不出钱来，银行去跟他打官司去，这个是承兑汇票。像蔚小李他们，很多都是要付一部分的承兑汇票，付一部分的现金，这样来处理的。

在这个里面呢，比亚迪还在付款，这个还不算是最差，最差的就是属于我不付钱了那种，比如像恒大汽车这种，他就我不付了，那这个事就直接趴菜了。对于所有的这些供应商来说，账期实际上就是要背负利息成本，这个很痛苦。而到最后呢，你还是未必能拿到这笔钱，所以到最后你还得找他求人去，求求你把这钱付给我吧，你看我们上有老下有小，求求你给钱吧。现在都是欠钱的事大爷啊，不是这个欠债的事大爷。

另外一个是什么呢，叫自处替代。自主替代呢，是这些汽车厂在找零配件的时候，并不是说找你一家药，他会每次都找几家，像招投标似的，让大家来比赛。同时呢，这些汽车厂会自己尝试生产各种各样的零配件。一旦到哪一天汽车厂觉得我自己生产的零配件要更划算的时候，他就直接把供应链的厂商踢掉，说算了，以后你们就不用做这个东西了，我自己做了。这个对于这种零配件厂商来说，是更残酷的。你说我去研发，研发完了提高质量，提高生产的效率，然后降低成本，折腾到最后，在终点站等着你的，是自主替代。说从今天以后，你跟这个零部件就没关系了，请离开这里，我以后自己造了，不用你的了。
比亚迪的很多零部件在内部都在进行自主替代的。这种生产和测试，外边这些供应商也没办法，有生意嘛，你还是得做。但是呢，最终的结果就是被踢出去，这个是很残酷的一点。那么，比亚迪是不是要完了呢？比亚迪到底负债多少钱？比亚迪负债5,000多亿。他的资产负债率是多少？77%。这个是一个非常吓人的数字。

什么叫资产负债率？就是我一共有多少资产，一共有多少负债，然后两个数相除，资产负债率77%。那你说比亚迪这么高了，有没有比它更高的？有，蔚来84.55%。还有更高的吗？还有，赛力斯89.2%（口误），就是造华为问界那家，更高。就这种，随时有可能崩盘的。今天还有一个消息是什么？赛力斯被引入到上证50的这个指数股里边去了。当然，另外一个进去的就更夸张一点，那是一个亏损的公司，AI芯片的。虽然亏损，但我们依然把它引入到上证50的成分股里边去。

讲得远点了。那么，正常的车企，这个资产负债率到底是多少呢？小鹏大概是58.1%，理想呢是56.7%。小米呢，其实不能完全算车企，车现在在小米整个的营收里，其实占的不算高，小米呢是49.33%。特斯拉呢是40.43%。从企业来说，他总是会借一些钱来去运作，这个是很正常的。你借的钱越多，其实说明你整个的资金性运转效率越高。但是呢，还是有一个安全的范围的，超过70%的呢，肯定是非常不安全的。所以，比亚迪是不是要完呢？肯定是非常危险，这个没什么好说的。

但是，比亚迪的债务里头，大家要注意，他有一些债务叫有息负债，有一些债务叫无息负债。什么叫有息负债？就是我找银行借了笔钱，银行是要找我收利息的，这个叫有息负债。或者说，有很多企业发这种企业债，最后企业债暴雷嘛，还不上了嘛，那么这些都是有利息的。比亚迪的有息负债的比例，相对来说还是比较低的，是410.4亿，占的总负债的7.7%。他总负债5,000多亿嘛，所以呢，这个还可以。

然后呢，自己还有一些现金，他自己有704亿的现金。就是这些需要付利息的债，我的现金是够的，随时要付，我是可以把它付掉的。咱们前面讲的这什么90天账期，180天商票，这些东西呢，都属于无息负债。这些东西，比亚迪自己是不承担利息的，他把这些利息的成本扔给了他的供应链了。那么现金呢，现在比亚迪还是可以用它的现金部分去完全覆盖有息负债的。所以在这个上，问题并没有那么大，但快速增长如果可以维持的话，这事就OK。
不会出问题，就跟原来我们说GDP保8似的。你只要保8，各种的问题都会被压制住。一旦说我GDP不再保8了，就会出问题。所以对于比亚迪来说，跟去年同期比，他增长了多少？36%。前面咱们读邮件的时候读过了。那么下一件事，对于比亚迪来说是什么呢？其实无非是三种结果啊。

第一种结果，继续高歌猛进，明年再涨36%、40%，接着涨上去。第二条路呢，叫软着陆，就是我想办法把这个速度降下来，降下来的同时呢，让所有的资金链不断裂。那还有一条路呢，就只能剩崩盘了。超高速增长，将上下游所有产业链的弦都崩到极限，现在他就已经是把上下游全崩到极限。

什么是下游？刚才咱们讲工业链是上游，下游他还有一大堆经销商呢。你卖的这些车到底有多少是在经销商的库存里挂着的，这个也是一个资金池，在为他服务的。而且比亚迪现在还惦记干嘛？搞并购啊。比亚迪说了，我们现在准备去并购这些国产新势力，他们搞不定了。而且我们要买就要买这个第一梯队的。现在大家猜猜，是不是要买蔚来？因为刚才我们讲了，蔚来的资产负债率是80%多。现在比亚迪跟蔚来都辟谣了，说不是我们，是别人啊。

但这个事再往后，到底买谁啊，这个还要去看。因为一旦要动了这种心思，那真的是“吃不穷，穿不穷，算计不到就受穷”。就比亚迪有可能会提前出现问题。所以呢，一旦他的车辆滞销或者增长放缓，就必然会去崩盘。这就是比亚迪现在的一个状态。

比亚迪现在到第三季度，它的自有现金是663.19亿。刚才咱们讲那个704.4亿，是比亚迪上半年结束的时候的现金。因为上市公司嘛，每个季度你是要出财报的，这个数据是透明的。现在还有663.19亿现金的情况下，要面对5,000亿的债务，那到底应该如何应对？那不是说无息负债不用害怕吗？对啊，虽然无息，但是它有期限啊。你到了日子以后，你付不出来，还是会被起诉，还是会崩盘的呀。

资产负债率并没有达到100%以上吧？那么你资产一定是比5,000亿多。但是那些叫资产，你并不能说我随时把这东西抵押给银行，就可以拿出钱来去还钱，或者我拿这个东西作为抵押，又可以借到新的钱来再去处理这个东西，借新还旧，或者怎么去滚。你到那个时候就滚不动了。一旦有人起诉说我拿不到钱了，马上就转不动，就跟恒大是一样的。

所以中国可能在面临的房地产危机或者房地产泡沫，到现在将破未破的时候，正在高歌猛进的比亚迪，可能也会面临同样的问题。总结一下，第一民族品牌还是有些骄傲自满的。
所以，他对上下游的供应商说话都极不客气。车企运营的情况，背后还是有很大学问的。这么高的运转效率，在悬崖上跳舞。比亚迪其实有一点做得还是不错的，他不腐败。如果他按这样的这种弦都拉满的状态，内部出现贪腐的话，早就崩了。所以在这点，比亚迪还行啊。

前边特斯拉讲了半天，也没有敢说里头内部有腐败的事情。当年小鹏找了一个老汽车厂出来的人，叽里咕噜就把手下一堆的高管全干掉了。其实在这个造汽车的过程中，上下起手的地方太多了。最终，这个高歌猛进的比亚迪，或高歌猛进的很多这种国产新势力们，危机就隐藏在阴影之中。

这就是今天咱们讲的，比亚迪要求供应链降价10%的故事。感谢大家收听，请帮忙点赞，点小铃铛，参加Discord讨论群。也欢迎有兴趣、有能力的朋友加入我的付费频道。再见。

Sora接口短暂泄露，艺术家们揭示Open AI的剥削内幕，是公关噱头还是真心合作？

老范讲故事 — Fri, 29 Nov 2024 00:42:07 +0000

昨天，Sora短暂的泄露。但是，我们真的还需要等待Sora吗？大家好，欢迎收听老范讲故事的YouTube频道。在今年2月份，Open AI公布了他们的Sora大模型之后，大家一直在等待这个产品的正式发布。但是，等到了现在，已经到年底了。很多跟随Sora的产品都已经上线，都已经有很多用户开始使用了，Sora自己还遥遥无期。

在这样的一个时间点里，突然有一群艺术家将Sora的这个接口公开到了Hugging Face上面去，短暂的开放了一段时间。这些艺术家呢，还发表了一封公开信，表达了自己对于Open AI的各种剥削的不满。Open AI呢，及时发现，在一小时之后封闭了接口，说你们就到这吧；然后也出来做了一些解释，表示这些艺术家们都是跟我们一起去合作的，他们都是自愿参加的，没有什么强迫。大概也是讲了一些这种片汤话。

至于Sora什么时候能发布，人家也没有再继续提供更进一步的信息。那么，这一次泄露出来的呢，是Sora的Turbo版本。Turbo是轻量级快速的版本，就是不是一个全尺寸的模型，参数呢也并不是很突出。2月份，Sora当时号称自己是世界模型，可以仿真出世界来的，当时是可以出一分钟的视频的。虽然一分钟视频并没有那么大的用处，超过一分钟都属于超长镜头，电影里头用这种镜头其实也不是那么多。这一次呢，只提供了1080P、720P、360P三种的分辨率，然后时长呢就是5到10秒钟。其实跟我们现在可以使用到的大量的这种视频生成模型参数是一样的，现在的视频生成模型基本上都是5到10秒钟。

那么，艺术家们为什么干这么个事呢？原因呢也很简单。有一句话叫“富贵不归乡，如锦衣夜行”。什么意思呢？有钱了得回家显摆显摆去，要不然的话就跟穿了个好衣服，晚上出门没人看见那是一样的。对于这帮艺术家们来说，有了一个好东西，你又不让他们显摆，这肯定是非常非常不爽的。

那公开信里都写了什么呢？他写了说，艺术家们年初呢就被邀请加入了。艺术家们加入呢，是分为三种不同的角色。第一个呢叫早期测试者，估计呢就是最一开始的一批人，还没有进行详细的分工。你们先来试试各种的接口能不能跑起来。第二个角色呢叫红队成员，这是干嘛使的。视频模型非常害怕一件事情，就是生成一些有害视频，色情、暴力、虚假或者版权侵害什么这样的视频。所以呢，需要一些成员说，你不断的向他提这样的要求，看看能不能都识别出来，拒绝服务，或者怎么能够规避，怎么能绕过，这个叫红队成员。

第三种呢叫创意合作伙伴。Sora每过一段时间呢，会发出一些样板视频来，那意思什么？他说，你看我还活着呢，我还在继续往前走，你们其他人怎么追赶也追不上。现在呢，这些艺术家们感觉被骗了，为什么呢？因为付出很多，Sora这种模型绝对没有那么好使。不是说它输出的东西不好，而是说你要想使用这个模型，需要付出的努力一定是非常艰巨的，因为你需要向它描述你到底要一个什么样的视频，它不像是我们普通人去使用图片生成模型式的，那我们只要写一个提示词，生成出来大差不差的我就能用。

这些人是艺术家，之所以他能成为艺术家，一定是他们对于自己的艺术产品有极高的要求。所以对于他们来说，想要让这种视频模型输出了自己能够满意的产品，或者叫作品吧，这个事本身是非常难的。所以呢，他说，我们付出了很多，但是发表的作品呢又非常难，因为他们发表作品一定是经过层层筛选，甚至是竞赛，然后呢再要经过Open AI的审核，才有极少的一部分作品可以发表。

即使是有作品被发表展示了，这些艺术家们呢，应该也没有得到什么回报。对应一个1,500亿美金的Open AI来说，大家觉得这个事有点太不公平了。而且这么长时间，你要说时间短了还可以，Sora大模型的发布又遥遥无期。这个就相当于什么？就是一帮人进去打测试服的游戏去了，结果呢始终也不给你公测，或者始终也不给你进正式上线。大家只能在里边参加各种删号测试，然后所有的测试还需要签保密协议，你还不能出来说，这个时间长了以后一定会造反的。

艺术家们呢就觉得他们成为了OpenAI的公关噱头。就是每过一段时间，他们会在这么多艺术家，可能300多个艺术家里头，挑选那么几个作品放出来，说你看，这就是Sora现在能够达到的成就，你们其他人就羡慕去吧。这些呢其实是艺术家们的艰苦工作，并不是Sora本身模型到底有多好。

再往后呢是呼吁Open AI可以更加开放。你不要上来就是签一大堆保密协议，这个实在是对于艺术家们来说太不友好了。而且呢，呼吁艺术家们开始使用开源的视频模型，说现在有很多开源模型已经可以用了，效果还不错。这就是他们的一个公开信。

现在呢，Open AI内部动荡不断，Sora到底什么时候能发布，还遥遥无期。仅仅依靠零星露出的作品保持社交媒体关注度，Open AI呢是可以接受的，但是艺术家们肯定接受不了。最后呢，就是艺术家毕竟不是工程师，不是律师，不是会计师，不是其他的这种社畜。如果他们完全按照逻辑，按照大家签的协议去做事的话，就不是艺术家了。

所以他们就整了这么一个幺蛾子出来。你虽然跟我签了保密协议，但是我们就把这个东西扔到世界上最大的开源大模型的集散网站Hugging Face上去，让大家都瞅了这么一眼。当然，现在也有人在讲说这个事情是不是又是Open AI的一次公关策略呢，现在不知道，因为Open AI绝对是社交媒体公关大师，不停的玩各种奇怪的事情。

也许过一段时间，人家就突然就发布了，发现这个江湖上又没有哥的声音再传播了，咱们得再整出点幺蛾子出来，这个都难说。艺术家们在一个网站上开始征集签名，说来，你们谁支持我。这个里边还有一个签名的人，号称叫埃隆·马斯克。只是签名的过程呢并不需要进行身份验证，所以也不知道这个是真是假。

那么，视频生成为什么这么费劲呢？Open AI在年初的时候，就2月份的时候，已经为全世界整个的AIGC行业指明了方向，这个贡献还是非常巨大的，我们要承认。但是呢，视频生成本身的难度是很大的。第一个呢，就是内容合理性，其实很难保持。六个手指头、七个手指头，手长得很奇怪。图片生成模型既然已经有这种问题了，那么视频生成模型有同样的手指头问题，或者各种的合理性问题，这个都是很正常的，避免不了的。

还有就是物理破膜的问题。咱们做过3D动画的人都知道，经常是就会出现这种叫物理破膜。什么叫物理破膜？你比如说你穿了件衣服，里边呢有个人，但是呢，在做一些动作的时候，里边的肢体就会从衣服外边撑出来。在视频模型生成的时候，有可能也会发生同样的事情，包括一些解剖学错误。比如说，这个脚要往前走的时候，应该膝盖往后弯的。但是呢，你怎么能够把这个膝盖必须往后弯这件事告诉大模型，让他每一次生成的时候都向后弯，这个挺难的。

我们看过很多视频模型生成的这种内容，两条腿突然走着走着就变三条了，或者是这个两条腿迈着迈着他都变成左脚了，都变成右脚。在图像生成模型上也会出现这种问题，视频生成模型更加难以避免。这个是第一个问题。

第二个问题就是一致性可控性。这个呢其实也是从图像生成模型那边就遇到的问题，到视频生成模型依然难以搞定。现在呢，在图片生成模型的一致性上已经好一点。什么叫一致性？比如说，你说让老范讲故事这张脸出现在不同的角色身上，或者是不同的艺术风格上，现在图片生成模型有一些方法，比如说自己去训练小模型，这个方式是可以让这个脸稍微的稳定一点的。

脸是一方面，然后这个身材，身上的衣服各种配饰，你要让所有的这些图片都很稳定的保持一致性，这个很难。像一个视频，一秒钟25帧到30帧，你要保证每一帧上，比如说这里都带着一个麦克风，这个对于他们来说非常非常难以控制和把握。

再往后呢，就是算力成本实在太高了。图片生成，现在我们画一幅1080P的这种图像吧，大概就需要几个美分。那你想一秒钟25帧到30帧的视频，他需要多少算力？大家去做各种测试和实验的时候，这个成本是非常非常高。当然了，这个还不是困扰视频生成本身的最大难题。

更大的难题是什么呢？就是视频要好看。最后生成完了以后，视频难看，没有人愿意看，没有人愿意传播，这个本身是没有任何意义和价值的。现在呢，做视频生成其实是在两个层面上大家在努力。第一个层面就是模型怎么能够让模型更好；第二个层面是什么？就是怎么去操控，我到底应该用一些什么样的方式对话吗，上传图片吗，然后一大堆菜单和选项吗，应该怎么能够让他进行顺畅的操作，把这个视频生成出来，这个其实非常难。

我记得在2014年的时候，有大量的团队尝试去做手机端的视频编辑软件。这个时候就发现，这个实在太难了，因为最早的时候，视频编辑这件事情都是在视频编辑机，那是个硬件，在那个上面弄的。再往后呢，是在这种很专业的视频编辑电脑上面去操作，而且是由一些专业人士操作。当你要把视频编辑这件事情弄到手机上去操作的时候，需要调控的东西实在太多了，非常麻烦。

这个大家想象一下，是否有人见过飞机驾驶舱？从头上到脚下，你身边所有能看见的地方，全都是各种各样的开关和仪表。视频编辑其实跟这个过程很像，大量的参数和开关选项需要设置才能够得到你满意的视频。现在我们要做视频生成的这种工具了，你在有大模型的基础上，你也需要大量的这种开关选项、菜单或者是提示词，才能够告诉大模型我们到底要生成什么样的视频。这些交互的过程应该如何去安排，这个对于现在所有的这种做视频生成工具的人来说，都是极大的挑战。

到目前为止，没有特别好使的。在这么难操控的情况下，你要能保证输出出来的视频是有人愿意看的，这个难度就会更大一些。所以为什么这帮艺术家也说说，我们付出的努力极其艰巨呢，也是如此。他们想控制Sora这样的一个半成品，甚至可能都没有界面，你还需要去写代码，才可以让他跑起来的一个系统，让这样的系统去输出需要的视频，这个是非常非常麻烦的。

像谷歌前面就是矫枉过正了，你跟他说，任何的提示词里边一定是有黄种人、有黑人、有白人，还有奇奇怪怪性别的人凑在一起，最后被骂的直接把这个接口封掉了。所以这个到底掌握到什么步骤，他们也是很头疼的。再往后什么欺诈，视频的欺诈，那要比文字欺诈、图片欺诈、声音欺诈都要吓人，因为他真的像真的一样。因为这个东西呢完全的可以以假乱真。

我今天测试了一下，在剪映里边去使用真人数字人。什么叫真人数字人？就是有一个数字人在这讲话，但是呢你可以自己上传一张照片，说我现在让这个人去讲话。你要想做这个操作的话，剪映要干嘛？要去做人脸识别，保证你上传的这个照片是你自己，否则的话他就拒绝工作了。你说我今天上传一个雷军的，让他去骂人，去让他去做一些其他的事情，这个事他不干。当然，有其他的工具可以干这件事情。

现在雷军骂人也好，于东来骂人也好，这种视频都是在满天飞的。除了前面我们讲的什么欺诈、血腥、暴力、歧视之外，还有一个问题叫版权纷争。你一旦是遇到了版权纷争，这个对于视频来说也很麻烦。什么叫版权纷争？比如说请给我按照宫崎骏的风格画一个什么东西，或者生成一个什么动漫，或者星球大战里的一个什么角色去做一个什么样的事情，或者说你现在请用马斯克的脸给我生成一个什么东西，这个呢都面临着版权纠纷，包括一些品牌和形象的纠纷，这些是需要去注意的。

那么，我们到底还需不需要等Sora呢？其实从达利3的这个角度上来看，我觉得我们完全不需要再去期待Sora了。为什么呢？我们看看Dalle3现在画图的效果。首先，咱们先说优点，文字理解还是相当不错的。当你给他一个很长的提示词的时候，他会把提示词中的各个部分都理解的很清楚，而且尽量的都给你画到这个图片上去，这个Dalle3算是最强的。但是，这个但是后边才是重点，艺术表现力非常的差。

甭管是跟最新的Flex比，还是跟Midjorney 6.1比，完全没法看。细节也是非常差的。他虽然可以把每一个提示词里边要求的东西都给你画上，但是呢，画的过程还是比较粗糙的，稍微擦点边的都拒绝服务。你比如说，我要求给我按照迪士尼的3D风格画一个什么东西，马上拒绝。你说现在请给我按照日本漫画风格画，可以画出来；说现在请按照宫崎骏的风格给我画，马上拒绝。你只要提到任何人的名字，直接拒绝。

所以他的拒绝的东西实在是太多了。如果按照同样的政策去执行的话，那我觉得Sora是完全不值得期待的一个东西。现在可以用的视频大模型其实已经不少了，甭管是Runway，还是国内能够使用的吉梦。吉梦是剪映下面的字节跳动做的，效果还可以。快手做的可灵效果其实也能够使用了，甚至在剪映内部也集成了视频直接生成的这种功能，这些呢已经可以达到一部分商业使用的能力了。

现在的各种亲友照片变成视频，这种内容已经有很强的传播力了。很多人会把一些过世亲友的照片拿出来，给他一个提示词，说这个人现在笑了，这个人人说话了，这个人人吃东西了，这个已经有一定的传播力了。数字人呢也已经开始赚钱了，甭管是数字人直播，还是数字人带货，或者数字人骂街，这块已经可以跑了。

YouTube上呢，有很多的这种预告片开始吸引流量。什么意思？就是他经常告诉你说，现在哪一部大片后边要拍续集了，大家赶快去看呀。当你看了以后，发现是有很多的前作剪辑，然后再加上一些AI生成的内容，拼凑起来的一个，你也不能说他粗制滥造，有的做的还可以，这样的一个视频。我已经被这种视频骗了好多回了。我现在再看到说哪个大片要准备拍续集，上预告片了，我先得看谁发布的。如果不是原来那个电影的制作公司发布的，我就直接跳过不看了，很容易上当受骗。

现在很多的漫画小说详解相关的视频，在抖音、快手上也开始在盈利赚钱了。所以这块呢已经走入了商业化。以假乱真也造成了很多的困扰，比如说雷军骂人，于东来骂人，甚至还有人把那个德国选择党的那个女党首，她的这个视频配上中文上来，讲一些比较激烈的这种话语吧，这个也是很容易骗到人的。

下一步的AI工具会是什么样的呢？第一个，专业应用级别呢，可能还是会有专门的人去做。就像现在我们，比如说在视频领域里头，我的这个视频处理都是用剪映的，但是呢，也还是有很多专业团队，会使用一些更复杂的这种视频工具。Sora以后可能就会向那个方向发展，说我们干脆就永远不再向公众开放了，就是直接签约给这些电影公司，让他们去用。用完了以后出了所有东西，你们自己负责任，跟我就没有关系了。这是一种方式。

半专业的应用呢，肯定还有待增强。普通人使用Sora这样的模型，或者使用其他的刚才我们说的吉梦也好，可灵也好，还是挺难使的。他们可能还需要在用户交互上，或者是工具上还要有待增强，这个大模型本身他们自己慢慢训就可以了。至于个人应用的话，是否能够爆发，我觉得应该还是可以爆发的，就是使用AI大模型生成视频的这种个人应用，但这个可能距离我们还稍微远一些。

这种半专业应用的话，应该正在路上。在吉梦也好，可灵也好，都在做手机APP，网站的这种Web APP也在尝试跟各自的这种视频编辑工具进行结合。这一块的话，有可能会最先让我们看到成绩。

至于Open AI下边该干嘛去呢，我们已经讲了Open AI的Sora已经不值得期待了。Open AI作为行业的排头兵老大，它有一个非常重要的职策，就是为整个行业指明下一个方向。他指明了Sora这一个方向以后，大家就赶快都去出了一堆可灵也好，吉梦也好，Runway Pica，一大堆的这样的视频模型就出来了。

他说我们要做O1这种可以带推理的模型，然后一堆的推理模型在这个后边就出来了。今天我还装了一个叫QWQ，通义千问做的推理模型，在32B的参数下吧，可以达到甚至是部分超越O1 mini的这个能力了。他现在还达不到O1 Preview的这个能力，但是可以达到O1 Mini的能力，只有32B，那这个还是非常棒的一个东西。

所以再往下一个方向到底是什么？虽然很多的厂商也在尝试去摸索寻找新方向，但是呢都没有Open AI指的方向。他只要摇旗呐喊，大家就直接跟风往上冲，没有这种号召力。所以我们期待Open AI可以给大家指明下一个方向，等指明了以后，全世界的厂商再顺着这个方向往前跑。

好，这是今天讲的故事。感谢大家收听，请帮忙点赞点小铃铛，参加Discord讨论群，也欢迎有兴趣、有能力的朋友加入我们的付费频道。再见。

昨天，Sora短暂的泄露。但是，我们真的还需要等待Sora吗？大家好，欢迎收听老范讲故事的YouTube频道。在今年2月份，Open AI公布了他们的Sora大模型之后，大家一直在等待这个产品的正式发布。但是，等到了现在，已经到年底了，很多跟随Sora的产品都已经上线，已经有很多用户开始使用了，而Sora自己还遥遥无期。

在这样的一个时间点里，突然有一群艺术家将Sora的这个接口公开到了Hugging Face上面去，短暂的开放了一段时间。这些艺术家还发表了一封公开信，表达了自己对于Open AI的各种剥削的不满。Open AI及时发现，在一小时之后封闭了接口，说你们就到这吧，然后也出来做了一些解释，说这些艺术家们都是跟我们一起去合作的，他们都是自愿参加的，没有什么强迫，大概也是讲了一些这种片汤话。

至于Sora什么时候能发布，人家也没有再继续提供更进一步的信息。那么，这一次泄露出来的呢，是Sora的Turbo版本。Turbo是轻量级快速的版本，参数也并不是很突出。2月份，Sora当时号称自己是世界模型，可以仿真出世界来的，当时是可以出一分钟的视频的。虽然一分钟视频并没有那么大的用处，超过一分钟都属于是超长镜头了，电影里头用这种镜头其实也不是那么多。

这一次只提供了1080P、720P、360P三种的分辨率，时长就是5到10秒钟。其实跟我们现在可以使用到的很多这种视频生成模型参数是一样的。现在的视频生成模型基本上都是5到10秒钟。那么，艺术家们为什么干这么个事呢？原因也很简单，有一句话叫“富贵不归乡，如锦衣夜行”。什么意思呢？有钱了得回家显摆显摆去，要不然的话就跟穿了个好衣服，晚上出门没人看见那是一样的。

对于这帮艺术家们来说，有了一个好东西，你又不让他们显摆，这肯定是非常非常不爽的。公开信里都写了什么呢？他写了说，艺术家们年初就被邀请加入，艺术家们加入是分为三种不同的角色。第一个叫早期测试者，估计就是最一开始的一批人，还没有进行详细的分工，你们先来试试各种的接口能不能跑起来。第二个角色叫红队成员，这是干嘛使的？视频模型非常害怕一件事情，就是生成一些有害视频，色情、暴力、虚假，或者版权侵害什么这样的视频。

所以呢，需要一些成员说，你不断的向他提这样的要求，看看能不能都识别出来，拒绝服务，或者怎么能够规避，怎么能绕过，这个叫红队成员。第三种叫创意合作伙伴，Sora每过一段时间会发出一些样板视频来，那意思是什么？他说你看我还活着呢，我还在继续往前走，你们其他人怎么追赶也追不上。

现在，这些艺术家们感觉被骗了。为什么呢？因为付出很多，Sora这种模型绝对没有那么好使。不是说它输出的东西不好，而是说你要想使用这个模型，需要付出的努力一定是非常艰巨的，因为你需要向它描述你到底要一个什么样的视频。它不像是我们普通人去使用图片生成模型式的，那我们只要写一个提示词，生成出来大差不差的，我就能用。

这些人是艺术家，之所以他能成为艺术家，一定是他们对于自己的艺术产品有极高的要求。所以对于他们来说，想要让这种视频模型输出了自己能够满意的产品或者叫作品吧，这个事本身是非常难的。所以呢，他说，我们付出了很多，但是发表的作品又非常难，因为他们发表作品一定是经过层层筛选，甚至是竞赛，然后再要经过Open AI的审核，才有极少的一部分作品可以发表。

即使是有作品被发表展示了，这些艺术家们也应该没有得到什么回报。对应一个1,500亿美金的Open AI来说，大家觉得这个事有点太不公平了。而且这么长时间，你要说时间短了还可以，Sora大模型的发布又遥遥无期，这就相当于什么，就是一帮人进去打测试服的游戏去了，结果始终也不给你公测，或者始终也不给你进正式上线，大家只能在里边参加各种删号测试。

然后，所有的测试还需要签保密协议，你还不能出来说。这个时间长了以后一定会造反的。艺术家们就觉得他们成为了OpenAI的公关噱头，每过一段时间，他们会在这么多艺术家，可能300多个艺术家里头，挑选那么几个作品放出来，说你看，这就是Sora现在能够达到的成就，你们其他人就羡慕去吧。这些其实是艺术家们的艰苦工作，并不是Sora本身模型到底有多好。

再往后呢，是呼吁Open AI可以更加开放。你不要上来就是签一大堆保密协议，这个实在是对于艺术家们来说太不友好了。而且呢，呼吁艺术家们开始使用开源的视频模型，说现在有很多开源模型已经可以用了，效果还不错，这就是他们的一个公开信。

现在，Open AI内部动荡不断，Sora到底什么时候能发布还遥遥无期。仅仅依靠零星露出的作品保持社交媒体关注度，Open AI是可以接受的，但是艺术家们肯定接受不了。最后，艺术家毕竟不是工程师，不是律师，不是会计师，不是其他的这种社畜。如果他们完全按照逻辑，按照大家签的协议去做事的话，就不是艺术家了。

所以，他们就整了这么一个幺蛾子出来。你虽然跟我签了保密协议，但是我们就把这个东西扔到世界上最大的开源大模型的集散网站Hugging Face上去，让大家都瞅了这么一眼。当然，现在也有人在讲说这个事情是不是又是Open AI的一次公关策略呢，现在不知道，因为Open AI绝对是社交媒体公关大师，不停的玩各种奇怪的事情。

也许过一段时间，人家就突然就发布了，发现这个江湖上又没有哥的声音再传播了，咱们得再整出点幺蛾子出来，这个都难说。这些艺术家们在一个网站上开始征集签名，说来你们谁支持我。这个里边还有一个签名的人，号称叫埃隆·马斯克。只是签名的过程并不需要进行身份验证，所以也不知道这个是真是假。

那么，视频生成为什么这么费劲呢？Open AI在年初的时候就已经为全世界整个的AIGC行业指明了方向，这个贡献还是非常巨大的，我们要承认。但是呢，视频生成本身的难度是很大的。第一个就是内容合理性，其实很难保持。六个手指头、七个手指头，手长得很奇怪，图片生成模型既然已经有这种问题了，那么视频生成模型有同样的手指头问题，或者各种的合理性问题，这个都是很正常的，避免不了的。

还有就是物理破膜的问题。咱们做过3D动画的人都知道，经常是就会出现这种叫物理破膜。什么叫物理破膜？你比如说，你穿了件衣服，里边有个人，但是呢，人在做一些动作的时候，里边的肢体就会从衣服外边撑出来。你在视频模型生成的时候，有可能也会发生同样的事情，包括一些解剖学错误，比如说这个脚要往前走的时候，应该膝盖是往后弯的。但是呢，你怎么能够把这个膝盖必须往后弯这件事告诉大模型，让他每一次生成的时候都向后弯，这个挺难的。

我们看过很多视频模型生成的这种内容，两条腿突然走着走着就变三条了，或者是这两条腿迈着迈着它都变成左脚了，或者是变成右脚。在图像生成模型上，也会出现这种问题，视频生成模型更加难以避免。这是第一个问题，第二个问题就是一致性可控性。这个其实也是从图像生成模型那边就遇到的问题，到视频生成模型依然难以搞定。

现在在图片生成模型的一致性上已经好一点。什么叫一致性？比如说你说让老范讲故事这张脸出现在不同的角色身上，或者是不同的艺术风格上，现在图片生成模型有一些方法，比如说自己去训练小模型，这个方式是可以让这个脸稍微的稳定一点的。脸是一方面，然后这个身材，身上的衣服各种配饰，你要让所有的这些图片都很稳定的保持一致性，这个很难。

像一个视频，一秒钟25帧到30帧，你要保证每一帧上，比如说这里都带着一个麦克风，这个对于他们来说非常非常难以控制和把握。再往后呢，算力成本实在太高了。图片生成，现在我们画一幅1080P的这种图像吧，大概就需要几个美分。那你想一秒钟25帧到30帧的视频，它需要多少算力？大家去做各种测试和实验的时候，这个成本是非常非常高。

当然了，这个还不是困扰视频生成本身的最大难题。更大的难题是什么呢？就是视频要好看。最后生成完了以后，视频难看，没有人愿意看，没有人愿意传播，这个本身是没有任何意义和价值的。现在，做视频生成其实是在两个层面上大家在努力。第一个层面就是模型怎么能够让模型更好；第二个层面是什么？就是怎么去操控，我到底应该用一些什么样的方式，对话吗？上传图片吗？然后一大堆菜单和选项吗？应该怎么能够让他进行顺畅的操作，把这个视频生成出来，这个其实非常难。

我记得在2014年的时候，有大量的团队尝试去做手机端的视频编辑软件，这个时候就发现，这个实在太难了，因为最早的时候，视频编辑这件事情都是在视频编辑机，那是个硬件，在那个上面弄的。再往后呢，是在这种很专业的视频编辑电脑上面去操作，而且是由一些专业人士操作。当你要把视频编辑这件事情弄到手机上去操作的时候，需要调控的东西实在太多了，非常麻烦。

这个大家想象一下，是否有人见过飞机驾驶舱，从头到脚下，你身边所有能看见的地方，全都是各种各样的开关和仪表。视频编辑其实跟这个过程很像，大量的参数和开关选项需要设置才能够得到你满意的视频。现在我们要做视频生成的这种工具了，你在有大模型的基础上，你也需要大量的这种开关选项、菜单或者是提示词，才能够告诉大模型我们到底要生成什么样的视频。

这些交互的过程应该如何去安排，这个对于现在所有的这种做视频生成工具的人来说，都是极大的挑战。到目前为止，没有特别好使的。在这么难操控的情况下，你要能保证输出出来的视频是有人愿意看的，这个难度就会更大一些。所以为什么这帮艺术家也说我们付出的努力极其艰巨呢，也是如此。他们想控制Sora这样的一个半成品，甚至可能都没有界面，你还需要去写代码，才可以让他跑起来的一个系统，让这样的系统去输出需要的视频，这个是非常非常麻烦的。

像谷歌前面就是矫枉过正了。你跟他说，任何的提示词里边一定是有黄种人、有黑人、有白人，还有奇奇怪怪性别的人凑在一起，最后被骂的直接把这个接口封掉了。所以，这个到底掌握到什么步骤，他们也是很头疼的。再往后什么欺诈，视频的欺诈，那要比文字欺诈、图片欺诈、声音欺诈都要吓人，因为他真的像真的一样。

因为这个东西完全可以以假乱真。我今天测试了一下，在剪映里边去使用真人数字人。什么叫真人数字人？就是有一个数字人在这讲话，但是你可以自己上传一张照片，说我现在让这个人去讲话。你要想做这个操作的话，剪映要干嘛？要去做人脸识别，保证你上传的这个照片是你自己，否则的话他就拒绝工作了。

你说我今天上传一个雷军的，让他去骂人，去让他去做一些其他的事情，这个事他不干。当然，有其他的工具可以干这件事情。现在雷军骂人也好，于东来骂人也好，这种视频都是在满天飞的。除了前面我们讲的什么欺诈、血腥暴力、歧视之外，还有一个问题叫版权纷争。你一旦是遇到了版权纷争，这对于视频来说也很麻烦。

什么叫版权纷争？比如说请给我按照宫崎骏的风格画一个什么东西，或者生成一个什么动漫，或者星球大战里的一个什么角色去做一个什么样的事情，或者说你现在请用马斯克的脸给我生成一个什么东西，这个都面临着版权纠纷，包括一些品牌和形象的纠纷，这些是需要去注意的。

那么，我们到底还需不需要等Sora呢？其实从达利3的这个角度上来看，我觉得我们完全不需要再去期待Sora了。为什么呢？我们看看Dalle3现在画图的效果。首先，咱们先说优点，文字理解还是相当不错的。当你给他一个很长的提示词的时候，他会把提示词中的各个部分都理解得很清楚，而且尽量的都给你画到这个图片上去，这个Dalle3算是最强的。

但是，这个但是后边才是重点，艺术表现力非常的差。甭管是跟最新的Flex比，还是跟Midjorney 6.1比，完全没法看。细节也是非常差的。他虽然可以把每一个提示词里边要求的东西都给你画上，但是呢，画的过程还是比较粗糙的。稍微擦点边的都拒绝服务。

你比如说，我要求给我按照迪士尼的3D风格画一个什么东西，马上拒绝。你说现在请给我按照日本漫画风格画，可以画出来；说现在请按照宫崎骏的风格给我画，马上拒绝。你只要提到任何人的名字，直接拒绝。说现在请按照哪一个漫画里的这个情节，七龙珠的漫画情节给我画一个东西，马上拒绝。请给我画个什么星球大战、什么米老鼠，马上拒绝。

所以他的拒绝的东西实在是太多了。如果按照同样的政策去执行的话，那我觉得Sora是完全不值得期待的一个东西。现在可以用的视频大模型其实已经不少了，甭管是Runway，还是国内能够使用的吉梦，吉梦是剪映下面的字节跳动做的，效果还可以。快手做的可灵效果其实也能够使用了，甚至在剪映内部也集成了视频直接生成的这种功能，这些已经可以达到一部分商业使用的能力了。

YouTube上有很多的这种预告片开始吸引流量。什么意思呢？就是他经常告诉你说，现在哪一部大片后边要拍续集了，大家赶快去看呀。当你看了以后，发现是有很多的前作剪辑，然后再加上一些AI生成的内容，拼凑起来的一个，你也不能说他粗制滥造，有的做的还可以，这样的一个视频我已经被这种视频骗了好多回了。

我现在再看到说哪个大片要准备拍续集，上预告片了，我先得看谁发布的。如果不是原来那个电影的制作公司发布的，我就直接跳过不看了，很容易上当受骗。现在很多的漫画小说详解相关的视频在抖音、快手上也开始在盈利赚钱了，所以这块已经走入了商业化。

那么，以假乱真也造成了很多的困扰，比如说雷军骂人，于东来骂人，甚至还有人把那个德国选择党的那个女党首，她的这个视频配上中文上来，讲一些比较激烈的这种话语，这个也是很容易骗到人的。下一步的AI工具会是什么样的呢？第一个专业应用级别，可能还是会有专门的人去做。

就像现在我们，比如说在视频领域里头，我的视频处理都是用剪映的，但是呢也还是有很多专业团队会使用一些更复杂的这种视频工具。Sora以后可能就会向那个方向发展，说我们干脆就永远不再向公众开放了，就是直接签约给这些电影公司，让他们去用。用完了以后出了所有东西，你们自己负责任，跟我就没有关系了，这是一种方式。

半专业的应用呢肯定还有待增强。普通人使用Sora这样的模型，或者使用其他的刚才我们说的吉梦也好，可灵也好，还是挺难使的，他们可能还需要在用户交互上或者是工具上还要有待增强。这个大模型本身，他们自己慢慢训就可以了。至于个人应用的话，是否能够爆发，我觉得应该还是可以爆发的，就是使用AI大模型生成视频的这种个人应用，但是呢，这个可能距离我们还稍微远一些。

这种半专业应用的话，应该正在路上。在吉梦也好，可灵也好，都在做手机APP，网站的这种Web APP也在尝试跟各自的这种视频编辑工具进行结合，这一块的话，有可能会最先让我们看到成绩。

至于Open AI下边该干嘛去呢？我们已经讲了Open AI的Sora已经不值得期待了。Open AI作为行业的排头兵老大，它有一个非常重要的职策，就是为整个行业指明下一个方向。他指明了Sora这一个方向以后，大家就赶快都去出了一堆可灵也好、吉梦也好、Runway Pica，一大堆的这样的视频模型就出来了。

所以再往下一个方向到底是什么？虽然很多的厂商也在尝试去摸索寻找新方向，但是呢，都没有Open AI指的方向。他只要摇旗呐喊，大家就直接跟风往上冲，没有这种号召力。所以我们期待Open AI可以给大家指明下一个方向，等指明了以后，全世界的厂商再顺着这个方向往前跑。

好，这是今天讲的故事。感谢大家收听，请帮忙点赞点小铃铛，参加Discord讨论群，也欢迎有兴趣、有能力的朋友加入我们的付费频道。再见。

昨天，Sora短暂的泄露。但是，我们真的还需要等待Sora吗？大家好，欢迎收听老范讲故事的YouTube频道。在今年2月份，Open AI公布了他们的Sora大模型之后，大家一直在等待这个产品的正式发布。但是，等到了现在，已经到年底了，很多跟随Sora的产品都已经上线，都已经有很多用户开始使用了，Sora自己还遥遥无期。

在这样的一个时间点里，突然有一群艺术家将Sora的这个接口公开到了Hugging Face上面去，短暂的开放了一段时间。这些艺术家呢，还发表了一封公开信，表达了自己对于Open AI的各种剥削的不满。Open AI呢，及时发现，在一小时之后封闭了接口，说你们就到这吧，然后也出来做了一些解释，称这些艺术家们都是跟我们一起去合作的，他们都是自愿参加的，没有什么强迫，大概也是讲了一些这种片汤话。

至于Sora什么时候能发布，人家也没有再继续提供更进一步的信息。那么，这一次泄露出来的呢，是Sora的Turbo版本。Turbo是轻量级快速的版本，不是一个全尺寸的模型，参数呢也并不是很突出。2月份，Sora当时号称自己是世界模型吧，可以仿真出世界来的，当时是可以出一分钟的视频的。虽然一分钟视频并没有那么大的用处，超过一分钟都属于是超长镜头了，电影里头用这种镜头其实也不是那么多。这一次呢只提供了1080P、720P、360P三种的分辨率，然后时长呢就是5到10秒钟。其实跟我们现在可以使用到的很多视频生成模型参数是一样的。

现在的视频生成模型基本上都是5到10秒钟。那么，艺术家们为什么干这么个事呢？原因呢也很简单。有一句话叫“富贵不归乡，如锦衣夜行”，什么意思呢？有钱了得回家显摆显摆去，要不然的话就跟穿了个好衣服，晚上出门没人看见那是一样的。对于这帮艺术家们来说，有了一个好东西，你又不让他们显摆，这肯定是非常非常不爽的。

那公开信里都写了什么呢？他写了说，艺术家们年初呢就被邀请加入了，艺术家们加入呢是分为三种不同的角色。第一个呢叫早期测试者，估计呢就是最一开始的一批人，还没有进行详细的分工，你们先来试试各种的接口能不能跑起来。第二个角色呢叫红队成员，这是干嘛使的？视频模型非常害怕一件事情，就是生成一些有害视频，色情、暴力、虚假呀，或者版权侵害什么这样的视频，所以呢需要一些成员说你不断的向他提这样的要求，看看能不能都识别出来，拒绝服务，或者怎么能够规避，怎么能绕过，这个叫红队成员。

第三种呢叫创意合作伙伴，Sora每过一段时间呢会发出一些样板视频来，那意思什么？他说你看我还活着呢，我还在继续往前走，你们其他人怎么追赶也追不上。现在呢这些艺术家们感觉被骗了，为什么呢？因为付出很多，Sora这种模型绝对没有那么好使。不是说它输出的东西不好，而是说你要想使用这个模型，需要付出的努力一定是非常艰巨的，因为你需要向它描述你到底要一个什么样的视频。它不像是我们普通人去使用图片生成模型式的，我们只要写一个提示词，生成出来大差不差的，我就能用。

这些人是艺术家，之所以他能成为艺术家，一定是他们对于自己的艺术产品有极高的要求。所以，对于他们来说，想要让这种视频模型输出了自己能够满意的产品，或者叫作品吧，这个事本身是非常难的。所以呢，他们说：“我们付出了很多，但是发表的作品呢又非常难。”因为他们发表作品一定是经过层层筛选，甚至是竞赛，然后呢再要经过Open AI的审核，才有极少的一部分作品可以发表。

即使是有作品被发表展示了，这些艺术家们呢应该也没有得到什么回报。对应一个1,500亿美金的Open AI来说，大家觉得这个事有点太不公平了。而且这么长时间，你要说时间短了还可以，Sora大模型的发布又遥遥无期。这个就相当于什么？就是一帮人进去打测试服的游戏去了，结果呢始终也不给你公测，或者始终也不给你进正式上线，大家只能在里边参加各种删号测试。

然后，所有的测试还需要签保密协议，你还不能出来说，这个时间长了以后一定会造反的。艺术家们呢就觉得他们成为了OpenAI的公关噱头，就是每过一段时间，他们会在这么多艺术家，可能300多个艺术家里头，挑选那么几个作品放出来，说你看，这就是Sora现在能够达到的成就，你们其他人就羡慕去吧。其实，这些呢是艺术家们的艰苦工作，并不是Sora本身模型到底有多好。

再往后呢，是呼吁Open AI可以更加开放，你不要上来就是签一大堆保密协议，这个实在是对于艺术家们来说太不友好了。而且呢，呼吁艺术家们开始使用开源的视频模型，说现在有很多开源模型已经可以用了，效果还不错，这就是他们的一个公开信。现在呢，Open AI内部动荡不断，Sora到底什么时候能发布还遥遥无期，仅仅依靠零星露出的作品保持社交媒体关注度，Open AI呢是可以接受的，但是艺术家们肯定接受不了。

最后呢，就是艺术家毕竟不是工程师，不是律师，不是会计师，不是其他的这种社畜。如果他们完全按照逻辑，按照大家签的协议去做事的话，就不是艺术家了。所以，他们就整了这么一个幺蛾子出来，你虽然跟我签了保密协议，但是我们就啪，把这个东西扔到世界上最大的开元大模型的集散网站Hugging Face上去，让大家都瞅了这么一眼。

当然，现在也有人在讲说这个事情是不是又是Open AI的一次公关策略呢？现在不知道，因为Open AI绝对是社交媒体公关大师，不停的玩各种奇怪的事情。也许过一段时间，人家就突然就发布了，发现哎，这个江湖上又没有哥的声音再传播了，咱们得再整出点幺蛾子出来，这个都难说。

这些艺术家们在一个网站上开始征集签名，说来你们谁支持我。这个里边还有一个签名的人，号称叫埃隆·马斯克。只是签名的过程呢并不需要进行身份验证，所以也不知道这个是真是假。那么，视频生成为什么这么费劲呢？Open AI在年初的时候，就在2月份的时候，已经为全世界整个的AIGC行业指明了方向，这个贡献还是非常巨大的，我们要承认。

但是呢，视频生成本身的难度是很大的。第一个呢，就是内容合理性，其实很难保持。六个手指头、七个手指头，手长得很奇怪，图片生成模型既然已经有这种问题了，那么视频生成模型有同样的手指头问题，或者各种的合理性问题，这个都是很正常的，避免不了的。

还有就是物理破膜的问题。咱们做过3D动画的人都知道，经常是就会出现这种叫物理破膜。什么叫物理破膜？你比如说你穿了件衣服，里边呢有个人，但是呢人在做一些动作的时候，里边的肢体就会从衣服外边撑出来。在视频模型生成的时候，有可能也会发生同样的事情，包括一些解剖学错误，比如说这个脚要往前走的时候，应该膝盖是往后弯的。但是呢，你怎么能够把这个膝盖必须往后弯这件事告诉大模型，让他每一次生成的时候都向后弯？这个挺难的。

我们看过很多视频模型生成的内容，两条腿突然走着走着就变三条了，或者是这两条腿迈着迈着就都变成左脚了，变成右脚。在图像生成模型上，也会出现这种问题，视频生成模型更加难以避免。这是第一个问题。

第二个问题就是一致性可控性，这个呢其实也是从图像生成模型那边就遇到的问题，到视频生成模型依然难以搞定。现在呢，在图片生成模型的一致性上已经好一点。什么叫一致性？比如说你说让老范讲故事这张脸出现在不同的角色身上，或者是不同的艺术风格上，现在图片生成模型有一些方法，比如说自己去训练小模型，这个方式是可以让这个脸稍微的稳定一点的。

更大的难题是什么呢？就是视频要好看。最后生成完了以后，视频难看，没有人愿意看，没有人愿意传播，这个本身是没有任何意义和价值的。现在呢，做视频生成其实是在两个层面上大家在努力，第一个层面就是模型，怎么能够让模型更好；第二个层面是什么？就是怎么去操控，我到底应该用一些什么样的方式，对话吗，上传图片吗，然后一大堆菜单和选项吗？应该怎么能够让他进行顺畅的操作，把这个视频生成出来，这个其实非常难。

我记得在2014年的时候，有大量的团队尝试去做手机端的视频编辑软件，这个时候就发现，哎呀，这个实在太难了。因为最早的时候，视频编辑这件事情都是在视频编辑机，那是个硬件，在那个上面弄的。再往后呢，是在这种很专业的视频编辑电脑上面去操作，而且是由一些专业人士操作。当你要把视频编辑这件事情弄到手机上去操作的时候，需要调控的东西实在太多了，非常麻烦。

这个大家想象一下，就是有没有人见过飞机驾驶舱？从头上到脚下，你身边所有能看见的地方，全都是各种各样的开关和仪表。视频编辑其实跟这个过程很像，大量的参数和开关选项需要设置才能够得到你满意的视频。现在我们要做视频生成的这种工具了，你在有大模型的基础上，你也需要大量的这种开关选项、菜单或者是提示词，才能够告诉大模型我们到底要生成什么样的视频。

这些交互的过程应该如何去安排，这个对于现在所有的这种做视频生成工具的人来说，都是极大的挑战。到目前为止没有特别好使的，在这么难操控的情况下，你要能保证输出出来的视频是有人愿意看的，这个难度就会更大一些。所以为什么这帮艺术家也说说我们付出的努力极其艰巨呢，也是如此。

他们想控制Sora这样的一个半成品，甚至可能都没有界面，你还需要去写代码，才可以让他跑起来的一个系统，让这样的系统去输出需要的视频，这个是非常非常麻烦的。除了视频模型操作的问题之外，下一个问题就是视频安全性，风险要比图片、文字、音频都要大的多，甚至把所有的这些前面我们讲的这些风险都盛起来，都没有视频所生成的这种风险更大。

咱们前面讲的红队要去处理的问题，就是看怎么能够把这些风险在发布之前尽可能地发现，尽可能地排除掉。这些风险包括色情、暴力、歧视性的，而且歧视性你不能出现的同时呢，还不能矫枉过正。像谷歌前面就是矫枉过正了，你跟他说任何的提示词里边一定是有黄种人、有黑人、有白人、有男的、有女的，还有奇奇怪怪性别的人凑在一起，最后被骂的直接把这个接口封掉了。

所以这个到底掌握到什么步骤，他们也是很头疼的。再往后，什么欺诈？视频的欺诈那要比文字欺诈、图片欺诈、声音欺诈都要吓人，因为他真的像真的一样。因为这个东西呢完全可以以假乱真。我今天测试了一下，在剪映里边去使用真人数字人。什么叫真人数字人？就是有一个数字人在这讲话，但是呢，你可以自己上传一张照片，说我现在让这个人去讲话。

你要想做这个操作的话，剪映要干嘛？要去做人脸识别，保证你上传的这个照片是你自己，否则的话他就拒绝工作了。你说我今天上传一个雷军的，让他去骂人，去让他去做一些其他的事情，这个事他不干。当然，有其他的工具可以干这件事情。现在雷军骂人也好，于东来骂人也好，这种视频都是在满天飞的。

除了前面我们讲的什么欺诈呀、血腥、暴力、歧视之外，还有一个问题叫版权纷争。你一旦是遇到了版权纷争，这个对于视频来说也很麻烦。什么叫版权纷争？比如说请给我按照宫崎骏的风格画一个什么东西，或者生成一个什么动漫，或者星球大战里的一个什么角色去做一个什么样的事情，或者说你现在请用马斯克的脸给我生成一个什么东西，这个呢都面临着版权纠纷，包括一些品牌和形象的纠纷，这些是需要去注意的。

但是，这个但是后边才是重点，艺术表现力非常的差。甭管是跟最新的Flex比，还是跟Midjourney 6.1比，完全没法看。细节也是非常差的。他虽然可以把每一个提示词里边要求的东西都给你画上，但是呢，画的过程还是比较粗糙的，稍微擦点边的都拒绝服务。你比如说，我要求给我按照迪士尼的3D风格画一个什么东西，马上拒绝。你说现在请给我按照日本漫画风格画，可以画出来；说现在请按照宫崎骏的风格给我画，马上拒绝。

你只要提到任何人的名字，直接拒绝。说现在请按照哪一个漫画里的这个情节，七龙珠的漫画情节给我画一个东西，马上拒绝。请给我画个什么星球大战，什么米老鼠，马上拒绝。所以他的拒绝的东西实在是太多了。如果按照同样的政策去执行的话，那我觉得Sora是完全不值得期待的一个东西。

现在可以用的视频大模型其实已经不少了，甭管是Runway，还是国内能够使用的吉梦，吉梦是剪映下面的字节跳动做的，效果还可以。快手做的可灵效果其实也能够使用了，甚至在剪映内部也集成了视频直接生成的这种功能。这些呢已经可以达到一部分商业使用的能力了。现在的各种亲友照片变成视频，这种内容已经有很强的传播力了。

很多人会把一些过世亲友的照片拿出来，给他一个提示词，说这个人现在笑了，这个说话了，这个吃东西了，这个已经有一定的传播力了。数字人呢也已经开始赚钱了，甭管是数字人直播，还是数字人带货，或者数字人骂街，这块已经可以跑了。YouTube上呢，有很多的这种预告片开始吸引流量。什么意思呢？就是他经常告诉你说，现在哪一部大片后边要拍续集了，大家赶快去看呀。

当你看了以后，发现是有很多的前作剪辑，然后再加上一些AI生成的内容，拼凑起来的一个，你也不能说他粗制滥造，有的做的还可以，这样的视频我已经被这种视频骗了好多回了。我现在再看到说哪个大片要准备拍续集，上预告片了，我先得看谁发布的。如果不是原来那个电影的制作公司发布的，我就直接跳过不看了，很容易上当受骗。

现在很多的漫画、小说详解相关的视频，在抖音、快手上也开始在盈利赚钱了，所以这块呢已经走入了商业化。那么，以假乱真也造成了很多的困扰，比如说雷军骂人，于东来骂人，甚至还有人把德国选择党的那个女党首的这个视频配上中文上来，讲一些比较激烈的这种话语吧，这个也是很容易骗到人的。

下一步的AI工具会是什么样的呢？第一个专业应用级别呢，可能还是会有专门的人去做，就像现在我们，比如说在视频领域里头，我的视频处理都是用剪映的。但是呢，也还是有很多专业团队会使用一些更复杂的这种视频工具，Sora以后可能就会向那个方向发展，说我们干脆就永远不再向公众开放了，就是直接签约给这些电影公司，让他们去用，用完了以后出了所有东西，你们自己负责任，跟我就没有关系了，这是一种方式。

半专业的应用呢肯定还有待增强，普通人使用Sora这样的模型，或者使用其他的，刚才我们说的吉梦也好，可灵也好，还是挺难使的。他们可能还需要在用户交互上或者是工具上还要有待增强，这个大模型本身他们自己慢慢训就可以了。至于个人应用的话，是否能够爆发，我觉得应该还是可以爆发的，就是使用AI大模型生成视频的这种个人应用，但这个可能距离我们还稍微远一些。

这种半专业应用的话，应该正在路上。在吉梦也好，可灵也好，都在做手机APP，网站的这种Web APP，也在尝试跟各自的这种视频编辑工具进行结合。这一块的话，有可能会最先让我们看到成绩。

至于Open AI下边该干嘛去呢？我们已经讲了，Open AI的Sora已经不值得期待了。Open AI作为行业的排头兵老大，它有一个非常重要的职策，就是为整个行业指明下一个方向。他指明了Sora这一个方向以后，大家就赶快都去出了一堆可灵也好，吉梦也好，Runway Pica，一大堆的这样的视频模型就出来了。

好，这是今天讲的故事。感谢大家收听，请帮忙点赞点小铃铛，参加Discord讨论群，也欢迎有兴趣、有能力的朋友加入我们的付费频道。再见。

昨天，Sora短暂的泄露。但是，我们真的还需要等待Sora吗？大家好，欢迎收听老范讲故事的YouTube频道。在今年2月份，Open AI公布了他们的Sora大模型之后，大家一直在等待这个产品的正式发布。但是，等到了现在，已经到年底了，很多跟随Sora的产品都已经上线，都已经有很多用户开始使用了。Sora自己还遥遥无期。

在这样的一个时间点里，突然有一群艺术家将Sora的这个接口公开到了Hugging Face上面去，短暂的开放了一段时间。这些艺术家呢，还发表了一封公开信，表达了自己对于Open AI的各种剥削的不满。Open AI呢，及时发现，在一小时之后封闭了接口，说你们就到这吧，然后也出来做了一些解释，说这些艺术家们呢，都是跟我们一起去合作的，他们都是自愿参加的，没有什么强迫，大概也是讲了一些这种片汤话。

至于Sora什么时候能发布，人家也没有再继续提供更进一步的信息。那么，这一次泄露出来的呢，是Sora的Turbo版本。Turbo是轻量级快速的版本，就是不是一个全尺寸的模型，参数呢也并不是很突出。2月份，Sora当时号称自己是世界模型，可以仿真出世界来的。当时是可以出一分钟的视频的，虽然一分钟视频并没有那么大的用处，超过一分钟都属于是超长镜头了，电影里头用这种镜头其实也不是那么多。这一次呢只提供了1080P、720P、360P三种的分辨率，然后时长呢就是5到10秒钟，实际上跟我们现在可以使用到的大量的这种视频生成模型参数是一样的。

现在的视频生成模型基本上都是5到10秒钟。那么，艺术家们为什么干这么个事呢？原因呢也很简单，有一句话叫“富贵不归乡，如锦衣夜行”。什么意思呢？有钱了得回家显摆显摆去，要不然的话就跟穿了个好衣服，晚上出门没人看见那是一样的。对于这帮艺术家们来说，有了一个好东西，你又不让他们显摆，这肯定是非常非常不爽的。

那公开信里都写了什么呢？他写了说，艺术家们年初呢就被邀请加入了，艺术家们加入呢是分为三种不同的角色。第一个呢叫早期测试者，估计呢就是最一开始的一批人，还没有进行详细的分工，你们先来试试各种的接口能不能跑起来。第二个角色呢叫红队成员，这是干嘛使的？视频模型非常害怕一件事情，就是生成一些有害视频，色情、暴力、虚假呀，或者版权侵害什么这样的视频，所以呢需要一些成员说，你不断的向他提这样的要求，看看能不能都识别出来，拒绝服务，或者怎么能够规避，怎么能绕过，这个叫红队成员。

第三种呢叫创意合作伙伴。Sora每过一段时间呢会发出一些样板视频来，那意思是什么？他说你看我还活着呢，我还在继续往前走，你们其他人怎么追赶也追不上。现在呢，这些艺术家们感觉被骗了，为什么呢？因为付出很多，Sora这种模型绝对没有那么好使。不是说它输出的东西不好，而是说你要想使用这个模型，需要付出的努力一定是非常艰巨的，因为你需要向它描述你到底要一个什么样的视频。

它不像是我们普通人去使用图片生成模型，式的那我们只要写一个提示词，生成出来大差不差的，我就能用。那些人是艺术家，之所以他能成为艺术家，一定是他们对于自己的艺术产品有极高的要求。所以对于他们来说，想要让这种视频模型输出了自己能够满意的产品，或者叫作品吧，这个事本身是非常难的。

所以呢，他说哎，我们付出了很多，但是发表的作品呢又非常难，因为他们发表作品一定是经过层层筛选，甚至是竞赛，然后呢再要经过Open AI的审核，才有极少的一部分作品可以发表。即使是有作品被发表展示了，这些艺术家们呢应该也没有得到什么回报。对应一个1,500亿美金的Open AI来说，大家觉得这个事有点太不公平了。而且这么长时间，你要说时间短了还可以，Sora大模型的发布又遥遥无期。

这个就相当于什么？就是一帮人进去打测试服的游戏去了，结果呢始终也不给你公测，或者始终也不给你进正式上线，大家只能在里边参加各种删号测试，然后所有的测试还需要签保密协议，你还不能出来说。这个时间长了以后一定会造反的。艺术家们呢就觉得他们成为了OpenAI的公关噱头，就是每过一段时间，他们会在这么多艺术家，可能300多个艺术家里头，挑选那么几个作品放出来，说你看，这就是Sora现在能够达到的成就，你们其他人就羡慕去吧。这些呢其实是艺术家们的艰苦工作，并不是Sora本身模型到底有多好。

再往后呢是呼吁Open AI可以更加开放，你不要上来就是签一大堆保密协议，这个实在是对于艺术家们来说太不友好了。而且呢呼吁艺术家们开始使用开源的视频模型，说现在有很多开源模型已经可以用了，效果还不错。这就是他们的一个公开信。

现在呢，Open AI内部动荡不断，Sora到底什么时候能发布还遥遥无期，仅仅依靠零星露出的作品保持社交媒体关注度，Open AI呢是可以接受的，但是艺术家们肯定接受不了。最后呢，就是艺术家毕竟不是工程师，不是律师，不是会计师，不是其他的这种社畜。如果他们完全按照逻辑，按照大家签的协议去做事的话，就不是艺术家了。

所以他们就整了这么一个幺蛾子出来，你虽然跟我签了保密协议，但是我们就啪，把这个东西扔到世界上最大的开元大模型的集散网站Hugging Face上去，让大家都瞅了这么一眼。当然，现在也有人在讲说这个事情是不是又是Open AI的一次公关策略呢，现在不知道，因为Open AI绝对是社交媒体公关大师，不停的玩各种奇怪的事情。

也许过一段时间，人家就突然就发布了，发现哎，这个江湖上又没有哥的声音再传播了，咱们得再整出点幺蛾子出来，这个都难说。艺术家们在一个网站上开始征集签名，说来你们谁支持我，这里边还有一个签名的人，号称叫埃隆·马斯克。只是签名的过程呢并不需要进行身份验证，所以也不知道这个是真是假。

那么，视频生成为什么这么费劲呢？Open AI在年初的时候，2月份的时候，已经为全世界整个的AIGC行业指明了方向，这个贡献还是非常巨大的，我们要承认。但是呢，视频生成本身的难度是很大的。第一个呢，就是内容合理性，其实很难保持。六个手指头、七个手指头，手长得很奇怪，图片生成模型既然已经有这种问题了，那么视频生成模型有同样的手指头问题，或者各种的合理性问题，这个都是很正常的，避免不了的。

还有就是物理破膜的问题，咱们做过3D动画的人都知道，经常是就会出现这种叫物理破膜。什么叫物理破膜？你比如说你穿了件衣服，里边呢有个人，但是呢人在做一些动作的时候呢，里边的肢体就会从衣服外边撑出来。你在视频模型生成的时候，有可能也会发生同样的事情，包括一些解剖学错误，比如说这个脚要往前走的时候，应该膝盖是往后弯的。但是呢，你怎么能够把这个膝盖必须往后弯，这件事告诉大模型，让他每一次生成的时候都向后弯，这个挺难的。

我们看过很多视频模型生成的这种内容，两条腿突然走着走着就变三条了，或者是这个两条腿迈着迈着他都变成左脚了，都变成右脚。在图像生成模型上，也会出现这种问题，视频生成模型更加难以避免。这是第一个问题。

像一个视频，一秒钟25帧到30帧，你要保证每一帧上，比如说这里都带着一个麦克风，这个对于他们来说，非常非常难以控制和把握。再往后呢，就是算力成本实在太高了。图片生成，现在我们画一幅1080P的这种图像吧，大概就需要几个美分。那你想一秒钟25帧到30帧的视频，他需要多少算力？大家去做各种测试和实验的时候，这个成本是非常非常高。

当然了，这个还不是困扰视频生成本身的最大难题。更大的难题是什么呢？就是视频要好看，最后生成完了以后视频难看，没有人愿意看，没有人愿意传播，这个本身是没有任何意义和价值的。现在呢，做视频生成其实是在两个层面上大家在努力，第一个层面就是模型，怎么能够让模型更好。第二个层面是什么？就是怎么去操控，我到底应该用一些什么样的方式，对话吗？上传图片吗？然后一大堆菜单和选项吗？应该怎么能够让他进行顺畅的操作，把这个视频生成出来，这个其实非常难。

这个大家想象一下，就是有没有人见过飞机驾驶舱，从头上到脚下，你身边所有能看见的地方，全都是各种各样的开关和仪表。视频编辑其实跟这个过程很像，大量的参数和开关选项需要设置，才能够得到你满意的视频。现在我们要做视频生成的这种工具了，你在有大模型的基础上，你也需要大量的这种开关选项、菜单或者是提示词，才能够告诉大模型我们到底要生成什么样的视频。这些交互的过程应该如何去安排，这个对于现在所有的这种做视频生成工具的人来说，都是极大的挑战。

到目前为止没有特别好使的。在这么难操控的情况下，你要能保证输出出来的视频是有人愿意看的，这个难度就会更大一些。所以为什么这帮艺术家也说说我们付出的努力极其艰巨呢，也是如此。他们想控制Sora这样的一个半成品，甚至可能都没有界面，你还需要去写代码，才可以让他跑起来的一个系统，让这样的系统去输出需要的视频，这个是非常非常麻烦的。

除了视频模型操作的问题之外，下一个问题就是视频安全性，风险要比图片、文字、音频都要大的多，甚至把所有的这些前面我们讲的这些风险都盛起来，都没有视频所生成的这种风险更大。咱们前面讲的红队要去处理的问题，就是看怎么能够把这些风险在发布之前尽可能地发现，尽可能地排除掉。这些风险包括色情、暴力、歧视性的，而且歧视性你不能出现的同时呢，你还不能矫枉过正。像谷歌前面就是矫枉过正了，你跟他说，任何的提示词里边一定是有黄种人、有黑人、有白人，还有奇奇怪怪性别的人凑在一起，最后被骂的直接把这个接口封掉了。

所以这个到底掌握到什么步骤，他们也是很头疼的。再往后什么欺诈？视频的欺诈，那要比文字欺诈、图片欺诈、声音欺诈都要吓人，因为他真的像真的一样。因为这个东西呢完全的可以以假乱真。我今天测试了一下，在剪映里边去使用真人数字人。什么叫真人数字人？就是有一个数字人在这讲话，但是呢你可以自己上传一张照片，说我现在让这个人去讲话。你要想做这个操作的话，剪映要干嘛？要去做人脸识别，保证你上传的这个照片是你自己，否则的话他就拒绝工作了。

你说我今天上传一个雷军的，让他去骂人，去让他去做一些其他的事情，这个事他不干。当然有其他的工具可以干这件事情，现在雷军骂人也好，于东来骂人也好，这种视频都是在满天飞的。除了前面我们讲的什么欺诈呀、血腥暴力歧视之外，还有一个问题叫版权纷争。你一旦是遇到了版权纷争，这个对于视频来说也很麻烦。什么叫版权纷争？比如说请给我按照宫崎骏的风格画一个什么东西，或者生成一个什么动漫，或者星球大战里的一个什么角色去做一个什么样的事情，或者说你现在请用马斯克的脸给我生成一个什么东西，这个呢都面临着版权纠纷，包括一些品牌和形象的纠纷，这些是需要去注意的。

那么，我们到底还需不需要等Sora呢？其实从达利3的这个角度上来看，我觉得我们完全不需要再去期待Sora了。为什么呢？我们看看Dalle3现在画图的效果。首先咱们先说优点，文字理解还是相当不错的。当你给他一个很长的提示词的时候，他会把提示词中的各个部分都理解的很清楚，而且尽量的都给你画到这个图片上去，这个Dalle3算是最强的。但是，这个但是后边才是重点，艺术表现力非常的差。

甭管是跟最新的Flex比，还是跟Midjorney 6.1比，完全没法看。细节也是非常差的。他虽然可以把每一个提示词里边要求的东西都给你画上，但是呢，画的过程还是比较粗糙的，稍微擦点边的都拒绝服务。你比如说，我要求给我按照迪士尼的3D风格画一个什么东西，马上拒绝。你说现在请给我按照日本漫画风格画，可以画出来。说现在请按照宫崎骏的风格给我画，马上拒绝。你只要提到任何人的名字，直接拒绝。

所以他的拒绝的东西实在是太多了。如果按照同样的政策去执行的话，那我觉得Sora是完全不值得期待的一个东西。现在可以用的视频大模型其实已经不少了，甭管是Runway，还是国内能够使用的吉梦，吉梦是剪映下面的字节跳动做的，效果还可以。快手做的可灵效果其实也能够使用了，甚至在剪映内部，也集成了视频直接生成的这种功能，这些呢已经可以达到一部分商业使用的能力了。

YouTube上呢，有很多的这种预告片开始吸引流量。什么意思？就是他经常告诉你说，现在哪一部大片后边要拍续集了，大家赶快去看呀。当你看了以后，发现是有很多的前作剪辑，然后再加上一些AI生成的内容，拼凑起来的一个，你也不能说他粗制滥造，有的做的还可以。这样的一个视频，我已经被这种视频骗了好多回了。我现在再看到说哪个大片要准备拍续集，上预告片了，我先得看谁发布的。如果不是原来那个电影的制作公司发布的，我就直接跳过不看了，很容易上当受骗。

现在很多的漫画小说详解相关的视频在抖音在快手上也开始在盈利赚钱了，所以这块呢已经走入了商业化。那么，以假乱真也造成了很多的困扰，比如说雷军骂人、于东来骂人，甚至还有人把那个德国选择党的那个女党首，她的这个视频配上中文上来，讲一些比较激烈的这种话语吧，这个也是很容易骗到人的。

下一步的AI工具会是什么样的呢？第一个专业应用级别呢，可能还是会有专门的人去做，就像现在我们，比如说在视频领域里头，我的这个视频处理都是用剪映的。但是呢，也还是有很多专业团队会使用一些更复杂的这种视频工具，Sora以后可能就会向那个方向发展，说我们干脆就永远不再向公众开放了，就是直接签约给这些电影公司，让他们去用，用完了以后出了所有东西，你们自己负责任，跟我就没有关系了，这是一种方式。

半专业的应用呢肯定还有待增强。普通人使用Sora这样的模型，或者使用其他的刚才我们说的吉梦也好、可灵也好，还是挺难使的。他们可能还需要在用户交互上或者是工具上还要有待增强，这个大模型本身他们自己慢慢训就可以了。至于个人应用的话，是否能够爆发，我觉得应该还是可以爆发的，就是使用AI大模型生成视频的这种个人应用，但这个可能距离我们还稍微远一些。

这种半专业应用的话，应该正在路上，在吉梦也好、可灵也好，都在做手机APP，网站的这种Web APP也在尝试，跟各自的这种视频编辑工具进行结合，这一块的话，有可能会最先让我们看到成绩。

至于Open AI下边该干嘛去呢？我们已经讲了，Open AI的Sora已经不值得期待了。Open AI作为行业的排头兵老大，它有一个非常重要的职策，就是为整个行业指明下一个方向。他指明了Sora这一个方向以后，大家就赶快都去出了一堆，可灵也好、吉梦也好、Runway Pica，一大堆的这样的视频模型就出来了。他说我们要做O1这种可以带推理的模型，然后一堆的推理模型在这个后边就出来了。

今天我还装了一个叫QWQ，通义千问做的推理模型，在32B的参数下吧，可以达到甚至是部分超越O1 mini的这个能力了。他现在还达不到O1 Preview的这个能力，但是可以达到O1 Mini的能力，只有32B，那这个还是非常棒的一个东西。

好，这是今天讲的故事。感谢大家收听，请帮忙点赞点小铃铛，参加Discord讨论群，也欢迎有兴趣、有能力的朋友加入我们的付费频道。再见。

昨天，Sora短暂的泄露。但是，我们真的还需要等待Sora吗？大家好，欢迎收听老范讲故事的YouTube频道。在今年2月份，Open AI公布了他们的Sora大模型之后，大家一直在等待这个产品的正式发布。但是等到了现在，已经到年底了，很多跟随Sora的产品都已经上线，都已经有很多用户开始使用了，Sora自己还遥遥无期。

在这样的一个时间点里，突然有一群艺术家将Sora的这个接口公开到了Hugging Face上面去，短暂的开放了一段时间。这些艺术家呢，还发表了一封公开信，表达了自己对于Open AI的各种剥削的不满。Open AI呢，及时发现，在一小时之后封闭了接口，说你们就到这吧，然后也出来做了一些解释，说明这些艺术家们都是跟我们一起去合作的，他们都是自愿参加的，没有什么强迫，大概也是讲了一些这种片汤话。

至于Sora什么时候能发布，人家也没有再继续提供更进一步的信息。那么，这一次泄露出来的呢，是Sora的Turbo版本。Turbo是轻量级快速的版本，不是一个全尺寸的模型，参数呢也并不是很突出。2月份，Sora当时号称自己是世界模型，可以仿真出世界来的，当时是可以出一分钟的视频的，虽然一分钟视频并没有那么大的用处，超过一分钟都属于是超长镜头了，电影里头用这种镜头其实也不是那么多。这一次呢只提供了1080P、720P、360P三种的分辨率，然后时长呢就是5到10秒钟，实际上跟我们现在可以使用到的很多视频生成模型参数是一样的。

现在的视频生成模型基本上都是5-10秒钟。那么，艺术家们为什么干这么个事呢？原因呢也很简单，有一句话叫“富贵不归乡，如锦衣夜行”。什么意思呢？有钱了得回家显摆显摆去，要不然的话就跟穿了个好衣服，晚上出门没人看见那是一样的。对于这帮艺术家们来说，有了一个好东西，你又不让他们显摆，这肯定是非常非常不爽的。

那公开信里都写了什么呢？他写了说，艺术家们年初呢就被邀请加入了。艺术家们加入呢，是分为三种不同的角色。第一个呢叫早期测试者，估计呢就是最一开始的一批人，还没有进行详细的分工，你们先来试试各种的接口能不能跑起来。第二个角色呢叫红队成员，这是干嘛使的？视频模型非常害怕一件事情，就是生成一些有害视频，色情、暴力、虚假呀，或者版权侵害什么这样的视频，所以呢需要一些成员说，你不断的向他提这样的要求，看看能不能都识别出来，拒绝服务，或者怎么能够规避，怎么能绕过。

这个叫红队成员。第三种呢叫创意合作伙伴，Sora每过一段时间呢会发出一些样板视频来，那意思是什么？他说你看我还活着呢，我还在继续往前走，你们其他人怎么追赶也追不上。现在呢，这些艺术家们感觉被骗了，为什么呢？因为付出很多，Sora这种模型绝对没有那么好使。不是说它输出的东西不好，而是说你要想使用这个模型，需要付出的努力一定是非常艰巨的，因为你需要向它描述你到底要一个什么样的视频。

它不像是我们普通人去使用图片生成模型那样。我们只要写一个提示词，生成出来大差不差的，我就能用。这些人是艺术家，之所以能成为艺术家，一定是他们对于自己的艺术产品有极高的要求。所以，对于他们来说，想要让这种视频模型输出自己能够满意的产品，或者叫作品吧，这个事本身是非常难的。

所以呢，他们说：“我们付出了很多，但是发表的作品呢又非常难。”因为他们发表作品一定是经过层层筛选，甚至是竞赛，然后呢再要经过Open AI的审核，才有极少的一部分作品可以发表。即使是有作品被发表展示了，这些艺术家们呢，应该也没有得到什么回报。对应一个1,500亿美金的Open AI来说，大家觉得这个事有点太不公平了。而且这么长时间，你要说时间短了还可以，Sora大模型的发布又遥遥无期。

这个就相当于什么？就是一帮人进去打测试服的游戏去了，结果呢始终也不给你公测，或者始终也不给你进正式上线，大家只能在里边参加各种删号测试，然后所有的测试还需要签保密协议，你还不能出来说。这个时间长了以后一定会造反的。

艺术家们呢，就觉得他们成为了OpenAI的公关噱头。就是每过一段时间，他们会在这么多艺术家，可能300多个艺术家里头，挑选那么几个作品放出来，说你看，这就是Sora现在能够达到的成就，你们其他人就羡慕去吧。这些呢，其实是艺术家们的艰苦工作，并不是Sora本身模型到底有多好。再往后呢，是呼吁Open AI可以更加开放。

你不要上来就是签一大堆保密协议，这个实在是对于艺术家们来说太不友好了。而且呢，呼吁艺术家们开始使用开源的视频模型，表示现在有很多开源模型已经可以用了，效果还不错。这就是他们的一个公开信。

所以，他们就整了这么一个幺蛾子出来。你虽然跟我签了保密协议，但是我们就啪，把这个东西扔到世界上最大的开源大模型的集散网站Hugging Face上去，让大家都瞅了这么一眼。当然现在也有人在讲说这个事情是不是又是Open AI的一次公关策略呢，现在不知道，因为Open AI绝对是社交媒体公关大师，不停的玩各种奇怪的事情。

也许过一段时间，人家就突然就发布了，发现哎，这个江湖上又没有哥的声音再传播了，咱们得再整出点幺蛾子出来，这个都难说。这些艺术家们在一个网站上开始征集签名，说来，你们谁支持我。这个里边还有一个签名的人，号称叫埃隆·马斯克。只是签名的过程呢，并不需要进行身份验证，所以也不知道这个是真是假。

还有就是物理破膜的问题。咱们做过3D动画的人都知道，经常是就会出现这种叫物理破膜。什么叫物理破膜？你比如说你穿了件衣服，里边呢有个人，但是呢人在做一些动作的时候，里边的肢体就会从衣服外边撑出来。你在视频模型生成的时候，有可能也会发生同样的事情，包括一些解剖学错误，比如说这个脚要往前走的时候，应该膝盖是往后弯的。但是呢，你怎么能够把这个膝盖必须往后弯这件事告诉大模型，让他每一次生成的时候都向后弯？这个挺难的。

我们看过很多视频模型生成的这种内容，两条腿突然走着走着就变三条了，或者是这两条腿迈着迈着都变成左脚了，都变成右脚。在图像生成模型上也会出现这种问题，视频生成模型更加难以避免。这是第一个问题。

第二个问题就是一致性可控性，这个呢其实也是从图像生成模型那边就遇到的问题，到视频生成模型依然难以搞定。现在呢，在图片生成模型的一致性上已经好一点。什么叫一致性？比如说你说让老范讲故事这张脸出现在不同的角色身上，或者是不同的艺术风格上，现在图片生成模型有一些方法，比如说自己去训练小模型，这种方式是可以让这个脸稍微的稳定一点的。

脸是一方面，然后这个身材、身上的衣服、各种配饰，你要让所有的这些图片都很稳定的保持一致性，这个很难。像一个视频，一秒钟25帧到30帧，你要保证每一帧上，比如说这里都带着一个麦克风，这个对于他们来说非常非常难以控制和把握。

再往后呢，就是算力成本实在太高了。图片生成，现在我们画一幅1080P的这种图像吧，大概就需要几个美分。那你想一秒钟25帧到30帧的视频，他需要多少算力？大家去做各种测试和实验的时候，这个成本是非常非常高的。当然了，这个还不是困扰视频生成本身的最大的难题，更大的难题是什么呢？就是视频要好看。

最后生成完了以后视频难看，没有人愿意看，没有人愿意传播，这个本身是没有任何意义和价值的。现在呢，做视频生成其实是在两个层面上大家在努力。第一个层面就是模型，怎么能够让模型更好。第二个层面是什么？就是怎么去操控，我到底应该用一些什么样的方式，对话吗，上传图片吗，然后一大堆菜单和选项吗？应该怎么能够让他进行顺畅的操作，把这个视频生成出来，这个其实非常难。

这个大家想象一下，有没有人见过飞机驾驶舱，从头上到脚下，你身边所有能看见的地方，全都是各种各样的开关和仪表。视频编辑其实跟这个过程很像，大量的参数和开关选项需要设置才能够得到你满意的视频。现在我们要做视频生成的这种工具了，你在有大模型的基础上，也需要大量的这种开关选项、菜单或者是提示词，才能够告诉大模型我们到底要生成什么样的视频。

这些交互的过程应该如何去安排，这个对于现在所有的这种做视频生成工具的人来说都是极大的挑战。到目前为止没有特别好使的，在这么难操控的情况下，你要能保证输出出来的视频是有人愿意看的，这个难度就会更大一些。所以为什么这帮艺术家也说，我们付出的努力极其艰巨呢？也是如此，他们想控制Sora这样的一个半成品，甚至可能都没有界面，你还需要去写代码，才可以让他跑起来的一个系统，让这样的系统去输出需要的视频，这个是非常非常麻烦的。

像谷歌前面就是矫枉过正了。你跟他说，任何的提示词里边一定是有黄种人、有黑人、有白人，有男的、有女的，还有奇奇怪怪性别的人凑在一起，最后被骂的直接把这个接口封掉了。所以这个到底掌握到什么步骤，他们也是很头疼的。

再往后什么欺诈，视频的欺诈那要比文字欺诈、图片欺诈、声音欺诈都要吓人，因为他真的像真的一样。因为这个东西呢，完全的可以以假乱真。我今天测试了一下，在剪映里边去使用真人数字人。什么叫真人数字人？就是有一个数字人在这讲话，但是呢你可以自己上传一张照片，说我现在让这个人去讲话。

你要想做这个操作的话，剪映要干嘛？要去做人脸识别，保证你上传的这个照片是你自己，否则的话他就拒绝工作了。你说我今天上传一个雷军的，让他去骂人，去让他去做一些其他的事情，这个事他不干。当然有其他的工具可以干这件事情，现在雷军骂人也好，于东来骂人也好，这种视频都是在满天飞的。

除了前面我们讲的什么欺诈、血腥、暴力、歧视之外，还有一个问题叫版权纷争。你一旦是遇到了版权纷争，这个对于视频来说也很麻烦。什么叫版权纷争？比如说请给我按照宫崎骏的风格画一个什么东西，或者生成一个什么动漫，或者星球大战里的一个什么角色去做一个什么样的事情，或者说你现在请用马斯克的脸给我生成一个什么东西，这个呢都面临着版权纠纷，包括一些品牌和形象的纠纷，这些是需要去注意的。

但是，这个但是后边才是重点，艺术表现力非常的差。甭管是跟最新的Flex比，还是跟Midjorney 6.1比，完全没法看。细节也是非常差的。他虽然可以把每一个提示词里边要求的东西都给你画上，但是呢，画的过程还是比较粗糙的，稍微擦点边的都拒绝服务。你比如说，我要求给我按照迪士尼的3D风格画一个什么东西，马上拒绝。你说现在请给我按照日本漫画风格画，可以画出来；说现在请按照宫崎骏的风格给我画，马上拒绝。你只要提到任何人的名字，直接拒绝。

所以他的拒绝的东西实在是太多了。如果按照同样的政策去执行的话，那我觉得Sora是完全不值得期待的一个东西。现在可以用的视频大模型其实已经不少了，甭管是Runway，还是国内能够使用的吉梦，吉梦是剪映下面的字节跳动做的，效果还可以。快手做的可灵效果其实也能够使用了，甚至在剪映内部也集成了视频直接生成的这种功能，这些呢已经可以达到一部分商业使用的能力了。

现在的各种亲友照片变成视频，这种内容已经有很强的传播力了。很多人会把一些过世亲友的照片拿出来，给他一个提示词，说这个人现在笑了，这个人人说话了，这个人吃东西了，这个已经有一定的传播力了。数字人呢，也已经开始赚钱了，甭管是数字人直播，还是数字人带货，或者数字人骂街，这块已经可以跑了。

YouTube上呢，有很多的这种预告片开始吸引流量。什么意思？就是他经常告诉你说现在哪一部大片后边要拍续集了，大家赶快去看呀。当你看了以后，发现是有很多的前作剪辑，然后再加上一些AI生成的内容，拼凑起来的一个，你也不能说他粗制滥造，有的做的还可以，这样的一个视频。我已经被这种视频骗了好多回了。我现在再看到说哪个大片要准备拍续集，上预告片了，我先得看谁发布的。如果不是原来那个电影的制作公司发布的，我就直接跳过不看了，很容易上当受骗。

现在很多的漫画小说详解相关的视频在抖音、快手上也开始在盈利赚钱了，所以这块呢已经走入了商业化。以假乱真也造成了很多的困扰，比如说雷军骂人，于东来骂人，甚至还有人把那个德国选择党的那个女党首，她的这个视频配上中文上来，讲一些比较激烈的这种话语，这个也是很容易骗到人的。

下一步的AI工具会是什么样的呢？第一个专业应用级别呢，可能还是会有专门的人去做，就像现在我们，比如说在视频领域里头，我的这个视频处理都是用剪映的。但是呢，也还是有很多专业团队会使用一些更复杂的这种视频工具。Sora以后可能就会向那个方向发展，说我们干脆就永远不再向公众开放了，就是直接签约给这些电影公司，让他们去用。用完了以后出了所有东西，你们自己负责任，跟我就没有关系了，这是一种方式。

半专业的应用呢肯定还有待增强，普通人使用Sora这样的模型，或者使用其他的刚才我们说的吉梦也好，可灵也好，还是挺难使的。他们可能还需要在用户交互上，或者是工具上还要有待增强，这个大模型本身，他们自己慢慢训就可以了。至于个人应用的话，是否能够爆发，我觉得应该还是可以爆发的，就是使用AI大模型生成视频的这种个人应用，但这个可能距离我们还稍微远一些。

这种半专业应用的话，应该正在路上。在吉梦也好，可灵也好，都在做手机APP，网站的这种Web APP，也在尝试跟各自的这种视频编辑工具进行结合，这一块的话，有可能会最先让我们看到成绩。

所以再往下一个方向到底是什么，虽然很多的厂商也在尝试去摸索寻找新方向，但是呢都没有Open AI指的方向。他只要摇旗呐喊，大家就直接跟风往上冲，没有这种号召力。所以我们期待Open AI可以给大家指明下一个方向，等指明了以后，全世界的厂商再顺着这个方向往前跑。

好，这是今天讲的故事，感谢大家收听，请帮忙点赞点小铃铛，参加Discord讨论群，也欢迎有兴趣、有能力的朋友加入我们的付费频道。再见。

昨天，Sora短暂的泄露。但是，我们真的还需要等待Sora吗？大家好，欢迎收听老范讲故事的YouTube频道。在今年2月份，Open AI公布了他们的Sora大模型之后，大家一直在等待这个产品的正式发布。但是等到了现在，已经到年底了，很多跟随Sora的产品都已经上线，都已经有很多用户开始使用了。Sora自己还遥遥无期。

至于Sora什么时候能发布，人家也没有再继续提供更进一步的信息。那么这一次泄露出来的呢，是Sora的Turbo版本。Turbo是轻量级快速的版本，就是不是一个全尺寸的模型，参数呢也并不是很突出。2月份，Sora当时号称自己是世界模型，可以仿真出世界来的。当时是可以出一分钟的视频的，虽然一分钟视频并没有那么大的用处，超过一分钟都属于是超长镜头了，电影里头用这种镜头其实也不是那么多。这一次呢只提供了1080P、720P、360P三种的分辨率，然后时长呢就是5到10秒钟，其实跟我们现在可以使用到的大量的这种视频生成模型参数是一样的。

现在的视频生成模型基本上都是5到10秒钟。那么艺术家们为什么干这么个事呢？原因呢也很简单，有一句话叫“富贵不归乡，如锦衣夜行。”什么意思呢？有钱了得回家显摆显摆去，要不然的话就跟穿了个好衣服，晚上出门没人看见那是一样的。对于这帮艺术家们来说，有了一个好东西，你又不让他们显摆，这肯定是非常非常不爽的。

那公开信里都写了什么呢？他写了说，艺术家们年初呢就被邀请加入了，艺术家们加入呢是分为三种不同的角色。第一个呢叫早期测试者，估计呢就是最一开始的一批人，还没有进行详细的分工，你们先来试试各种的接口能不能跑起来。第二个角色呢叫红队成员，这是干嘛使的？视频模型非常害怕一件事情，就是生成一些有害视频，色情、暴力、虚假呀，或者版权侵害这样的视频，所以呢需要一些成员说，你不断的向他提这样的要求，看看能不能都识别出来，拒绝服务或者怎么能够规避，怎么能绕过，这个叫红队成员。

第三种呢叫创意合作伙伴。Sora每过一段时间呢会发出一些样板视频来，那意思是什么？他说你看我还活着呢，我还在继续往前走，你们其他人怎么追赶也追不上。现在呢这些艺术家们感觉被骗了，为什么呢？因为付出很多，Sora这种模型绝对没有那么好使。不是说它输出的东西不好，而是说你要想使用这个模型，需要付出的努力一定是非常艰巨的，因为你需要向它描述你到底要一个什么样的视频。它不像是我们普通人去使用图片生成模型式的，那我们只要写一个提示词，生成出来大差不差的，我就能用。

这些人是艺术家，之所以他能成为艺术家，一定是他们对于自己的艺术产品有极高的要求。所以对于他们来说，想要让这种视频模型输出了自己能够满意的产品，或者叫作品吧，这个事本身是非常难的。于是他们说：“我们付出了很多，但是发表的作品呢又非常难。”因为他们发表作品一定是经过层层筛选，甚至是竞赛，然后呢再要经过Open AI的审核，才有极少的一部分作品可以发表。

艺术家们呢就觉得他们成为了OpenAI的公关噱头，就是每过一段时间，他们会在这么多艺术家，可能300多个艺术家里头，挑选那么几个作品放出来，说你看，这就是Sora现在能够达到的成就，你们其他人就羡慕去吧。这些呢其实是艺术家们的艰苦工作，并不是Sora本身模型到底有多好。再往后呢是呼吁Open AI可以更加开放，你不要上来就是签一大堆保密协议，这个实在是对于艺术家们来说太不友好了。而且呢呼吁艺术家们开始使用开源的视频模型，说现在有很多开源模型已经可以用了，效果还不错，这就是他们的一个公开信。

现在呢Open AI内部动荡不断，Sora到底什么时候能发布还遥遥无期，仅仅依靠零星露出的作品保持社交媒体关注度，Open AI呢是可以接受的，但是艺术家们肯定接受不了。最后呢就是艺术家毕竟不是工程师，不是律师，不是会计师，不是其他的这种社畜。如果他们完全按照逻辑，按照大家签的协议去做事的话，就不是艺术家了。所以他们就整了这么一个幺蛾子出来，你虽然跟我签了保密协议，但是我们就把这个东西扔到世界上最大的开源大模型的集散网站Hugging Face上去，让大家都瞅了这么一眼。

当然现在也有人在讲说这个事情是不是又是Open AI的一次公关策略呢，现在不知道，因为Open AI绝对是社交媒体公关大师，不停的玩各种奇怪的事情。也许过一段时间，人家就突然就发布了，发现这个江湖上又没有哥的声音再传播了，咱们得再整出点幺蛾子出来，这个都难说。

这些艺术家们在一个网站上开始征集签名，谁支持我，这里边还有一个签名的人，号称叫埃隆·马斯克。只是签名的过程呢并不需要进行身份验证，所以也不知道这个是真是假。那么视频生成为什么这么费劲呢？Open AI在年初的时候，2月份的时候，已经为全世界整个的AIGC行业指明了方向，这个贡献还是非常巨大的，我们要承认。但是呢，视频生成本身的难度是很大的。

第一个呢就是内容合理性，其实很难保持。六个手指头、七个手指头，手长得很奇怪。图片生成模型既然已经有这种问题了，那么视频生成模型有同样的手指头问题，或者各种的合理性问题，这个都是很正常的，避免不了的。还有就是物理破膜的问题。咱们做过3D动画的人都知道，经常是就会出现这种叫物理破膜。什么叫物理破膜？你比如说你穿了件衣服，里边呢有个人，但是呢人在做一些动作的时候呢，里边的肢体就会从衣服外边撑出来。

你在视频模型生成的时候，有可能也会发生同样的事情，包括一些解剖学错误。比如说这个脚要往前走的时候，应该膝盖是往后弯的。但是呢，你怎么能够把这个膝盖必须往后弯这件事告诉大模型，让他每一次生成的时候都向后弯，这个挺难的。我们看过很多视频模型生成的这种内容，两条腿突然走着走着就变三条了，或者是这个两条腿迈着迈着他都变成左脚了，都变成右脚。在图像生成模型上，也会出现这种问题，视频生成模型更加难以避免。

这是第一个问题。第二个问题就是一致性可控性，这个呢其实也是从图像生成模型那边就遇到的问题，到视频生成模型依然难以搞定。现在呢在图片生成模型的一致性上已经好一点。什么叫一致性？比如说你说让老范讲故事这张脸出现在不同的角色身上，或者是不同的艺术风格上。现在图片生成模型有一些方法，比如说自己去训练小模型，这个方式是可以让这个脸稍微的稳定一点的。脸是一方面，然后这个身材，身上的衣服各种配饰，你要让所有的这些图片都很稳定的保持一致性，这个很难。

像一个视频，一秒钟25帧到30帧，你要保证每一帧上，比如说这里都带着一个麦克风，这个对于他们来说非常非常难以控制和把握。再往后呢就是算力成本实在太高了。图片生成现在我们画一幅1080P的这种图像吧，大概就需要几个美分。那你想一秒钟25帧到30帧的视频，他需要多少算力？大家去做各种测试和实验的时候，这个成本是非常非常高。

当然了，这个还不是困扰视频生成本身的最大的难题。更大的难题是什么呢？就是视频要好看。最后生成完了以后视频难看，没有人愿意看，没有人愿意传播，这个本身是没有任何意义和价值的。现在呢做视频生成，其实是在两个层面上大家在努力。第一个层面就是模型，怎么能够让模型更好；第二个层面是什么？就是怎么去操控，我到底应该用一些什么样的方式对话吗，上传图片吗，然后一大堆菜单和选项吗？应该怎么能够让他进行顺畅的操作，把这个视频生成出来，这个其实非常难。

我记得在2014年的时候，有大量的团队尝试去做手机端的视频编辑软件。这个时候就发现，哎呀，这个实在太难了，因为最早的时候，视频编辑这件事情都是在视频编辑机，那是个硬件，在那个上面弄的。再往后呢是在这种很专业的视频编辑电脑上面去操作，而且是由一些专业人士操作。当你要把视频编辑这件事情弄到手机上去操作的时候，需要调控的东西实在太多了，非常麻烦。这大家想象一下，就是有没有人见过飞机驾驶舱？从头上到脚下，你身边所有能看见的地方，全都是各种各样的开关和仪表。

视频编辑其实跟这个过程很像，大量的参数和开关选项需要设置才能够得到你满意的视频。现在我们要做视频生成的这种工具了，你在有大模型的基础上，也需要大量的这种开关选项、菜单或者是提示词，才能够告诉大模型我们到底要生成什么样的视频。这些交互的过程应该如何去安排，这个对于现在所有的这种做视频生成工具的人来说，都是极大的挑战。

到目前为止没有特别好使的。在这么难操控的情况下，你要能保证输出出来的视频是有人愿意看的，这个难度就会更大一些。所以为什么这帮艺术家也说说：“我们付出的努力极其艰巨呢？”也是如此。他们想控制Sora这样的一个半成品，甚至可能都没有界面，你还需要去写代码，才可以让他跑起来的一个系统，让这样的系统去输出需要的视频，这个是非常非常麻烦的。

除了视频模型操作的问题之外，下一个问题就是视频安全性，风险要比图片、文字、音频都要大得多，甚至把所有的这些前面我们讲的这些风险都盛起来，都没有视频所生成的这种风险更大。咱们前面讲的红队要去处理的问题，就是看怎么能够把这些风险在发布之前尽可能地发现，尽可能地排除掉。这些风险包括色情、暴力、歧视性的，而且歧视性你不能出现的同时呢，你还不能矫枉过正。像谷歌前面就是矫枉过正了，你跟他说，任何的提示词里边一定是有黄种人、有黑人、有白人、有男的、有女的，还有奇奇怪怪性别的人凑在一起，最后被骂的直接把这个接口封掉了。所以这个到底掌握到什么步骤，他们也是很头疼的。

再往后什么欺诈，视频的欺诈那要比文字欺诈、图片欺诈、声音欺诈都要吓人，因为他真的像真的一样。因为这个东西呢完全可以以假乱真。我今天测试了一下，在剪映里边去使用真人数字人。什么叫真人数字人？就是有一个数字人在这讲话，但是呢你可以自己上传一张照片，说我现在让这个人去讲话。你要想做这个操作的话，剪映要干嘛？要去做人脸识别，保证你上传的这个照片是你自己，否则的话他就拒绝工作了。你说我今天上传一个雷军的，让他去骂人，去让他去做一些其他的事情，这个事他不干。当然有其他的工具可以干这件事情，现在雷军骂人也好，于东来骂人也好，这种视频都是在满天飞的。

除了前面我们讲的什么欺诈呀、血腥暴力、歧视之外，还有一个问题叫版权纷争。你一旦是遇到了版权纷争，这个对于视频来说也很麻烦。什么叫版权纷争？比如说请给我按照宫崎骏的风格画一个什么东西，或者生成一个什么动漫，或者星球大战里的一个什么角色去做一个什么样的事情，或者说你现在请用马斯克的脸给我生成一个什么东西，这个呢都面临着版权纠纷，包括一些品牌和形象的纠纷，这些是需要去注意的。那么我们到底还需不需要等Sora呢？

其实从达利3的这个角度上来看，我觉得我们完全不需要再去期待Sora了。为什么呢？我们看看Dalle3现在画图的效果。首先咱们先说优点，文字理解还是相当不错的。当你给他一个很长的提示词的时候，他会把提示词中的各个部分都理解得很清楚，而且尽量的都给你画到这个图片上去。这个Dalle3算是最强的。但是，这个但是后边才是重点，艺术表现力非常的差。甭管是跟最新的Flex比，还是跟Midjorney 6.1比，完全没法看。细节也是非常差的。他虽然可以把每一个提示词里边要求的东西都给你画上，但是呢，画的过程还是比较粗糙的，稍微擦点边的都拒绝服务。

现在可以用的视频大模型其实已经不少了，甭管是runway还是国内能够使用的吉梦，吉梦是剪映下面的字节跳动做的，效果还可以。快手做的可灵效果其实也能够使用了，甚至在剪映内部也集成了视频直接生成的这种功能，这些呢已经可以达到一部分商业使用的能力了。现在的各种亲友照片变成视频，这种内容已经有很强的传播力了。很多人会把一些过世亲友的照片拿出来，给他一个提示词，说这个人现在笑了，这个人人说话了，这个人吃东西了，这个已经有一定的传播力了。

数字人呢也已经开始赚钱了，甭管是数字人直播，还是数字人带货，或者数字人骂街，这块已经可以跑了。YouTube上呢有很多的这种预告片开始吸引流量。什么意思？就是他经常告诉你说，现在哪一部大片后边要拍续集了，大家赶快去看呀。当你看了以后，发现是有很多的前作剪辑，然后再加上一些AI生成的内容，拼凑起来的一个，你也不能说他粗制滥造，有的做的还可以，这样的视频我已经被这种视频骗了好多回了。我现在再看到说哪个大片要准备拍续集，上预告片了，我先得看谁发布的。如果不是原来那个电影的制作公司发布的，我就直接跳过不看了，很容易上当受骗。

现在很多的漫画小说详解相关的视频在抖音、快手上也开始在盈利赚钱了，所以这块呢已经走入了商业化。以假乱真也造成了很多的困扰，比如说雷军骂人、于东来骂人，甚至还有人把那个德国选择党的那个女党首，她的这个视频配上中文上来，讲一些比较激烈的这种话语吧，这个也是很容易骗到人的。

下一步的AI工具会是什么样的呢？第一个专业应用级别呢，可能还是会有专门的人去做，就像现在我们，比如说在视频领域里头，我的这个视频处理都是用剪映的，但是呢也还是有很多专业团队会使用一些更复杂的这种视频工具。Sora以后可能就会向那个方向发展，说我们干脆就永远不再向公众开放了，就是直接签约给这些电影公司，让他们去用。用完了以后出了所有东西，你们自己负责任，跟我就没有关系了，这是一种方式。

半专业的应用呢肯定还有待增强，普通人使用Sora这样的模型或者使用其他的刚才我们说的吉梦也好，可灵也好，还是挺难使的。他们可能还需要在用户交互上或者是工具上还要有待增强，这个大模型本身他们自己慢慢训就可以了。至于个人应用的话，是否能够爆发，我觉得应该还是可以爆发的，就是使用AI大模型生成视频的这种个人应用。但是呢，这个可能距离我们还稍微远一些。这种半专业应用的话，应该正在路上，在吉梦也好可灵也好呢，都在做手机APP，网站的这种Web APP也在尝试跟各自的这种视频编辑工具进行结合，这一块的话有可能会最先让我们看到成绩。

至于Open AI下边该干嘛去呢？我们已经讲了，Open AI的Sora已经不值得期待了。Open AI作为行业的排头兵老大，它有一个非常重要的职策，就是为整个行业指明下一个方向。他指明了Sora这一个方向以后，大家就赶快都去出了一堆可灵也好、吉梦也好、Runway Pica，一大堆的这样的视频模型就出来了。他说我们要做O1这种可以带推理的模型，然后一堆的推理模型在这个后边就出来了。

今天我还装了一个叫QWQ，通义千问做的推理模型。在32B的参数下吧，可以达到甚至是部分超越O1 mini的这个能力了。他现在还达不到O1 Preview的这个能力，但是可以达到O1 Mini的能力，只有32B，那这个还是非常棒的一个东西。所以再往下一个方向到底是什么？虽然很多的厂商也在尝试去摸索，寻找新方向，但是呢都没有Open AI指的方向。他只要摇旗呐喊，大家就直接跟风往上冲，没有这种号召力。

所以我们期待Open AI可以给大家指明下一个方向，等指明了以后，全世界的厂商再顺着这个方向往前跑。好，这是今天讲的故事，感谢大家收听，请帮忙点赞点小铃铛，参加discord讨论群，也欢迎有兴趣、有能力的朋友加入我们的付费频道。再见。

其实，从达利3的这个角度上来看，我觉得我们完全不需要再去期待Sora了。为什么呢？我们看看Dalle3现在画图的效果。首先，咱们先说优点，文字理解还是相当不错的。当你给他一个很长的提示词的时候，他会把提示词中的各个部分都理解得很清楚，而且尽量的都给你画到这个图片上去。这个Dalle3算是最强的。但是，这个“但是”后边才是重点，艺术表现力非常的差。甭管是跟最新的Flex比，还是跟Midjorney 6.1比，完全没法看。细节也是非常差的。他虽然可以把每一个提示词里边要求的东西都给你画上，但是画的过程还是比较粗糙的。稍微擦点边的都拒绝服务。

你比如说，我要求给我按照迪士尼的3D风格画一个什么东西，马上拒绝。你说现在请给我按照日本漫画风格画，可以画出来。说现在请按照宫崎骏的风格给我画，马上拒绝。你只要提到任何人的名字，直接拒绝。说现在请按照哪一个漫画里的这个情节，七龙珠的漫画情节给我画一个东西，马上拒绝。请给我画个什么星球大战，什么米老鼠，马上拒绝。所以他的拒绝的东西实在是太多了。如果按照同样的政策去执行的话，那我觉得Sora是完全不值得期待的一个东西。

现在可以用的视频大模型其实已经不少了，甭管是runway还是国内能够使用的吉梦。吉梦是剪映下面的字节跳动做的，效果还可以。快手做的可灵效果其实也能够使用了，甚至在剪映内部也集成了视频直接生成的这种功能。这些呢，已经可以达到一部分商业使用的能力了。现在的各种亲友照片变成视频，这种内容已经有很强的传播力了。很多人会把一些过世亲友的照片拿出来，给他一个提示词，说这个人现在笑了，这个人说话了，这个人吃东西了，这个已经有一定的传播力了。

数字人呢，也已经开始赚钱了，甭管是数字人直播，还是数字人带货，或者数字人骂街，这块已经可以跑了。YouTube上呢，有很多的这种预告片开始吸引流量。什么意思？就是他经常告诉你说，现在哪一部大片后边要拍续集了，大家赶快去看呀。当你看了以后，发现是有很多的前作剪辑，然后再加上一些AI生成的内容，拼凑起来的一个你也不能说他粗制滥造，有的做的还可以。这样的一个视频，我已经被这种视频骗了好多回了。我现在再看到说哪个大片要准备拍续集，上预告片了，我先得看谁发布的。如果不是原来那个电影的制作公司发布的，我就直接跳过不看了，很容易上当受骗。

现在很多的漫画小说详解相关的视频，在抖音、快手上也开始在盈利赚钱了，所以这块呢已经走入了商业化。至于Open AI下边该干嘛去呢，我们已经讲了，Open AI的Sora已经不值得期待了。Open AI作为行业的排头兵老大，它有一个非常重要的职策，就是为整个行业指明下一个方向。他指明了Sora这个方向以后，大家就赶快都去出了一堆可灵也好，吉梦也好，Runway Pica，一大堆的这样的视频模型就出来了。

所以，我们期待Open AI可以给大家指明下一个方向。等指明了以后，全球的厂商再顺着这个方向往前跑。好，这是今天讲的故事，感谢大家收听，请帮忙点赞、点小铃铛，参加discord讨论群，也欢迎有兴趣、有能力的朋友加入我们的付费频道。再见。

昨天，Sora短暂地泄露。但是，我们真的还需要等待Sora吗？大家好，欢迎收听老范讲故事的YouTube频道。在今年2月份，Open AI公布了他们的Sora大模型之后，大家一直在等待这个产品的正式发布。但是等到了现在，已经到年底了，很多跟随Sora的产品都已经上线，已经有很多用户开始使用了。Sora自己还遥遥无期。

在这样的一个时间点里，突然有一群艺术家将Sora的这个接口公开到了Hugging Face上面去，短暂地开放了一段时间。这些艺术家还发表了一封公开信，表达了自己对于Open AI的各种剥削的不满。Open AI及时发现，在一小时之后封闭了接口，说你们就到这吧，然后也出来做了一些解释，称这些艺术家们都是跟我们一起去合作的，他们都是自愿参加的，没有什么强迫。大概也是讲了一些这种片汤话。

至于Sora什么时候能发布，人家也没有再继续提供更进一步的信息。那么，这一次泄露出来的呢，是Sora的Turbo版本。Turbo是轻量级快速的版本，不是一个全尺寸的模型，参数也并不是很突出。2月份，Sora当时号称自己是世界模型，可以仿真出世界来的，当时是可以出一分钟的视频的。虽然一分钟视频并没有那么大的用处，超过一分钟都属于超长镜头了，电影里头用这种镜头其实也不是那么多。这一次只提供了1080P、720P、360P三种的分辨率，时长就是5到10秒钟。其实跟我们现在可以使用到的大量这种视频生成模型参数是一样的，现在的视频生成模型基本上都是5到10秒钟。

那么，艺术家们为什么干这么个事呢？原因很简单。有一句话叫“富贵不归乡，如锦衣夜行”。什么意思呢？有钱了得回家显摆显摆，要不然的话就跟穿了个好衣服，晚上出门没人看见那是一样的。对于这帮艺术家们来说，有了一个好东西，你又不让他们显摆，这肯定是非常非常不爽的。

那公开信里都写了什么呢？他写了说，艺术家们年初就被邀请加入了。艺术家们加入是分为三种不同的角色。第一个叫早期测试者，估计就是最一开始的一批人，还没有进行详细的分工，你们先来试试各种的接口能不能跑起来。第二个角色叫红队成员，这是干嘛使的？视频模型非常害怕一件事情，就是生成一些有害视频，色情、暴力、虚假，或者版权侵害什么这样的视频。所以需要一些成员不断地向他提这样的要求，看看能不能都识别出来，拒绝服务或者怎么能够规避，怎么能绕过，这个叫红队成员。第三种叫创意合作伙伴，Sora每过一段时间会发出一些样板视频来，意思是什么？他说你看我还活着呢，我还在继续往前走，你们其他人怎么追赶也追不上。

现在，这些艺术家们感觉被骗了，为什么呢？因为付出很多，Sora这种模型绝对没有那么好使。不是说它输出的东西不好，而是说你要想使用这个模型，需要付出的努力一定是非常艰巨的，因为你需要向它描述你到底要一个什么样的视频。它不像是我们普通人去使用图片生成模型式的，我们只要写一个提示词，生成出来大差不差的我就能用。

这些人是艺术家，之所以能成为艺术家，一定是他们对于自己的艺术产品有极高的要求。所以对于他们来说，想要让这种视频模型输出自己能够满意的产品，或者叫作品，这个事本身是非常难的。他们说，我们付出了很多，但是发表的作品又非常难，因为他们发表作品一定是经过层层筛选，甚至是竞赛，然后再要经过Open AI的审核，才有极少的一部分作品可以发表。

即使是有作品被发表展示了，这些艺术家们应该也没有得到什么回报。对应一个1500亿美金的Open AI来说，大家觉得这个事有点太不公平了。而且这么长时间，你要说时间短了还可以，Sora大模型的发布又遥遥无期。这就相当于什么？就是一帮人进去打测试服的游戏去了，结果始终也不给你公测，或者始终也不给你进正式上线，大家只能在里边参加各种删号测试，然后所有的测试还需要签保密协议，你还不能出来说。这个时间长了以后一定会造反的。

艺术家们就觉得他们成为了OpenAI的公关噱头。就是每过一段时间，他们会在这么多艺术家，可能300多个艺术家里头，挑选那么几个作品放出来，说你看，这就是Sora现在能够达到的成就，你们其他人就羡慕去吧。这些其实是艺术家们的艰苦工作，并不是Sora本身模型到底有多好。

再往后是呼吁Open AI可以更加开放。你不要上来就是签一大堆保密协议，这个实在是对于艺术家们来说太不友好了。而且呼吁艺术家们开始使用开源的视频模型，说现在有很多开源模型已经可以用了，效果还不错，这就是他们的一个公开信。

现在，Open AI内部动荡不断，Sora到底什么时候能发布还遥遥无期，仅仅依靠零星露出的作品保持社交媒体关注度，Open AI是可以接受的，但艺术家们肯定接受不了。最后，艺术家毕竟不是工程师，不是律师，不是会计师，不是其他的这种社畜。如果他们完全按照逻辑，按照大家签的协议去做事的话，就不是艺术家了。

所以，他们就整了这么一个幺蛾子出来。你虽然跟我签了保密协议，但是我们就把这个东西扔到世界上最大的开源大模型的集散网站Hugging Face上，让大家都瞅了这么一眼。当然，现在也有人在讲说这个事情是不是又是Open AI的一次公关策略呢，现在不知道，因为Open AI绝对是社交媒体公关大师，不停地玩各种奇怪的事情。

也许过一段时间，人家就突然就发布了，发现这个江湖上又没有哥的声音再传播了，咱们得再整出点幺蛾子出来，这个都难说。这些艺术家们在一个网站上开始征集签名，说来，你们谁支持我，这里边还有一个签名的人，号称叫埃隆·马斯克。只是签名的过程并不需要进行身份验证，所以也不知道这个是真是假。

那么，视频生成为什么这么费劲呢？Open AI在年初的时候，2月份的时候，已经为全世界整个的AIGC行业指明了方向，这个贡献还是非常巨大的，我们要承认。但是，视频生成本身的难度是很大的。第一个，内容合理性其实很难保持。六个手指头、七个手指头，手长得很奇怪，图片生成模型既然已经有这种问题了，那么视频生成模型有同样的手指头问题，或者各种的合理性问题，这个都是很正常的，避免不了的。

还有就是物理破膜的问题。咱们做过3D动画的人都知道，经常会出现这种叫物理破膜。什么叫物理破膜？你比如说你穿了件衣服，里边有个人，但是人在做一些动作的时候，里边的肢体就会从衣服外边撑出来。你在视频模型生成的时候，有可能也会发生同样的事情，包括一些解剖学错误，比如说这个脚要往前走的时候，膝盖应该往后弯的。但是，你怎么能够把这个膝盖必须往后弯这件事告诉大模型，让他每一次生成的时候都向后弯，这个挺难的。

我们看过很多视频模型生成的内容，两条腿突然走着走着就变三条了，或者是两条腿迈着迈着都变成左脚了，变成右脚。图像生成模型上也会出现这种问题，视频生成模型更加难以避免。这是第一个问题。第二个问题就是一致性可控性，这个其实也是从图像生成模型那边就遇到的问题，到视频生成模型依然难以搞定。

现在在图片生成模型的一致性上，已经好一点。什么叫一致性？比如说你说让老范讲故事这张脸出现在不同的角色身上，或者是不同的艺术风格上，现在图片生成模型有一些方法，比如说自己去训练小模型，这个方式是可以让这个脸稍微的稳定一点的。脸是一方面，然后这个身材、身上的衣服、各种配饰，你要让所有的这些图片都很稳定地保持一致性，这个很难。

像一个视频，一秒钟25帧到30帧，你要保证每一帧上，比如说这里都带着一个麦克风，这个对于他们来说非常非常难以控制和把握。再往后，算力成本实在太高了。图片生成，现在我们画一幅1080P的图像，大概就需要几个美分。那你想一秒钟25帧到30帧的视频，他需要多少算力？大家去做各种测试和实验的时候，这个成本是非常非常高。

当然了，这还不是困扰视频生成本身的最大难题。更大的难题是什么呢？就是视频要好看。最后生成完了以后，视频难看，没有人愿意看，没有人愿意传播，这个本身是没有任何意义和价值的。

现在做视频生成，其实是在两个层面上大家在努力。第一个层面就是模型，怎么能够让模型更好。第二个层面是什么？就是怎么去操控，我到底应该用一些什么样的方式，对话吗？上传图片吗？然后一大堆菜单和选项吗？应该怎么能够让他进行顺畅的操作，把这个视频生成出来，这个其实非常难。

我记得在2014年的时候，有大量的团队尝试去做手机端的视频编辑软件，这个时候就发现，哎呀，这个实在太难了。因为最早的时候，视频编辑这件事情都是在视频编辑机，那是个硬件，在那个上面弄的。再往后呢是在这种很专业的视频编辑电脑上面去操作，而且是由一些专业人士操作。

当你要把视频编辑这件事情弄到手机上去操作的时候，需要调控的东西实在太多了，非常麻烦。大家想象一下，有没有人见过飞机驾驶舱？从头上到脚下，你身边所有能看见的地方，都是各种各样的开关和仪表。视频编辑其实跟这个过程很像，大量的参数和开关选项需要设置才能够得到你满意的视频。

现在我们要做视频生成的这种工具了，在有大模型的基础上，你也需要大量的开关选项、菜单或者是提示词，才能够告诉大模型我们到底要生成什么样的视频。这些交互的过程应该如何去安排，这个对于现在所有的做视频生成工具的人来说，都是极大的挑战。

到目前为止，没有特别好使的。在这么难操控的情况下，你要能保证输出出来的视频是有人愿意看的，这个难度就会更大一些。所以，为什么这帮艺术家也说我们付出的努力极其艰巨呢，也是如此。他们想控制Sora这样的一个半成品，甚至可能都没有界面，你还需要去写代码，才可以让他跑起来的一个系统，让这样的系统去输出需要的视频，这个是非常非常麻烦的。

像谷歌前面就是矫枉过正了。你跟他说，任何的提示词里边一定是有黄种人、有黑人、有白人、有男的、有女的，还有奇奇怪怪性别的人凑在一起，最后被骂的直接把这个接口封掉了。所以，这个到底掌握到什么步骤，他们也是很头疼的。

再往后，什么欺诈，视频的欺诈那要比文字欺诈、图片欺诈、声音欺诈都要吓人，因为他真的像真的一样。因为这个东西完全可以以假乱真。我今天测试了一下，在剪映里边去使用真人数字人。什么叫真人数字人？就是有一个数字人在这讲话，但是你可以自己上传一张照片，说我现在让这个人去讲话。

你要想做这个操作的话，剪映要干嘛？要去做人脸识别，保证你上传的这个照片是你自己，否则的话它就拒绝工作了。你说我今天上传一个雷军的，让他去骂人，去让他去做一些其他的事情，这个事他不干。当然，有其他的工具可以干这件事情。现在雷军骂人也好，于东来骂人也好，这种视频都是在满天飞的。

除了前面我们讲的什么欺诈、血腥、暴力、歧视之外，还有一个问题叫版权纷争。你一旦是遇到了版权纷争，这对于视频来说也很麻烦。什么叫版权纷争？比如说请给我按照宫崎骏的风格画一个什么东西，或者生成一个什么动漫，或者星球大战里的一个什么角色去做一个什么样的事情，或者说你现在请用马斯克的脸给我生成一个什么东西，这个都面临着版权纠纷，包括一些品牌和形象的纠纷，这些是需要去注意的。

但是，这个“但是”后边才是重点，艺术表现力非常的差。甭管是跟最新的Flex比，还是跟Midjorney 6.1比，完全没法看。细节也是非常差的。他虽然可以把每一个提示词里边要求的东西都给你画上，但是画的过程还是比较粗糙的，稍微擦点边的都拒绝服务。你比如说，我要求给我按照迪士尼的3D风格画一个什么东西，马上拒绝；你说现在请给我按照日本漫画风格画，可以画出来；说现在请按照宫崎骏的风格给我画，马上拒绝；你只要提到任何人的名字，直接拒绝；说现在请按照哪一个漫画里的这个情节，七龙珠的漫画情节给我画一个东西，马上拒绝；请给我画个什么星球大战、米老鼠，马上拒绝。

所以，他的拒绝的东西实在是太多了。如果按照同样的政策去执行的话，那我觉得Sora是完全不值得期待的一个东西。现在可以用的视频大模型其实已经不少了，甭管是Runway，还是国内能够使用的吉梦，吉梦是剪映下面的字节跳动做的，效果还可以。快手做的可灵效果其实也能够使用了，甚至在剪映内部也集成了视频直接生成的这种功能，这些已经可以达到一部分商业使用的能力了。

现在的各种亲友照片变成视频，这种内容已经有很强的传播力了。很多人会把一些过世亲友的照片拿出来，给他一个提示词，说这个人现在笑了，这个人人说话了，这个人吃东西了，这个已经有一定的传播力了。数字人也已经开始赚钱了，甭管是数字人直播，还是数字人带货，或者数字人骂街，这块已经可以跑了。

YouTube上有很多的这种预告片开始吸引流量。什么意思？就是他经常告诉你，现在哪一部大片后边要拍续集了，大家赶快去看呀。当你看了以后，发现是有很多的前作剪辑，然后再加上一些AI生成的内容，拼凑起来的一个，你也不能说他粗制滥造，有的做的还可以。这样的一个视频，我已经被这种视频骗了好多回了。我现在再看到说哪个大片要准备拍续集，上预告片了，我先得看谁发布的。如果不是原来那个电影的制作公司发布的，我就直接跳过不看了，很容易上当受骗。

现在很多的漫画小说详解相关的视频，在抖音、快手上也开始在盈利赚钱了，所以这块已经走入了商业化。那么，以假乱真也造成了很多的困扰，比如说雷军骂人、于东来骂人，甚至还有人把那个德国选择党的那个女党首，她的这个视频配上中文上来，讲一些比较激烈的这种话语，这个也是很容易骗到人的。

下一步的AI工具会是什么样的呢？第一个专业应用级别，可能还是会有专门的人去做。就像现在我们，比如说在视频领域里头，我的这个视频处理都是用剪映的。但是，也还是有很多专业团队会使用一些更复杂的这种视频工具。Sora以后可能就会向那个方向发展，说我们干脆就永远不再向公众开放了，就是直接签约给这些电影公司，让他们去用。用完了以后出了所有东西，你们自己负责任，跟我就没有关系了，这是一种方式。

半专业的应用肯定还有待增强，普通人使用Sora这样的模型，或者使用其他的，刚才我们说的吉梦也好、可灵也好，还是挺难使的。他们可能还需要在用户交互上，或者是工具上还要有待增强。这个大模型本身，他们自己慢慢训就可以了。至于个人应用的话，是否能够爆发，我觉得应该还是可以爆发的，就是使用AI大模型生成视频的这种个人应用。但是，这个可能距离我们还稍微远一些。

这种半专业应用的话，应该正在路上。在吉梦也好、可灵也好，都是在做手机APP，网站的这种Web APP也在尝试，跟各自的这种视频编辑工具进行结合，这一块的话，有可能会最先让我们看到成绩。

至于Open AI下边该干嘛去呢，我们已经讲了，Open AI的Sora已经不值得期待了。Open AI作为行业的排头兵老大，它有一个非常重要的职策，就是为整个行业指明下一个方向。他指明了Sora这个方向以后，大家就赶快都去出了一堆可灵也好、吉梦也好、Runway、Pica，一大堆的这样的视频模型就出来了。他说我们要做O1这种可以带推理的模型，然后一堆的推理模型在这个后边就出来了。

今天我还装了一个叫QWQ，通义千问做的推理模型，在32B的参数下，可以达到甚至是部分超越O1 mini的这个能力了。他现在还达不到O1 Preview的这个能力，但是可以达到O1 Mini的能力，只有32B，那这个还是非常棒的一个东西。

所以再往下一个方向到底是什么？虽然很多的厂商也在尝试去摸索，寻找新方向，但是都没有Open AI指的方向。他只要摇旗呐喊，大家就直接跟风往上冲，没有这种号召力。所以，我们期待Open AI可以给大家指明下一个方向，等指明了以后，全世界的厂商再顺着这个方向往前跑。

好，这是今天讲的故事，感谢大家收听，请帮忙点赞点小铃铛，参加Discord讨论群，也欢迎有兴趣、有能力的朋友加入我们的付费频道。再见。

昨天，Sora短暂的泄露。但是，我们真的还需要等待Sora吗？大家好，欢迎收听老范讲故事的YouTube频道。在今年2月份，Open AI公布了他们的Sora大模型之后，大家一直在等待这个产品的正式发布。但是，等到了现在，已经到年底了，很多跟随Sora的产品都已经上线，已经有很多用户开始使用了。Sora自己还遥遥无期。

至于Sora什么时候能发布，人家也没有再继续提供更进一步的信息。那么，这一次泄露出来的呢，是Sora的Turbo版本。Turbo是轻量级快速的版本，就是不是一个全尺寸的模型，参数呢也并不是很突出。2月份，Sora当时号称自己是世界模型，可以仿真出世界来的，当时是可以出一分钟的视频的，虽然一分钟视频并没有那么大的用处，超过一分钟都属于是超长镜头了，电影里头用这种镜头其实也不是那么多。这一次呢只提供了1080P、720P、360P三种的分辨率，然后时长呢就是5到10秒钟，实际上跟我们现在可以使用到的大量的这种视频生成模型参数是一样的。

现在的视频生成模型基本上都是5-10秒钟。那么，艺术家们为什么干这么个事呢？原因呢也很简单。有一句话叫“富贵不归乡，如锦衣夜行。”什么意思呢？有钱了得回家显摆显摆去，要不然的话就跟穿了个好衣服，晚上出门没人看见那是一样的。对于这帮艺术家们来说，有了一个好东西，你又不让他们显摆，这肯定是非常非常不爽的。

公开信里都写了什么呢？他写了说，艺术家们年初呢就被邀请加入了，艺术家们加入呢是分为三种不同的角色。第一个呢叫早期测试者，估计呢就是最一开始的一批人，还没有进行详细的分工，你们先来试试各种的接口能不能跑起来。第二个角色呢叫红队成员，这是干嘛使的？视频模型非常害怕一件事情，就是生成一些有害视频，色情、暴力、虚假呀，或者版权侵害什么这样的视频，所以呢需要一些成员说你不断的向他提这样的要求，看看能不能都识别出来，拒绝服务，或者怎么能够规避，怎么能绕过，这个叫红队成员。第三种呢叫创意合作伙伴，Sora每过一段时间呢会发出一些样板视频来，意思是什么？他说你看我还活着呢，我还在继续往前走，你们其他人怎么追赶也追不上。

现在呢，这些艺术家们感觉被骗了，为什么呢？因为付出很多，Sora这种模型绝对没有那么好使。不是说它输出的东西不好，而是说你要想使用这个模型，付出的努力一定是非常艰巨的，因为你需要向它描述你到底要一个什么样的视频。它不像是我们普通人去使用图片生成模型式的，那我们只要写一个提示词，生成出来大差不差的，我就能用。这些人是艺术家，之所以他能成为艺术家，一定是他们对于自己的艺术产品有极高的要求。

所以，对于他们来说，想要让这种视频模型输出了自己能够满意的产品，或者叫作品吧，这个事本身是非常难的。所以呢，他说：“我们付出了很多，但是发表的作品呢又非常难。”因为他们发表作品一定是经过层层筛选，甚至是竞赛，然后呢再要经过Open AI的审核，才有极少的一部分作品可以发表。即使是有作品被发表展示了，这些艺术家们呢应该也没有得到什么回报。对应一个1500亿美金的Open AI来说，大家觉得这个事有点太不公平了。

而且这么长时间，你要说时间短了还可以，Sora大模型的发布又遥遥无期，这个就相当于什么？就是一帮人进去打测试服的游戏去了，结果呢始终也不给你公测，或者始终也不给你进正式上线，大家只能在里边参加各种删号测试，然后所有的测试还需要签保密协议，你还不能出来说。这个时间长了以后一定会造反的。艺术家们呢就觉得他们成为了OpenAI的公关噱头，就是每过一段时间，他们会在这么多艺术家，可能300多个艺术家里头，挑选那么几个作品放出来，说：“你看，这就是Sora现在能够达到的成就，你们其他人就羡慕去吧。”这些呢其实是艺术家们的艰苦工作，并不是Sora本身模型到底有多好。

再往后呢是呼吁Open AI可以更加开放。你不要上来就是签一大堆保密协议，这个实在是对于艺术家们来说太不友好了。而且呢呼吁艺术家们开始使用开源的视频模型，说现在有很多开源模型已经可以用了，效果还不错。这就是他们的一个公开信。

现在呢，Open AI内部动荡不断，Sora到底什么时候能发布还遥遥无期，仅仅依靠零星露出的作品保持社交媒体关注度，Open AI呢是可以接受的，但是艺术家们肯定接受不了。最后呢就是艺术家毕竟不是工程师，不是律师，不是会计师，不是其他的这种社畜。如果他们完全按照逻辑，按照大家签的协议去做事的话，就不是艺术家了。

所以，他们就整了这么一个幺蛾子出来。你虽然跟我签了保密协议，但是我们就把这个东西扔到世界上最大的开源大模型的集散网站Hugging Face上去，让大家都瞅了这么一眼。当然现在也有人在讲说这个事情是不是又是Open AI的一次公关策略呢？现在不知道，因为Open AI绝对是社交媒体公关大师，不停的玩各种奇怪的事情。也许过一段时间，人家就突然就发布了，发现这个江湖上又没有哥的声音再传播了，咱们得再整出点幺蛾子出来，这个都难说。

这些艺术家们在一个网站上开始征集签名，说来你们谁支持我。这个里边还有一个签名的人，号称叫埃隆·马斯克。只是签名的过程呢并不需要进行身份验证，所以也不知道这个是真是假。

那么，视频生成为什么这么费劲呢？Open AI在年初的时候，已经为全世界整个的AIGC行业指明了方向，这个贡献还是非常巨大的，我们要承认。但是呢，视频生成本身的难度是很大的。第一个呢就是内容合理性，其实很难保持。六个手指头、七个手指头，手长得很奇怪，图片生成模型既然已经有这种问题了，那么视频生成模型有同样的手指头问题，或者各种的合理性问题，这个都是很正常的，避免不了的。

当然了，这个还不是困扰视频生成本身的最大的难题。更大的难题是什么呢？就是视频要好看。最后生成完了以后视频难看，没有人愿意看，没有人愿意传播，这个本身是没有任何意义和价值的。

现在呢，做视频生成其实是在两个层面上大家在努力。第一个层面就是模型怎么能够让模型更好。第二个层面是什么？就是怎么去操控，我到底应该用一些什么样的方式，对话吗？上传图片吗？然后一大堆菜单和选项吗？应该怎么能够让他进行顺畅的操作，把这个视频生成出来，这个其实非常难。

我记得在2014年的时候，有大量的团队尝试去做手机端的视频编辑软件。这个时候就发现，哎呀，这个实在太难了。因为最早的时候，视频编辑这件事情，都是在视频编辑机，那是个硬件，在那个上面弄的。再往后呢是在这种很专业的视频编辑电脑上面去操作，而且是由一些专业人士操作。当你要把视频编辑这件事情弄到手机上去操作的时候，需要调控的东西实在太多了，非常麻烦。

到目前为止没有特别好使的，在这么难操控的情况下，你要能保证输出出来的视频是有人愿意看的，这个难度就会更大一些。所以为什么这帮艺术家也说说：“我们付出的努力极其艰巨呢？”也是如此。他们想控制Sora这样的一个半成品，甚至可能都没有界面，你还需要去写代码，才可以让他跑起来的一个系统，让这样的系统去输出需要的视频，这个是非常非常麻烦的。

除了视频模型操作的问题之外，下一个问题就是视频安全性，风险要比图片、文字、音频都要大的多，甚至把所有的这些前面我们讲的这些风险都盛起来，都没有视频所生成的这种风险更大。咱们前面讲的红队要去处理的问题，就是看怎么能够把这些风险在发布之前尽可能地发现，尽可能地排除掉。这些风险包括色情、暴力、歧视性的，而且歧视性你不能出现的同时呢，你还不能矫枉过正。像谷歌前面就是矫枉过正了。你跟他说，任何的提示词里边一定是有黄种人，有黑人，有白人，有男的，有女的，还有奇奇怪怪性别的人凑在一起，最后被骂的直接把这个接口封掉了。所以这个到底掌握到什么步骤，他们也是很头疼的。

当然有其他的工具可以干这件事情。现在雷军骂人也好，于东来骂人也好，这种视频都是在满天飞的。除了前面我们讲的什么欺诈呀，血腥、暴力、歧视之外，还有一个问题叫版权纷争。你一旦是遇到了版权纷争，这个对于视频来说也很麻烦。什么叫版权纷争？比如说请给我按照宫崎骏的风格画一个什么东西，或者生成一个什么动漫，或者星球大战里的一个什么角色去做一个什么样的事情，或者说你现在请用马斯克的脸给我生成一个什么东西。这呢都面临着版权纠纷，包括一些品牌和形象的纠纷，这些是需要去注意的。

那么，我们到底还需不需要等Sora呢？其实从达利3的这个角度上来看，我觉得我们完全不需要再去期待Sora了。为什么呢？我们看看DALL·E 3现在画图的效果。首先，咱们先说优点，文字理解还是相当不错的。当你给他一个很长的提示词的时候，他会把提示词中的各个部分都理解得很清楚，而且尽量的都给你画到这个图片上去，这个DALL·E 3算是最强的。但是，这个“但是”后边才是重点，艺术表现力非常的差。甭管是跟最新的Flex比，还是跟Midjourney 6.1比，完全没法看。细节也是非常差的。他虽然可以把每一个提示词里边要求的东西都给你画上，但是呢画的过程还是比较粗糙的，稍微擦点边的都拒绝服务。

现在可以用的视频大模型其实已经不少了，甭管是Runway还是国内能够使用的吉梦。吉梦是剪映下面的字节跳动做的，效果还可以。快手做的可灵效果其实也能够使用了，甚至在剪映内部也集成了视频直接生成的这种功能。这些呢已经可以达到一部分商业使用的能力了。现在的各种亲友照片变成视频，这种内容已经有很强的传播力了。很多人会把一些过世亲友的照片拿出来，给他一个提示词，说这个人现在笑了，这个人人说话了，这个人吃东西了，这个已经有一定的传播力了。

数字人呢也已经开始赚钱了，甭管是数字人直播，还是数字人带货，或者数字人骂街，这块已经可以跑了。YouTube上呢，有很多的这种预告片开始吸引流量。什么意思？就是他经常告诉你说，现在哪一部大片后边要拍续集了，大家赶快去看呀。当你看了以后，发现是有很多的前作剪辑，然后再加上一些AI生成的内容，拼凑起来的一个，你也不能说他粗制滥造，有的做的还可以。

这样的一个视频，我已经被这种视频骗了好多回了。我现在再看到说哪个大片要准备拍续集，上预告片了，我先得看谁发布的。如果不是原来那个电影的制作公司发布的，我就直接跳过不看了，很容易上当受骗。现在很多的漫画小说详解相关的视频在抖音、快手上也开始在盈利赚钱了，所以这块呢已经走入了商业化。

那么，以假乱真也造成了很多的困扰，比如说雷军骂人、于东来骂人，甚至还有人把那个德国选择党的女党首，她的这个视频配上中文上来，讲一些比较激烈的这种话语，这个也是很容易骗到人的。下一步的AI工具会是什么样的呢？第一个专业应用级别呢，可能还是会有专门的人去做，就像现在我们，比如说在视频领域里头，我的这个视频处理都是用剪映的，但是呢也还是有很多专业团队会使用一些更复杂的这种视频工具。

Sora以后可能就会向那个方向发展，说我们干脆就永远不再向公众开放了，就是直接签约给这些电影公司，让他们去用，用完了以后出了所有东西，你们自己负责任，跟我就没有关系了。这是一种方式。半专业的应用呢肯定还有待增强，普通人使用Sora这样的模型，或者使用其他的刚才我们说的吉梦也好，可灵也好，还是挺难使的。他们可能还需要在用户交互上，或者是工具上还要有待增强，这个大模型本身他们自己慢慢训就可以了。

至于个人应用的话，是否能够爆发，我觉得应该还是可以爆发的，就是使用AI大模型生成视频的这种个人应用。但是呢，这个可能距离我们还稍微远一些。这种半专业应用的话，应该正在路上。在吉梦也好，可灵也好，都在做手机APP，网站的这种Web APP也在尝试，跟各自的这种视频编辑工具进行结合，这一块的话，有可能会最先让我们看到成绩。

至于Open AI下边该干嘛去呢，我们已经讲了，Open AI的Sora已经不值得期待了。Open AI作为行业的排头兵老大，它有一个非常重要的职策，就是为整个行业指明下一个方向。他指明了Sora这一个方向以后，大家就赶快都去出了一堆可灵也好、吉梦也好、Runway、Pica，一大堆的这样的视频模型就出来了。他说我们要做O1这种可以带推理的模型，然后一堆的推理模型在这个后边就出来了。

今天我还装了一个叫QWQ通义千问做的推理模型，在32B的参数下吧，可以达到甚至是部分超越O1 mini的这个能力了。他现在还达不到O1 Preview的这个能力，但是可以达到O1 Mini的能力，只有32B，那这个还是非常棒的一个东西。所以再往下一个方向到底是什么？虽然很多的厂商也在尝试去摸索，寻找新方向，但是呢都没有Open AI指的方向。他只要摇旗呐喊，大家就直接跟风往上冲，没有这种号召力。

所以，我们期待Open AI可以给大家指明下一个方向。等指明了以后，全世界的厂商再顺着这个方向往前跑。好，这是今天讲的故事。感谢大家收听，请帮忙点赞、点小铃铛，参加Discord讨论群。也欢迎有兴趣、有能力的朋友加入我们的付费频道，再见。

ChatGPT桌面应用11月更新：融入编程工具，新功能是否能替代Github Copilot？

老范讲故事 — Wed, 20 Nov 2024 00:51:09 +0000

ChatGPT的桌面应用更新了，直接可以跟应用结合了。这又是什么新方向吗？大家好，欢迎收听老范讲故事YouTube频道。今天咱们来讲一讲11月15号ChatGPT桌面版的一个更新。大家注意，这次更新的不是网站，而是桌面端，就是你要有Windows或者是MacOS才可以使用的这个版本。

在这个里面，MacOS永远是走在Windows前面的，因为MacOS的操作系统其实相对来说要简单一些。为什么呢？因为MacOS的硬件简单，它没有那么多兼容性问题，所以它整个的操作系统，或者说整个的操作系统环境也相对来说要更单一一点点。Windows呢，现在也在跟上，但是Windows的所有功能对于ChatGPT的桌面版来说，都要稍微滞后一些。

现在的Windows上呢，已经有APP了，而且可以上传文件，可以拍照，可以截屏，可以做高级语音，这些都可以干了。MacOS是这些功能早都有了。这一次增加的是什么？这一次增加的叫跟应用相结合。那么跟什么样的应用相结合呢？不是所有应用都可以的哦，主要是跟编程工具一起干活。

Xcode就是苹果自己家的这种编程工具，然后是文字编辑器。很多人写程序是不会看IDE的，IDE叫集成开发环境，他们会直接开一个文字编辑器就干活了。然后是VSCode，这个是最常用的一个IDE，这是微软做的。还有Terminal，Terminal是叫终端，Linux也好，MacOS也好，有大量的操作是在终端里边干的，所以呢，你也可以跟终端直接结合。还有一个比较高级一点的终端程序叫ITerm2，也是支持了。

现在呢，就是支持这5个应用，其他都不支持。那这是不是要去抄Github Copilot的后路去了？那是不是有没有必要去花一个月10美金去订这个Github Copilot呢？我赶快去测试了一下，首先测试第一步，检查梯子，因为呢，我们的网站上去其实还是比较容易的。

但是呢，你使用他的桌面客户端，有的时候还需要对梯子做一些特殊的设置。如果你自己没有这个问题，这块可以越过。再往后呢，就是更新你的桌面客户端，就是ChatGPT在MacOS上的这个应用。当然，这个很神奇，他这个更新居然是手动的，这要稍微吐槽一下。为什么呢？因为我们以前做APP的时候，有一个重要的指标，就是当你每一次新版本出来以后，用户是不是都更新了。因为你的新版本更新经常是要换这个广告商。如果用户不跟着更新的话，一旦更新了以后，你就没法挣钱了。你的广告商换了以后，用户没跟着更新，这事是不行的。可能前面那个广告商的广告服务协议已经到期了，你必须要更新，这个事是一个很重要的指标。

但是呢，ChatGPT是要手动更新的，它不会说一启动了以后，哎呀，我发现有新版本了，咱们更新一下吧。反正这个他没提醒我，我是手动更新了一下。更新了以后呢，需要去点设置，设置是在这个应用的左下角，有一个人脑袋的地方。点一下，然后要允许使用应用，他那个名字是这样的一个名字，叫“允许使用应用”。我显示的都是中文，因为我已经把我的ChatGPT的桌面版换成中文的了。

然后呢，就是去授权。对于一个要去操控你电脑的程序来说，所有操作系统都是会有严格管理的，因为你不管的话，这就要出病毒了，有可能会给你造成损失。授权是什么呢？就是在设置里边有个叫辅助功能，在这一项里头，允许下面的应用程序控制你的电脑。这边有这么一项，在里头找到ChatGPT，把它打开就可以使用了。

后边呢，就是管理应用，就是我到底要用哪些。Xcode因为我自己不使，所以呢我就没有测试。Terminal只要是你把上面授权开了，你的Terminal窗口打开了以后，就可以在ChatGPT的应用程序下边，这个对话框底下多出一个图标来。这个图标呢是一个小方块，中间有一个指针。哈哈，这个我就不跟大家截图了，就是你点完了这个图标以后，就可以选中你的Terminal的这个窗口。

他就会根据你Terminal窗口里面的信息进行问答了。他会把Terminal窗口里的最后200行读出来，根据这200行的信息去给你做各种回复。这就是连接这个terminal窗口的一个操作方式。而且呢，这个terminal大家知道，我们经常通过SSH连接到远程的云服务器上去，或者连到我们的NAS上去。那么这个的话，它依然是可以工作的。我在云服务器上做各种操作，报错了或者什么的，你就可以直接问ChatGPT说：“哎，报了一个什么错，该怎么改呀？”他会给你去解决问题。

文本编辑器也是可以的。我试了一下，打开文本编辑器，里面有内容，它就会根据内容进行回复。VScode这个是我的主力IDE。在使用VSCode的时候，先需要装一个插件。在VSCode里头下载一个VSIX的文件，这个是从OpenAI的网上下载。下完了以后呢，到VSCode里头去安装这个插件。装上以后就可以使用了。但是要注意，这个插件在VScode的插件商店里没有。这也是一种“萝卜急了不洗泥”的方式。就是说，按道理说应该把这个插件上架到Vscode的插件商店里去，但是呢，它就没有上架。有可能是因为太着急了，没上去；也有可能呢，是因为他们惦记抢这个GitHub Copilot的饭碗，去上微软那里去上架的时候，因为VSCode是微软家的嘛，去上架的时候被微软横挑鼻子竖挑眼，说：“你这不行，这个不太安全，回去接着改去。”要给他拖一拖，所以干脆他们就自己升级了功能，自己做了个插件，从外面让你去装上去。

这个系统呢，是可以在本地工作的。什么意思呢？就是VScode在编辑代码的时候，你可以编辑本地的代码，也可以通过SSH编辑远程云服务器上的代码。但是如果要去编辑远程代码的话，你需要重新装所有的插件，这个搞不定，所以它只能在本地工作。这个系统呢，是只能够查看当前窗口的代码，因为VScode里头是可以开好多窗口的，它只能查看当前的。

如果你在当前窗口里头选中了一些高亮代码，他会优先专注于高亮代码进行解析，也就是这样的一些功能。所有生成的代码，比如说我这哪错了，那些代码是有什么问题，他会生成很多的代码来帮你去解释，帮你解决问题。但是呢，这些代码必须要拷贝粘贴，他不会直接把这些代码应用到你的程序里边去，也不会直接把这些指令送到Terminal，就是命令行终端里边去执行。你要自己手动地从这个聊天窗口里头把他给你建议的代码也好，命令也好，粘贴到相应的地方去，打回车。这呢，也是让大家觉得很不爽的一个地方。

那么这东西到底能不能替换GitHub Copilot呢？我试了几下以后就换回去了，我接着使用GitHub Copilot。为什么呢？第一个，ChatGPT不能直接修改代码，每一次都需要你去拷贝粘贴，自己去改，很有可能改错呀。你再问他说这对不对，操作起来非常麻烦，这是第一个原因。第二个，不能处理远程代码，这是我不能接受的。我是经常需要处理云服务器上的代码，他只能在本地工作，这个不行。第三个，他不能使用不同的模型，现在甭管你是用Cursor也好，还是用GitHub Copilot也好，你都可以选不同的模型。但是OpenAI的ChatGPT只能选OpenAI自己家的模型。你说我想去选Anthropic下边的Claude行不行？我想去选谷歌的Gemini行不行？不行，没有这个能力，所以这个也是让人不太爽的地方。

还有一个很烦的是什么，他只能处理当前的文件，没法去处理workspace上的东西。我们做一个程序，这个程序都是一个很复杂的目录结构，这个目录结构我们要管它叫workspace，就是这个工作空间，这里头会有很多很多的文件。如果说不能够根据整个的workspace一起去给我建议，只有根据我当前打开这个文件去建议，那这个完全没有意义，改程序会越改越乱的。

我们推崇的是每一个程序尽可能短，每一个程序之间相互配合，而不是说我们写一个特别长的程序。因为特别长的程序不好维护。你使用ChatGPT的APP，直接调用当前窗口的代码进行提示，那这个效果应该是很差的。我的Cursor呢，是过期了，所以我就没有再回去测试。现在我主要的编程工具是GitHub Copilot。从用户体验上来讲，Cursor应该是最好的，其次是GitHub Copilot，再差的就是今天我们讲的这个ChatGPT。

你说ChatGPT为什么会选择这样的一条路出来，明明做得又不好，还要去跟GitHub Copilot、Cursor去硬刚呢？其实很多做大模型的公司，他们预期的方式就是这种。什么叫全能助理？就是你不需要在编程的时候打开GitHub Copilot，在Office里头去打开Office Copilot，在浏览器里面去打开Web Copilot，在操作系统里头去打开操作系统的Copilot。他们希望你有一个统一的全能助理，打开什么样的工作我都给你搞定。这是这些做大模型的公司，无论是Anthropic还是OpenAI，他们想干的活。

所以你看他的应用，可以截图、截屏、照相、上传文件，还可以听到你的声音，现在还可以直接从IDE页面里把代码拎出来。他们希望说我都干了，你不用再去烦别人了。但是这里面有一些困境，就是不能直接操作电脑。原来Anthropic不是演示过直接操作电脑吗？我上一次出去参加活动，还有人问我说这太可怕了，他就直接操作电脑了。我说这个没有那么可怕。第一个，Anthropic演示的直接操作电脑的那个程序是一个实验室版本，他们也不敢把这种东西直接给用户去用。因为一旦给用户用了，咱不说他有恶意或者什么的，他弄坏了以后你咋给人修啊？这个是没法整的。

所有的公司里边的IT人员，最害怕的就是：“哎呀，我的电脑不行了，我有一个程序找不到了，哪个东西起不来了。”你要到现场去部署，现场去看当时的环境是什么样，可麻烦了这个过程。这是不允许Claude直接操作电脑的。现在用户能够用到的还是Claude从电脑上读东西，操作的过程还要你自己拷贝粘贴，都是如此的。ChatGPT也是这么干，所以它不能操作电脑。

那么用户体验，到底什么是用户体验？或者这种大模型应用的用户体验到底是什么样的？这里头其实有两个关键点。第一个关键点叫做找到合适的内容，第二个关键点是在可预期的范围内进行操作。

咱们先说第一个，找到适当的内容。那么什么叫找到适当的内容？就是我们要解决一个问题，你需要解决问题所需的所有内容。就像刚才我们说，我们要改程序，你要改程序的话，你需要在Workspace里，这个工作空间里边的所有程序、所有代码，然后你才能够去改这个程序。甚至你还需要什么？就是很多的环境信息。你说：“我这个电脑是Oracle云上面的一个乌斑图的主机，还是一个Oracle OS的主机，还是一个什么样的主机？我这个主机是什么样的CPU？什么样的内存？”你说：“我是arm的CPU，还是Intel的CPU？”你都要告诉这个大模型，否则的话，它给你的很多建议就会是错的，所以你需要全部的信息。

第二个呢，还有一个问题是什么？你不能被其他没用的信息干扰。什么叫被没用的信息干扰？这跟大家讲一个小故事：以前的杀毒程序在这个硬盘里杀病毒的时候，最怕的是什么，知道吗？最怕的是别的杀毒程序。为什么？因为杀毒程序干活的方式是拿病毒库去比较。我读了这段代码了，谁到我病毒库里比较一下是不是病毒。但是他一旦遇到了别的杀毒程序，在硬盘里安装着这个杀毒程序，里头也有一个病毒库，那你拿出来一比较，哎呦，跟我这里一样，接着往下比还一样。到最后几个字节可能不一样了，这个不是一个完整的病毒，不用管它。

再到下一个，哎，又一样。因为人家那病毒库里头所有病毒都有一遍，他就到人那去检索，说这个好好厉害。你看你这个病毒库里边所有的毒都有，这就是被无用信息所干扰了。我们硬盘里也是这样，各种各样的信息是非常多的。当你这个大模型需要去给我回答问题的时候，你不能把我硬盘里所有的内容都找出来，然后来给我回答。有些是我希望你看到的，有些是我不希望的，或者有些是我不希望你这一次拿去参考的，这个一定要搞清楚。

而且还有一点，什么叫不能让用户害怕，这个是很关键的。如果一个用户告诉他说，现在大模型来了，我要把你硬盘里头所有的内容都搜索一遍，我来给你解决问题，用户说那算了，咱别费劲了。我这个里头还有一些什么学习强国呀，或者这种目录里头放的文件，是我不希望你拿来解读它，可能是一些宝藏、小电影什么的。他还是要让用户知道，你这个大模型是在他允许许可的范围内在工作，不能吓着他。

这个是找到适当的内容。下一个呢，在可预期的范围内操作。什么意思？第一个先要保证做对，这个其实很难。为什么呢？现在给出来的答案，甭管是GitHub Copilot还是ChatGPT，还是Claude，或者它的Cursor这样的产品，它给出来的答案基本上很难一次正确。原因也很简单，就是他们得到的信息不够完整，环境信息不完整，其他的代码没有研究。

就算你告诉他说，你根据我所有代码去做处理，其实他也没有办法真的这么干，因为大模型是有上下文窗口的。你不可能说我把一个程序的所有代码都塞进去，这个是非常非常费劲的。就算他的上下文窗口足够大，你还有大量的网络传输的开销，这个也是很麻烦的。

所以现在的这些大模型处理这种workspace的方式是什么呢？就是做嵌入。他把你所有的代码拿去做这个embedding的处理，做完了以后再根据你的命令，在embedding之后的代码里头找到相关的内容，然后再去回答他们。现在只能这么干，所以他们给出的答案。

其实，通常都是错误的。你拿到了以后，还要人工判断，然后再去调整，才有可能把它做对。这个第一个要做对，这事很难。第二个，什么？你还是不能让用户害怕。一上来说，我们执行一个命令叫“RM -RF *”，那这个什么意思？就是把硬盘上所有东西都删光。执行命令这件事，有很多是比较吓人的。所以，为什么现在 ChatGPT 和 Claude 都不敢直接去执行命令，就是这样。他怕吓着用户。而且，如果真让他执行了，万一出错了以后，他又没有补救措施，这个也是一个很大的开销。

为什么呢？就是你要看正规的工程师，或者叫网络工程师，他们的操作手册都是什么？你做任何的升级，做任何操作之前要备份。备份完了以后才能做操作，万一做错了以后还能恢复。但是这个操作的开销就非常大了。所以，现在他们这两个应用都不敢直接下手。

那么，这算不算是一种纯视觉方案？咱们想的稍微远一点，什么叫纯视觉方案？就是特斯拉在推自动驾驶的时候，就推这种纯视觉方案。别人还在研究什么毫米波雷达、激光雷达的时候，马斯克说不，我就要纯视觉方案，我不跟你费劲了。那么，什么时候上纯视觉方案呢？就是要去对抗各种雷达，对抗车路协同系统。雷达还算是一个相对来说比较简单的玩法，车上加毫米波，加这个激光雷达，这还算简单一些。车路协同是什么？就是在路上加各种传感器，加各种各样的处理终端，加各种标记，让你的车在这样的智能公路上可以畅通无阻。

但是，这条路看来现在应该不是主流方向。就算是国内的国产新势力们，也没有向车路协同的方式走。大家还都是惦记说，我怎么在车上把这事搞定就完事了。那么，这个事情跟咱们今天讲的 ChatGPT MacOS 上的这个客户端到底有什么关系呢？我们来类比一下，现在的 ChatGPT 和 Claude 这种桌面客户端，干的活是什么？就是给桌面应用增加眼睛、耳朵、嘴和手脚。什么意思呢？原来这个东西叫聊天工具，但现在我们希望这个聊天工具自己可以看到你电脑上的屏幕。

它可以截屏，可以看到你的代码，可以听到你说话，也可以对你说话，甚至可以做一定的操作。那么在这个过程中，如果是走纯视觉方案，实际上就是ChatGPT和Claude现在用的这个方案。什么意思呢？就是看到用户能够看到的部分，用户看不到的部分就算了。然后呢，通过摄像头截屏以及与IDE结合，不需要做其他的改造了，我们只需要做最简单的一个改造，就可以使用了。甚至只是说我给你一个授权，你就可以使用了，也不需要跟操作系统的厂商进行深度的整合。你要做这种很复杂的底层操作，你一定要操作系统厂商给你授权才可以，否则他是不能去做的。

最终是要像人一样工作。什么意思呢？大家想，马斯克为什么推纯视觉？两个原因。第一个，你跟各个国家的公路系统去打交道，说你给我在公路上加一标签吧，或者加一牌子吧，或者加一个什么传感器吧，这个事就没法整。你万一走到没有传感器、没有经过改造的公路上，你智能驾驶系统是不是就没有了？这是一个原因。说我们不愿意跟你打交道，我在车上自己都解决完就完了。

第二个原因是什么呢？他希望这个车像人一样工作，因为你的大模型还是在不断地迭代、不断地升级的。那么到底向哪个方向升级呢？比如说我升级了带有车路协同系统的、带有激光雷达和豪美涡雷达的这样的大模型，那这个到底对不对？其实很难去衡量。但是说，哎，我就向人的方向去转变。人是怎么开车的？我怎么开车？人反正也没有毫米波雷达，也没有激光雷达，也没有什么车路协同。我们走到哪，这路甭管认不认识，我都可以开走。那么我们就以此为基准进行训练就完了。这是纯视觉系统的一个核心底层逻辑，就是我们以人为标准，向这个方向不断前进。

那么这是纯视觉方案。如果是车路协同方案是什么样的呢？就是Github Copilot走的这个方案，还有各种操作系统，像什么AIPC、AI手机，新带Copilot的Windows 11。

带有这个 Apple Intelligence 的 MacOS 和 iPhone 16，以及咱们国内号称带大模型的各种安卓手机，这就是标准的车路协同系统。在这个过程中，那你就需要对基础设施进行改造。反正这个微软没事，他说：“我是做操作系统的，我就在操作系统上改呗。”苹果说：“那我也在操作系统上改。”安卓这帮手机，甭管是小米还是华为，说：“我们也上操作系统 IC，直接底层修改，这样用户体验才最好。”它就变成这样的方式了。

在这块，操作系统厂商跟 IDEE 的这些厂商有一些天然的优势。你那些做大模型的厂商，你就过不来了，因为你搞不懂这个操作系统到底是怎么运作的。就算你能搞懂了，我不给你授权，你越过我的授权也是病毒。他是这样来工作的。

那么，我们在电脑上是不是需要这种纯视觉方案？这个路是不是对的？你说马斯克在做 FSD 的时候，做纯视觉方案，大家都觉得这条路是对的。那么在电脑上，我们是不是也该这么干？除了环境方的配合度之外，模型发展方向才是最重要的考核。自动驾驶这件事，其实相对来说还比较简单，纯视觉方案是可以搞得定的。人就向这个方向走就行了，你只需要让自动驾驶的汽车达到驾驶员的高度就可以了。我不需要达到 F1 方程式赛车，也不需要达到修车老师傅的程度，你只要能够达到一个正常驾驶员的程度就 OK 了。

所以，自动驾驶可以走纯视觉方案，但在电脑上这事不行，为什么？因为我们需要专家模式，我们需要解决很多我们自己解决不了的问题。这个跟刚才我们讲的自动驾驶是不同的。自动驾驶是，你只要模型变成普通驾驶员就够了，而我们去操作电脑是需要电脑上辅助，我们的专家模型能够达到比我们更高水平。那你如果是这样的话，去做纯视觉就不合适了。

现在摆在 OpenAI 和 Anthropic 面前的困境是什么呢？他们需要克服什么？就是操作系统厂商不愿意配合他们。你说：“我希望有更多的功能给用户用起来，我明明可以做更多的事情，可以做得更好。”

但是，你没有操作系统厂商的配合，就做不了。用户量上去了，但是用户也没法使用全部的功能。大家还是在跟你聊天，那用户的付费意愿就低。他们这两家公司最后能够实现盈利的可能性，就基本上等于零。他现在是遇到这样的问题，原来还想着说：“哎呀，微软你就向OpenAI老老实实地交授权费就完了呗，我就让你去用去了。”结果，GitHub Copilot现在不仅能够用OpenAI的GPT-4，还是能够用Anthropic的Claude，人家还可以用谷歌的Gemini。

这个OpenAI说那不行，你们不在一棵树上吊死，我也不能在一棵树上吊死，咱们双向奔赴了。你们这个不忠诚，我们也不忠诚，搞成这样的一个事情。那么，大模型厂商还在解决用户需求的路上继续前进。甭管最后他的商业问题是不是能够解决，是不是能够挣到钱，这个事我们不管他。但是，如果你没有办法把用户的需求解决掉，这条路注定是条死路。

现在呢，就是两条路。刚才咱们讲过了，一个是车路协调的路，一个是纯视觉的路。纯视觉路实际上就是我关起门来自己把事搞定了，你们不用管我，我也不用配合我，我自己能搞定。车路协同的方式就是我从底层把基础设施改掉。现在车路协同的方式就是AIPC、AIPHONE，这条路是车路协同的方式。

纯视觉方式，现在甭管是OpenAI的ChatGPT，还是Anthropic的Claude，都在尝试走这条独立的路线。我不需要你跟我配合，我自己搞定。我就看到用户能看到的东西，然后我在用户可眼见的范围内去解决问题。用户看不着东西，我也看不着。至于哪条路能够走通，咱们拭目以待。

好，这个故事跟大家讲到这里，感谢大家收听。请帮忙点赞，点小铃铛，参加Discord讨论群。也欢迎有兴趣、有能力的朋友加入我们的付费频道。再见。

川普时代的汽车产业链动荡：关税政策下的全球供应链如何重新洗牌？

老范讲故事 — Fri, 15 Nov 2024 00:58:22 +0000

大家好，欢迎收听老范讲故事的YouTube频道。今天来讲一讲川普时代的汽车产业链如何迁移。

首先，川大统领确实是上台了。这其中有一点让我觉得很诧异，就是在投票之前，那一周的民调到底是咋做的。在民调之前的两周，再往前都是川大统领必胜，各种遥遥领先。到最后这一周的时候，突然就感觉两边都在使力气说不行了，有可能要输，有可能会有问题。跟川普有关的各种经济指标，像比特币的价格，很多他的股票相关的信息，都有明确的回调。这个让我觉得非常诧异，感觉好像是两边约好了一样。

民主党说：“我们也得走一些好看的数据。”到共和党说：“我们也不能让大家掉以轻心。”一旦大家觉得稳赢了，可能就不出来投票了，所以一定要让大家有危机感。因此，双方配合起来，给大家看了一个势均力敌，甚至在很多的州里边，哈里斯还领先的这样的一个民调结果出来，最后让大家担惊受怕了一整天，特别是到11月5号的时候。但最终呢，有惊无险，川大统领还是上台了。这个过程我们就不去详细分析了，因为你按阴谋论的方式，这个事就没完没了了。

我们来讲一讲，靠关税解决问题的川大统领，是否真的智慧？这真的是一种很好的方式吗？其实我们要思考这样的一个问题：市场这种东西到底是一个怎么运作的方式？其实很多人都在去解释说，哎呀，美国给中国商品加关税，中国的GDP会下降多少，美国的GDP会下降多少，或者是两边的日子都不好过。

也有人说，哎，我们不去加关税，我们去做补贴，我们去限制出口，或者做一些这样的事情，是不是OK？大家要注意，市场不是一个静态的。刚才所有分析这些方式的人，都是把市场作为一个静态的市场来去看待的。当然，他们有的时候也投机取巧，他们说什么呢？说这个关税一旦增加了以后，短期之内这个商品的价格会上涨，人民的生活水平会下降。他们隐藏了长期的可能会进行调整，或市场可以自动适应这种新关税的可能性。他们在里头加了一个短期之内，但我们要知道……

市场本身是一种动态平衡的状态。政府提出各种各样的政策以后，商人们会在市场里重新找到平衡。这个最忌讳的是什么呢？最忌讳的是微调。事无巨细，哪样都想动一下，这个是非常非常麻烦的。这会打破市场自己动态平衡、动态调节的节奏。就跟很多人去吃益生菌似的，说这个益生菌吃到肚子里以后，我们就补充了很多的有益菌群。实际上去测试的是什么呢？就是你吃完益生菌以后，它会首先把你肠胃里的菌群整个破坏掉。如果没法建立起新的益生菌群的话，这个肠胃就会失调。

怎么说呢？大政府喜欢事无巨细，东弄一下西弄一下，而小政府一般喜欢处理的方式就是，我只动一下，然后等着市场整个自己去调整。这样其实才是一个真正有智慧的方式。这也是叫奥卡姆剃刀原理吧。在面对市场的时候，如果没有必要，千万不要增加乱七八糟的东西。稍微动一下，等着自己动。

在这里呢，我们举一个案例。咱们今天先不讲汽车，先讲一个别的案例——芯片法案。芯片法案其实就是一个大政府的玩法。我想要芯片了，那我怎么办？向美国的芯片企业发补贴，向台湾的芯片企业发补贴，到美国来建厂吧。这就是大政府玩法。包括咱们中国国内的各种电动车补贴、电池补贴，其实都是这种大政府玩法。

这个里头，请让我们先为伟大的英特尔公司默哀5秒钟。为什么呢？英特尔其实是芯片法案最大的受益者。在500多亿美金的芯片法案里头，他大概能够得到85亿或者更多一些，再加上其他的各种投资减税的政策，所以他可以得到非常多的钱。因为所有造芯片的这些公司里头，只有英特尔是根红苗正的美国公司，所以他一直在努力地找政府要这笔钱。但是呢，直到目前为止，芯片法案的前期是英特尔没要到手。为什么呢？因为英特尔在奥巴马时期其实已经干过一次了。他在美国建了芯片厂，但是因为芯片卖不掉，所以厂房是长期空置的。等过了很长一段时间以后，发现芯片可以卖掉了，他才去把机器从阿斯麦拉回来，开始生产芯片。

如果芯片卖不掉的话，他这个机器还会停产。拜登有芯片法案了，英特尔又把这个厂房盖起来了，然后跑到国会去要钱。国会说：“我要万一把钱给你了，你又劣迹斑斑地把这个厂房盖了，然后不把机器拉回来，不给我生产这玩意，我不就亏了吗？这不划算呀。”

而且英特尔现在自己的状态又非常不好。高通都提出收购邀约了。在八月份的时候，在他公布上一季财报的时候，市值一度跌到了千亿美金之下，只剩下了810亿美金。但是最近呢，稍微缓了一点，1,131亿美金。你想想，另外一个芯片巨头英伟达，3.6万亿美金，这个是差得多大的一个数据。

当然了，现在川大统领上来以后，英特尔可以去做空了，接着往下跌。为什么他这钱拿不着了？前面政府或者说国会就不敢把这钱给他，怕被骗，因为他前面干过这种事。另一方面，你自己业绩又不好，真拿了钱了以后，你盖了工厂，拉了积蓄回来，你把芯片造出来，你卖不掉咋办？这事算谁的？

这是一方面。另一方面呢，现在其实虽然川大统领还没有就职，但是应该是众议院已经是共和党的了。共和党已经有众议院的议长，他上来说：“这个不划算，我应该把这个芯片法案直接废掉。”这不给你钱了，这给你了以后，你最后也造不出芯片来，或者你造了你也卖不掉，这实在是非常不划算的一个事情。

如果把芯片法案换成川普的这种关税会怎么样？咱比较一下，芯片法案是花钱，政府补贴给钱，他没有办法改变整个的供应链。你新英特尔就算把芯片造出来了，你打算把芯片卖给谁呢？你还是得卖给中国厂商，卖给韩国人，卖给台湾人。那这些人为什么不从台积电买？为什么不从三星买？为什么要从你那买呢？

你造出来的这个芯片，品质又没有人家好，良品率又没有那么高，还很贵。我干嘛上你那去定制芯片？真不划算。所以他没有办法去改变供应链，新建的工厂没有订单，就只能闲置。那么为什么这些大政府还会去搞芯片法案这种东西出来呢？其实大家都是心知肚明的，就是想去骗这笔钱。

最后呢，只能是睁一只眼闭一只眼，让有关系的人能够把钱骗走。这就是芯片法案大政府干的活。但换一种方式，关税了。就比如川大统领上来，他玩关税，那他怎么弄呢？他政府收钱，我不给你钱，我要收一笔钱进来。从境外运向美国的芯片都会变得很贵，不划算了。如果想在美国去销售一个更便宜的设备，那只能是在美国本土去造芯片，等于把整个供应链结构给改了。你就必须要在美国建工厂去生产，而且它让这件事情变得划算。

你像前面，甭管是英特尔还是台积电，在美国盖了工厂以后，它都不生产。为什么？我生产了以后卖不掉。你在美国生产的芯片，一定是比在台湾生产的贵的，甚至可能一些低制程的芯片，它比在大陆生产都贵。而且品质一开始肯定是比较差的。在这样的情况下，他就先搁那，搁着，我先把补贴要到手再说。

现在呢，等于芯片法案发了，但是钱一个都没发，现在是这么一个状态。那么有了生产动力，然后下面有了生产能力的公司，就会跑到美国去建工厂。像台积电，像Intel，它就有可能真的去建一个工厂去生产这些芯片，它就会变得划算起来。就算不在美国建工厂，他们也会将芯片的利润留在美国。

这什么意思呢？芯片大家想英伟达挣的多，还是台积电挣的多？肯定是英伟达挣的多嘛，3.6万亿美金的公司，现在市值第一。他一定是设计最挣钱。那只要是说我设计在美国设计，那我在台湾生产，在大陆生产，在任何地方生产，那我再弄到美国来，我交税，我只需要交生产那部分的税就可以了。

你比如说英伟达，委托台积电在台湾生产一堆芯片，比如说H100，一块芯片4万美金，5万美金。台积电说我这个加工费值2,000美金，剩下的48,000美金都是您的设计费。那他只需要为加工费这个2,000美金交税就完了。那个设计费本来就是美国人挣到了，他就不用再交税了，他就可以来这样处理。

那么商人呢，就会根据利益自行去选择应对的方法。所以小政府一般使用这种方法，他没有人惦记在里头贪钱。

他也不允许在里头贪钱，那干脆就是我收一笔关税，大家在里边随便玩就好了。现在呢，趁着川大统领还有俩月上台，最近的新形势是什么？海运爆仓。什么叫海运爆仓？就是所有的码头堆满了东西，准备拿集装箱把它运走。这是为什么？第一个，圣诞季快到了，圣诞季的时候，全世界的人民都要买东西。然后另外一个呢，再过俩月川大统领上来就要加关税了，那大家肯定趁着这个时候，抓紧的把买卖做了呀，把这个东西都运出去。

其实在中国Q3，咱们的整个的出口数据是非常难看的。咱们当时的就讲说欧美的消费不行，不好好买东西了。但川大统领一上来以后，赶快买，赶快再不买了，川大统领加税了，咱现在趁着便宜都买点。现在所有的海运都爆仓了，在9月份、10月份的时候，码头上都堆着空集装箱，没东西运。很多货人都停在那，但是川大统领一上台了以后，疯了，说赶快把东西都运到美国去，趁着没加税之前。

咱们讲到这了，后边汽车该怎么办？汽车产业链应该如何迁移？这件事情呢，还是要看马斯克跟特斯拉的供应链到底是怎么移动。大家照着他这样移，就没有什么大毛病了，因为毕竟他是第一功臣嘛，帮着川大统领上了台了，马上就要建这个什么真章的时候了，你不能把马斯克的后路断了呀。所以马斯克怎么挪，大家照那个方式去挪就行了。

第一个，马斯克现在要求所有供应链厂商离开台海两岸，避免台海两岸变成唯一的生产基地。应该是昨天的最新消息，首先对于台湾的供应商，甭管是特斯拉的还是Spacex的，所有位于台湾的供应商必须搬离台湾，这个没什么好说的，马上搬走。这个其实也很简单了，台湾是没有特斯拉的工厂的，所有的供应商，你必须跟着工厂走。

原来你还可以比如说在台湾造出一些东西，运到大陆来去使用，现在就别费劲了，就搬走就完了。所有台湾的有40多家工厂必须搬离台湾。然后大陆的供应链，大陆的供应链呢，你该给上海工厂供货的这部分，你只能在大陆生产，不能搬到其他地方生产去，这个没什么好说的。

但是，必须在离开台海两岸的地方设置新工厂。你不能说我就在这生产，其他地方我没有了，这个不允许。我以后不采购你的，你必须是在大陆给上海工厂供货的，同时再到墨西哥去给我的墨西哥工厂生产。你要在墨西哥重新建工厂。这是马斯克对台海两岸的供应链提出的要求。

现在已经有非常多的人跟着特斯拉一起去墨西哥建工厂去了。当然了，这个呢是为最坏的可能性在做准备。什么叫最坏的可能性？就是两岸可能会一起受到非常长时间的禁运。特斯拉不能为这事死掉，SpaceX还要奔赴火星呢，不能为这个事死掉。所以大家赶快搬家，这是马斯克提的要求。

因为一旦台海有事的时候，最大的可能性是什么？最大的可能性就是一起封锁，这个没有办法。它不像乌克兰似的，有一头还有一个很长的陆地边境，然后另外一头是很强大的欧洲，还可以不停地把东西运进去。台湾呢是在海上，咱们自己也算有两条航母了，有一堆的战斗机每天绕着台湾岛飞来飞去的。所以要封锁呢，肯定就一封一起封掉了。

大陆到底能不能打下台湾来，咱不知道。这个就算打下来了，也很难被国际社会所承认。在这样的一个情况下，那就封着呗，像现在俄罗斯入侵乌克兰似的，一下封三年。马斯克现在要做出这样的这个动作来，告诉你说：“唉，你没法拿捏我。”实际上干了这么个事，这是马斯克的运作方式。

咱们呢后边分四种不同的企业来讲一讲其他的汽车企业应该如何进行产业链的迁移。首先呢，咱们先讲一下川普的关税政策。第一个是给全世界所有的商品加10%关税，任何商品去美国加10%关税，这个有点像咱们收增值税，反正你进来就收10%。中国的商品关税是60%起步，然后接着往上涨。

其实拜登政府已经设置了一些关税，比如咱们的电动汽车是100%关税，光伏太阳能板是50%的关税。但大家注意没有，这两样东西其实都是马斯克的产品。马斯克在上海生产特斯拉汽车，马斯克的Solar City也使用大量的光伏板。

马斯克原来SOLO city是在美国很多的超市或者这种大的办公楼上面去装这个太阳能板，全都是中国生产的。这个基本上是奔着马斯克去的。但是现在呢，川普说了，如果谁在美国雇佣大量的工人，你可以豁免这个税。如果马斯克说：“我准备把大量的中国太阳能板弄到美国来销售，那你看我在美国雇佣了这么多工人，那你这个税豁免了。”这是可以干这个事了。

所以咱们来分四个部分讲讲，咱们怎么办。第一个，中国的新能源企业该怎么办？中国的新能源车企呢，可以去投奔贾跃亭了。为什么？贾跃亭其实在七八月份的时候就在讲，说我已经具备独特优势了。我在美国整个把造整车这条路都走通了，所有该做的批文，所有该做的手续我都做过了。哪个地方有什么问题我都摊过了。任何人想在美国销售汽车的时候，你来找我，我帮你把这事弄完。然后呢，你就可以跑到我这来造汽车，整车最后在美国生产，在美国可以直接把所有的手续、所有认证都给你做完。

甭管他卖了几辆车吧，但是他把所有手续都跑遍了。现在贾跃亭应该是已经可以开心的乐了。就算是买北国倒闭工厂改建的话，其实在美国造工厂也是很慢的，四年未必能够投产。但是呢，将设计中心迁移到美国去，将汽车的主要利润搬迁到美国去，这个事呢还是可以做的。

比如说我们经常使用的一种产品，上面写的叫“加州设计，中国生产”，这样的产品如果到美国去，我就把中国生产那部分的税交了，不就完事了吗？那设计这部分的利润我就留在美国，就不用交税了。而这个“加州设计，中国生产”的这个产品叫iPhone，他们就是这么干的。那么也是可以走得通的这条路，所以中国车企就准备往美国搬吧。

当然了，他们搬到美国会很贵，那怎么办呢？可以把生产中心搬到墨西哥去，将涉及市场、广告相关的这种成本中心迁移到美国去，这个应该是最优解了。当然，墨西哥前面建立的汽车厂、汽车配件厂呢，其实并没有那么顺利了，因为墨西哥政府自己其实并不是那么积极。墨西哥政府到底是为了什么去服务的？

咱们不知道，但是呢，很多的墨西哥工厂现在也在慢慢地建起来。毕竟，川普要求墨西哥管好非法移民，否则对墨西哥产品征税。那你干脆也甭过来了，你在墨西哥的工厂里，在汽车厂里上班吧。你也不用走线了，这个没准会在未来形成一种解决方法。中国的新势力就可以走这条路走通了。

所有的供应链企业，就是我不造整车的，我是TIER one、TIER two的这种供应链企业，跟着主机厂走就行了。主机厂去哪你就去哪。就是咱们管造整车的，这个工厂叫主机厂。台湾没有主机厂，所以就离开就行了。因此，特斯拉、SpaceX都要求所有的台湾的工厂撤离。主机厂肯定是跟着市场走的，哪个地方卖车卖得多，我就在哪个地方造整车。

全世界卖车卖得最多的前三名，大家知道在哪吗？2023年，第一名是2,300万辆车卖掉了，乘用车销售，这个地方叫中国；第二名是1,545.7万辆车，这是美国；第三名是1,284.8万辆车，是欧盟。这就是全世界卖汽车卖得最多的这三个地方。

所以你看，马斯克的工厂是在上海、在柏林、在墨西哥，当然在美国也有一些工厂。车厂主机厂一定要奔这去，三大汽车生产基地就是中国，这个没什么好说的，因为我们卖掉2,300万辆车嘛，谁也不愿意放掉这块市场。美国跟墨西哥算是一对，因为你在美国生产的贵，到墨西哥生产的就变得便宜很多嘛。美国人也不傻，也愿意买便宜货。

德国跟土耳其其实也是一对，德国特斯拉工厂是在那的，很多的配件厂，包括一些像比亚迪，很多这样的工厂都在土耳其。为什么？那便宜，而且那离欧洲近，直接上火车就拉走了。这个汽车这种东西，你要装到这种滚装船上去，全世界拉着满处都跑，一般是不划算的。

所以呢，基本上就这三个地方，配件厂就奔这仨地方走。你在中国、在墨西哥、在土耳其，你不一定跑到美国，跑到德国去。在这仨地方都是可以的。所以供应链必须向这三个地方迁移。现在呢，是中国供应链过剩，咱们的东西太多了，所以呢，现在就是中国的供应链。

在快速往墨西哥和土耳其迁移，这是供应链企业再往后的第三个选择。日本和欧洲的车企怎么办？那你说他们怎么来应对这个关税问题呢？怎么应对新的电动车风潮？这样的问题呢，他们现在的应对方式是这样的：在中国养蛊练兵。就是我在中国，我不能放弃这个市场，我还得在中国生产和销售电动车，即使赔钱也不退出中国市场。我就是要在这，跟你们这些中国新势力打来打去的。打完了以后我就有战斗力。你跟中国新势力战斗了，完了以后才有机会再去挑战特斯拉吗？要不然你挑战不了他。

咱们现在每天都是重新势力，围剿特斯拉这样的一个态势。所以他们还是要在中国做。这两天又出了一些新闻，比如说奥迪启用了新的商标Audi，他把这四个圈去了。干嘛呢？就生产电动车，在中国生产，用华为的系统。生产完了以后在中国销售。如果能够在中国占有一席之地，那咱就把这车拉回去呗，再弄到欧洲，弄到美国，再去生产再去销售，不就完事了吗？

所以他们还是要在这折腾的。而且呢，他一旦是说要到美国、到欧洲或者到墨西哥去生产这些奥迪汽车或者丰田汽车的时候，他可以继续使用特斯拉在中国建立起来的产业链，快速迭代出自己的车型来。这是他们现在努力在做的事情。现在丰田在中国销售的电动车使用的是中国的车机系统，他们自己投资了一家，他们也有一部分车直接用的华为的。奥迪用的华为的，大众则是直接买了小鹏的技术。

其他的很多欧美车企、日本车企都是在中国找合作伙伴。而且他们大量投资和收购中国的汽车软件企业以及软件设计师。他要把这块板补上。因为大家知道，特斯拉是不需要这事的，他所有东西都自研的。但是日本车企、德国车企是没有这个能力的。所以干脆说，你们都做得差不多了，还便宜买下来吧。而且这些日本车企、德国车企本来就在美国有大规模的生产基地。我记得原来讲这个Figure01那个机器人的时候，他们就是跑到美国的宝马工厂里去实习的，机器人上岗了已经。所以他们已经直接可以申请。

减免相关的关税了。那么，将中国的研发团队搬到美国，或者将利润留在美国，可能也是他们未来的一个选择。那是三个了，第四个是什么呢？第四个可能在川普的关税政策生效之后，会诞生大量的美国新势力。现在都是中国新势力，PPT造车造完了以后，真的把车造出来以后，这么多的品牌人员、设计人员、营销人员都往美国聚集了。他们要把利润搬到美国，这部分不要交税了。

这些人去美国，去了美国以后就总有离职的，总有人混不下去的。这些人就会去创业，这些人呢，就会快速地利用已经整合好的供应链，而且是弹性供应链，直接把新车造出来。这些人再设计出来的新汽车，就可以直接拿这些供应链去生产了。那么，PPT造车就不再是梦了。像富士康做的Model B，就等着大家呢。你看，我们有生产能力，你只管拿出图纸来，我就给你把车做出来。这个事是没有任何问题的。而且，如果马斯克开放了FSD，因为马斯克一直承诺要把FSD开放出来给别人用，那么可能大量的美国新势力就直接崛起了。

这个可能是一些新的方向。那你说中国政府难道就看着就不动吗？这个肯定不会了。中国政府呢，按道理说应该是会对美国的商品进行反向制裁。甭管这个日子过得怎么样，生意怎么好不好做，反正面子咱不能丢。美国一旦是开始给中国的商品加税，我们呢，一定是会给他加回去的，包括农产品和一些其他的美国商品，都会加税加回去。

短期内呢，我们可以靠俄罗斯的农产品和工矿原料，可以搞定这个事情。长期的话，就要看咱们一带一路到底好不好使。如果下边换民主党了咋办？美国他要选的呀，下一届有可能会换回去。民主党呢，属于这种大政府，或者说至少比共和党的政府大吧。他们大概率呢，会在当前的关税政策基础上继续画蛇添足，然后修修补补。大政府一定是惦记说钱在我手里，然后呢，我去花。因为你只有策划花钱的时候，才有机会上下其肉。你收钱的时候，收完了以后到国库里了，它变成了一本很干净很透明的帐，你是没有办法去上下其手的。

所以到民主党的时候不会有大的改变，但是他还是会想办法再补贴点什么，再把一些钱落落手里。那么未来的汽车市场格局会是什么样的呢？设计品牌营销等高利润环节，为了躲避关税，可能就会去美国。这是一个比较现实的问题。主机跟供应链厂一定会跟着市场走，哪个地方卖的车多就奔哪里去。你说这个供应链全都搬离中国，这不用想，咱卖2,300万辆车的，这个是死数。而且那是2023年，2024年肯定比这数还高得多，因为现在卖车已经卖疯了。

我前两天去这个特斯拉商场里体验店，他们就告诉我说，你现在交钱，在这也得等俩礼拜。特斯拉也得排期，你不能说马上交了钱马上把车开走。我说那好吧，他这个也是不那么容易交付的。所以今年的这个车在中国的销售量一定是比去年高非常多的一个数字。那么主机厂跟供应链厂在中国一定会留一套，美国呢应该会出现大量的造车新势力。未来在美国你想造出一款新车来，可能会变得非常容易。

美国会出现各种各样的实验型工厂和这种黑灯工厂，就是什么机器人那种工厂会在里面。所以虽然制造业会回流美国，但是真的不一定会给万斯的老乡们更多的就业机会。你像特斯拉已经把擎天柱造出来了，准备明年下场了。Figure 01的那个机器应该明年也可以下场。所以就算是这些工厂去了美国，也不会增加太多就业。

中国、墨西哥、德国、土耳其应该会成为新的汽车产业中心。这就是未来的一个汽车格局。当然了，中国肯定也看到了，哎呀，汽车这条路好像是被美国封住了吧，咱们以后做航空吧。所以呢，咱们在航空工业上努力发力。有一家公司被普遍看好，2000年就创立了，做航空与空中交通管理软件的相关业务，也做人工智能、VR、AR，还做飞行模拟和训练。最近一个月股价暴涨了100%。创始人是一个老教授，叫尤志胜，是四川大学的一个老教授。这个公司第二大股东呢，就是四川大学。这个公司的名字叫川大致胜，当然今天好像这个股票跌了。

所以，我们未来可能向航空业发展。这就是咱们今天讲的第一个故事。最后，用一个开心的笑话跟大家结束一下。

字节跳动终于迎来懂王！未来会怎样？！🤔✨在美国和全球，TikTok会沿着抖音的路径，继续高歌猛进

Luke Fan — Sun, 10 Nov 2024 00:37:48 +0000

字节跳动守得云开见月明，等来了懂王。大家好，这里是老范讲故事的YouTube频道。说这几天懂王当选了，谁最开心？除了马斯克之外，估计字节跳动的人应该也在其列。为什么？因为前面拜登政府是要封禁他，把字节跳动放在了一个没有任何回旋余地的地方，就是要么你把股份卖掉，成为完完全全的美国公司，要不然就直接被封禁，等于退无可退。

但是现在终于算是天晴了，太阳出来了，懂王来了。要想被挽救，一定要自身过硬。你比如说，我们盼着懂王拯救一下，你说我自己的数据很拉胯，完全没法看，这个对于商人来说是没有任何价值和意义的。所以打铁还需自身硬。

字节跳动上半年的财报算是一骑绝尘，在国内已经完全没有对手了。不要去跟这种大国企、大央企去比，跟所有的互联网企业比，它已经算是一骑绝尘跑掉了。在全球范围内的话，它的收入已经开始直追Meta了。上半年字节跳动收入是730亿美金，Meta上半年是755亿美金，所以这个直追是真的追得很近的。而且年底的话，没准还能再往前蹭一蹭。

现在的字节跳动，在国内的收入已经开始放缓。今年上半年的整体增长了35%，境内收入的增长呢，要稍显疲软一些，只增长了28.89%。其实你对一个互联网企业来说，你有两位数的增长，就是10%以上的增长，已经算是还不错了。如果说降到两位数以下，我们就不认为你是互联网企业了。但是对于像字节跳动这样的公司来说，28.89%这样的同比增长率，还不是一个很好的数字。为什么呢？因为这属于还没上市的独角兽，这种公司的增长一般都是在百分之三四十往上走的。

为什么字节跳动在国内的增长放缓了呢？第一个是境内的经济还是没有那么好。现在虽然不太讲稳中向好了，但是依然不承认有大的系统性结构性的问题。其实很多问题你如果不承认的话，就很难把它解决掉。所以现在国内的所有商家只能是继续卷。在卷成这样的一个情况下，它依然可以增长，这就已经是非常不容易了。

干了一个很奇葩的事情，它叫“要流量，不要销售额，不要利润”。什么意思呢？你正常来说，我是一个公司，我一定是要最大的利润，要挣最多的钱，要回报股东。很多人说呀，你们公司的slogan是什么？你们公司的目标是什么？讲得天花乱坠，但其实所有的公司只有一个目标，就是挣了钱回报股东。如果哪个公司说我们的目标不是这个，要么你是非盈利，要么你就是骗钱。

但是呢，字节就反过来了，说我不要利润，甚至我也不要销售额，我就要单量。什么意思呢？就是它也是可以在后台调参数嘛。你在要利润的时候，那你一定是什么？要让利润最高的商品多展示、多销售，这样利润才能上去。你要销售额呢，你一定要把比较贵的商品多展示，要不然你说我卖一堆特别便宜的商品，那凑了半天，你这个销售额是很少的。而且便宜的商品卖得越多，你利润越低。为什么呢？不是说便宜的商品利润率就低，但你想，你每一件商品卖掉了以后，是有固定成本的，运维、合规、交付、快递什么的都是成本。

你等于卖了一个5块钱的东西，哪怕你挣3块钱，你把那些成本摊掉了以后，没准会赔钱的。你卖了一个1万块钱的东西，哪怕说我只挣个500，这也就是挣了一个5%的钱，但贪完那些成本以后，你可能还是挣钱的。

而现在，字节跳动搞了一个特别奇葩的事情，就是说我只鼓励销售的单量，至于你卖的便宜、卖的贵我不管你，卖的利润多少我也不管你，我就要单量。导致什么呢？所有在字节跳动平台上卖东西的人说：“哎，我们应该尽量卖便宜的东西，只有便宜的东西单量才能大嘛。”利润要低，价格要单价要低，甚至呢，很多东西我们要把它拆开了卖，大包装拆小包装去买，这样卖的话，字节才乐意。

字节乐意有什么好处？他给你流量，他给你做流量倾斜。那你说这种玩法，是不是导致了他今年上半年在国内的收益增长放缓？是这样的。但是呢，这个玩法背后实际上是有阴谋的，不是随随便便就来的。你虽然收入变少了，收入的增长率变少了，收入还是上升的。

但是，收入的增长率变低了。我们要看到一些数据，比如抖音。抖音有8亿用户，8亿用户不算多呀。腾讯的微信有10亿用户。对抖音来说，它是一个娱乐产品，而微信是一个人们生活中必不可少的工具。所以，抖音8亿用户，但8亿用户不算特别神奇的事情。

神奇的在于，8亿用户里头有7亿日活。这是完全无法想象的一个数据。日活是什么？就是每天活跃的用户。中国一共有8亿用户，7亿都是日活。因此，它的用户活跃度极高。

很多应用，你一看，哎，用户量很大，但累计安装时不去重的情况也很常见。因为很多算累计安装的时候不去重，一个人装10次就算10个。哪怕你去掉重复的累计安装，你有10个用户，但日活不一定有那么两三个，这才是一个正常的情况。

但是像抖音这种，8亿用户，7亿日活，真是非常恐怖。但这还不是最恐怖的数据。最恐怖的数据是什么？单用户日活时长接近一小时。什么意思？每个日活用户刷抖音的时候，平均每天大概刷一个小时。这是非常非常吓人的。

你说我这个日活很高，但你的用户每一个日活时长只有20秒、30秒，或者是10分钟。这跟日活时长一小时的差异在哪里？大家知道吗？你日活时长一小时，你有非常多的展示机会，有很多看广告的机会，很多形成交易的机会。如果单个用户的日活时长只有十几秒、二十几秒的话，你能看几条广告？你能有几次形成交易的机会？这之间是有巨大差异的。

所以，抖音在国内的数据，整个字节跳动在国内的数据，都好得一塌糊涂。这就是通过刚才我们讲的，要销售的单量，不要销售额，不要利润造成的。为什么？我就是让你不停在我这刷。刷完了以后，哎，很便宜买一个吧。待会再刷，刷完了以后再买，哎，刚刚好像买过东西。嗨，没事，那个东西也不到几十块钱，再买一个也没什么关系。

实际上，他们通过这种方式牺牲销售额、牺牲利润，在干嘛？抢流量、抢用户、抢用户时长。原来它可以花钱去买，你可以像华为去买，像OPPO、vivo、小米去买，这些流量现在已经没什么可买的了。

所有的用户都已经转换完了。现在大家都是在用户有限的使用时长上去抢时间。如果你比如说我今天在抖音上买了一个5000块钱的东西，那我可能今儿我就不看了，或者再看到任何其他东西我就不买了。但是你看我今儿在抖音上买了一个20块钱的东西，没准刷刷刷我就又买了个20块钱的，或者再买了一个100块钱的东西，我就会一直刷下去。

原来没准这些时间我就去逛拼多多、逛淘宝、逛京东去了。但是现在好了，反正没花多少钱，接着逛吧。我可能就大量的时间在抖音上就都消耗掉了。而这实际上是一个阳谋，就是用利润去换用户的使用时长。我少挣点钱，你在这多刷会，多买了点东西，没关系，很便宜，再买没事。这是抖音在国内干的活，也是现在的无奈之举吧。

在境外那就是高歌猛进了，TikTok继续狂奔，海外收入170亿美金。也就是刚才咱们讲的730亿美金里头，有170亿是TikTok，同比增涨了60%，涨得是非常猛的。但是现在的TikTok收入还是非常非常保守的。为什么现在TikTok的主要收入是广告，而且是娱乐和媒体广告占主导地位？

为什么说这样的数据就很保守呢？大家要注意，抖音在国内的主要收入是什么？是电商以及电商的广告。这才是主流最挣钱的。因为你打了半天广告，最终还是要变成交易的。如果没有办法在你的平台上变成交易，那你的交易转化率可能就有问题。大家就不会愿意去认可你的交易价值，或者广告价值，就比较难以被认可。

但是如果你哪天电商走通了，雪球整个滚动起来了，就完全挡不住。因为我在这卖东西，我就要再去打广告，去推广我的这个账号、推广我的店铺、推广我的直播间。所有的这些用户，就会在这个电商模式的基础下，整个运转起来。这才是真正挣钱的方式。现在TikTok这个大钱还没开始挣呢，他就已经挣到170亿美金了。未来的话，TikTok应该会比抖音更挣钱。为什么？因为它用户量更大，而且用户的支付能力也足够强。

欧美用户和日韩用户，这都是很有钱的用户，绝对比中国用户支付能力强。但是，唯一的缺陷是什么呢？就是欧美日韩这些地方的产品交付能力要比国内差一些，送快递什么的，这个要差一些。等着马斯克的RobotaXi，加上他的擎天柱无人送快递，等哪天这玩意成了以后，TikTok就可以再上一层楼。

现在字节跳动说：“我自己的成绩足够好，懂王您上来了拉我一把呗。”前面要封禁TikTok的法令依然在，但是现在TikTok在起诉美国政府，而且这个案子也还在审理之中。现在懂王上来以后，至少这个案子再想去快速推动，就没有那么容易了。谁有这积极性跟懂王找不痛快呢？懂王已经讲了：“我们并不需要把TikTok干掉，如果把它干掉了以后，唯一受益者是Meta，他变成一家独大，这个事并不好。”这是懂王的原话。

那么在这样的情况下，你一个案子就慢慢放耗着呗。拜登到退任之前的最后一天，到底能不能签个字，直接把这个正在审理之中的案子直接给他执行掉，现在应该就有很大的问号。而且拜登其实也没有必要在最后找这个不痛快，他也说了：“我们顺利做好交接就完事了，不再需要折腾什么其他事情了。”所以，TikTok应该算是逃过一劫了。

那么懂王为什么不希望Meta一家独大呢？现在X是属于马斯克的，但是Meta这块的扎克伯格呢，就属于忠诚的不绝对，绝对的不忠诚这种人。马斯克属于绝对忠诚，站在懂王的那个演讲台上，上蹿下跳，挨着个的发钱，说：“你们赶快给懂王投票，投了票我给你钱。”这样的方式，把懂王真正的托举起来，所以这个绝对是最忠诚的手下了。

但是扎克伯格不行，扎克伯格虽然也表态了：“哎呀，懂王被枪击了以后，这个照片让我看到了，感觉热血沸腾，这就是我崇拜的英雄。”但是他也表态了：“我们是中立的，不支持任何一个候选人。”这个是完全不一样的一个表态。那么你说，我已经有X，可以在Meta面前去竞争了，为什么还要再留一个TikTok呢？现在Meta在主要打短视频。

X实际上也在主要打短视频。你现在到X的页面上去翻，到X的这种应用里边去翻，上面从上到下都是短视频。为什么一定要留着他？其实X在Meta面前是基本上不够看的。即使在大选的最后几天，X的活跃数猛增了数倍，但依然比不了。马斯克在大选胜利之后，专门晒了一张图说：“你看，我们X上的用户活跃度蹭蹭蹭就上去了。”但为什么比不了用户总量？X跟Meta是差着数量级的，这个差非常非常远。活跃用户的数字，那就差得更远，可能差两个数量级以上了。用户停留时长，这个也是非常大的差距。而用户价值的话，完全没法看。

Meta的用户广告价值是非常高的。很多人都是在这个上面打广告，做电商，做各种各样的宣传和推广。因为我们以前做游戏公司的时候，每年都是大量的钱投在Meta上，甚至是我们可能每年销售额拿回来的钱，百分之八九十都交给Meta。就中国玩流量的这些公司，都是给Meta交钱的，剩下的可能是交给谷歌了。为什么交给谷歌的少？因为谷歌的广告系统相对来说不是那么好用，并不是说它效率差，只是工程师做的系统嘛，你需要学习更多的技巧，才可以把它用好。用好了也是很厉害的。

Twitter在这一块，或者叫X这一块的用户价值，就已经非常非常打折扣了。为什么？就是原来X还是有一定的用户价值的，但是在马斯克上来以后，他被很多的广告联盟所抵制，大家不在这打广告，所以导致X现在的收益其实是要比原来收购之前差非常远的。很多人都说：“哎呀，懂王上台了，X是不是已经估值翻倍了？”他440亿美金收下来的，就算他估值翻倍了，也就是880亿美金。Meta呢，是上万亿美金的公司，而字节跳动是2,000亿美金的公司。而且我觉得字节跳动如果真的上市的话，奔万亿走是没什么问题，因为他的收入跟Meta已经上下差不太多了嘛。哪怕你达不到万亿，达到个七八千亿，这个事是没毛病的。这个X跟他们比实在差太远了，商业价值上也是完全没法比的一个事情。

所以，TikTok才能够在这种媒体竞争中，或者叫社交媒体竞争中，平衡Meta的强势。当然，很多人说懂王上来，他应该按照商人的方式去思考问题，去处理问题，因为他是个成功的商人。那么，商人怎么处理问题呢？懂王您话下道来，字节跳动和TikTok在下头执行就完了。您说怎么办，我们就怎么办。你说我们应该把多少整合团队，或者审核团队弄到美国来，我弄来。你说我需要在美国怎么去建立这个审核的机房，怎么能够保证美国的数据不到外边去，这些东西我们需要怎么让第三方监督。你只要划开道了，我们就给你办就完了。

桌子下边还有东西吗？一定有。但是，桌子下边的东西是不能摆在桌子上边的。这个什么意思？其实我们去看拜登政府给TikTok下的禁令，以及他们前面的所有听证会，你会感觉到疑邻人为贼。我怀疑你是坏人，有证据没？反正我就是怀疑你。你自己也没法自证清白。他就这样的一个状态，他把很多桌子下边的东西搬到上边来了。我因为怀疑你，我又没有什么证据，但是我心情不好，我就处罚你。

这个事情商人一般不这么干活。桌子上面的东西就是桌子上面东西，桌子下面的东西就是桌子下面的东西，他不会弄混的。而且懂王阵营里头还有一个反华大将，谁？万斯。他这个副总统，但是万斯呢，是PayPal黑帮的代表。他后边很多的大佬都是原来PayPal的创始人，包括像马斯克这些人。这是一个圈子里的人，他们是完全明白互联网到底是怎么做互联网的。很多的推荐算法和这些东西到底是什么情况，他们是搞得明白的。他不像是民主党这帮人似的，说他其实不懂到底是怎么回事。他不懂了以后，他就开始恐惧，然后无限的往上拉升，说我们做到这样，我还是觉得不够，再往前坐一点，我还是觉得不够，搞成这样的情况。

而且商人的处理模式里头，还有一个很重要的点是什么呢？就是政治服务于商业，而不是反过来。底层逻辑是商业逻辑，我们只要把生意做好了就可以了。如果生意受到阻碍了……

再使用政治手段，比如价格、税什么这样的事情，我们最终还是要商业利益。反过来的话，我们的商业行为是要为政治服务的。一切先讲政治，这件事情呢，至少原来民主党他们搞的这一套东西，现在看并没有什么特别好的结果。

现在对于字节跳动来说，下边该干嘛了？大力出奇迹的时刻到了。前面美团、拼多多都是属于中国比较喜欢干“大力出奇迹”的这些公司，现在该轮到字节跳动了。说上吧，甭想了。字节跳动的用户基本盘是稳定的，用户量在快速增长，活跃度非常高，高到简直是吓人的一个地步。活跃时长一小时，咱们看到这么多的应用里，大概只有Meta还有Instagram的活跃时长可以达到50分钟，其他很少有应用和服务的活跃时长可以达到这么长的时间。游戏可以，但是你只要不是游戏类的这种应用和服务，你的用户活跃时长能够到20分钟，就已经非常不错了。

然后用户的商业价值极高，这是TikTok现在的一个基本盘。而且字节跳动，甭管是抖音还是TikTok，它已经把所有商业模式都打透了。那你说所有商业模式这么夸张吗？对的，广告这个商业模式打透了，文化娱乐，从动漫、小说、短剧、游戏也都做明白了。字节跳动可能就是游戏做的稍微差一些，他的游戏团队总是三天打鱼两天晒网，今天收购一团队，明天把他开了的这样的一个状态，游戏还没有太搞懂。但是小说、短剧都已经做得非常好了，而且这两块目前还没怎么出海呢，更不要说什么直播这些东西，直播现在也是可以出海的。

这些之外还有什么？电商，包括直播电商、货柜电商、本地生活、团购，这些东西抖音都已经玩透了。而且在国内里头，他可以按着每一个行业里的老大上阵，厮杀三百回合。货架电商可以跟淘宝、头天集团干一仗，直播电商他就是老大，别人都惦记着干他呢。本地生活可以拉着美团下场厮杀一顿，团购也是如此。

再往后还有什么挣钱的商业模式？金融。我都搞完电商了，那剩下的呢？借钱，像我们在抖音上买东西。

为什么喜欢买，都是使用抖音的“先买后付”这种服务。一摁确认，这个东西就到手了。等你收到货了以后，再去付钱。这都属于抖音金融的产品。所有这些商业模式，他这样都打明白了。只要能够守住现在的用户盘，就可以把所有的这些挨着个都上一遍。广告现在已经有了，在TikTok上已经挣到钱了。其他的什么短剧、小说、游戏、电商、本地生活、团购、金融，挨着个的，在全世界让他们都见识见识，中国人都是过着什么水深火热的日子。

那这个收益，绝对是可以翻着跟头往上涨的。而且字节跳动这几年各种降本增效，游戏团队干掉吧，教育团队干掉。除了他维护基本盘之外，剩下集中力量办的大事是什么？AI啊，全村最后的靓仔，一定是花足够多的钱、足够多的人、足够多的数据和足够多的显卡。他在中国买显卡，算是买的非常多的一个公司。而且呢，做人工智能的人，字节跳动的这个团队，应该也是国内最强的一个团队。就是甭管是从人员数量、素质、薪资，所有加在一块，字节跳动应该都是最强的，应该比百度还要强。他们从百度挖了很多人，而且也在里头投了足够多的钱去烧。

而且呢，字节跳动还有一些优势，比如像OpenAI，他们都比不了的，是APP能力。APP能力那真的是全球第一，没有之一。你说我想做个应用，想做个APP，想做一些服务，这一块谁也比不上他，可以做出十几亿用户的应用来，而且可以让大家在里头玩的很开心的，这种团队，全世界没几个。Meta是可以，但其实我要告诉大家，Meta做的应用的品质跟字节跳动比起来，简直是太粗糙了。字节跳动那是中国公司，他可以上十倍的人在里头绣花，Meta哪有这功夫，哪有这人力。

再加上什么，我们这一波干的叫AIGC，内容生成。但内容生成了以后，最大的社交媒体平台，最大的短视频平台，这个是谁？社交平台最大的是Meta，但是社交媒体平台最大的短视频平台，那是TikTok。大家能够生成最好的内容，视频、图片、文案、音乐，这些东西。

你还是要往 TikTok 平台上放的呀。学得文武艺，要货卖帝王家。你不能说我自己生成了一大堆的视频，最后我没地放，我没地方挣钱去。那这个没有任何意义。哪怕是 OpenAI，它把 Sora 大模型做出来了，做得还特别好。那你 Sora 最后做出来的产品，还是得到 TikTok 上去放。原来 Sora 在比较热的时候，每个月每个礼拜就往那个 TikTok 平台上放新的视频，大家一看，哦，好漂亮好帅，都是这样的。

你如果没有往那放的这个能力的话，那你咋弄？那你说其他的一些视频平台，他们没有这个能力吗？还真没有。YouTube 世界上最大的视频平台不是短视频，短视频最大的是 TikTok。最大的视频平台 YouTube 压根儿就没有这种工具。像我天天做 YouTube 还在用字节跳动加的剪映，每天在这剪东西呢。而剪映里头各种 AI 功能那叫一个完整，一堆的人给他做测试。因为剪映在很长一段时间，在美国的 iOS 排行榜上排第一。在 AI 的领域里头，字节跳动应该还是大有可为的。

那么最后总结一下，字节跳动未来可期。赶到懂王上台了，终于把拜登老爷子熬过去了。未来的话就是大力出奇迹，使劲使劲往前走。而懂王团队的话，甭管后边是万斯背后的 Paypal 黑帮人员，还是说里边有马斯克这样的人，他们对于字节跳动这种智能推荐算法为核心的商业模式，就至少却魅了。他不会说看这玩意害怕，他知道这东西怎么回事，也可以比较清晰地来划清责任利益。

那么在这个过程中，该在桌上搞定的事情，字节跳动肯定也都愿意配合给你搞定；可以在桌下搞定的事情，这些人其实已经是整个互联网圈子里头最顶尖的一群人了，他们也可以达成相应的合作或者相应的交易。所以不用为他们担心。

大家赶快去看看字节跳动，哎呀，还没上市。好吧，继续期待一下吧。好，这一期节目就跟大家讲到这里，感谢大家收听，请帮忙点赞点小铃铛，参加 Discord 讨论群，也欢迎有兴趣有能力的朋友加入我的付费频道。

再见。

特斯拉首破禁锢：外资企业终于获准申请ICP许可证，新政策全面解析

Luke Fan — Mon, 28 Oct 2024 00:59:28 +0000

10月23号，突然发文，互联网增值服务对外开放了，特斯拉第一个上来申请。这到底是什么样的情况？大家好，这里是老范讲故事的YouTube频道，今天咱们来讲一讲，到底啥是互联网增值服务，这一次都开放了一些什么东西。

互联网增值服务呢，指的是利用互联网通讯、网络资源和互联网技术，在基础的互联网接入服务、信息服务之上，通过深度加工、开发和整合等方式，为用户提供具有额外价值的服务。这个呢是一个基本的解释。你说你这说的好像是一堆废话。

互联网增值服务里头，有一个比较核心的证书，叫ICP证书。咱们国内就是你做各种服务，就需要申请各种各样的许可证。ICP许可证呢，叫电信与信息服务业务经营许可证。但是呢，这一次给外资开放的，仅仅是互联网信息服务业务，其他的并没有开放。

以前你要想申请ICP许可证，这个企业必须是纯内资，里头有1%的外资都不行。你的股东里头，股东的股东里头有1%的外资，也是不能的，必须是纯内资。以前经常去搭建VIE架构的核心原因，就是这样的，你必须是纯内资，差一点都不行。

现在呢，就是不限制了，你外资也可以，100%外资的，我都给你发SP许可证。只是呢，你只能够做互联网信息服务业务。什么叫仅能做互联网信息服务业务呢？意思是这样，你可以做信息发布、信息搜索、信息交互等服务的网站平台或者是应用程序，其他的你是不能做的。

那你说还有什么其他的呢？这个ICP许可证其实是非常强大，你在互联网上做任何事情，你基本上都需要ICP证。很多证书，甚至是需要你先拥有ICP证书，你才可以再去申请的。例如，互联网出版许可证。你说我想做个起点中文网，我想做个网络小说的网站，你必须要拥有这个互联网出版许可证。你没有ICP证书这个东西，你连申请都申请不了。

或者是网络文化经营许可证，俗称叫文网文，这个东西你没有ICP证书也申请不了。你说广播电视节目制作经营许可证，这个其实倒不一定非要有ICP证书才能申请。

但是通常拿这个证书的人，也会有ICP证书。这两个证书不是有这种承上启下的关系，但一般情况下会一起运营。就是你只要在互联网上干任何事情，你都需要ICP证书。咱们以抖音为例吧，抖音有哪些证书呢？

第一个，ICP他必须有，没有没法干活。第二个，网络文化经营许可证你也必须有，没有是不可以干这个事。第三个，叫广播电视节目制作经营许可证。如果你没有这个证的话，你上的那些短视频是不可以用的。

还有一些人说，咱们是不是应该还有一个证书，好像叫做互联网视听许可证。是有这张证书，但这个证书呢跟咱们现在讲的ICP证其实没什么关系。这个证书是由广电部发的，所以呢它一般是发给电视台的，比如说中央电视台、国际广播电视台，他们会领这种证书。拿这种证书别说你有外资了，民营企业都申领不了，都是这种国有的大企业才有可能去申领互联网视听许可证。

那你说咱们周围，有谁用这个互联网视听许可证吗？除了刚才咱们讲的这些什么中央电视台之外，还有比如说小米电视、华为电视、乐视电视，他们呢就需要使用互联网视听许可证。你如果没有这个证的话，就不可以把电视卖出去，但这个证跟ICP证没关系。

那么ICP证还可以做什么呢？就是除了刚才咱们讲的信息发布、信息搜索之外，还可以做社区。你比如说我做一个什么开心网，都是需要有ICP证的。还可以做IM，你说我想做微信、想做QQ，这也需要ICP证。然后呢，信息保护与处理的服务，比如360杀毒这些东西，有偿信息下载这个下载站，以及互联网设计相关的服务，还有互联网游戏相关的服务，招聘、互联网金融电商平台，这些都是以ICP证为基础的。

现在呢，要求的是你这ICP证，就是做信息发布就可以了。其他的，呃，回头咱们再说。你比如说文网文这些，外企肯定是申请不了的，包括互联网出版许可证、广播电视节目制作经营许可证，这些外企都是申请不了的。现在只是ICP中有一部分，他们可以干了。

那么这一次都开放了什么呢？除了ICP证之外，其实还开放了一堆其他的证。10月23号发的消息出来，允许外资不受股份比例限制地去申请一些新的许可证。原来呢，有些许可证是受股份比例限制的，比如说必须中资占50%或者51%，你才可以去申领一些许可证。像刚才我们讲的ICP，为什么单独讲它呢？因为互联网增值服务基本上讲的就是这东西。而且原来的ICP真的是一丁点外资都不行。比如说你的母公司的母公司的母公司里，它有那么一点点外资，它都不允许你去申请。

因为我以前在游戏公司的时候，就出现过这个问题。我们接受了一个人民币基金的投资，这个人民币基金里头呢，有一个LP，就是出钱的人，是这一个国内的A股上市公司。它的这个投资进入以后，就导致这个公司没法再去申请ICP了。为什么呢？因为外资是可以在A股上去买卖国内A股上市公司股票的。所以你只要是A股上市公司，你就不是纯内资企业。这个大家没想到吧，也是很神奇的事情。

所以只能再去绕来绕去的去注册新的公司，通过协议控制，然后再去申请ICP证，才能再去发行游戏。因为你发行游戏，必须要有ICP证的。当然，除了ICP证之外，你可能还需要一些其他的证书，才能去发行游戏。那么这一次允许的是哪些呢？第一个刚才我们讲的ICP。然后ISP，ISP叫互联网接入服务许可证。这个东西主要给两类人用：第一类，比如说像咱们家里头给咱们接宽带的这帮人，他们是需要ISP的；另外一拨人是什么呢？云计算的服务商。比如说我是个云计算机房的服务商，我自己可以处理域名，直接对外公共服务的，这部分是需要ISP证书的。

那你说我这个是云计算服务商，但是我只给企业内部使用，我不对外服务，那它是不需要ISP证书的。然后云计算服务商还需要一个证书，叫IDC证书，就是数据中心服务许可证。这一次也开放了，你们可以自己去申请，自己建机房了在中国。

然后VPN证书，这个VPN就跟大家理解的字面意思是一样的。现在我们也允许这些外商企业去申请VPN证书。

然后EDI许可证呢，叫在线数据处理与交易业务，这个一般是发给电商平台的，也允许他们去做了。然后SP许可证，这叫信息服务业务，你说我提供各种信息出去，一般你是要有SP许可证的。

然后呢，CDN这个是叫内容分发网络许可证，需要去分发很多信息，然后要在全国各地建机房，让每一个用户可以就近获得这些信息，这就需要CDN许可证。这些许可证都发了，而且不限制你的持股比例，就是你100%都是外资，我们都愿意发给你，这个是一个巨大的进步。

然后四个试点城市，这个就不是全国铺开的，应该叫四个城市或省份吧，北京、上海、深圳，还有一个叫海南。所以呢不能叫四个城市。第一批申请的企业，现在都在上海，其他三个地方还没有看到谁来申请的。

那么排第一的是谁呢？特斯拉。他第一个冲上来说我需要的东西。然后叫托克，这个我不太了解，据说是全球大宗贸易相关的一个公司。然后汇丰金科，就是汇丰银行下面做金融科技服务的一个项目。还有西门子数字医疗科技，听这个名字大家就知道他是干嘛的，他们也跑出来申请了。

然后呢是猎聘网，猎聘网其实不是一个纯外资企业，它应该是一个VIE架构的这种互联网公司，就是它的最上面的母公司应该在开曼群岛，然后是搭了一圈公司进来的。他整个的运营融资，包括创始团队应该都在中国。原来呢，他们都是通过VIE架构控制一些境内的这种壳公司来去帮他们持有ICP相关的这种牌照，现在呢他说我直接申请，不不过那个VIE下面那壳了，我直接就可以去用了。

然后秦达瑞，这个不知道干嘛的，还有一个叫益力互联，这两个公司都不知道干嘛的。然后U N I T Y，这就是做游戏引擎的这个公司，说我也需要申请一张，我需要为中国的游戏开发者提供相应的服务。还有一个叫普洛斯，这个是做物流基础设施运营的一个公司。

现在呢，就是这些公司跑去做第一批的申请人了。那么，传统的处理方式是什么呢？就是如果没有这一次的开放，其实生意也都在做。这个活人不能让尿憋死。

传统的方式，你像谷歌呀、微软，都是找代理商，你们替我来代理一下，你们来处理相关的业务。然后，甚至有一些代理商呢，微软还会进去投资。当然，微软一旦投资了以后，你就还要再去做一个VIE架构，然后再控制一个壳公司，在外面去做所有相关的证书，这个大家都已经学会怎么做了。

像那个海外的游戏公司呢，一般是要在国内找发行商的。你比如说任天堂，我需要在中国发游戏，就要找腾讯来，你去给我发去。当然，发游戏这件事，还有版号和出版单位相关的限制。你比如说，出版单位是可以发放版号的，而出版单位是要有互联网出版许可证的，那审核是非常非常难的，不是一般人能搞得定的。

中国的互联网巨头们，比如BAT，还有很多在纳斯达克、纽交所上市的公司，他们呢，都是通过VIE架构来实现这些证书的持有，以及在国内服务的落地的。所以呢，在没有开放之前，这些外资企业，甭管是真外资还是假外资，在中国呢，也已经都提供了相应的服务了。只是呢，这一次开放了，大家不需要再绕来绕去了，有一部分就可以直接在国内进行服务。

特斯拉呢，每一次都是它最特别，这名字也起得好。比如说特斯拉上海工厂，是特斯拉100%全资的，这个也是开先河。因为以前，比如上海大众、一汽大众、广汽本田这些，都是按照中方占51%、外方占49%的这种方式来去做的。但特斯拉进来说，我要占100%。当时的上海的老大，应该是现在的总理吧，李强说，我们同意了，这个事咱就干吧。

所以，它是比较特殊的一个。这一次的开放，基本上可以认为是为特斯拉量身定制的。FSD的服务就可以在本地落地了。特斯拉如果申请到ISP和IDC相关的证书的话，就可以自建机房了，可以去把服务器搭进去，而不像苹果那样，苹果走的那个东西叫云上贵州。

你一旦在苹果手机里头开这个iCloud，你就会收到发票，说“云上贵州扣你多少多少钱”。特斯拉完完全全可以自己控制这些事情。特斯拉就可以把这些相应的算力卡放在他自己的机房里，比如放在保税区里。在美国禁止这些算力卡进入中国的前提下，他就有可能有一个空子让他去钻。比如上海就有保税区。我是不是这些卡在保税区里，只要不出来就不算出口到中国了？我就可以在保税区里建个机房。特斯拉有这个IDC证书，有ISP证书，我就可以来自己管理这个机房，然后为全中国的车主提供FSD的智能驾驶服务。他就可以干这件事情了。

ICP证书有了以后，特斯拉就可以在自己的机房里设置这个网站，在自己的机房里设置全项的FSD相关的服务，以及自建APP。所有的APP都在自己的机房里跑，这个事都是可以的，它不会受到任何其他互联网服务商的控制或限制。然后呢，他也可以去申请CDN的服务，也可以让相应的地图或其他的一些服务信息分发到距离用户最近的地方。在中国任何地方开特斯拉汽车，你都可以就近获得地图，这个其实也挺好的。

然后呢，他还可以去申请那种SP的证书。SP证书叫内容提供商，他可以发短信、彩信出来，这个也算是一个新的服务。然后呢，还可以做一些别的，比如新闻、应用商店、博客，包括播客。你可以自己做个小的电台，这些都是可以的。但是你做所有跟内容相关的，肯定还要去申请跟内容相关的一些证书，这个没有那么容易，但这块可以外包，那是另外一个事情。

但是呢，SP的证书特斯拉也是可以去申请的。那你说这个是不是WTO入市承诺，我们最后终于实现了呢？其实不是。2001年我们入市，当时的承诺是什么呢？第一年要开放ISP，但我们的开放承诺一直是什么？就是有股份限制，比如说可以占25%的股份。再往后，大概应该是到第四年吧，你可以占49%的股份。

如果是其他的一些，比如无限寻呼机这种比较旧的业务，我们允许他占到50%的股份。到入市第五年的时候，我们就会取消对于寻呼机、手机这些设备的进口限制。你可以随便向我这出口这些东西了。在国内固定网络电话服务领域，也可以取消一定的限制，这块也是给出了一些放松。然后，承诺到入市第六年，一些有限光纤也可以允许他们进行接入和使用。

国务院新闻办公室曾经就宣称过，截止到2010年，中国加入世贸的所有承诺已经全部都履行完毕了。你们不要指责我们，说原来你答应哪个事我没办，到2010年都弄完了。现在都2024年了。但是，大家有没有发现一个问题，就是当时的很多承诺还针对什么寻呼机、固话接入、各种网络接入设备，还在讲这些事情。但是，这个互联网领域的发展其实本身是很快的。在这个里头真正有价值的东西，并不是刚才我们讲的寻呼机，现在谁还是寻呼机。真正有价值的东西是互联网增值服务，以及互联网上的各种信息相关的服务，出版音视频，这个东西才是真正需要控制的。

中国真正控制的其实是内容，而不是传输的渠道。那么，为什么现在可以开放了呢？以前为什么不开呢？其实原因也很简单，经过了这么多年的网络实名制、网站实名制、网站域名相关备案的实名制，把国内所有这些个人拥有的网站、个人的各种BBS都给杀干净了。导致是什么呢？国内的云服务厂商现在，除了政务云之外，基本上都是苟延残喘的一个过程，这事混不下去了。你现在说OK，我们已经控制好了，我们已经把内部的人都训练好了，没有这种人，私搭乱建这种个人的网站，个人的这个博客。我前一段时间还把自己所有的域名都从国内搬到国外去了，实在是在国内没法使了，就不跟他们费劲了。

那么，现在这个时间点说OK，我们内部已经收拾干净了，你现在可以进来，大概就是这么样的一个情况。所以，这就是中国在2024年10月23号宣布，我们解除互联网增值服务对外资企业各种限制。

相关的一个故事。好，感谢大家收听，请帮忙点赞，点小铃铛，参加Discord讨论群。也欢迎有兴趣、有能力的朋友加入我们的付费频道。再见。