潘多拉魔盒已打开!Sora 2 的“数字分身”功能才是社交裂变核武器,授权好友用你的脸做视频,你敢玩吗?| Sora app、OpenAI、TikTok competitor
10 月 02
AIGC AI内容创作, AI生成视频, AI社交平台, AI视频, Deepfake风险, iOS应用, MidJourney, OpenAI, Sam Altman, Sora 2, Sora 2邀请码, Sora app, TikTok竞品, YouTube Short, 世界模型, 个性化推荐, 数字分身, 文生视频, 用户形象授权, 短视频, 社交视频应用, 视频创作社区, 视频生成器, 邀请制社交 潘多拉魔盒已打开!Sora 2 的“数字分身”功能才是社交裂变核武器,授权好友用你的脸做视频,你敢玩吗?| Sora app、OpenAI、TikTok competitor已关闭评论
Sora 2 发布了,谁有邀请码给一个?
大家好,欢迎收听老范讲故事的YouTube频道。昨天晚上深夜,Sora 2 就突然发布了,山姆·奥特曼还跑上去祝贺了一下,但是他是远程的。现在我们也搞不清楚,他这个祝贺视频到底是他自己拍的,还是Sora 2 生成的,因为现在已经很难分出真假来了。
上来先放了用Sora 2 做的各种各样炫酷的视频。这一次呢,确实是看到了物理上基本都合理了,像原来物理上不合理的地方,现在少很多了。另外呢,就是人可以直接进到场景里去了。原来都是说先画一个人出来,这个人怎么动,而且人动的时候,衣服或者什么还要换。现在看到的演示,已经基本上没有这种问题了。
三个小哥呢,坐在那里刷了半天视频,他们整个的演示过程,实际上就是在刷视频,让你看看Sora 2 做的各种各样的东西是怎么样的。大家注意一点,这次刷的视频大部分是竖屏的,因为呢他们做了一个类似于TikTok这样的软件,展示这些Sora 2 的内容。既然是TikTok类型的嘛,在iPhone手机上一定是竖屏内容为主。
现场呢,做了两条效果都是比较炫酷的,一个是让山姆·奥特曼手舞足蹈地说了个祝贺词,这个确实是挺震撼的。另外一个呢,是让现场的一个小哥,他原来拍了一条香水的广告,然后让他再改一条帽子的广告,效果都非常非常好。但是呢,更复杂的视频到底是怎么做,现在还不确定,因为现场做的两条视频都比较简单。
现在呢,它是有iOS版本的软件,我也下载了,但是没有邀请码玩不了。所以谁有邀请码赶快给一个,拿到邀请码以后,可以再变出4个新邀请码来。这谁拿到邀请码进去了,会得到四个新的邀请码,他是希望通过这样的方式来裂变的。
这一次到底有什么不一样的呢?虽然他讲了很多我们物理模型怎么增强了,我们怎么世界模型了,我们人物怎么保持一致了,一致性怎么增强了,但是这一块呢都是刷视频,他给你看的一定是筛选出来的比较好的视频。所以这一块到底做成什么样了,还是要咱们自己上手了以后才能知道。
这一次真正不一样的地方,是做了一个AI版的TikTok,这个绝对超出想象范围了。其实我们现在看到的各种的图像生成、视频生成的这些应用,都有类似于TikTok这样的功能,你比如说像即梦或者是像可灵,即使是Midjourney,他自己没有APP,他在网站上也都是可以去浏览别人的内容的。但是浏览别人内容是什么呢?你只看最好的,或者他希望你看到的他认为是好的,这些内容会给你,他并不会让你去进行社交关注,也不会去对你进行这种个性化推荐。
原因其实也很简单,就是内容没那么多。如果是让你进行社会化关注的话,你可能会看到大量的低质内容。就相当于是两个人结为好友了,那你只能看到那个人照的各种照片、做的各种内容,甭管他长得有多难看,审美有多差,你也只能看到他的,其他人的内容你就看不太到。所以这也是为什么像可灵、即梦、Midjourney,给你看所有人里头做的最好的内容。现在呢,Sora 2 是要给大家社交关注以后的个性化推送的,这个基本上是TikTok的套路。
这次呢是直接上了iOS版本,网页上没有。你现在到Sora.com上,还是Sora 1 的这些内容。刚才我去试了一下,Sora 2 的内容基本上没出来。我呢也下载了一个,只要是你把iOS的账号切到美区,它就允许你去下载,但是没有邀请码进不去。像这个TikTok,你如果不登录的话,你还是可以去浏览视频的。Sora 2 的话,你不登录直接退出来了,这个还是挺烦的。
Sora 2 呢,不允许上传视频,必须是在里边生成。这个呢,还是非常棒的一个策略。为什么呢?它可以很好的让Sora 2 的内容溢出到别的平台上去。什么意思?就是你拿Sora 2 做了一堆视频以后,你可以把这些视频再导出到TikTok,导出到YouTube,导出到Instagram。但是呢,别人的这些做好的内容,不能够灌到Sora里头来。这个要比YouTube Short和Instagram Reels要聪明很多。因为大部分的这种内容,都是在TikTok上的,或者是在国内抖音上的。你一旦这种内容倒灌的话,你整个的社区的调性跟氛围就没了。你到现在去刷YouTube Short,大量的YouTube Short内容,最后都是有TikTok的标,就是从那边搬过来的。所以呢,现在Sora采用的这个策略就是单向的,你可以把我这东西搬走,但是你不能把外边东西搬进来。
据OpenAI的人讲,他们内部测试这个产品的时候,大家都非常喜欢,喜欢到了已经影响工作效率的程度了,大家都天天玩这样的一个东西,这不是不干活不上班了。
怎么说呢,像我们以前做这种社交产品,是有一个简单方法的。很多人呢在2010年前后都想去做社交产品,也写了非常非常多的社交产品的商业计划书出来。但是呢,我们最后就要求他们玩叫“传纸条游戏”。什么叫传纸条游戏?你想社交产品一定是你在社会上认识他,然后呢,你们的社交关系来影响信息的传播的一种游戏。在这样的情况下,你说我到底是单向关注、双向关注,实际上都是在设计社交关系如何参与到信息传播过程中的一个方法。但是怎么能够验证说你这个方法就行,他那个方法就不行呢?当时就设计了这样的一种叫“传纸条游戏”。
怎么传法?就是3个人到5个人吧,先写一个纸条,按照你设计的规则传给下一个人。传给下一个人以后呢,这个人再决定做什么样的反馈,然后再向其他地方传。你比如说我现在设计的社交规则是,我一个人发出消息来了,关注我的人可以看到,那你就是写一个条,给下边的关注你的人。关注你的人看到了以后呢,再来决定说我到底是点个赞,还是说转发呀,还是要评论,到底哪些人能看到呢?再把这个纸条复制出来了以后,按照你的这个规则设定,再去传给应该看到的人。大家相互这么玩一段时间以后,看看这个游戏玩的下去玩不下去。如果这游戏玩不下去呢,那你设计的这个社交玩法就有问题;玩得下去,就说明这个方法还是不错的。Sora 2 证明了他们现在这套社交玩法应该还是比较受欢迎的。
为什么会有这种影响工作效率的事情发生呢?就是很多没有经历过洗礼和考验的人,第一次遇到这种成瘾性极强的内容,就会出现这样的问题。跟大家讲一个小故事,我们以前去做电子书的时候,很多的清华博士工程师嘛,他们这辈子没看过网络文学,说我们为什么会看这玩意呢?纯浪费时间,一点意思都没有。但是我们把产品做出来以后,说你得看,要不然你不测试了,怎么知道这东西行不行呢?大家要知道这个小说是很上瘾的。我有一天早上起来去上班,就看到我们一位同事开着车就朝我撞过来了。我说你要干嘛?他说对不起,昨天晚上看书实在看太晚了,就是看书一直看到天亮了,所以早上起来迷迷糊糊就来了。他们就是属于从来没看过小说的人,接触网络小说以后就会变成这样。这些人原来都是觉得,看这玩意不是浪费人生命吗?OpenAI里头应该也有很多不怎么接触TikTok的人,给了他们Sora 2 这样的一个类似TikTok的工具以后,确实会很容易影响工作。所以咱们在这稍微讲远一点,千万不要相信自己的意志力,这种成瘾性极强的东西,我们现在没有上瘾,可能仅仅是因为我们没有接触过。
好,下一件事儿。像现在这样,Sora 2 到底能不能成呢?想要裂变成功,想要玩起来,其实是需要几个条件的。第一个条件可能大家没有想到是什么,就是挫折感跟成就感要平衡。什么意思呢?就是你拍了一堆视频,我制作了一堆视频,经常是会不满意的,这个叫挫折感。然后你终于找到了一条还可以的,把它发出去以后没有人点赞,那你就没有成就感。一定是什么呢?就是你获得的成就感要能够抵消你的挫折感,这样的产品才可以继续往前走。Musically,也就是后来的TikTok,之所以能够成功,就是他们利用了很多的技巧来去降低挫折感,提升成就感,让这个人拍视频、进行传播的这个过程成为可能。我告诉你,拍视频想要让人满意是非常非常难的。你想给自己拍张照片,还经常觉得这不爽那不爽的,你要拍一条视频,拍个一分钟视频,特别是这种要求比较高的小姐姐们,那她们的挫折感会很强的。所以这个里头有很多很多的技巧。
然后要有社交属性。什么叫社交属性?你说我看到了这个人是川普,但是呢川普跟我有什么关系呢?我也不能天天说川普怎么怎么样了。一定要有社交属性,这个人是我的邻居,这个人是我的同学,这个人是我的同事,那个人是我的家人,我们之间发生的各种故事,这才有意思。还记得去年OpenAI玩的那个吉卜力风吗?吉卜力风为什么会突然火起来?真的是因为他画的像吉卜力这样的一个风格吗?不是的,而是因为那个里边放的所有的东西都是你的社交好友,包括你自己在内。如果不是你自己在里面,而且看着还很像你,那这个事它也流传不起来。所以大家不要觉得因为是吉卜力才火的,是因为像,因为有社交属性才火的。
所以一定要有社交属性。这次Sora 2 怎么做社交属性呢?他们做了一个功能呢,叫做CAMEO这样的一个玩法。什么意思呢?是可以授权数字分身,也就是我们自己的形象,参与到这个视频里边去。当然了,你也可以把你的形象授权给你的朋友,让他们去使用。当然,首先你要向他证明说这是我,要通过录像、通过声音去识别这是我的形象,我对这个形象是有权利的,你可以参与到里边去。这个就有社交属性了,你们看到老范干什么什么去了,或者老范跟谁谁谁做了什么什么样事情了。如果我授权别人了,那别人也可以用老范的形象。如果谁用了老范的形象了,即使是这个视频没有发布,是一个草稿状态,他也会通知我。这个还是很危险的,如果别人不通知我就去做视频,那我可能就会“社死”。一旦是别人拿我的形象做了视频了,我自己是可以有权利决定是不是要删除这个视频的。他是这样的一个运作模式,这样的话他的传播性就绝对拉满了。
但是这件事的风险性也是极高的。虽然OpenAI做了很严格的限制,必须本人验证才能上传形象,去使用必须得到授权,你还可以知道别人用没用,还可以删除,还不允许使用公众人物的形象,比如我今天想跟川普干点什么事,这事是不允许的。他的这一块限制很严格,但是既然玩法大家都知道了,而且发现这东西有效了,这个潘多拉魔盒就打开了。Sora 你不给我玩,还有那么多开源模型呢,后边应该会有很多群魔乱舞的内容会出来。
现在呢是采用邀请制。邀请制呢,也是社交产品成功的一个核心因素。很多人可能不太理解,说我一下放出去让大家用呗,这个社交产品上来了以后,我正愁着没人使呢,我为什么还要邀请制呢?这个邀请制的作用呢,其实有三个。
第一个是什么呢?就是进来的人得玩得起来。原来我们经常讲这样的一个故事,就是两个人在这聊天呢,这时候站了第三个人,他呢可以站旁边听一会,说你们聊什么呢,然后再逐渐的参与进来。然后三个人聊天呢,比如再进来两个人,这时候就5个人了。新进来的人呢也会先听一会,看看你们在聊什么,然后逐渐的加入到话题里边来。但如果是5个人聊天呢,突然冲进1万个人来,然后就问你们聊什么呢?你干嘛呢?前面人就走了,所有的社区氛围和调性就没了。所以邀请制都是干这个用的。像新浪微博、Twitter、Facebook早期都是邀请制的,所有的社交产品一开始都是邀请制的。如果不做邀请制的话,你这个社区就不会有任何的调性和氛围,很难维持下去。
第二个邀请制的作用是什么呢?就是随时观察互动,发现问题及时解决。你要掌控这个调性跟氛围。你比如说现在有30个人了,大家聊的还都挺好,再放了20个人进来,50个人了,有点跑题,怎么都去奔政治去了,还是说奔极端去了?那看看是不是删掉一些人,处罚几个。这个时候影响不是很大,你可以维持这个调性,然后再邀请几个进来。他是这样一波一波的,这么逐渐传递出去的,中间出现问题你可以调。
第三个作用是什么呢?就是控制成本。做视频这个事的成本是非常非常高的。到目前为止呢,还没有看到Sora 2 到底是怎么收费。因为大家知道,虽然短视频这种东西是可以挣钱的,但是你的制作成本和大量废片,因为你做这东西不可能一次成功,一定是有大量的废片的,所有这些成本是很难靠短视频广告这种东西来挣回来的,这个非常非常痛苦。所以未来到底怎么收费,不知道。所以它通过邀请制的方式,一开始呢控制一下算力的消耗也是合理的。
那你说OpenAI现在做了Sora 2 这样的内容创作社区了,是不是就能玩得起来?不一定。因为原来也有一些内容创作社区,内容创作的很好,但是也没玩起来的。这个里边最典型的是大疆跟GoPro的社区。你像我们现在拍视频就用的大疆,大疆一开始也惦记做内容社区的,现在其实也还在努力做,但是呢玩不起来,他纯纯的沦为了制作工具,他自己的社区就没起来。原因很简单,因为你使用大疆制作内容的成本和门槛还是很高的。虽然大疆尽量的降低了门槛,现在有云台了,有各种的自动化了,还可以把这个东西变得很小型了,但是你后期剪辑呢,绝对是地狱级难度。所以大疆也好,GoPro也好,最后只能做工具,做不出内容社区来。所以Sora 2 到底最后能不能成为社区,还是说最后会沦为像大疆这样的一个工具,现在还不太好说。
当前的AI视频发展到了一个什么样的状态了呢?制作视频,操作方式一直是一道门槛。我们如何去操作电脑、操作手机去做一个视频?我是从跟他对话也好还是怎么样好,这个一直都非常非常难。在抖音、快手、TikTok刚刚起步的时候,大家都在研究如何在手机上创作视频这个终极难题。AI视频模型出来以后,其实现在限制它的,除了刚才我们讲过的什么物理上的违背常识、一致性有问题、画面崩坏,除了这些问题之外,还有一个很严重的问题,就是操控起来太麻烦。
你怎么能够靠语言去把这事描述清楚?你看个电影回来,来坐着说你看到什么了?说不清楚的。而且真正的电影是由很多很多镜头组成的,怎么去剪辑?怎么去切换?如何去把握节奏?这种镜头语言非常非常难掌控。目前为止VEO 3,也就是谷歌这套东西,效果其实还是不错的,但是呢只能算半成品工具,它连IDE、连这种集成的环境都没有,你整个像剪映这样的东西也行,谷歌现在都没有,只是给了你一个很简单的窗口,这种是做不出产品来的。当然谷歌呢,准备未来一段时间把VEO 3 往这个YouTube里边放,这个还是值得期待一下吧。
再往后,像阿里做的通义万象2.2、2.5这样的产品呢,它其实就是个模型,这种东西运作起来,你还需要跟ComfyUI这种工具去配合,所以呢也不是一个完整的工具链,这块还是有一些差距。至于即梦跟可灵,即梦是字节跳动家的,后边有抖音;可灵是快手家的。他们呢控制起来其实依然是不太舒服,而且呢背后的抖音跟快手对于AI内容其实还是比较谨慎的。
大型社交媒体平台有时候反而会成为包袱。为什么呢?因为你做了大量的这种内容上来以后吧,它会冲击真人制作的内容,而所有的这些大型媒体平台必须要保住制作人。如果制作人都没有了,也就没人看了。因为这些人一边在制作内容上去,一边也在看内容,还要去在上面刷广告买东西。如果没有这些人的话,他的系统可能就会“含人量”逐渐下降,商业价值快速流失。所以他们都是比较谨慎的。
另外呢,价格其实也是一个不可回避的问题。我呢是刚刚订阅了一个月5刀的即梦,当然我订阅即梦呢,现在还没太挣回来。我用即梦去做YouTube Short,上个月呢从YouTube Short里大概收回了3刀,就是每个月订阅费是5刀,我从YouTube里头收了3刀广告费回来,快要盈亏平衡了吧。
Midjourney做的视频呢,确实很漂亮很美,但是依然是这样的问题:没法控制。你很难通过自然语言对它进行精准的控制。我们举一个例子吧,你比如说像字节跳动的模型,它里头有一个参数叫“固定镜头”。我们有时候就是想拍一个场景,镜头你不要动,我们直接描述场景发生各种变化就可以了。但是在Midjourney里头就没有这样的一个参数,你只能靠语言去描述说“固定镜头”,但是呢你没法控制它一定会遵循这个指令,这个就非常非常麻烦。像我做视频,背景一般都是Midjourney画的画,我一直希望它们能够变成一个稍微有点动作的这种动态背景,但目前为止这个问题都很难解决。而且Midjourney还有一个问题是什么?就是也是很贵。因为Midjourney呢,没有怎么拿投资,所以它一直是号称自己盈亏平衡。你看人家OpenAI什么时候想过盈亏平衡这种事?人家都是挣30亿,亏100亿这样的一个玩法,反正我们接着融就完了。所以Midjourney这条路呢,应该走的没有那么远。Midjourney刚出来的时候呢热闹了几天,然后就没有然后了,大家现在已经不再那么去传播Midjourney的视频了。
Sora呢就是世界模型AI视频,这个想法最开始是OpenAI它提出来的。发布的时候呢,给出了一些操作方法,故事板确实也让大家眼前一亮。但是呢,发布出来的产品并没有引起什么社会反响,因为这个东西最后做出来的成片,它的挫折感太强,成就感太低。Sora 2 呢给出了TikTok竞品的这样的一个产品形态。现在只有iOS版本,北美地区的用户可以下载,还需要邀请码才可以玩,这个就是现在一个情况吧。
未来到底能不能成功,还要拭目以待。Sora 2 呢也准备放出API,因为视频模型必须要靠API才能进行大型的内容创作。5秒钟一个镜头,10分钟的一个短剧,有这么多的镜头出来,你没有API的话是没法整的。你把屏幕挠烂了,把鼠标挠穿了,你都做不出来。所以最了最后还是要靠API。
世界模型是不是真的来了呢?Sora 2 看到的这些东西,从演示视频上来说,基本上没有物理错误,一致性也很强。但是演示视频就是演示视频,自己没有试过都不算数。像Sora前头这么强,前面的演示视频也是很帅的,Sora 1 出来以后,大家也是觉得翻车了,没什么意思。所以Sora 2 现在大家不要着急下结论。虽然现在X平台上我已经看到有些人再去放一些内容出来了,但是惊艳程度跟他们演示的还是有挺大差距的。
世界模型呢,对于世界来说本身是很危险的。我们到底最后是不是需要一个世界模型呢?现在还很难说。世界模型到底哪危险?现在已经有人拿图片生成模型或者视频生成模型的这个内容去骗支付系统,已经能够成功的绕过支付系统去付钱去了,这事多吓人。如果世界模型真的来了,即使是有AI标记,也很容易翻车和出事。所以世界模型这件事,我们还是要稍微谨慎一点点。
最后总结一下吧。OpenAI再次震撼发布了Sora 2,这次到底是不是GPT-3.5时刻呢?因为他们自己在视频发布会上讲的是,“这是GPT-3.5时刻”,再一次要颠覆了。这个我觉得还要再等个一两个月看一看,要让更多的人拿到邀请码,更多的人把内容做出来,才可以下定论。现在下定论还稍微早了一点点。
最后,谁有邀请码请私信给我,不要公开场合传播。
感谢大家收听,请帮忙点赞、点小铃铛、参加DISCORD讨论群,也欢迎有兴趣、有能力的朋友加入我们的付费频道。再见。