Seedance 2.0上手实测:3大革命性功能,15秒烧掉10块钱到底值不值?

一个写着Seedance 2.0的电影场记板放在胶卷堆上,周围漂浮着发光的数字粒子和X标志,羊皮纸,钢笔彩色手绘的统一风格。

Seedance 2.0发布了,视频生成的专业选手终于登场了。大家好,欢迎收听老樊讲故事的YouTube频道。

Seedance 2.0发布,小红书上神龙见首不见尾了好几天了。好几天之前大家就开始在那发布说Seedance 2.0实在好厉害。字节的产品我也习惯了,他们通常都是做灰度发布的,就是有些人可以先用到,有些人后用到。昨天我也用上了,2月8号应该是付费用户全量开放了。今天是不是给免费用户开放了,我不确定。今天X平台直接被刷屏了,大家都在疯狂地用Seedance 2.0做各种各样的视频。这绝对是一个现象级的产品和技术,能够在X上刷屏刷几天的这种,就属于叫现象级了。

一个卡通人物用力掀翻桌子,背景是崩塌的股票K线图和散落的显卡,羊皮纸,钢笔彩色手绘的统一风格。

那你说这算不算是一个真正的革命性的技术、真正的这种颠覆式创新掀桌子的技术?目前为止看,还稍微有一点点差距。如果能够把英伟达股价干崩,或者是把整个行业股价干崩,那就属于叫颠覆式创新了。比如说去年春节的DeepSeek,比如说Anthropic的Cowork,一个把英伟达股价干崩了,一个是把整个SaaS股股价干崩了。如果哪天大家突然发现Adobe,还有像很多视频编辑、影视设备、影视软件的公司股价崩了,那么Seedance 2.0可能就属于是颠覆式创新了。让子弹再飞一会。

咱们今天这故事分几段来讲:

  1. Seedance 2.0为什么这么震撼;
  2. Seedance 2.0有哪些限制,这个要跟大家讲清楚;
  3. 我自己做了几条,跟大家分享一下制作的流程;
  4. 即梦APP也更新了,更新了点什么东西;
  5. 最后跟大家讲讲为什么在这样的一个时间点里头,字节跳动着急忙慌的把这些玩意全都扔出来,也是有原因的。

首先,Seedance 2.0震撼发布,到底震撼在哪了?

一个焦虑的画家面对画布,画中的人物正在发生扭曲变形,画笔断裂,羊皮纸,钢笔彩色手绘的统一风格。

其实从OpenAI预告Sora的时候,大家就都惦记做视频了。大家兴奋了一个礼拜、两个礼拜吧,这事又过去了。原因是什么?有几个痛苦的问题一直纠缠着大家:

  1. 输入困难。你说我想去画一幅画,你通过提示词可以搞定;你说我想做一个视频,你光靠嘴说,你说不明白,所以这个东西的输入是很痛苦的。
  2. 可控性差。我希望这个人做什么什么事情,跟另外一个人怎么怎么样,在这个过程中这个人总是变来变去的,别说是手指头了,脸都变得不像了,或者衣服也不停地换来换去的,这个是无法忍受的。
  3. 又慢又贵。Seedance 2.0这个据说是快一点,但是我尝试了几次,这个还是需要耐心的,而且真的是很贵。当然字节它还是要比美国这些视频生成模型要便宜很多的,待会咱们来告诉大家需要多少钱。一方面是输出的时长很短,因为你越长,这个模型就越难控制稳定性嘛,所以他们通常都是比较短的,而且输出的分辨率还有很多细节都非常非常差。这个是现在做视频模型的几大魔咒吧。

Seedance 2.0基本上就把这些问题都解决掉了。业界的技术其实也在不断积累,特别是DiT技术上来以后。DiT是什么?Di应该都是Diffusion,T是Transformer,它等于是Diffusion Transformer。原来大家都是用Diffusion技术,就是扩散技术,一个像素一个像素去猜;Diffusion Transformer它里头是进行这种推理的,也进行这种上下文的记忆。它把视频拆成一小块一小块的,进行这种逐块的生成,这样的话里头这个推理模型它是知道说这个是个人,这个人应该是长成什么样,他在整个这过程中他是有记忆的。所以上了DiT以后,稳定性的问题基本上是可以得到解决和控制的。

从Sora 2开始搞多镜头和音视频同步,大家又看到希望了。你不是控制不好吗?咱干脆不要一个镜头从头到尾整十几秒了,每个镜头有个三五秒,然后咱们把它拼起来,这样我们控制的就更好一点点。Sora 2就干了这么个事情。而且Sora 2有一个很重要的突破,就是音视频同步,它同时生成视频和音频,而且两边是可以配合在一起的。后面Seedance 1.5、阿里的通义万象(也叫万2.5)、谷歌的VEO 3.1,基本上都可以做到音视频同步了。但是更复杂的控制还是很麻烦的。

一个巨大的魔法炼丹炉,里面投入了照片、胶卷和音符,正在炼制发光的视频水晶球,羊皮纸,钢笔彩色手绘的统一风格。

在这个时候Seedance 2.0就来了,说我把最后一块短板也给大家补上。它怎么来解决这个问题?它一次可以允许大家输入12个元素。这12个元素里头可以是9张图片、3个视频或者是3条音频,你就加起来总数12个以内。当然了,12这个数是来自于文档,我自己在即梦网页上看到的是最多可以输入5张图片,更多的是不是可以,我现在没有去测试。

然后就是写提示词了。你想你输入了这么多图片、音频、视频进去,那提示词就好写了。你可以写@代表各种元素,比如说参考@第一张图里边的人物,参考@第二张图里边的场景,参考@第三张图里边的某一个物品,或者是里头的哪张图是首帧、哪张图是尾帧、哪一张图是中间帧,你可以在里边直接写这样的提示词了。

然后可以参考视频。你上传一个视频,说我要参考这个视频的运镜,比如说是旋绕环绕运镜,或者是前进运镜、后退运镜,这个你可以直接写;还可以参考视频里边的场景,或者参考里边的动作。我做了几个跳舞的,就是把现在比较流行的什么海豹舞或者什么弄出来,然后说来老范跳一个,还是很开心的。音频上去了以后,你可以语音参考,说这个是老范在讲东西,要参考老范的语音。还可以干嘛?做音乐节奏卡点。很多的视频是根据音乐的节奏的那个点要去发生变化的,你可以上传一个音频去做。但是这里要注意,音频跟视频最长只能上传15秒的,再长了他就不让你传了。

然后就是写提示词,一次可以写几千字的提示词进去,最长的是可以生成1080P的、15秒的视频出来。这就是这一次的Seedance 2.0,它真正给我们提供的绝对的掌控力。

一个沙漏,里面的沙子是金币,漏下去后变成了电影胶卷,旁边放着一杯冒热气的咖啡,羊皮纸,钢笔彩色手绘的统一风格。

提示词进去以后,就是耐心的等待,这个还是挺慢的。我生成一条15秒的视频,我觉得等了几分钟吧。坐在这等是没必要的,可以站起来上别地方去晃荡晃荡去。等待之后TOKEN在燃烧嘛,我的一条15秒的1080P视频,大概花了我10块钱,9块多钱吧。这数是怎么算出来的?因为我是付费用户,基本上一个月是五十几块钱,每个月给1080点。即梦里它是按点算的,生成一条视频是190多点,大概是这样的一个钱数。如果我把这个1080点用完了,再去买大概是5块多钱100点,是这样的一个价格。所以基本上算下来的,这个15秒就是9块多。如果你说我什么也不参考,那他这个便宜点,大概4块多是15秒。当然我买的是最低的套餐,你买的套餐越高,他这个15秒的价格就越便宜。好像是买几千块钱一个月的这种,他们再去买100点的话,大概就是两块多钱了。

但是我原来基本上用不完这些点数,为什么?因为即梦的生成图片是不要钱的,他现在叫限时免费,就是2k的图片生成都是免费的。视频我又做的不多,而且他每天还送点数,每天大概是送80点还是100点吧,他是随机的给你送,只要你每天登录,他就每天给你送。所以那个点数越凑越多,根本使不完。现在终于可以把这些点数都用掉了。我每个月的点数大概够我做5条到6条视频的,再领一点的话,大概能够做个七八条。目前为止,你想靠Seedance 2.0去挣钱,你还要想一想。因为一条10块钱,你要想这一条把这10块钱挣出来,还是挺难的。比如说我送到YouTube Shorts里头去,这一条视频比如播个1000次,也就是能够挣到可能20美分、30美分这样的水平吧,不会再多了。20美分的话也就是一块多人民币,我花十块钱把它做出来,挣了一块多钱,这个还是不划算的。

下一个问题,就是Seedance 2.0的限制有哪些

一个严肃的保安在安检口拦住了一个模糊的人影,但放行了一只卡通老鼠和一个穿着古装的剑客,羊皮纸,钢笔彩色手绘的统一风格。

这个还是要跟大家讲清楚的。目前还没有开放API,只能在网页端使用。APP还没有灰度到我这里,我现在APP上还不让使用2.0。其实APP里头有一个接口可以用,但是让它直接生成视频只到1.5的版本。

在这里头要讲清楚,Seedance 2.0不是开源模型,这个跟国内主流不一样。字节跳动自己家的模型都是不开源的,甭管是豆包模型还是Seedance模型都是不开源的。这些模型都是跑在字节跳动的服务器上的,字节跳动会进行审核的。因为他后边经营抖音、经营TikTok,所以你也不用担心他审核不过来,人家是有极强的视频审核能力的。所以千万不要去试探各种的边缘,色情、血腥、暴力、政治不正确的,就别上去尝试了。我自己曾经试过写标题“雷军如何如何了”,等再输出出来的时候,就变成“某知名企业家如何如何了”。所以它在里头还是有一些限制的。

但是对于版权IP、个人形象,基本上是不管的。你说我要求米老鼠干一个什么事、要求绝地武士干一个什么事,或者是塞尔达公主干点什么事,直接就出。你说我模仿宫崎骏,没毛病,他都是百无禁忌的。你上传头像说这就是我、这是谁谁谁,他也是直接干。所以比国外的一些模型各有优缺点吧。你比如说你到了OpenAI的模型上说我现在想模仿迪士尼的风格,它就不出了;你到了谷歌的这个模型上,你说我现在想画个纳粹,他也不出了。当然这两个换过来是可以的,你到谷歌的模型上画迪士尼可以,你上OpenAI的这个模型上画纳粹也是没毛病的。那这些东西跑到这个Seedance 2.0上,至少是对于迪士尼或者是各种形象,他是不管你的。

我自己也做了几条,跟大家分享一下

一只戴着墨镜的可爱海豹在迪斯科球下跳舞,动作滑稽,羊皮纸,钢笔彩色手绘的统一风格。

这个视频就不在这里展示了,原因也很简单,因为音乐没有版权,放在这的话我这条视频就挂掉了。我在里头做了一个海豹舞这样的一个视频。这个视频我是发到Twitter上了,就发到X平台了,YouTube Shorts我就没发,就是他这个音乐我搞不定。

制作流程分享:

  1. 首先第一步,先到抖音上去下载这个海豹舞的原视频,大概是17秒还是十几秒。那这视频你没法上传到即梦,因为他只能用15秒嘛。
  2. 那怎么办?到剪映里去把他提速,让它播放速度上升一点点,把整个的时长压缩到15秒。基本上是没有什么变化的,就是音乐稍微快那么一点点,人感觉不出来。你就得到了一个15秒的海豹舞的原始视频。
  3. 然后找了一张老范本人的照片,再搞一张机器猫的照片,再搞一张功夫熊猫的照片。这都是有版权的,但是Seedance不管你。如果你找不到照片没关系,直接拿即梦生成也可以,效果也很好。
  4. 上传了所有这些素材(就是一个视频三张照片)以后,写提示词。提示词就是:@图一中的人物站在中间,@图2中的人物站在左后,@图3中的人物站在右后,形成三角阵型;然后根据@视频一里边的动作开始跳舞。就OK了,你就耐心等待。当然这过程还要支付10块钱。
  5. 然后就得到了一个完整的15秒视频。这个15秒视频里头的这音乐是Seedance 2.0重新给你生成的,那个是没有版权问题的,但是它不够魔性。
  6. 所以再把剪映拎出来,然后把前面那15秒的海豹舞的音乐给它替换上去,这个魔性的音乐就有了,老范带着机器猫和功夫熊猫在这跳舞的视频也有了。就很好的配合在一起。
一个戴眼镜的中年男子、一只蓝色的机器猫和一只熊猫站成三角形队形,摆出跳舞的姿势,羊皮纸,钢笔彩色手绘的统一风格。

我就把这个视频上传到X平台了,大家也可以去玩耍起来。

除了Seedance 2.0之外,今天即梦的APP也更新了

手机屏幕上显示着一个正在眨眼的3D卡通虚拟形象,周围漂浮着红心和点赞拇指,羊皮纸,钢笔彩色手绘的统一风格。

大家注意,即梦是有云端的API的,只是目前为止Seedance 2.0还没上去。还有一个入口,就是它的iOS/安卓端的移动APP。移动APP更新的时候,上面写的是什么?就是“我们马上要出图形模型4.6和5.0了”。大家注意,现在图像模型是升到4.5了,就即梦的图像模型4.5;而这个视频模型升到2.0了,只是我打开APP以后,还没有看到这个模型。它写的是我们这个APP为新模型做好了准备,现在还不让用,因为等灰度呗。灰度发布,本周应该会全量更新出来。

真正的变化,其实不是说有新的模型出来了,真正的变化是什么?即梦APP现在长得跟Sora 2一模一样了。这个是怎么回事?Sora 2其实尝试在玩社交,虽然没有玩起来吧,但是这个尝试大家还是看到了。上来说我们把自己的人头贡献出来,可以让自己跟其他人一起去做互动,或者自己可以做各种各样的动作,直接用个人虚拟角色录制视频。甚至大家可以相互加好友,加了好友以后你就可以用别人的形象,或者大家在同一个视频里出现,就可以来做这样的事情了。

现在即梦APP更新了以后也变成这样了。你也可以说把个人的形象放上去,他上来说123456789,就是你要念一串数字,把你声音录下来,然后抬头晃晃脑袋一下,再把人脸录下来。当然录的时候,它要比Sora 2好一点点是什么?它允许你开美颜,把自己美美的样子录下来以后,你就有个人形象了。然后你就可以@自己去做各种各样的事情。如果有其他人授权你使用形象,或者说你们相互关注了可以使用形象的,那就大家可以凑一桌打麻将什么的都是OK的。这个视频就都可以做了。这个应该也是用Seedance 2.0的模型做出来的。

但是要注意一点什么?在这里头用个人形象去做视频是免费的,还是比较棒的。做出来的内容可以直接分享到抖音,国外的话应该可以是分享到TikTok。我们抖音上、在TikTok上有的是用户,所以在这一点上,没准字节跳动搞的这套东西就能够走通,因为毕竟后头是有底子的。玩短视频这件事情,字节跳动现在应该是全世界的老大,没有第二名了。

最后咱们讲一下为什么在这样的一个时间点里头更新

一家人围坐在电视机前看春晚,手里拿着手机发送视频红包,背景挂着红灯笼,羊皮纸,钢笔彩色手绘的统一风格。

最后咱们讲一下Seedance 2.0以及刚才咱们讲的即梦的APP,为什么会在这样的一个时间点来更新?原因很简单,马上要过年了,央视春晚的合作伙伴就是字节跳动。春节联欢晚会,大家举家团圆一起过年的时候,会产生大量的照片和视频。这些照片和视频如何进行传播?或者如何在传播的过程中能够带来更多的互动?这就是字节跳动需要去思考的问题了。我相信Seedance 2.0和即梦最新的APP,一定会让咱们在春节期间发布图片、发布视频更加的开心,更好的互动,给大家拜年助兴带来更大的帮助。

最后咱们赶快行动起来吧

我去下载了一些动画电影,因为动画电影里边的一些动作是比较有趣的,比如功夫熊猫什么的。我可能过几天再去整几个功夫熊猫相关的这种影片出来给大家瞅瞅,准备拿这些动画电影里的这个动作复刻到自己的视频里头去,看看春节谁在拜年视频里头玩出花来,咱们拭目以待了。

赶紧去玩耍起来。在国内的话下载即梦,或者到即梦的APP上去,用手机的抖音就可以直接登录了,或者是手机号也是可以直接登录的。海外的话应该叫Dreamia,都是可以使用的。希望Seedance 2.0可以给大家带来快乐。好,这个故事就讲到这里,感谢大家收听。请帮忙点赞、点小铃铛,参加DISCORD讨论群,也欢迎有兴趣有能力的朋友加入我们的付费频道。再见。


背景图片

Prompt:Abandoned film production studio interior, scattered cinema camera rigs and lenses, boom mics, audio recorders and cables messy on the floor, editing decks, splicers and tools, VHS tapes piled in the corner, a single computer workstation at the center running a video generation model UI with the title “Seedance 2.0”, floor-to-ceiling window reveals a seaside horizon at dusk with blazing sunset afterglow, dust motes in the air, cinematic anime background art, high contrast, high saturation, crisp textures, reflective glass, subtle film grain, ultra-detailed environment, wide shot, 24mm, low eye-level, leading lines toward the computer, deep depth of field –ar 16:9 –stylize 220 –chaos 8 –no watermark, logo, signature, gibberish text blocks, bad typography, extra monitors, duplicated objects, deformed equipment, lowres, blurry, overexposed highlights –v 7.0 –p lh4so59