硕鼠的博客站

范路的博客主站,时而会发些东西。

Figure02机器人发布了,这真的是地表最强的机器人了吗?大家好,这里是老范讲故事的YouTube频道。Figure AI最近发表了它的Figure02,因为前面Figure01发布的时候真的是引起了轰动。现在Figure02发布了,但是它呢,也没有正儿八经开发布会,只是在官方账号上发了个视频,展示了一下Figure02的一些特性。

官方账号发视频呢,大家还是可以去相信一下的。如果是非官方账号呢,现在有可能是AI生成合成的。现在的很多视频,已经不能说叫“眼见为实”了,但是官方我相信,应该还是实拍的视频。不过官方视频呢,也不排除剪辑提速的可能性。提速什么意思?就是我慢点拍,然后快点放。剪辑呢,就是只给你看能看的部分,把这个出错的部分都给你剪掉,这个也是可能性比较大的。

而且在前期,各家公司发布的机器人视频里头,这两种手段用的都还是很多的。现在Figure02里边到底是不是用了这些,不确定。因为Figure01为什么大家不怀疑这件事?Figure01是这个机器人正对面是一个帅哥,帅哥真的在那跟他有问有答的,在那聊天呢,所以大家觉得不应该是减速了,但剪辑的可能性也还是存在的。

现在这个视频呢,演示了全新的机器人在宝马的工厂里头摆放零件、搬箱子以及缓慢的行走。当然,也展示了一下机器人新的结构、新的一些功能、新的一些特性。这里呢,就不跟大家详细去讲,如果有兴趣可以自己去搜一下啊,YouTube里边是有这个视频的。那么,为什么在这个时候发布Figure02呢?你说正好这时候做出来了,我们就发布了呗。这玩意还有啥为什么呢?在创投圈里头,如果这样想问题就稍微幼稚了一点点。每一个重大事件的宣布都是有原因的。那么,这个时间点,我们想一想都在发生什么事情。

OpenAI最近的负面信息稍微有一点点多。很多人都说OpenAI要玩啊,创始团队要崩,还有很多的前面吹过的牛,最后圆不上。AIGC有可能成为泡沫,大家现在在谈这样的一个问题。而且前两天股市还忽悠了好几下,快速下跌,快速起稳,大家感觉这个泡泡要破了。所以,要赶快再去拿出一些东西来提振人心一下。

而作为Figure AI这样的一家公司,它后边是有OpenAI投资的,而且它的整个模型是用的OpenAI的模型。他现在出来发布这样的一个还是比较振奋人心的机器人视频,也算是给OpenAI稍微撑一撑厚场子。所以现在国内所有做AI相关媒体的人都在解读这个视频,而且用上了“地表最强”这样的形容词,也是说我们要抓住最后几根稻草,告诉大家泡沫还没破啊,接着往前走。

Figure AI今年年初刚融过钱,那么现在是不是可以再融一轮?前面Figure01做完了以后,我现在Figure02出来了,通常是融资节点会去放这样的东西。那你说刚融的钱融了好几亿美金,估值好几十,20多亿美金,现在花完了吗?为什么马上要融钱呢?

大家要想一想,下一个上来的有可能是谁。下一个上来有可能是川大爷。如果川大爷上来的话,那对于整个科技行业来说,其实未必是好事。他有可能说:“来,红脖子之后,你们好好地再把工业发展发展,人上一上,这个机器人你们等一等。”所以到那个时候,未必好融钱了。如果是川大爷上来,可能整个的美股会向什么样的发展呢?就是科技巨头会向下走,而其他的各种传统行业会向上走。

所以在这个时候,一定要赶快,赛是容易轮啊。所以这个时候发布Figure 02是恰逢其会,正好在这个时间点。Figure 02跟Figure 01的比较起来,到底有什么差异呢?首先从硬件上看,完全重新进行了架构设计。这个东西跟Figure 01只能说彻底不一样了,一点相近的地方都没有了。这个Figure 02呢,更加好看一点。为什么好看呢?就是从外表看,更像人了,结构跟人已经是很像了,胳膊腿身子,而且看外边像个皮肤似的,干干净净的,很光滑。人是没有说身上四处插着线的,他这个从外表上非常像人。但是从整个的架构来说,跟人是一点关系没有。

为什么人是里头骨骼啊,然后是肌肉,再往外边是一层皮肤,或者我们管它叫蒙皮。这是这样来构成的。Figure 01呢,它里边是骨骼,外边是电机,然后是加上各种线缆,就直接溜出来了。所以我记得在《星球大战》的电影里面,天行者Luke第一次做出3PO的时候,他没有给他装外壳,他去见到R2D2,然后R2D2说:“你怎么光着呀?然后3PO说:你太没礼貌了。所以早期的Figure 01啊,就是这个光着的、赤裸的这样的一个状态,没有外壳。而现在的Figure 02呢,并不是给它加了个外壳,而是什么呢?它把结构改了,它变成昆虫结构啊。昆虫是什么结构?外骨骼结构,就是它的整个的支撑是外边这层壳。人是不靠外边皮肤支撑的啊,人是靠里边骨骼来支撑的。而Figure 02是靠外边这层壳来支撑的。所以呢,它这个东西表面上看像人,但实际上的结构实际上是像虫子啊。这就是Figure 02跟Figure 01的差别。

但是呢,它已经把所有的线呀、所有的传感器、电机什么都藏在这个外壳里头去了。现在特斯拉的擎天柱应该还是骨骼加上外壳的形状,还没有上这种外骨骼的形状。电池呢,更大了,Figure 02上带了2.25度电,也就2.25千瓦时的电,可以连续工作20个小时。这个呢,其实没太大必要啊。为什么这个东西很像在中国人造的这种可以续航800公里的电动汽车,对吧?甚至有些中国人造的电动汽车可以续航1,000公里。马斯克说,你们傻吗?为什么这么讲?因为一辆汽车,其实他的续航超过500公里以上,意义就没有那么大了。咱们完完全全可以说,开到三四百公里去充电就可以了。

但是你想,要把它造到800公里、造到1,000公里的续航,一定需要什么?更大的电池包,那东西很贵的,而且非常大的重量。电池跟汽油不一样,汽油烧完了就没了。

这个电池甭管有电没电,它都是那么老沉。所以这个是一个非常不划算的事情。咱们身边常用的电子设备,大概有多少电池,大家知道吗?MacBook Pro啊,14英寸的,大概是70瓦时。咱们的iPhone Pro Max 15,我现在就是用的这样的手机,是16瓦时吧。因为iPhone的标记是按照毫安时计算的,所以毫安时要算成瓦时,要算电压。iPhone的电压的话,应该是3-5伏之间,它里头不一定在什么时候用什么样的电压输出的。所以呢,一般按照可能4伏左右来算的话,大概是16瓦时左右。

那跟它这个电池比较起来呢,它是2250瓦时。你说它这里装了多少电池,真是非常恐怖的一个电池壳。你想装这么多电池在里头,它的重量、价格、发热都是非常麻烦的一个问题。Figure 02呢,跟Figure 01比较起来,也增加了更强的算力,更好的CPU,更好的GPU。但是我并没有看到文章里边具体去写它到底用的是哪一款,只是说它的算力是原来飞格 01的好多倍,确实是增强了。

然后传感器,现在这个东西已经可以跟他聊天。你跟他说,他给你回复没有任何问题。传感器是带6个RGB摄像头。什么叫RGB摄像头?就是彩色摄像头。一般咱们在机器人身上创作摄像头分几种:一种是全彩摄像头,一种是单色摄像头。很多单色摄像头实际上是测井深的,还有的会在上面装这种红外线摄像头,它可以测一些温度。

它这个上面是六个全彩摄像头,分别在头部、前胸和后背。这个东西怎么越来越像虫子了呢?也就是这样的一个硬件吧。软件上呢,这就是OpenAI的功能了,这个肯定更加聪明。第一个GPT-4O上来了,那么,端到端的语言模型已经来了。你现在可以随时跟它聊天,聊天的时候可以打断它,这就是GPT-4O的能力嘛。

现在,GPT-4O的语音版本已经有人用上了,但我等待了这么长时间,还没有能够用上。现在不知道它是按照一个什么样的梯度在进行慢慢的解锁,也许再过一两个月就能用上了,这还是值得期待的一个事情。

另外呢,就是视觉模型,这个应该也是OpenAI跟Figure AI一起去合作研发的视觉模型。它完全可以依靠视觉来完成各种复杂的工作,但在这一块上并没有详细的演示。其实,Figure 01在这一块演示的还是比较好的,而且确实震撼到了很多人。在Figure 02上呢,只是告诉你说这件事情我做了,效果在提升,但我估计跟Figure 01比较起来,已经没法再去震撼你一次了。

那么,Figure 02到底算不算地表最强呢?这个还要看特斯拉的擎天柱怎么玩。特斯拉最近是在跳票,原来计划是8月8号要去发布Robotaxi,现在跳票到10月份了,应该是没做出来。现在特斯拉说,我已经把我的AI算力中心重新搭建完成了,后边我的模型就要准备开始升级了。这是特斯拉最近宣布的消息。

对于做机器人这件事情来说,硬件上的设计制造以及工程能力上,我相信特斯拉针对Figure AI绝对甩他好几条街,没什么问题。但是想要在大模型领域里去追赶OpenAI的话,还是需要努力的。马斯克欠的债也很多,他也是许了好多的愿,他等着一个一个的实现呢。这一点,我觉得他不愧是OpenAI的创始人之一啊。

OpenAI在这块上,完完全全跟马斯克是有相同的特性,大家都是不停地许愿,不停地放气球,让所有的人在后边等,问:“你咋还没做出来呀?”那你说“地表最强”这件事呢,其实现在的所谓人形机器人都还停留在放视频的阶段。所谓放视频,就是可以剪辑,可以调速的一个阶段,并没有真正的开始进行实际应用。

所以在这个时候,到底哪个更强,真的并没有那么重要。而国内外有一些媒体,号称Figure 02是地表最强的机器人了,其实也是有点唯恐天下不乱,或者说赶快再看过来,不要把目光转走。AI并没有泡沫,我们还可以再抢救一下,大家再看这件事情。所以每一个词后面都是有原因的。

Figure 02呢,现在已经在宝马工厂里干活了,至少视频里显示是这样的。那么汽车厂是不是适合人形机器人呢?是不是人形机器人最适合的场景呢?很要跟大家讲,不是很多人在讨论,机器人到底是应该走腿的,两条腿,还是四条腿,还是应该上轮子、上履带呢?其实对于汽车厂来说,他们的地面设施是相对比较平整的,不一定非要是腿,因为腿这个东西啊……

确实是可以上下台阶,可以去,在一些非规则的路径上去行走。哪怕地上有一些障碍物,也可以跨越。但是呢,对于现在这种电机控制的机器人来说,他们的越野能力都并不怎么样。只有是原来波士顿动力做的这种液压机器人,才是越野能力比较强,因为它有爆发力嘛。

所以到底应该放轮子还是放腿,现在大家也在争论。到底是应该移动,还是应该多放一台,大家其实也有争论。什么意思呢?你比如说,我这有一个工位,需要有一个机器人在这干活,干重复性的劳动。然后旁边还有一个工位,传统的汽车厂的设置就是两个工位上放两个机器人就完了。你就别动了,我就直接把机器人拧在地上,你也别腿了,也别轮子了,也别履带了,直接固定在地上。

固定在地上的好处是什么?它有更大的功率,你可以直接把很重的机械拿起来,可以有更强的力量。而且在汽车厂里,其实并不需要那么大的电池。你在汽车厂里干活,后边脱根电线都没什么毛病。哪怕说你使用电池工作,只要能够工作个,比如说4个小时、6个小时,上旁边换电池去呗,这有多费劲嘛?你在里边装上使20个小时的电池,是非常不划算的一个事情。

而且呢,人形机器人的输出功率和效率其实并不高。什么意思呢?就是从特斯拉的擎天柱再到Figure 01、Figure 02的这种,它的输出能力来看,它的负重大概也就是20公斤,或者再高一些,也就是可能撑死了,到不了50公斤这种水平。他们的行进速度的话……

大概也就是每小时5公里,就相当于是一个成年人步行的速度啊。跑步什么的,他肯定是不行的啊。他只能是按照咱们正常走的速度往前走。因此,这样的一个设备在爆发力、力量的爆发和速度的爆发上,跟成年男性比较起来,都是没有任何优势的啊。当然,这玩意也有好处,什么呢?它持久力很强。你让一个机器人举着20公斤的物品走个10个小时,可能都能走下来。但是你要让人抱着20公斤的物品往前走的话,这事会呃出问题的啊。

那你说,汽车厂里的机器跟人之间到底是怎么去分工的呢?就算是工业4.0,完全自动化的那种汽车厂里,实际上只要是重复性的劳动,都是机器。而且是这种拧在地上的机械手,或者有人也管它叫机械人吧,只是长得跟人不太一样而已。那么人在里面干嘛呢?人在里面实际上是巡检的,就是我走过去看看哪个地方报警了,哪个地方的仪表有问题,或者说仪表可能所有的数据都是可以在后台统一读的。但是人可能需要到前台去进行一定的维修、维护,更换一些工件,或者是做一些阀门的这种现场的调整啊。这是人需要干的事情。

而这样的事情呢,其实现在甭管是擎天柱还是Figure02,还是做不了的。为什么现在人形机器人都在最不适合他们的地方干活呢?就是汽车厂啊、物流仓库啊,都在这种地方干活。第一个呢,容错性比较高。就是你在这个里头干错了点什么事情,拿错了东西或者摔坏了东西,大家是可以容忍的啊。你这个东西直接就进到家庭里边来。

你把小孩的手捏折了,或者是把什么瓶子打碎了,这个事情啊,是大家比较容易产生负面评论的。所以呢,在汽车厂还是有他们逐渐适应社会的一个封闭环境啊,这个是比较好的一点。然后呢,是肥水不流外人田,自己的狗屎自己吃。因为马斯克自己就是造电动车的,你让他再换个工厂,比如说把擎天柱送到SpaceX的工厂里去,你看看他行不行,我估计他不敢啊。因为SpaceX的工厂跟特斯拉的工厂的差异在什么地方?更像是实验室,火箭的工厂,它里面其实并不会像汽车工厂那样非常整齐,里面会更混乱一些。

所以像擎天柱这样的东西到了火箭工厂里头去以后啊,大家可能就会更加提心吊胆一点。让机器人去汽车厂,还有一个比较大的好处,就是拍出来的视频比较震撼人心,看他在这里干活了,没有工会了,就到更加的震撼人心吧。真正适合人形机器人的场景是什么呢?其实从现在来看,真正适合人形机器人的场景是物流的最后几百米。原来讲物流的最后一公里,我们把所有的物流的东西送到了集中配送的点以后,再通过车辆送到小区,或者送到周边的一些配送的地方,让大家去取,或者说最后一步是靠人给大家送上门啊。这一步其实是适合人形机器人的。为什么呢?他需要拿的东西并不重,20公斤吧,撑死了也就如此了。他可以上台阶下台阶,把这个东西拿起来以后啊,送到房间的门口。所以,这是非常适合人形机器人的一个场景。

另外呢,就是家政服务。可能还要等现在的人形机器人再在工厂里边锻炼一段时间,可能再有个三五年啊,他才可以去做家政机器人。那你说战争呢?战争这个事其实更适合机械狗。是人形机器人,这种东西在相对来说没有那么平的路面上,比如有台阶,这个还是可以搞定的。但是你真让它去越野,这个事呢,还是四条腿要比两条腿更好使。

中国是不是又可以奋起直追了呢?一定是啊。在模型方面,现在我们肯定是有差距,这个要承认。但是呢,稍微差一些的各种平替模型应该大家也在做。硬件部分,其实是咱们相对来说比较擅长的。甭管是特斯拉还是Figure 01、Figure 02,他们最后要去实施的时候,估计还是得到中国来建产业链。

所有这些东西,咱们都有外观设计啊。那你说咱们能不能设计出这么好看的,甭管是特斯拉还是Figure 02这样的机器人,咱能设计出来吗?这种事呢,不用太担心啊。中国大部分的现在大家觉得还比较好看的电动汽车,都是欧洲团队设计的。我们再接着找欧洲团队说,来再给我们设计一个啊,所以设计这件事情不用担心。

那你说,为什么中国人没有七尺喀嚓在这开这种炫酷的机器人发布会呢?很也很简单。刚才我们讲了Figure 02,为什么在这个时候开发布会?你准备再圈钱了吗?准备把这个岌岌可危的泡沫再稍微维护一段时间了吗?中国呢,本身资本就没有那么热,你就算是发布了这样的产品,你能圈到钱吗?你又圈不到,那何必费这个劲呢?因为你一旦发布了以后,这狼多着呢。

大家会冲着你的方向接着往前跑的,还不如关起门来,咱们自己干点活呢。以前这样的产品发布了以后,还有美国的美元基金进来投,现在美元基金也进不来了,那媚眼不是抛给瞎子看了吗?好啊,这就是我们今天讲的故事。

Figure02的发布,很多人冠以“地表最强机器人的”名头,原因是在这样的一个大家都在传AIGC泡沫要破的时候,看看能不能再融到一笔钱。所以,这个词是这么来的啊。至于他到底是不是地表最强,反正他们家拍视频拍的还是不错的。在拍视频这件事情上来说,我觉得Figure AI要比特斯拉要强一些,特别是在做机器人的盈利里头,Figure算是最强视频拍摄公司。

好,这一期就跟大家讲到这里,感谢大家收听,请帮忙点赞、点小铃铛,参加Disco讨论群也欢迎。有兴趣、有能力的朋友加入我们的付费频道,再见。

 

Both comments and pings are currently closed.

Comments are closed.

Close Bitnami banner
Bitnami