Figure AI与OpenAI分道扬镳,难道是因为DeepSeek吗?深挖背后原因:具身智能的端到端大模型、机器人自主创新赛道如何博弈?
2 月 07
AIGC, 机器人与具身智能 AI Agent, AI大模型, Archer无人机, DeepSeek, DeepSeek开源, DeepSeek蒸馏微调, Figure, Figure 01, Figure 02, Figure VS OpenAI, Figure10万台计划, Figure2024发布, Figure与OpenAI分手, Figure与宝马合作, Figure与擎天柱, Figure估值, Figure冲击市场, Figure和OpenAI, Figure商业机器人, Figure家用机器人, Figure招聘, Figure新应用, Figure无人机协作, Figure机器人, Figure机器人应用, Figure机器学习, Figure物流机器人, Figure独立研发, Figure研发计划, Figure端到端技术, Figure端到端机器人模型, Figure端到端模型, Figure融资, OpenAI, OpenAI合作, 人形机器人, 全球机器人大战, 实时系统, 布雷特·阿德柯克, 微软投资, 智能机器人, 机器人市场, 深度学习, 端到端大模型, 自主创新, 英特尔资本, 贝索斯基金, 非实时系统, 马斯克擎天柱 Figure AI与OpenAI分道扬镳,难道是因为DeepSeek吗?深挖背后原因:具身智能的端到端大模型、机器人自主创新赛道如何博弈?已关闭评论
Figure突然官宣放弃跟OpenAI的合作,这到底是一个什么样的事情?大家好,欢迎收听老范讲故事的YouTube频道。Figure的老板突然发了一条推特,他的老板叫布雷特·阿德柯克,后边我们就不再重复他老板的名字了。这公司干嘛呢?这公司做机器人的。去年,Figure 01和Figure 02的演示还是引起了很大的轰动的。现在他就讲了自己要去研发端到端的大模型了。机器人公司必须要拥有自己的端到端大模型,说我们的模型一定不是外包的,就像我们的硬件不是外包的一样,我们一定要自己做,要自力更生了。
这个也是别人一开源,他就自主创新,自主知识产权去了。谁开源了?DeepSeek V3开源了,DeepSeek R1开源了。除了说我不再去跟OpenAI合作之外,还讲了什么呢?我现在已经开始去做自主的知识产权的端到端大模型了,30天之后就可以给大家看成果了,绝对吓到你们。然后开始招聘,现在还需要什么什么样的人,具身智能的工程师,快来上班吧。未来4年准备要交付10万台机器人,这个呢,应该是对着马斯克去的。马斯克说2025年要造1万台擎天柱,到特斯拉的工厂里去打工。他说我今年造1万台有点费劲,但是我未来4年造10万台,气势上不能输给你。
未来的机器人呢,他是准备用在商业和家庭两个方面的。马斯克的擎天柱目前应该主要还是在工厂里打螺丝的,但是Figure的机器人呢,商业上第一个制造业也是工厂里打螺丝,他要去的。然后仓储物流,就是可以到仓库里去搬东西,以及零售导购,这个其实已经接近于家用了,就是他已经跟人很近了。他可以在商场里头卖东西。家用呢,Figure 01第一个演示的就是煮咖啡,给你演示一下这个咖啡是怎么用的,应该是用的一个胶囊咖啡机吧。他就跟着你去学,学完了以后就会煮咖啡了。然后呢,还要学会洗衣服、整理房间以及遛狗。遛狗我觉得应该不是一个特别难的事情吧。
但是,整理房间这事还是挺费劲的。洗衣服肯定也不是手洗嘛,能使洗衣机就完事了。这是他未来要去做的事情。而且呢,这个Figure的老板还讲了一个新的应用,是什么呢?要跟这个Archer无人机协作去送快递。这个Archer无人机的公司呢,也是Figure老板一起创建的一个公司,应该是先创建的Archer,后来创建的Figure,这是这样的一个次序。
Archer是做什么的呢?就是四旋翼载人无人机。这个东西呢,应该是跟美国军方签的协议,已经开始交付了。以后加上他的Figure机器人,就可以把快递直接送到你们家去了。这个应该是一个很不错的应用。以后特斯拉的擎天柱,跟特斯拉的robotaxi配合在一起去送快递,应该也是想起来很美的一件事情。
Figure呢,应该绝对是去年的当红炸子鸡。我记得当时Figure 02的演示效果绝对拉满,应该也是给马斯克带来了很大的压力。而从创投行业来说,什么样的企业叫当红炸子鸡呢?就是一年至少融资两轮。如果你要是一年融资三轮,那你就彻底红了。什么意思呢?因为我们知道融资这件事,种子轮、天使轮、ABCDE,再上个市,它一般是这样的一个顺序。如果你在一年之内能够连续融两轮的话,就已经非常厉害了。
Figure 2024年就是连续融了两轮。他呢,在2024年年初融了一个7,000万美金的A轮,这个其实已经很大的一个A轮了。当然,你做机器人吧,钱还是要稍微多一些的。所谓的2024年年初呢,应该是在2023年把协议都签完了,只是执行,到了2024年的年初才执行完。
第二轮什么时候呢?2024年2月29号,又过了,也就是一个多月的时间,又融了一轮。这一轮呢,是6.75亿美元的B轮,这个非常吓人了,估值就直接达到了26亿美金。一般超过10亿美金就是独角兽了吧,双份独角兽,还带个拐弯的。这一次的投资是谁呢?微软投了,OpenAI的startup fund,就是OpenAI自己下头。
专门有一个创业投资的基金,他们也投了。然后英伟达、亚马逊创始人贝索斯通过贝索斯下面的一个基金会投资的。然后Parkway,应该是他的这个A轮的投资人,他们也进行了跟投。英特尔资本也进行了投资。
当然,这里面有些人可能出的是真金白银。你比如说像英伟达、贝索斯、Parkway这样的,肯定是出的这个真金白银的。微软呢,有可能出的是代金券。微软当时给OpenAI,应该有一部分是真金白银,但有一部分就是代金券。而OpenAI给的钱呢,大概率是软件授权或者是一个技术入股,所以它未必能给出多少现金来。
就别看OpenAI今天融了个100亿,明天要融200亿,就手里有好多现金似的,但是它拿到的也有一大部分是代金券,手里的现金也没有那么充裕。而且你想,作为大模型的带头大哥,我愿意赏给你脸,愿意让你用我的这个大模型,你给我些股份呗,这个也还是说得过去的。
这个呢,也为今天Figure跟OpenAI翻脸留下了一个伏笔。如果你真金白银给了钱,后边说我不跟你玩,这件事确实还是有点难度的。但是如果是技术入股的话,这个翻脸的压力就没有那么大了。
现在呢,这个Figure已经在宝马的工厂里打螺丝了,并没有去德国,是在宝马位于南卡罗莱纳州斯帕坦堡的工厂。Figure01是2024年初就进到宝马工厂里干活去了,然后Figure02呢,是2024年8月份正式发布。在发布前就已经派到宝马工厂,在工厂里边执行将钣金部件插入到特定装置等任务,就是反正搬来搬去的这样的任务。
这个老板做的Archer无人机公司呢,他们做的无人机叫午夜,叫这样的一个名字。这个无人机呢,是美国海军订了6架,2024年8月呢,已经交付了一架。但是呢,并没有继续交付的这个报道出来,是不是后边继续在交付不知道了。不过大家注意,它这个无人机不是像大疆那种打农药的,或者是拍视频的。
它这个是里头可以坐人的。 当然,你不要想着说机器人坐里头操控无人机,没有这个必要。 这种无人机的飞行一般是通过三种方式。 第一种呢,就是规划路径,规划航线,直接点对点飞行。 现在其实大量的在城市里边跑的无人机都是通过这种方式来运作的。 他们唯一需要去处理的就是,比如起飞降落,我能找着这个地上的靶子,能够降准了。而且在飞的过程中遇到一些特殊情况,我可以稍微的处理一下。
第二种呢,就是遥控,就跟大疆的那个是一样,他有个遥控器在远程可以遥控着飞。 然后第三种的话,他也是允许你坐在机舱里头驾驶这个无人机的。 但是这一块其实并没有那么重要。 咱们来思考一下,他为什么跟OpenAI闹翻了呢? 正常情况下,他就算是不再跟OpenAI合作,他通常也是私下解决。 OpenAI现在好歹还是个当红炸子鸡,你现在直接跟人闹翻了,到底想干嘛? 想要踩着OpenAI上位吗? 这个有点太难了。 而且作为Figure这样的一个公司来说,你踩不到OpenAI。 你比如说XAI,你还可以去踩一下,它还可以以OpenAI为这个阶梯往上爬一爬。 但你一个做机器人的,离他还是稍微有一点点远。
那你说这个事情有没有可能就是个表演呢? 不会,只要出来官宣了,一定是真翻脸了。 那么机器人里边的大模型,大家有没有想过,他到底是怎么工作的? 是不是这个机器人他有一个大模型,你让他干活,他其实开始给你干了,还是说机器人就像手机似的,你给他发所有指令,然后都到云端找那个模型去干活去? 应该不是这样的。 机器人里面应该是一个完整的AI agent。 为什么这么讲呢? 它也是可以去读取各种信息,在各种指令库里边去检索,然后去形成记忆,操控机器人去做各种事情的。 所以呢,它应该是一个完整的AI agent。 这个完整的AI里头呢,应该是多个模型在配合工作,绝不可能是一个模型在工作。 所有的这种有巨身智能或者有机械身体的这种设备,包括像汽车,它的系统一般都是分两块。
一块呢叫非实时系统,一块叫实时系统。什么是非实时系统?比如影音视频的多幕态识别和语音对话。你把这东西传到云端去,处理完了再传回来,是没毛病的。包括一些主控任务规划和这个执行,这个也都可以作为非实时系统。你都可以在云端做,或者哪怕在本地做,都不用那么着急,说必须马上要有一个什么结果,没必要。
再往后呢,就是实时系统。我想控制这个手臂怎么去动,怎么迈腿走路。你不能抬脚摔倒。那么这些系统一定是实时系统,这些系统一定会在本地执行,而且对延时要求是非常高的。你不能说我这边脚抬起来了,陀螺仪也转起来了,发现身子已经歪了,向云端请示说这个身子歪了,然后该往哪边动一下,那边再过个几十毫秒,再把这个指令发回来,这个时候这机器人早趴地上了,这个事一定是不行的。
在这个里边,哪部分是Figure自己做的,哪部分是OpenAI做的呢?GPT-4O的高级语音功能,也就是咱们在Figure02演示里边看到的那个聊天、任务规划,比如说你把这食物给我,他就会在一堆的杂物里头把苹果选出来递过来,他就可以干这件事情。那么这一部分呢,应该是OpenAI做的事情。
然后哪一部分是Figure自己的呢?就是刚才我们讲实时系统那部分,以及各种控制的部分。虽然OpenAI的这个视频部分可以看到说这个桌子上有苹果有纸团,但是你要真想伸手,准确地把苹果抓起来,这一部分的视频识别和定位,以及整个的操控,应该是Figure自己干的事情。
在这样的一个情况下,我们就可以想清楚为什么Figure现在要跟OpenAI闹掰了。第一个原因,OpenAI大概率是没有出钱,应该是技术授权入股的一个方式,所以呢,现在觉得不划算了。第二个原因,肯定是跟DeepSeek这种东西有关系。为什么呢?因为现在有了DeepSeek,导致了对自己的小模型直接进行蒸馏微调变成可能了。DeepSeek R1蒸馏微调的一点几B的模型。
或者是7B的模型都已经展示出来了。刚才我们讲的Figure自己做的这个模型能有多大,在本地实时系统跑的,这个模型应该很小。那既然这样的话,干脆直接对本地的模型进行蒸馏微调,就完事了。他也可以有一定的推理能力,我何必去跟你OpenAI去折腾的,没必要。我完全可以自己去部署自己的DeepSeek的服务器,然后自己再去微调一些专业的机器人模型,他就可以跑起来了。
你想,他26亿美金的估值,OpenAI占的股份再少,它这个股份肯定也是值很多钱的吧。这一块就能省则省了吧。那么后边的话,咱们就使用Deepseek就完事了。既然是AI agent,原来可能主控的部分是由OpenAI来提供的,现在的话没必要了,我就完全可以自己主控了,由DeepSeek直接搞定,自己去学习,自己去做记忆,自己去做任务的理解和规划,这个是没有任何问题的。
现在咱们看到春节联欢晚会上那个宇数科技转手绢那个东西,他们在1月30号就已经挂上了DeepSeek R1这样的模型去给他们进行任务规划了。挂上以后发现,任务规划成功的这个比例急剧上升,没有必要再去使用OpenAI了。有了DeepSeek,Figure底气变硬了,这就是他们要脱离OpenAI的第二个原因。
第三个是什么呢?就是OpenAI现在可能也顾不太上Figure了。他自己还投了一个叫EX的公司,这EX就是那个机器人,穿了个秋衣上来说,谁也不知道那后头到底是真人还是什么,他们自己也不出来解释。这个公司就是这样的一个项目,然后他们还准备再去孵化一大堆的这种机器人公司。Figure说,我原来想着我是你的唯一呢,结果一看你这是一渣男,不跟你玩了,这个也是一个原因了。
当然这个可能并不是一个关键原因,关键原因应该是什么呢?就是OpenAI说我自己做吧,我不说再跟你们去孵化来孵化器了,干脆我自己做就完了。而且OpenAI呢大概率会走安卓路线,就出标准出模型。
通过投资和孵化的方式,要求这些下面的小公司跟着他的标准和模型往前走,应该往这个方向去走。而且呢,为了这个目标,OpenAI还从Meta招聘了新人回来,负责机器人业务。这个事情我们原来其实遇到过,一个公司说我们在这块业务上想调整一下战略,找了一个特别牛的大牛回来。那么在这个时候,会遇到一个什么问题呢?叫新官上任三把火。这个新官上任干什么了呢?一定是对原来的协作方式有了新的规划。你原来做那部分必须扔掉,它一定会有这样的调整。
因为对于这种提供底层系统的人来说,他真正需要去做的事是什么呢?就是要划清边界。就是我的整个系统边界在什么地方,哪一部分归我,哪一部分归你。在划的过程中呢,从大厂里出来的人,他原来Meta负责AR那部分的嘛,一定是比较强硬的,老厉害了。在这样的一个情况下,Figure觉得自己还是一老臣子,就可能会有不服气的情况,可能会闹掰。
新来的OpenAI的机器人负责人跟这个Figure可能处理的并不是那么开心。为什么这么去想这个问题?原因也很简单,就是这个事情被公开化的贴出来了。如果说大家只是方向上有差异,或者是协作上不是很愉快的话,大家自己内部消化就完事了。哪怕说我们不再协作了,你也没必要出来去发推特。
大概率还是有一些人跟人之间的私人恩怨爆出了。从这个投资的角度上来说呢,还有一种很特殊的条款,有可能也会在里边去起作用。这个条款呢叫反竞争条款。这种条款通常是要求被投企业不可以跟投资公司相互竞争的。但是呢,这个东西并不是一定的。有的时候,当下面的公司比较强硬或者比较强势的时候,被投公司也会要求母公司不可以跟他进行竞争。这个有的时候会双向都有,特别是当这个母公司还没出钱,用技术占了个股,还占了也挺多的份额的时候,这有可能会在投资协议里面包含这样的反竞争条款,就是OpenAI你不可以做哪些哪些事情,你必须要去支持,有可能会有这样条款。
当OpenAI决定说我自己做机器人的时候,就会触发这样的条款,直接丧失原来在Figure里边的一些股份。但是,就像我刚才讲的,他不应该出来吵吵,吵吵了那么大概率还是有私人恩怨。最后一个原因是什么呢?刚才咱们已经捋了这么多原因了,但是我觉得这些可能都不是最核心的原因。最核心的原因是,端到端的机器人模型最后不一定有几套,但肯定不会是每个机器人公司都有一套。
现在看来,特斯拉的FSD肯定是一套机器人端到端模型,OpenAI的话一定会出一套自己的机器人端到端模型。至于说谷歌呀,或者其他的一些大模型公司,有可能会做。我觉得谷歌在实验室里藏点什么奇奇怪怪的东西的可能性是比较大的。然后,各大实验室、研究所以及汽车厂手里边都应该有一些储备。这些东西到底最后能不能商品化出来跑不好说,但储备一定要有。
比如说像中国的小鹏、理想这样的公司,手里头应该是有机器人端到端模型在储备的。那么Figure的话,现在肯定想要挤上最后一班车,我的估值都已经26亿美金了,一定要有自己的端到端模型。如果你没有自己的端到端模型的话,你再往前发展,等于就变成了一个代工厂,你就是给人造硬件的,那你就不值26亿美金了,你再往后融资就没法融了。那么他一定要在这个时候说OK,我下车了,以后我就独立做自己的端到端模型了。这可能是他要抢到最后一张入场券,这才是Figure在这个时候喊着下车的一个核心原因。
那么2025年呢,我们应该会看到一场热热闹闹的机器人大战。马斯克的擎天柱准备造1万台,进工厂打螺丝。而且马斯克还招聘了大量的人去训练他的机器人,完成各种各样的动作。等于他也是需要有一个预训练,有一个学习的过程吧。中国的厂商们呢,肯定也在端到端这块要卷一下,包括像什么宇数、理想、小鹏这些人都会干,小米肯定也会去做,因为小米原来也是有铁蛋机器人的嘛。戴里斯应该也在努力的向这个方向去发展。
而且,从造硬件这件事来说,中国厂商一定会在最后的人形机器人大战里头占有一席之地的。能把这东西造得多快、好、省,这件事全世界应该没有哪个国家可以跟咱们去一较长短。你说我把这个机器人造得非常精密,能效比很高,这件事呢,那可能美国、日本、德国,他们也很强。但是你说造得物美价廉,这件事他们跟咱们比还是差很远的。
现在中国呢,在大语言模型和推理模型这块呢,也算是暂时追上了一大步。我们还是要看未来一段时间,OpenAI怎么再接着往前走。谷歌这两天也在出新模型,他把Gemini 2.0 Pro的模型出来了,但我还没有仔细去试,应该也是又往前迈了一大步。
现在的宇数科技,就是中国造机器人的这些公司,其实也是不少的。这些公司里边,他们的实时系统的那部分模型,很多的是英伟达,还有包括美国的一些大学给他们去做的。真正的AI agent去进行统合规划、进行这种语言对话,进行这样的非实施系统上的模型的话,现在都已经开始向DeepSeek转型了。DeepSeek在这个角度上说,你说它是国运级的创新,并没有什么大毛病。
中国大量的机器人公司应该都在快速地向这个方向去转型,因为效果确实还不错。而且他可以把大量的小模型进行微调了以后,塞到机器人里面进行端侧的一些处理,这块还是非常非常强大的。而且中国的话应该会比较敢用。什么意思呢?就是我们在使用新鲜事物上,胆子一般是要比欧美国家大的。在这个过程中,造成一些人员伤亡、财产损失什么的,这些事情的话在中国,整个的成本还是要比西方低很多的。
所以呢,2025年我们也可以再看看,在机器人领域里头,中国跟美国是不是还可以像在大模型领域里头再好好较量一下。在这个过程中的话,Figure应该也可以上到牌桌上去,跟马斯克的擎天柱、跟国内的各种各样的机器人一起去竞技,给我们贡献各种各样的故事。原来呢,他只是OpenAI的小兄弟。
大家只是觉得你就是个做硬件的,其他的东西到底做成什么样也不知道。现在他说我可以独立上桌了。今天其实就是发生了这样的一件事情。好,今天这个故事讲到这里。感谢大家的收听,请帮忙点赞,点小铃铛,参加Discord讨论群。也欢迎有兴趣、有能力的朋友加入我们的付费频道。再见。