硕鼠的博客站

范路的博客主站,时而会发些东西。

谷歌DeepMind做出来打乒乓球的机器人了。很多人开个玩笑说,这东西应该叫阿尔法乓。因为当时下围棋叫阿尔法Go,这个东西应该叫阿尔法乓。大家好,这里是老范讲故事的YouTube频道。今天我们来讲一讲谷歌做出来的阿尔法乓的故事。

今年整个的奥运会里头,我唯一观看的比赛就是乒乓球男团,大概看了一场吧,就是咱们国家的一位男单选手,也叫小胖,去打这个瑞典的一个小帅哥,这个还是看着很过瘾的,叫樊振东。对,不能光想人家的外号。咱们算乒乓球的传统强势国家,整个的奥运会,我们得到了全部的五枚金牌,银牌铜牌我们也得到了其中的一部分,当然也漏了一部分。都得了这事了,没法玩了。下一届奥运会说,算了,我们把乒乓球这个项目给你取消了,不跟你玩了。

谷歌这一次做的乒乓球机器人长什么样呢?长得一点都不像人,这个没办法,长得像人的成本实在是太高了。他使用了一个机械手,这个机械手是ABB的IRB 1100。它等于是把这样的一个机械手固定在一个轨道上。ABB是瑞士苏黎世的世界机器人行业的领军企业之一。

ABB的这种IRB 1100是一个什么样的机械手呢?我们以前去做机器人项目投资的时候,也去研究过这个问题。就是说机器人最后这个人字呢,是大家一般比较纠结的地方。因为现在很多叫机器人的东西,其实只有一个胳膊,就是它里头有几个关节可以动的,一条手臂,并没有一个像人一样的东西。但是你也管它叫机器人。在国外应该都是robots,但在国内就都是叫机器人。

而另外一种叫机械手。IRB 1100这个机械手呢,它是一个最紧凑、最轻的六轴机器人,六轴就是它有六个活动的关节。

它的承重是4公斤,再重了它也拿不起来了。工作区间就是半米乘半米的这样的一个平面上,它可以在这个范围内去工作。最高的速度是5米每秒,5米每秒的话应该是18公里每小时,大概是这样的一个速度吧。它是可以按照这个速度去运作的。价格的话大概是10万块钱左右一台。它这种机器人在国内是有组装的,瑞士ABB在全世界有三大工厂,其中有一个就是在上海。它的价格其实跟特斯拉的擎天柱差不多。马斯克现在讲的说我的特斯拉擎天柱大概是十几万到二十万,他讲的是2.5万美金嘛,这样的价格一台可能接近20万吧。所以它这个光有一根手臂的价格跟整个擎天柱的价格是接近的。

它固定在一个轨道上,这轨道可以横向移动。前面是一个乒乓球台子,后边是一轨道,可以横向动,因为它的覆盖范围就是半米,半米乘半米的纵深的一个范围,是它可以去覆盖的工作范围。但是这个乒乓球台子我印象里应该是一米多宽吧,因为我并不怎么打乒乓球,所以对这个数据不熟悉。它还是需要移动的,而且还有正手反手的,所以它会去分说我是在哪个方向把球打回去的。有旋转等等,这个它都会有。

谷歌真正做的是什么呢?谷歌做的是软件,硬件是瑞士ABB的。这个软件就是视频捕捉,我通过摄像头把它捕捉下来。它还是分两个摄像头去捕捉,一个是捕捉人的动作,可以通过人的动作来确认说我这个球应该是怎么样去前进的。另一个摄像头是捕捉球的轨迹。对一些特别旋转的球,可能处理得没有那么好,因为这个球真的转起来以后发过来,靠捕捉球的这个摄像头其实是看不太出来它的旋转的角度、速度或者说测量得没有那么准。

然后,他会制定策略。这个策略呢,也是分两期。第一个呢,是我的战略是什么?我要如何去调动你,如何去发现你的长处短处,如何针对这个人去制定战略。另一个层面是战术性的。我现在到底是正手的回正,还是反手的去搓,还是怎么去旋转?这个是两层的策略制定。

然后再可以去把这个轴接回去。速度和效率呢,其实才是这一次谷歌展示了这个机器人最重要的一点。他是可以告诉大家说,你看,我们可以通过摄像头去捕捉,完了以后可以接到这个球的。因为大家知道,乒乓球本身速度是很快的,但它不是最快的,最快的是羽毛球。乒乓球的这个速度也是相对来说比较快的,而且乒乓球还需要在台面上去弹跳。

所以,它的这种物理引擎计算,对算力的要求还是比较高的。因为像这样的机器人,如果效率达不到的话,是没有任何意义的。其实像阿尔法Go是不需要效率的,对吧?我这边下完棋以后,你那边慢慢的等就完了。但是打乒乓球这个事,你是必须有效率的。你这边球发过来以后,我算完了以后球过去了,这个事是不允许的。

我记得原来有一个故事,讲这个抗美援朝的时候,美国的战斗机上就已经开始有火控系统了,但他那个火控系统的速度就不够快。所以,当时咱们开的喷气式战斗机上去以后,就会看到他那个机炮永远在咱后头追,老追不上咱们。这就是电脑指挥的这种设备,如果效率不够会怎么样。

现在谷歌做的阿尔法乓呢,应该还是停留在论文和实验室的阶段,可以跟普通人打成平手,但跟职业运动员比,基本上还是没戏的。跟普通选手打成平手,就是互有胜负,应该这么去理解。为什么跟职业选手搞不定这个事呢?第一个就是说,机械手的运动范围跟速度还是受限制了。

另外的话,职业选手的这种假动作,包括他这种旋转,对于摄像图和算法能够处理的范围,还是稍微有些超纲了。但是呢,谷歌已经把这种可能性跟大家展示出来了,这还是很棒的。那么未来会是什么样的呢?未来肯定要上难度嘛。大家想一想,现在它只是一根手臂放在一个横向的轨道上了,对吧?如果变成腿会怎么样?如果真的是变成人形机器人,变成两条腿站,那会是什么样的一个情况呢?

现在,马斯克还有像Figure 02这样的机器,他们的人形机器人每个小时也就能走5公里,基本上也就是人类正常步行速度。但是我们看看这个乒乓球比赛的时候,那真的是上窜下跳,那是要跑,要跳的,所以这个应该还达不到。如果真的可以在这种机器人下面做成两条腿,那么步行机器人就算是彻底成熟了。我觉得可能还要个三五年吧。

即使不是两条腿,您给下边装轮子,这事都搞不定。为什么呢?因为轮子你就可以前后左右地动了。他的速度、重心这个事就没法整。轨道的话,你是不需要研究重心的问题的。我挥了拍以后,你不会能从轨道上出去,我轨道是给你固定在这了。而且现在的比赛,乒乓球是可以干这个事,其他的都没法整。

你说我弄个网球、羽毛球,那网球你得满场子跑啊。你不可能说我在地上给你固定一条轨道,或者固定几个轨道就搞不定这个。要是羽毛球的话,第一个速度更快,第二个羽毛球你也需要满场的跑。你不可能说我站在台子后面,只要横向移动就搞定了。

至于其他的,比如说篮球、足球这些东西,你需要面对面对抗了。不是说中间立一个网,大家站两边,这个就已经是太危险了。你真的跟一个机器人面对面的冲撞一下,他是个铁疙瘩,对吧?

这个事现在还比较难以想象。现在有没有这种机器人陪练呢?其实是有的啊,乒乓球机器人的陪练呢,欧姆龙公司已经做到第八代了,叫Forpheus,应该这么念:FORPHEUS。有这种叫做乒乓球教练机器人的,国内也有啊,上海体育学院跟新松机器人做了一个,叫Pangbot,就是打乒乓的一个机器人。

但是这种机器人呢,主要做的是什么呢?主要做的是发球机器人。我只管发球,一个球一个球发,发完了以后,你那球给我打回来。而且呢,他可以根据运动员打回来的这个过程,通过传感器去判断,你现在的姿势对不对,回的球是不是有质量,然后再去发下一个球。现在呢,也是有AI辅助的,这块现在都做出来了。

增加接球的部分的话,谷歌做的阿尔法乓跟现在这种发球机器人的最大区别,就是他可以接到球给你打回来。这个增加的成本就实在是太高了。而且呢,他能够实现战术变化,以及实现的功能,其实是要比原来的发球机器人要少的。

那么在未来,阿尔法乓是不是有可能像阿尔法Go那样,整个提高某一项运动的这种竞技水平呢?因为阿尔法Go出来以后,人类现在已经彻底放弃了战胜机器人这种想法了。现在呢,我们只是不断地通过阿尔法Go的训练,来提升人类棋手的棋力,最后比赛还是人跟人之间的去比赛。

那你说,阿尔法乓这样的机器人出来以后,是不是中国就不会再得到这么多的乒乓球金牌了呢?他们可以把所有中国队的选手做成程序,然后让这个机器人去训练。说来,现在我们让樊振东去陪你打一场球,或者让以前已经退役的很多球员,比如像邓亚萍、张怡宁,让他们来陪你打一场球,这个是完全可以做到的。

未来会不会向这个方向走?我觉得我们可以拭目以待。阿尔法乓呢。

真正的意义在于,它为整个行业指明了方向。我们可以通过机械手进行这样的操作,而且我们的算力已经可以进行这种多层级的策略制定了。这是它真正的价值。它的价值未必产生在乒乓球上,甚至比如说我们以后在飞船上整一个机械手,举一拍子,有陨石过来啪啪打走。这开个玩笑,但未来肯定会有很多新的不同的用法。这是阿尔法乓给我们的一些新的启示吧。

好,这一期就跟大家讲到这里。感谢大家收听,请帮忙点赞,点小铃铛,参加Disco讨论群,也欢迎有兴趣、有能力的朋友加入我们的付费频道。再见。

 

Both comments and pings are currently closed.

Comments are closed.

Close Bitnami banner
Bitnami