硕鼠的博客站

范路的博客主站,时而会发些东西。

马斯克的脑机接口已经成为了人类的成神之路。大家好,这里是老范讲故事的YouTube频道。今天咱们来讲一讲,在上周五,马斯克和整个脑机接口团队一起接受了8小时的访谈,都谈了些什么。时间是8月2号,名字叫做《Neuralink与人类未来》。著名的科技博主莱克斯·弗里德曼主持了这场访谈。参加访谈的有Neuralink公司的创始人埃隆·马斯克,还有他们的首席科学家DJ·SEO,以及首位Neuralink脑机接口的植入者诺兰·阿伯。

那么主要讲的是一些什么样的内容呢?首先,现在的技术还比较可笑。虽然方向是指明了,但并不是那么看起来高大上的样子。64根导线就真的是往脑子里塞线,每根线上有16个电极。这些电极是在三四个毫米的范围内进行分布。应该是一根线出去以后,有16个小电极从线里的中间插出来,这个长度三四个毫米。在这个线的周围把它分布出来,这16个电极是以200微米的间隔进行排布。这些电极的深度是3-5毫米,它真的是要插进去的,而不是说贴在上面的,是要插到我们的脑皮层里边去的,是一个有损害的手术,这个还是有点吓人的。

这个玩意让我想起来那种可以贴在胳膊上测血糖的东西,对吧?它啪一下把它贴上,其实也是有一些细小的针把皮肤扎破的。这样复杂的手术是靠机器人来去做的。

脑机接口公司Neuralink做的第一个产品,其实是它的脑机接口植入机器人。现在,已经成功做了一例,准备做第二例。今年估计会做10例,未来应该每一年,这个数字还会快速上升。这个机器插到人脑里后,通过无线连接到APP上,APP采集了所有的信号后再去解码。

所以,现在的脑机接口其实是一个只读设备。什么叫只读设备?就是它只能够从我们脑子里读取信息,而并不往里写东西。因此,现在找的测试人员是能说、能听、能看到的四肢瘫痪的人。他们并不需要把什么信号传到脑子里去,只需要通过大脑的想象来识别,出来后让机器或一些外部设备去做动作就可以了。

现在的速度还比较慢,每秒钟一个比特。比特应该是一位,就是0或者1这样的一个位数,这真的挺慢的。你想,要凑出一个英文字母来,至少需要8个比特;要凑出一个中文单词来,至少需要16个比特。所以,整个的动作并没有那么快。

不过,现在第一个测试的人植入的这些电极中,有一些已经脱落了。目前还在正常工作的电极,只有原来计划好的10%。如果电极都插好了以后的话,它的传输速率应该可以达到,比如说10倍,每秒钟可以达到10个比特,也就是一个字节。稍微多一点点,你可能每一秒钟都可以想出一个字。

现在的信号仍然需要进行双向训练拟合,我们没法直接从大脑里读取出来。

说你想往左还是想往右,想向上想向下。你到底是想去输入哪个字母?现在想去直接确认解码,还是有一些难度的?所以现在要做的事是什么呢?就是训练,对吧?我们把所有的这些很模糊、很混乱的数据都读出来。读完了以后呢,看看怎么能够把噪音滤掉,然后里头哪一部分是有明确的指令,可以去解读出来的。现在还在做这件事。而且呢,这个东西不光是训练电脑的,这解码程序,还需要训练人。他需要让人也去按照一个什么样的方式去思考,这是一个什么故事。

其实我以前试过啊,就是带这种脑电波的这种环。以前就是没有脑机接口之前吧,他们也有这种啊,脑电设备的一些采集系统。他呢,就是要求你是集中注意力,或者是啊,彻底放松,想象一些不同的东西。它是可以读出一些波形来的。那么这个过程,就是需要让我们去训练思维,这就是一个双向训练的过程。

大家想一想,早期的语音识别是怎么干活的?早期的语音识别是需要进行训练的。他给你一个词表,你要挨着个念。念完了以后呢,如果计算机发现你念的不清楚,他会让你重念,对吧?要训练你按照标准的发音去念这些单词。同时计算机会进行一定的学习,说:“啊,这个就是在念这个单词了,我也记住了。”这样才可以进行语音识别。

早期的图像识别其实也是这么干的,先进行人工标注:“这是个汽车,这是个房子,那是个人,这是个自行车,这是个交通标志。”然后呢,再从速度很慢、错误率很高的情况下,逐渐的可以达到说分割一切的这样的结果。那你说,都是怎么进化过来的呢?

进化的过程其实也不复杂。第一个就是采集的信息更多。我们用非常非常多的信息在里边去识别,那么他就很容易,或者说要更容易在里边找到有用的信息。第二个是什么呢?就是通过大数据和AI学习进行训练,这个也是可以提高识别率的。现在,我们去识别这些脑信号还是比较费劲的,但是未来一定会发生,发展到不需要标注、不需要预训练就可以直接读取。这一天啊,应该离我们并不远。

现在我们再去做语音识别,还需要预训练吗?不需要。我们现在再去做图像识别,需要人工标注吗?不需要。现在直接用梅塔的Sam 2的这个模型“Segment Anything”,这个模型直接用起来以后,它就自动都给你分割好了。所以发展应该还是很快的。

现在制约脑机接口数据识别的呢,肯定还是数据量不够,或者说采样的频度、采样的信息的准确度还差得比较远。当以后说,我可以一秒钟采样很多数据的时候,他这种识别就会变得非常好。

这呢是一个99米长的枪的故事,这个是一个我非常喜欢的故事。我记得在我刚上班的时候,应该是有一次到惠普去参加培训。惠普的工程师就跟我们讲说:“你们知道,如果现在的枪只能打一米远,但是我又要打到100米之外的那只鸟,应该怎么办吗?”我们说:“这个怎么办呢?我们爬过去啊,还是怎么办啊?”他说:“都不对,首先我们是工程师,工程师要解决的问题就是,已知条件是我们要打中100米之外的鸟,另外一个已知条件是现有的技术是枪只能打一米远。”

那么在这样的情况下,我们能够造出来的东西,就是99米长的枪。当你的枪可以打1千米远的时候,或者可以打100米远的时候,拿到一支99米长的枪出来,你会觉得这件事情非常非常可笑。但是,99米长的枪也解决了问题,而且为未来创造打1千米长的枪指明了方向。说“OK,你照着这个方向去做是可以来实现的”,而且也为未来可以造出打1千米远的枪提供了资金支持。这就是工程师要干的事情。

所以,现在的脑机接口应该还是这支99米长的枪。我们看着会很可笑,但这就是未来,而且这就是工程师可以解决的未来。马斯克就是一个很伟大的工程师。那么,从第一个使用者的情况上看,他叫诺兰·阿伯,29岁的时候因为游泳事故导致颈部以下完全瘫痪。每天,他现在可以使用10到12个小时的植物设备,这实际上是一个很好的消息,对吧?因为我们去用苹果的Vision Pro,你可能用个十几二十分钟就会开始头晕,有些人可能用5分钟就头晕了。就算你一点都不头晕,使用一两个小时以后也是会有这种不适的感觉,就是你不可以长期用这个东西。

而脑机接口第一个使用者就每天可以用10到12个小时,这是个非常好的消息。现在,他已经可以用脑机接口控制鼠标移动,可以去打游戏了。但是,我估计他打这种《艾尔登法环》应该够呛,因为每秒输出的字节数太少,所以他的鼠标应该也跑不快。而且,还可以处理多任务,这也是一个非常令人兴奋的结果。

他可以一边用电脑,一边吃东西。这代表什么意思呢?代表是脑机接口可以区别不同的指令,加入到不同的指令序列里边去。啊,我先命令你,这个电脑的鼠标往哪边动一下,再命令我的杯子往前走一走,或者是哪个吸管应该怎么动。那么,我可以一边吃东西,一边去玩电脑,而不是说两边的指令会混在一起。这个也算是很令人兴奋。

未来的发展方向是什么呢?第一个就是还是做更多的案例嘛,因为现在排队的人足够多,就是申请要去做这个脑机接口的人非常非常多。他的机器人是做脑力接口的,机器人也做了好几台了。马斯克的钱啊,也是有的,世界首富嘛。而且现在这个Neuralink公司已经估值50亿美金了,那么手里边现金也足够多。在这样的情况下,只要FDA允许,他就可以七差咔嚓做下去。计划呢,今年能够做到10例,未来几年可能呈几何级数上升。这一两个月吧,就开始准备要做第二例了。

下一个要做的是什么呢?叫做盲视(blind sight)。做盲视的意义在哪呢?前面我们讲了,现在的脑机接口只能是读,不能往里写东西。那盲视呢,就是要往里写东西了,要告诉失明的人说这个地方是什么,这里是有个方的,有个圆的,是个什么颜色的,要给失明的人直接把信号放到他的视觉区域里边去,啊,视觉神经。因为很多失明,其实不是视觉神经有问题,或者不是脑部接受视觉信号的部分有问题,而是他可能啊,视网膜或者眼睛有问题。所以在这样的情况下,他们就可以去做盲视这样的一个产品。

当然了,他一开始可能输入的效率会比较低。所以呢,早期这种盲视的产品,它的分辨率应该也不会太高。不是说我们直接把脑机接口插上,就可以看高清大片的程度。你可能最开始是看着模模糊糊的黑白片,然后慢慢的再变得清晰起来。当读写无碍,带宽如果再拓展一些,再加上AI的话,那人就要成神了。人类成神之路自此开始。

如果现在第一位测试者的电极都在的话,那么每秒钟读十几个比特出来,就已经是速度其实不慢了。计划呢在未来几年里头,把速度提高,可以达到每秒钟100,甚至是上千个比特。这个速度其实就已经超越了人类说话的速度,甚至超越了可能打字的速度。在五年以后,要达到1兆每秒,也就是100万个比特,每一秒钟这个速度的话,已经远远的超出了人类现在能够输出信息的速度。

再加上什么呢?我们现在是看不到什么红外线、紫外线,也听不到超声波。但是这些东西呢,都是可以通过仪器采集的。那么采集了以后,把这些东西直接通过脑袋接口写到我们脑子里去,那千里眼、顺风耳、透视眼,什么不都有了吗?都不是问题。

所以现在我们需要思考一个新的问题:是什么语言到底是不是思想?这个呢,争议其实自古以来都有。但是最新的结论,应该语言并不是思想,因为很多从小就不会讲话的人,依然是有思想的。甚至思想有时候的速度是超越语言的。而我们在跟别人沟通交流、学习和思考的过程中呢,我们的思考速度完全是被语言所限制。我没法以超越语言的速度。

去进行内容的输入,输出是特别是输出输入的话。因为我们是有视觉、听觉,还有各种的无感触觉,甚至还有第六感,所以我们是可以以超越语言的速度输入的。但是,我们完全无法以超越语言的速度输出。当人类终于可以超越语言的速度的时候,我们也可以超越我们本身的感知范围,包括原来红外、紫外、超声我都看不见、听不见,很多其他的什么第六感、什么心灵感应我们也都没有。

现在好了,我们通通都可以依靠脑机接口,再加上外面还有AI,还有所有的知识库,那么人类就已经成神了。到这样的程度,现在有人问我说:“红楼梦啊,第几章第几节,第多少个字是多少?”对吧,我只需要下指令说:“来,给我检索一下,然后把它写到我的脑子里。”我就直接可以答了。这是一个多么有趣的事情,再也不需要背书了。真正可能取代手机的技术也正在向我们走来。

对吧,很多人在期待VR、AR可以取代手机,但是目前为止,这个趋势依然不明显。最大的问题是,它戴上以后没有办法出门,不能长时间佩戴。而现在这个脑机接口,第一位测试者就已经可以一天10-12小时的长时间使用了。所以,这个脑机接口是有可能真的取代手机的。马斯克呢,已经算是为行业指明了方向,资本的指挥棒已经开始转动了,我们马上要迎来科技大爆炸了。

三体的黑暗森林法则,大家知道是怎么来的吗?形成黑暗森林有三个原因。第一个原因是物质总量保持不变,也就是说大家都在发展,总有不够分的一天。

第二个呢,是猜疑链而导致黑暗森林的。第三个原因就是技术爆炸啊。为什么说呢?我看见旁边有一个很小的文明,刚处于萌芽状态,我们是不是先不用管它?但是,因为你到那里的时间可能需要几千年、几万年。那么在这样的一个情况下,你可能等到那的时候,发现对面的文明已经技术大爆炸了。你这个没法再去把它灭掉,而是人家直接上来把你灭掉了。

那么在这样的情况下,我们就黑暗森林一下,看到任何地方有声音,二话不说先抬枪就打。我们即将迎来脑机接口的科技大爆发了,而这个是真正的成神之路。这就像是互联网、移动互联网或者AIGC一样,资本导向的科技大爆发正在向我们走来。

好,这一期就跟大家讲到这里。感谢大家收听,请帮忙点赞、点小铃铛,参加Disco讨论群。也欢迎有兴趣、有能力的朋友加入我们的付费频道。再见。

 

Both comments and pings are currently closed.

Comments are closed.

Close Bitnami banner
Bitnami