
程序员的天真的塌了吗?马斯克说AI编程也要玩端到端了,直接生成优化过的二进制代码。
大家好,欢迎收听老范讲故事的YouTube频道。
马斯克说了,今年年底就不用再写程序了,AI会直接生成最优的二进制代码。我最害怕的事情还是发生了。两年前我就担心这件事,说AI编程一旦玩起端到端来,那人类就彻底没有什么事情了。虽然现在编程我们也不需要去看代码了,或者说通常不太需要去看代码,但是那个代码还是可以读的。代码我们还是可以进去看看到底有什么问题的,但一旦变成端到端了,就变成0101了,这玩意你就彻底没法看了。
很多不懂编程的人都很嗨,他们以为程序都是通过二进制代码在跑的,其实压根不是这么回事。还好这是马斯克说的,他说的东西未必什么时候能够实现,但是让我担心的是,马斯克说的东西很多还真的实现了。
今天这个故事分三段来讲:
- 第一段,马斯克在什么样的会上说的这个事?在 xAI All-Hands大会上说的这个事情。
- 第二个,编程真的会变成端到端吗?在这个过程中到底有哪些难点需要克服?
- 第三个,xAI还会剩下4个部门,他们未来会向什么方向走?
xAI All-Hands大会:公开的“闭门会议”与正视听

首先咱们先讲一点,xAI All-Hands大会(所有的手都在),这个是一次被公开的闭门会议。本来应该是大家关起门来开,1000多人塞在一个屋里开会,有全程录像。但是2月11号开完了以后,40多分钟的视频就全都放出来了,所以这个会其实是开给公众看的。为什么开这样的一个会?xAI最近有大批的员工离职了,必须要以正视听,否则的话会全面崩盘的。一堆人离职了以后,剩下的人就会人心惶惶:你这事还干不干?是不是没得干了?
在大厂里头,虽然有一些人走了,那剩下的人还得接着干。
“皇上永远正确,离开了都是坏人。”
他都是这样的一个思路,要去把这个事情以正视听。而且马斯克也讲了,说他们并不是离职了,他们实际上相当于被裁员了。他讲了这样的一个话,他还讲说我们现在很年轻,xAI成立到现在只有两年半的时间。在这两年半的时间里头,他从一个只有几十人的小团队,每天都可以凑在一起聊天、凑在一起来商量事情,涨到了1000多人的一个状态,很多人就适应不了了。
这个生物也是这样进化过来的呀,从单细胞、多细胞慢慢到变成人。在这个过程中,有些器官可能进化进化就没了,比如说尾巴。这个尾巴原来有一段时间是有的,即使你从胚胎到人的过程中,有一段时间也是有尾巴的,但是最后生出来的时候是没有尾巴的。他讲了这样的一个话,那意思就是离开这帮人就是尾巴,他们就不需要了。

其实很多大厂都经历了类似的事情,也都展开过类似的活动。比如当年傅盛离开360的时候,周鸿祎其实也开过这种会,他们叫“批斗大会”,意思就是走的人都是坏人,咱们剩下留下来的人才是好人,而且要统一思想认识,日子还要继续过下去,而且还要越过越好。这就是他们真正要开这个会的原因。
实际上这个会开的过程,应该去讲他们为什么不适应?有什么问题?这个没讲。然后也应该去讲他们走了以后,我们现在新的组织架构变成什么样了?这1000多人的公司,现在跟SpaceX合并了有1万多人的公司,这个组织架构是什么样的?他也没讲。
马斯克的风格是什么?上来吹了一堆牛皮,说我们要做程序端到端,还讲了一些其他的牛皮,待会咱们再说。把这些牛皮都吹完了以后就完事了,这最后告诉大家说xAI以后分成四个部门,大家接着干活。具体他整个的内部的管理制度、流程什么到底什么样,他也没说。
编程真的会变成端到端吗?

在这样的一个会上,他就提出了程序会变成端到端的。那么编程真的会向这个方向走吗?程序到底是不是通过二进制的方式在电脑上运行的?有一部分是,但很多程序都不是通过二进制的方式在电脑上运行的。程序运行其实一共有三种方式:
1. 二进制形式运行
像我们的操作系统、浏览器、数据库,包括这些3A大作的游戏,这个都是二进制去运行的。为什么?因为它要求效率极高。二进制运行的时候,它是直接在机器上运行的。我们的电脑其实分很多层:最底下这层是机器是硬件,中间是操作系统,再往上是各种的架构和框架,再往上才是这些程序。你一旦通过二进制运行的话,它就是在最底层去运行,直接在这个CPU上、在GPU上跑。
二进制运行它的优点是什么?就是快,非常非常的快。但是缺点也是很明显的,就是兼容性是没有的。举一个很简单的案例,我们现在想给苹果装一个应用(macOS MacBook),想给它装一个应用的时候,它会问你:你是要给英特尔的CPU的苹果装,还是要给Arm CPU的苹果来装(或者叫M系列芯片的苹果来装)?为什么?你为英特尔CPU去编译的那个二进制代码,在那个Arm芯片上是跑不起来的,反过来也是如此。因为你直接在CPU上跑嘛,完全在硬件上跑的,他就没有办法在兼容性上做任何的妥协。
2. 虚拟机运行
虚拟机运行就是要解决兼容性的问题。我们一个代码写完了以后,它也编译,这个东西编译了以后会变成一种中间执行代码,然后在一个叫Runtime(运行时)的程序上跑。这个程序是去适应各种不同的硬件的。这样我可以保证我写一遍代码了以后,在这种Runtime上跑,我就同时可以在安卓手机、在苹果手机、在Windows电脑、在Linux电脑、在Arm芯片上,在各种各样的芯片都可以跑。因为最后你这个芯片长什么样,有多少寄存器、有多少这个指令、有多少内存,它都是由这个Runtime来去适应的。
3. 解释执行
什么东西是解释执行?一般网页上的东西都是解释执行,Python它基本上也都是解释执行的。这个东西是不编译的,就是有一个解释器,你需要执行的时候说“来,这是我的源代码”,那这个解释器把这个源代码拎出来以后,直接就看第一行写什么、第二行写什么、然后跳转到什么地方去,就直接开始去解释了。
这个执行方式有什么好处?就是你开发的过程很爽,我随时改点什么东西,刷新一下页面就可以看到结果了,它没有中间编译的这个过程,这个就会变得非常非常开心。
为什么程序不能都按二进制的方式跑?
刚才我们讲了,兼容性的问题是很难解决的。比如Linux系统就有很多的问题,这个Linux系统里头我们要去装一些新的软件,或者装一些新的程序的时候,他是怎么来装的?首先先把源代码弄回来,在本机去编译,然后得到一个最终可以执行的二进制代码,它是这样来跑的。
为什么要在本机编译,而不是说直接把编译好的程序给你?这个原因也很简单,他这个源代码给你的时候,他不知道你这个机器是什么样的配置,你到底有几个CPU?这CPU有多少个核?里头有哪些寄存器?有多大内存?多大硬盘?你到底是什么网卡?他都不知道。只有是编译的过程中,我们来去确定说你这个机器到底是什么样的情况,然后我们现场去给你编译出来它能够跑。处理起来就很麻烦。
如果AI直接出二进制代码,像马斯克说的这样,而且是最优的二进制代码,那真正需要跨越的东西是什么?这个东西叫编译器。就是我们从写好的甭管是C语言程序还是Java程序,你就需要去编译它。那编译分几步?
- 语法检查及拼接: 检查语法是否正确,如果写错了就报错;将引用的代码拼接在一起。
- 优化(核心过程): 比如循环100次的代码,如果有一部分是不变的,编译器会把它提取到循环外,减少执行次数。
- 汇编和打包: 将变量名变成内存地址。
- 计算机执行时,不能直接在内存里加,要先把内存数据提取到寄存器。
- 执行CPU指令(Intel和Arm指令不同)进行运算。
- 将结果存回内存地址。
- Link(链接)与Package: 将所有相关东西捆绑成一个完整文件包。

那你说马斯克他就能把这事搞定吗?他自己有CPU吗?它其实也有,它的CPU应该是三星给它做的Arm CPU。对于特斯拉汽车、擎天柱机器人和星舰的这种计算服务器来说,这个事还真是可以用。因为它已经不需要考虑兼容性的问题了,我就在特斯拉汽车上跑,我就在这个机器人上跑,我就需要最极致的效率,其他的兼容性的问题我不考虑了。他确实可以干这个活。
那他这个事情其实有点像什么?有点像特斯拉汽车一体压铸成型这过程。好处是组件制作成本低、效率高;坏处是没法修,坏了整个换掉。特斯拉汽车为什么保险费贵?就是你没办法去对它某一个小的零部件把它拆下来去处理,它都给你一把都给你搞完了。
直接出二进制代码也是如此,他也不需要考虑兼容性了,我就在特斯拉汽车、我就在擎天柱机器人里跑,你换其他地方这程序也没用,就这样的一个情况。而这些程序对于更复杂的运行环境来说,是基本上不可能跑起来的。你比如说特斯拉一直想让别人用他的FSD,除了贾跃亭之外没人理他。原因也很简单,就是他这套系统你如果想用,你就必须整个全换上他的,变成一个大黑盒子。
端到端以后的代码生成流程
那么端到端以后,代码会变成什么样的?
- 写出需求并检查: 必须检查需求逻辑是否自洽,是否有危险动作。
- 在目标环境直接生成: 如果无法在实体机器人里编译,就在xAI云端的虚拟环境中编译。
- 目标环境测试: 必须在原来的环境里测试,因为换个版本可能都跑不起来。
以目前的硬件和操作系统架构的话,那走到这一步还是有一定的距离的。我觉得就是很特殊的这种机器人,这个可能需要,其他的还是路要更遥远一些。
xAI剩下的四个部门是干嘛的?

最后咱们再说一下,xAI剩下四个部门是干嘛的?人家这个All-Hands大会除了吹牛之外,还得讲一下说我们以后怎么往前走嘛。这个端到端编程之外,还有哪些牛皮被吹了?就是在月球上建立算力卫星工厂。算力卫星直接别在地球上造了,我们在月球上造,造完了以后在月球上通过大质量的电磁投送器向这个地球上边去扔。这个事是不是可行?可行性还是很高的。
然后他还讲了剩下的人要好好干活了,他分四块:
1. Grok加语音
这个应该会更多的跟X平台进行结合,后边比如出X Money,出X Chat,应该都在这一块了。
2. 编程
说我们在两到三个月之内就会生成这个世界上最强的编程模型。当然这个肯定还不是端到端的,应该还是在继续追赶Claude 4.5 Opus或者Claude 4.6 Opus。既然中国能够做出Kimi 2.5、GRM 5和Minimax M2.5这样的模型出来,Grok应该也可以做到,这事并没有那么难。至于到2026年年底能不能实现端到端这个事,我个人表示怀疑。
3. 图形和视频生成
既然现在Seedance让马斯克都震惊了,说我们也要干,那这也得吹。说我们要实时生成视频。现在Seedance你要想生成一个视频,就算不排队,一个15秒的视频你也得等个五六分钟。马斯克说不用,我们有的是卡,我们准备上实时的。你这边说需求进去,那边马上就出来。
4. “巨硬公司”(Macrohard)
这个是为了应对微软起的一个名字。这个项目是干嘛的?是通过视觉的方式操作现有设备的。比如说我这有一台Windows电脑、macOS电脑,或者安卓设备,它通过一个摄像头来看这个设备,在里边去点点点、确认确认,把各种的事情都完成。要干这样的一个项目出来。但是这个我觉得路还很长,因为复杂的运行环境下,错误排除非常困难。

总结

马斯克的端到端编程就像他的端到端辅助驾驶,或者是他的一体压铸成型这个过程是一样的。在他自己的环境下确实是可以实现的,但是你一旦要考虑到大家的协作以及兼容性的问题,这个就很难搞定了。
xAI经历了大规模的离职之后,马斯克亲自开了定调会。走了的已经走了,都是他们不好,留下来的还要把日子过下去,而且还要越过越好。饼画了,上市也不远了,现金也在路上了,最大的一个稳定人心的点就在这,就是今年他要上市。一旦他要传出来说“我们今年上不了市了”,那他现在这个盘子可能马上就崩了。
留下的人都说我手里还有股票,今年就能上市,我马上就可以变百万富翁、千万富翁了,他们肯定还是愿意再忍一忍的。即使走了的这些人,马斯克把话说的很难听了,说你们就是尾巴,你们被淘汰掉了,他们也不希望手里的股票变废纸嘛,所以他们也不会站出来反驳马斯克的。
马斯克吹的牛也还是值得期待一下的吧,我们至少可以看一看说他到底什么时候能实现,或者到底实现了其中的哪一部分,或者是通过一种什么样的形式来实现。
好,这就是今天我们讲的故事。感谢大家收听,请帮忙点赞、点小铃铛,参加DISCORD讨论群,也欢迎有兴趣有能力的朋友加入我们的付费频道。再见。
背景图片
Prompt:in the style of Hayao Miyazaki, Studio Ghibli, hand-drawn manga storyboard aesthetic, watercolor gouache textures, delicate ink linework, Silicon Valley xAI open-plan AI company office floor, half of the workstations abandoned with empty chairs and dark monitors, crumpled papers and discarded printouts scattered across desks and floor, quiet post-boom atmosphere, 24mm wide establishing shot, eye-level, environmental framing, center negative space reserved for presenter, no dominant hero subject, balanced depth layers, spacious composition, soft directional window light, subtle rim light, muted teal and warm beige with dusty gray accents, rich environmental storytelling details, –no central hero character, spotless office, crowded foreground people, logo-heavy branding, watermark, text overlay –ar 16:9 –stylize 220 –chaos 10 –v 7.0 –p lh4so59



