代码无法编译、数据完全隐藏,这一波操作到底是不是“假开源”?拆解Grok架构的虚与实,虽然无法直接复刻竞品,但给国内大厂指明了进化新方向|X 马斯克 推荐算法 假开源 算法细节 分析

代码无法编译、数据完全隐藏,这一波操作到底是不是“假开源”?拆解Grok架构的虚与实,虽然无法直接复刻竞品,但给国内大厂指明了进化新方向|X 马斯克 推荐算法 假开源 算法细节 分析已关闭评论

马斯克实现诺言,开源了X的推荐算法,这次总是真的了吧?

大家好,欢迎收听老范讲故事的YouTube频道。老范原来总批评马斯克假开源,这次应该是真的了吧?

1月10号,马斯克发帖说7天之内开源X的推荐算法;1月20日,也就是10天之后,确实开源了。马斯克事确实给你干了,但是时间大家就不要计较了,稍微晚几天并不那么重要。

老范以前为什么总说马斯克是假开源?

2023年,他开源了X的推荐算法,但是仅开源了部分的非核心代码。而且开源了以后就往这一扔,再也不理你了,也没有后续版本,也没有各种的讨论。你问他一些什么问题,他也不理你,所以我说这是个假开源。

2024年3月17号又宣布开源GROK1,3月19号确实开源了,开源了权重和加载的代码。但是这个模型非常的笨重,基本上没有任何的实用价值。当然了,还有马斯克一贯的作风:不回答任何问题,也没有后续更新。就是代码开源了,这个事也就算办完了,社区里头的各种issue、pull request基本不看,也不会有任何后续更新。最新的版本不开源,你像GROK1开源了,后边的版本基本上就不理你了。无法验证开源出来的东西和生产环境是不是有关联,这就是马斯克开源的一些特点。

这次其实也差不太多,X推荐算法也只是开源了一部分。最核心的东西叫Grok Transformer,这个东西并没有开源。整个的推荐算法建立在一个Transformer的模型上了,你没有把那个Transformer模型拿出来,你只围绕Transformer模型外围的一些东西给大家看了看,开源了这样的一些东西出来。而且你要做推荐,你一定要有一开始的信息筛选的机制。信息怎么筛选?过滤的这些参数以及最后排序的权重,这些东西通通都没有公开。所以这一次开源的东西,按照传统意义的开源来说,是个假开源。

这次到底放了些什么东西出来?

首先是一个非常非常革命性的东西,就是单一Transformer模型的推荐算法。这个很像SpaceX猎鹰火箭底下那个猛禽发动机。最早的猛禽一代好多好多管子,非常多的零碎,200万美金一台;后来更新到猛禽二代,比猛禽一代就要简洁很多了,外边支棱八翘的管子就少很多了,100万美金一台;最近发布的猛禽三代极其简洁,完全一体化设计,高度集成。它这个发动机外面基本上没有外边的管子,外边的这些零碎全都没了,这个机器25万美金一台,非常非常便宜。这一次它把推荐算法也做了一模一样的调整。

我用单一模型。以前的推荐算法都是好多好多模型一起配合来干活的,每一个模型是关注一个参数,大家去发现各种的数据特征,然后设置新的参数,把这个参数想办法调好,原来是这样来配合干活的。现在说别费劲了,统一上一个Transformer模型完事了。

这个模型是基于GROK1的一个MOE的模型,应该参数不大,但是具体有多少参数他也没说,怎么训练的也没说,训练数据也没给。就是这样的一个模型,因为它需要高频的高效的工作——你看每一次你去刷新X平台的时候,它都需要让每一个帖子跟你的个人人设在这里头过一遍,所以它的效率一定是很高的,模型一定不会特别大。

高薪调参工程师的危机

那些高薪调参的人,工作估计要不保了。什么意思?以前很多号称是AI工程师、年薪百万甚至是几百万的,这些AI工程师他们最主要的工作就是调参数:拿大量的用户数据回来,去里头发现一些特征,然后把这些特征放到模型里边去,再调整相应的一些参数。所以我们管这帮人叫“调参数的”。未来的趋势是不再设置一大堆的参数,而是统一扔给Transformer模型,直接出结果。那么他们这些人的工作就有点危险了。

这个过程很像什么?就是从一大堆摄像头、激光雷达、超声波雷达、一大堆模型配合一起工作的自动驾驶操作系统,转向纯视觉的、端到端模型驱动的自动驾驶系统,就是做了这样的一个转换。那为什么要做这种转换?就是当有一大堆阀门的时候,你总是很难调出最优解来。你比如说我把这个参数调好了以后,那个参数可能就下降了,怎么能够让所有的参数平衡起来,达到一个最好的结果?这个时候我们上统一的Transformer模型,上端到端的这种训练,它就有可能得到这样的一个最优结果,而不是说摁起葫芦浮起瓢。

X推荐算法的具体工作流程

具体这个东西是怎么工作的?他先把我们能够看到的帖子分成两类:一类是关注帖,一类是非关注帖。关注帖就是这个人是我关注的,他在这段时间里头发了一个帖子,这叫关注帖;非关注帖就是完全靠推荐算法推上来的,这个人我虽然没关注他,但是推荐算法认为我应该看到。再把这一部分帖子拎出来,关键的一定是非关注帖这部分。首先对人和每一个帖子进行匹配,寻找高质量、低投诉、高互动的帖子推给我们;而找到这些帖子以后,再对帖子进行排序,然后跟我们的关注帖混合在一起进行展示。说白了就是这样的一个过程。

那再详细的说一些吧,那后边这块可能要稍微的麻烦一点。

第一步:对人生成画像

就是他把我的过去多少天的行为动作,包括停留在每一个帖子上停留了多长时间、有没有点赞、有没有评论、有没有转发、有没有去投诉,把这些数据拎起来。但是具体是多长时间给隐藏了,这部分是不告诉你的。

第二步:对内容进行初筛

你不可能说把X上所有帖子都拿来跑一遍,那个效率实在太低了,所以首先要先筛一批。到底筛出多少条来还没告诉你,这个是隐藏的。它有一个过滤器对这些内容进行筛选,第一个原则就是去重,如果发现两条帖子是重复的或者内容很相近,他会把它去掉一个。然后去掉自己发的帖子,去掉屏蔽的作者,去掉敏感的违规的内容。按照时序排序,取前面的多少条,但是具体多少条不告诉你。如果是相同的作者,你反复的发也会进行过滤,所以不要刷屏。比如你连续的发了好多内容,X会把后边的这些内容都给你降权掉。所有看过的帖子就不再重复出现了。

第三步:互动可能性计算

所以第一步是这个人的画像,第二步是初筛这些帖子。筛出这些帖子以后,就把这个Transformer模型拎出来了,进行互动可能性的计算。他要算一下这个帖子如果给你看,到底有多大的可能性会被点赞、多大的可能性会被回复、多大的可能性会被投诉,他要把这些东西放出来。一共是15项。因为大模型没有开放出来,所以这一步是无法复现的。

第四步:对权重进行整合

前面我们说有多少可能性点赞、多少可能性投诉,我15项拎回来以后干嘛?做一个加权的整合。这个乘一个参数,加上那个乘一个参数,把这15个数加一块。加完了以后进行一个排序。那你说这参数都是什么?也没告诉你。这部分告诉你,那绝对机器人会刷死他的。然后把排序好的这些帖子,再跟关注帖混合在一起给我们展示。这就是整个这个系统工作的一个原理。

技术细节与代码分析

这个Grok Transformer到底是一个啥?是一个基于Grok 1模型重新训练的MOE的一个小参数模型。只能做单一任务,就是每一次给他一个用户画像,给他一个帖子,然后他把这些数据做矢量化,然后去做正面和各种负面维度的可能性的概率输出,就干这一件事。没有公开参数,没有训练数据,没有训练方法,大概就是这样的一个系统。

主要代码是用什么语言写的?

  • 一个叫RUST,系统的整个的逻辑基本上是用这个语言写的,它是一种很高效的后台语言;
  • 另外一个就是Python,因为里边有Pytorch、有Tensorflow,就是跑大模型用的。你要调用这些平台的话,你必须要有Python代码在里头。所以基本上代码就是用这两种系统来写的。

那你说这么多代码,那普通人肯定“有看没有懂”,完全没有任何意义。也不要这么讲,虽然它没有给大家很多文档,但是现在有非常非常多的代码分析工具。你比如说你把它扔给Cloud Code,或者扔给Cursor,扔给Open Code,扔给Codex,他们会替你去总结,告诉你说整个系统是怎么样的。然后你可以提各种问题,他会来给你回答,这个代码是写在哪一块的、如何实现的、哪一块隐藏了、哪一块给你了,这个都是会有的。所以普通人也是可以去看这些代码的。

这东西可以复现吗?

既然我们已经拿到了这样的一个开源系统,我是不是可以自己搭一个X,或者看看能不能在X里头怎么去做一个机器人,把X的数据都给它刷回来?就跟美国上委内瑞拉抓马杜罗之前,得先盖一小屋子,把马杜罗的安全屋都盖出来,让人在里头训练,训练完了以后到那啪一把把他拎出来。这事能不能干?能不能复现?

首先说,这个系统本身是无法复现的。你把这个代码down下来以后,你没法编译它,你也没法部署它,因为代码本身并不完整,而且里头还有很多的引用冲突。什么叫引用冲突?就是有些代码并没有写在这个系统里边去,而是说我要引用外边的哪个系统,但是他在不同的代码里引用的版本不一样,而且有的可能干同样的事情引用的是这个,另外的代码可能引用的是另外一个。所以他应该并没有把真正可以执行的一个线上系统直接打包扔上来,因为能够编译执行的这种线上系统是不会出现引用冲突的。

还有就是文档也不是很完整,它里头只是给了代码,并没有给特别多的文档,很多参数被隐藏了。而且也没有办法获得X上的实时数据,因为你要想让这个系统动起来的话,你必须要给它X上的实时数据——这个人过去几天都点了什么东西了,最近有哪些帖子——你没有这些东西,它这个系统也没法跑起来。

那你说是不是开源了个寂寞?也不能这么说。马斯克开源特斯拉的一些专利,对于中国人做新能源产业还是有巨大帮助的。这次将单一Transformer模型驱动的这种推荐算法给出来,也是为整个推荐算法进步给出了方向。所以国内那些原来推荐算法比较差的平台,比如像B站什么的,应该现在正在尝试进行复现。但是这种复现就不是说拿人那个系统去复现了,而是说用这种思想和方向去复现。你比如说拿千问的一些小参数模型,零点几B的这些模型,你可以跑一跑试试,或者是看看能不能做出更小的一些模型出来,进去跑一跑试试,应该是有人去尝试了。

怎么发帖可以提高互动?涨粉怎么赚钱?

别说那么复杂的,怎么发帖可以提高互动?涨粉怎么赚钱?这玩意才是大家关心的。

  • 负面权重极高(拉黑、静音、举报):因为这里头是有正面权重和负面权重,刚才我们说这几个都是负面权重。你一旦这个帖子有负面权重的话,说你被很多人拉黑过、被很多人举报过、有好多人去静音你,这种帖子就会非常非常吃亏。所以那些喜欢引战吵架、喜欢骂街的那些大V们要小心了,原来他们是可以吸引非常非常多流量的,以后的话这种流量会下降的。
  • 连续发帖会被降权:千万不要尝试刷屏,就很多机器人喜欢干这个事,连续的往外发帖子。这个系统也是需要处理机器人的,但是具体一些处理机器人的模块并没有在这一次开放出来,因为你如果敢开放出来的话,那机器人马上就给你照方抓药了,给你表演什么叫道高一尺魔高一丈了。
  • 正面权重:用户停留时长:这个事很重要。什么叫用户停留时长?你像我们刷X的时候,如果你看到某一个帖子,你需要停下来,你并不用点进去,你还要停下来,你要认真看这个帖子到底写了什么。在这样的情况下,X就知道了,这个是一个大家喜欢、要停下来看的东西。很多长帖子,故事叙述性比较强的——但是你说我啪写一大块,这事也不行,你还是要写出条目来,可读性比较高。这样的帖子才容易让人留下来。前头写一很好的钩子,这样容易留下来;然后放出视频、放出图片来,这样容易留下来;然后做一些系列的讨论,这样也容易留下来。这样的帖子才是X所希望的。

为什么是这样?因为这种帖子可以让X展示更多的广告,人家这个平台也是要挣钱的。

  • 视频帖子非常赚便宜:但是他这很逗,他的视频主要看点不点开,不管你是不是看完了。像TikTok、像YouTube,他们主要考察的是完播率,因为那些平台是要在视频前后的去给你插广告的。而现在X的逻辑是什么?就是你点进去了,你就可以展示这个帖子的一个详情页,它就可以多给你放一堆广告出来,所以你只要点进去就行了,你是不是把它看完无所谓。
  • 回复评论也是非常重要的:如果我发了个帖子,你们给我评论了,那我一定要在下头再给你回回去。为什么?就是一旦进入评论页了,你相当于也是进入一个帖子的详情页了,那么X展示广告的机会又上升了。所以你看,所有的X所愿意推荐的这个帖子,都是能够让他多放几条广告的帖子。
  • 尽量不要在里头贴链接:马斯克真的是想做微信了,他不希望你用链接把流量从X引走。这个点对于老范来说不是特别有利,因为老范经常发帖子说:“你看我发视频了,大家去看视频;我发博客了,大家去看博客呀。”这个是X不喜欢的。

规则之下的现状

既然有这些规则了,谁跑得最快?一定是坏人跑得最快,好人一般是要慢一些的。原因很简单,坏人是有利益的嘛。大家还记得前几天那些@Grok脱衣服的帖子吗?是不是完全符合这套标准?我发了一个美女照片在上头,在下头写@Grok,给她把衣服脱了,或者给她穿上比基尼。这种时候大家就会点到这个回复里边去看,点到详情页里边去看,你的点击率一下就上去了。这个应该算是马斯克自己家的,人家说自己利用一下规则没毛病。

最近大量的抖音和TikTok的热门视频被搬运进来了。算法对于视频是有极大的倾斜的,只要你这里头有视频,视频被点进去了,他就会非常努力的给你推荐。所以我现在打开X,基本上跟刷抖音的那个感觉差不多,里头大量的抖音视频。因为这套算法里头是没有任何跟版权保护相关的东西的,他不是说你发的这个视频最后有一个抖音或者最后有一个TikTok的标,他就给你下架了,不会干这事了。他才不管你是从哪来的。大家的玩法在这点其实都差不太多,先热闹起来然后再清理。现在X上短视频少,他又希望短视频,那你们就来;等什么时候我这短视频多了以后,我再收拾你。这个有点像新加坡,先吸引一大堆大陆土豪去移民,然后再反洗钱、关门打狗,这基本上应该是这样的一个套路。

最近有好几个涨粉相关的账号跑来关注我了。什么叫涨粉相关?就是他那个账户的名字叫“涨粉多少多少”,赤裸裸的叫这名字。如果我也去回关他、跟他聊两句、花点钱的话,那我这个X上的粉丝就可以蹭蹭蹭涨,涨一堆机器人出来。我的帖子下面也出现了一堆炒币的人进行回复。这个原来其实比较少见,这一次马斯克开源了这些算法以后,很多这些炒币的人就来回复我的帖子。如果我再回复他的信息的话,他的账号被看到的机会就会上升。所以一般遇到这样的帖子,我就不再去理他了。机器人已经活跃起来了,等着老马进一步更新他的算法了。

马斯克开源的真实目的

这一次老马总算是真的开源了吧?老范是不是被打脸了?这个还要看下个月。为什么这么讲?马斯克宣布每四周更新一次代码。前几次更开源都是扔上去,以后几年都不带动的,彻底就不理你了,算是一个死项目。这一次老马说我每四周更新一次,老马也算开创了一个先河。

以前做开源软件的目的是什么?

  1. 降低系统维护的成本:我把系统开源出去了,你不懂的话,你可以在上头看代码,你也问问其他使用者,大家可以聊一聊,我就不用挨着个去给你们服务去了,甚至有些人可以帮我改bug,这是第一个。
  2. 提供松散协作的机会:我一旦把代码开源出去了,就会有其他人才提这个pull request,让我去修改这个系统,甚至他替我改,他会进行一个跨国家的松散的协作。
  3. 绑架事实标准:因为你开源了,一旦这个系统用的人很多的话,相当于就形成了一个事实标准,我们就绑架这个标准,然后可以在里边挣到钱。

马斯克开源的目的跟他们不太一样,他是提供了一个监管窗口。你看我把这东西开源了,大家以后觉得我的X有什么推荐不对的地方,你自己去看去。我可以开源,让你们去监管,让你们去审核这个东西。你再批评我,你可以去看。其他那些平台还没开放,我都开放了。他搞了这样的一个事情。

关于偏见与监管

很多人都说X是一个很右的社交媒体,因为相比其他的这些社交媒体平台来说,X是要偏右一些的。现在马斯克说:“来,我直接把推荐系统给你开放看看,你现在看看我到底右不右。”为什么大家都觉得这个X偏右,大家是不是冤枉马斯克了?其实没有。原因很简单,左的特征是什么?圣母嘛,道德高地嘛。大部分的社交媒体平台是按照更左的方式来进行内容审核和筛选的。如果是这样的话,内容比较开放的这种X平台,就肯定是靠右的嘛。左右这个事不是绝对的,它是相对的。

这次开放的代码肯定不是传统的开源项目。它无法复现、无法使用,代码跟文档也不是完整的,也基本上不回复社区的issue跟PR。马斯克可以达到通过开源实现监管的目的吗?现在并不能证明开源出来的版本跟实际跑的版本是强相关的。这个东西应该不是实际的版本,也绝对不可能四周才更新一次,各种参数应该是按小时进行调整的。Grok Transformer的这个模型规模也不大,应该可以几天的时间就会重新训练一次。

这次展示的是Transformer模型之外,并没有保留特定类型帖子的加分减分的这种调整的控制面板。就是说,我就是靠这玩意干活了。你如果希望更左一点、更右一点,你可以在Transformer的这个结果基础上,再去加一层的意识形态的这种调整。但是马斯克给大家看说:“你看我没这东西,这个Transformer模型出来的结果我就直接干了,没有任何跟意识形态相关的东西,都是你的互动可能性跟这玩意相关的。得到结果了以后就可以展示了。”

如果以后每个月更新的版本可以坚持,并且带有完整的更新轨迹——什么叫更新轨迹?在这些源代码更新的过程中,是有一个版本一个版本上的,会写着说每个版本更新什么东西,这叫完整的更新轨迹——如果这个都有的话,那么这个监管会更加可信一些。如果无法坚持,或者以后的更新都是一个没有任何更新轨迹的独立版本的话,监管的效果会差一些。但是也总比那些从来都没有公开过的平台要好。以后再有人批评马斯克说“你怎么偏右”,马斯克说:“我都公开过。甭管我是公开过几个版本,但是至少我公开过,你还没公开过。”他就可以这样去批评别人了。

总结

那未来的方向是什么?做推荐算法的成本一下就降下来了。那些年薪几百万的调参的人,要重新想一想是不是去送个外卖、跑个滴滴了。老马为可信可监管的平台推荐系统做了一个打样。

最后总结一下吧。马斯克开源了X的推荐算法,革命性的单一Transformer模型,就像是一体化的猛禽3发动机一样那么震撼。马斯克为可信可监督的平台推荐系统指明了最新的方向。以后谁想再去证明你的平台推荐系统是可信的,来,跟我一样开放。他就做了这样的一个事情。

好,这一期就讲到这里,感谢大家收听。请帮忙点赞点小铃铛,参加DISCORD讨论群,也欢迎有兴趣、有能力的朋友加入我们的付费频道。再见。


背景图片

Prompt:Detailed watercolor rendering of a loft open-plan office interior, no people, neon cyan rim light, deep navy backdrop, cinematic lighting, sharp subject separation, minimal palette (ink blue, neon cyan, gold accents), glossy reflections on glass and polished concrete, intricate textures of wood, metal, and glass, wide-angle 28mm, deep depth of field, strong negative space for text –ar 16:9 –v 7.0 –stylize 120 –chaos 4 –no people, faces, text, watermark, signature, clutter, photorealistic, 3D render, blurry, low contrast –p lh4so59

Comments are closed.