MOE架构 - 老范讲故事｜AI、大模型与商业世界的故事

深度揭秘Grok-2开源：马斯克藏不住的“中国芯”？SGLANG与Deepseek的秘密关系。

2025-08-27 作者 Luke Fan

马斯克终于开源了他的Grok-2。虽迟但到，这背后隐藏着哪些不为人知的秘密呢？

马斯克最终还是开源了他的Grok-2。原来我们还嘲笑过他，Grok-1开源完了，往那一扔就再也不管它了，有任何人提问题，你也不说什么。Grok 4都出来了，现在Grok 2都没开源出来。马斯克说：“那我们下周开源。”当时是这么讲的。然而下周完了以后，好像还是又等了那么一段时间，稍微晚了这么几天吧，Grok 2最终还是开源出来了。而且承诺呢，6个月之内，或者说在年底之前吧，有可能会去开源Grok 3。但是马斯克的话嘛，大家相信，就是他说了的事会做，但是未必按时间做。

马斯克的开源呢，只能算是符合非常广义的开源。这话什么意思呢？开源也是分原教旨主义者的，他们是肯定不会认可马斯克在开源的。第一个，马斯克不是当时发布产品马上开源，而是要过一段时间，甚至是过了一年多才去开源。而且现在他开源出来的这个版本，远远落后于当前主流模型。当然Grok 2呢也不算特别落后，它在当时刚推出的时候，应该是跟GPT-4不相上下的一个水平，但是跟后边4O，以及后边O1、O2这些东西就没法比了。跟当前的主流模型，像什么GPT-5、Grok-4、Claude 4或者是Gemini 2.5这些，它是比不过的。

Llama 4悄然发布震撼不足？对比DeepSeek与千问，Meta的MOE架构和千万级上下文能否挽回开源领导地位，避免被超级APP浪潮抛弃？

2025-04-102025-04-07 作者 Luke Fan

Llama4发布了。这里的黎明静悄悄，没有什么响动。这是怎么回事？

大家好，欢迎收听老范讲故事的YouTube频道。一觉醒来，Llama4就发布了。扎克伯格亲自在Facebook的REELS（也就是Facebook的短视频里面）发了一条视频，说Llama4发布了，今天是Llama4日。

Llama4呢，一共是有三个版本：
第一个叫Scout（侦察兵版本），总参数1,090亿（也就是109B），活跃参数是170亿，包含16个专家模块。对的，Llama终于也放弃抵抗了，从Llama4开始变成Moe了。在Llama4之前的版本都是单一体的模型，Llama3.3还给了一个400多B的单一模型，到Llama4彻底放弃抵抗了。

现在呢，支持1,000万TOKEN这种上下文，这个是Llama4最大的一个特点。DeepSeek是64K（也就是64,000个TOKEN上下文），现在上下文比较大的Gemini大概是能到2兆（200万），Llama4直接给了一个10兆（1,000万TOKEN），这是它做的一个很创新的点。

马斯克Grok-2登场，可订阅才8美元，真的划算吗？推翻AI市场的游戏规则，Elon Musk的肖像被拿来玩儿梗图！

2024-08-20 作者 Luke Fan

Grok 2出来了，老板马斯克就是拿来开涮。马斯克各种梗图突然开始满天飞了，这是什么东西呢？就是XAI做的Grok大模型的第二版，Grok 2发布了，包括特朗普跟贺锦利的各种梗图也在飞了。其中有一张是特朗普去抚摸贺锦利怀孕的肚子呀。但其实玩的呢，并不是Grok 2，而是什么叫Flux 1。

首先分析下时间点，为什么在这个时间要去出Grok 2呢？第一个，3月份我开始测试了，Grok 2已经开始测试了，测试到8月份呢，也差不多开始出了。而且3月份，Grok一开源了，然而开源之后就再也没有更新过任何的代码，也没有去回答过任何的issues或者是Pull request，这个都再也没有动过，完全死水一潭。马斯克的开源就是这么开的，我开了，用不用是你的事，我反正不理你，我也不会再更新任何代码。

包括推特，原来开源的推荐算法，包括Grok 1都是这样的，开了就挂在这了，爱使不使。而且它开出来以后，你自己到底能不能部署得上去，能不能把他们这个用起来去测试，他就完全不管了。你提任何问题，他也不理你啊，这就是马斯克开源。