腾讯AI – 老范讲故事｜AI、大模型与商业世界的故事

腾讯元宝派深度解析：10亿红包能否救活AI社交？

Luke Fan — Sun, 01 Feb 2026 00:44:02 +0000

腾讯想要押上春节10亿红包，以及积累了多年的社交关系链，在AI领域背水一战，期待弯道超车。但是，决胜点真的在前面咱们说的这些东西上吗？

每次提到腾讯的时候，甭管你说它是“狗日的腾讯”，还是什么样的腾讯，咱们都会想到一些场景。第一个场景是什么？马化腾去接受各种访谈、去参加各种圆桌。每次被问到说：“你跟百度比有什么优势？人家一边是做搜索的，一边是做电商的，你都没做起来；你跟小米比你有什么优势？人家做硬件做的很好，你也没做起来。”马化腾每一次的回复都一样：

“我有10亿用户。”

每次都回复这句。

有10亿用户的超级APP，在中国其实不止微信一个，还是有好几个的。但是只有微信上的用户或者是QQ上的用户，是有社交关系链的。这个上面有好友、有群、有各种的关系，这个才是真正最重要的。其他的你比如像抖音，也有10亿用户，但是抖音这个用户都是独立的。我去看抖音看什么东西，跟你去看抖音看什么东西，他没有那么大关系。一旦说大家没有关系了，没有社交关系链在里边，那这个用户的粘性就会下降。你只有带着社交关系链的用户，才是粘性最高的用户。腾讯在中国最底层的价值就在这儿。

腾讯另外一个特别神奇的东西是什么？跟大家讲一故事吧。大概在11年前，当时是去参加金山集团的年会，求伯君、雷军在上面讲话。但是我们在底下就交头接耳，没有认真听讲。在干嘛？都是在加入各种各样的微信群抢红包。11年前春节前后在开年会的时候，微信红包功能上线了。这一次绝对是腾讯可以去书写到教科书里边的一个案例。

原来移动支付里头只有一家独大，这个人叫支付宝。那是淘宝积攒了多少年，攒下来的支付的能力，没有第二家了。而且当时你要想去做一个移动支付，想要让用户上来，那买一个用户得好几十块钱。为什么那么贵？原因很简单，你先去撒广告让用户进来，但是这里头有一步特别难，就是绑银行卡。绑银行卡的时候，你前面买回来的用户，可能10个里头流失了9个半。最后成功绑定银行卡的一个用户，你合下来那个成本二三十。腾讯自己没花钱，获得了支付用户，绑银行卡都是我们自己愿意绑的。里边那些钱、发红包的钱是我们的钱，他腾讯没花。这个绝对是神奇的案例。

腾讯发明了抢红包以后，后边阿里说我一定要奋起直追，然后抢了好多年。腾讯做完抢红包以后，就再也没有去跟央视合作过抢红包。今年跟央视合作抢红包的是谁？是豆包，他给了6亿。腾讯说：

“我虽然没有跟央视的春晚合作上，但是我给10亿。我要把AI这块弯道超车回来，要让大家重新使用腾讯的AI社交关系链。”

10亿红包，在春节这个时间点一把砸进去，说来我们在AI这弯道超车。弯道超车的这个产品叫做“元宝派”，叫这么奇怪的一个名字，因为它的这个APP叫“元宝”嘛。里边开个派对，就是在元宝里头做有AI参与的群聊。不是好几个AI，是很多人加一个AI，在这个派对里头咱们去聊天去。

今天咱们就围绕元宝派讲三件事：

第一个，腾讯怎么把元宝派这样的一个产品推到台面上来的；
第二个，元宝派的底层逻辑是什么，AI群聊为什么比你想的要难一些；
第三个，这事到底行不行，在这个赌局里头，到底谁会输谁会赢，如果咱们关心这件事的话，应该盯着哪些指标看。

先讲第一件事，这件事怎么开始的

这个事是在腾讯的年会上，马化腾已经承认了，腾讯的AI上动作慢了。虽然最近在连续的挖大牛回来，但是确实慢了。他们的元宝（就是这APP）以及他们的混元大模型，动作都比别人慢。虽然现在在花很多钱去推广，但是还是不行。为了准备今天的节目，我还专门上去用了一下。我的习惯是准备谁家的节目，我都要用谁家的AI去试一下。上去以后发现，依然是个稀烂，非常非常难使。为什么？因为元宝里边现在的混元模型极其的糟糕。它里头现在默认是使用DeepSeek模型的，比混元模型好很多，但是DeepSeek V3.2的版本跟豆包、跟现在最新的Kimi、Minimax、千问这些模型比起来，还是有挺大差距的。

动作慢了，马化腾说这咱也得追，说我们要去探索“AI加社交”的玩法。现在大家都在跟自己的老本行干仗。你比如说阿里的千问，说：“来，我们把电商场景、把这个购物场景给你打通吧。”那是他的老本行。那腾讯这个元宝，说：“来，咱们去跟社交打通吧，咱们把群聊加进去吧。”大家都把压箱底的宝贝直接压上去了。

然后准备怎么推这东西？就是元宝在春节期间，直接砸10亿红包进去。这个红包不是原来咱们自己发来发去的，而是由腾讯发出来的。而且希望员工现在就开始体验元宝的2.5.5版本。我刚才看了一下，我的版本是2.5.6，但是我那个上面这个元宝派还没有出来，应该是在灰度推送之间。我刚刚上微信里查了一下，大家都在搜索元宝派的这个邀请码。现在可能有些人拿到邀请码已经可以试了，我现在还试不了。

那么元宝派是怎么干活的？就是这个群里头有一个成员叫元宝。什么意思？在元宝这APP里头最底下有一个按钮叫“元宝派”，你点了以后就可以建一个新的派对。建完了以后，你可以生成一个链接，把这个链接到微信和QQ里边去散播去。任何的微信和QQ的用户看到这个链接一点，就进到你这派里来了，就可以在里边聊天去了。

那你说这不就是微信群、QQ群吗？但是你聊的时候，可以@元宝给我干一什么事。你不@他，自己不出来。在这个里头它能干嘛？很简单，比如说：

@元宝，“请把上面那个红羽绒服给我换成绿的羽绒服”；可以说换个衣服、换个风格，或者换个姿势，或者把前面几张照片给我拼个大合影出来。

他就可以干这样的事情，这个还是很有意思的。

当然还可以干嘛？咱们还是参考Grok的用法。有人在里头说了：“你们听说了吗？最近有一什么什么事。”那马上你就可以@元宝：“这个是真的吗？”我在Twitter里边经常干这活，@Grok 请帮我核实一下这事是不是真的。然后就给你全网搜索，回来告诉你说这个事可能是真的、可能是假的，或者半真半假，他会给你一个回复。当然你还可以让他玩玩游戏什么的，说：“我现在有笔钱，请你帮我去发个红包。”这个都是可以玩的。元宝可玩的东西就非常非常多。如果你说我们这一个群里头，咱们就是好好玩游戏行不行？也可以，这不就是有一个主持人，大家可以在里头玩，比如像狼人杀什么这东西都没毛病吧。

其实AI群聊这东西，也不是腾讯第一个想出来的。2025年11月份，ChatGPT先上线了这样的一个功能，并且在11月20日进行了更新，正式的逐步的开放给大家去使用。像他们一开始功能出来了以后，一定是比较小范围能用，现在我也可以用这个功能。但是好像ChatGPT群聊这功能并没有给OpenAI带来巨大的收益和用户量。原因也很简单，ChatGPT虽然有非常多的用户（它现在应该也上10亿了吧），但是它的用户都是单打独斗的，里头是没有社交关系链的。所以ChatGPT搞不定的事情，这个元宝是有可能能够搞定的。在这样的一个情况下，腾讯说：“咱干吧，春节这样的一个关键时间点，咱干吧。”这是咱们讲的第一件事。

第二件事就是，这个元宝的底层逻辑到底是什么样的？AI群聊为什么难做？

AI群聊其实本身不是一个功能，而是什么？而是入口的争夺战。元宝派被设计在元宝的APP里头独立访问，而不是直接塞进微信。这个事是腾讯还没有彻底下决心。如果腾讯彻底下决心的话，这东西就到微信里去了。因为不可能说像当年微信吸收手机QQ的用户那样，把这个微信用户直接导到元宝里，这个事不太现实。一定是什么？要想让这个功能做好，一定应该是把元宝派这功能放到微信里。现在并没有这么干。

入口这一块，现在腾讯应该还在犹豫。而且大家注意，群聊这个东西在中国其实是一个很敏感的事情。这么多人在里头聊天，你说对了说错了，那是要承担责任的。微信群和QQ群的群主都是要承担相应的责任的。像我们现在拉了微信群，特别是拉了人数比较多的微信群的时候，一旦这事结束了，一定要把那群解散了。为什么？万一有人在里头说点不该说的话，那是要出事的。我上次在上海做线下活动的时候，也是拉了微信群，到第二天就有人在里头说一些很奇怪的话了，那我赶快把这群解散掉了，这没法整。

现在有了元宝了，这个模型本身也不是特别强的一个产品。你拉到微信群里头以后，万一有人在里头逗着元宝说：“来，给我讲一黄色笑话”，或者“你给我说一个谁谁谁的某个敏感人物的一个什么什么事”。他万一没说错了，这责任不能微信去背，你得由元宝去背。所以从入口这一块，腾讯还是有一些顾虑的。这也是这个元宝派这样的一个产品最后到底能不能成功的一个很关键的胜负手。如果我们现在发现元宝派就在微信里，那这事铁成了，而且腾讯可能就真的是在AI领域里头弯道超车了。但是如果是在一个没多少用户的元宝里头，那这个就稍微要观察一下了。

第二个就是模型的能力，这个才是最重要的。腾讯现在手里头没有一个特别强力的模型。现在通过@方式能够叫大模型干活的，我现在见到最好用的就是在X上面，那玩意是真好使。你在上头真的是@Grok，“给我换衣服”、“给我这个图片重新做一下”、“给我核实信息”，非常非常好用，而且给X带来了极大的活跃度。但是在元宝里头，甭管是DeepSeek还是比DeepSeek还烂的混元模型，你到底能不能顶得住这件事？不好说。这个也是有待观察的。

第三个就是从应用场景上来说。Grok在X里边给X带来了非常好的互动。咱们来看一下Grok在里边怎么干活的：我们在X的时间线上，你随时可以给一个人的推文发一个评论，这个评论叫@Grok “帮我核实这个信息”；或者是有一个图片，你也可以发一个评论说@Grok “帮我去换衣服”，这个都是可以的。如果有人看到了这一条推文以后，他们想去看到Grok的回复怎么办？你要再点进去才能看到Grok的回复，等于是平白的给X平台增加了很多次点击。而这个就是在Grok的整个运作过程中，它跟X平台的这种广告变现、跟他的这种希望你更多点击、更多互动的这样的一个诉求，他是一致的。所以他做的很好。

而现在的话，群聊真不是这么玩的。你想这个群里头只有一个元宝，没有第二个元宝，这个可玩性就会低很多了。

第二个，刚才咱们讲Grok在X里面它是统一的人格，所有人你只要喊了Grok了，它实际上都是跟一个人在聊天。而在元宝里头它不是这样的。你说我单独跟元宝聊天，他的人格其实对于每一个人来说也是独立的，也是一致的。但是你一旦拉群了，就不是这样了。为什么？因为这个元宝在这个群里边是活跃的，他的生命周期就是建群到群退出。为什么我们要讲到生命周期这么样的一个词？因为你想，我建了一个群，拉进来了比如说20个人。这个里头有聊天记录、有上传的照片、有上传的文件，这个里边的元宝工作的过程，就是根据这20多个人聊天的记录、聊天的照片和这些文件，根据这些东西去聊。你一旦把这个东西解散了，他就不是他了。

不同的群里面，这个元宝虽然都叫同一个名字，都叫元宝，但实际上不同的群里边，这个元宝的性格、这个元宝的对外的体现都是不一样的。那你说为什么会有不一样？原因很简单，我这个里头是这20个人，那边是另外的10个人，而且我们这20个人聊天的内容跟那10个人聊天的内容是不一样的。你让元宝说：“来，给我统计一下在这个这次聊天里头，张三李四他们是怎么表现的？”哗哗哗给你总结去了。哪怕另外一个群里、10个人的群里头也有张三跟李四，你说你再去总结一下他们是怎么做的，他那就另外一套词了。所以在这个里头，元宝会有极大的人格割裂的问题，这个是非常非常麻烦的，看后边怎么去解决了。而且这些群聊跟群聊之间数据也是不通的，微信跟这些群聊之间数据也是不通的，后面还是有非常非常多需要改进的地方的。

所以AI群聊这件事，本身其实是挺难做的。光有10亿人民币的红包，光有以前微信和QQ上面社交关系链，你未必能做的好。这两样东西是腾讯加分项，而后边入口——现在因为各种各样的原因还不敢放到一级入口上去；第二模型很烂；第三这个产品设计上还是有一些逻辑不自洽的地方了。

这个事情上有很多参与方吧，他们的输赢清单是什么？

第一个是腾讯元宝团队。他的可能的收益：抢到AI社交的定义权。我来定义这个东西就应该这么玩了，现在因为谁都没做出来，所以大家都在拍脑袋，谁也不知道这东西该怎么做。而且如果他真的做成了，腾讯也就抢到了时间窗口，他比别人落后了，现在我就弯道超车超回来了。那么可能的损失是什么？变成红包驱动的短命功能，把这红包领完完事了，这功能好不好使不重要，红包跟咱们没仇，咱还是要去领的。关键的条件就是你的关系链到底能不能迁移进来，以及协作场景是不是能够成立。你比如说最后我发现元宝派里头玩狼人杀非常好，等于我有一个关键的场景被确立起来了，这个也可以算部分成功。至于关系链迁移这件事的话，我觉得还是有点难度的。

第二个对于微信和QQ的这个主体来说。可能的收益是什么？获得AI社交行为数据，或者是试错的样本。甭管你成不成，反正我先把这个数据收集回来了。可能的损失就是用户体验被打断，注意力被分流。因为你这个群不在你原来的APP里去了，你这个群被拉到元宝派那个APP里去了，这个对于他们来说一定是损失的。与元宝派的数据互通的政策到底是什么？目前为止还没有看到他们最后准备怎么做这件事。

从用户的角度，可能的收益：群聊总结、共创效率，这些都会有极大的提升。来核实一下这东西真的假的、帮我总结一下这个人的性格特点什么的，会让这个聊天的过程变得好玩。当然了，@元宝把他这个衣服换成比基尼，到时候大家一定会去试的，没什么好说的。但是可能的损失是什么？第一个这个隐私边界就被打破了。另外一个是什么？就是你有可能被骂。因为前两天还出一个什么事，元宝骂人嘛。原来只是普通人在骂你，现在可能会被AI痛骂，这个会有一个全新的体验。关键条件是什么？是否形成低噪音高价值的AI参与感，这个还要看。因为现在我自己也没有试用上，但是以我刚才去看到的混元大模型和DeepSeek模型在元宝里边的体验，我觉得这个很难。

至于竞品的话。可能的收益是观察一下腾讯的打法，要去调整一下产品的节奏了。如果这东西确实做好了，那大家要上。其实现在百度的文心一言和阿里的通义千问都准备上群聊，就看看腾讯能做成什么样了。可能的损失就是红包流量被人吸走了。因为今年央视春节联欢晚会上，这个中标可以发红包的是豆包，不是腾讯。但是腾讯说我发的多，大家来。关键点还是要看红包这一波完了以后能不能有留存。如果说红包完了以后，元宝打了翻身仗了，就像当年微信抢红包这事似的，那这个豆包就该哭了。

至于海外的竞争对手的话，有可能会有什么样的收益？所谓的海外竞争对手，实际上就是一家，就是Meta。因为他们其实现在也在思考说，我这个AI到底怎么跟社交联系在一起。虽然X已经给出一个样例来了，但是Meta绝对是跟腾讯更像一些的。他们也可以验证一下中国市场上这条路是不是走通了，如果走通了的话，可以去抄袭一下。

上面咱们总结的，就是各方在元宝派这件事情里头，各种的胜负手都在什么地方。

最后总结一下吧

关注AI产品的人，看老范的节目，对于AI的各种新的技术、新的应用方式肯定还是关心的。咱们有一个行动清单，咱们要观察哪些事：

第一个，我们要观察一下元宝派是否能够在微信和QQ之外形成稳定的日活。这个是一个很关键的事。如果说红包领完了，元宝派就没人理他了，那这个就完蛋了。你像OpenAI的Sora，前面也是热了几天，热完了以后就没什么热度了，这个就属于一个失败的产品。元宝派我们也需要去关注这件事。
第二个需要关注的点，就是群聊里头的AI总结是不是真的减少了消息噪音？是不是真的有用？这个是要去观察一下的。
第三个是是否出现AI群内共创的这种高频场景。比如说有没有一些真正有意思的玩法，像刚才我们讲的狼人杀，或者是一些其他的这种游戏，由元宝去给你做主持人这样的一个东西，到底能不能玩的起来？这个也是需要观察的。
第四个需要观察的是什么？就是在群里头这个元宝被处罚的频率和复用率到底怎么样。你说我到群里了，大家不跟这元宝聊天，咱自己聊上了，这个元宝每次进来都聊不到这个点子上，这个我觉得可能性很大。我每周有一天要YouTube里边去处理评论，YouTube现在在我的这个评论下面会给我做评论建议。什么意思？就是人家给我发评论了，YouTube就调用Gemini模型说“咱们这样回一下吧”、“那样回一下吧”，他会给我做这种建议。但是我要跟大家讲，这个建议都是非常非常垃圾的，我基本上没有采用过的。我们也要看这个元宝在群聊的过程中，到底是在说一些有意义的话、画龙点睛的话，还是说经常在这像二傻子一样，说一些不着边际的东西，完全融不到这个聊天的过程中去。这个还有待观察。
最后一个要观察的是什么？就是春节红包结束以后的四周，咱们要去观察一下留存曲线。如果春节以后一个月，也就是四周以后，留存非常非常差的话，马化腾这个10亿人民币就打水漂了。

好，这就是咱们这一次分享的内容。感谢大家收听，请帮忙点赞、点小铃铛，参加DISCORD讨论群。也欢迎有兴趣有能力的朋友加入我们的付费频道。再见。

背景图片

Prompt：Ghibli-inspired hand-drawn interior of a Shenzhen tech-company penthouse office, multi-level open-plan workspace, staggered desks across different floors, glass curtain-wall meeting rooms scattered between workstations, layered mezzanines and staircases, warm wood and soft industrial materials, calm productive atmosphere, subtle city skyline through large windows, cinematic wide interior establishing shot, slightly elevated wide-angle, rich spatial depth, clean lineart, soft gradients, cel-shaded look –ar 16:9 –stylize 180 –chaos 6 –v 7.0 –no photorealistic, 3d render, harsh neon, cluttered text, logos, watermark, crowds –p lh4so59

Llama 4悄然发布震撼不足？对比DeepSeek与千问，Meta的MOE架构和千万级上下文能否挽回开源领导地位，避免被超级APP浪潮抛弃？

Luke Fan — Mon, 07 Apr 2025 00:45:28 +0000

Llama4发布了。这里的黎明静悄悄，没有什么响动。这是怎么回事？

大家好，欢迎收听老范讲故事的YouTube频道。一觉醒来，Llama4就发布了。扎克伯格亲自在Facebook的REELS（也就是Facebook的短视频里面）发了一条视频，说Llama4发布了，今天是Llama4日。

Llama4呢，一共是有三个版本：
第一个叫Scout（侦察兵版本），总参数1,090亿（也就是109B），活跃参数是170亿，包含16个专家模块。对的，Llama终于也放弃抵抗了，从Llama4开始变成Moe了。在Llama4之前的版本都是单一体的模型，Llama3.3还给了一个400多B的单一模型，到Llama4彻底放弃抵抗了。

现在呢，支持1,000万TOKEN这种上下文，这个是Llama4最大的一个特点。DeepSeek是64K（也就是64,000个TOKEN上下文），现在上下文比较大的Gemini大概是能到2兆（200万），Llama4直接给了一个10兆（1,000万TOKEN），这是它做的一个很创新的点。

1,000万TOKEN的上下文可以干嘛？可以处理20小时以上的视频或者超长文档，是行业领先的长上下文技术。采用了混合专家模型（也就是MOE架构），在INT4量化后，可以在单个的H100 GPU上运行，每秒处理42,400个TOKEN，还是速度比较快的。但是要注意，即使经过量化到Intel4上，它也必须要有H100，否则跑不起来这东西。所以咱们普通的电脑就别惦记了，最小的模型就是它了，没有更小的了。

所以这一次Llama4的发布，并不像以前的Llama1、Llama2、Llama3似的，把各个尺寸的模型都做出来（从7b、14b、72b、32b什么这些都做一遍），没有，上来最小的一个就是109B。它可以支持文本、图像、音频、视频的输入，目前呢只支持文本的输出，未来应该会出现全模态输出的版本。这是它最小的一个侦察兵。

中间的模型呢叫MARVELIC（独行侠），总参数量400B，活跃参数量17B，包含128个专家模块。它的专家模块变多了，超越GPT4O、DeepSeek V3，仅次于闭源模型Gemini2.5 Pro。Gemini2.5 Pro现在还是最强的，没有之一。在编程和数学任务中，仅用DeepSeek V3一半的参数即可达到相当的性能，但是你上再多参数也就这水平了。

所以，它在数学跟编程角度上来说，跟DeepSeek V3应该是半斤八两，只是它的运算效率要更高一些。最大的一个叫Behemoth（巨兽），总参数量2000B，活跃参数量288B，包含16个专家模块，使用30万亿多模态TOKEN（就是文本、图像、视频），在32K（也就是32,000个GPU）上训练，FP8精度，提升效率。所以，你有足够的显卡才可以玩这件事情——32,000块显卡。Deepseek到现在为止，都没有承认它有这么多块显卡。所以，这种巨兽，国内追赶起来是比较费劲的。

只是呢，这一个产品目前并没有发布出来，前面两个发布了，这个应该是在2025年的下半年发布。这个巨兽在数学、科学等基准测试中，超越了GPT 4.5、Claude sonnet 3.7和Gemini2.0 Pro。但是是不是超越了2.5 Pro，我现在没有看到相应的介绍。它呢，主要的作用是作为教师模型，用于知识蒸馏——就是我做一最大的，然后下边这些小的模型、中型的模型，都是拿这个最大的进行蒸馏，蒸馏出来的。现在呢，它也转向了MOE，性能有所提升，但是呢并没有那么明显。最大的特点就是1,000万输入，这个是Llama4做的最不一样的一个点。

目前呢，支持全模态输入、文字输出；未来呢，会支持全模态输出，就是端到端的全模态输出。你甚至可以跟它去直接聊天，还可以打断它，就像现在的GPT4O高级语音功能一样。但是这个什么时候出来还不确定。如果能够有全模态输出的话，还是值得期待一下的。未来的方向一定是全模态、端到端的输入输出，现在新的模型都在向这个方向走。

那么，为什么没有什么声音讨论它呢？Llama1出来的时候，整个的行业都震动了——这样程度的一个模型一下就开源了，大家都可以拿来去研究了。Llama2出来一看，又可以往前走一步。其实Llama1跟GPT3.5还是有差距的，到Llama2出来以后说“哎，可以用了”，进行一些微调以后，就真的可以去解决一些ToB的，或者说使用范围相对比较集中的应用，就可以直接用起来了。我记得是在两年前，就很多国内的项目就在微调Llama。等到Llama3出来的时候说，这个虽然达不到GPT4的水平，但是已经很接近了，大家拿这个东西去稍微调一调，就可以跑了。

在Llama3出来以后的话，千问就开始疯狂的去输出各种各样尺寸的模型，就是千问2.0、千问2.5，这一批就直接追赶上来了。但是到Llama4出来，大家没说什么。

这到底是什么样的一个情况？我呢，第一时间还上去试了一下。现在你到Open Router这个网站上，你是可以进行测试的，而且是免费的。侦察兵版和独行侠版都可以使用，也有收费的版本。收费版本就是比免费的版本稍微快一点点，主观感受上没有特别大的差异。

那你说真的没有什么提升吗？这个肯定不对。它呢，跟现在的GPT-4O、Gemini 2.5、Claude 3.7这种主流模型比起来，确实没有什么提升。哈哈，这个基本上跟他们算站在同一个起跑线上，可能跟Gemini 2.5还稍微的差一点。Gemini 2.5不太友好的地方就是它比较慢，现在的Llama 4是很快的。但是呢，这个Llama 4比Llama 3、3.1、3.2、3.3这些版本还是有巨大提升的，特别是在中文这一块，效果好了非常非常多。大家可以去试一试，就完全可以达到能用的状态了。这个原来在Llama 3的水平上还是达不到的。

那么为什么不觉得震撼了呢？原来Llama虽然和闭源模型比起来稍有差距，但是呢，毕竟你是开源的吧，开源圈里的扛把子。现在的开源模型也卷起来了，DeepSeek绝对达到了可用程度，千问现在也绝对在数量上碾压。怎么叫数量上碾压？就是千问的模型是数量非常大呀，零点几B，然后到4B、7B、14B、32B、34B，多模态的推理的全都有。这块非常非常完善，而且有非常多的人在以千问模型为基础进行微调。因为你要到手机上，或者到一些嵌入式设备上去进行操控的话，你拿千问这种小模型微调是很方便的。给你一个105B的模型，你拿去微调的话，这个就有点费劲了。所以现在你到Hugging Face上去看，最受欢迎的开源模型基本上都是千问或者是千问系的。

所以从数量上，千问绝对赶超Llama。从能用程度上说，DeepSeek比它早发布了几个月，已经达到完全可用的一个状态了。现在Llama 4再拿出来，并没有划时代的提升。同样作为开源版本的大模型，他就没有那么震撼，已经有审美疲劳了。当然了，Llama 4出来，应该大家还是会去抄的。这Llama 1、Llama 2、Llama 3出来以后，实际上对至少国内的大模型产业都是有极强的促进作用的。Llama 4出来呢，应该也是有这种意义。千问和DeepSeek应该会尝试使用这种超长上下文的技术，因为它是1,000万TOKEN嘛。所以这一块至少千问应该会去追赶一下，DeepSeek的话……

现在到底在忙什么？不确定。当然，DeepSeek呢，应该也会在多模态上奋起直追。只是奋起直追多莫泰这个事呢，对于卡的数量是一个考验。DeepSeek前面一直说我没有那么多卡，看看后边这个话怎么把它说圆回来吧。

那么现在大模型到底在卷什么？大模型最终有可能还是会走向超级APP的道路。好像现在各大厂商依然在尝试卷超级APP，而且超级APP才是流量入口的一个锚点。你没有流量入口的话，你的模型做的再好，其实没有什么意义。这件事情上，以谷歌和Meta作为反面典型，大家看一看。谷歌的大模型其实一直做的还可以的，只是呢它的入口做的比较烂，大家就一直用的比较少。谷歌每一次出新的大模型，先给程序员用，他自己telegram内部用户，甭管是付费的还是免费的，都要很晚才能接触到他们最新的模型。而Meta，Llama做到现在了，做的这么热闹，Meta的用户，甭管是Facebook用户、Instagram用户，其实并没有感觉有特别大的体验上的提升。这个是两个典型案例。

这里还有一个正面案例，谁啊？就是马斯克的Xa i 1，一做出来以后，第一件事在x平台上，直接给了一个最核心的入口，直接给了一个Grok的入口，你一点就可以进去聊天去了。现在ChatGPT呢已经是超级APP了，Claude呢应该也接近成为超级APP了。谷歌呢算突然惊醒，ChatGPT 2.5 Pro上来以后，直接把Gemini客户端的经理给干掉了，把Notebook LM的负责人拎回来，你去给大家继续去做Gemini客户端去。这个Notebook LM是用户所喜欢的，Gemini被人骂了这么久了，我们要换一换了。而且Gemini 2.5 Pro一上来，就直接给Gemini的免费用户就开放了。所以谷歌已经醒过味了，说我们要换一个姿势了。

现在呢卷王们已经下场了。阿里还在内斗，千问跟夸克还要在内部做一次赛马。腾讯的元宝已经开始疯狂砸钱了。现在的进展到什么样的一个状态了？就这些超级APP都是带有搜索、知识库和靠谱推理的一个结果生成。目前我们现在看到的所有的超级APP，或者叫AI方面的超级APP，基本上都是在这个起跑线上。语音端到端呢，OpenAI做了，Claude我不确定做没做，好像没有。Grok英文的部分已经有了，中文的部分没有。豆包已经做出来了，千问和夸克现在正在奋起直追，腾讯的元宝也还在努力的往前走。

DeepSeek在这一块做的稍微有点拉胯。它的语音部分和图屏的部分，就是多模态的部分，稍微差那么一点点。再往后就是图片、视频、音频的理解和生成。现在这些呃超级APP，OpenAI是完全可以实现图片理解、图片生成，甚至是视频生成，这些功能都是完整的。谷歌其实它的功能都做出来了，但是Gemini里头好多没接，这块还要再奋起直追一下。

阿里的千问还有像夸克，包括字节的豆包，在这一块已经都做了图片理解、图片生成，包括修图改图，包括一些视频生成，现在他们都已经做出来了。其他的还在奋起直追。全新的形态是无法跟传统的形态进行有机结合的，或者结合起来比较费劲。现在唯一结合成功，或者大家感觉还比较顺眼的，就是x集合XAI，而且两个公司还合并了。

其他公司都是尝试在传统的产品形态之外，寻找新的应用形态，或者新的用户使用形态。所以都是做的独立的APP，甭管是腾讯、阿里还是谷歌，或者是字节，都是做出独立APP来，希望能够去抢占新的入口。现在呢是新场景已经有了，底层技术基本上拉平，就这么一个状态。甭管是豆包的推理模型，还是腾讯推理模型，包括DeepSeek，还有像谷歌的Gemini 2.5 Pro、GPT-4O、Claude 3.7这些模型，它们其实基本上算是拉平了。谁比谁好一些，但是并没有好出那么多去。

现在可能唯一能够明显感觉到有差距的，是Gemini 2.5 Pro。那么当新场景出现了，底层技术又基本拉平以后，剩下的就是一个字了——卷吧。这件事咱们中国人擅长，后面还要看大家怎么冲上去。

现在留给Meta的时间已经不多了，开源大模型的老大位置应该已经不是他的了。Grok的卡应该比Llama可能稍微少一些，但是XAI的卡要比Llama的新。Grok也是开源的，只是Grok没有把最新的开源出来。它现在是上一代的Grok 2要去开源，现在Grok 3出来以后，它准备把2开源出来。这个3的话可能要等到Grok 4出来以后再去开源。但是呢，你也是开源模型，而且Grok 3特别是配上AI agent以后，相当的好用。

DeepSeek在多模态和长文本上呢，还有所欠缺，但是达到可用状态，这个要比Llama4要早好几个月。所以在这一块上，Meta的开源大模型老大的位置也被动摇了。再加上可能在最近的一两周里头，千问3也要出来。现在大家使用都是千问2.5，千问3一旦下来以后的话，有可能整个开源大模型的座次……

还要再重排一次。开发独立APP对于美塔来说，应该是刻不容缓了。Meta也有计划，在4月份准备上线超级APP。

这个中间呢，还少了一步。Meta少哪一步？AI agent它没做。就甭管是deep search、deeper search或者这些东西，他都没做。而且呢，他还缺一个什么东西？就是他的function call和MCP都没有。他的模型你只能是给出提示词，然后那边生成结果。你说我在这边给一大堆的function call的描述，或者是给MCP的描述，我在生成的过程中可以调用外部数据，这个到Llama4依然没有。所以这一块，Meta稍微有些落后了。

而且现在从Meta发布的Llama4来看，它已经完全退出了小模型的竞争。最小的侦察兵109B，你没有H100跑不起来。在这一块上，阿里已经算是稳赢了。所以阿里作为AI公司，基本上已经站住脚跟了。现在其他还在做小模型的公司，一个是微软，一个是谷歌。谷歌的Gemma3现在是有各种小模型的。还有就是欧洲的Mistral，他们也有一些小模型，只是呢Mistral的声音没有那么大。

Meta呢，算是手里有卡，有数据、有用户、有钱，还有一大堆的现成的用户使用场景。必须要做的事情，是探索新的用户使用场景。如果老惦记去玩眼镜的话，那可能真的会被抛下的。AI的牛皮不能总靠卡的数量来维持下去，卡估值的逻辑正在坍塌。所以Meta必须要在卡估值逻辑坍塌之前，拿出来一个被大家可以接受的超级APP，或者说一个全新应用场景的服务，可以去跟其他的这些大模型超级APP去进行竞争。否则的话，它的故事会讲不下去的。

好，这就是今天Llama 4发出了以后的第一期视频。未来的话，Llama 4可能更进一步的功能被暴露出来，或者说大家又试出什么好玩的来，那再去录视频跟大家分享。好，这一期就讲到这里，感谢大家收听，请帮忙点赞点小铃铛，参加Discord讨论群，也欢迎有兴趣、有能力的朋友加入我们的付费频道。再见。