罗福莉发布了小米MiMo-V2 Flash新模型，小米股价却应声下跌了

关于 MiMo-V2 Flash 模型发布

12月17号开的发布会，罗福莉终于站上了小米的舞台，发布了新模型 MiMo-V2 Flash。这是一个MoE的模型，这倒是不出乎人意料，因为现在新的模型基本上都是MoE。而且罗福莉作为Deepseek V2的主要创作者，MoE就是从他手里头发扬光大的。

但是MiMo-V2 Flash这样的一个模型，使用了更强的后训练算法，就是前头预训练完了以后，后边做更激进的这种后训练。整个的模型是 309B，也就是3,090亿参数，每一次干活只激活 15B。所以他每一次真正回答问题的时候，激活的参数量是非常非常小的。

这是一个云端模型。别看他只激活15B，在本地是没法跑的。如果你想在电脑上跑的话，基本上三十几B就是到头了。不是说你每次激活多少，而是你总模型量有多少。你比如说我现在有一个72B的模型，每一次激活十几B，在我们电脑上是跑不起来的。所以它这个309B每次激活15B的模型，只能在云端跑。

开源、价格与实际体验

这个模型直接开源了，目前API是可以限时免费使用的。即使后边收费了，也是非常非常便宜的，比Deepseek还要便宜很多的一个价格。256K的上下文，刷分的能力还是很强的，就是在很多跑分上，跑的还是相当不错的。但是具体使用，还是要各自去体验一下。

我自己试了一下，感觉很一般，这个模型并不是很聪明的样子。我原来有一个习惯，就是每一次做什么模型介绍的时候，都会用这个模型去搜集相应的信息。比如说像Gemini 3，就用Gemini 3去搜集信息；像GPT-5.2，就用GPT-5.2；讲Deepseek V3.2也是用Deepseek去收集信息。但是今天这个稿子，是用GPT-5.2和Gemini 3 Pro写的，MiMo-V2 Flash这个模型搞不定，我去试过了。它这个模型的能力确实要稍微差一些。

但是据说这个模型，在 Agent以及Coding 的方面，是进行了专项的增强训练，效果非常好。甚至在某些的评分上，已经超过了Claude 4.5 Sonnet，这是非常恐怖的。就算你刷分能把它刷上去也很难，小镇做题家也不是谁都能干的。

资本市场的冷淡反应

但是这样的一个模型发布之后，小米股价应声下跌了。说明什么？就资本市场并不看好这件事。

12月16号：这个模型的消息就已经泄露了，说我们准备发这个模型了，当天小米股价下跌了2.25%。
12月17号上午：罗福莉在国家会议中心开的发布会，小米股价微涨了一点点，涨了0.78%。
12月18日：大家在消化这个消息的时候，相关的文章满天飞的时候，小米股价下跌了3.01%。

所以伴随大模型的发布，小米的股价是在持续下跌的。而相同的时间段，恒生指数是在上涨的。这个就属于叫逆势下跌，说明整个的资本市场，对于这件事都不看好。

为什么资本不看好小米搞大模型？

这是为什么？别人发了大模型，买了GPU或者做了什么事，大家都很看好，怎么到你这小米这就不行了？有几个原因。小米这种大模型搞法，和资本认知是存在偏差的。当然还有一个原因是什么，就是最近AI泡沫正在吹破，所以谁发大模型，都未必是完全的利好了。

1. 算力储备不足

那咱们回过头来讲，为什么小米搞大模型，资本就觉得有问题？现在号称搞大模型的这些公司，没有个10万卡起，都不好意思说自己搞大模型。国内的阿里、字节，都是10万卡起的这种公司。百度也是如此，更别提华为了（华为因为他那卡水平稍微差一些，所以那个量更大）。你没有10万卡，搞啥大模型？小米有多少卡？他应该是在2023年，还是更早一些的时候，买A100的卡买了6,500张，真的是不多，几千张卡。现在号称是准备上更大的集群，也就是万卡集群，还没有说到10万或者几万这个数。所以小米的一直是比较抠抠搜搜的，干这个事情。

2. 缺乏云计算积累

而且小米自己也不是云计算大厂，缺乏相应的积累。甭管是百度、腾讯、阿里、字节，还是国外的谷歌、微软、亚马逊这些，这都是云计算大厂。这些人管理这种巨型的云计算集群，在里边插了显卡以后去做训练，它是有积累的。小米虽然也有小米云，但是小米云最主要的功能是网盘，让大家存照片用的。它在云计算这一块，一直都没有什么特别大的声响出来。

3. 与“性价比”人设不符

而搞大模型这件事，是需要烧很多钱的，这件事跟小米的人设极度的不符。小米的人设是什么？叫“薄利多销型”。小米就相当是一大师傅，在这包包子。皮薄馅大，最新鲜的好肉，面粉、油盐所有的这些配料，都买能够买到的最好的。味道肯定不会难吃，但是也绝对不会有什么独特的、让人回味的这种味道。他也不会做什么特别复杂的创新，量大管饱就完了。

但是他每次去宣传的是什么呀？“你看我用的是什么样的面粉，这个面粉种小麦的时候，晒了什么样的太阳；我这个肉用的是什么样的肉，这个猪长大的过程中，是不是听音乐了。”这就是雷式营销法嘛。他总去强调什么？每一个这种原材料里边，一些不被人所关注的这种小细节。这些细节会感动人，但是你说这个猪在长大的过程中，是听了音乐还是喝了啤酒，跟我们最后去吃猪肉的时候，这个感受到底有多大关系？反正我也没太搞明白。

但是小米整个的雷式营销，就是在不断的强调这些东西，而且堆料堆的很足。甭管是他造手机，造电视、造洗衣机，还是造汽车，堆料都是堆的非常非常足的。但是到底有哪创新了？还真没有。小米向来是硬件堆料，软件相对粗陋。设计基本上就是没有设计，以前就是说小小米有风格吗？没风格。你把所有的小米产品放在一起，让你去猜小米下一代产品长什么样，你猜不出来。为什么没有风格吗？每一代都长得不一样。

利润确实是非常薄，依靠巨大的销量去压缩上游的这种供货商价格，然后依靠巨大的流量压缩销售成本。他通过这样的方式，精打细算的、省吃俭用的积攒了大量现金。小米手里还是有不少现金的，他在研发投入以及大模型相关的投资，其实都不大。在国内做大模型投资的，阿里是做的最狠的，字节做的也还不错，最近腾讯也开始发力了，已经开始向这个OpenAI挖人了，也在疯狂的挖字节的人。但是小米目前为止还是比较节俭的，小米的钱基本上都是省出来的。

4. 罗福莉的背景与技术来源

另外一点，大家不太看好小米的原因是什么？就是罗福莉来自Deepseek，这个身份还是多少有那么一点点尴尬的。在Deepseek最火的时候，就传出了雷军千万年薪挖人的消息，后来小米跟罗福莉本人都进行了否认，说这事没有。那这段时间罗福莉在干嘛？他把自己的名字写在了一篇论文上。这个论文是北大跟小米联合发表的论文，这个论文也是讨论后训练方法的一些新的探索，罗福莉是这篇论文的通讯作者。罗福莉在这段时间在干这个。而这个小米的MiMo-V2 Flash这个模型，就是用这个论文里边写、所使用的这个方法来训练的。所以这一段时间，他就已经在加入小米了，只是没有对外官宣。10月份罗福莉正式官宣加入了小米，12月17号站台发布了MiMo-V2 Flash。

5. 创新模式的质疑

小米的每一次的科技创新，其实都显得不那么大气。你比如说玄界O1，大家一看就知道，这个芯片基本上走的ARM的这种定制套餐。当然是雷军他自己会否认，说“我们没有做定制套餐，我们还是投入了很多的”。但是你投入了很多备不住，人家有一个套餐，跟你这个玄界O1芯片真的是卡边卡沿，一点都不带差的。他那个套餐里还包括台积电生产，你这个玄界O1也是台积电生产的。但是你说我这个就是没有签那份协议，那他也说得过去。

另外澎湃OS，现在大家都得做手机操作系统嘛，但是小米的澎湃OS，那就是安卓。为什么？因为它小米要在国外卖手机，你把这东西改大发了，你怎么去跟谷歌兼容？你没法在国外销售。对，至于自动驾驶，反正一直属于第二梯队里靠前的，能使但是不算特别好的，也一样把硬件堆齐。小米每一次都是把硬件堆齐，它自动驾驶也是直接塞两颗索尔芯片进去，软件稍微差那么一点点，也就是这样的一个状态。

所以在这样的情况下，你要让整个的资本市场相信，说你是按照我们熟悉的配方、熟悉的套路去做大模型投入了，大家不信。所以发个大模型，股价还跌了。

小米的转型与雷军的“挖人”艺术

那大模型发布会，以及最近小米不断的挖人、积累团队的这些行为，可能意味着小米正在进行转型。小米现在在不断的拉高研发投入。要注意，国内这些科技企业里头，研发投入最高的是谁？是华为。那真的是砸死钱在里头去做研发。你可以不喜欢这公司，但是人家研发投入的钱是真金白银的。做出来的东西怎么样，是另外一回事。有的时候他底层逻辑有问题了以后，他们做出来的东西，也是总会透着那么一点点的诡异。现在小米也是不断的拉高研发投入，然后高调官宣罗福莉的入职，从原来的隐瞒到现在官宣，甚至让罗福莉直接站台去发表演讲。

而且最近还有什么人入职了？前特斯拉“擎天柱”灵巧手的工程师卢泽宇，也入职了小米。以后要做机器人，没有哪个汽车厂说我自己不做机器人的，现在直接挖了特斯拉的人回来干。据说有3,000人的大模型团队，但这件事我是表示怀疑的。马斯克的xAI还没有3,000人，小米整3,000人？你在这熬汤吃，还是在这包包子？这个3,000人的团队里头，到底有多少人是真正能干活的，或者真正能够在大模型底层上，有这种研究能力的？这个事我表示怀疑。

雷军的必杀技：挖人

但是有一点不用怀疑的是什么？就是雷军的有一大技能，就是挖人。雷军挖人的能力，是国内这些CEO里头，应该是绝对第一梯队的。

像雷军做小米手机的时候就是去挖人，他当时直接列了一个表，全世界做安卓的人，排第一是谁，排第二是谁，排第三是谁。甭管排的严不严格了，他反正排了一表，然后就一个一个上去敲门，说来你上小米这来做手机来。那排最前面人都是哪人？都是谷歌的人，因为安卓是谷歌发明的。那雷军就去敲门，人家说“我为什么要离开谷歌，上你们那去？”那雷军怎么办？就坐在人那跟人继续聊天，一聊聊10个小时，20个小时。几天的聊下来，那有些实在聊不下来就算了，但是还是有不少人真的被他挖过来的。然后去找魅族跟人去学习去，学完了以后挖人，最后魅族都快疯了，说你不能这么干。

像雷军算是成名比较早，他很早就成为了金山的高管，所以他这个圈子里头比较有名。他这个隐蔽性又很强，跑到人家那去说“我跟你学习一下”，就是这种工程师的本色，还是比较彰显的。他跑那跟人学习还很谦虚，有一些好为人师的人也是愿意跟他讲，讲完了他就这个顺手，就“七嚓咔嚓”开始挖人了。这个是雷军的一大技能。所以小米早期的人，都是雷军照着名单挖回来，以及到别的厂里头去学习了以后，顺手挖回来的。

小米汽车其实也是这么来的。小米汽车在早期的时候，雷军就跑到吉利去学习去了，说“你们这车造的真好，我好喜欢你们这个东西，你们到欧洲也是收购了很多厂，有这么多好的工程师，我们好好学习一下，看看到底是怎么做这个事情。”人家也是很开放的就跟他聊，聊完了以后，就把吉利的一大票人，全都拎回来了，包括很多莲花的人，就是Lotus的人。Lotus这个品牌，当时也是被吉利收购了。Lotus团队的很多成员都是在国内的，直接被小米连锅端回来了。

现在雷军继续在发挥这个技能，大模型上把罗福莉拎回来，机器人也直接上“擎天柱”那去挖人去了。薄利多销这条路，未必能够走的下去了，必须要转型了。再去堆料，然后去宣传原料、那些不被人注意的小众特点，就是雷式营销法可能走不通了。所以现在真的是要自己做出点技术来了，趁着手上还有现金，需要砸一把了。这就是现在小米可能在干的事情。

小米的大模型矩阵

小米都发了哪些大模型？

2025年4月份发布了 MiMo-7B：这个是一个7B的模型，这个模型是可以在手机上跑的。
5月份发布了叫 MiMo-VL：一般叫VL的模型，都是视觉语言模型，它是有视觉视频推理能力的，或者有视频的识别能力的，我们管它叫多模态模型。我现在在我的汽车上开着开着，我就可以喊：“给我看看前面那什么车？这车多少钱？”他就可以“咔嚓”拍一张照片回来，然后给你讲半天，这什么车，什么牌子，现在多少钱，给你分析半天。这个也挺好玩的。
MiMo-Audio：这是一个1.2B的模型，9月份发布的。
MiMo Embody：这个模型是11月发布的，其实是自动驾驶和机器人的模型。

现在澎湃OS 1.11版本正在推送，里头就是这个MiMo-Embody的模型。现在这个版本，已经摆在小米SU7的版本上都推完了，小米Yu期的版本还没轮上我，在分批推送。据说推送到手以后的话，它的自动驾驶能力就会得到极大的提升。今天讲的MiMo-V2 Flash模型，12月发布的，所以它发布的这个频数还是很高的。

“人车家全生态”背后的逻辑

那这么多模型都干什么的？MiMo-V2 Flash是作为云端Agent基座来干活的，其他模型都是端侧模型。其他模型都是相对比较小的，直接可以在这个手机上、你的家的冰箱上，或者是汽车上跑。包括语音模型只有1.2B吗，在各种的家用电器上都是可以跑起来的。这个视觉模型也是7B的，就是这些模型都不大。

云端的V2 Flash这个模型，它主要强调的是AI Agent的能力。AI Agent的能力，实际上是可以进行专项的后训练，是相对来说比较容易增强的。还有就是编码能力，这块也是相对比较容易验证和提升的。像小米喊了半天“人车家全生态”，其实是一大堆设备。这些设备的控制都是靠什么？就是一大堆简单的脚本代码。你要给他写一个脚本：先开灯，再怎么转方向，这实际上都是脚本。那么MiMo-V2 Flash在搜索和推理的帮助下，搜集设备上反馈的信息，生成可靠的脚本，进行设备控制。这个故事还是编的圆的。

所以他就是整个这一套：一堆的端侧模型，加上一个非常高速、非常便宜的AI Agent和简单编码模型，形成一整套的大模型体系。

现在所有这些模型都是开源的。小米自己是个硬件设备公司，大模型通通都开源了。以后有开发者想要基于这些设备，再去开发各种应用场景，相对来说的话会容易一些。这就是小米现在的大模型的主要的思路。

总结

最后总结一下：罗福莉发布了极其偏科的新模型，速度快、成本低，AI Agent和编码都还不错，但是确实不太聪明。资本市场的反应极其冷淡。这不再是那个我们熟悉的小米了，小米现在正在转型。未来这条路是不是能够走得通，现在看还非常非常难说。为什么？因为小米在海外，它是可以直接用Gemini模型的，你只有在国内，你才需要上MiMo这些东西。那么省钱省习惯了的小米团队，未必能适应的了大模型的这种投入模式。所以未来到底会走成什么样，咱们还需要看一下。反而是目前为止，资本市场不太认可他们能够转得过这个弯子来。

好，这一期就讲到这里，感谢大家收听。请帮忙点赞、点小铃铛，参加DISCORD讨论群，也欢迎有兴趣、有能力的朋友加入我们的付费频道。再见。

背景图片：