罗福莉携新模型亮相股价却连跌三天?资本看透了什么:当“堆料之王”试图讲好技术故事,市场为何依旧投出反对票?|小米AI战略、人车家全生态、高端市场挑战、研发投入

罗福莉携新模型亮相股价却连跌三天?资本看透了什么:当“堆料之王”试图讲好技术故事,市场为何依旧投出反对票?|小米AI战略、人车家全生态、高端市场挑战、研发投入已关闭评论

罗福莉发布了小米MiMo-V2 Flash新模型,小米股价却应声下跌了

大家好,欢迎收听“老范讲故事”的YouTube频道

关于 MiMo-V2 Flash 模型发布

12月17号开的发布会,罗福莉终于站上了小米的舞台,发布了新模型 MiMo-V2 Flash。这是一个MoE的模型,这倒是不出乎人意料,因为现在新的模型基本上都是MoE。而且罗福莉作为Deepseek V2的主要创作者,MoE就是从他手里头发扬光大的。

但是MiMo-V2 Flash这样的一个模型,使用了更强的后训练算法,就是前头预训练完了以后,后边做更激进的这种后训练。整个的模型是 309B,也就是3,090亿参数,每一次干活只激活 15B。所以他每一次真正回答问题的时候,激活的参数量是非常非常小的。

这是一个云端模型。别看他只激活15B,在本地是没法跑的。如果你想在电脑上跑的话,基本上三十几B就是到头了。不是说你每次激活多少,而是你总模型量有多少。你比如说我现在有一个72B的模型,每一次激活十几B,在我们电脑上是跑不起来的。所以它这个309B每次激活15B的模型,只能在云端跑。

开源、价格与实际体验

这个模型直接开源了,目前API是可以限时免费使用的。即使后边收费了,也是非常非常便宜的,比Deepseek还要便宜很多的一个价格。256K的上下文,刷分的能力还是很强的,就是在很多跑分上,跑的还是相当不错的。但是具体使用,还是要各自去体验一下。

我自己试了一下,感觉很一般,这个模型并不是很聪明的样子。我原来有一个习惯,就是每一次做什么模型介绍的时候,都会用这个模型去搜集相应的信息。比如说像Gemini 3,就用Gemini 3去搜集信息;像GPT-5.2,就用GPT-5.2;讲Deepseek V3.2也是用Deepseek去收集信息。但是今天这个稿子,是用GPT-5.2和Gemini 3 Pro写的,MiMo-V2 Flash这个模型搞不定,我去试过了。它这个模型的能力确实要稍微差一些。

但是据说这个模型,在 Agent以及Coding 的方面,是进行了专项的增强训练,效果非常好。甚至在某些的评分上,已经超过了Claude 4.5 Sonnet,这是非常恐怖的。就算你刷分能把它刷上去也很难,小镇做题家也不是谁都能干的。

资本市场的冷淡反应

但是这样的一个模型发布之后,小米股价应声下跌了。说明什么?就资本市场并不看好这件事。

  • 12月16号:这个模型的消息就已经泄露了,说我们准备发这个模型了,当天小米股价下跌了2.25%。
  • 12月17号上午:罗福莉在国家会议中心开的发布会,小米股价微涨了一点点,涨了0.78%。
  • 12月18日:大家在消化这个消息的时候,相关的文章满天飞的时候,小米股价下跌了3.01%。

所以伴随大模型的发布,小米的股价是在持续下跌的。而相同的时间段,恒生指数是在上涨的。这个就属于叫逆势下跌,说明整个的资本市场,对于这件事都不看好。

为什么资本不看好小米搞大模型?

这是为什么?别人发了大模型,买了GPU或者做了什么事,大家都很看好,怎么到你这小米这就不行了?有几个原因。小米这种大模型搞法,和资本认知是存在偏差的。当然还有一个原因是什么,就是最近AI泡沫正在吹破,所以谁发大模型,都未必是完全的利好了。

1. 算力储备不足

那咱们回过头来讲,为什么小米搞大模型,资本就觉得有问题?现在号称搞大模型的这些公司,没有个10万卡起,都不好意思说自己搞大模型。国内的阿里、字节,都是10万卡起的这种公司。百度也是如此,更别提华为了(华为因为他那卡水平稍微差一些,所以那个量更大)。你没有10万卡,搞啥大模型?小米有多少卡?他应该是在2023年,还是更早一些的时候,买A100的卡买了6,500张,真的是不多,几千张卡。现在号称是准备上更大的集群,也就是万卡集群,还没有说到10万或者几万这个数。所以小米的一直是比较抠抠搜搜的,干这个事情。

2. 缺乏云计算积累

而且小米自己也不是云计算大厂,缺乏相应的积累。甭管是百度、腾讯、阿里、字节,还是国外的谷歌、微软、亚马逊这些,这都是云计算大厂。这些人管理这种巨型的云计算集群,在里边插了显卡以后去做训练,它是有积累的。小米虽然也有小米云,但是小米云最主要的功能是网盘,让大家存照片用的。它在云计算这一块,一直都没有什么特别大的声响出来。

3. 与“性价比”人设不符

而搞大模型这件事,是需要烧很多钱的,这件事跟小米的人设极度的不符。小米的人设是什么?叫“薄利多销型”。小米就相当是一大师傅,在这包包子。皮薄馅大,最新鲜的好肉,面粉、油盐所有的这些配料,都买能够买到的最好的。味道肯定不会难吃,但是也绝对不会有什么独特的、让人回味的这种味道。他也不会做什么特别复杂的创新,量大管饱就完了。

但是他每次去宣传的是什么呀?“你看我用的是什么样的面粉,这个面粉种小麦的时候,晒了什么样的太阳;我这个肉用的是什么样的肉,这个猪长大的过程中,是不是听音乐了。”这就是雷式营销法嘛。他总去强调什么?每一个这种原材料里边,一些不被人所关注的这种小细节。这些细节会感动人,但是你说这个猪在长大的过程中,是听了音乐还是喝了啤酒,跟我们最后去吃猪肉的时候,这个感受到底有多大关系?反正我也没太搞明白。

但是小米整个的雷式营销,就是在不断的强调这些东西,而且堆料堆的很足。甭管是他造手机,造电视、造洗衣机,还是造汽车,堆料都是堆的非常非常足的。但是到底有哪创新了?还真没有。小米向来是硬件堆料,软件相对粗陋。设计基本上就是没有设计,以前就是说小小米有风格吗?没风格。你把所有的小米产品放在一起,让你去猜小米下一代产品长什么样,你猜不出来。为什么没有风格吗?每一代都长得不一样。

利润确实是非常薄,依靠巨大的销量去压缩上游的这种供货商价格,然后依靠巨大的流量压缩销售成本。他通过这样的方式,精打细算的、省吃俭用的积攒了大量现金。小米手里还是有不少现金的,他在研发投入以及大模型相关的投资,其实都不大。在国内做大模型投资的,阿里是做的最狠的,字节做的也还不错,最近腾讯也开始发力了,已经开始向这个OpenAI挖人了,也在疯狂的挖字节的人。但是小米目前为止还是比较节俭的,小米的钱基本上都是省出来的。

4. 罗福莉的背景与技术来源

另外一点,大家不太看好小米的原因是什么?就是罗福莉来自Deepseek,这个身份还是多少有那么一点点尴尬的。在Deepseek最火的时候,就传出了雷军千万年薪挖人的消息,后来小米跟罗福莉本人都进行了否认,说这事没有。那这段时间罗福莉在干嘛?他把自己的名字写在了一篇论文上。这个论文是北大跟小米联合发表的论文,这个论文也是讨论后训练方法的一些新的探索,罗福莉是这篇论文的通讯作者。罗福莉在这段时间在干这个。而这个小米的MiMo-V2 Flash这个模型,就是用这个论文里边写、所使用的这个方法来训练的。所以这一段时间,他就已经在加入小米了,只是没有对外官宣。10月份罗福莉正式官宣加入了小米,12月17号站台发布了MiMo-V2 Flash。

5. 创新模式的质疑

小米的每一次的科技创新,其实都显得不那么大气。你比如说玄界O1,大家一看就知道,这个芯片基本上走的ARM的这种定制套餐。当然是雷军他自己会否认,说“我们没有做定制套餐,我们还是投入了很多的”。但是你投入了很多备不住,人家有一个套餐,跟你这个玄界O1芯片真的是卡边卡沿,一点都不带差的。他那个套餐里还包括台积电生产,你这个玄界O1也是台积电生产的。但是你说我这个就是没有签那份协议,那他也说得过去。

另外澎湃OS,现在大家都得做手机操作系统嘛,但是小米的澎湃OS,那就是安卓。为什么?因为它小米要在国外卖手机,你把这东西改大发了,你怎么去跟谷歌兼容?你没法在国外销售。对,至于自动驾驶,反正一直属于第二梯队里靠前的,能使但是不算特别好的,也一样把硬件堆齐。小米每一次都是把硬件堆齐,它自动驾驶也是直接塞两颗索尔芯片进去,软件稍微差那么一点点,也就是这样的一个状态。

所以在这样的情况下,你要让整个的资本市场相信,说你是按照我们熟悉的配方、熟悉的套路去做大模型投入了,大家不信。所以发个大模型,股价还跌了。

小米的转型与雷军的“挖人”艺术

那大模型发布会,以及最近小米不断的挖人、积累团队的这些行为,可能意味着小米正在进行转型。小米现在在不断的拉高研发投入。要注意,国内这些科技企业里头,研发投入最高的是谁?是华为。那真的是砸死钱在里头去做研发。你可以不喜欢这公司,但是人家研发投入的钱是真金白银的。做出来的东西怎么样,是另外一回事。有的时候他底层逻辑有问题了以后,他们做出来的东西,也是总会透着那么一点点的诡异。现在小米也是不断的拉高研发投入,然后高调官宣罗福莉的入职,从原来的隐瞒到现在官宣,甚至让罗福莉直接站台去发表演讲。

而且最近还有什么人入职了?前特斯拉“擎天柱”灵巧手的工程师卢泽宇,也入职了小米。以后要做机器人,没有哪个汽车厂说我自己不做机器人的,现在直接挖了特斯拉的人回来干。据说有3,000人的大模型团队,但这件事我是表示怀疑的。马斯克的xAI还没有3,000人,小米整3,000人?你在这熬汤吃,还是在这包包子?这个3,000人的团队里头,到底有多少人是真正能干活的,或者真正能够在大模型底层上,有这种研究能力的?这个事我表示怀疑。

雷军的必杀技:挖人

但是有一点不用怀疑的是什么?就是雷军的有一大技能,就是挖人。雷军挖人的能力,是国内这些CEO里头,应该是绝对第一梯队的。

像雷军做小米手机的时候就是去挖人,他当时直接列了一个表,全世界做安卓的人,排第一是谁,排第二是谁,排第三是谁。甭管排的严不严格了,他反正排了一表,然后就一个一个上去敲门,说来你上小米这来做手机来。那排最前面人都是哪人?都是谷歌的人,因为安卓是谷歌发明的。那雷军就去敲门,人家说“我为什么要离开谷歌,上你们那去?”那雷军怎么办?就坐在人那跟人继续聊天,一聊聊10个小时,20个小时。几天的聊下来,那有些实在聊不下来就算了,但是还是有不少人真的被他挖过来的。然后去找魅族跟人去学习去,学完了以后挖人,最后魅族都快疯了,说你不能这么干。

像雷军算是成名比较早,他很早就成为了金山的高管,所以他这个圈子里头比较有名。他这个隐蔽性又很强,跑到人家那去说“我跟你学习一下”,就是这种工程师的本色,还是比较彰显的。他跑那跟人学习还很谦虚,有一些好为人师的人也是愿意跟他讲,讲完了他就这个顺手,就“七嚓咔嚓”开始挖人了。这个是雷军的一大技能。所以小米早期的人,都是雷军照着名单挖回来,以及到别的厂里头去学习了以后,顺手挖回来的。

小米汽车其实也是这么来的。小米汽车在早期的时候,雷军就跑到吉利去学习去了,说“你们这车造的真好,我好喜欢你们这个东西,你们到欧洲也是收购了很多厂,有这么多好的工程师,我们好好学习一下,看看到底是怎么做这个事情。”人家也是很开放的就跟他聊,聊完了以后,就把吉利的一大票人,全都拎回来了,包括很多莲花的人,就是Lotus的人。Lotus这个品牌,当时也是被吉利收购了。Lotus团队的很多成员都是在国内的,直接被小米连锅端回来了。

现在雷军继续在发挥这个技能,大模型上把罗福莉拎回来,机器人也直接上“擎天柱”那去挖人去了。薄利多销这条路,未必能够走的下去了,必须要转型了。再去堆料,然后去宣传原料、那些不被人注意的小众特点,就是雷式营销法可能走不通了。所以现在真的是要自己做出点技术来了,趁着手上还有现金,需要砸一把了。这就是现在小米可能在干的事情。

小米的大模型矩阵

小米都发了哪些大模型?

  • 2025年4月份发布了 MiMo-7B:这个是一个7B的模型,这个模型是可以在手机上跑的。
  • 5月份发布了叫 MiMo-VL:一般叫VL的模型,都是视觉语言模型,它是有视觉视频推理能力的,或者有视频的识别能力的,我们管它叫多模态模型。我现在在我的汽车上开着开着,我就可以喊:“给我看看前面那什么车?这车多少钱?”他就可以“咔嚓”拍一张照片回来,然后给你讲半天,这什么车,什么牌子,现在多少钱,给你分析半天。这个也挺好玩的。
  • MiMo-Audio:这是一个1.2B的模型,9月份发布的。
  • MiMo Embody:这个模型是11月发布的,其实是自动驾驶和机器人的模型。

现在澎湃OS 1.11版本正在推送,里头就是这个MiMo-Embody的模型。现在这个版本,已经摆在小米SU7的版本上都推完了,小米Yu期的版本还没轮上我,在分批推送。据说推送到手以后的话,它的自动驾驶能力就会得到极大的提升。今天讲的MiMo-V2 Flash模型,12月发布的,所以它发布的这个频数还是很高的。

“人车家全生态”背后的逻辑

那这么多模型都干什么的?MiMo-V2 Flash是作为云端Agent基座来干活的,其他模型都是端侧模型。其他模型都是相对比较小的,直接可以在这个手机上、你的家的冰箱上,或者是汽车上跑。包括语音模型只有1.2B吗,在各种的家用电器上都是可以跑起来的。这个视觉模型也是7B的,就是这些模型都不大。

云端的V2 Flash这个模型,它主要强调的是AI Agent的能力。AI Agent的能力,实际上是可以进行专项的后训练,是相对来说比较容易增强的。还有就是编码能力,这块也是相对比较容易验证和提升的。像小米喊了半天“人车家全生态”,其实是一大堆设备。这些设备的控制都是靠什么?就是一大堆简单的脚本代码。你要给他写一个脚本:先开灯,再怎么转方向,这实际上都是脚本。那么MiMo-V2 Flash在搜索和推理的帮助下,搜集设备上反馈的信息,生成可靠的脚本,进行设备控制。这个故事还是编的圆的。

所以他就是整个这一套:一堆的端侧模型,加上一个非常高速、非常便宜的AI Agent和简单编码模型,形成一整套的大模型体系。

现在所有这些模型都是开源的。小米自己是个硬件设备公司,大模型通通都开源了。以后有开发者想要基于这些设备,再去开发各种应用场景,相对来说的话会容易一些。这就是小米现在的大模型的主要的思路。

总结

最后总结一下:罗福莉发布了极其偏科的新模型,速度快、成本低,AI Agent和编码都还不错,但是确实不太聪明。资本市场的反应极其冷淡。这不再是那个我们熟悉的小米了,小米现在正在转型。未来这条路是不是能够走得通,现在看还非常非常难说。为什么?因为小米在海外,它是可以直接用Gemini模型的,你只有在国内,你才需要上MiMo这些东西。那么省钱省习惯了的小米团队,未必能适应的了大模型的这种投入模式。所以未来到底会走成什么样,咱们还需要看一下。反而是目前为止,资本市场不太认可他们能够转得过这个弯子来。

好,这一期就讲到这里,感谢大家收听。请帮忙点赞、点小铃铛,参加DISCORD讨论群,也欢迎有兴趣、有能力的朋友加入我们的付费频道。再见。


背景图片:

Comments are closed.

退出移动版