罗福莉携新模型亮相股价却连跌三天?资本看透了什么:当“堆料之王”试图讲好技术故事,市场为何依旧投出反对票?|小米AI战略、人车家全生态、高端市场挑战、研发投入
12 月 19
AIGC, 雷军、小米 DeepSeek, MiMo-V2 Flash, 云端Agent, 人车家全生态, 供应链管理, 商业模式, 大模型应用, 小米AI战略, 小米大模型, 小米汽车, 小米转型, 性价比, 技术护城河, 智能驾驶, 机器人, 混合专家模型, 澎湃OS, 研发投入, 端侧AI, 罗福莉, 股价下跌, 自动驾驶, 自研芯片, 资本市场, 雷军 罗福莉携新模型亮相股价却连跌三天?资本看透了什么:当“堆料之王”试图讲好技术故事,市场为何依旧投出反对票?|小米AI战略、人车家全生态、高端市场挑战、研发投入已关闭评论
罗福莉发布了小米MiMo-V2 Flash新模型,小米股价却应声下跌了
大家好,欢迎收听“老范讲故事”的YouTube频道。
关于 MiMo-V2 Flash 模型发布
12月17号开的发布会,罗福莉终于站上了小米的舞台,发布了新模型 MiMo-V2 Flash。这是一个MoE的模型,这倒是不出乎人意料,因为现在新的模型基本上都是MoE。而且罗福莉作为Deepseek V2的主要创作者,MoE就是从他手里头发扬光大的。
但是MiMo-V2 Flash这样的一个模型,使用了更强的后训练算法,就是前头预训练完了以后,后边做更激进的这种后训练。整个的模型是 309B,也就是3,090亿参数,每一次干活只激活 15B。所以他每一次真正回答问题的时候,激活的参数量是非常非常小的。
这是一个云端模型。别看他只激活15B,在本地是没法跑的。如果你想在电脑上跑的话,基本上三十几B就是到头了。不是说你每次激活多少,而是你总模型量有多少。你比如说我现在有一个72B的模型,每一次激活十几B,在我们电脑上是跑不起来的。所以它这个309B每次激活15B的模型,只能在云端跑。
More
RSS