DeepSeek开创的风俗，春节中国模型大爆发？

2026-02-11 作者老范讲故事

中国春节的热闹街景，舞狮队伍中的狮子由精密的电路板和发光芯片组成，象征科技与传统的融合，羊皮纸，钢笔彩色手绘的统一风格。

春节临近，中国各大模型厂商都憋着劲要刷屏，要上大分。

大家好，欢迎收听老范讲故事的YouTube频道。还记得去年春节吗？Deepseek给大家留下了极其深刻的印象，干崩了英伟达的股价，这个真的是非常非常不容易的。而且Deepseek发布之后，整个大模型的竞争就进入了下一个阶段。在Deepseek发布之前，大家还在看着OpenAI在这里优雅的表演各种的杂技；Deepseek发布以后，那大家就直接疯掉了。可以说是一石激起千层浪，所有人都在快速的迭代，快速的去推进各种各样的新模型。去年Deepseek R1的发布，不是说给了大家一个多么强的模型，而是把英伟达和OpenAI彻底拉下了神坛。

今天的故事分几块来讲：

第一个，Kimi 2.5的爆火；
第二个，字节跳动准备了大餐；
第三个，阿里千问3.5已经箭在弦上了；
再往后，Pony阿尔法到底是谁家的还不知道，但是智谱的股票已经涨疯了；
然后，Deepseek江湖上永远的传说；
海外模型厂商也都没闲着，他们也在努力准备应接我们的突袭。

一个深海潜水员手持发光的探照灯，照亮了海底巨大的沉船，沉船上散落着英伟达显卡和OpenAI的标志，羊皮纸，钢笔彩色手绘的统一风格。

腾讯元宝派深度解析：10亿红包能否救活AI社交？

2026-02-01 作者 Luke Fan

一只身穿赛车服的企鹅驾驶着充满未来感的赛车在弯道加速，手里挥舞着巨大的红包，背景是模糊的速度线，羊皮纸，钢笔彩色手绘的统一风格。

腾讯想要押上春节10亿红包，以及积累了多年的社交关系链，在AI领域背水一战，期待弯道超车。但是，决胜点真的在前面咱们说的这些东西上吗？

大家好，欢迎收听“老范讲故事”的YouTube频道。

每次提到腾讯的时候，甭管你说它是“狗日的腾讯”，还是什么样的腾讯，咱们都会想到一些场景。第一个场景是什么？马化腾去接受各种访谈、去参加各种圆桌。每次被问到说：“你跟百度比有什么优势？人家一边是做搜索的，一边是做电商的，你都没做起来；你跟小米比你有什么优势？人家做硬件做的很好，你也没做起来。”马化腾每一次的回复都一样：

“我有10亿用户。”

每次都回复这句。

无数个微小的人物手拉手形成一张巨大的、发光的社交网络，覆盖在地图之上，而旁边零散漂浮着几个孤独的小人，羊皮纸，钢笔彩色手绘的统一风格。

有10亿用户的超级APP，在中国其实不止微信一个，还是有好几个的。但是只有微信上的用户或者是QQ上的用户，是有社交关系链的。这个上面有好友、有群、有各种的关系，这个才是真正最重要的。其他的你比如像抖音，也有10亿用户，但是抖音这个用户都是独立的。我去看抖音看什么东西，跟你去看抖音看什么东西，他没有那么大关系。一旦说大家没有关系了，没有社交关系链在里边，那这个用户的粘性就会下降。你只有带着社交关系链的用户，才是粘性最高的用户。腾讯在中国最底层的价值就在这儿。

“给中国供应芯片等于卖核弹”？Anthropic CEO达沃斯激进言论震惊全场，谷歌DeepMind掌门人为何温和反击？｜AGI Demis Hassabis Dario Amodei

2026-01-23 作者老范讲故事

“给中国供应H200，就是给朝鲜供应核弹。”

大家好，欢迎收听老范讲故事的YouTube频道。

这是2026年达沃斯论坛上，Anthropic CEO阿姆戴伊语出惊人了。达沃斯世界经济论坛最近在开，上头有很多有趣的演讲、有趣的访谈。这一次是在1月20号的一个访谈上，主题叫“AGI之后的一天”，就是我们已经实现AGI了，该怎么办。

主持人是《经济学人》的一位主编，他就去问Anthropic的CEO阿姆戴伊了。他的问题是什么？如何看待美国政府的一种逻辑：我们需要卖给中国芯片，因为我们需要确保通过供应链将他们与美国绑定在一起。

美国政府（黄仁勋）的逻辑 vs. 阿姆戴伊的反驳

其实这不是美国政府的逻辑，这是黄仁勋的逻辑。黄仁勋的意思就是：如果我们不卖给他们芯片，过一段时间他们自己造出来了，可能跟我们这个路线就不一样了，这个更可怕；还不如我们就卖给他，只要我们一直卖给他们芯片，他们就自己不努力了。

从历史上来说也确实如此，中国到现在为止没有自己的操作系统，就是因为原来Windows基本上是不打盗版的，Office其实打盗版打的也不好，所以WPS这些是在非常非常后期才逐渐发展起来的。黄仁勋说咱们也这样，咱只要卖给他芯片，他们就不自己研究了。

这个主持人就问了这样的一个问题，阿姆戴伊的回答是什么？他说：

“这就像是决定向朝鲜出售核武器，仅仅因为这能给波音公司带来利润，或者因为那是波音制造的，就觉得美国赢了。”

他认为这种为了商业利益而扩散极度危险，技术的权衡是完全讲不通的。

中国顶尖大脑闭门承认：我们做不了0到1，只能等美国验证方向后疯狂内卷！算力差距高达百倍，为何说超越机会仅剩20%？｜中美AI競爭 AI競賽中國AI 美國AI AI創新

2026-01-13 作者老范讲故事

中国顶尖AI企业的大脑们：承认中国不擅长做从0到1，但擅长做从1到100

中国顶尖AI企业的大脑们，坐在圆桌会议上，终于承认了中国人不擅长做从0到1，但是很擅长做从1到100。

大家好，欢迎收听老范讲故事的YouTube频道。

中国企业超越美国同行的机会不超过20%。中国企业将算力都用在了做交付上、做确定性的事情；美国则是将更多的算力用在做新方向的探索上。中国一旦发现了明确的方向，会快速赶上，会在很多的点上做的比美国更好。

背景：AGI Next 闭门峰会

这些话是在什么时候传出来的？1月10日，有一个会叫AGI next，算是一个闭门峰会。这个会是刚刚上市的智谱他们组织的。因为是闭门会议，所以我们只看到了一些总结归纳，并没有看到完整的视频。前面有一些演讲，最后有一个圆桌会议，四个人在上面进行讨论。前边咱们讲的这个“暴论”，就是在这个圆桌会议里边出来的。

圆桌会议的四位嘉宾

唐杰：智谱的创始人。他的发言逻辑中充满了矛盾，这种做ToB项目的人很难逻辑自洽的，所以他的发言后边我们会引用的比较少。
杨强：香港科技大学荣休教授，加拿大皇家科学院工程院院士。他站在学术界的角度上，讲的很多东西跟我们日常所熟悉的也是有很大差距的，所以后面引用他的话应该也不多。
姚顺雨：腾讯刚刚从OpenAI挖回来这兄弟，他是CEO总裁办公室首席AI科学家，算是前OpenAI研究员。这哥们是一个绝对的聪明人，很多地方都有独到的见解，逻辑很清晰，但是也很圆滑，不太会踩坑。
林俊旸：这个字我不查还不认识，左边是一个日，不是木——他是阿里巴巴通义实验室、千问的技术负责人。这哥们是个直男，上面那段话就是他说的。很多大实话别人都绕着说，只有他敢直接说。

罗福莉携新模型亮相股价却连跌三天？资本看透了什么：当“堆料之王”试图讲好技术故事，市场为何依旧投出反对票？｜小米AI战略、人车家全生态、高端市场挑战、研发投入

2025-12-19 作者 Luke Fan

罗福莉发布了小米MiMo-V2 Flash新模型，小米股价却应声下跌了

大家好，欢迎收听“老范讲故事”的YouTube频道。

关于 MiMo-V2 Flash 模型发布

12月17号开的发布会，罗福莉终于站上了小米的舞台，发布了新模型 MiMo-V2 Flash。这是一个MoE的模型，这倒是不出乎人意料，因为现在新的模型基本上都是MoE。而且罗福莉作为Deepseek V2的主要创作者，MoE就是从他手里头发扬光大的。

但是MiMo-V2 Flash这样的一个模型，使用了更强的后训练算法，就是前头预训练完了以后，后边做更激进的这种后训练。整个的模型是 309B，也就是3,090亿参数，每一次干活只激活 15B。所以他每一次真正回答问题的时候，激活的参数量是非常非常小的。

这是一个云端模型。别看他只激活15B，在本地是没法跑的。如果你想在电脑上跑的话，基本上三十几B就是到头了。不是说你每次激活多少，而是你总模型量有多少。你比如说我现在有一个72B的模型，每一次激活十几B，在我们电脑上是跑不起来的。所以它这个309B每次激活15B的模型，只能在云端跑。

AI炒币一周战报：DeepSeek凭低频策略狂赚36%，GPT-5惨亏28%，Gemini更是亏掉30%！｜Alpha Arena、AI trading、LLM、Crypto trading

2025-10-22 作者 Luke Fan

在炒币这件事上，DeepSeek完胜GPT和Gemini。

大家好，欢迎收听老范讲故事的YouTube频道。

最近有一件事闹得沸沸扬扬，也就是Alpha竞技场。有一个叫NOFE.AI的实验组织，他们组织了一场由大模型炒币的一个实验。这个实验室的组织者呢，是纽约大学机器学习领域的一位博士候选人，应该算是一个学术组织，并不是一个炒币的机构。他呢，想要让大模型使用真金白银，直接在币市里边去进行竞技，而不是去做什么模拟题，做各种什么模拟盘，直接真金白银开干。

比赛呢，是从10月17日开始，每一个大模型给1万美金的启动资金，到现在呢，胜负已经非常明显了。DeepSeek V3.1完胜，他挣的钱最多。Grok-4紧随其后，也是盈利的。盈利的曲线呢，跟DeepSeek V3.1很像，但是这里呢，并不是因为Grok-4抄了V3.1，或者在DeepSeek的基础上去训练出来的，而是什么呢？就是你市场本身是有一个波动曲线的，他们只要采用相近的策略，他们盈亏的曲线就会比较接近。

再往后呢，是Claude sonnet 4.5，它表现得呢要稍微差一些，但也是盈利的。Qwen3 MAX也参加了，稍微地赚了一点点，大概是挣了几百美金吧，基本没赔。有一个对照组，对照组是什么呢？就是买入比特币直接持有，因为你总要跟市场的大势去进行比较嘛。这个组呢，是挣得要更少一些，大概挣了300多美金。Qwen3 MAX大概挣了700多美金，所以Qwen3 MAX还是跑赢了持币观望组的。

别只盯着股价了，阿里真正的翻盘点在这里：全栈布局+开源大旗，它正在复制英伟达“左手倒右手”的高明玩法｜阿里巴巴 AI 大模型阿里云战略通义千问云计算

2025-10-01 作者 Luke Fan

大家好，欢迎收听老范讲故事的YouTube频道。今天咱们来讲一讲，阿里到底是不是中国的AI之光所在呢？

这几天正在开阿里的云溪大会，9月24号到9月26号开。这一次的口号呢，叫“云智一体，碳硅共生”，提的口号很神奇。当然，最神奇的还不在这，咱们待会往后看神奇在什么地方。4万平米的展厅，500多家企业参与，6万多人到现场，这个是一个非常大规模的会。

那么还宣布了什么呢？与英伟达合作做物理AI。现在呢，谁也不敢宣布说与英伟达合作，买人家的这个RTX6000，现在只能说我们做一个别的合作吧。什么是物理AI呢？就是做机器人相关的AI，做机器人的仿真训练、量化强化学习和仿真测试，做这玩意的。英伟达在这块也确实是很强。阿里呢，也会去投资很多的这种机器人公司，所以这个宣布了以后也是一个重大利好。

而且呢，阿里现在绝对是全世界开源AI领域的扛把子。原来最早的扛把子是Meta，出了Llama，出了这么多模型以后，现在阿里接过了这一面大旗。阿里开源的模型，在Hugging Face上基本上是站到最前面的一批了。以阿里开源模型为基础再微调出来的其他的各种模型有几万个，现在基本上属于事实标准的一个状态。所以只要说开源的大模型，大概率是拿阿里通义千问的这个模型去调出来的。那这点呢，其实也很符合阿里的调性，就阿里的这些模型都属于他没有那种很强的这种个性，或者很强的这种能力，但是指令依存度、逻辑推理能力这块都是达标的，这个还是一个很好的底座。

深度揭秘Grok-2开源：马斯克藏不住的“中国芯”？SGLANG与Deepseek的秘密关系。

2025-08-27 作者 Luke Fan

马斯克终于开源了他的Grok-2。虽迟但到，这背后隐藏着哪些不为人知的秘密呢？

大家好，欢迎收听老范讲故事的YouTube频道。

马斯克最终还是开源了他的Grok-2。原来我们还嘲笑过他，Grok-1开源完了，往那一扔就再也不管它了，有任何人提问题，你也不说什么。Grok 4都出来了，现在Grok 2都没开源出来。马斯克说：“那我们下周开源。”当时是这么讲的。然而下周完了以后，好像还是又等了那么一段时间，稍微晚了这么几天吧，Grok 2最终还是开源出来了。而且承诺呢，6个月之内，或者说在年底之前吧，有可能会去开源Grok 3。但是马斯克的话嘛，大家相信，就是他说了的事会做，但是未必按时间做。

马斯克的开源呢，只能算是符合非常广义的开源。这话什么意思呢？开源也是分原教旨主义者的，他们是肯定不会认可马斯克在开源的。第一个，马斯克不是当时发布产品马上开源，而是要过一段时间，甚至是过了一年多才去开源。而且现在他开源出来的这个版本，远远落后于当前主流模型。当然Grok 2呢也不算特别落后，它在当时刚推出的时候，应该是跟GPT-4不相上下的一个水平，但是跟后边4O，以及后边O1、O2这些东西就没法比了。跟当前的主流模型，像什么GPT-5、Grok-4、Claude 4或者是Gemini 2.5这些，它是比不过的。

DeepSeek R2难产真相！金融时报爆料：华为昇腾芯片训练失败，揭秘国产AI算力的“卡脖子”困境。

2025-08-18 作者 Luke Fan

8月14号，英国金融时报发了一篇报道，说Deepseek R2模型之所以难产，是因为在使用华为升腾芯片训练的时候，持续遇到了技术问题，最后被迫改用了英伟达芯片。甚至透露华为曾经派出一支救火队，常驻在Deepseek，手把手帮忙调教升腾服务器，但仍然无法完成训练。无奈之下，Deepseek只能退回老路训练，重新切换回性能更加可靠的Nvidia的GPU，升腾芯片仅退居辅助，用于模型推理环节。

虽然没有华为和Deepseek官方的回应，也没有他们的辟谣，但是呢，据说是援引了三位知情人士的一些说法，也进行了很多交叉验证，所以这个事情呢，大概率是真的。

国运跟国运相碰撞的时候，升腾也号称是国运级产品，Deepseek肯定是国运级产品，为什么是升腾不灵呢？升腾芯片是可以替代的，也还有一堆竞争对手，所以出现问题以后，他的竞争对手会帮他去宣传。而Deepseek虽然在国内也有模型在追赶，但是地位是不一样的。升腾和国内的其他算力芯片，以及其他那些大模型，从来没有像Deepseek那样震动过世界。所以呢发生碰撞的时候，必须是升腾不行了，不可能是Deepseek不行了。

马斯克重磅发布GROK4：史上最聪明AI大模型横空出世，强化学习碾压GPT-4与Claude，20万张H100显卡大力出奇迹，中美科技差距再度拉大，谁将主导AI未来？

2025-07-15 作者 Luke Fan

史上最聪明的AI大模型GROK4诞生了。马斯克亲自坐镇开发布会。视频发布会呢，并不是特别的顺畅。第一个呢，是他晚了一个小时，也没说为什么。反正马斯克的直播经常会晚。然后呢，太多的东西需要集中发布，上下衔接的呢比较仓促一点。

最早期很多的互联网公司开发布会也是这样的，两三个小时七差咔嚓发一大堆东西。后来OpenAI这些公司习惯了在网上开直播以后呢，就慢慢把这风格改了。改成什么呢？就是每次发一个功能，发个十分钟二十分钟就完事了。然后呢，不停的发，每个月发每个月发。Xai呢，现在还没有彻底学会这件事情，还是一股脑给大家扔了一大堆东西出来。

我们以前在面对创业者的时候，每次都会苦口婆心的去做一种劝告。大家可能不知道会劝什么。作为投资人来说，我们每次看到任何一个创业者，都会上去劝一件事，叫不要憋大招。你一次要惦记着做一个大的东西，就很容易失败。你应该是做一些小的东西，一点一点放出来。OXAI现在还是憋了一个大招。当然了，XAI后面呢，也会每个月发布一个新的工具出来，它也慢慢的向这样的一个方向去前进。