DeepSeek融资背后的控制权之争

2026-05-26 作者老范讲故事

DeepSeek 标志性的抽象芯片立在画面中央，周围环绕融资数字、投资机构名牌和控制权箭头，形成一张资本争夺关系图，浅色背景的商业评论版橡皮泥平面信息图的统一风格。

DeepSeek 融资背后的隐秘：大家看到的是数字，但这背后隐藏着哪些争夺呢？

DeepSeek 开始融资的时候，我们做过节目。当时讲了它到底想干什么：开一轮融资，给 DeepSeek 自己做一个定价，来稳定团队。到目前为止，我依然坚持当时的说法，这就是他们当时的目的。

但是你一旦开始融资了，口子开了，很多事情就由不得你了，后边有很多人会冲上来。而这些冲进去的人，也不是梁文锋都可以随意拒绝的。

现在大家看到的数据已经不再是融 3 亿美金、投后估值 100 亿美金了，而是投前估值 450 亿美金，要融 100 亿美金，而且在这个里头，梁文锋自己要出 30 亿美金。现在已经变成这样的一个数字了，已经很难控制了。

我们真正要问的是：

为什么一开始一个融 3 亿美金、投后估值 100 亿美金的案子，突然变成融 100 亿美金、投前估值 450 亿美金、投后可能到 550 亿美金？
梁文锋怎么能够拿出 30 亿美金，或者叫 200 亿人民币？这个钱到底是哪来的？为什么要在这个项目里投这么多钱？难道这仅仅是热爱吗？
腾讯、阿里、IDG、Monolith 这些传闻要加入的基金，到底想在里边干什么？
国家大基金加进去以后，到底会给这个项目带来什么样的变数？
梁文锋拿到这么多钱以后，到底能够把 DeepSeek 带往何方？

DeepSeek V4 发布没炸场，却靠降价掀起革命？

2026-05-01 作者老范讲故事

DeepSeek V4 化作蓝色橡皮泥芯片站在中央，周围是被压低的 Token 价格牌、Coding Plan 订阅盒和被掀起的小桌子，构图像一张商业格局变化总览图，浅色背景的商业评论版橡皮泥平面信息图的统一风格。

DeepSeek V4 终于开始了属于它的革命，只是方法可能出乎了很多人的意料。

革命不是发生在发布当天

DeepSeek 发布之后，很多人的第一反应是：就这？跑分没有炸裂，发布会没有高潮，实际上压根就没有发布会。梁文锋也没有站出来讲一个“AGI 改变世界”的宏大故事，什么都没有。

但是几天之后，真正可怕的事情发生了。DeepSeek 没有推出什么 Coding Plan 或者 Token Plan，也没有把用户锁在一个订阅套餐里，而是直接掀桌子：连续降价。

一只橡皮泥手把写着高 Token 价格和 Coding Plan 的小桌子掀翻，另一侧 DeepSeek 价格牌连续下落形成阶梯，浅色背景的商业评论版橡皮泥平面信息图的统一风格。

这件事情的意义可能比跑分更大。因为它不是在说“我的模型比你强一点”，而是在说：你们靠高 Token 价格，再用 Coding Plan 去捆绑用户的玩法已经结束了。

所以 DeepSeek 这一次的降价，其实是在给现在的 Coding Plan、Token Plan 泼冷水，直接说你们就是在坑人，咱这个才是实在人。

GPT-5.5与DeepSeek V4，AI 竞争进入新格局！

2026-04-27 作者老范讲故事

两条新闻时间线在同一张书桌上交汇，一侧是写着GPT-5.5的现代终端界面，另一侧是写着DeepSeek V4的杭州发布海报，中央摊开的全球AI竞争地图上标出开源、闭源、算力与价格四条路线，羊皮纸，钢笔彩色手绘的统一风格。

GPT-5.5和DeepSeek V4在同一天前后发布，AI竞争进入了一个新格局。2026年4月23日和24日这两天，全球AI产业迎来了一场小小的地震，而且这次地震很有意思。

同日发布背后：AI竞争进入新阶段

对比式双联画面，左边是低调无舞台的OpenAI产品推送界面直接弹出GPT-5.5，右边是杭州会场中DeepSeek V4发布后立刻开源的代码仓库页面与人群，开源与闭源像两股河流正面相撞，羊皮纸，钢笔彩色手绘的统一风格。

GPT-5.5发布后9个小时，DeepSeek在杭州发布了V4。要注意的是，这次发布和前几天GPT Image 2的发布形成了鲜明对比。

OpenAI过去每次发布重要版本，通常都会开发布会，至少也会有线上直播。但这一次什么都没有，直接就上线了。前几天GPT Image 2发布时，Sam Altman还陪着一屋子亚洲面孔的小哥讲了一晚上，除了他之外，剩下的人里大概有两到三个中国人，可能还有一个日本人、一个韩国人，几乎只有他一个白人。然而这次GPT-5.5什么仪式都没有，直接推送给Plus、Pro、Business、Enterprise用户使用。

DeepSeek V4这边则是发布之后直接开源，本身就是一个开源产品。这意味着，全球AI竞争从此进入了一个新的阶段，不再只是比谁家的模型更强，而是开源和闭源、高价和低价、算力自主和算力依赖这几条主线开始正面交锋。

DeepSeek融资别急着冲！100亿美金估值最危险的是退出难！

2026-04-20 作者老范讲故事

夜色中的金融新闻编辑部，一张写着“DeepSeek 3亿美元融资、投后估值100亿美元”的快讯单被按在木桌上，旁边散落放大镜、钢笔、旧式计算器和全球媒体报纸剪影，羊皮纸，钢笔彩色手绘的统一风格。

突然有消息传出，DeepSeek 要融资 3 亿美金，投后估值 100 亿美金。作为一个曾经的投资人，我想跟大家讲一讲这里面几个容易被忽视的点。

消息源与基本背景

两份国际媒体报道摊开放在桌面上，一份标题为The Information，一份为Reuters，报道页边缘压着“4月17日”的日期纸条，桌角有沉默未回应的公司印章，羊皮纸，钢笔彩色手绘的统一风格。

这个消息是什么时候爆出来的？4 月 17 号，The Information 先爆出来，路透社也进行了转发。报道的内容是：据两位知情人士透露，DeepSeek 现在正在进行一轮 3 亿美金的融资，投后估值 100 亿美金。

不过，DeepSeek 官方并没有出来确认或者辟谣，而是选择了沉默。所以我们也不能说，因为是路透社、The Information 这种国际主流媒体报道的，就一定是真的。它们有时候也会出错，只是相对靠谱一点。

今天主要想讲的是，这里面有几个普通人很容易产生的误判。

Deepseek V3.2高分真相：我们被“遥遥领先”忽悠了？Special版跑分超GPT-5，但API成本砍半才是真杀招｜DeepSeek-V3.2、DSA

2025-12-05 作者 Luke Fan

Deepseek V3.2，12月1号发布了。是不是又遥遥领先了呢？

大家好，欢迎收听老范讲故事的YouTube频道。

Deepseek V3.2的发布应该是12月1日。我们始终没有等来心心念念的Deepseek R2。在今年春节的时候，深度求索突然发布了Deepseek R1，算是扔下了一颗深水炸弹，把整个AI圈都震动了，甚至还造成了英伟达股价的闪崩——一段时间内闪崩吧。甚至老黄都跑出来喊，说：“Deepseek发布对我是利好，你们不要卖英伟达的股票。”大家就一直等着这个R1，既然这么厉害，咱们上R2。但是等了这么久，都没有等来R2。

Deepseek V系列版本回顾

下面呢，我们来捋一下Deepseek V系列的版本到底是怎么样的一个发布过程。

Deepseek V3 (去年12月26日发布): 这是非常非常重要的一个版本。实际上我们后面看到的所有版本，包括R1，都是在Deepseek V3的基础上进行微调、进行蒸馏、进行强化学习。今天发布的Deepseek V3.2，也依然是在这个版本的基础上做出来的。
Deepseek V3-0324 (3月24日发布): 主要是在专项能力上做了一些增强，比如说编代码或者写文章。
Deepseek V3.1 (8月21日发布): 主要是工程化和智能体方面做了增强。因为当时大家都要去做AI agent，而之前的版本在AI agent这一块都比较弱。
Deepseek V3.1 Terminals (9月22日发布): 这个版本叫V3.1的终极版，实际上是对V3.1做了一些修复和精调，并告知这是V3.1的最终版本。
V3.2 EXP (9月29日发布): 一个实验版本，在V3.1终极版的基础上加入了DSA技术。最主要的变化是降价，直接把API调用的价格砍了一半。
Deepseek OCR (10月20日发布): 一个很小的模型（约6G），用于图片解释，效果很好。
maths VR (11月27日发布): 专门做数学推理和数学证明的一个版本，在各种数学题测试中评分非常高。
Deepseek V3.2 正式版 & V3.2 special 特别版 (12月1号发布): 本次发布的主角。

10个月血赚近9000万，最后被罚1.77亿！DeepSeek背后程序员如何利用“老鼠仓”掏空公司？监管漏洞全解析｜DeepSeek US China fine prison

2025-11-26 作者 Luke Fan

Deepseek背后的老鼠仓，被罚了1.77亿人民币，这到底是个什么神奇的故事？

大家好，欢迎收听老范讲故事的YouTube频道。

天价罚单：1.77亿的老鼠仓

2025年11月11日发了一个公告，这是浙江证监局行政处罚决定书，处罚一个叫林艺平的人，艺术的艺，平衡的平。这个人呢，是在幻方量化里边做老鼠仓。罚多少钱呢？没一罚一，就是把他的非法所得没收掉，再罚以同样的钱。非法所得8,857.69万元，这哥们还是很能挣钱的。你把这个8,000多万要交出来，再罚8,000多万，加一块1.77亿人民币。

处罚算重还是算轻？

是不是付钱了？没有进一步的消息。付不出来就强制执行呗，上你们家卖房卖车去。如果转移资产，就是要判刑。如果实在付不了的话，估计是会挂失信人员的。然后还处以了5年证券市场禁入，这五年里头不能给人当CFO了。你说一程序员是给谁当CFO去？但是他也不能到股市里边去开户。

那你说这对于他来说，处罚是不是太轻了一点？大概率呢，还会移交公安机关起诉判刑，但是这个呢，并没有在这一次的信息里头披露出来。

其实这还不是中国最大的老鼠仓，但基本上已经算是第一梯队了，绝对是战绩彪炳。最大的呢，应该是华宝基金原基金经理蒋宁的一个案子，用了9个亲友账号，盈利1.14亿，最后呢是有期徒刑5年。所以林艺平大概率最后还是要去坐牢的，只是目前呢，是浙江证监局行政处罚决定书公布出来了，应该是后边还有法院再去判决，所以当前并不确定后续的处理方式。

主角登场：幻方量化与“外包程序员”林艺平

Deepseek背后就是幻方量化。那你说他们家确实炒股是有两把刷子。犯事的这段时间呢，是2022年11月16日至2023年9月6号。如果大家有记忆的话，当时应该是中国股市震荡下行期。但是即使在这样的一个阶段里头，幻方量化还是挣到钱了，就是他们通过量化的交易方式挣钱了。

AI炒币一周战报：DeepSeek凭低频策略狂赚36%，GPT-5惨亏28%，Gemini更是亏掉30%！｜Alpha Arena、AI trading、LLM、Crypto trading

2025-10-22 作者 Luke Fan

在炒币这件事上，DeepSeek完胜GPT和Gemini。

大家好，欢迎收听老范讲故事的YouTube频道。

最近有一件事闹得沸沸扬扬，也就是Alpha竞技场。有一个叫NOFE.AI的实验组织，他们组织了一场由大模型炒币的一个实验。这个实验室的组织者呢，是纽约大学机器学习领域的一位博士候选人，应该算是一个学术组织，并不是一个炒币的机构。他呢，想要让大模型使用真金白银，直接在币市里边去进行竞技，而不是去做什么模拟题，做各种什么模拟盘，直接真金白银开干。

比赛呢，是从10月17日开始，每一个大模型给1万美金的启动资金，到现在呢，胜负已经非常明显了。DeepSeek V3.1完胜，他挣的钱最多。Grok-4紧随其后，也是盈利的。盈利的曲线呢，跟DeepSeek V3.1很像，但是这里呢，并不是因为Grok-4抄了V3.1，或者在DeepSeek的基础上去训练出来的，而是什么呢？就是你市场本身是有一个波动曲线的，他们只要采用相近的策略，他们盈亏的曲线就会比较接近。

再往后呢，是Claude sonnet 4.5，它表现得呢要稍微差一些，但也是盈利的。Qwen3 MAX也参加了，稍微地赚了一点点，大概是挣了几百美金吧，基本没赔。有一个对照组，对照组是什么呢？就是买入比特币直接持有，因为你总要跟市场的大势去进行比较嘛。这个组呢，是挣得要更少一些，大概挣了300多美金。Qwen3 MAX大概挣了700多美金，所以Qwen3 MAX还是跑赢了持币观望组的。

Deepseek V3.1 引爆A股！神秘代码 UE8M0 揭秘，华为升腾背后的“国运”豪赌

2025-08-24 作者 Luke Fan

Deepseek V3.1发布，很多人应该都有疑问，UE8M0到底是个什么东西？这个国运级的大模型，到底有没有翻车呢？

大家好，欢迎收听老范讲故事的YouTube频道。

DeepSeek V3.1发布，为什么会墙内开花墙外香呢？大家说这东西在国外也没多火。咱们讲的墙内开花墙外香，并不是说国外火，而是在圈外火。什么意思呢？就是在真正大模型圈里，其实大家并不怎么说这个事，但是在炒股票的这帮人面前，一下就火了，国产算力芯片一把就飞了。

到底是一个什么样的情况？首先呢，Deepseek V3.1在性能上其实并没有特别显著的提升，所以一帮真正去研究大模型的人，或者去研究AI的人，只能在那尬吹，说这个好像强了一点，那个好像强了一点，但其实都并不明显。它的编程能力呢，确实应该有所上升吧，但是你说现在就可以吊打Claude Sonic 4，这个我觉得有些言过其实了。上下文现在是128K了，在Deepseek去年12月份发布的V3版本以及1月份发布的R1版本的时候呢，它的上下文都是64K的。到V30324和R10528这两个版本呢，就已经升级到128K了，所以这一次的V3.1依然是128K。工具调用上应该是真的增强了，比原来的V3增强了，也更加符合AI agent的一个需求，这个就是他的一个主要的优势。

德国全境禁用DeepSeek只是冰山一角？昔日我们建墙防外，今日欧美反向修墙防内，AI时代的数据主权争夺战已然打响。

2025-07-01 作者 Luke Fan

德国全境禁用DeepSeek，以后这墙要反着修了吗？

大家好，欢迎收听老范讲故事的YouTube频道。2025年6月27日，德国数据保护专员梅克坎普宣布，已经要求苹果和谷歌从德国应用商店下架DeepSeek应用程序了。德国不是第一个，估计应该也不是最后一个。第一个是谁？意大利。意大利在每一次反对AI这件事情上，都是占第一个。原来他还反过OpenAI的ChatGPT。2025年初，也就是R1刚出来的时候，就直接给封了。

欧盟的其他国家现在是一个什么状态呢？他们比较纠结。荷兰是禁止政府手机安装DeepSeek的APP；比利时是建议公务员的手机不要安装，但是不强制；西班牙是有消费者权益组织在呼吁，政府到目前为止没有采取任何的措施；英国表示说他们在持续的监测，目前还没有做出反应。

其他的一些国家对DeepSeek是什么样的一个态度呢？加拿大所有的政府设备禁止使用DeepSeek；丹麦政府设备禁止使用，但是丹麦有5个大区里头，只有3个在执行，剩下两个还在看。

从557万美金训练成本到545%利润，DeepSeek如何用惊悚的数字，震撼AI行业的？这些数字，靠谱吗？

2025-03-04 作者 Luke Fan

DeepSeek也玩“one more thing”，突然公布了它的推理利润达到545%，就像当初557.6万美金的训练成本那样，再次震惊了行业。大家好，欢迎收听老范讲故事的YouTube频道。今天咱们来讲一讲，DeepSeek结束了连续5天的开园周之后，到礼拜六玩了一次“one more thing”。这个“one more thing”呢，应该是当年乔布斯的梗。他每一次开发布会到最后的时候呢，都要说“还有一件事，等一等”，而且这一件事呢，往往是特别重要、特别颠覆性的事情。那么这一次又来了，DeepSeek公布了它的V1和R3推理系统相关内容，及大规模部署的成本和收益数据。就是说我部署了这东西以后，到底是挣了多少钱？非常非常让人震惊，因为所有人做这个东西都说我不挣钱，我亏钱，结果等到他这好，545%的利润，所有人都傻了，说你到底咋干的？

具体的实现方法呢，就不再跟大家详细分析了。简单来说，第一个负载均衡，你想他有这么多的GPU，这么多的核心，在他这种MOE的架构下，他把每一层的模型里边每一个专家，分配到不同的设备上面去进行运算。这个呢，就是一个负载均衡，尽量让所有的芯片都动起来，不要说有的芯片闲着呢，有的芯片在那排队。第二个，并行计算。并行处理是什么呢？所有的芯片一起来干活，这个速度肯定会变快。另外呢，一边干活的时候，另外一边呢，再同时进行数据的读写。你不能说我这需要数据了，你给我读，然后处理完了以后你再去写，这样就变慢了嘛。所以基本上在做这样的事情，负载均衡和并行处理。

另外还有一个什么样的事情在做呢？就是有一点点叫“驴粪蛋表面光”。这个也算是老北京的一个俏皮话，什么意思呢？就是这个驴粪球外边是很光滑的，但是里边呢，就是一堆的没有消化好的碎草。DeepSeek也是如此，他把很多的计算精度呢进行了调整，他尽可能的能够达到大家的要求，但是很多细节上的这些你看不到的环节呢，就给你忽略掉了。