Deepseek V3.2高分真相：我们被“遥遥领先”忽悠了？Special版跑分超GPT-5，但API成本砍半才是真杀招｜DeepSeek-V3.2、DSA

2025-12-05 作者 Luke Fan

Deepseek V3.2，12月1号发布了。是不是又遥遥领先了呢？

Deepseek V3.2的发布应该是12月1日。我们始终没有等来心心念念的Deepseek R2。在今年春节的时候，深度求索突然发布了Deepseek R1，算是扔下了一颗深水炸弹，把整个AI圈都震动了，甚至还造成了英伟达股价的闪崩——一段时间内闪崩吧。甚至老黄都跑出来喊，说：“Deepseek发布对我是利好，你们不要卖英伟达的股票。”大家就一直等着这个R1，既然这么厉害，咱们上R2。但是等了这么久，都没有等来R2。

Deepseek V系列版本回顾

下面呢，我们来捋一下Deepseek V系列的版本到底是怎么样的一个发布过程。

Deepseek V3 (去年12月26日发布): 这是非常非常重要的一个版本。实际上我们后面看到的所有版本，包括R1，都是在Deepseek V3的基础上进行微调、进行蒸馏、进行强化学习。今天发布的Deepseek V3.2，也依然是在这个版本的基础上做出来的。
Deepseek V3-0324 (3月24日发布): 主要是在专项能力上做了一些增强，比如说编代码或者写文章。
Deepseek V3.1 (8月21日发布): 主要是工程化和智能体方面做了增强。因为当时大家都要去做AI agent，而之前的版本在AI agent这一块都比较弱。
Deepseek V3.1 Terminals (9月22日发布): 这个版本叫V3.1的终极版，实际上是对V3.1做了一些修复和精调，并告知这是V3.1的最终版本。
V3.2 EXP (9月29日发布): 一个实验版本，在V3.1终极版的基础上加入了DSA技术。最主要的变化是降价，直接把API调用的价格砍了一半。
Deepseek OCR (10月20日发布): 一个很小的模型（约6G），用于图片解释，效果很好。
maths VR (11月27日发布): 专门做数学推理和数学证明的一个版本，在各种数学题测试中评分非常高。
Deepseek V3.2 正式版 & V3.2 special 特别版 (12月1号发布): 本次发布的主角。

10个月血赚近9000万，最后被罚1.77亿！DeepSeek背后程序员如何利用“老鼠仓”掏空公司？监管漏洞全解析｜DeepSeek US China fine prison

2025-11-26 作者 Luke Fan

Deepseek背后的老鼠仓，被罚了1.77亿人民币，这到底是个什么神奇的故事？

大家好，欢迎收听老范讲故事的YouTube频道。

天价罚单：1.77亿的老鼠仓

2025年11月11日发了一个公告，这是浙江证监局行政处罚决定书，处罚一个叫林艺平的人，艺术的艺，平衡的平。这个人呢，是在幻方量化里边做老鼠仓。罚多少钱呢？没一罚一，就是把他的非法所得没收掉，再罚以同样的钱。非法所得8,857.69万元，这哥们还是很能挣钱的。你把这个8,000多万要交出来，再罚8,000多万，加一块1.77亿人民币。

处罚算重还是算轻？

是不是付钱了？没有进一步的消息。付不出来就强制执行呗，上你们家卖房卖车去。如果转移资产，就是要判刑。如果实在付不了的话，估计是会挂失信人员的。然后还处以了5年证券市场禁入，这五年里头不能给人当CFO了。你说一程序员是给谁当CFO去？但是他也不能到股市里边去开户。

那你说这对于他来说，处罚是不是太轻了一点？大概率呢，还会移交公安机关起诉判刑，但是这个呢，并没有在这一次的信息里头披露出来。

其实这还不是中国最大的老鼠仓，但基本上已经算是第一梯队了，绝对是战绩彪炳。最大的呢，应该是华宝基金原基金经理蒋宁的一个案子，用了9个亲友账号，盈利1.14亿，最后呢是有期徒刑5年。所以林艺平大概率最后还是要去坐牢的，只是目前呢，是浙江证监局行政处罚决定书公布出来了，应该是后边还有法院再去判决，所以当前并不确定后续的处理方式。

主角登场：幻方量化与“外包程序员”林艺平

Deepseek背后就是幻方量化。那你说他们家确实炒股是有两把刷子。犯事的这段时间呢，是2022年11月16日至2023年9月6号。如果大家有记忆的话，当时应该是中国股市震荡下行期。但是即使在这样的一个阶段里头，幻方量化还是挣到钱了，就是他们通过量化的交易方式挣钱了。

AI炒币一周战报：DeepSeek凭低频策略狂赚36%，GPT-5惨亏28%，Gemini更是亏掉30%！｜Alpha Arena、AI trading、LLM、Crypto trading

2025-10-22 作者 Luke Fan

在炒币这件事上，DeepSeek完胜GPT和Gemini。

大家好，欢迎收听老范讲故事的YouTube频道。

最近有一件事闹得沸沸扬扬，也就是Alpha竞技场。有一个叫NOFE.AI的实验组织，他们组织了一场由大模型炒币的一个实验。这个实验室的组织者呢，是纽约大学机器学习领域的一位博士候选人，应该算是一个学术组织，并不是一个炒币的机构。他呢，想要让大模型使用真金白银，直接在币市里边去进行竞技，而不是去做什么模拟题，做各种什么模拟盘，直接真金白银开干。

比赛呢，是从10月17日开始，每一个大模型给1万美金的启动资金，到现在呢，胜负已经非常明显了。DeepSeek V3.1完胜，他挣的钱最多。Grok-4紧随其后，也是盈利的。盈利的曲线呢，跟DeepSeek V3.1很像，但是这里呢，并不是因为Grok-4抄了V3.1，或者在DeepSeek的基础上去训练出来的，而是什么呢？就是你市场本身是有一个波动曲线的，他们只要采用相近的策略，他们盈亏的曲线就会比较接近。

再往后呢，是Claude sonnet 4.5，它表现得呢要稍微差一些，但也是盈利的。Qwen3 MAX也参加了，稍微地赚了一点点，大概是挣了几百美金吧，基本没赔。有一个对照组，对照组是什么呢？就是买入比特币直接持有，因为你总要跟市场的大势去进行比较嘛。这个组呢，是挣得要更少一些，大概挣了300多美金。Qwen3 MAX大概挣了700多美金，所以Qwen3 MAX还是跑赢了持币观望组的。

Deepseek V3.1 引爆A股！神秘代码 UE8M0 揭秘，华为升腾背后的“国运”豪赌

2025-08-24 作者 Luke Fan

Deepseek V3.1发布，很多人应该都有疑问，UE8M0到底是个什么东西？这个国运级的大模型，到底有没有翻车呢？

大家好，欢迎收听老范讲故事的YouTube频道。

DeepSeek V3.1发布，为什么会墙内开花墙外香呢？大家说这东西在国外也没多火。咱们讲的墙内开花墙外香，并不是说国外火，而是在圈外火。什么意思呢？就是在真正大模型圈里，其实大家并不怎么说这个事，但是在炒股票的这帮人面前，一下就火了，国产算力芯片一把就飞了。

到底是一个什么样的情况？首先呢，Deepseek V3.1在性能上其实并没有特别显著的提升，所以一帮真正去研究大模型的人，或者去研究AI的人，只能在那尬吹，说这个好像强了一点，那个好像强了一点，但其实都并不明显。它的编程能力呢，确实应该有所上升吧，但是你说现在就可以吊打Claude Sonic 4，这个我觉得有些言过其实了。上下文现在是128K了，在Deepseek去年12月份发布的V3版本以及1月份发布的R1版本的时候呢，它的上下文都是64K的。到V30324和R10528这两个版本呢，就已经升级到128K了，所以这一次的V3.1依然是128K。工具调用上应该是真的增强了，比原来的V3增强了，也更加符合AI agent的一个需求，这个就是他的一个主要的优势。

德国全境禁用DeepSeek只是冰山一角？昔日我们建墙防外，今日欧美反向修墙防内，AI时代的数据主权争夺战已然打响。

2025-07-01 作者 Luke Fan

德国全境禁用DeepSeek，以后这墙要反着修了吗？

大家好，欢迎收听老范讲故事的YouTube频道。2025年6月27日，德国数据保护专员梅克坎普宣布，已经要求苹果和谷歌从德国应用商店下架DeepSeek应用程序了。德国不是第一个，估计应该也不是最后一个。第一个是谁？意大利。意大利在每一次反对AI这件事情上，都是占第一个。原来他还反过OpenAI的ChatGPT。2025年初，也就是R1刚出来的时候，就直接给封了。

欧盟的其他国家现在是一个什么状态呢？他们比较纠结。荷兰是禁止政府手机安装DeepSeek的APP；比利时是建议公务员的手机不要安装，但是不强制；西班牙是有消费者权益组织在呼吁，政府到目前为止没有采取任何的措施；英国表示说他们在持续的监测，目前还没有做出反应。

其他的一些国家对DeepSeek是什么样的一个态度呢？加拿大所有的政府设备禁止使用DeepSeek；丹麦政府设备禁止使用，但是丹麦有5个大区里头，只有3个在执行，剩下两个还在看。

从557万美金训练成本到545%利润，DeepSeek如何用惊悚的数字，震撼AI行业的？这些数字，靠谱吗？

2025-03-04 作者 Luke Fan

DeepSeek也玩“one more thing”，突然公布了它的推理利润达到545%，就像当初557.6万美金的训练成本那样，再次震惊了行业。大家好，欢迎收听老范讲故事的YouTube频道。今天咱们来讲一讲，DeepSeek结束了连续5天的开园周之后，到礼拜六玩了一次“one more thing”。这个“one more thing”呢，应该是当年乔布斯的梗。他每一次开发布会到最后的时候呢，都要说“还有一件事，等一等”，而且这一件事呢，往往是特别重要、特别颠覆性的事情。那么这一次又来了，DeepSeek公布了它的V1和R3推理系统相关内容，及大规模部署的成本和收益数据。就是说我部署了这东西以后，到底是挣了多少钱？非常非常让人震惊，因为所有人做这个东西都说我不挣钱，我亏钱，结果等到他这好，545%的利润，所有人都傻了，说你到底咋干的？

具体的实现方法呢，就不再跟大家详细分析了。简单来说，第一个负载均衡，你想他有这么多的GPU，这么多的核心，在他这种MOE的架构下，他把每一层的模型里边每一个专家，分配到不同的设备上面去进行运算。这个呢，就是一个负载均衡，尽量让所有的芯片都动起来，不要说有的芯片闲着呢，有的芯片在那排队。第二个，并行计算。并行处理是什么呢？所有的芯片一起来干活，这个速度肯定会变快。另外呢，一边干活的时候，另外一边呢，再同时进行数据的读写。你不能说我这需要数据了，你给我读，然后处理完了以后你再去写，这样就变慢了嘛。所以基本上在做这样的事情，负载均衡和并行处理。

另外还有一个什么样的事情在做呢？就是有一点点叫“驴粪蛋表面光”。这个也算是老北京的一个俏皮话，什么意思呢？就是这个驴粪球外边是很光滑的，但是里边呢，就是一堆的没有消化好的碎草。DeepSeek也是如此，他把很多的计算精度呢进行了调整，他尽可能的能够达到大家的要求，但是很多细节上的这些你看不到的环节呢，就给你忽略掉了。

DeepSeek引爆硅胶娃娃市场！人工智能加持情感寄托，背后细节全揭秘

2025-02-27 作者 Luke Fan

DeepSeek推动了硅胶娃娃的大卖。大家好，欢迎收听老范讲故事的YouTube频道。DeepSeek确确实实改变了很多的行业与渠道，甚至DeepSeek之后，整个AIGC领域进行了一次大的洗牌，或者进行了一次方向调整。那么，这一次轮到了谁呢？轮到了硅胶娃娃。

这里讲到的硅胶娃娃是一种成人用品，跟儿童玩具是没有关系的。那么，这一次接入DeepSeik大卖的硅胶娃娃是谁家的呢？是广东中山金三完美这样的一个公司，他们做的这个品牌叫WM DOLL。一般好像硅胶娃娃都是这个词。他们呢，把这个DeepSeek加上语音模块，直接集成到了硅胶娃娃里面去，还加上了一些内部的存储单元。就是它可以记住一些主人与硅胶娃娃之间沟通交流的细节，然后下一次你再跟他沟通交流的时候，他可能还记住一部分，所以可以形成非常好的这种情感寄托。

这个娃娃呢，现在在海外大卖，第一批200个扔出去以后秒光。你说200个这玩意有多少？大家注意，硅胶娃娃这个东西，全世界每年也就卖个几千个，已经算是非常非常高的销量了。那么，国内做硅胶材料的各种上市公司呢，股票都大涨。这个金三完美他们是没有上市的，但是给他们供材料的，都已经借上这波东风了。DeepSeek来了，我股票涨了，为什么？没想明白，原来有人做了硅胶娃娃，套了DeepSeek的壳了。这个也真的是破天的富贵就到头上了。

DeepSeek开源力量爆发！Flash MLA登场，英伟达的精准刀法遇到重大挑战！

2025-02-26 作者 Luke Fan

DeepSeek开源周第一炮打响，这次英伟达可真的有的愁了。大家好，欢迎收听老范讲故事的YouTube频道。DeepSeek号称要做开源周，也就是在这一周里边，连续5天发布5个开源项目。那么第一炮打的是什么呢？这个产品叫Flash MLA，这是一个MIT协议的开源项目。待会我们再去讲什么是MIT协议。一天上来就直接获得了几千个星星，就是你把项目发布到GitHub上以后，如果有人喜欢的话会打一个星星。打了星星以后的话，这个项目未来有各种的更新和迭代，我们是会收到通知的。所以很多的开源项目，是用星星的数字来衡量自己项目的受欢迎程度的。

这个项目呢，其实对于绝大多数的使用者来说，短期之内是不会有影响的。什么叫短期？可能就是几个月的时间之内，不会有特别大的变化。但是，可能过了这几个月，这个变化就会逐渐的显现出来。英伟达这次到底能不能挺得住，是会变得好还是会变得坏？这就是我们今天要讲的故事。

英伟达面对Flash MLA这样的一个项目呢，应该有点哭笑不得。为什么呢？这个是必须在英伟达Hopper系列芯片上使用的一个技术，也就是离开英伟达芯片你跑不了。所以这玩意是给英伟达芯片再去做优化。但是呢，这里有个问题，英伟达的H100是被美国禁运的，中国是不可以购买的。中国只可以购买H800，也就是英伟达经过精准的刀法裁切以后的这个版本。它在H800的这个基础上呢进行了提速，这就是这一次的Flash MLA真正给出来的东西。

DeepSeek是否融资迷雾重重——国家资本、阿里巴巴、社保基金都参与了吗？

2025-02-24 作者 Luke Fan

大家好，欢迎收听老范讲故事YouTube频道。今天咱们来讲一讲DeepSeek的母公司——深度求索，是不是正在融资？消息是什么时候出来的？是2月19号传出来的。而且这个消息呢，并不是某人突然发了一条推特，或者发了一个其他的社交媒体，而是有一份报道。这个是The Information这样的一个媒体，做了独家的报道。据说有人参加谈判了，那么是参加这种融资谈判的人出来报的料。

据说参加谈判的有哪些家？第一个是阿里巴巴，然后呢是一些国有资金，包括中投公司、国家主权财富基金、国家社会保障基金，也就是社保基金。在The Information发了邮件去质询DeepSeek，阿里巴巴、中投公司没有回复质询，两位直接了解会谈的人回复了信息。

看到这里，咱们先看看这个到底是在说什么。一共是几家来谈判？DeepSeek自己可能要去参加谈判的，阿里巴巴要去参加谈判的，中投、国家主权财富基金、国家社会保障基金，这些都要去参加谈判呢。现在没有评论的是DeepSeek、阿里巴巴和中投，剩下有两位直接了解会谈信息的人士回复信息。这两个人应该是国家主权财富基金和国家社会保障基金的。那你说是一边一个，还是说这两个人都是属于其中某一个基金的呢？这个就没有办法去判断了。

鲶鱼效应搅翻AI江湖：DeepSeek 671B开源来袭，GPT-5和百度文心一言迎巨大挑战！

2025-02-18 作者 Luke Fan

大家好，欢迎收听老范讲故事的YouTube频道。今天咱们来讲一讲DeepSeek。这条鲶鱼搅浑了水，GPT5要来了，百度也要免费开源了，到底是一个什么样的情况？大模型这个赛道未来会怎么去发展？

DeepSeek呢，算是彻底改变了游戏规则。OpenAI给整个行业挖的坑，到现在呢，还有一些公司没查出来呢。什么坑？就是客户端这个订阅20美金一个月这个坑。这个其实是一个非常失败的商业模式。谷歌到现在还在往外爬，因为谷歌他其实自己不太想爬出来。为什么？因为他一旦爬出来以后的话，谷歌搜索的广告收入就没了，只能在那里头装聋作哑了。Perplexity到现在也还在思考，到底是不是要爬出来。

大家有没有想过一个问题？开源模型，因为DeepSeek是满血版671B的开源模型，它对于OpenAI的伤害，到底是ToB的伤害大，还是ToC的伤害大？这是一个大家值得去思考的事情。虽然现在DeepSeek在很多的C端有非常大的影响力，就是很多的个人去下载这个东西去用去，但其实真正的开源模型影响最大的是B端。我这是一个自己的公司，我是一个政府项目，或者是一个什么样的商业相关的事情，我要去使用大模型的时候，一定是会优先去选择这种完全可控的开源模型，而不是说我去用人家的闭源的，买人家API。因为你一旦是有开源模型的话，你就可以选择完全私有部署，我自己买台服务器往里装就完了。