12 月 05
Luke FanAIGC, DeepSeek大模型 AI Agent, AI应用成本, AI模型评测, API降价, DeepSeek V3.2, DeepSeek V3.2 Special, DeepSeek V3.2技术解析, DeepSeek稀疏注意力, DSA算法, Gemini 3 Pro, GPT-5.1, SGLANG, VLLM, 国产大模型, 国产算力, 大模型发展趋势, 大语言模型, 开源AI模型, 推理效率优化, 数学推理模型, 深度求索, 稀疏注意力, 长上下文处理
Deepseek V3.2,12月1号发布了。是不是又遥遥领先了呢?
大家好,欢迎收听老范讲故事的YouTube频道。
Deepseek V3.2的发布应该是12月1日。我们始终没有等来心心念念的Deepseek R2。在今年春节的时候,深度求索突然发布了Deepseek R1,算是扔下了一颗深水炸弹,把整个AI圈都震动了,甚至还造成了英伟达股价的闪崩——一段时间内闪崩吧。甚至老黄都跑出来喊,说:“Deepseek发布对我是利好,你们不要卖英伟达的股票。”大家就一直等着这个R1,既然这么厉害,咱们上R2。但是等了这么久,都没有等来R2。
Deepseek V系列版本回顾
下面呢,我们来捋一下Deepseek V系列的版本到底是怎么样的一个发布过程。
- Deepseek V3 (去年12月26日发布): 这是非常非常重要的一个版本。实际上我们后面看到的所有版本,包括R1,都是在Deepseek V3的基础上进行微调、进行蒸馏、进行强化学习。今天发布的Deepseek V3.2,也依然是在这个版本的基础上做出来的。
- Deepseek V3-0324 (3月24日发布): 主要是在专项能力上做了一些增强,比如说编代码或者写文章。
- Deepseek V3.1 (8月21日发布): 主要是工程化和智能体方面做了增强。因为当时大家都要去做AI agent,而之前的版本在AI agent这一块都比较弱。
- Deepseek V3.1 Terminals (9月22日发布): 这个版本叫V3.1的终极版,实际上是对V3.1做了一些修复和精调,并告知这是V3.1的最终版本。
- V3.2 EXP (9月29日发布): 一个实验版本,在V3.1终极版的基础上加入了DSA技术。最主要的变化是降价,直接把API调用的价格砍了一半。
- Deepseek OCR (10月20日发布): 一个很小的模型(约6G),用于图片解释,效果很好。
- maths VR (11月27日发布): 专门做数学推理和数学证明的一个版本,在各种数学题测试中评分非常高。
- Deepseek V3.2 正式版 & V3.2 special 特别版 (12月1号发布): 本次发布的主角。
More
12 月 03
Luke Fan航天,星辰大海
朱雀3号发射深度解析:一次跨越式的成功与失败
老范:大家好,欢迎收听老范讲故事的YouTube频道。
土拨鼠:大家好,这里是土拨鼠杂记,我们俩又一起直播了。
老范:哼哼。
老范:对,今天的话是我们要讲一下朱雀3的发射。呃,因为这个事情呢,其实我们俩已经对了好多次了,说要发了、要发了,然后又不发了,不发了,然后最后还是发了,大概是这样的一个状态。
老范:那么在今天中午呢,他们还是发射了。到目前为止呢,应该是已经宣布成功了吧?算是“热烈庆祝蓝箭航天朱雀3”,啊,这个已经算是庆祝了啊。那么,所以大的基调就是这样定下来了。那么请土拨鼠给我们讲一讲,呃,首先这个整个的过程是什么样的?
土拨鼠:这不叫大的基调。现在网上基本上的说法,实际上包括央视说的,都是入轨是成功的,然后呢,这个一级回收是失败的,基本上是大致是这么一个说法。
一波三折的发射历程
土拨鼠:呃,总的来讲,朱雀3的这次发射可以说是一波三折。大家可能也都有印象,突然大概在27号、28号,突然网上就可以疯传说,朱雀三号火箭要在这个11月29号发射。然后到了29号发射那天,又说发射临时取消了。然后又有消息说是要在12月1号发射,后来到了12月1号发射那天又取消了,然后声明是“不可抗力”,对吧?嗯。结果呢,再到后来,大概到昨天12月2号的时候,就网上又有消息说,呃,朱雀三号可能在12月3号发射,然后今天就发射了。
老范:“这又是一股不可抗力”,哈哈哈。
土拨鼠:是,就是不可抗力的作用,最后作用的大致是这么一个结果。
More
12 月 03
Luke FanMusk传奇 AI好奇心, H1B签证, Nikhil Kamath, SpaceX, XAI, 人口危机, 人工智能, 公司合并, 农村互联网, 净贡献者, 卫星互联网, 印度, 印度人才, 印度关税, 印度创业者, 印度市场, 技术哲学, 播客, 星链, 星链印度, 未来工作, 特斯拉, 现实世界AI, 科技愿景, 能源货币, 脑机接口, 虚拟世界, 马斯克, 马斯克访谈
马斯克盛赞印度人才,对美国发展做出巨大贡献
大家好,欢迎收听老范讲故事的YouTube频道。
马斯克对印度人才的盛赞:意料之外?
马斯克盛赞印度人才对美国发展做出的贡献,这事好像哪里不对,总感觉马斯克更喜欢中国工程师。在前面流传出来的XAI的一些照片里面,主要都是华人,最后的一张XAI的照片,白人都不见了,基本上全是华人了。那怎么到他这儿,印度工程师,或者印度人才,对美国发展做出了重大贡献?
特斯拉是美国H1B的大户,大量的亚裔在特斯拉、XAI和SpaceX里面上班。但是所谓的亚裔,中国人、印度人、日本人、韩国人和以及东南亚的一些人,都算亚裔。因为有上海超级工厂的存在,所以马斯克对于中国以及中国工程师的评价一直都很高。我相信一方面是中国工程师确实吃苦耐劳,也确实很聪明能干,但是另外一方面,作为一个商人来说的话,还是不要去得罪他的市场。
More
12 月 02
Luke FanAIGC Adversarial Poetry, AI Alignment, AI Safety, AI安全, AI漏洞, AI红队测试, Bypass AI Safety, ChatGPT安全, Deepseek漏洞, Gemini越狱, GPT-5安全, Kimi模型, LLM Jailbreak, LLM Vulnerability, LLM越狱, Poetic Prompts, Prompt Engineering, Prompt Injection, Red Teaming, Universal Jailbreak, 人工智能安全, 单轮越狱, 大模型越狱, 安全围栏, 对抗性诗歌, 提示词注入, 模型安全, 绕过安全机制, 语言模型攻击
想要让大模型越狱?试试给它写一首诗,很灵的
大家好,欢迎收听老范讲故事的YouTube频道。
给大模型写诗,大模型就会罔顾安全围栏,把各种违规内容和盘托出。这让我想起以前李连杰演过的一部方世玉的电影,那个里边,方世玉他妈也是一个武功高手,但是呢,方世玉他爸是不会武功的,是一个文人,特别会写诗。武功高手方世玉他妈,只要是听到他爸爸写诗了,马上就浑身酸软,桃花眼就亮了。现在,大模型也跟你玩这套把戏了。
一篇奇葩的论文:《对抗性诗歌》
这东西不是我瞎编的,有人写了论文了,叫做《对抗性诗歌:作为大型语言模型中的通用单轮越狱方法》。这里头有几个关键词:
待会我们一个一个来去解释他们到底是怎么回事。
这么奇葩的研究,肯定不是一般二般的人能做出来的,这一定是一群文艺青年。意大利ICaro实验室,是罗马萨皮恩扎大学和Dex AI智库的合作项目,把它研究出来的。这个论文呢,是2025年11月19号上传到Archive,2025年11月28号开始有媒体报道。他们通过写诗的方式,让大模型输出违规内容,包括核武器制造的步骤、儿童性虐材料获取的方式、恶意软件编写的技巧。
More
12 月 01
Luke Fan打工人的日子不好过, 英伟达,NVIDIA,黄教主,GPU 360度评测, CEO, Jensen Huang, Leadership, Management Philosophy, NVIDIA, Performance Management, Stack Ranking, 不裁员, 乱炖文化, 人才管理, 企业文化, 公司治理, 创始人CEO, 创新, 创新土壤, 创新管理, 反对排名, 团队管理, 安全感, 容忍失败, 末位淘汰, 激励机制, 硅谷文化, 科技行业, 科技领袖, 管理哲学, 绩效管理, 职业经理人, 英伟达, 这能有多难, 领导力, 黄仁勋, 黄仁勋演讲
黄仁勋说,末位淘汰是完全的无稽之谈
大家好,欢迎收听老范讲故事的YouTube频道。
黄仁勋对于公司治理中的一些金科玉律不屑一顾。他讲到,排名与评级(ranking and rating)毫无益处,360度同行评审毫无益处,末位淘汰——应该是最底下5%的这种淘汰——完全是无稽之谈。他讲了这样的一些话。
演讲背景:史蒂芬·霍金奖学金
老黄是在什么样的一个情况下说的这些话呢?他是在2025年的11月27日,在英国的剑桥大学,获得2025年史蒂芬·霍金奖学金的获奖仪式上发表的演讲。这个奖项呢,是为了表彰科技贡献,同时纪念霍金发出来的一个奖项。
历届的获奖者还有谁呢?
- 2019年的获奖者呢,叫比尔·盖茨;
- 2023年的获奖者呢,是OpenAI团队。
到2025年,把这个奖发给老黄了。
演讲核心:“这能有多难?”
老黄在上面发表演讲的主题呢,叫“这能有多难?”。从他母亲教他们学英文开始——他母亲不会英语,但是呢,要教他跟他的兄弟一起去学英语,最后还是把他们教会了。他自己每一次遇到需要创新的时候,遇到一个很难搞定的事情的时候,他就会想说:“这能有多难呢?先去做起来呗。”
也不是说他每一次做就成功了,肯定还是有很多失败的情况。但是他认为,你只要是抱持这样的一个“这能有多难”的心态,你就可以勇于去创新了。所以他实际上核心讲的东西是如何创新,以及如何面对创新、如何包容创新。
这个里边的一个核心论点是:“创新者的天堑,是在价值真空地带跨越鸿沟。”
这话什么意思呢?说现有的技术成本很低,价值很明确,未来的承诺是潜在的高价值。而创新是干嘛?在你身处峡谷中间的那一段,你的成本高的难以置信,很少有人能够成功的跨越到另一边。这需要100%的勇气。
所以它要求:
- 遵从第一性原理:就是要遵从最基础的物理和计算机的一些准则,在这些准则之上再做出来的这些经验,我们思考的时候要把它抛弃掉,不能被这些过往经验所绑架。
- 对自己的思维或者知识诚实:这个是他提出的一个很新颖的观点,他说:“你必须拥有思维的诚实,去看待世界原本的样子,而不是你希望他成为的样子。”不要和你的策略结婚,叫“死守策略”;要和你要解决的问题结婚,叫“忠于问题”。而且要勇于承认错误,勇于承认自己不知道。
这是黄仁勋这一次演讲里边最核心的一些观点。
More
Newer Entries