12 月 05
Luke Fan AIGC , DeepSeek大模型 AI Agent , AI应用成本 , AI模型评测 , API降价 , DeepSeek V3.2 , DeepSeek V3.2 Special , DeepSeek V3.2技术解析 , DeepSeek稀疏注意力 , DSA算法 , Gemini 3 Pro , GPT-5.1 , SGLANG , VLLM , 国产大模型 , 国产算力 , 大模型发展趋势 , 大语言模型 , 开源AI模型 , 推理效率优化 , 数学推理模型 , 深度求索 , 稀疏注意力 , 长上下文处理
VIDEO
Deepseek V3.2,12月1号发布了。是不是又遥遥领先了呢?
大家好,欢迎收听老范讲故事的YouTube频道 。
Deepseek V3.2的发布应该是12月1日。我们始终没有等来心心念念的Deepseek R2。在今年春节的时候,深度求索突然发布了Deepseek R1,算是扔下了一颗深水炸弹,把整个AI圈都震动了,甚至还造成了英伟达股价的闪崩——一段时间内闪崩吧。甚至老黄都跑出来喊,说:“Deepseek发布对我是利好,你们不要卖英伟达的股票。”大家就一直等着这个R1,既然这么厉害,咱们上R2。但是等了这么久,都没有等来R2。
Deepseek V系列版本回顾
下面呢,我们来捋一下Deepseek V系列的版本到底是怎么样的一个发布过程。
Deepseek V3 (去年12月26日发布): 这是非常非常重要的一个版本。实际上我们后面看到的所有版本,包括R1,都是在Deepseek V3的基础上进行微调、进行蒸馏、进行强化学习。今天发布的Deepseek V3.2,也依然是在这个版本的基础上做出来的。
Deepseek V3-0324 (3月24日发布): 主要是在专项能力上做了一些增强,比如说编代码或者写文章。
Deepseek V3.1 (8月21日发布): 主要是工程化和智能体方面做了增强。因为当时大家都要去做AI agent,而之前的版本在AI agent这一块都比较弱。
Deepseek V3.1 Terminals (9月22日发布): 这个版本叫V3.1的终极版,实际上是对V3.1做了一些修复和精调,并告知这是V3.1的最终版本。
V3.2 EXP (9月29日发布): 一个实验版本,在V3.1终极版的基础上加入了DSA技术。最主要的变化是降价,直接把API调用的价格砍了一半。
Deepseek OCR (10月20日发布): 一个很小的模型(约6G),用于图片解释,效果很好。
maths VR (11月27日发布): 专门做数学推理和数学证明的一个版本,在各种数学题测试中评分非常高。
Deepseek V3.2 正式版 & V3.2 special 特别版 (12月1号发布): 本次发布的主角。
More
12 月 02
Luke Fan AIGC Adversarial Poetry , AI Alignment , AI Safety , AI安全 , AI漏洞 , AI红队测试 , Bypass AI Safety , ChatGPT安全 , Deepseek漏洞 , Gemini越狱 , GPT-5安全 , Kimi模型 , LLM Jailbreak , LLM Vulnerability , LLM越狱 , Poetic Prompts , Prompt Engineering , Prompt Injection , Red Teaming , Universal Jailbreak , 人工智能安全 , 单轮越狱 , 大模型越狱 , 安全围栏 , 对抗性诗歌 , 提示词注入 , 模型安全 , 绕过安全机制 , 语言模型攻击
VIDEO
想要让大模型越狱?试试给它写一首诗,很灵的
大家好,欢迎收听老范讲故事的YouTube频道 。
给大模型写诗,大模型就会罔顾安全围栏,把各种违规内容和盘托出。这让我想起以前李连杰演过的一部方世玉的电影,那个里边,方世玉他妈也是一个武功高手,但是呢,方世玉他爸是不会武功的,是一个文人,特别会写诗。武功高手方世玉他妈,只要是听到他爸爸写诗了,马上就浑身酸软,桃花眼就亮了。现在,大模型也跟你玩这套把戏了。
一篇奇葩的论文:《对抗性诗歌》
这东西不是我瞎编的,有人写了论文了,叫做《对抗性诗歌:作为大型语言模型中的通用单轮越狱方法》 。这里头有几个关键词:
待会我们一个一个来去解释他们到底是怎么回事。
这么奇葩的研究,肯定不是一般二般的人能做出来的,这一定是一群文艺青年。意大利ICaro实验室,是罗马萨皮恩扎大学和Dex AI智库的合作项目,把它研究出来的。这个论文呢,是2025年11月19号上传到Archive,2025年11月28号开始有媒体报道。他们通过写诗的方式,让大模型输出违规内容,包括核武器制造的步骤、儿童性虐材料获取的方式、恶意软件编写的技巧。
More
11 月 28
Luke Fan AIGC AGI , AI创业公司 , AI发展方向 , AI安全 , AI小镇做题家 , AI情感判断 , AI未来 , AI模型 , AI泡沫 , AI科研 , Daniel Gross , Ilya Sutskever , NVIDIA , OpenAI , OpenAI创始人 , Safe Superintelligence , Sam Altman , Scaling law , Superintelligence , Transformer瓶颈 , 价值函数 , 大语言模型
VIDEO
伊利尔·苏斯克维的专访:他到底说了些什么?
大家好,欢迎收听老范讲故事的YouTube频道 。
伊列尔·苏斯克维,很多人说:“这哥们是谁?”就是和马斯克、山姆·奥特曼一起创建OpenAI那哥们。在2023年11月份,对山姆·奥特曼进行逼宫以后,休假了很长时间,然后从OpenAI离职的。这一位算是OpenAI的创始人吧,他离职了以后呢,自己闷头去做研究,好长时间没有他的声音了,现在突然出来接受了一次专访。
引言:AI界的科学家与当下的迷茫
首先要注意,这哥们不是一个工程师,他是一个科学家。工程师跟科学家之间还是有很大差异的。使用确定的技术、加大投入、获得可预期的结果,这是工程师干的活;研究不确定的方向,这是科学家干的事情。所以,他是一位科学家。
现在很多人都在讨论AI是不是有泡沫。现在距离走通“最后一步”还有一点点小的差距。到底什么叫“最后一步”?就是AI真正的落地,真正的开始改变很多东西,开始挣钱。这一步现在还是有一点点差距的。但是呢,很多人也在否认AI泡沫的存在。AI虽然没有走通最后一步,但是AI真的带来很多失业。“钱我没挣着,但是我真的把人的工作干掉了。”现在是大家都比较迷茫的一个时间点。
原来那些应该默默无闻做研究的科学家,就携带了巨大的光环跑出来说话了。本来这些科学家说的话呢,应该是在很小的圈子里边流传,但是现在大家看看李飞飞、杨乐坤,包括今天咱们讲的伊利尔说的这些话,也成为了大众讨论的话题。
核心观点一:科学研究与工程研发的转化
“科研现在需要相互转化了”,这就是这一次伊利尔访谈的一个核心观点。你说,科研科研不是一回事吗?不是,科学跟研究是两回事,它是分为“科学研究”和“工程研发”,它是两个不同的概念。
科学研究呢,是在发现方向。发现了方向以后,就可以堆钱、堆算力、堆数据,在各种行业里边进行测试,这个呢都叫工程研发。就像前面他们研究了半天,到底哪个算法是可以把这个大模型做出来的,最后发现Transformer算法是可以搞定的,发现方向了。到发现Transformer方法有效之前,都是在做科学研究。在Transformer出来以后,大家说:“咱们堆钱吧!”玩这个scaling law,就是直接往里头去堆算力、堆数据、堆这些东西了,这就开始玩工程研发了。这个都是确定的东西,我们只管往里堆钱就完了。
工程研发呢,有一个不可避免的问题,就是你万一站到了一个小山头上,朝任何一个方向走都是下坡。工程研发的时候,他也是会寻找更高的一个山头往上爬,但是你爬到一个最高的山头的时候,你就没法往前走了,因为你不知道应该往哪个方向走了。如果有一个离你很近的山头,你还可以去尝试的跳一跳;如果下一个山峰离你非常遥远的话,这个工程研发是没有办法去跨越鸿沟的。那么在这个时候就应该重新走回来,做科学研究了,重新去尝试那些现在不确定的方向。这就是这一次伊利尔访谈的一个核心观点。
所有的科学家最大的能力是不是科学?其实不是这样。所有的科学家,特别是成功的科学家,他们最大的能力是筹措经费和资金。特别是现在这个时间点,任何一项科学研究都是需要海量资金去堆砌的。现在已经不能说科学家坐在家里头,闭门造车多少年,最后研究出一个神奇的东西出来,现在已经过了那个时间点了。
More
11 月 25
Luke Fan AIGC , Google的故事 AI , AI Agent , AI Competition , AI Dominance , AI Ecosystems , AI Race , AI strategy , AI创业公司 , AI开发者 , Anti-gravity IDE , ChatGPT , Future of AI , Gemini , Gemini 3 Pro , Google , Google TPU , Google vs OpenAI , Nano Banana Pro , OpenAI , Startups , 人工智能 , 凛冬将至 , 大模型 , 大模型评测 , 山姆奥特曼 , 微信式逆袭 , 模型即应用 , 行业变革 , 谷歌AI
VIDEO
Gemini 3 Pro和Nano Banana Pro发布之后,OpenAI的山姆·奥特曼开始喊“凛冬将至”了
大家好,欢迎收听老范讲故事的YouTube频道 。凛冬将至(winter is coming),这是一个《权游》里边的梗,大家要小心准备了。以前呢,OpenAI每一次发布会之后,都会有一群的创业公司原地死亡。这次谷歌没有开发布会,直接发布了新产品之后,OpenAI虽然不至于原地死亡,但是凛冬将至了。
奥特曼的内部警告:“凛冬将至”
山姆·奥特曼到底是怎么说的呢?对外肯定不能跌面子,讲的是祝贺谷歌发布了Gemini 3,看起来是一个很棒的模型。但是曝光的一些内部备忘录里边,寒意已经体现出来了。奥特曼罕见的表现出了危机感,直言公司当前的氛围充满了不太妙的低迷气氛,大家都觉得有问题了。
OpenAI如今不得不拼命追赶,谷歌的AI进展可能给OpenAI创造暂时的“经济阻力” 。大家注意,这个词叫“经济阻力”,它的收入可能会有问题。如果收入有问题的话,他前面画的1.3万亿这种大饼,这是会出大问题的,会让整个行业崩塌的。
现在,山姆·奥特曼要求团队进入战时状态,聚焦长远,即便意味着我们在当前阶段会暂时落后,也要押注更有雄心的突破。这个非常非常正确。首先,他承认了“我们现在可能暂时落后”,而且一段时间未必追得上。但是,如果只是跟着谷歌的脚步往前追的话,这是没法整的。因为谷歌最擅长的事情就是极限拉扯、极限迭代升级,你像Chrome到现在100多版了,安卓一年一个大版、一堆的小版,所以任何想在这后边跟版本的人,都会被谷歌拉死的。你要想跟谷歌竞争,一定要跳到谷歌外面去,自己做一些完完全全创新的东西,让用户有感知的东西,这个才是需要去干的活。
而且,山姆·奥特曼讲到,公司的估值虽然很高,但是要清醒看到,我们还有不少的功课要补,AI研发的严冬考验就在眼前,OpenAI必须奋起直追了。这也就是“凛冬将至”的出处。
大家还记得国内互联网企业是什么时候开始喊这句话的吗?谁喊的?任正非喊的。任正非喊“我们要让大家感受到寒意”之后,华为确实有在裁员,但是业绩并没有大的问题。但是华为身边的这些公司,就在大量的原地消失,直接就不见了。这就是凛冬到来的时候,我们会看到的景象。
More
11 月 23
Luke Fan AIGC , Google的故事 4K图像 , AI Studio , AI图像生成 , AI绘画 , Gemini 3 Pro , Gemini API , Gemini使用教程 , Google AI , MidJourney对比 , Nano Banana Pro , Nano Banana Pro价格 , Nano Banana Pro免费 , Nano Banana Pro测评 , PPT设计 , 信息图表 , 图像编辑 , 多图融合 , 多模态AI , 搜索增强绘图 , 文字渲染 , 文生图 , 自然语言修图 , 角色一致性 , 谷歌AI绘画
VIDEO
Nano Banana Pro发布了,它在Nano Banana的基础上到底做了些什么新东西?
大家好,欢迎收听老范讲故事的YouTube频道。
大家等了半天的Nano Banana 2没有来,出来的是Nano Banana Pro。当然,前面Nano Banana Pro也是隐姓埋名,在各种的大模型评测平台上偷跑了好长时间。所以很多人呢,信誓旦旦地说:“我已经用到了这个东西,强的没边了。”现在终于发布出来了。
从Nano Banana到Nano Banana Pro:核心区别是什么?
从名字上呢,一个叫Nano Banana,另外一个呢加了个Pro,它们到底差在哪呢?原来的Nano Banana,其实是叫做Gemini 2.5 Flash image。现在的Nano Banana Pro呢,它背后的模型是Gemini 3.0 Pro image,是两个不同版本。而且一个呢是Flash,一个呢是Pro。Flash一定是比较快,出来的东西呢相对比较粗糙;而Pro的话,出来的东西就会比较笨重了,或者说比较昂贵,而且出来的东西非常非常细致和完善,它们核心的区别就在这里。
Nano Banana也是先在外边测试了很久然后才发布,这个名字也是当时他们测试的时候使用的名字。当然这一次测试呢,并没有叫纳米香蕉,这次换了个名字,因为纳米香蕉这名字你用过了嘛,好像叫GENIMG,大概是这样的一个名字去测试的。
More
11 月 21
Luke Fan AIGC , Meta的故事 Advanced Machine Intelligence , AI pioneer , AI research , AI Startup , AI strategy , AI商业化 , AI教父 , AI科学家 , Alexander Wang , chief AI scientist , Facebook AI , FAIR , godfather of AI , JEPA , launch startup , Llama大模型 , machine intelligence , Meta , Meta AI , Meta AI战略 , PyTorch , world model , Yann LeCun , Yann LeCun leaves Meta , 世界模型 , 人工智能 , 具身智能 , 图灵奖得主 , 大语言模型 , 扎克伯格 , 李飞飞 , 杨乐坤 , 杨乐坤离职 , 非生成式AI
VIDEO
杨乐坤出走Meta:一场关于战略、用人和未来的博弈
大家好,欢迎收听老范讲故事的YouTube频道。
这一天还是来了。前面我们已经猜测了很久,说杨立昆到底什么时候会离开,因为所有人都眼睁睁地看着Meta的AI战略转换方向。亚历山大·汪进入Meta,一个28岁的辍学生,在管理65岁的大学教授和图灵奖得主,这个事一定不能长久。而且前面还对杨立昆手下的FAIR部门进行了600人的裁员。
靴子落地:杨乐坤宣布离职
现在靴子终于落地了。2025年11月19日,当地时间13:20,杨立昆发了一个长文宣布离职了。在这个文章里边,他回顾了一下在Meta待了12年,感谢了小扎和一堆高管,然后准备要去做他的AMI。他这个AMI呢,叫做“高级机器智能”,说:“我在Meta期间就一直在干这件事,现在呢我准备出去了以后接着干。”而且新公司呢,Meta依然还有参与,具体的情况后续再公布。他呢,也终于可以不受Meta的限制,去研究自己的世界模型了。
杨立昆也要去做世界模型,跟李飞飞有些相近。最后咱们再说一下,他的世界模型跟李飞飞的世界模型到底有什么差别。
Meta呢,应该在这个里边还是给了钱的。你请这样的一位大神出去,而且大神在发文的时候还感谢了扎克伯格,那一定还是要给钱的。所以杨立昆未来的公司里头,Meta应该还是一位重要的股东。但是到底给了多少钱,占了多少股份,可能还要等未来Meta的官宣,现在应该公司还在注册过程中吧。
More
11 月 20
Luke Fan AIGC , Google的故事 AI Agent , AI Studio , AI发展趋势 , AI工具调用 , AI编程助手 , Claude 4.5 , Gemini 3 Pro , Generative AI , Google Deepmind , GPT-5.1 , Graph Reasoning , Grok 4.1 , LMArena跑分 , TPU v6 , 人工智能 , 原生多模态 , 合成数据训练 , 多塔MOE , 大模型训练 , 大模型评测 , 投机采样 , 科技前沿 , 谷歌AI , 超强推理 , 过程奖励模型
VIDEO
Gemini 3终于发布了,这一次是真王炸了吧?
大家好,欢迎收听老范讲故事的YouTube频道 。
千呼万唤始出来:Gemini 3的发布背景
2025年11月18日,谷歌Gemini 3 Pro Preview 版本就这么上架了。为什么要用这样的一个词,“就这么上架了呢”?因为第一,它是千呼万唤始出来。大概从10月份开始,大家就开始传说,谷歌要开始上Gemini 3了。传来传去始终也没上来,到11月份说这个月肯定上。我还听说过是11月22号上,还听说过最晚12月份上,大家一直在等待这样的一个产品。
跟它一起传的还有另外一个产品,叫Nano Banana 2 。因为上一次谷歌引起大家关注、引起大家去下载和使用的产品呢,就是Nano Banana 2,这个生图和改图的模型。这一次说Gemini 3跟Nano Banana 2一起来,而且都在进行测试,甚至很多人信誓旦旦说我用到了,我已经看到了。谷歌从Nano Banana一开始,就采用了一个很奇葩的玩法,就是在大模型发布之前,先给它们起个名字,隐姓埋名,跑到其他的这种测试平台上去测试去。大家觉得这个名字很奇怪,不知道是谁,测完了以后发现巨好,这是不是Gemini 3?那个生图模型是不是Nano Banana 2?大家都在猜这种事情。
More
11 月 19
Luke Fan AIGC , 马云和阿里的故事 AI , AI Assistant , AI产品设计 , AI助手 , AI行业分析 , Alibaba , Alibaba Cloud , C-end , ChatGPT , C端应用 , Ecosystem , Gemini , Generative AI , Large Language Models , LLM , Open Source , Qwen , Tech Giant , Tongyi Qianwen , 人工智能 , 内部竞争 , 创新困境 , 千问APP , 大厂创新 , 大语言模型 , 夸克APP , 字节跳动 , 山头主义 , 开源模型 , 来往与微信 , 生成式AI , 电商生态 , 百度 , 科技巨头 , 科技评论 , 腾讯 , 豆包 , 通义千问 , 阿里云 , 阿里巴巴 , 马云
VIDEO
千问APP:阿里的绝地反击,还是又一个“来往”?
千问APP大家都试过了吗?这是阿里的绝地反击,还是又来了一次“来往”一样的故事呢?大厂为什么总是在创新的时候,起个大早,赶个晚集呢?大家好,欢迎收听老范讲故事的YouTube频道 。
千问APP的短暂狂欢与第一印象
千问APP带来了一个短暂的狂欢。阿里这个模型这么强的公司,终于也要出一款APP,C端的APP要去对标ChatGPT了。阿里的股价短暂上涨,然后被一个很奇怪的小作文,据说是有人看了白宫里边泄密的文件,说阿里为中国军方提供服务,马上要接受制裁了,所以阿里股价又跌回去了。
这一次的短暂狂欢呢,来自于一个很拙劣的吹风方式,说阿里在搞一个秘密项目,据说呢是集团高层定的战略,大家都在一起封闭开发,具体在干什么不知道。但是呢,突然发现食堂里边吃大量的粤菜,食堂的师傅被要求做粤菜,这一定是由广东过来的团队在做项目。当时就在吹风说在做千问APP。那么为什么是广东团队在做?待会咱们后边再讲。
产品上线呢,也确实引发了关注。第一天服务器短暂崩了一次。现在新产品上线,如果连服务器都不崩一次的话,好像流程没有走完,所以千问上线的时候也短暂的崩了一下。用起来的感觉呢,一言难尽。我确实把它下载下来用了一下,这个东西说是对标ChatGPT,却是比豆包更“豆包”的一个产品。
More
11 月 17
Luke Fan AIGC AI取代工作 , AI时代生存 , 个人成长 , 中层管理 , 亚马逊CEO , 亚马逊云AWS , 亚马逊大裁员 , 企业扁平化 , 初级程序员岗位 , 安迪杰西 , 岗位削减 , 工作自动化 , 提升工作效率 , 新技能学习 , 未来工作趋势 , 毕业生就业 , 生成式AI , 白领工作危机 , 硅谷裁员潮 , 科技巨头动态 , 科技行业裁员 , 职业发展建议 , 职业经理人 , 职场安全感 , 职场转型 , 自由职业者 , 裁员潮应对 , 超级个体
VIDEO
硅谷大裁员,AI已经开始抢夺人类工作了,到底应该怎么办?
大家好,欢迎收听老范讲故事的YouTube频道 。今天咱们来讲一讲硅谷大裁员,AI已经开始抢夺人类工作了,到底应该怎么办?
从亚马逊大裁员说起:一个行业的缩影
首先,咱们要从亚马逊大裁员开始讲起,因为最近大裁员的就是它。虽然大家都在裁,但是呢,明目张胆、不以为耻反以为荣的就是亚马逊了,说我们要裁3万人,第一批1.4万,应该是过了年以后再裁下一批的1.6万。
在以前,都是说公司玩不下去了才裁员,比如说亏损、利润下滑,这样可以让股市稍微地觉得你在很努力地调整。但是现在这帮裁员的都是收入上升、利润上升、股价创新高的时候说我要裁员,而且一裁就裁这么多。以前都是偷偷地裁一点点,这基本上是10%的比例裁员,非常非常大比例裁员。而且这种消息宣布了以后,股市马上就涨。
现在呢,都是以AI为名进行大裁员。一方面说,要使用AI,你们这些工作被AI替代了,上了AI以后,这么多层级的审批、这么多层级的领导不需要了,要扁平化一点。还有些人呢,说我们把钱省下来去买GPU,我们去建算力中心了。亚马逊裁员基本上就这三个理由。
亚马逊呢,其实只是一个缩影,很多的IT巨头实际上都在裁。今年大概已经裁了有十几万,甚至可能几十万人被裁掉了。应该是昨天吧,美股又在那暴跌,一个原因呢,是大空头还在很努力地做空;另外一个原因就是大家觉得就业数据可能有问题,因为美国政府停摆嘛,所以10月份的通胀数据也没出来。一帮美联储的人出来放鹰来了,说12月份是不是不应该降息了?咱们12月份不降了吧?所以呢,大家比较害怕,因为裁员确实是发生在身边。
More
11 月 17
Luke Fan AIGC AI Agent , AI伦理 , AI安全 , AI生成代码 , AI网络攻击 , AI驱动攻击 , Anthropic , Chatbot安全 , Claude , Claude Code , Cybersecurity , GTG1002 , 中国灰产 , 中国黑客 , 国家支持黑客 , 地缘政治 , 拖库 , 撞库 , 政府机构 , 数据泄露 , 渗透测试 , 漏洞扫描 , 科技公司 , 网络安全威胁 , 网络间谍 , 金融机构 , 黑客组织
VIDEO
Anthropic抓住中国间谍了吗?
大家好,欢迎收听老范讲故事的YouTube频道 。
Anthropic信誓旦旦的公告里边说抓到中国间谍了,但是里面很多细节非常的模糊不清。11月13号,Anthropic发了一个长文,叫《挫败首次披露的AI协助网络间谍活动》,认定幕后是一个中国国家支持的黑客组织,而且他认为幕后是中国国家级支持,是非常高置信度的一个事情。他给这个组织起了一个名字叫GTG1002。但是呢,这个组织的名字并不是现实世界中常用命名黑客组织的APT编号,而是一个叫GTG的一个编号。所以很多安全圈的人就对此提出了一些质疑,说你到底找没找到人。
具体这帮人干了些什么呢?造成了多大危害?只进行了描述,没有细节。当然这也可以理解了,很多这种安全事件都是不会描述细节的,因为描述细节以后容易造成模仿,也会让被伤害的人受到进一步的伤害。告诉你说谁家的信息被偷了,这个可能本身没什么大事的,一下就股价崩了,可能会出现这种事情。所以呢,一般都不会披露特别多的细节。
那么为什么认定这是中国国家支持的黑客组织呢?也许更多的来自于臆测,咱们后边一步一步分析。
More
Older Entries