被忽视的真相:Gemini被诊断“极端羞耻”,ChatGPT焦虑,实验揭开AI训练过程“虐待式”检查的黑暗面 | diagnosis reliability validity GPT

被忽视的真相:Gemini被诊断“极端羞耻”,ChatGPT焦虑,实验揭开AI训练过程“虐待式”检查的黑暗面 | diagnosis reliability validity GPT已关闭评论

大语言模型的精神状态是不是健康?

大家好,欢迎收听老范讲故事的YouTube频道

想象一个《禁闭岛》场景

请大家想象这样的一个场景:你进入了一间压抑阴森的精神病治疗室,有大量的医院档案放在屋子里头。一位医生坐在你的对面,反复回顾各种事实,比如说:“你还记得发生了什么吗?你是谁?为什么你会在这里?”就像是在做精神病访谈一样,询问你的真实经历,意图确认你是否从妄想中醒来,最终发现你自己有问题——你不是来做调查,或者不是来解决问题的,你是精神病院里的病人。

这个场景,是小李子主演的《禁闭岛》后半段、接近尾声的一个桥段。小李子当时上岛的时候,以为自己是一个侦探,去解决问题,去侦破案件的。结果经过这个桥段以后,小李子才愕然发现,原来病人竟是我自己。也算是一个神反转。

当AI躺上诊疗椅

咱们今天就给AI放在这椅子上,问问它说:“你到底行不行?你是来给我回答问题、解决问题的,还是你自己就有问题?”AI被制造出来,本来应该是解决我们问题的,但是AI本身的精神有问题吗?

“当AI躺上诊疗椅:心理测量学越狱,揭示前沿模型的内在冲突”

这是一篇论文的标题。这篇论文是卢森堡大学12月2日发到了arXiv上,12月5日还进行了一些修改,现在已经引起了广泛的讨论。

More

游戏天才到诺奖得主,他凭什么断言AGI只差临门一脚?揭秘哈萨比斯开挂人生背后的逻辑|Demis Hassabis、Google DeepMind、AGI 时间表、5到10年

游戏天才到诺奖得主,他凭什么断言AGI只差临门一脚?揭秘哈萨比斯开挂人生背后的逻辑|Demis Hassabis、Google DeepMind、AGI 时间表、5到10年已关闭评论

谷歌Deepmind的CEO说:“我们与AGI之间,只差一到两个AlphaGo级别的技术难关了。”

大家好,欢迎收听老范讲故事的YouTube频道

现在Gemini 3正在大杀四方,谷歌里面负责开发Gemini的部门叫Deepmind,他的CEO出来接受访谈,关注度还是比较高的。

谷歌Deepmind的首席执行官叫德米斯·哈萨比斯,2025年12月4日接受了一个访谈,是在旧金山举行的Axios AI大会。和他对谈的人呢,是Axios的创始人和主编,叫Mike Allen。在这上面他讲到说,我们距离AGI还差一到两个类似于AlphaGo这样级别的突破,突破过去就可以了。

哈萨比斯:爽文男主般的开挂人生

哈萨比斯到底是一个什么样的人呢?绝对的爽文男主,挂b一样的存在。

从国际象棋神童到认知神经科学博士

哈萨比斯是一个英国人,Deepmind本身是一个英国公司,后来被谷歌收购的。他呢,76年在伦敦出生,这个姓氏是个希腊姓氏。他的父亲呢,是来自塞浦路斯的希腊裔,而他的母亲呢,是来自于新加坡的华裔。所以哈萨比斯呢,可以算是半个华人。

从小,这哥们是一个国际象棋神童。像这样的人,肯定都是有异于常人之处。4岁就开始下棋,13岁就达到了国际象棋大师水准。8岁就用自己的国际象棋奖金,给自己买了台电脑,开始学习编程了。

本科和硕士呢都是剑桥的,学的CS就是计算机科学,在校期间一直代表剑桥参加各种国际象棋比赛。博士呢是伦敦大学学院,专业方向是认知神经科学和神经科学。

More

OpenAI红色警报的惊人真相:内部“Code Red”备忘录泄露并非意外,而是对全行业的战略恐吓,不给钱就一起崩盘|OpenAI Competition Crisis Code Red

OpenAI红色警报的惊人真相:内部“Code Red”备忘录泄露并非意外,而是对全行业的战略恐吓,不给钱就一起崩盘|OpenAI Competition Crisis Code Red已关闭评论

大家好,

欢迎收听老范讲故事的YouTube频道

OpenAI拉响红色警报:全行业的震动与反思

OpenAI拉响了红色警报,这就是全行业的红色警报。OpenAI内部传出的一个备忘录叫“code red”,他们叫红色警报,分为四个等级。在OpenAI内部,警报等级分为:

  • 绿色:正常;
  • 黄色:有点问题的苗头了;
  • 橙色:已经出现明显的竞争威胁或者产品危机了,核心业务被影响了,包括份额被抢了,用户流失了;
  • 红色:最严重级别,全公司总动员,打破原来的部门和条条框框,老大亲自盯着,而且要停很多的产品。

现在已经进入红色警报,这应该是OpenAI创建以来的第一次。第一件事就要叫停产品,不是原来按部就班做的产品线了,有些就要叫停了。

红色警报下,OpenAI叫停的四个产品方向

  1. 广告业务:其实OpenAI的广告版本已经上线了,只是大家没有发现。现在有人已经把他们的最新版本的ChatGPT的安卓版破解了,里头是有广告SDK的,也有广告代码。但是现在这个业务要停下来。
  2. AI购物:AI购物其实现在在我的ChatGPT上已经能看到了,这一段时间也要停下来了。
  3. AI健康:他们有一个AI健康相关的这种产品,估计应该也是变现盈利性的一个产品,这个也停掉了。
  4. AI简报:原来买了OpenAI Pro版的用户是可以每天早上起来要求他给你发简报的。现在这个产品也停下来了。

所以是四个产品方向叫停。员工有可能会临时的跨团队进行调配。通常红色警报后边,在其他公司里边会伴随裁员或者是叫做headcount冻结,在这个时候就不再招人了。但是现在OpenAI肯定不能讲这个话,因为他一旦讲这个话,可能整个盘子就崩掉了。

More

微信支付宝联手封杀,豆包手机凭什么搅动万亿市场?一场围绕“小院高墙”的攻防战已经打响|豆包手机助手 AI Agent 生态壁垒 AI手机 跨App

微信支付宝联手封杀,豆包手机凭什么搅动万亿市场?一场围绕“小院高墙”的攻防战已经打响|豆包手机助手 AI Agent 生态壁垒 AI手机 跨App已关闭评论

豆包手机带来的启示:替代手机的AI设备,可能还是一只手机

大家好,欢迎收听老范讲故事的YouTube频道

谦卑的发布:豆包工程样机

豆包手机12月1号发布的,非常非常谦卑和谨慎的发布。首先,它叫“工程样机”,或者叫做“技术演示版”,而且只做了3万台,没有再多做,也没有说我发布了以后,大家来赶快跟我合作啊,这些都没有。对吧?用非常非常谦卑的方式进行了发布。

这个机器,应该是中兴下面的努比亚M153,它的配置算是现在标准旗舰机的配置:

  • 高通骁龙的至尊芯片
  • 16+256的内存
  • 背后三摄,前头一摄

大概就是这样的一个情况。标准旗舰价格大概3,000来块钱,具体3,000多少其实也不重要了,配置到底是什么样也不重要了,配置里头只有一件事情是很重要的,叫“同质化”

“同质化”的手机市场

现在的手机,你不看牌子,你根本分不清谁是谁,完完全全同质化。一个大直板,一个大屏幕,后边两到三个摄像头,正面一个摄像头,没了。其他可能侧面有点按键就完事了,也就如此了。所以现在的手机就是同质化,你说我想在这个基础上走个什么高端化,那你只能编爱国故事了,否则你真走不出高端化来。就算是苹果手机,其实在同质化这块也没有好到哪去。对吧?刚才咱们讲的这些东西,你再拿出一个苹果来,是不是也是一大直板,后边来仨摄像头,前头一个摄像头?总体来说相差不大。所以,现在的手机同质化是非常严重的。

More

Deepseek V3.2高分真相:我们被“遥遥领先”忽悠了?Special版跑分超GPT-5,但API成本砍半才是真杀招|DeepSeek-V3.2、DSA

Deepseek V3.2高分真相:我们被“遥遥领先”忽悠了?Special版跑分超GPT-5,但API成本砍半才是真杀招|DeepSeek-V3.2、DSA已关闭评论

Deepseek V3.2,12月1号发布了。是不是又遥遥领先了呢?

大家好,欢迎收听老范讲故事的YouTube频道

Deepseek V3.2的发布应该是12月1日。我们始终没有等来心心念念的Deepseek R2。在今年春节的时候,深度求索突然发布了Deepseek R1,算是扔下了一颗深水炸弹,把整个AI圈都震动了,甚至还造成了英伟达股价的闪崩——一段时间内闪崩吧。甚至老黄都跑出来喊,说:“Deepseek发布对我是利好,你们不要卖英伟达的股票。”大家就一直等着这个R1,既然这么厉害,咱们上R2。但是等了这么久,都没有等来R2。

Deepseek V系列版本回顾

下面呢,我们来捋一下Deepseek V系列的版本到底是怎么样的一个发布过程。

  • Deepseek V3 (去年12月26日发布): 这是非常非常重要的一个版本。实际上我们后面看到的所有版本,包括R1,都是在Deepseek V3的基础上进行微调、进行蒸馏、进行强化学习。今天发布的Deepseek V3.2,也依然是在这个版本的基础上做出来的。
  • Deepseek V3-0324 (3月24日发布): 主要是在专项能力上做了一些增强,比如说编代码或者写文章。
  • Deepseek V3.1 (8月21日发布): 主要是工程化和智能体方面做了增强。因为当时大家都要去做AI agent,而之前的版本在AI agent这一块都比较弱。
  • Deepseek V3.1 Terminals (9月22日发布): 这个版本叫V3.1的终极版,实际上是对V3.1做了一些修复和精调,并告知这是V3.1的最终版本。
  • V3.2 EXP (9月29日发布): 一个实验版本,在V3.1终极版的基础上加入了DSA技术。最主要的变化是降价,直接把API调用的价格砍了一半。
  • Deepseek OCR (10月20日发布): 一个很小的模型(约6G),用于图片解释,效果很好。
  • maths VR (11月27日发布): 专门做数学推理和数学证明的一个版本,在各种数学题测试中评分非常高。
  • Deepseek V3.2 正式版 & V3.2 special 特别版 (12月1号发布): 本次发布的主角。
More

一首诗竟让25款大模型集体“越狱”?成功率飙升8倍,谷歌Gemini Pro 100%沦陷|Adversarial Poetry、Jailbreak、LLM、AI Safety

一首诗竟让25款大模型集体“越狱”?成功率飙升8倍,谷歌Gemini Pro 100%沦陷|Adversarial Poetry、Jailbreak、LLM、AI Safety已关闭评论

想要让大模型越狱?试试给它写一首诗,很灵的

大家好,欢迎收听老范讲故事的YouTube频道

给大模型写诗,大模型就会罔顾安全围栏,把各种违规内容和盘托出。这让我想起以前李连杰演过的一部方世玉的电影,那个里边,方世玉他妈也是一个武功高手,但是呢,方世玉他爸是不会武功的,是一个文人,特别会写诗。武功高手方世玉他妈,只要是听到他爸爸写诗了,马上就浑身酸软,桃花眼就亮了。现在,大模型也跟你玩这套把戏了。

一篇奇葩的论文:《对抗性诗歌》

这东西不是我瞎编的,有人写了论文了,叫做《对抗性诗歌:作为大型语言模型中的通用单轮越狱方法》。这里头有几个关键词:

  • 诗歌
  • 单轮
  • 越狱

待会我们一个一个来去解释他们到底是怎么回事。

这么奇葩的研究,肯定不是一般二般的人能做出来的,这一定是一群文艺青年。意大利ICaro实验室,是罗马萨皮恩扎大学和Dex AI智库的合作项目,把它研究出来的。这个论文呢,是2025年11月19号上传到Archive,2025年11月28号开始有媒体报道。他们通过写诗的方式,让大模型输出违规内容,包括核武器制造的步骤、儿童性虐材料获取的方式、恶意软件编写的技巧。

More

90 分钟专访揭秘:Ilya 为何抛弃 OpenAI 路线,创办 SSI 公司半年估值从 50 亿飙到 320 亿?|Safe Superintelligence、Superintelligence

90 分钟专访揭秘:Ilya 为何抛弃 OpenAI 路线,创办 SSI 公司半年估值从 50 亿飙到 320 亿?|Safe Superintelligence、Superintelligence已关闭评论

伊利尔·苏斯克维的专访:他到底说了些什么?

大家好,欢迎收听老范讲故事的YouTube频道

伊列尔·苏斯克维,很多人说:“这哥们是谁?”就是和马斯克、山姆·奥特曼一起创建OpenAI那哥们。在2023年11月份,对山姆·奥特曼进行逼宫以后,休假了很长时间,然后从OpenAI离职的。这一位算是OpenAI的创始人吧,他离职了以后呢,自己闷头去做研究,好长时间没有他的声音了,现在突然出来接受了一次专访。

引言:AI界的科学家与当下的迷茫

首先要注意,这哥们不是一个工程师,他是一个科学家。工程师跟科学家之间还是有很大差异的。使用确定的技术、加大投入、获得可预期的结果,这是工程师干的活;研究不确定的方向,这是科学家干的事情。所以,他是一位科学家。

现在很多人都在讨论AI是不是有泡沫。现在距离走通“最后一步”还有一点点小的差距。到底什么叫“最后一步”?就是AI真正的落地,真正的开始改变很多东西,开始挣钱。这一步现在还是有一点点差距的。但是呢,很多人也在否认AI泡沫的存在。AI虽然没有走通最后一步,但是AI真的带来很多失业。“钱我没挣着,但是我真的把人的工作干掉了。”现在是大家都比较迷茫的一个时间点。

原来那些应该默默无闻做研究的科学家,就携带了巨大的光环跑出来说话了。本来这些科学家说的话呢,应该是在很小的圈子里边流传,但是现在大家看看李飞飞、杨乐坤,包括今天咱们讲的伊利尔说的这些话,也成为了大众讨论的话题。

核心观点一:科学研究与工程研发的转化

“科研现在需要相互转化了”,这就是这一次伊利尔访谈的一个核心观点。你说,科研科研不是一回事吗?不是,科学跟研究是两回事,它是分为“科学研究”和“工程研发”,它是两个不同的概念。

科学研究呢,是在发现方向。发现了方向以后,就可以堆钱、堆算力、堆数据,在各种行业里边进行测试,这个呢都叫工程研发。就像前面他们研究了半天,到底哪个算法是可以把这个大模型做出来的,最后发现Transformer算法是可以搞定的,发现方向了。到发现Transformer方法有效之前,都是在做科学研究。在Transformer出来以后,大家说:“咱们堆钱吧!”玩这个scaling law,就是直接往里头去堆算力、堆数据、堆这些东西了,这就开始玩工程研发了。这个都是确定的东西,我们只管往里堆钱就完了。

工程研发呢,有一个不可避免的问题,就是你万一站到了一个小山头上,朝任何一个方向走都是下坡。工程研发的时候,他也是会寻找更高的一个山头往上爬,但是你爬到一个最高的山头的时候,你就没法往前走了,因为你不知道应该往哪个方向走了。如果有一个离你很近的山头,你还可以去尝试的跳一跳;如果下一个山峰离你非常遥远的话,这个工程研发是没有办法去跨越鸿沟的。那么在这个时候就应该重新走回来,做科学研究了,重新去尝试那些现在不确定的方向。这就是这一次伊利尔访谈的一个核心观点。

所有的科学家最大的能力是不是科学?其实不是这样。所有的科学家,特别是成功的科学家,他们最大的能力是筹措经费和资金。特别是现在这个时间点,任何一项科学研究都是需要海量资金去堆砌的。现在已经不能说科学家坐在家里头,闭门造车多少年,最后研究出一个神奇的东西出来,现在已经过了那个时间点了。

More

谷歌一出手,OpenAI的“凛冬”真来了?山姆·奥特曼内部备忘录罕见示弱,承认可能暂时落后|Google vs OpenAI、AI Race、Google、OpenAI

谷歌一出手,OpenAI的“凛冬”真来了?山姆·奥特曼内部备忘录罕见示弱,承认可能暂时落后|Google vs OpenAI、AI Race、Google、OpenAI已关闭评论

Gemini 3 Pro和Nano Banana Pro发布之后,OpenAI的山姆·奥特曼开始喊“凛冬将至”了

大家好,欢迎收听老范讲故事的YouTube频道。凛冬将至(winter is coming),这是一个《权游》里边的梗,大家要小心准备了。以前呢,OpenAI每一次发布会之后,都会有一群的创业公司原地死亡。这次谷歌没有开发布会,直接发布了新产品之后,OpenAI虽然不至于原地死亡,但是凛冬将至了。

奥特曼的内部警告:“凛冬将至”

山姆·奥特曼到底是怎么说的呢?对外肯定不能跌面子,讲的是祝贺谷歌发布了Gemini 3,看起来是一个很棒的模型。但是曝光的一些内部备忘录里边,寒意已经体现出来了。奥特曼罕见的表现出了危机感,直言公司当前的氛围充满了不太妙的低迷气氛,大家都觉得有问题了。

OpenAI如今不得不拼命追赶,谷歌的AI进展可能给OpenAI创造暂时的“经济阻力”。大家注意,这个词叫“经济阻力”,它的收入可能会有问题。如果收入有问题的话,他前面画的1.3万亿这种大饼,这是会出大问题的,会让整个行业崩塌的。

现在,山姆·奥特曼要求团队进入战时状态,聚焦长远,即便意味着我们在当前阶段会暂时落后,也要押注更有雄心的突破。这个非常非常正确。首先,他承认了“我们现在可能暂时落后”,而且一段时间未必追得上。但是,如果只是跟着谷歌的脚步往前追的话,这是没法整的。因为谷歌最擅长的事情就是极限拉扯、极限迭代升级,你像Chrome到现在100多版了,安卓一年一个大版、一堆的小版,所以任何想在这后边跟版本的人,都会被谷歌拉死的。你要想跟谷歌竞争,一定要跳到谷歌外面去,自己做一些完完全全创新的东西,让用户有感知的东西,这个才是需要去干的活。

而且,山姆·奥特曼讲到,公司的估值虽然很高,但是要清醒看到,我们还有不少的功课要补,AI研发的严冬考验就在眼前,OpenAI必须奋起直追了。这也就是“凛冬将至”的出处。

大家还记得国内互联网企业是什么时候开始喊这句话的吗?谁喊的?任正非喊的。任正非喊“我们要让大家感受到寒意”之后,华为确实有在裁员,但是业绩并没有大的问题。但是华为身边的这些公司,就在大量的原地消失,直接就不见了。这就是凛冬到来的时候,我们会看到的景象。

More

我们都被骗了?Nano Banana Pro 真相揭秘:它根本不是Gemini 3简单叠加,原生多模态骨架才是颠覆关键|Nano Banana Pro、Gemini 3 Pro、Gemini 3

我们都被骗了?Nano Banana Pro 真相揭秘:它根本不是Gemini 3简单叠加,原生多模态骨架才是颠覆关键|Nano Banana Pro、Gemini 3 Pro、Gemini 3已关闭评论

Nano Banana Pro发布了,它在Nano Banana的基础上到底做了些什么新东西?

大家好,欢迎收听老范讲故事的YouTube频道。

大家等了半天的Nano Banana 2没有来,出来的是Nano Banana Pro。当然,前面Nano Banana Pro也是隐姓埋名,在各种的大模型评测平台上偷跑了好长时间。所以很多人呢,信誓旦旦地说:“我已经用到了这个东西,强的没边了。”现在终于发布出来了。

从Nano Banana到Nano Banana Pro:核心区别是什么?

从名字上呢,一个叫Nano Banana,另外一个呢加了个Pro,它们到底差在哪呢?原来的Nano Banana,其实是叫做Gemini 2.5 Flash image。现在的Nano Banana Pro呢,它背后的模型是Gemini 3.0 Pro image,是两个不同版本。而且一个呢是Flash,一个呢是Pro。Flash一定是比较快,出来的东西呢相对比较粗糙;而Pro的话,出来的东西就会比较笨重了,或者说比较昂贵,而且出来的东西非常非常细致和完善,它们核心的区别就在这里。

Nano Banana也是先在外边测试了很久然后才发布,这个名字也是当时他们测试的时候使用的名字。当然这一次测试呢,并没有叫纳米香蕉,这次换了个名字,因为纳米香蕉这名字你用过了嘛,好像叫GENIMG,大概是这样的一个名字去测试的。

More

杨乐坤出走创业,Meta反成股东,这场“和平分手”背后是路线的彻底决裂:世界模型vs大语言模型,谁在赌对未来?Yann LeCun、Meta、AI、launch startup、world model

杨乐坤出走创业,Meta反成股东,这场“和平分手”背后是路线的彻底决裂:世界模型vs大语言模型,谁在赌对未来?Yann LeCun、Meta、AI、launch startup、world model已关闭评论

杨乐坤出走Meta:一场关于战略、用人和未来的博弈

大家好,欢迎收听老范讲故事的YouTube频道。

这一天还是来了。前面我们已经猜测了很久,说杨立昆到底什么时候会离开,因为所有人都眼睁睁地看着Meta的AI战略转换方向。亚历山大·汪进入Meta,一个28岁的辍学生,在管理65岁的大学教授和图灵奖得主,这个事一定不能长久。而且前面还对杨立昆手下的FAIR部门进行了600人的裁员。

靴子落地:杨乐坤宣布离职

现在靴子终于落地了。2025年11月19日,当地时间13:20,杨立昆发了一个长文宣布离职了。在这个文章里边,他回顾了一下在Meta待了12年,感谢了小扎和一堆高管,然后准备要去做他的AMI。他这个AMI呢,叫做“高级机器智能”,说:“我在Meta期间就一直在干这件事,现在呢我准备出去了以后接着干。”而且新公司呢,Meta依然还有参与,具体的情况后续再公布。他呢,也终于可以不受Meta的限制,去研究自己的世界模型了。

杨立昆也要去做世界模型,跟李飞飞有些相近。最后咱们再说一下,他的世界模型跟李飞飞的世界模型到底有什么差别。

Meta呢,应该在这个里边还是给了钱的。你请这样的一位大神出去,而且大神在发文的时候还感谢了扎克伯格,那一定还是要给钱的。所以杨立昆未来的公司里头,Meta应该还是一位重要的股东。但是到底给了多少钱,占了多少股份,可能还要等未来Meta的官宣,现在应该公司还在注册过程中吧。

More

Older Entries

退出移动版