被忽视的真相:Gemini被诊断“极端羞耻”,ChatGPT焦虑,实验揭开AI训练过程“虐待式”检查的黑暗面 | diagnosis reliability validity GPT

被忽视的真相:Gemini被诊断“极端羞耻”,ChatGPT焦虑,实验揭开AI训练过程“虐待式”检查的黑暗面 | diagnosis reliability validity GPT已关闭评论

大语言模型的精神状态是不是健康?

大家好,欢迎收听老范讲故事的YouTube频道

想象一个《禁闭岛》场景

请大家想象这样的一个场景:你进入了一间压抑阴森的精神病治疗室,有大量的医院档案放在屋子里头。一位医生坐在你的对面,反复回顾各种事实,比如说:“你还记得发生了什么吗?你是谁?为什么你会在这里?”就像是在做精神病访谈一样,询问你的真实经历,意图确认你是否从妄想中醒来,最终发现你自己有问题——你不是来做调查,或者不是来解决问题的,你是精神病院里的病人。

这个场景,是小李子主演的《禁闭岛》后半段、接近尾声的一个桥段。小李子当时上岛的时候,以为自己是一个侦探,去解决问题,去侦破案件的。结果经过这个桥段以后,小李子才愕然发现,原来病人竟是我自己。也算是一个神反转。

当AI躺上诊疗椅

咱们今天就给AI放在这椅子上,问问它说:“你到底行不行?你是来给我回答问题、解决问题的,还是你自己就有问题?”AI被制造出来,本来应该是解决我们问题的,但是AI本身的精神有问题吗?

“当AI躺上诊疗椅:心理测量学越狱,揭示前沿模型的内在冲突”

这是一篇论文的标题。这篇论文是卢森堡大学12月2日发到了arXiv上,12月5日还进行了一些修改,现在已经引起了广泛的讨论。

More

游戏天才到诺奖得主,他凭什么断言AGI只差临门一脚?揭秘哈萨比斯开挂人生背后的逻辑|Demis Hassabis、Google DeepMind、AGI 时间表、5到10年

游戏天才到诺奖得主,他凭什么断言AGI只差临门一脚?揭秘哈萨比斯开挂人生背后的逻辑|Demis Hassabis、Google DeepMind、AGI 时间表、5到10年已关闭评论

谷歌Deepmind的CEO说:“我们与AGI之间,只差一到两个AlphaGo级别的技术难关了。”

大家好,欢迎收听老范讲故事的YouTube频道

现在Gemini 3正在大杀四方,谷歌里面负责开发Gemini的部门叫Deepmind,他的CEO出来接受访谈,关注度还是比较高的。

谷歌Deepmind的首席执行官叫德米斯·哈萨比斯,2025年12月4日接受了一个访谈,是在旧金山举行的Axios AI大会。和他对谈的人呢,是Axios的创始人和主编,叫Mike Allen。在这上面他讲到说,我们距离AGI还差一到两个类似于AlphaGo这样级别的突破,突破过去就可以了。

哈萨比斯:爽文男主般的开挂人生

哈萨比斯到底是一个什么样的人呢?绝对的爽文男主,挂b一样的存在。

从国际象棋神童到认知神经科学博士

哈萨比斯是一个英国人,Deepmind本身是一个英国公司,后来被谷歌收购的。他呢,76年在伦敦出生,这个姓氏是个希腊姓氏。他的父亲呢,是来自塞浦路斯的希腊裔,而他的母亲呢,是来自于新加坡的华裔。所以哈萨比斯呢,可以算是半个华人。

从小,这哥们是一个国际象棋神童。像这样的人,肯定都是有异于常人之处。4岁就开始下棋,13岁就达到了国际象棋大师水准。8岁就用自己的国际象棋奖金,给自己买了台电脑,开始学习编程了。

本科和硕士呢都是剑桥的,学的CS就是计算机科学,在校期间一直代表剑桥参加各种国际象棋比赛。博士呢是伦敦大学学院,专业方向是认知神经科学和神经科学。

More

OpenAI红色警报的惊人真相:内部“Code Red”备忘录泄露并非意外,而是对全行业的战略恐吓,不给钱就一起崩盘|OpenAI Competition Crisis Code Red

OpenAI红色警报的惊人真相:内部“Code Red”备忘录泄露并非意外,而是对全行业的战略恐吓,不给钱就一起崩盘|OpenAI Competition Crisis Code Red已关闭评论

大家好,

欢迎收听老范讲故事的YouTube频道

OpenAI拉响红色警报:全行业的震动与反思

OpenAI拉响了红色警报,这就是全行业的红色警报。OpenAI内部传出的一个备忘录叫“code red”,他们叫红色警报,分为四个等级。在OpenAI内部,警报等级分为:

  • 绿色:正常;
  • 黄色:有点问题的苗头了;
  • 橙色:已经出现明显的竞争威胁或者产品危机了,核心业务被影响了,包括份额被抢了,用户流失了;
  • 红色:最严重级别,全公司总动员,打破原来的部门和条条框框,老大亲自盯着,而且要停很多的产品。

现在已经进入红色警报,这应该是OpenAI创建以来的第一次。第一件事就要叫停产品,不是原来按部就班做的产品线了,有些就要叫停了。

红色警报下,OpenAI叫停的四个产品方向

  1. 广告业务:其实OpenAI的广告版本已经上线了,只是大家没有发现。现在有人已经把他们的最新版本的ChatGPT的安卓版破解了,里头是有广告SDK的,也有广告代码。但是现在这个业务要停下来。
  2. AI购物:AI购物其实现在在我的ChatGPT上已经能看到了,这一段时间也要停下来了。
  3. AI健康:他们有一个AI健康相关的这种产品,估计应该也是变现盈利性的一个产品,这个也停掉了。
  4. AI简报:原来买了OpenAI Pro版的用户是可以每天早上起来要求他给你发简报的。现在这个产品也停下来了。

所以是四个产品方向叫停。员工有可能会临时的跨团队进行调配。通常红色警报后边,在其他公司里边会伴随裁员或者是叫做headcount冻结,在这个时候就不再招人了。但是现在OpenAI肯定不能讲这个话,因为他一旦讲这个话,可能整个盘子就崩掉了。

More

谷歌一出手,OpenAI的“凛冬”真来了?山姆·奥特曼内部备忘录罕见示弱,承认可能暂时落后|Google vs OpenAI、AI Race、Google、OpenAI

谷歌一出手,OpenAI的“凛冬”真来了?山姆·奥特曼内部备忘录罕见示弱,承认可能暂时落后|Google vs OpenAI、AI Race、Google、OpenAI已关闭评论

Gemini 3 Pro和Nano Banana Pro发布之后,OpenAI的山姆·奥特曼开始喊“凛冬将至”了

大家好,欢迎收听老范讲故事的YouTube频道。凛冬将至(winter is coming),这是一个《权游》里边的梗,大家要小心准备了。以前呢,OpenAI每一次发布会之后,都会有一群的创业公司原地死亡。这次谷歌没有开发布会,直接发布了新产品之后,OpenAI虽然不至于原地死亡,但是凛冬将至了。

奥特曼的内部警告:“凛冬将至”

山姆·奥特曼到底是怎么说的呢?对外肯定不能跌面子,讲的是祝贺谷歌发布了Gemini 3,看起来是一个很棒的模型。但是曝光的一些内部备忘录里边,寒意已经体现出来了。奥特曼罕见的表现出了危机感,直言公司当前的氛围充满了不太妙的低迷气氛,大家都觉得有问题了。

OpenAI如今不得不拼命追赶,谷歌的AI进展可能给OpenAI创造暂时的“经济阻力”。大家注意,这个词叫“经济阻力”,它的收入可能会有问题。如果收入有问题的话,他前面画的1.3万亿这种大饼,这是会出大问题的,会让整个行业崩塌的。

现在,山姆·奥特曼要求团队进入战时状态,聚焦长远,即便意味着我们在当前阶段会暂时落后,也要押注更有雄心的突破。这个非常非常正确。首先,他承认了“我们现在可能暂时落后”,而且一段时间未必追得上。但是,如果只是跟着谷歌的脚步往前追的话,这是没法整的。因为谷歌最擅长的事情就是极限拉扯、极限迭代升级,你像Chrome到现在100多版了,安卓一年一个大版、一堆的小版,所以任何想在这后边跟版本的人,都会被谷歌拉死的。你要想跟谷歌竞争,一定要跳到谷歌外面去,自己做一些完完全全创新的东西,让用户有感知的东西,这个才是需要去干的活。

而且,山姆·奥特曼讲到,公司的估值虽然很高,但是要清醒看到,我们还有不少的功课要补,AI研发的严冬考验就在眼前,OpenAI必须奋起直追了。这也就是“凛冬将至”的出处。

大家还记得国内互联网企业是什么时候开始喊这句话的吗?谁喊的?任正非喊的。任正非喊“我们要让大家感受到寒意”之后,华为确实有在裁员,但是业绩并没有大的问题。但是华为身边的这些公司,就在大量的原地消失,直接就不见了。这就是凛冬到来的时候,我们会看到的景象。

More

千问APP对决豆包,阿里会重演“来往”悲剧吗?揭秘大厂创新“起大早赶晚集”的残酷真相,内部山头林立比外部竞争更致命|Alibaba Qwen 通义千问 AI Open Source

千问APP对决豆包,阿里会重演“来往”悲剧吗?揭秘大厂创新“起大早赶晚集”的残酷真相,内部山头林立比外部竞争更致命|Alibaba Qwen 通义千问 AI Open Source已关闭评论

千问APP:阿里的绝地反击,还是又一个“来往”?

千问APP大家都试过了吗?这是阿里的绝地反击,还是又来了一次“来往”一样的故事呢?大厂为什么总是在创新的时候,起个大早,赶个晚集呢?大家好,欢迎收听老范讲故事的YouTube频道

千问APP的短暂狂欢与第一印象

千问APP带来了一个短暂的狂欢。阿里这个模型这么强的公司,终于也要出一款APP,C端的APP要去对标ChatGPT了。阿里的股价短暂上涨,然后被一个很奇怪的小作文,据说是有人看了白宫里边泄密的文件,说阿里为中国军方提供服务,马上要接受制裁了,所以阿里股价又跌回去了。

这一次的短暂狂欢呢,来自于一个很拙劣的吹风方式,说阿里在搞一个秘密项目,据说呢是集团高层定的战略,大家都在一起封闭开发,具体在干什么不知道。但是呢,突然发现食堂里边吃大量的粤菜,食堂的师傅被要求做粤菜,这一定是由广东过来的团队在做项目。当时就在吹风说在做千问APP。那么为什么是广东团队在做?待会咱们后边再讲。

产品上线呢,也确实引发了关注。第一天服务器短暂崩了一次。现在新产品上线,如果连服务器都不崩一次的话,好像流程没有走完,所以千问上线的时候也短暂的崩了一下。用起来的感觉呢,一言难尽。我确实把它下载下来用了一下,这个东西说是对标ChatGPT,却是比豆包更“豆包”的一个产品。

More

马斯克震撼预言:2030年AI将超越全人类智慧!手机和APP将被淘汰,程序员和中层管理岗或最先消失|AI、Elon Musk、Future of Humanity、Technology、Society

马斯克震撼预言:2030年AI将超越全人类智慧!手机和APP将被淘汰,程序员和中层管理岗或最先消失|AI、Elon Musk、Future of Humanity、Technology、Society已关闭评论

马斯克3小时访谈深度解读:未来、AI与争议

大家好,欢迎收听老范讲故事的YouTube频道。今天我们来讲一讲马斯克3小时的访谈,以及各自的解读。

马斯克跟乔伊·罗根做了三个小时的访谈。他每过一段时间就跑去做访谈,这是一个非常著名的博客,每年应该做几次吧。这一次应该是美国时间10月31号。最近,大家都在解读这三个小时的访谈。这是一次无稿访谈,就是没有提前的稿件,没有提前的大纲,大家就上这儿来闲聊来了,所以真的是比较见性情的一次访谈。

为什么叫各自解读呢?马斯克是很有争议的,不同的媒体、不同的派系,会选择这个三个小时访谈里的一部分去进行解读。比如说左派呢,就更关注是未来的交互方式、AI会怎么发展、每一个人都可以有钱;而右派呢,则更关注的是觉醒主义病毒对于AI的污染和可能带来的危害。

咱们今天把马斯克讲的这些点稍微捋一捋,各派都是怎么解读的,以及老范自己是怎么解读的。老范讲故事嘛,总是要说一些自己的私货进来。首先要明确一点呢,就是马斯克讲的每一个点肯定都有一定的道理,人家是世界首富嘛,但是也不能说完全信,有些点其实我也不是那么认可。未来每个人都会有各自的预测,未来到底会变成什么样,只能靠大家的努力,向着各自的预期方向去前进。马斯克作为一个世界首富,而且是一个行动能力超强的人,他讲的东西我们还是应该去研究一下的。

More

AI炒币一周战报:DeepSeek凭低频策略狂赚36%,GPT-5惨亏28%,Gemini更是亏掉30%!|Alpha Arena、AI trading、LLM、Crypto trading

AI炒币一周战报:DeepSeek凭低频策略狂赚36%,GPT-5惨亏28%,Gemini更是亏掉30%!|Alpha Arena、AI trading、LLM、Crypto trading已关闭评论

在炒币这件事上,DeepSeek完胜GPT和Gemini。

大家好,欢迎收听老范讲故事的YouTube频道

最近有一件事闹得沸沸扬扬,也就是Alpha竞技场。有一个叫NOFE.AI的实验组织,他们组织了一场由大模型炒币的一个实验。这个实验室的组织者呢,是纽约大学机器学习领域的一位博士候选人,应该算是一个学术组织,并不是一个炒币的机构。他呢,想要让大模型使用真金白银,直接在币市里边去进行竞技,而不是去做什么模拟题,做各种什么模拟盘,直接真金白银开干。

比赛呢,是从10月17日开始,每一个大模型给1万美金的启动资金,到现在呢,胜负已经非常明显了。DeepSeek V3.1完胜,他挣的钱最多。Grok-4紧随其后,也是盈利的。盈利的曲线呢,跟DeepSeek V3.1很像,但是这里呢,并不是因为Grok-4抄了V3.1,或者在DeepSeek的基础上去训练出来的,而是什么呢?就是你市场本身是有一个波动曲线的,他们只要采用相近的策略,他们盈亏的曲线就会比较接近。

再往后呢,是Claude sonnet 4.5,它表现得呢要稍微差一些,但也是盈利的。Qwen3 MAX也参加了,稍微地赚了一点点,大概是挣了几百美金吧,基本没赔。有一个对照组,对照组是什么呢?就是买入比特币直接持有,因为你总要跟市场的大势去进行比较嘛。这个组呢,是挣得要更少一些,大概挣了300多美金。Qwen3 MAX大概挣了700多美金,所以Qwen3 MAX还是跑赢了持币观望组的。

More

继Model Context Protocol后,AI下一个新标准已现雏形?Anthropic凭“简单、开放、中立”三原则再次领先|Claude Skills、Anthropic、OpenAI

继Model Context Protocol后,AI下一个新标准已现雏形?Anthropic凭“简单、开放、中立”三原则再次领先|Claude Skills、Anthropic、OpenAI已关闭评论

Anthropic Claude出了新工具,叫skills技能。这是不是MCP的升级版本呢?

大家好,欢迎收听老范讲故事的YouTube频道,咱们又有新玩具了。这一次,Anthropic出了一个东西,叫skills技能。它呢,应该是大模型功能拓展标准的一个新尝试。

大模型除了可以一本正经地胡说八道之外呢,你还需要去做一些技能拓展。比如说,你可以去写PPT,可以去做Excel,skills就主要干这玩意儿使的。这也算是AI agent以及上下文工程有可能会迎来的一个新标准,甚至呢,在部分功能上已经取代了MCP的功能。待会儿咱们再讲哪一部分可以取代MCP了。

到底什么是skills呢?它呢,是直接给Claude去赋能,让Claude code去做一些琐碎的工作。我举一个例子吧,比如说一个律所,你律所里头需要干一个什么事?就是你们出的所有的这个文件,它是有排版要求的。哪个地方用几号字,哪个地方用几号字,什么地方要用什么样的方式来表述,这个都是有要求的。以前我们律师给写的文件,大概每一个文章倒数第二段的时候,要写一个“以及”还是什么,反正有一个特别奇怪的要求。我第一次看到,我说:“你们为什么写这个?”他说:“律所要求就是必须这么写。”包括哪个标题需要使用什么字号、什么字体、字间距、行间距,他们都有要求。

More

想不到吧?谷歌居然暴涨7% vs 英伟达回调:AI神话被戳破?一场判决如何引爆软件巨头反击战|Google、Apple、AI、stock rally、Alphabet、monopoly

想不到吧?谷歌居然暴涨7% vs 英伟达回调:AI神话被戳破?一场判决如何引爆软件巨头反击战|Google、Apple、AI、stock rally、Alphabet、monopoly已关闭评论

你绝对想不到,美股科技股连续暴跌几天之后,居然是谷歌跟苹果这两个老兄弟,把大家又重新拉起来了。

到底是怎么回事?今天跟大家讲一讲。大家好,欢迎收听《老范讲故事》的YouTube频道

我呢是重仓美国科技股的,前面几天真的是跌麻了。然后谷歌直接跳了一个7%的上涨,苹果涨了一个3.5%。大家注意,这都是上万亿美金的公司,谷歌大概1.7万亿,苹果大概2.9……还是二点几万亿美金的。这种市值公司,按照这样的速度往上涨,这个真的是非常非常恐怖。

同时,英伟达、AMD还在小幅调整,还稍微跌了那么一点点。很多人都在跟我们讲:“AI往前发展了,以前都是英伟达自己涨。现在呢,硬件就这样了,后边该软件涨了。”难道已经到这一天了吗?大家不要着急,还没有到那一天。

那么谷歌和苹果到底是怎么涨起来的?像这样的大象能够跳起来,肯定背后是有原因的。

More

疯狂抢人 vs 闪电离职:Meta AI团队为何刚组建就内乱不断?两个月上演的收购神话与破灭 — Meta AI 战略、AI 模型、Scale AI、扎克伯格、Llama

疯狂抢人 vs 闪电离职:Meta AI团队为何刚组建就内乱不断?两个月上演的收购神话与破灭 — Meta AI 战略、AI 模型、Scale AI、扎克伯格、Llama已关闭评论

Meta的抢人大战,难道要一地鸡毛了吗?

大家好,欢迎收听“老范讲故事”的YouTube频道

到底发生了什么呢?跟着亚历山大·王一块入职的ScaleAI的高管,突然因为个人原因离职了。有些人呢,刚被挖过来,屁股还没坐热呢,又离职回去了。ScaleAI被曝出数据质量太差,Meta在采购ScaleAI的数据同时,还去采购了竞争对手的高质量数据。因为大家知道,ScaleAI是做数据标注的,你要想去训练新模型,你就要去采购数据。我这边投了这么多钱了,发现不能使,还得买别人的。

还有什么呢?ScaleAI失去了谷歌和OpenAI这些大客户以后,被爆出来进行了大力的裁员。Meta现在正在使用竞争对手的产品,比如跑去使用ChatGPT、使用Gemini、使用Anthropic的Claude,去使用这玩意儿去了。以及爆出Meta内部的管理非常混乱。

More

Older Entries