游戏天才到诺奖得主,他凭什么断言AGI只差临门一脚?揭秘哈萨比斯开挂人生背后的逻辑|Demis Hassabis、Google DeepMind、AGI 时间表、5到10年

游戏天才到诺奖得主,他凭什么断言AGI只差临门一脚?揭秘哈萨比斯开挂人生背后的逻辑|Demis Hassabis、Google DeepMind、AGI 时间表、5到10年已关闭评论

谷歌Deepmind的CEO说:“我们与AGI之间,只差一到两个AlphaGo级别的技术难关了。”

大家好,欢迎收听老范讲故事的YouTube频道

现在Gemini 3正在大杀四方,谷歌里面负责开发Gemini的部门叫Deepmind,他的CEO出来接受访谈,关注度还是比较高的。

谷歌Deepmind的首席执行官叫德米斯·哈萨比斯,2025年12月4日接受了一个访谈,是在旧金山举行的Axios AI大会。和他对谈的人呢,是Axios的创始人和主编,叫Mike Allen。在这上面他讲到说,我们距离AGI还差一到两个类似于AlphaGo这样级别的突破,突破过去就可以了。

哈萨比斯:爽文男主般的开挂人生

哈萨比斯到底是一个什么样的人呢?绝对的爽文男主,挂b一样的存在。

从国际象棋神童到认知神经科学博士

哈萨比斯是一个英国人,Deepmind本身是一个英国公司,后来被谷歌收购的。他呢,76年在伦敦出生,这个姓氏是个希腊姓氏。他的父亲呢,是来自塞浦路斯的希腊裔,而他的母亲呢,是来自于新加坡的华裔。所以哈萨比斯呢,可以算是半个华人。

从小,这哥们是一个国际象棋神童。像这样的人,肯定都是有异于常人之处。4岁就开始下棋,13岁就达到了国际象棋大师水准。8岁就用自己的国际象棋奖金,给自己买了台电脑,开始学习编程了。

本科和硕士呢都是剑桥的,学的CS就是计算机科学,在校期间一直代表剑桥参加各种国际象棋比赛。博士呢是伦敦大学学院,专业方向是认知神经科学和神经科学。

从游戏制作人到AI先驱

工作,这哥们一开始做游戏的。先去加入了很著名的牛蛙工作室,这个牛蛙工作室呢,最著名的作品叫做《地下城守护者》。但是哈萨比斯当时进去的时候,应该还没有开发这个产品,牛蛙工作室最终是被EA给收购了。后来呢,他自己创建了一个工作室接着做游戏,叫做仙丹工作室。2004年出了一个游戏叫《邪恶天才》,是一个模拟经营游戏,就是一帮邪恶天才在一个小岛上做各种各样坏事的这样的一个游戏。只是呢,这个游戏并不怎么挣钱,这种超级天才做出来的游戏都未必能挣钱。

他呢就把工作室关掉了。后来呢,《邪恶天才》的IP被收购了,2021年《邪恶天才2》发布,但是呢,《邪恶天才2》就已经跟哈萨比斯没有什么关系了。

关闭这个游戏工作室之后,他就去创建了Deepmind。Deepmind主要还是游戏方向,他呢在里边去训练AI下围棋。这哥们是个国际象棋大师,但是呢开始训练AI下围棋,也就是AlphaGo这个东西就出来了。在这中间呢,还训练AI去打各种游戏,星际争霸呀,做一些其他这样的训练。

收购、AlphaFold与内部整合

2014年,Deepmind就被谷歌给收购了,6.5亿美金的价格。但是这个数字呢,并不是特别统一,很多的报道里的这个数字是有一些偏差的。有人说是4亿美金,也有人说是6.5亿美金,还有人说是4亿英镑。因为收购的时候,谷歌自己并没有公布价格,这些价格呢都是后续的报道里边去写的。

在谷歌收购以后呢,哈萨比斯在Deepmind里头又开发了叫AlphaFold这样的一个产品。这个产品是解决蛋白质折叠难题的。蛋白质实际上是这种超大分子,这些超大分子,我们算清楚有多少碳、多少氢、多少氧、还有氮,它并不是一个平面的结构,它是一个立体的结构,3D的。在这样的一个结构里头,它到底是怎么去排列和折叠的呢?原来大家是去预测呀、去猜呀,或者通过一些很复杂的设备去进行扫描,通过这样的方式去识别,成本是很高的。你要想去用蛋白质开发各种药品,你就必须要搞清楚它的3D架构空间,你搞不清楚,这事没法往前走。

哈萨比斯就去搞了AlphaFold,用AI去预测蛋白质的3D折叠空间到底是怎么回事。2020年呢,这个AlphaFold在蛋白质预测大赛中夺得头筹,比第二名强好几倍,这个事基本上就算解决了。现在只要是知道这个蛋白质的分子结构,这个AlphaFold的预测结果就极其准确。2024年,哈萨比斯依靠这个AlphaFold获得了诺贝尔化学奖,这哥们是个诺贝尔奖得主。

这还没完,他呢还在内部斗争中战胜了谷歌大脑。这是一个什么故事呢?谷歌内部一直是有两个AI部门的,一个是Deepmind,另外一个叫谷歌大脑,相互内斗,相互争夺资源。直到什么时候呢?直到ChatGPT出来,三年前谷歌拉响了红色警报,说不能再这样了,你们俩两家打来打去,这个不行了。那怎么办呢?最终是Deepmind合并了谷歌大脑,所以现在整个的谷歌AI是由Deepmind来去负责的,由哈萨比斯来去管理。

现在的Gemini 3使用的技术,大多都是原来谷歌大脑研究的方向:Transformer、大语言模型都是那边研究的。而Deepmind呢,原来在英国这帮人研究的呢,就是AlphaGo、AlphaZero(AlphaZero是AlphaGo之后的一个下棋的模型)以及各种可以自动玩游戏的AI产品,还有呢就是AlphaFold,做这个蛋白质分析的。

哈萨比斯除了是Deepmind的CEO之外,他自己还有一间专门做药的公司,专门用AlphaFold去做蛋白质研究,做各种新创新药的公司,他也是那个公司的创始人。所以哈萨比斯管理了整个的谷歌AI方向,以及谷歌Gemini这个产品化方向,都是归他管的。所以,爽文人生,绝对没有任何问题吧?

通往AGI之路:还差哪两个AlphaGo级别的突破?

哈萨比斯认为,我们距离AGI到底还差哪两个AlphaGo级别的突破呢?他自己做AlphaGo的,所以AlphaGo到他这儿变成了一个衡量单位,再出现两次AlphaGo这样的突破,我们就达到AGI了。

Gemini 3的惊人进展

他呢首先讲到Gemini 3,现在确实让人震惊,已经从文本专家变成了多模态理解系统了。他举了一个案例,说有一个电影叫《搏击俱乐部》,主角上去打斗之前把戒指摘下来了。他就去问这个Gemini,说这代表什么意思。它没有告诉你把戒指摘了就完了,而是告诉你说,这是主角抛开了身份、摆脱了规则的象征,是角色从现实到极端的转变。这个确实挺让人震惊的,这个Gemini 3模型有了自己的判断,不再只是迎合了。

到GPT这儿,你说你错了,它就会说“对不起,我错了”。到Gemini 3上,你说你错了,它会很耐心地给你解释,或者跟你去讨论这个事,是不会直接承认的。说Gemini 3的性格,叫“简洁,冷静,有自信,不讨好”。这个是哈萨比斯自己作为一个科学家,非常非常喜欢Gemini 3的一个地方。

而且Gemini 3呢,现在已经从生成内容,在向着打造产品的方向前进了。我们现在使用Gemini 3去做PPT,去做简单的应用原型,效果已经非常好了。它已经可以去执行一个比较简短的、连续的这种AI agent的工作了,这个是Gemini 3真正强的地方。

大模型当前面临的难题

哈萨比斯说了,现在的大模型还是有很多问题没法解决的。

  1. 不具备持续学习的能力。很多人都在担心,说我跟大模型聊了半天,是不是大模型就拿聊天的结果回去做训练去了。其实有时候确实他干,但主要做的是什么呢?就是强化学习。因为我们跟Gemini聊天,他经常会出俩答案让你挑一个,你在挑选的时候呢,实际上就已经在开始帮助大模型进行训练了。但是搜索的结果、我生成的内容、我提出的问题,我让这些东西去进入到大模型里头去进行训练的话,这个是不行的。大模型必须要进行数据筛选,然后才能训练。日常的这些内容,你拿去训练大模型的话,大模型可能会越训越笨的,特别是很多互联网上的垃圾信息,你塞到大模型里去训练,根本就没有办法达到预期的效果。所以大模型是没有办法自己去找内容去训练的,还是需要人先去提出要求,然后去进行数据清洗、数据处理。现在都是由大模型根据原始数据,再去生成最后的预训练数据,然后才能再去训练。所以这个事情,还没有办法让大模型自己去干,这是第一个问题。
  2. 无法执行长期的规划。虽然现在Gemini 3已经可以走一个一两个小时的规划,它还是能够走完的。但是你说我这有一个很多步骤,还是并行的,这种步骤需要去执行,执行完了以后需要连续执行几天、甚至几个月的这种任务,这个Gemini 3还搞不定。现在谁都搞不定这个事情。所以现在人去使用大模型,我们还需要自己去理解问题、自己去拆解问题,然后把这个拆解好的问题扔给大模型,而在对大模型的结果进行确认和验证之后,再把结果拼凑起来,让大模型去做下一步。它没有办法说你一开始给他个要求就做出来,“上帝说有光,于是就有了光”,这个事现在还做不到。
  3. 智能体系统很不稳定。为什么它没法连续干下去?就是它可能干着干着就跑偏,而且跑偏的过程中呢,自己不知道跑偏。在这个过程中,就有可能会浪费大量的TOKEN和算力,最后呢得出一个完全不可用或者说有害的一个结果出来。这个是目前为止大模型无法避免的问题。
  4. 缺乏跨对话的稳定记忆。现在大模型已经开始有记忆了,但是大量的记忆呢,还是在对话内的。而对话外的这种记忆,就是跨对话的记忆呢,它也不是说没有,像ChatGPT也好、Gemini也好,都是有一些跨对话记忆的。但是呢,这个记忆的空间都很小,你不可能说让他记很多的东西,然后跟你进行跨对话的去聊天。为什么呢?对于计算机来说吧,让它记住什么事是非常非常容易的,往硬盘里写不就记住了吗?但是让它忘掉是很难的。到底应该记住哪一部分、忘掉哪一部分,在下一次工作的时候我应该使用其中的哪部分去参与工作,这件事是非常难去抉择的。这就是大模型跨对话记忆的这个难点。所以他讲的,现在缺乏跨对话的稳定记忆,就是你让他记住可以,但是呢不一定下次就想起什么事来,可能他会找一个完全不相关的知识点,就参与到你这一次新的对话里去了。现在我们使用大模型的方式还是比较简单粗暴的,你发现讲着讲着驴唇不对马嘴了,怎么办?开始新话题,就是把原来的记忆都清干净。我们开始一个新的,甭管是Gemini也好,还是ChatGPT也好,它会有一些跟我们个人相关的这种个性化记忆。比如说我就告诉这个ChatGPT:“你记住了,我叫老范,我是个Youtuber,每天都要做什么事情。你要给我去总结信息,或者我要找你提问题,你要先去经过验证才能给我。”就这些玩意,我是可以让他记住的。但是如果你给他特别多的东西让他记,或者说我们在整个的聊天过程中让他把所有聊天内容都记下来,他就没法干活了。

两大关键突破点

这些问题关键的突破点是什么呢?咱们前头讲了两个关键突破点。

  • 世界模型:让AI理解物理世界的运行规律,这个是非常重要的。Deepmind内部呢,有一个叫Genius模型(天才模型),这呢是一个世界模型,通过物理一致性和时间连贯性生成虚拟世界,最后输出视频的。大方向上呢,跟李飞飞的方向是比较接近的。但是Deepmind的这个模型,是更接近于游戏世界一点点。这个哈萨比斯,不愧是从游戏公司里出来的,人生的第一份工作都是对一个人有重要的作用的。
  • 智能体系统:现在Gemini虽然也算是智能体,但是距离智能体系统还是有一些差距的。什么是智能体系统?就是从回答问题到完成任务。现在Gemini依然是在回答问题。他说未来呢,Gemini会嵌入眼镜、工作场景和工作流里面,能够记忆、推理或者是代办,不再只是回答问题,而是直接完成各种各样的任务。你让他做一个什么事的,切咔切咔给你做完了。可以自主规划、执行任务,并且根据结果调整的这种稳定的智能系统,这就是未来方向。

所以呢,两个AlphaGo级别的突破,一个是世界模型,第二个是智能体系统。

谷歌:科研领域的“怪物”

讲到这儿,要再跟大家啰嗦几句。其实大部分的科技公司,是无法想象谷歌的运作方式的,就像是大部分国家的人也无法想象中国是一个什么样的存在,是一样的。

中国的这种存在方式呢,联合国里边专门有一个效应,叫“中国效应”,就是各种统计的时候,一定要把中国排出去。为什么?因为你一旦把中国加上,所有统计数据就没有任何意义了。咱们举一个最简单的例子,吃西瓜。全世界的人都没法想象中国人到底一年吃多少西瓜,咱本身人就多,咱们一年大概吃全世界70%的西瓜。你把这个统计起来,全世界每个国家大家平均吃多少西瓜,你把中国算进去,这事没法算了。包括像什么发电、炼钢,只要是跟制造相关的,你就不能把中国搁里头统计,因为这个完完全全是另外一个维度了,它会让整个的统计结果完全失衡。中国属于是全产业链内卷,而且全产业链都产能过剩的一个国家。

谷歌呢,在科研上就有点像中国在产业链上的这个状态,很多方面呢都会尝试和探索。谷歌呢,具有非常高的人才密度、充足的科研经费,还有海量的数据,这个是缺一不可。而且呢,这些科研团队,他们的时间压力也不是很高,大家就自己按照自己的喜好去研究就行了。他们还在不断的收购新的、最前沿的公司,Deepmind就是买回来的嘛。

谷歌在AI领域里头,同时在探索强化学习(AlphaGo、AlphaZero这些产品)、认知架构、神经科学建模,以及Transformer大语言模型,这些都在研究。不是说我们觉得哪块有机会了,我就往这一个方向去研究。我记得特别清楚,我进入盛大网络参加入职培训的时候,他们就跟我讲说:“全世界只有一种游戏,这种游戏叫MMORPG,其他都不行。”后来我说那我们玩的其他游戏,他们说:“那些游戏不挣钱,我们不研究那个,我们只研究这一个最挣钱的。”这其实是大部分的公司的思考方式,我们既然已经证明了这玩意挣钱,其他的不挣钱,那咱就研究这就完了,特别很多中国公司是喜欢走这条路的。

但是谷歌不,它是所有的方向都要去试一试。而且很多方向呢,你都不知道什么时候能挣回钱来,他也要去试一试,比如说量子计算。前面咱们还专门讲过谷歌的量子计算是怎么回事。很多的这种科技成果,都没有办法给谷歌挣钱,也没有办法在谷歌内部取得成绩,很多人最终是离开了谷歌才创业成功的。现在的AI行业里头,创始人或者是创始的核心团队,大多都在谷歌混过。所以现在我们所看到的AI行业,或者叫AI革命,你基本上可以认为是一帮从谷歌出来的人在去折騰这个事情。

中国呢老说自己是“睡狮”,一旦被吵醒了会很吓人的。谷歌在科研领域里头,其实也是这么回事。拉一次红色警报,就有可能拎出像Gemini 3这样的大杀器出来吓唬人。现在Gemini 3火了,但是谷歌依然不会去收敛方向,照着唯一正确的方向前进,这不是谷歌的路子。谷歌的路子是什么?还是全面探索,严格追踪数据表现,保留多个可能性,并且不断验证。

普通公司能够解决当前的问题,预言一个未来的热门方向——大家注意,不热门他不去干,去一定是热门方向——他们才会愿意说我花一点精力、花点钱去折腾。像谷歌这个,都是这么多方向,哪块云彩下雨都不知道,到底什么时候做出来也不知道,就开始撒人、撒钱进去干活去了。在普通公司里头,能够去预言一个热门方向的,就已经算是很强的了。大量的都是别人做出来,特别是谷歌做出来,他在后边再接着跟着改。而且这些公司实在是搞不清楚什么是热门方向,或者热门方向搞不定怎么办?还有一条最简单的路:上谷歌挖人,或者直接从谷歌出来创业。这个就是普通公司跟谷歌之间的差异。所以谷歌呢,在科研领域里头完完全全就是一个怪物。

总结与展望

好,最后总结一下吧。谷歌Deepmind的CEO哈萨比斯,携Gemini 3成功之势参加了Axios AI大会,说再有一到两个AlphaGo级别的突破,就可以实现AGI了。这两个是什么呢?就是世界模型以及智能体系统。可能要5到10年,把这两个实现了以后,我们就达到AGI了。

本节目的特点,咱们八卦了一下哈萨比斯的开挂人生,也稍微介绍了一下谷歌这个绝对的科研领域的怪物。我们也希望谷歌,以及所在谷歌里头工作过的这些人,未来还会给我们带来更多的惊喜。


好,这个故事就讲到这里,感谢大家收听。请帮忙点赞、点小铃铛、参加DISCORD讨论群,也欢迎有兴趣、有能力的朋友加入我们的付费频道。再见。

Comments are closed.