游戏天才到诺奖得主,他凭什么断言AGI只差临门一脚?揭秘哈萨比斯开挂人生背后的逻辑|Demis Hassabis、Google DeepMind、AGI 时间表、5到10年
12 月 10
AIGC, Google的故事 5到10年, AGI, AGI 时间表, AI Agent, AI突破, AI路线图, AI进展, AI预测, AlphaFold, AlphaGo, Axios AI峰会, Demis Hassabis, Gemini, Gemini 3, Google Deepmind, 世界模型, 人类水平AI, 大模型局限, 强化学习, 德米斯·哈萨比斯, 技术挑战, 持续学习, 智能体系统, 蛋白质折叠, 认知神经科学, 诺贝尔奖得主, 谷歌AI, 谷歌大脑, 通用人工智能, 长期规划 游戏天才到诺奖得主,他凭什么断言AGI只差临门一脚?揭秘哈萨比斯开挂人生背后的逻辑|Demis Hassabis、Google DeepMind、AGI 时间表、5到10年已关闭评论
谷歌Deepmind的CEO说:“我们与AGI之间,只差一到两个AlphaGo级别的技术难关了。”
大家好,欢迎收听老范讲故事的YouTube频道。
现在Gemini 3正在大杀四方,谷歌里面负责开发Gemini的部门叫Deepmind,他的CEO出来接受访谈,关注度还是比较高的。
谷歌Deepmind的首席执行官叫德米斯·哈萨比斯,2025年12月4日接受了一个访谈,是在旧金山举行的Axios AI大会。和他对谈的人呢,是Axios的创始人和主编,叫Mike Allen。在这上面他讲到说,我们距离AGI还差一到两个类似于AlphaGo这样级别的突破,突破过去就可以了。
哈萨比斯:爽文男主般的开挂人生
哈萨比斯到底是一个什么样的人呢?绝对的爽文男主,挂b一样的存在。
从国际象棋神童到认知神经科学博士
哈萨比斯是一个英国人,Deepmind本身是一个英国公司,后来被谷歌收购的。他呢,76年在伦敦出生,这个姓氏是个希腊姓氏。他的父亲呢,是来自塞浦路斯的希腊裔,而他的母亲呢,是来自于新加坡的华裔。所以哈萨比斯呢,可以算是半个华人。
从小,这哥们是一个国际象棋神童。像这样的人,肯定都是有异于常人之处。4岁就开始下棋,13岁就达到了国际象棋大师水准。8岁就用自己的国际象棋奖金,给自己买了台电脑,开始学习编程了。
本科和硕士呢都是剑桥的,学的CS就是计算机科学,在校期间一直代表剑桥参加各种国际象棋比赛。博士呢是伦敦大学学院,专业方向是认知神经科学和神经科学。
从游戏制作人到AI先驱
工作,这哥们一开始做游戏的。先去加入了很著名的牛蛙工作室,这个牛蛙工作室呢,最著名的作品叫做《地下城守护者》。但是哈萨比斯当时进去的时候,应该还没有开发这个产品,牛蛙工作室最终是被EA给收购了。后来呢,他自己创建了一个工作室接着做游戏,叫做仙丹工作室。2004年出了一个游戏叫《邪恶天才》,是一个模拟经营游戏,就是一帮邪恶天才在一个小岛上做各种各样坏事的这样的一个游戏。只是呢,这个游戏并不怎么挣钱,这种超级天才做出来的游戏都未必能挣钱。
他呢就把工作室关掉了。后来呢,《邪恶天才》的IP被收购了,2021年《邪恶天才2》发布,但是呢,《邪恶天才2》就已经跟哈萨比斯没有什么关系了。
关闭这个游戏工作室之后,他就去创建了Deepmind。Deepmind主要还是游戏方向,他呢在里边去训练AI下围棋。这哥们是个国际象棋大师,但是呢开始训练AI下围棋,也就是AlphaGo这个东西就出来了。在这中间呢,还训练AI去打各种游戏,星际争霸呀,做一些其他这样的训练。
收购、AlphaFold与内部整合
2014年,Deepmind就被谷歌给收购了,6.5亿美金的价格。但是这个数字呢,并不是特别统一,很多的报道里的这个数字是有一些偏差的。有人说是4亿美金,也有人说是6.5亿美金,还有人说是4亿英镑。因为收购的时候,谷歌自己并没有公布价格,这些价格呢都是后续的报道里边去写的。
在谷歌收购以后呢,哈萨比斯在Deepmind里头又开发了叫AlphaFold这样的一个产品。这个产品是解决蛋白质折叠难题的。蛋白质实际上是这种超大分子,这些超大分子,我们算清楚有多少碳、多少氢、多少氧、还有氮,它并不是一个平面的结构,它是一个立体的结构,3D的。在这样的一个结构里头,它到底是怎么去排列和折叠的呢?原来大家是去预测呀、去猜呀,或者通过一些很复杂的设备去进行扫描,通过这样的方式去识别,成本是很高的。你要想去用蛋白质开发各种药品,你就必须要搞清楚它的3D架构空间,你搞不清楚,这事没法往前走。
哈萨比斯就去搞了AlphaFold,用AI去预测蛋白质的3D折叠空间到底是怎么回事。2020年呢,这个AlphaFold在蛋白质预测大赛中夺得头筹,比第二名强好几倍,这个事基本上就算解决了。现在只要是知道这个蛋白质的分子结构,这个AlphaFold的预测结果就极其准确。2024年,哈萨比斯依靠这个AlphaFold获得了诺贝尔化学奖,这哥们是个诺贝尔奖得主。
这还没完,他呢还在内部斗争中战胜了谷歌大脑。这是一个什么故事呢?谷歌内部一直是有两个AI部门的,一个是Deepmind,另外一个叫谷歌大脑,相互内斗,相互争夺资源。直到什么时候呢?直到ChatGPT出来,三年前谷歌拉响了红色警报,说不能再这样了,你们俩两家打来打去,这个不行了。那怎么办呢?最终是Deepmind合并了谷歌大脑,所以现在整个的谷歌AI是由Deepmind来去负责的,由哈萨比斯来去管理。
现在的Gemini 3使用的技术,大多都是原来谷歌大脑研究的方向:Transformer、大语言模型都是那边研究的。而Deepmind呢,原来在英国这帮人研究的呢,就是AlphaGo、AlphaZero(AlphaZero是AlphaGo之后的一个下棋的模型)以及各种可以自动玩游戏的AI产品,还有呢就是AlphaFold,做这个蛋白质分析的。
哈萨比斯除了是Deepmind的CEO之外,他自己还有一间专门做药的公司,专门用AlphaFold去做蛋白质研究,做各种新创新药的公司,他也是那个公司的创始人。所以哈萨比斯管理了整个的谷歌AI方向,以及谷歌Gemini这个产品化方向,都是归他管的。所以,爽文人生,绝对没有任何问题吧?
通往AGI之路:还差哪两个AlphaGo级别的突破?
哈萨比斯认为,我们距离AGI到底还差哪两个AlphaGo级别的突破呢?他自己做AlphaGo的,所以AlphaGo到他这儿变成了一个衡量单位,再出现两次AlphaGo这样的突破,我们就达到AGI了。
Gemini 3的惊人进展
他呢首先讲到Gemini 3,现在确实让人震惊,已经从文本专家变成了多模态理解系统了。他举了一个案例,说有一个电影叫《搏击俱乐部》,主角上去打斗之前把戒指摘下来了。他就去问这个Gemini,说这代表什么意思。它没有告诉你把戒指摘了就完了,而是告诉你说,这是主角抛开了身份、摆脱了规则的象征,是角色从现实到极端的转变。这个确实挺让人震惊的,这个Gemini 3模型有了自己的判断,不再只是迎合了。
到GPT这儿,你说你错了,它就会说“对不起,我错了”。到Gemini 3上,你说你错了,它会很耐心地给你解释,或者跟你去讨论这个事,是不会直接承认的。说Gemini 3的性格,叫“简洁,冷静,有自信,不讨好”。这个是哈萨比斯自己作为一个科学家,非常非常喜欢Gemini 3的一个地方。
而且Gemini 3呢,现在已经从生成内容,在向着打造产品的方向前进了。我们现在使用Gemini 3去做PPT,去做简单的应用原型,效果已经非常好了。它已经可以去执行一个比较简短的、连续的这种AI agent的工作了,这个是Gemini 3真正强的地方。
大模型当前面临的难题
哈萨比斯说了,现在的大模型还是有很多问题没法解决的。
- 不具备持续学习的能力。很多人都在担心,说我跟大模型聊了半天,是不是大模型就拿聊天的结果回去做训练去了。其实有时候确实他干,但主要做的是什么呢?就是强化学习。因为我们跟Gemini聊天,他经常会出俩答案让你挑一个,你在挑选的时候呢,实际上就已经在开始帮助大模型进行训练了。但是搜索的结果、我生成的内容、我提出的问题,我让这些东西去进入到大模型里头去进行训练的话,这个是不行的。大模型必须要进行数据筛选,然后才能训练。日常的这些内容,你拿去训练大模型的话,大模型可能会越训越笨的,特别是很多互联网上的垃圾信息,你塞到大模型里去训练,根本就没有办法达到预期的效果。所以大模型是没有办法自己去找内容去训练的,还是需要人先去提出要求,然后去进行数据清洗、数据处理。现在都是由大模型根据原始数据,再去生成最后的预训练数据,然后才能再去训练。所以这个事情,还没有办法让大模型自己去干,这是第一个问题。
- 无法执行长期的规划。虽然现在Gemini 3已经可以走一个一两个小时的规划,它还是能够走完的。但是你说我这有一个很多步骤,还是并行的,这种步骤需要去执行,执行完了以后需要连续执行几天、甚至几个月的这种任务,这个Gemini 3还搞不定。现在谁都搞不定这个事情。所以现在人去使用大模型,我们还需要自己去理解问题、自己去拆解问题,然后把这个拆解好的问题扔给大模型,而在对大模型的结果进行确认和验证之后,再把结果拼凑起来,让大模型去做下一步。它没有办法说你一开始给他个要求就做出来,“上帝说有光,于是就有了光”,这个事现在还做不到。
- 智能体系统很不稳定。为什么它没法连续干下去?就是它可能干着干着就跑偏,而且跑偏的过程中呢,自己不知道跑偏。在这个过程中,就有可能会浪费大量的TOKEN和算力,最后呢得出一个完全不可用或者说有害的一个结果出来。这个是目前为止大模型无法避免的问题。
- 缺乏跨对话的稳定记忆。现在大模型已经开始有记忆了,但是大量的记忆呢,还是在对话内的。而对话外的这种记忆,就是跨对话的记忆呢,它也不是说没有,像ChatGPT也好、Gemini也好,都是有一些跨对话记忆的。但是呢,这个记忆的空间都很小,你不可能说让他记很多的东西,然后跟你进行跨对话的去聊天。为什么呢?对于计算机来说吧,让它记住什么事是非常非常容易的,往硬盘里写不就记住了吗?但是让它忘掉是很难的。到底应该记住哪一部分、忘掉哪一部分,在下一次工作的时候我应该使用其中的哪部分去参与工作,这件事是非常难去抉择的。这就是大模型跨对话记忆的这个难点。所以他讲的,现在缺乏跨对话的稳定记忆,就是你让他记住可以,但是呢不一定下次就想起什么事来,可能他会找一个完全不相关的知识点,就参与到你这一次新的对话里去了。现在我们使用大模型的方式还是比较简单粗暴的,你发现讲着讲着驴唇不对马嘴了,怎么办?开始新话题,就是把原来的记忆都清干净。我们开始一个新的,甭管是Gemini也好,还是ChatGPT也好,它会有一些跟我们个人相关的这种个性化记忆。比如说我就告诉这个ChatGPT:“你记住了,我叫老范,我是个Youtuber,每天都要做什么事情。你要给我去总结信息,或者我要找你提问题,你要先去经过验证才能给我。”就这些玩意,我是可以让他记住的。但是如果你给他特别多的东西让他记,或者说我们在整个的聊天过程中让他把所有聊天内容都记下来,他就没法干活了。
两大关键突破点
这些问题关键的突破点是什么呢?咱们前头讲了两个关键突破点。
- 世界模型:让AI理解物理世界的运行规律,这个是非常重要的。Deepmind内部呢,有一个叫Genius模型(天才模型),这呢是一个世界模型,通过物理一致性和时间连贯性生成虚拟世界,最后输出视频的。大方向上呢,跟李飞飞的方向是比较接近的。但是Deepmind的这个模型,是更接近于游戏世界一点点。这个哈萨比斯,不愧是从游戏公司里出来的,人生的第一份工作都是对一个人有重要的作用的。
- 智能体系统:现在Gemini虽然也算是智能体,但是距离智能体系统还是有一些差距的。什么是智能体系统?就是从回答问题到完成任务。现在Gemini依然是在回答问题。他说未来呢,Gemini会嵌入眼镜、工作场景和工作流里面,能够记忆、推理或者是代办,不再只是回答问题,而是直接完成各种各样的任务。你让他做一个什么事的,切咔切咔给你做完了。可以自主规划、执行任务,并且根据结果调整的这种稳定的智能系统,这就是未来方向。
所以呢,两个AlphaGo级别的突破,一个是世界模型,第二个是智能体系统。
谷歌:科研领域的“怪物”
讲到这儿,要再跟大家啰嗦几句。其实大部分的科技公司,是无法想象谷歌的运作方式的,就像是大部分国家的人也无法想象中国是一个什么样的存在,是一样的。
中国的这种存在方式呢,联合国里边专门有一个效应,叫“中国效应”,就是各种统计的时候,一定要把中国排出去。为什么?因为你一旦把中国加上,所有统计数据就没有任何意义了。咱们举一个最简单的例子,吃西瓜。全世界的人都没法想象中国人到底一年吃多少西瓜,咱本身人就多,咱们一年大概吃全世界70%的西瓜。你把这个统计起来,全世界每个国家大家平均吃多少西瓜,你把中国算进去,这事没法算了。包括像什么发电、炼钢,只要是跟制造相关的,你就不能把中国搁里头统计,因为这个完完全全是另外一个维度了,它会让整个的统计结果完全失衡。中国属于是全产业链内卷,而且全产业链都产能过剩的一个国家。
谷歌呢,在科研上就有点像中国在产业链上的这个状态,很多方面呢都会尝试和探索。谷歌呢,具有非常高的人才密度、充足的科研经费,还有海量的数据,这个是缺一不可。而且呢,这些科研团队,他们的时间压力也不是很高,大家就自己按照自己的喜好去研究就行了。他们还在不断的收购新的、最前沿的公司,Deepmind就是买回来的嘛。
谷歌在AI领域里头,同时在探索强化学习(AlphaGo、AlphaZero这些产品)、认知架构、神经科学建模,以及Transformer大语言模型,这些都在研究。不是说我们觉得哪块有机会了,我就往这一个方向去研究。我记得特别清楚,我进入盛大网络参加入职培训的时候,他们就跟我讲说:“全世界只有一种游戏,这种游戏叫MMORPG,其他都不行。”后来我说那我们玩的其他游戏,他们说:“那些游戏不挣钱,我们不研究那个,我们只研究这一个最挣钱的。”这其实是大部分的公司的思考方式,我们既然已经证明了这玩意挣钱,其他的不挣钱,那咱就研究这就完了,特别很多中国公司是喜欢走这条路的。
但是谷歌不,它是所有的方向都要去试一试。而且很多方向呢,你都不知道什么时候能挣回钱来,他也要去试一试,比如说量子计算。前面咱们还专门讲过谷歌的量子计算是怎么回事。很多的这种科技成果,都没有办法给谷歌挣钱,也没有办法在谷歌内部取得成绩,很多人最终是离开了谷歌才创业成功的。现在的AI行业里头,创始人或者是创始的核心团队,大多都在谷歌混过。所以现在我们所看到的AI行业,或者叫AI革命,你基本上可以认为是一帮从谷歌出来的人在去折騰这个事情。
中国呢老说自己是“睡狮”,一旦被吵醒了会很吓人的。谷歌在科研领域里头,其实也是这么回事。拉一次红色警报,就有可能拎出像Gemini 3这样的大杀器出来吓唬人。现在Gemini 3火了,但是谷歌依然不会去收敛方向,照着唯一正确的方向前进,这不是谷歌的路子。谷歌的路子是什么?还是全面探索,严格追踪数据表现,保留多个可能性,并且不断验证。
普通公司能够解决当前的问题,预言一个未来的热门方向——大家注意,不热门他不去干,去一定是热门方向——他们才会愿意说我花一点精力、花点钱去折腾。像谷歌这个,都是这么多方向,哪块云彩下雨都不知道,到底什么时候做出来也不知道,就开始撒人、撒钱进去干活去了。在普通公司里头,能够去预言一个热门方向的,就已经算是很强的了。大量的都是别人做出来,特别是谷歌做出来,他在后边再接着跟着改。而且这些公司实在是搞不清楚什么是热门方向,或者热门方向搞不定怎么办?还有一条最简单的路:上谷歌挖人,或者直接从谷歌出来创业。这个就是普通公司跟谷歌之间的差异。所以谷歌呢,在科研领域里头完完全全就是一个怪物。
总结与展望
好,最后总结一下吧。谷歌Deepmind的CEO哈萨比斯,携Gemini 3成功之势参加了Axios AI大会,说再有一到两个AlphaGo级别的突破,就可以实现AGI了。这两个是什么呢?就是世界模型以及智能体系统。可能要5到10年,把这两个实现了以后,我们就达到AGI了。
本节目的特点,咱们八卦了一下哈萨比斯的开挂人生,也稍微介绍了一下谷歌这个绝对的科研领域的怪物。我们也希望谷歌,以及所在谷歌里头工作过的这些人,未来还会给我们带来更多的惊喜。
好,这个故事就讲到这里,感谢大家收听。请帮忙点赞、点小铃铛、参加DISCORD讨论群,也欢迎有兴趣、有能力的朋友加入我们的付费频道。再见。
RSS