<?xml version="1.0" encoding="UTF-8"?><rss version="2.0"
	xmlns:content="http://purl.org/rss/1.0/modules/content/"
	xmlns:wfw="http://wellformedweb.org/CommentAPI/"
	xmlns:dc="http://purl.org/dc/elements/1.1/"
	xmlns:atom="http://www.w3.org/2005/Atom"
	xmlns:sy="http://purl.org/rss/1.0/modules/syndication/"
	xmlns:slash="http://purl.org/rss/1.0/modules/slash/"
	>

<channel>
	<title>Google的故事 &#8211; 老范讲故事｜AI、大模型与商业世界的故事</title>
	<atom:link href="https://lukefan.com/category/google%e7%9a%84%e6%95%85%e4%ba%8b/feed/" rel="self" type="application/rss+xml" />
	<link>https://lukefan.com</link>
	<description>这里是老范讲故事的主站，持续更新 AIGC、大模型、互联网平台、商业冲突与资本市场观察，帮你看清热点背后的底层逻辑。</description>
	<lastBuildDate>Fri, 05 Jun 2026 06:17:49 +0000</lastBuildDate>
	<language>zh-Hans</language>
	<sy:updatePeriod>
	hourly	</sy:updatePeriod>
	<sy:updateFrequency>
	1	</sy:updateFrequency>
	<generator>https://wordpress.org/?v=7.0</generator>

<image>
	<url>https://lukefan.com/wp-content/uploads/2026/03/cropped-jimeng-2026-02-28-5245-用图一的人物形象，替换图二中的人物，使用图二的风格。文字替换：老范讲故事，Yo-32x32.jpeg</url>
	<title>Google的故事 &#8211; 老范讲故事｜AI、大模型与商业世界的故事</title>
	<link>https://lukefan.com</link>
	<width>32</width>
	<height>32</height>
</image> 
	<item>
		<title>谷歌800亿融资，巴菲特久违接盘，背后有什么鬼故事？</title>
		<link>https://lukefan.com/2026/06/05/alphabet-ai-infrastructure-financing-and-buyback-pause/</link>
		
		<dc:creator><![CDATA[老范 讲故事]]></dc:creator>
		<pubDate>Fri, 05 Jun 2026 00:52:08 +0000</pubDate>
				<category><![CDATA[AIGC]]></category>
		<category><![CDATA[Google的故事]]></category>
		<category><![CDATA[AI寒冬科技巨头囤现金]]></category>
		<category><![CDATA[Alphabet]]></category>
		<category><![CDATA[Alphabet全球举债100年期英镑债]]></category>
		<category><![CDATA[伯克希尔哈撒韦100亿投资谷歌]]></category>
		<category><![CDATA[美股科技股AI基建]]></category>
		<category><![CDATA[谷歌847.5亿美金融资]]></category>
		<category><![CDATA[谷歌停止股票回购]]></category>
		<category><![CDATA[谷歌母公司Alphabet融资分析]]></category>
		<guid isPermaLink="false">https://lukefan.com/?p=3820</guid>

					<description><![CDATA[谷歌847.5亿融资、停止回购、全球举债，正在释放AI巨头提前过冬的信号。本文拆解谷歌融资结构、AI基建现金需求、科技股回购归零、伯克希尔哈撒韦投资谷歌等关键动作，理解为什么最有钱的公司仍在囤现金。文章也对比互联网泡沫与AI算力周期，分析现金、资产价格和竞争格局如何在“冬天”重新洗牌，并提醒普通人关注AI真正落地后的交易效率提升与个人位置选择。]]></description>
										<content:encoded><![CDATA[
<figure class="wp-block-embed is-type-video is-provider-youtube wp-block-embed-youtube wp-embed-aspect-16-9 wp-has-aspect-ratio"><div class="wp-block-embed__wrapper">
<iframe title="谷歌800亿融资，巴菲特久违接盘，背后有什么鬼故事？" width="900" height="506" src="https://www.youtube.com/embed/IbVORK8NX2M?feature=oembed" frameborder="0" allow="accelerometer; autoplay; clipboard-write; encrypted-media; gyroscope; picture-in-picture; web-share" referrerpolicy="strict-origin-when-cross-origin" allowfullscreen></iframe>
</div></figure>



<figure class="wp-block-image size-large"><img decoding="async" src="https://pictures.lukefan.com/alphabet-ai-infrastructure-financing-and-buyback-pause/blog_1.jpg" alt="冬季城市里的谷歌大楼、现金弹药箱、AI芯片和债券文件围成一座储备仓，几家科技巨头在远处排队囤现金，浅色背景的商业评论版橡皮泥平面信息图的统一风格。"/></figure>



<p class="wp-block-paragraph">如果是，那么它的股价就会下跌，因为它的业绩没有达到预期；如果是，那么它的股价就会上涨，因为它的业绩超出了预期。所以我们要关注的是公司的业绩，而不是股价的短期波动。</p>



<p class="wp-block-paragraph">首先要跟大家更正一点，谷歌融的不是800亿美金，是<strong>847.5亿美金</strong>。而且它不仅仅是发动了融资，还停止了回购，而且还在全世界举债借钱。这到底在发生什么？</p>



<p class="wp-block-paragraph">AI巨头嘴上在讲春天要来了，账面上却在准备过冬。什么时候需要这么多现金？一定是准备过冬的时候，准备冬眠的时候，这个时候才需要囤现金。寒冬里的现金不只是为了买过冬粮，还是为了收割竞争对手和低估资产的子弹。</p>



<h2 class="wp-block-heading">巨头们的反常动作</h2>



<figure class="wp-block-image size-large"><img decoding="async" src="https://pictures.lukefan.com/alphabet-ai-infrastructure-financing-and-buyback-pause/blog_2.jpg" alt="几家科技巨头的卡通总部同时把“股票回购”开关拨到关闭，旁边现金箱和AI服务器被推入仓库，浅色背景的商业评论版橡皮泥平面信息图的统一风格。"/></figure>



<p class="wp-block-paragraph">现在把几个反常的动作放在一起来看一下。谷歌一季度回购归零。美国这些大的科技股都是会不停回购股票的，但谷歌一季度没有回购。Meta同季度回购归零，它也不回购了。Oracle最近一个季度回购归零。所有这些巨头都已经停止了股票回购。春江水暖鸭先知，他们这些人肯定先动起来了。</p>



<p class="wp-block-paragraph">谷歌过去一年在多币种密集举债，不光是在美国搞钱，日本、瑞士、各个地方都在发债，都在搞钱。英国市场上甚至再次出现了100年期的英镑债，很神奇。伯克希尔哈撒韦也拿出了100亿美元买谷歌，但是自己仍然握着3,000多亿美元的现金和短期美债。</p>



<p class="wp-block-paragraph">所以这不是缺钱公司在求救，这是最有钱的一批公司，在钱还相对比较便宜、市场还愿意相信AI春天的时候，提前把弹药库囤满的动作。</p>



<span id="more-3820"></span>



<h2 class="wp-block-heading">谷歌847.5亿融资是怎么算的</h2>



<figure class="wp-block-image size-large"><img decoding="async" src="https://pictures.lukefan.com/alphabet-ai-infrastructure-financing-and-buyback-pause/blog_3.jpg" alt="一张融资结构拆解图，847.5亿美金总额被分成普通股、强制可转优先股、伯克希尔私募和ATM增发四个模块，浅色背景的商业评论版橡皮泥平面信息图的统一风格。"/></figure>



<p class="wp-block-paragraph">首先咱们来讲谷歌这个847.5亿到底是怎么算的。2026年6月1日，Alphabet宣布计划进行800亿美金的权益融资。2026年6月2日，定价文件把总规模上修到了847.5亿美金。</p>



<p class="wp-block-paragraph">结构大概包括几块：</p>



<ul class="wp-block-list">
<li>普通股公开发行；</li>



<li>强制可转优先股存托股份；</li>



<li>伯克希尔哈撒韦私募；</li>



<li>ATM按市场价分批增发。</li>
</ul>



<p class="wp-block-paragraph">ATM是400亿美金，就是400亿放在这，但是到Q3的时候慢慢把它放出来，预计从2026年Q3开始，不是当天一次性就到账了。</p>



<p class="wp-block-paragraph">伯克希尔哈撒韦这100亿美金，50亿买的是A类普通股，价格是351.81美金每股；50亿买的是C类资本股，价格是348.2美元每股。</p>



<p class="wp-block-paragraph">A类股票是一股一票，股票除了可以分钱之外，是有投票权的，开股东大会的时候你可以上去投票。B类股是一股十票，主要握在谷歌的创始团队和管理团队手里。C类股是无投票权的。所以大家看到，伯克希尔哈撒韦所买的C类股，要比A类股稍微便宜一点点。</p>



<p class="wp-block-paragraph">伯克希尔哈撒韦买的是谷歌冬天里的经济仓位，不是谷歌的控制权。谷歌控制权仍然焊在B类超级投票股的手里。所以你说我现在想让谷歌做出一个什么决策，靠外边买股票很难实现这个目标。</p>



<p class="wp-block-paragraph">那你说这数到800亿了，剩下的钱去哪了？不多出来47.5亿吗？这里头大概有20多亿是承销商做这样的操作会有的，他们可以多买一点点，这个是要给他们留出来的。还有20多亿是承销商的手续费，人家给你干这个活，还是要收手续费的。大概加在一起是847.5亿。</p>



<h2 class="wp-block-heading">回购熄火：科技股的重要边际买盘退潮</h2>



<figure class="wp-block-image size-large"><img decoding="async" src="https://pictures.lukefan.com/alphabet-ai-infrastructure-financing-and-buyback-pause/blog_4.jpg" alt="一台写着“股票回购”的发动机逐渐熄火，科技股价格曲线旁的公司自购机器人停止买入并转向AI机房建设，浅色背景的商业评论版橡皮泥平面信息图的统一风格。"/></figure>



<p class="wp-block-paragraph">下一个事，咱们讲回购。过去十年，美股科技股很重要的边际买盘，就是公司自己买自己。美股七姐妹里有一些是非常喜欢回购的，这里头最喜欢回购的是苹果，谷歌、微软都是特别喜欢回购的。</p>



<p class="wp-block-paragraph">但是美股七姐妹里有两个不怎么回购。第一个是特斯拉，基本上不回购；另外一个就是亚马逊，回购相对来说比较少。通常创始人在的时候都不太爱回购，因为他们觉得钱在我手里是可以更好发展的。乔布斯在的时候苹果也不回购，乔布斯离开了，蒂姆·库克上来以后，才开始进行大规模回购。</p>



<p class="wp-block-paragraph">现在美股七姐妹能够占到美股这么大的份额，其实很大一块是他们自己买回来的。回购意味着公司有富余的现金，愿意托股价，愿意把利润还给股东。现在AI基建一上来，这台发动机开始退潮了。</p>



<h3 class="wp-block-heading">谷歌：连续33个季度回购后突然归零</h3>



<p class="wp-block-paragraph">谷歌一季度回购归零，没有回购A类和C类的股票。2025年一季度，谷歌回购股票现金流约150.68亿美金。从2017年Q4到2025年Q4，连续33个季度都是有回购的，突然到2026年第一季度就停了，就归零了。</p>



<p class="wp-block-paragraph">大家可以看到趋势，不是没有钱回购了，是明明还有授权。大家注意，回购这东西不是说我今天想回就回，明天不想回就不回的。你要先去提交申请，人家SEC给你授权了，你才可以去回购。他授权还在，但是我就不回购了。一边停止回购，一边融资847.5亿美金，这个信号比新闻标题更重要。</p>



<h3 class="wp-block-heading">Meta：从持续回购转向AI基础设施</h3>



<p class="wp-block-paragraph">下一个是Meta。Meta 2026年一季度停止了回购，2025年同期Meta还回购了127.54亿美金，2025年四季度也没有回购。所以它的2026年一季度，是第二个停止回购的季度。</p>



<p class="wp-block-paragraph">Meta的A类股回购计划也是从2017年1月份开始的，8年零9个月，35个季度。Meta回购了这么多季度以后，到2025年Q4说停：我们现在这些钱有用了，我们要拿去做AI基础设施建设了。</p>



<h3 class="wp-block-heading">Oracle：老回购机器也停了</h3>



<p class="wp-block-paragraph">Oracle属于老回购机器。Oracle跟上面两家比起来是比较小的，所以它每年的回购也就是几亿美金。它从1992年就开始回购，每年都回购。但是到2026年2月28日这个季度就停止回购了。我要拿这些钱去建机房，我要去买AI服务器去了。</p>



<h3 class="wp-block-heading">亚马逊：本来就不是高回购公司</h3>



<p class="wp-block-paragraph">亚马逊是一个比较特殊的。亚马逊有回购计划，2022年授权了最高100亿美金的回购，但是没有固定日期。</p>



<p class="wp-block-paragraph">像我们以前去申请回购的时候，是这么申请的：</p>



<ol class="wp-block-list">
<li>回购多少钱；</li>



<li>这个回购在多长时间之内要把它做完；</li>



<li>在什么样的价格区间内去启动回购。</li>
</ol>



<p class="wp-block-paragraph">回购还有量，就是每天回购的量不超过上一个交易日的百分之多少，反正有这样一些规定。当然也有一些规定稍微宽松一点的，就像亚马逊这种，2022年授权了100亿美金，什么时候愿意回就什么时候回，把这100亿回完了以后，再去做新的申请就可以了。</p>



<p class="wp-block-paragraph">2022年，它回购了60亿美金。2023年、2024年、2025年都没有回购，2026年也没有回购。所以它这个100亿美金，基本上就是为了2022年那一次去做的。亚马逊压根就不是这种高回购公司，它是突然有事了我就干一笔，其他时候我就不做了。</p>



<h3 class="wp-block-heading">微软和苹果：两个对照组</h3>



<p class="wp-block-paragraph">这里头还有一个对照组，就是微软跟苹果。微软并没有停止回购，2026年刚刚过去的这个季度，仍然通过分红和回购返还了102亿美金。但是微软的回购额度在下降，原来回购的会更多一些，现在在收紧。</p>



<p class="wp-block-paragraph">而苹果就是另外一回事了。大家注意，每个公司给财年起名字的方式不一样，所以它经常对不齐。苹果2026年的第二季度新增最高1,000亿美金的回购。为什么它这么猛？因为苹果AI啥也没干，它也没有去建机房。到目前为止，苹果跟英伟达之间的恩怨也没有解开，你建了机房，总不能上英伟达那买芯片去吧，所以它就只能拿着钱去回购去了。</p>



<h2 class="wp-block-heading">谷歌全球举债：提前锁定低成本资金</h2>



<figure class="wp-block-image size-large"><img decoding="async" src="https://pictures.lukefan.com/alphabet-ai-infrastructure-financing-and-buyback-pause/blog_5.jpg" alt="世界地图上日元、瑞士法郎、欧元、加元和英镑债券从各地流向Alphabet资金池，低利率标签贴在不同货币旁，浅色背景的商业评论版橡皮泥平面信息图的统一风格。"/></figure>



<p class="wp-block-paragraph">咱们讲了两点，第三个，谷歌还在全球举债，四处借钱。谷歌过去一年一直在全球债券市场上拿钱。Alphabet 6月融资材料显示，过去一年已经在六种主要货币和市场融资，借了超过850亿美金的债务，这让它的负债总额超过了1,000亿美金。原来没多少，你看它新增了850亿，达到1,000亿。</p>



<p class="wp-block-paragraph">谷歌在日元、欧元、加元、瑞士法郎、英镑四处去借。那你说为什么借这些钱？因为这些钱的利息低。瑞士法郎的利息是0，日元的利息大概是0点一几还是0点几，非常非常低。我借这个钱，肯定要比去借美元便宜，因为美元的利息是很高的。欧元的利息其实也不低，但是只要有窗口还是要去借。</p>



<h3 class="wp-block-heading">英国100年期英镑债</h3>



<p class="wp-block-paragraph">所有这些债务里头，最有意思的一笔是在英国。2026年2月，Alphabet在英国发行英镑债，其中包括一支100年期的英镑债。路透社报道，这只100年期英镑债的规模是10亿英镑，票息是6.125%。这只百年债务属于55亿英镑五档英镑债务交易中的一部分，就是它一共借了55亿，然后这55亿里按照不同的档次去借，其中有一笔10亿英镑是100年的。</p>



<p class="wp-block-paragraph">Bloomberg报道称，这类科技公司的百年债务是极其罕见的。上一个是谁？上一个是1997年的摩托罗拉。谷歌是有史以来的第二次。这个事稍微有点不太吉利，因为摩托罗拉大家已经知道，它借完百年债以后，实际上就一直在走下坡路。现在摩托罗拉的手机业务先卖给了谷歌，后来卖给了联想。现在摩托罗拉到底在干什么，大家都不知道了。</p>



<h2 class="wp-block-heading">伯克希尔哈撒韦的100亿：不是追热点</h2>



<figure class="wp-block-image size-large"><img decoding="async" src="https://pictures.lukefan.com/alphabet-ai-infrastructure-financing-and-buyback-pause/blog_6.jpg" alt="伯克希尔哈撒韦的大粮仓里堆满现金和短期美债，一只手拿出一小袋100亿现金投向谷歌标识的湖面试探水温，浅色背景的商业评论版橡皮泥平面信息图的统一风格。"/></figure>



<p class="wp-block-paragraph">伯克希尔哈撒韦投了谷歌100亿美金，我看也很多人在说这个事。甚至有些人在讲，巴菲特退休了，新上的这位CEO是“崽卖爷田不心疼”，就是说前面把田留下来了，新人上来以后就把田卖了，不心疼。这个不能这么讲。</p>



<p class="wp-block-paragraph">这100亿美金对于很多人来看是一个很大的钱，但实际上，伯克希尔哈撒韦2026年一季度保险和其他业务持有的美元现金及现金等价物514.78亿美金，同期还持有3,392.61亿美元的短期美国国库券，两项合起来3,907.39亿美金，应该是伯克希尔哈撒韦自建立起来现金存量最高的一个时间点。</p>



<p class="wp-block-paragraph">所以伯克希尔哈撒韦给了谷歌100亿，不是倾家荡产，不是把粮仓搬空了，它只是从粮仓里拎了一小袋子粮食出来，往市场的水里扔了一块石头。这块石头的作用是什么？是看看市场是不是已经很紧张了，也要看一看资产会不会开始打折，看看AI基建这场大洗牌会不会提前开始。</p>



<h2 class="wp-block-heading">现金既是防守，也是冬天里的收割工具</h2>



<figure class="wp-block-image size-large"><img decoding="async" src="https://pictures.lukefan.com/alphabet-ai-infrastructure-financing-and-buyback-pause/blog_7.jpg" alt="雪地市场中现金充足的大公司举着盾牌和收购网，一边抵御寒风一边把打折资产与小型AI公司收入购物车，浅色背景的商业评论版橡皮泥平面信息图的统一风格。"/></figure>



<p class="wp-block-paragraph">所以现金不只是防守，也是冬天里的收割工具。冬天有两件事情会同时发生：钱会变贵，资产会变便宜。</p>



<p class="wp-block-paragraph">很多人听到这就会觉得，资产变便宜我能理解，原来估值是100亿，现在估值剩10亿了，这事我能理解。那什么叫钱会变贵？就是你借不到钱了，融不到钱了。你要想融到钱，需要支付更高的利息，这就叫钱会变贵。</p>



<p class="wp-block-paragraph">刚刚我们讲的，大家也可以看到这个钱变便宜的过程。你现在去借日元、借瑞士法郎，这个钱就变得特别便宜，因为它利息低。去借美元，这个好贵，5%的年息。你现在去找伯克希尔哈撒韦，说我愿意把股票卖给你，打了个百分之几的折扣。你真到冬天的时候，再去找伯克希尔哈撒韦谈这个生意，说我现在还想把股票卖给你，那伯克希尔哈撒韦说，来，给我打个八折行不？它就会变成这样了。这就是钱和资产之间的价格博弈。</p>



<p class="wp-block-paragraph">真到冬天的时候，现金多的人一边能够熬过应用收入还没跑出来的阶段，一边还能够在别人被迫卖身的时候，收购竞争对手或者被低估的资产。比如现在突然钱变贵了，资产变便宜了，那谷歌一扭头说，Anthropic，你的日子不太好过吧，我把你买下来吧。它会干这样的事情。当然未必是Anthropic，有可能是其他一些公司。它一伸手就直接把人买回来了，因为那个时候人家变便宜了，它手里有现金，现金变贵了。</p>



<p class="wp-block-paragraph"><strong>AI寒冬真正残酷的地方，不是大家一起亏钱，而是现金多的人会在冬天把现金少的人直接收走。</strong></p>



<h2 class="wp-block-heading">AI会有春天，但春天之前先有冬天</h2>



<p class="wp-block-paragraph">那么AI到底是不是泡沫？我觉得这个问题不是我们今天要讨论的。我们今天要讲的是，AI会迎来春天，但是在春天之前，先会有冬天。</p>



<p class="wp-block-paragraph">所以现在甭管是谷歌、微软、Meta、Oracle，所有这些公司，他们一边在粉饰太平，在告诉大家说，你看我很挣钱，我的现金流很稳，我手上现金很多；一边又在拼命地囤积弹药。他们就是在过冬。他们都相信春天会到来，但是一定要把冬天的子弹存好，这样他们可以熬过冬天，甚至可以在冬天消灭竞争对手。</p>



<h2 class="wp-block-heading">互联网泡沫与AI算力：像与不像</h2>



<figure class="wp-block-image size-large"><img decoding="async" src="https://pictures.lukefan.com/alphabet-ai-infrastructure-financing-and-buyback-pause/blog_8.jpg" alt="左侧是2000年互联网泡沫里的思科路由器堆成金矿旁的卖水摊，右侧是AI时代英伟达算力卡堆成新卖水摊，中间用对比箭头连接，浅色背景的商业评论版橡皮泥平面信息图的统一风格。"/></figure>



<p class="wp-block-paragraph">那么我们就要想想，上一个泡沫、上一个冬天是什么样了。互联网泡沫跟AI算力之间，到底有什么异同之处？</p>



<p class="wp-block-paragraph">大家知道互联网泡沫的时候，这些科技企业在囤什么吗？现在咱们都知道，在囤算力，在囤机房，在囤显卡。上一次大家干的是什么？上一次大家囤的是思科，是路由器，是网络设备。因为当时大家也不知道互联网怎么去改变世界。既然挖不出金子来，咱就在金矿旁边卖水呗。这一次卖水的是英伟达，上一次卖水的就是卖交换机的。所以他们就拼了命地去囤思科，把思科的市值一直推到了5,554亿美金，成为了当时市值最高的一个公司。</p>



<p class="wp-block-paragraph">这个时间点是2000年3月，也就是互联网泡沫正在破裂的这个时间点，最高峰就在这了。到2001年，这个泡沫就破了，而且当时的市场发现我们押错注了。思科现在依然是一个很大的公司，但是已经完全不是当年的思科了。</p>



<p class="wp-block-paragraph">2001年，思科做了约22.5亿美元的库存冲销，就是这库存卖不出去了，并且启动了裁员和成本压缩。思科的股价大概在最高峰上跌去了50%以上，直接是腰斩再腰斩的状态。思科到现在应该也没有爬回到5,000多亿的市值去，就一直这么不温不火地往前走，也没死掉，还是在接着往前做。</p>



<p class="wp-block-paragraph">这玩意是鬼故事，咱们一开始就要讲鬼故事吗？大家有没有害怕？互联网时代拼命去做卖水人、卖铲人，囤了一堆思科路由器，把思科股价推到市值第一。现在AI冬天即将来临，囤了一堆算力卡，囤了一堆英伟达，把英伟达推成了市值第一的位置。是不是觉得后脊梁开始发凉？</p>



<h3 class="wp-block-heading">不同之处：TOKEN需要算力产生</h3>



<p class="wp-block-paragraph">要跟大家讲，这里不太一样。思科的问题是什么？互联网真正赚钱的地方在于广告、搜索、电商和交易匹配。交易次数的暴增、交易效率的提升，不会自动让思科多卖一台交换机。你把这些交换机都卖完了以后，就搁这不动了，然后那边人家去提升交易效率、提升交易次数，后边挣的钱跟你没关系。</p>



<p class="wp-block-paragraph">但是现在AI是不一样的，因为AI是需要产生TOKEN的，而TOKEN必须要靠显卡去产生，要靠算力卡去产生。只要有新一代的算力卡出来，它产生TOKEN的效率会提升。你可以用更少的钱买更强的算力卡，用更少的电产出更多的TOKEN。而且你希望挣到更多的钱，就必须要烧出更多的TOKEN。所以这个跟上一次确实不太一样。</p>



<p class="wp-block-paragraph">但是这还是鬼故事。</p>



<blockquote class="wp-block-quote is-layout-flow wp-block-quote-is-layout-flow">
<p class="wp-block-paragraph">“这次真的不一样了”，也是那些股市里的老韭菜每次都说的一句话。</p>
</blockquote>



<p class="wp-block-paragraph">我们希望这一次真的不一样了吧。</p>



<h2 class="wp-block-heading">普通人真正应该思考什么</h2>



<figure class="wp-block-image size-large"><img decoding="async" src="https://pictures.lukefan.com/alphabet-ai-infrastructure-financing-and-buyback-pause/blog_9.jpg" alt="普通人站在AI交易网络地图前，用放大镜寻找自己的新位置，旁边有现金储备篮、技能工具箱和分散资产图标，浅色背景的商业评论版橡皮泥平面信息图的统一风格。"/></figure>



<p class="wp-block-paragraph">普通人真正应该思考的是什么？首先，巨头们的这些动作，他们在干什么，他们是怎么想的，他们为什么干这件事，我觉得我已经跟大家讲得很明白、很透彻了。他们已经判断了要入冬，冬天以后是灿烂的春天，但是怎么度过这个冬天，这就是他们现在在做的事情。</p>



<p class="wp-block-paragraph">普通人说，我现在也去买点股票，我买点伯克希尔哈撒韦吧，或者什么都可以。但是更多需要思考的是什么？互联网进入春天以后，不是网页更酷了，当然也不是需要买更多的交换机，这都不对。真正互联网进入春天以后发生了什么？是所有交易的效率、交易的频次、交易的数量呈几何级数上升了，然后大家在里面找到了各自的位置，重新开始挣钱。</p>



<p class="wp-block-paragraph">AI其实也是一样的。现在我们总担心AI带来裁员，AI有泡沫，AI不知道怎么挣钱，其实跟互联网冬天之前的那个时期是一样的。AI真正落地以后，一定也是交易，一定注意交易。交易的效率会提升，交易的数量会提升，大量原来没法做的交易可以去做了。在这里头，我们要去思考到底能够给自己寻找到什么样新的位置，这个才是普通人在这里头真正要去想的。</p>



<p class="wp-block-paragraph">剩下的，咱们也都囤点现金，囤一点好出手的资产，鸡蛋不要放在一个篮子里，也只能跟大家讲这种老生常谈的话了。</p>



<h2 class="wp-block-heading">结尾：四句话总结</h2>



<figure class="wp-block-image size-large"><img decoding="async" src="https://pictures.lukefan.com/alphabet-ai-infrastructure-financing-and-buyback-pause/blog_10.jpg" alt="四张总结卡片并排展示回购熄火、全球举债、老钱试水和AI交易春天，卡片下方连接成一条从冬天走向春天的路线，浅色背景的商业评论版橡皮泥平面信息图的统一风格。"/></figure>



<p class="wp-block-paragraph">最后咱们结个尾。谷歌不是缺钱了，伯克希尔哈撒韦也不是在追热点，他们都在做同一件事情：趁着市场还相信春天，先把冬天的钱和资产囤好。更狠的一层是，冬天不只是防守期，也是收割期，他们也准备去收割别人。</p>



<p class="wp-block-paragraph">所以今天这个故事可以落在四句话上：</p>



<ol class="wp-block-list">
<li><strong>回购熄火</strong>，是股东回报让位给AI基建；</li>



<li><strong>全球举债</strong>，是提前锁定低成本、长久期的资金；</li>



<li><strong>伯克希尔哈撒韦进场</strong>，是老钱拿着现金看冬天资产会不会打折，实际上它真的就是在往湖里扔石头，有3,900亿现金，扔了100亿出来听个响，看看你们是不是开始抢起来了，它在干这样的事情；</li>



<li><strong>AI真正的春天</strong>，要看它能不能像互联网一样，把难做的生意变成高效、高频、低成本、可规模化的新交易。我们真正要等的是这一个时间点。</li>
</ol>



<p class="wp-block-paragraph">好，这就是咱们今天的故事。感谢大家收听，请帮忙点赞，点小铃铛，参加Discord讨论群，也欢迎有兴趣、有能力的朋友加入我们的付费频道。再见。</p>



<hr class="wp-block-separator has-alpha-channel-opacity"/>



<h2 class="wp-block-heading">背景图片</h2>



<figure class="wp-block-image size-large"><img decoding="async" src="https://pictures.lukefan.com/alphabet-ai-infrastructure-financing-and-buyback-pause/background_1.jpg" alt=""/></figure>
]]></content:encoded>
					
		
		
			</item>
		<item>
		<title>Google I/O失焦与Gemini困局</title>
		<link>https://lukefan.com/2026/05/24/google-io-gemini-antigravity-agent-reliability/</link>
		
		<dc:creator><![CDATA[老范 讲故事]]></dc:creator>
		<pubDate>Sun, 24 May 2026 01:13:55 +0000</pubDate>
				<category><![CDATA[AIGC]]></category>
		<category><![CDATA[Google的故事]]></category>
		<category><![CDATA[Antigravity 2.0 使用体验]]></category>
		<category><![CDATA[Gemini]]></category>
		<category><![CDATA[Gemini 3.5 Flash 评测]]></category>
		<category><![CDATA[Gemini Spark 与 Workspace 集成]]></category>
		<category><![CDATA[Google AI Ultra 用户限制]]></category>
		<category><![CDATA[Google I/O 2026]]></category>
		<category><![CDATA[Google I/O 2026 发布了什么]]></category>
		<category><![CDATA[Google 智能体战略]]></category>
		<guid isPermaLink="false">https://lukefan.com/?p=3790</guid>

					<description><![CDATA[本文复盘 Google I/O 2026 的核心发布与争议，重点分析 Gemini 3.5 Flash 体验、AI智能体可靠性、Gemini Spark 与 Antigravity 2.0 的产品困局。文章指出，Google 并非输在技术，而是输在入口过多、主线分散和产品取舍不足：Flash 快但不够可靠，Omni 强但用户感知弱，Spark 受限于开放范围，Antigravity 又难以成为统一入口。适合关注 Google AI 发布会、智能体工具和大模型产品策略的读者。
]]></description>
										<content:encoded><![CDATA[
<figure class="wp-block-embed is-type-video is-provider-youtube wp-block-embed-youtube wp-embed-aspect-16-9 wp-has-aspect-ratio"><div class="wp-block-embed__wrapper">
<iframe title="Google I/O失焦：Gemini为何做不好新产品?" width="900" height="506" src="https://www.youtube.com/embed/6CktIqU3C-U?feature=oembed" frameborder="0" allow="accelerometer; autoplay; clipboard-write; encrypted-media; gyroscope; picture-in-picture; web-share" referrerpolicy="strict-origin-when-cross-origin" allowfullscreen></iframe>
</div></figure>



<figure class="wp-block-image size-large"><img decoding="async" src="https://pictures.lukefan.com/google-io-gemini-antigravity-agent-reliability/blog_1.jpg" alt="巨大的 Google I/O 舞台投影在黄昏色背景中，前景是一位评论者拿着讲稿和放大镜审视散落的 Gemini、Spark、Antigravity 图标，构图呈现“技术巨人与疲态发布会”的对照，浅色背景的商业评论版橡皮泥平面信息图的统一风格。"/></figure>



<p class="wp-block-paragraph">今天咱们聊一聊 Google I/O。</p>



<p class="wp-block-paragraph">我本人应该是在 2005 年、2006 年都去现场参加过 Google I/O。当时还是在旧金山市中心的 Moscone Center。后来 Google I/O 搬到 Mountain View 以后，我就没有再去参加过了，因为 Google I/O 越办越大，Moscone Center 已经不够用了。</p>



<p class="wp-block-paragraph">今天讲 Google I/O，其实是要讲一个日暮西山的巨人，还在坚持一些很守旧的东西，给我们展现各种疲态。以前每年 Google I/O，我们还会关注今年发布了什么、有什么有意思的东西。现在看完以后，只会觉得很失望。当然，还是有很多人在尬吹 Google I/O，看得我脚底板都快抠出两室一厅来。</p>



<span id="more-3790"></span>



<h2 class="wp-block-heading">一次让我放弃使用 Gemini 的经历</h2>



<figure class="wp-block-image size-large"><img decoding="async" src="https://pictures.lukefan.com/google-io-gemini-antigravity-agent-reliability/blog_2.jpg" alt="一个人坐在电脑前询问 Gemini Spark，屏幕里的机器人却把 Apache Spark、讯飞 Spark 和 Google Spark 三个标签混成一团，桌面上放着直播讲稿草稿，浅色背景的商业评论版橡皮泥平面信息图的统一风格。"/></figure>



<p class="wp-block-paragraph">今年最有意思的，不是 Google 发布了多少东西，而是我本来想用 Google 自己最新的 AI 来准备这一期 Google I/O 的直播讲稿。我原来有这样的习惯：讲谁家的产品，就一定用谁家的大模型去准备，也算稍微体现一下他们的能力。但是稍微点了几下以后，我就放弃了。</p>



<p class="wp-block-paragraph">事情是这样的：我去问 Gemini，而且还不是在 Gemini App 或者 Gemini 网页里问。我还专门跑到 Antigravity 2.0 里，做了一个升级以后去问。我说：“Gemini Spark 这个我很喜欢，我想用一下，怎么用？”</p>



<p class="wp-block-paragraph">它也搜索了，也思考了，然后告诉我：有一个东西叫 Apache Spark，还有一个东西好像叫科大讯飞还是谁的 Spark，你到底要用哪个？当时把我问傻了。我说我要用 Google 的，刚在 I/O 上发布的那个 Spark。然后它说：“那你真的要用 Apache Spark 吗？”</p>



<p class="wp-block-paragraph">我已经不知道该怎么接了，于是我就放弃了。</p>



<p class="wp-block-paragraph">所以今天这个稿子依然是用 GPT 来准备的。刚才这个故事发生在 Google 刚刚升级的 Antigravity 2.0 和 Google 刚刚发布的 Gemini 3.5 Flash 上。3.5 Flash 没搞定，我就换成 3.1 Pro，结果还是在那胡说八道。后来我到 Google 的 Gemini App 或者 Gemini 网页上试，依然如此。</p>



<p class="wp-block-paragraph">我为什么要出来骂街、抱怨这件事？因为我自己的使用体验非常非常差。这不是一个单纯的吐槽。Google 在发布会上讲的是智能体时代，它也意识到现在是智能体时代，是 harness agent 的时代。但是普通用户真正关心的是什么？就是你能不能听懂我在说什么，能不能按我的话去干活，能不能少犯点低级错误。</p>



<p class="wp-block-paragraph">聊天机器人胡说八道，最多让人一笑。但是<strong>智能体胡说八道是很危险的</strong>：它会改错文件、发错邮件、删错代码、安排错会议。这是我们不能忍受的。所以 AI 从聊天进入干活阶段以后，可靠性要比速度和价格重要得多。</p>



<figure class="wp-block-image size-large"><img decoding="async" src="https://pictures.lukefan.com/google-io-gemini-antigravity-agent-reliability/blog_3.jpg" alt="一个 AI 智能体像机械手一样同时伸向文件夹、邮件、代码窗口和日历，但每个目标上都有红色错误标记，旁边的用户紧张地按下停止按钮，浅色背景的商业评论版橡皮泥平面信息图的统一风格。"/></figure>



<p class="wp-block-paragraph">今天先稍微回顾一下 Google I/O 2026 到底发了点什么，然后讲 Gemini 3.5 Flash 为什么让我发疯、让我愤怒。后面再说 Gemini Omni、Spark 和 Antigravity 各自的问题在哪里，以及 Google 为什么总是在撒胡椒面。</p>



<h2 class="wp-block-heading">Google I/O 这次到底发了什么</h2>



<figure class="wp-block-image size-large"><img decoding="async" src="https://pictures.lukefan.com/google-io-gemini-antigravity-agent-reliability/blog_4.jpg" alt="Google I/O 发布会大屏上同时挤满搜索、Workspace、安卓、Chrome、YouTube、Cloud 等图标，主持人站在中央撒出一把胡椒面般的小亮点，观众席人物露出困惑表情，浅色背景的商业评论版橡皮泥平面信息图的统一风格。"/></figure>



<p class="wp-block-paragraph">Google 还是在玩宏大叙事。几年之前，Google 的宏大叙事、微软的宏大叙事，我们看着还是很爽的。但是这几年下来，我们越来越讨厌看宏大叙事了。这跟咱们是中国人没有关系，不要胡乱联想。即使是 Google 的宏大叙事，我们也看不下去了。</p>



<p class="wp-block-paragraph">Google 这次本来应该只讲一个主题：我们做 agent，就完事了。它本来应该说：我们要做智能体引擎，Google 不只是模型公司，而是智能体时代的基础设施公司。</p>



<p class="wp-block-paragraph">但是你去看它讲了什么：搜索、Workspace、安卓、Chrome、YouTube、Google Cloud，包括怎么写邮件、怎么做日历、怎么安排日历、怎么写文档、怎么在你的网盘上做事情。它把所有东西都讲了一遍，最后就让人觉得很烦。</p>



<p class="wp-block-paragraph">Google 的潜台词是：如果智能体时代真的来了，谁最适合做你 24 小时的 AI 助理？应当是 Google。</p>



<p class="wp-block-paragraph">这很像微软原来那套词：你看，我有 Windows，我有 IE，我有 Office，你应该在我这里待着。但是微软错过了移动互联网时代。Google 现在真的在向这条路上继续狂奔。</p>



<h2 class="wp-block-heading">Gemini 3.5 Flash：快、便宜，但不靠谱</h2>



<figure class="wp-block-image size-large"><img decoding="async" src="https://pictures.lukefan.com/google-io-gemini-antigravity-agent-reliability/blog_5.jpg" alt="一枚写着 Gemini 3.5 Flash 的高速小火箭冲出起跑线，旁边的价格标签很小但机身零件松动，终点处摆着“可靠性”高墙，浅色背景的商业评论版橡皮泥平面信息图的统一风格。"/></figure>



<p class="wp-block-paragraph">首先说 Gemini 3.5 Flash。这个产品主打快和便宜。快不快？确实很快。便宜不便宜？它其实没有国内的 DeepSeek V4 Pro 便宜，也没有像 MiniMax 或者其他一些中国模型便宜。所以在“便宜”这件事上，它并没有什么优势。</p>



<p class="wp-block-paragraph">Google 为什么发布这样的东西，而不是发布 Gemini 3.5 Pro？这里可能有三个考量。</p>



<h3 class="wp-block-heading">第一种可能：Gemini 3.5 Pro 不够惊艳</h3>



<p class="wp-block-paragraph">Gemini 3.5 Pro 可能没有办法明显压制 GPT、Claude、DeepSeek 这些东西。那么 3.5 Pro 就过两天凑合发出来，反正拿出来也比不过别人。</p>



<p class="wp-block-paragraph">其实 Google 的 Gemini 系列模型从来也没有压制过 GPT 和 Claude。虽然有一段时间它确实很猛，导致 OpenAI 拉过一次红色警报，但它也仅仅是追上了 OpenAI，达到了一个将就能用的状态。</p>



<p class="wp-block-paragraph">那一次拉红色警报，我觉得最核心的原因不是 Gemini 3.5 Pro，而是 Nano Banana，通过画图的方式把用户拉走了。现在不要求你每一块都做得好，而是要求你有一个不可替代的点。所以 GPT 通过 GPT Image 2 又把用户拎回来了。</p>



<h3 class="wp-block-heading">第二种可能：智能体时代需要更快、更便宜的模型</h3>



<p class="wp-block-paragraph">既然到了智能体时代，大家都在做智能体，那么可能确实需要一个更快、更便宜的模型，不一定要上 Pro 模型去做深度思考。所以这也是一种可能：把成本压缩下来。</p>



<h3 class="wp-block-heading">第三种可能：Google 留了后手</h3>



<p class="wp-block-paragraph">也许 Google 确实留了一个后手，可能还有一个非常非常强的模型在憋劲。但是我觉得稍微有点难。Google 其实给自己选了一条特别难的路。</p>



<p class="wp-block-paragraph">问题在于，智能体不能光便宜。我们现在是在智能体里使用大模型，并不是一定要便宜。我宁肯花贵一点的钱，宁肯慢一点，但是它一定要靠谱。</p>



<p class="wp-block-paragraph">因为现在不管是养虾也好，养马也好，系统本身没有那么靠谱，我们又要让它去干一些真实工作，所以可靠性才是最重要的。我宁肯花更多的钱订 GPT 或者 Claude，也不要为了贪一点小便宜，让它每次干活都惹我生气。</p>



<p class="wp-block-paragraph">现在看到的 Gemini 3.5 Flash，真的能把你气死，而且是在它自家的 harness agent 框架，也就是 Antigravity 2.0 上，能气得你完全没招。</p>



<p class="wp-block-paragraph">我们真正需要的模型是：</p>



<ul class="wp-block-list">
<li>不跑题；</li>



<li>不瞎猜；</li>



<li>不把旧知识硬套到新产品上；</li>



<li>不自信地犯错。</li>
</ul>



<p class="wp-block-paragraph">现在这几条它都犯了。</p>



<p class="wp-block-paragraph"><strong>Gemini 3.5 Flash 证明了一件事：只省钱、只提速是没有任何意义的。</strong>你把这样的东西放到 harness agent 里，放到 Antigravity 里，没有人敢放心地把事情交给它干。</p>



<p class="wp-block-paragraph">原来我让 Gemini 跟我聊天，它胡说八道一下也就算了。最多是我被它骗了，拿一些错误信息跟大家讲故事，最后被大家挑错：“老范你又不懂了吧。”这个我认了。但是你到了 harness agent 里，是要在我电脑上操作文件的，是要操作我的邮箱的，这就太恐怖了。</p>



<h2 class="wp-block-heading">Gemini Omni：技术路线强大，用户感知很差</h2>



<figure class="wp-block-image size-large"><img decoding="async" src="https://pictures.lukefan.com/google-io-gemini-antigravity-agent-reliability/blog_6.jpg" alt="一个写着 Gemini Omni 的多模态机器核心连接图片、视频、声音和动作四个彩色模块，但用户面前的输出屏幕平淡无趣，旁边另一块屏幕播放更有冲击力的视频画面，浅色背景的商业评论版橡皮泥平面信息图的统一风格。"/></figure>



<p class="wp-block-paragraph">再往后一个发布的东西叫 Gemini Omni。“Omni”这个单词每次出来，意思都是全能。这一次 Gemini Omni 的技术路线极其强大，但是效果并不好。</p>



<p class="wp-block-paragraph">它讲的是一个世界模型的故事。也就是说，我不是文字模型了，我能够理解图片、视频、声音和动作，什么都可以理解。</p>



<p class="wp-block-paragraph">像 GPT、Gemini 3.1 Pro，其实 3.0 Pro 往后的版本，都是可以输入图片、声音、视频、动作的，都是全模态输入。但是原来的 Gemini 3.0 Pro、Gemini 3.1 Pro 只能输出文字，不能输出其他东西。也就是输入是全模态的，输出只有文字。</p>



<p class="wp-block-paragraph">这一次 Gemini Omni，输入是全模态的，输出也是全模态的。</p>



<p class="wp-block-paragraph">但更重要的是，它是一个世界模型。它可以理解物理模型，可以理解世界规律，可以保证它输出的所有东西在物理世界里逻辑自洽。</p>



<p class="wp-block-paragraph">可是大家拿它做视频测试，和最强的字节跳动 Seedance 2.0 比较，到底谁强谁弱？结果发现，Gemini Omni 输出的视频确实在物理上自洽了，但是没有表现力。Seedance 3.0 出来的东西才有表现力，包括国内的可灵 3.0，这类东西出来才会让人想去分享。</p>



<p class="wp-block-paragraph">这个非常重要。因为这个东西很贵，烧完 token 以后，如果你没有任何想分享的欲望，那肯定没法整。</p>



<p class="wp-block-paragraph">所以我觉得，这是非常强大的模型，但是用户感知很差。用户试了半天以后会说：虽然 Seedance 2.0 的逻辑不一定自洽，有时候还穿模，有时候还有一些乱七八糟的东西，但是就是帅，我就是想看这个。那 Gemini Omni 就打不过。</p>



<p class="wp-block-paragraph">有些人可能会说：不对，我们希望有强大内核，是你们没有用出来，是你技术不对。千万不要对用户提出这种要求。</p>



<h3 class="wp-block-heading">iPhone、尼康和佳能的例子</h3>



<p class="wp-block-paragraph">大家知道 iPhone 是怎么干掉尼康和佳能的吗？虽然尼康、佳能现在还在卖相机，卖得也还可以，但是在整体使用量、照片量上，绝对被 iPhone 碾压。</p>



<p class="wp-block-paragraph">尼康、佳能玩的是“还原”：色彩要准，畸变要小，宽容度要高，能够留给后期更大的空间。但你要不会玩，这个机器拍出来的片子也就那么回事。</p>



<p class="wp-block-paragraph">iPhone 搞的是什么？它不关心畸变。你拿 iPhone 拍照片，一个人如果站在图片侧边，脑袋就是斜的，畸变得一塌糊涂。色彩加上各种滤镜以后，也完全不是还原。虽然现在 iPhone 可以出 RAW 格式了，但跟尼康、佳能比起来差远了。</p>



<p class="wp-block-paragraph">可是要想清楚一点：大部分用户就是要随手拍一张照片，然后发出去。如果拍完以后还需要做半天后期才能往外发，那就没意思了。</p>



<p class="wp-block-paragraph">Gemini Omni 就是按照尼康、佳能的路子在做，确实很强大，但是用户感觉不出来。用户更喜欢要一个 iPhone，Seedance 2.0 可能就更像 iPhone 一点。</p>



<p class="wp-block-paragraph">所以核心是：<strong>你做出强大的产品，一定要让用户有感知。</strong></p>



<h2 class="wp-block-heading">Google 并不擅长前端和用户体验</h2>



<p class="wp-block-paragraph">其实 Google 一直不是一个特别擅长做用户感知和用户体验的公司。很多人可能不同意，因为不管是 Google 搜索还是安卓，Google 都在定义各种设计标准，也一直在建用户体验、点击率和用户流失的数据模型。</p>



<p class="wp-block-paragraph">但是我要说，Google 从来就没有真正做好过这件事。</p>



<p class="wp-block-paragraph">虽然我们觉得 Gmail 很棒，Google 搜索很好使，但这从来不是因为它们前端设计得好。我曾经听过 Google 前端给我们讲课。他讲，当时雅虎、百度的搜索，上面是一个搜索框，“搜索”按钮在下面。而 Google 不这样做。Google 做了很多数据实验，把按钮放在搜索框后面。为什么？因为你输完以后，注意力就在那个地方，鼠标也在那里，所以把按钮放在那里多么有道理，数据比别人好多少。</p>



<p class="wp-block-paragraph">Google 真的是靠把搜索按钮换个地方赢的吗？纯扯淡。Google 赢的原因是搜索结果好。</p>



<p class="wp-block-paragraph">Google 真正强的地方，是后端算法特别强，可以提供别人无可替代的结果。包括 YouTube、Gmail 也是如此。Gmail 真正强的地方是反垃圾邮件；YouTube 是数据量特别大，推荐算法特别好。至于前端，至于视频编辑这些东西，跟国内抖音之类的根本没法比。</p>



<p class="wp-block-paragraph">所以 Google 从来就不是一个做前端、做客户端软件的公司。大家觉得它好用，是因为它后端做得太好了，其他人赶不上它。</p>



<h2 class="wp-block-heading">Gemini Spark：我期待，但 Google 觉得我不配</h2>



<figure class="wp-block-image size-large"><img decoding="async" src="https://pictures.lukefan.com/google-io-gemini-antigravity-agent-reliability/blog_7.jpg" alt="云端办公室里漂浮着 Gmail、Drive、Docs、Sheets 和日历文件，一个写着 Spark 的小龙虾智能体站在云上准备工作，但门口有“Ultra 用户限定”和“美国限定”的门禁牌，浅色背景的商业评论版橡皮泥平面信息图的统一风格。"/></figure>



<p class="wp-block-paragraph">下一个产品叫 Gemini Spark。这个产品其实是我比较期待的，因为 Google 说要做自己的 agent，要把自己的“龙虾”装到云端上去。</p>



<p class="wp-block-paragraph">我为什么期待这样的产品？因为 Codex、Claude Code，包括 Openclaw、Hermes，这些“龙虾”产品都有一个严重问题：</p>



<ul class="wp-block-list">
<li>如果在云端运转，它们没有数据。你不能光靠聊天，必须上传大量数据，上传以后还要让它把数据吐出来，这个交互过程并不方便。</li>



<li>如果让它在本地干活，又不安全。因为这种东西干活必须有巨大的权限。一般我们会单独买一个 Mac mini 让它去干活，不敢让它在真正的本地生产机上干活。</li>
</ul>



<p class="wp-block-paragraph">这个矛盾到目前为止解决不了。</p>



<p class="wp-block-paragraph">而 Google 正好可以解决这个矛盾。因为 Google 从诞生那天开始就在跟微软打仗。微软说，你把所有东西都放在本地，装 Windows、装 Office，文件都在 C 盘、D 盘。Google 一上来就不是这套，Google 说，你把所有东西都放到云端。</p>



<p class="wp-block-paragraph">Google 的 Workspace，包括 Documents、Sheets、Slides 这些东西，本来就都在云端。所以 Google 一开始玩的就是云端电脑这一套。</p>



<p class="wp-block-paragraph">一旦云端有了 Spark 这样的“龙虾”，功能就会非常强大。我不需要到本地来，也不用担心怎么传文件，因为我的文件本来就在云端。</p>



<p class="wp-block-paragraph">所以 Google 想做 AI agent 时代的基础设施，这条路是通的，饼是画圆了的，路径没有问题。</p>



<p class="wp-block-paragraph">我希望 Spark 可以帮我：</p>



<ul class="wp-block-list">
<li>读邮件、写邮件；</li>



<li>整理日程；</li>



<li>在 Google Drive 上做文件助手；</li>



<li>写幻灯片、做文档；</li>



<li>填表格、算数据；</li>



<li>把该干的活都干起来。</li>
</ul>



<p class="wp-block-paragraph">这应该是非常有吸引力的事情。</p>



<p class="wp-block-paragraph">但是问题是，Google 觉得我不配。Google 现在讲的是，这个 App 产品只是内测，只向一些可信任的用户开放，而且要求这些用户必须在美国，还必须是 Google AI Ultra 用户。像我这种 Pro 用户，对不起，不能用。</p>



<p class="wp-block-paragraph">而且以我现在测试 Gemini 3.5 Flash 的水平，我建议大家谨慎使用。因为它的底层模型非常不靠谱，一旦它在 Google Spark 或 Gemini Spark 上用了 Gemini 3.5 Flash，可能就会发生各种惨绝人寰的事故。所以千万要谨慎。</p>



<h2 class="wp-block-heading">Antigravity 2.0：方向对，但不是 Google 的超级入口</h2>



<figure class="wp-block-image size-large"><img decoding="async" src="https://pictures.lukefan.com/google-io-gemini-antigravity-agent-reliability/blog_8.jpg" alt="一个写着 Antigravity 2.0 的应用窗口站在十字路口，周围 Codex、Claude Code、Android Studio、AI Studio、Firebase Studio 多个入口牌子互相争抢箭头，用户站在中间不知该点哪一个，浅色背景的商业评论版橡皮泥平面信息图的统一风格。"/></figure>



<p class="wp-block-paragraph">再往后一个东西是 Antigravity 2.0。这个方向是对的，但是 Antigravity 2.0 并不是 Google 超级 App 的入口。</p>



<p class="wp-block-paragraph">现在大家在抢什么？抢超级 App 入口。</p>



<p class="wp-block-paragraph">Claude 的入口就是 Claude 客户端、Claude Code，这就是 Anthropic 给的超级 App 入口。剩下的它不弄了，只在这上面加各种技能插件。现在我们在 macOS 上使用 Claude App，它上头都可以直接调用 Claude Code，所以这是一个统一入口。</p>



<p class="wp-block-paragraph">对于 OpenAI 来说，Codex 就是他们家的统一入口，这就是未来的超级 App。</p>



<p class="wp-block-paragraph">Antigravity 升级到 2.0 以后，也确实在向这个方向努力，但非常非常难用。难用的原因不是这帮人做不好，我并不认为做这个东西有多么费劲。做不好的核心原因是：<strong>Google 内部的入口实在太多了。</strong></p>



<p class="wp-block-paragraph">它并没有想明白：我是不是要把 Antigravity 2.0 做成 Google 未来超级 App 的唯一入口？这才是 Antigravity 出问题的最核心原因。</p>



<p class="wp-block-paragraph">你会发现这东西长得跟 Codex 很像，但是让它操作浏览器、操作文件、操作这些东西，真的不那么好用，各种报错。而且我用了 Gemini 3.5 Flash、Gemini 3.1 Pro，效果都很烂。</p>



<h3 class="wp-block-heading">一次安装 Antigravity CLI 的经历</h3>



<p class="wp-block-paragraph">我原来装了 Gemini client。现在我让它把 Gemini client 卸了，改成 Antigravity client，因为他们现在有一个 Antigravity 的命令行工具。</p>



<p class="wp-block-paragraph">Gemini 3.5 Flash 折腾半天，什么也没折腾出来，然后给我说了一堆我连看都懒得看的话。</p>



<p class="wp-block-paragraph">Gemini 3.5 Pro 又在那吭哧瘪肚地折腾半天，最后也没跑出来。后来我看到里面还有 Claude Opus 4.6，我说你去搞吧。结果它很快就把原来的 Gemini CLI 卸掉了，然后告诉我：你现在有问题，我没法接着装，你要继续安装 Antigravity IDE。</p>



<p class="wp-block-paragraph">现在它等于变成两个软件：一个是 Antigravity App，一个是 Antigravity IDE。它说你把 IDE 装起来，装完以后就有 Antigravity CLI。最后我照着它说的，一点点把 Antigravity CLI 装出来了。</p>



<p class="wp-block-paragraph">但真正干活的是谁？是 Claude Opus。这就有点让人哭笑不得。</p>



<p class="wp-block-paragraph">现在看来，做客户端的超级 App，做客户端的 harness agent 超级入口，还是需要很大的人力物力，甚至需要很大的 token 倾斜。Antigravity 作为众多入口之一，还要争宠、抢注意力，肯定没有足够的人力物力把它做得很精细。这块差得还比较远。</p>



<p class="wp-block-paragraph">为什么 Google 不愿意多投入一点？因为这帮人是“后娘养的”。这是从外面收购回来的，原来 Win Server 的团队，买回来以后做的产品。跟 Google 那一大堆“亲儿子”比起来，肯定还有差距。所以就做了这么一个半拉拉的东西拿出来给大家看，实在难用。</p>



<p class="wp-block-paragraph">到目前为止，这里面还在跑 Claude Opus。你说它能有多三心二意？</p>



<p class="wp-block-paragraph">它还不敢把 Claude Opus 去掉。为什么？因为也要看 KPI。如果把 Claude Opus 去掉，可能 Antigravity 的 KPI 就崩了，用户量下滑，那就没法整了。</p>



<h3 class="wp-block-heading">Antigravity 成功的难度</h3>



<p class="wp-block-paragraph">Antigravity 有没有可能成功？我觉得以 Google 现在的体量和体系来说，基本不太可能。</p>



<p class="wp-block-paragraph">如果 Google 真想把 Antigravity 做成可以跟 Codex、Claude Code 竞争的客户端超级 App 唯一入口，它首先要干嘛？先把 Android Studio 干掉。</p>



<p class="wp-block-paragraph">Android Studio 是 Google 自己根红苗正维护多年的 IDE，现在还在升级，而且升级得很开心。更重要的是，Android Studio 后面是另一个 IDE 的底壳，还不是 VSCode 底壳。</p>



<p class="wp-block-paragraph">还有 AI Studio，后面也是一整套东西。Google 还在说 AI Studio 可以独立做成应用，不需要其他东西。</p>



<p class="wp-block-paragraph">还有 Firebase Studio，这是 Google Cloud 做的一套系统，也在竞争。还有 Google 的云工具 Gemini Code Assist。怎么一大堆东西都在抢入口？</p>



<p class="wp-block-paragraph">除非把它们统统干掉，否则 Antigravity 也只能这样。做 Antigravity 的人本身三心二意，后面还有一堆“亲儿子”在说：“就你也敢上我爹那去争宠？”所以起不来，想都不用想。</p>



<h2 class="wp-block-heading">Google 的根本问题：好牌太多，主线太散</h2>



<figure class="wp-block-image size-large"><img decoding="async" src="https://pictures.lukefan.com/google-io-gemini-antigravity-agent-reliability/blog_9.jpg" alt="一张会议桌上堆满搜索、YouTube、安卓、Chrome、Gmail、Drive、Gemini、TPU 等好牌，每个小人都伸手抢主牌位置，中央的路线图被拉成多条分叉线，浅色背景的商业评论版橡皮泥平面信息图的统一风格。"/></figure>



<p class="wp-block-paragraph">先替 Google 说一句公道话：技术真强。这个没什么好说的。</p>



<p class="wp-block-paragraph">Google 搜索、YouTube、安卓、Chrome、Gmail、Drive、Docs、Sheets、Google Cloud、Gemini、TPU、DeepMind，没有哪一个差。任何一个拎出来，都可以把现在市面上这些独角兽打得满地找牙。</p>



<p class="wp-block-paragraph">但是它们凑在一起以后，相互掣肘，就走不动了。</p>



<blockquote class="wp-block-quote is-layout-flow wp-block-quote-is-layout-flow">
<p class="wp-block-paragraph">一个和尚挑水喝，两个和尚抬水喝，三个和尚没水喝。</p>
</blockquote>



<p class="wp-block-paragraph">Google 现在就是给大家表演“三个和尚”。甚至不是三个和尚，可能有几十个和尚。他们想把这碗水喝到嘴里，非常不容易。</p>



<p class="wp-block-paragraph">每一张牌都可以当主牌来打：搜索是入口，安卓是入口，Gemini App 是入口，Workspace 是入口，Cloud 是入口，Antigravity 也要入口。最后到底怎么打？</p>



<p class="wp-block-paragraph">OpenAI 现在也在合并，也在砍这砍那。Google 还舍不得。入口太多，主线不清楚，这就是它的问题。所以它永远在那撒胡椒面，大家都要沾一点。</p>



<p class="wp-block-paragraph">今年的 Google I/O，除了刚才讲的这些东西之外，还有一大堆东西，像眼镜也还在发布。人家足足开了两天。</p>



<p class="wp-block-paragraph">大公司玩的是什么？“我在拥抱 AI 了，我整个公司都动起来了。”但是它整个体系架构打不破，每个部门都有每个部门的利益。这么多个和尚到底怎么把这碗水喝到肚子里？这才是真正需要思考的问题。</p>



<h2 class="wp-block-heading">Google 如果想有救，需要两个信号</h2>



<h3 class="wp-block-heading">第一个信号：Workspace 加 Spark 必须跑起来</h3>



<p class="wp-block-paragraph">Workspace 加上 Spark 必须得能跑起来，而且要下放到 Pro 账号，或者下放到一些更便宜的账号里。</p>



<p class="wp-block-paragraph">如果你必须买 200 美金或者 100 美金的 Ultra 账号才给用，这事不太行。而且模型必须在 Workspace 加 Spark 的环境下不能胡说八道。</p>



<p class="wp-block-paragraph">现在它最新出的 Gemini 3.5 Flash 放上去一定会出事故，所以大家一定要小心。如果它做成了，那么 Google 可以继续维持它的用户盘子，接着往前走。</p>



<h3 class="wp-block-heading">第二个信号：Antigravity 能不能成为默认入口</h3>



<p class="wp-block-paragraph">另一个信号是 Antigravity 能不能成为默认入口。如果最后成不了，依然是在你方唱罢我登场、相互掐来掐去，那 Google 这一次的客户端战争估计就要输。</p>



<p class="wp-block-paragraph">至于其他东西，比如眼镜，我从来不看好。</p>



<h2 class="wp-block-heading">TPU 的问题：强，但不一定适合所有人</h2>



<p class="wp-block-paragraph">说到 TPU，有一个特别有意思的事情。很多人都觉得 TPU 很强，比英伟达的显卡强，而且更便宜、更省电。</p>



<p class="wp-block-paragraph">但是有个比较悲催的事情：Midjourney 的 CEO 这两天出来抱怨，说自己鬼迷心窍，把整个算法都搬到 Google Cloud 的 TPU 上去了。确实省钱了，公司也盈利了，但是在训练这一块就不行了，现在比所有同行慢了一年。</p>



<p class="wp-block-paragraph">为什么？TPU 想做训练，需要大量适配和调教。这个事对于 Google 可能是 OK 的，因为它有的是工程师。对于 Anthropic 也是 OK 的，因为它的工程师也很强。但是对于 Midjourney 这样的小公司来说，想把它调通，一年未必搞得定，非常痛苦。</p>



<p class="wp-block-paragraph">在英伟达上，你不需要调这些东西，它都有预置好的工具，你只要往上干就完了。实在搞不明白，还可以到社区里问，有的是人会玩，会教你。但是在 Google TPU 上，每一家在上面做训练的人都会遇到各种新问题。</p>



<p class="wp-block-paragraph">现在全世界能够训练大模型的算力卡只有三种：</p>



<ul class="wp-block-list">
<li>第一种是英伟达；</li>



<li>第二种是 TPU，现在 Gemini 和 Anthropic 的部分模型是用 TPU 训练的；</li>



<li>第三种是昇腾。</li>
</ul>



<p class="wp-block-paragraph">哪个模型是用昇腾芯片训练的？就是 DeepSeek V4 Flash。它的 Pro 不是用昇腾训练的，但 Flash 是用昇腾训练的。这也是 DeepSeek 一帮大神折腾了这么长时间、延后了这么长时间以后，终于可以出来吹个牛：我的 Flash 是用昇腾训练的。</p>



<p class="wp-block-paragraph">但是训练 Flash 模型是怎么训练的？你先把 Pro 在英伟达算力卡上训练好，然后蒸馏。蒸馏完以后，再到昇腾芯片上跑起来，最后拿到一个 Flash 出来用。大概是这样的过程。</p>



<p class="wp-block-paragraph">因为一旦用小众算力卡训练，就会面临一大堆从来没人踩过的坑。TPU 在这块确实还是差一些。想训练模型，最简单的方式就是上英伟达，没有任何其他可选择的东西。</p>



<h2 class="wp-block-heading">不要跟学霸学怎么上学，也别迷信 Google 的开发工具</h2>



<p class="wp-block-paragraph">还有一点：千万不要去跟学霸学怎么上学。一个人上来说：“我跟大家分享一下怎么考上清华。”千万别听。你听完以后，考不上清华。</p>



<p class="wp-block-paragraph">为什么讲这个梗？因为千万不要用 Google 家的开发工具。</p>



<p class="wp-block-paragraph">Google 家真的都是学霸，而且都是编程界的翘楚。他们会说：我们认为应该这么写程序，这样写程序才是最对的。甚至不行的话，我可以自己做一大堆工具出来，我们自己写程序。</p>



<p class="wp-block-paragraph">但是这些东西给普通程序员用，巨难使无比。你用 Google 家的各种开发工具，就像是在听考上清华的学霸分享自己怎么考上清华一样。</p>



<h2 class="wp-block-heading">现在再开发布会，已经不是好选择了</h2>



<p class="wp-block-paragraph">最后说一下，现在这个时间点再去开发布会，已经不是一个特别好的选择。</p>



<p class="wp-block-paragraph">我们发现很多 AI 大厂已经不再开发布会了。他们把发布会搬到线上，做一场直播，或者干脆写个博客、发个推文。甚至连推文都懒得发，直接上线就完事了。甚至不上线，只要泄露了，大家都会觉得有新产品出来，然后疯狂上去用。</p>



<p class="wp-block-paragraph">现在谁还在开发布会？苹果，在挤牙膏：芯片又升级了，摄像头又升级了，又环保了一点。小米也在开发布会，也在挤牙膏，它的发布会我连看都懒得看了。这都是老掉牙的公司才在这开发布会。</p>



<p class="wp-block-paragraph">如果没有人跟你竞争，像苹果那样开发布会，这叫挤牙膏。如果你本来就落后，还要追赶别人，又开了一个发布会，发了一堆完全没法使的东西出来，那不就是应了今天这个主题吗？Google I/O 今年拉了一坨大的吗？</p>



<p class="wp-block-paragraph">现在只要产品还不错，模型很好，工具很好，不需要发布会，它自然就传播起来了。你有那钱，还不如多给大家点额度，让大家去玩。</p>



<p class="wp-block-paragraph">Sam Altman 原来特别喜欢狙击 Google I/O。我记得有一年 Google I/O 开之前，Sam Altman 发了 GPT-4o；还有一年是在 Google I/O 开之前一天发了 GPT Image。今年人家不费这个劲了，只说一句话：我把大家的 Codex 额度重置了。那谁还看 Google I/O？我要回去写程序了。</p>



<p class="wp-block-paragraph">另外，Karpathy 大神直接上了一个八卦，说自己去 Anthropic 上班了，注意力一下就全走了。</p>



<p class="wp-block-paragraph">所以现在再开发布会，很难获得长期注意力。国内谁还在努力开发布会？小米刚开了一个，但我觉得也很烂。百度李彦宏开了一个大发布会，什么百度 Build、百度文心一言 5.1，好强好强。有人用吗？没人用。包括刚开完发布会的千问 3.7，有人使吗？其实也没什么人使。</p>



<p class="wp-block-paragraph">其他人就不费劲了，像 DeepSeek、Timi、MiniMax、GLM 都不开发布会，直接把产品一发，然后发一条推文、一个博客，完事了。你们用去就完了。谁好使谁不好使，公道自在人心。DeepSeek V4 根本没有任何发布会，连视频都没有，直接上线，大家开开心心用起来，不就完事了吗？</p>



<p class="wp-block-paragraph">所以现在这个时间点再去开发布会，是一个极不划算的事情。</p>



<h2 class="wp-block-heading">总结：Google 没输在技术，而是输在大公司病</h2>



<figure class="wp-block-image size-large"><img decoding="async" src="https://pictures.lukefan.com/google-io-gemini-antigravity-agent-reliability/blog_10.jpg" alt="一座写着 Google 技术的坚固机器城堡内部齿轮精密运转，但外部多条产品路线互相缠绕打结，管理层小人站在分叉路牌前犹豫不决，浅色背景的商业评论版橡皮泥平面信息图的统一风格。"/></figure>



<p class="wp-block-paragraph">最后总结一下，Google 没有输在技术上。Google 技术依然很强。现在大家再去挖 Google 的人，或者 Google 的人出来创业，依然会有人给钱。</p>



<p class="wp-block-paragraph">但是 Google 输在了大公司病上，输在了整个产品决策上。所以不要说 Google 不行了。Google 当然很强，DeepMind 很强，TPU 很强，搜索、YouTube、Android、Workspace 都很强，没有哪个不强。</p>



<p class="wp-block-paragraph">真正的问题是：<strong>没有取舍，没有决断，没有一个唯一的中心和突出点。</strong></p>



<p class="wp-block-paragraph">它敢不敢让某一个产品成为绝对主线？不敢。敢不敢让其他部门给它让路？也不敢。当年微信起来，是牺牲了手机 QQ 的。Google 现在还没有下这种决心：我是不是应该牺牲谁、扶持谁？还没有。</p>



<p class="wp-block-paragraph">更悲催的是，全村的希望是“后娘养的”，外来的孩子是 Antigravity，这就特别尴尬，也非常痛苦。</p>



<p class="wp-block-paragraph">它敢不敢承认有些入口应该降级？不敢。敢不敢砍掉一些重复产品？比如前面讲的这么多 IDE，你能不能把其他东西都干掉？干不掉。敢不敢把“所有地方都有 AI”改成“某一个入口真正好用”？也不敢。</p>



<p class="wp-block-paragraph">Google 这样的大公司只能说：你看，我有 Gemini 大模型了，每个地方我都用上了。它不能说我要把入口统一，因为那就是要削藩、要收权，在这种公司里搞不定。</p>



<p class="wp-block-paragraph">如果让我选的话，就是两条路：</p>



<ul class="wp-block-list">
<li><strong>Spark 加 Workspace</strong> 这条路如果跑通，Google 可以继续带着它的用户、数据和生态往前跑。</li>



<li><strong>Antigravity</strong> 这条路如果跑通，Google 在客户端上就有一个超级 App，可以跟 Claude Code、Codex 竞争，但难度很大。</li>
</ul>



<p class="wp-block-paragraph">最后一句话：Google 的问题不是看不到未来，它的问题是看见了太多未来，却还没有决定哪一个未来才是自己真正要压上去的。</p>



<p class="wp-block-paragraph">这个时候要 all in 了，all in 的不是 AI，而是某一个具体路线，要把所有其他的孩子都掐死。这个是 Google 可能很难下决心去做的事情。</p>



<p class="wp-block-paragraph">好，这就是咱们今天的一个结果了。</p>
]]></content:encoded>
					
		
		
			</item>
		<item>
		<title>尼姑的光头（跨应用操作），为什么和尚（Google）摸得，阿Q（豆包）摸不得？Elon Musk应该也摸不得。</title>
		<link>https://lukefan.com/2026/03/03/google-vs-doubao-cross-app-ai-agent-android17-intelligent-os-ecosystem-control-trust/</link>
		
		<dc:creator><![CDATA[老范 讲故事]]></dc:creator>
		<pubDate>Tue, 03 Mar 2026 00:45:57 +0000</pubDate>
				<category><![CDATA[AIGC]]></category>
		<category><![CDATA[Google的故事]]></category>
		<category><![CDATA[字节跳动，故事多]]></category>
		<category><![CDATA[AI助手入口流量争夺战]]></category>
		<category><![CDATA[Android App Functions接口]]></category>
		<category><![CDATA[Gemini跨应用操作]]></category>
		<category><![CDATA[Google Android 17 agentic AI]]></category>
		<category><![CDATA[MCP远端调用协议]]></category>
		<category><![CDATA[UI Automation自动化框架]]></category>
		<category><![CDATA[三星Galaxy S26智能操作系统]]></category>
		<category><![CDATA[豆包手机封禁事件]]></category>
		<guid isPermaLink="false">https://lukefan.com/?p=3589</guid>

					<description><![CDATA[跨应用 AI agent 正在变成“新入口”，但为什么谷歌在安卓17/Galaxy S26 上能做，豆包手机却被超级APP、支付与银行应用迅速封禁？本文拆解谷歌的三条路径：MCP 远端调用、APP Functions 接口、以及 UI 自动化，并对比豆包几乎只能走 UI 自动化导致的合规与信任风险。同时从生态位、标准制定权、信誉与上线节奏解释“谁能摸、谁不能摸”，并延伸到马斯克跨平台自动化同样面临的阻力，给出企业与个人如何适配 AI 分发时代的建议。]]></description>
										<content:encoded><![CDATA[
<figure class="wp-block-embed is-type-video is-provider-youtube wp-block-embed-youtube wp-embed-aspect-16-9 wp-has-aspect-ratio"><div class="wp-block-embed__wrapper">
<iframe title="跨应用AI Agent来了：谷歌安卓17为何能做豆包做不了？Musk的巨硬，应该也很难。" width="900" height="506" src="https://www.youtube.com/embed/Jndny4tVouE?feature=oembed" frameborder="0" allow="accelerometer; autoplay; clipboard-write; encrypted-media; gyroscope; picture-in-picture; web-share" referrerpolicy="strict-origin-when-cross-origin" allowfullscreen></iframe>
</div></figure>



<figure class="wp-block-image size-large"><img decoding="async" src="https://pictures.lukefan.com/google-vs-doubao-cross-app-ai-agent-android17-intelligent-os-ecosystem-control-trust/blog_1.jpeg" alt="一张复古羊皮纸风格的插画：桌上摊开一部智能手机，屏幕上有“跨应用 AI assistant”字样与多个APP图标被线条连接，旁边一只手犹豫地伸向屏幕，暗示“能不能摸”的争议，羊皮纸，钢笔彩色手绘的统一风格。"/></figure>



<p class="wp-block-paragraph"><strong>小尼姑的光头和尚摸得，我就摸不得吗？</strong>跨应用 AI agent，谷歌摸得，为什么豆包就摸不得？马斯克估计也摸不得。</p>



<p class="wp-block-paragraph">大家好，欢迎收听老范讲故事的 Youtube 频道。</p>



<p class="wp-block-paragraph">咱们想象这样的一个场景：中兴公司的老板跑到巴塞罗那去，看到谷歌跟三星联合推出的新一代智能手机操作系统，无语落泪。为什么？因为去年跟豆包合作、推出豆包手机的就是中兴。巴塞罗那 MWC2026 上，谷歌跟三星推出了 agentic AI，加上跨应用的能力，实际上就是跟去年豆包手机差不多的一个东西。</p>



<p class="wp-block-paragraph">谷歌也发声了：在三星 Galaxy S26 上，我们发布了这样的一个东西，这是一个智能操作系统。它直接用了 Intelligent OS 这样一个词，我们都不好意思再叫安卓了，其实还是安卓，但是我们给它起了个新名字，叫智能操作系统。这不就是去年的豆包手机吗？</p>



<p class="wp-block-paragraph">豆包手机推出以后，闪电般地被各种超级 APP、电商应用、支付和银行应用给封禁了，所以这个东西就无疾而终了。谷歌这次推出的产品，却被赞为下一代的智能操作系统。小尼姑的头谷歌摸得，豆包就摸不得，所以中兴的老板看着只能在那里无语落泪了。</p>



<span id="more-3589"></span>



<h2 class="wp-block-heading">今天故事分六块</h2>



<ol class="wp-block-list">
<li>谷歌到底干了什么</li>



<li>从技术角度上说，谷歌跟豆包到底有什么相同和不同</li>



<li>除了技术之外，在市场地位、信誉以及行动的激进程度上，谷歌跟豆包到底有什么不一样</li>



<li>为什么说小尼姑的头埃隆·马斯克他也摸不得</li>



<li>新的智能终端、APP 这种形式必然被革命，但是过程很重要</li>



<li>我们到底能够在这过程中做些什么</li>
</ol>



<h2 class="wp-block-heading">一、谷歌到底干了什么</h2>



<figure class="wp-block-image size-large"><img decoding="async" src="https://pictures.lukefan.com/google-vs-doubao-cross-app-ai-agent-android17-intelligent-os-ecosystem-control-trust/blog_2.jpeg" alt="复古羊皮纸插画：发布会舞台上写着“Android 17 / Intelligent OS”，左侧是谷歌标志与Gemini图形，右侧是三星Galaxy S26手机特写，台下观众席中几位手机厂商代表在记笔记，羊皮纸，钢笔彩色手绘的统一风格。"/></figure>



<p class="wp-block-paragraph">首先，谷歌干什么了？它其实是推出了安卓 17 版。大家注意，谷歌每一次出安卓版本之后，三星、小米、中兴，所有在国外去卖手机的这些厂商，他们要去跟谷歌签协议，签完了以后回来去定制。谷歌的安卓 17 在三星 Galaxy S26 上，这个定制版本就实现了跨应用访问的这样的一个能力。</p>



<p class="wp-block-paragraph">它其实是 Gemini APP 的一个 Beta 版，先在美国和韩国部分设备、部分品类，也就是外卖、订餐和打车上上线了，其他的一些还没有上去。咱们刚才讲这段话是什么意思？就是谷歌其实是非常谨慎的，只在很少的设备上、很少的国家和地区、很少的场景上上线了，而不是像豆包似的，咔一把全来了。</p>



<p class="wp-block-paragraph">目前就是在三星 Galaxy S26 上可用。谷歌自己家的亲儿子 Pixel 10，部分功能可用，还没有三星上的功能那么多。原因也很简单，这种东西功能多了以后会很耗电的，三星在这一块应该是控制得会更好一些吧。它精选场景、精选 APP 起步，不是上来什么都来。</p>



<p class="wp-block-paragraph">只在美国和韩国推出，因为你像打车、订餐这个东西，一下我就全世界推出了，我一点餐发现这个餐馆在埃塞俄比亚，你让我咋去？所以一定是分地区开的。这个功能的未来会逐步扩大到更多的手机厂商型号和国家那里去，但是这个扩充的过程一定是手机厂商要上来配合。</p>



<p class="wp-block-paragraph">你比如小米吧，说我们也想上这功能怎么办？你要去跟谷歌签协议，看看在哪个国家可以上哪些 APP，怎么去做这个事。因为要说服这些 APP 接入这套系统，也是要用力的。谷歌要去跟他们谈，跟这些 APP 去沟通，三星也要去跟他们谈。</p>



<p class="wp-block-paragraph">那以后比如说小米说我想到欧洲去接这个东西，因为华为退出了以后，华为在欧洲的市场基本上被小米吃了。假设他们想去干这个事，他就得到欧洲去挨个跟人餐厅、跟打车公司、跟一些外卖派送公司去谈这个事去。谈好了以后，你才可以上架这些功能。</p>



<h2 class="wp-block-heading">二、技术层面：谷歌与豆包的相同与不同</h2>



<figure class="wp-block-image size-large"><img decoding="async" src="https://pictures.lukefan.com/google-vs-doubao-cross-app-ai-agent-android17-intelligent-os-ecosystem-control-trust/blog_3.jpeg" alt="羊皮纸插画：一张技术示意图，中央是“Gemini/Agent”圆形节点，向外分三条路径：服务器API(MCP)的云端箭头、APP functions的模块接口拼图、UI Automation的手指点击手机屏幕，三条路径用不同颜色标注，羊皮纸，钢笔彩色手绘的统一风格。"/></figure>



<p class="wp-block-paragraph">谷歌跟豆包到底有什么不同？咱们先说技术层面。谷歌是通过三种方式来获得应用的数据和功能的。</p>



<h3 class="wp-block-heading">1）MCP 远端调用</h3>



<p class="wp-block-paragraph">第一种叫 MCP 远端调用。比如说你这是一个送外卖的平台，你在服务器上是有接口的，我们通过这个接口直接调用就完了，我压根不在你手机上去折腾。这个其实是各种外卖平台最喜欢的一种方式。</p>



<h3 class="wp-block-heading">2）APP functions（APP 功能）</h3>



<p class="wp-block-paragraph">第二种，谷歌出了一个新的接口规范，叫 APP functions，就是 APP 功能。这个什么意思？就是你这一个应用，可以把很多希望别人调用的这些功能把它包装出来，包装出来以后，我们的 Gemini APP 就会去读每一个 APP 的这些接口，到时候我就按照你的要求从这里进入，然后去调用相应的数据和功能。</p>



<h3 class="wp-block-heading">3）UI Automation framework</h3>



<p class="wp-block-paragraph">第三种方式，叫 UI Automation framework。就是当你没有接口的时候，AI 会自动地通过 UI 去识别你的界面，然后去点击、去使用这个应用。</p>



<p class="wp-block-paragraph">但是谷歌也强调，如果我们用这样的方式来去使用应用的话，一定是用户透明和可控的。就是用户一定是知道我们在干这件事了，完全可知的，而且完全可控，随时可以停下来。</p>



<p class="wp-block-paragraph">豆包其实就只有第三条路，它前两条路都没法走。因为毕竟安卓不是他家的嘛，你说我做了一个新的规则，请你们开放接口给我，谁理他呀？所以这种事只能操作系统公司去干，谷歌去干了，华为鸿蒙里头也干了类似这样的事情。</p>



<p class="wp-block-paragraph">至于 MCP 的远端调用，中国现在这些大的超级 APP 还在建墙：我不希望你去调用我，我希望你整体都在我这里来工作。豆包也没去折腾这个事，所以它只能通过自动界面识别、自动点击，只能干这一件事。</p>



<p class="wp-block-paragraph">而且谷歌还承诺，就算我走第三条路，也仅仅是备用方案。如果你愿意去加这个 APP functions，或者加这个服务端的 MCP 调用，我就绝对不会去干这个活；而且即使干了，也一定用户知情。差异就差在这了。</p>



<h2 class="wp-block-heading">三、非技术层面：市场地位、信誉与激进程度</h2>



<figure class="wp-block-image size-large"><img decoding="async" src="https://pictures.lukefan.com/google-vs-doubao-cross-app-ai-agent-android17-intelligent-os-ecosystem-control-trust/blog_4.jpeg" alt="羊皮纸插画：一架天平，左盘放着“Google/Android”与一叠协议文件、信誉徽章，右盘放着“豆包手机”与被封禁的红色印章、破碎的APP图标围墙，天平明显倾斜，羊皮纸，钢笔彩色手绘的统一风格。"/></figure>



<p class="wp-block-paragraph">那你说除了技术之外，谷歌跟豆包在市场地位和信誉以及行动的激进程度上有什么不一样？怎么谷歌摸得豆包就摸不得？其实前面技术上算是有一定的原因，但是后边这个才是更重要的。</p>



<h3 class="wp-block-heading">1）市场地位不同</h3>



<p class="wp-block-paragraph">谷歌的地位跟豆包手机的地位肯定是不一样的。谷歌是安卓里头的真正扛把子，这东西是他发明的，是他去指定、掌握标准的，所有流量都在他手里面。所有这些服务和应用到谷歌的安卓平台上，实际上都是等着谷歌赏饭吃的：再多给我点流量吧，多让我这里做几单生意吧，少让他那边做几单生意。</p>



<p class="wp-block-paragraph">假设这边有一个叫 Uber，另外还有其他的一些打车平台，我们要到谷歌上去竞争，那你到底是打 Uber 的还是打其他的？这谷歌说了算。你想获得用户和流量，谷歌去给你分配去，它是这样的一个关系。所以在手机应用这一块，谷歌是所有人的爸爸；而豆包的话是其他人的竞争对手，这个是绝对不一样的。</p>



<h3 class="wp-block-heading">2）信誉不同</h3>



<p class="wp-block-paragraph">第二个，谷歌的信誉也是豆包所不能比的。人家毕竟做了这么多年了，而且这些年里头风风雨雨，有各种各样的问题，人家也都跟这些应用开发厂商、跟这些手机厂商风雨同舟一起过来了，这些信誉是逐渐积累起来的。</p>



<p class="wp-block-paragraph">就跟人家说小尼姑的光头为什么和尚摸得？和尚跟小尼姑之间本身是一种共生关系，而且小尼姑可能还有些事情要有求于大和尚，这样情况下人家和尚才摸得。而豆包的话你就相当于那个阿 Q 似的，你就摸不得。你摸了以后对小尼姑没有任何好处，人家凭什么让你摸？摸了以后还臭名声，这肯定不能让你摸，所以他是这样的一个关系。</p>



<h3 class="wp-block-heading">3）行动更谨慎</h3>



<p class="wp-block-paragraph">而且谷歌这一次也要比豆包谨慎很多。豆包是非常非常激进，它是没有跟任何人打招呼，就直接上来读了别人的界面，就直接上去点击去了，那这个是肯定任何一个 APP 都不能允许的。你相当于是给人借口了：你做了一个非常不安全的事情，你直接破解了我的应用。我这是个银行应用，我这是个支付应用，我微信里头有钱的，那我肯定要封你，这没什么好说的。</p>



<p class="wp-block-paragraph">但是谷歌就很谨慎。第一个，过于敏感的 APP 不碰：你这是银行 APP，你这是支付 APP，我绝对绝对不碰你。谁愿意来我就跟谁合作，谁不愿意来我坚决不碰你。极个别情况下用户一定要用的时候，我们再去做自动化，而且一定要在用户监督下才能去做，这个是谷歌能够去保证的事情。</p>



<p class="wp-block-paragraph">用户也可以选择说你现在不许干了，或者说用户可以删除 Gemini 所看到的数据。比如说你让 Gemini 帮你操作了一些支付，或者是这种订单相关的数据，说现在 Gemini 把我的家庭住址把这些东西都给我删了，然后 Gemini 假假模假式说行，放心吧我给你删了。其实删没删你自己也不知道，但是谷歌靠信誉嘛，说你看我给你删了，你就信了。</p>



<p class="wp-block-paragraph">而且谷歌还强调说不会将数据用于广告，这个也是谷歌信誉的保证。咱们就信了吧。</p>



<p class="wp-block-paragraph">而且谷歌只在小范围内上线：一款半机型，一款就是三星的 Galaxy S26，半款是它的 Pixel 10，一部分的功能是在 Pixel 10 上可用的；然后只有两个国家，美国跟韩国，因为韩国三星自己可以搞定嘛，美国的话谷歌自己去搞定去；然后少量的高频、低危险度、高价值的应用场景，只上了这些，不是上来我就什么都上了。所以谷歌的行动非常非常的谨慎。</p>



<h3 class="wp-block-heading">4）和尚与阿 Q 的区别</h3>



<p class="wp-block-paragraph">那么和尚跟阿 Q 的区别在哪？表面上和尚的信誉一定要比阿 Q 好，一定是这样的。第二个，与尼姑属于相互需要，甚至可能还拿捏着尼姑的把柄。第三个，和尚是懂得分寸的，不会上来就不分场合蛮干；但阿 Q 就什么也不懂，尼姑刚出来就伸手去摸人家光头，这个肯定是不行的，那尼姑肯定不愿意。</p>



<h2 class="wp-block-heading">四、为什么说马斯克也摸不得</h2>



<figure class="wp-block-image size-large"><img decoding="async" src="https://pictures.lukefan.com/google-vs-doubao-cross-app-ai-agent-android17-intelligent-os-ecosystem-control-trust/blog_5.jpeg" alt="羊皮纸插画：一台笔记本电脑与一部手机并排，屏幕上有“截图识别/模拟点击”的小窗口；旁边是一位戴墨镜的企业家剪影伸手想跨设备操作，前方却立着苹果、谷歌、微软形状的高墙与“Access Denied”标牌，羊皮纸，钢笔彩色手绘的统一风格。"/></figure>



<p class="wp-block-paragraph">那为什么说小尼姑的头马斯克也摸不得？这事跟马斯克有啥关系，是不是老范在这生蹭马斯克的热度？还真不是。马斯克做了一公司叫“巨硬”，这一次也跟 xAI 一起被卖给了 SpaceX 了。它的 xAI 未来还有一个很重要的部门叫巨硬，这公司走的就是豆包这条路：它通过直接截屏，通过视觉模型去识别屏幕信息，进行模拟点击，实现跨平台跨应用的自动化。他就想干这活。</p>



<p class="wp-block-paragraph">他想干的活可能比豆包还要再狠一点，因为豆包只做手机上，他可能要把 PC、Windows、Mac 都要干一遍。</p>



<p class="wp-block-paragraph">马斯克的名声就算比豆包好一些吧，但是在手机个人办公设备应用场景方面的生态位，马斯克并不比豆包强，甚至可能还要稍微弱一些。Grok 的用户数连豆包的零头都没有，它 X 用户数是稍微多一些，但是你跟 TikTok 比，你也是比不了的。</p>



<p class="wp-block-paragraph">准备在跨越移动和个人电脑系统的应用上去蛮干，这就是马斯克想干的活。马斯克跟微软、谷歌、苹果的关系好像也没有那么融洽，在这一点上更是和字节跳动这种手中有多个冠军应用、完全在移动平台上成长起来的公司是没法比的。你马斯克造汽车造得再好，造火箭再造得再好，你跟这些应用平台来比，你跟这些 App Store 去攀关系，你根本攀不上。这就是为什么这个小尼姑的头，马斯克大概率也摸不得的一个原因。</p>



<h2 class="wp-block-heading">五、新的智能终端会革命 APP，但过程很重要</h2>



<p class="wp-block-paragraph">再往后，新的智能终端，APP 这种形态必然被革命，但是过程很重要。APP 模式是必然消亡的，这是扎克伯格的一个梦想，因为他原来作为 APP 上到苹果上，天天被苹果欺负，说这玩意太不科学了、太落后了，我们一定要把这个模式干掉。</p>



<p class="wp-block-paragraph">功能数据一定会聚集在 AI agent 手里面，根据用户的需求去完成更复杂、更有价值的操作，这是未来的方向。原来以 APP 为单位各玩各的所遗留下来的很多商业模式必然被淘汰。比如说吧，广告展示：我做了个 APP 上面有功能，你要想用我这功能，必须要先看三个广告才能去用，这就是传统的玩法。</p>



<p class="wp-block-paragraph">但是你一旦把 APP 这个模式打破了，你把这功能在底下开放出来，让谷歌自己去调去了，那你怎么去盈利？大家就重新需要去思考：真正我们提供的不是你看了多少次广告、点击了哪些东西，而是我真的给你实现了哪些功能，那我怎么通过实现功能来赚取收入？这个是未来大家需要去思考的东西。</p>



<p class="wp-block-paragraph">最终各个服务商卖的应该是结果，而不是打开 APP 的 DAU 与停留时长。比如说吧，你有个电商 APP，你真正希望的是更多的成交，把东西卖掉，而不是说用户每天打开 APP 在这瞎转悠。在这样的情况下，电商是不是更愿意开放接口，让谷歌的 Gemini 上我这来去获取数据，然后去直接完成交易？你哪怕不打开我的 APP，你只要把交易都做完就完了，我很开心，就这样的一个情况。</p>



<p class="wp-block-paragraph">当然了，电商其实在这里还有一些问题。问题在哪？就是电商平台最主要的收入其实不是卖东西，电商平台最主要的收入是做广告。在这样的情况下，他就要重新去定位了：说我卖掉更多东西，我怎么能够挣到这个服务费？至于广告费的话，让谷歌去赚就好了，他要调整这个心态了。</p>



<p class="wp-block-paragraph">新的入口争夺战马上就要开始了。原来的入口在各个超级 APP 之间抢来抢去，未来的入口一定是 AI 助手，就像豆包、像 Gemini、像 ChatGPT，这些会成为未来的入口。现在我打开手机可能更多的是使用 ChatGPT、Gemini、豆包这些东西，其实我现在使用那些超级 APP 像微信这些的频度已经下降非常非常多了。</p>



<p class="wp-block-paragraph">真正有价值的未来会是什么？会是场景：我要看视频，我要打游戏，我要去付费阅读，什么样的这种信息和资源，这个是未来的一个场景。大家最终交付的是这个场景里边的结果，而不是把用户生生地框在你的应用里。</p>



<h2 class="wp-block-heading">六、我们在这过程中能做些什么</h2>



<figure class="wp-block-image size-large"><img decoding="async" src="https://pictures.lukefan.com/google-vs-doubao-cross-app-ai-agent-android17-intelligent-os-ecosystem-control-trust/blog_6.jpeg" alt="羊皮纸插画：一个用户站在路口，面前分成两条路，一边是“筑墙的超级APP城堡”高墙与封禁印章，另一边是“开放接口/AI友好”道路，路牌写着“APP functions / MCP / 可控透明”，用户手里拿着放大镜在对比服务，羊皮纸，钢笔彩色手绘的统一风格。"/></figure>



<p class="wp-block-paragraph">最后咱们行动起来吧。首先在美国的朋友们可以去买个三星手机玩耍一下试试，如果有在韩国的话也可以试试，但是我的观众里头好像韩国的比较少。</p>



<p class="wp-block-paragraph">很多场景会被打散，而不是筑墙包围起来。原来的社交场景会筑起高墙，将其他的场景进行捆绑，像微信就是干这活的：你谁想去碰微信的东西都不行。今年春节的时候，微信还通过封禁阿里的红包，去给大家表演了一下什么叫强势筑墙。</p>



<p class="wp-block-paragraph">那么以后的话，AI 助手将成为新的入口，可以极大地解放这些长尾场景。比如说我现在想去跟大家玩砍一刀，以前砍一刀是完全在微信这个圈子里玩的，我们就可以设计出一些新的场景来，让这个 AI 助手能够识别一些场景，能够拉着客户一起来互动，这就需要去想了：怎么去适应 AI 场景。</p>



<p class="wp-block-paragraph">我们尽量要去挑选那些&nbsp;<strong>AI 友好</strong>的应用和服务去使用。那些对 AI 不友好的应用和服务的话，这个一定是有猫腻的：他希望把你的眼蒙上，把你的耳遮住，让你只能选择他的服务，他希望捆绑你，这个一定是不好的。我们要在 AI agent 里头、在 AI 助手里边去货比三家，让他去获取更多的信息，然后给我们一个最优解，这才是未来的方向。这也可以帮助 AI 手机也好、AI 操作系统也好，更快地走向下一个阶段。</p>



<p class="wp-block-paragraph">然后是检查我们各自的所在公司，或者是自己所提供的服务与产品，是不是适合新的流量分发模式。现在是 AI 分发流量直达、最终交付成果的一个时候，不是说我把你骗进来，让你在我这个应用里转来转去，找不着最终要的那东西，不是这样的一个时代了。要上来就把结果交出去，你要让 AI 转来转去，它就不推荐你了，所以要尽早调整。</p>



<p class="wp-block-paragraph">越早调整越赚便宜，为什么？因为每一次发生流量转变的时候，会形成流量的早期红利效应。现在 AI 来挑服务了，发现别人都不提供，只有你提供，那你可能就赚到了。所以这个流量的早期红利是很香的，很多原来依托超级 APP 的小众场景都有新的机会了。</p>



<h2 class="wp-block-heading">结尾</h2>



<p class="wp-block-paragraph">今天咱们讲这故事，用的是鲁迅《阿 Q 正传》里头这个典故：</p>



<blockquote class="wp-block-quote is-layout-flow wp-block-quote-is-layout-flow">
<p class="wp-block-paragraph">“这个尼姑的脑袋，和尚摸得，我就摸不得？”</p>
</blockquote>



<p class="wp-block-paragraph">把这故事串起来了。但是我们真正需要去思考的问题，不是我们能不能去摸小尼姑的光头，而是当我们自己是光头小尼姑的时候，愿意被谁摸，被谁摸了头不会臭了名声，还能有最大的好处。</p>



<p class="wp-block-paragraph">好，这个故事今天就讲到这里。感谢大家收听，请帮忙点赞、点小铃铛、参加 DISCORD 讨论群，也欢迎有兴趣有能力的朋友加入我们的付费频道。再见。</p>



<hr class="wp-block-separator has-alpha-channel-opacity"/>



<h2 class="wp-block-heading">背景图片</h2>



<p class="wp-block-paragraph">Prompt：<strong>Spanish comic watercolor style, expressive ink outlines, soft layered washes, Barcelona smartphone showroom interior, empty and serene retail space with no people, walls richly decorated with intricate Buddhist-style murals, lotus motifs, mandala geometry, sacred ornamental patterns integrated with modern phone displays, clean aisles and glass counters, eye-level 24mm wide establishing shot, balanced depth layers, gentle daylight through windows, Buddhist color palette of saffron yellow, vermilion red, indigo blue, jade green, muted antique gold, handcrafted painterly detail &#8211;no people, no staff, no crowds, photorealism, neon overload, text, watermark, logo &#8211;ar 16:9 &#8211;stylize 190 &#8211;chaos 6 &#8211;v 7.0 &#8211;p qaczhqj</strong></p>



<figure class="wp-block-image size-large"><img decoding="async" src="https://pictures.lukefan.com/google-vs-doubao-cross-app-ai-agent-android17-intelligent-os-ecosystem-control-trust/background_1.jpeg" alt=""/></figure>



<figure class="wp-block-image size-large"><img decoding="async" src="https://pictures.lukefan.com/google-vs-doubao-cross-app-ai-agent-android17-intelligent-os-ecosystem-control-trust/background_2.jpeg" alt=""/></figure>



<figure class="wp-block-image size-large"><img decoding="async" src="https://pictures.lukefan.com/google-vs-doubao-cross-app-ai-agent-android17-intelligent-os-ecosystem-control-trust/background_3.jpeg" alt=""/></figure>



<figure class="wp-block-image size-large"><img decoding="async" src="https://pictures.lukefan.com/google-vs-doubao-cross-app-ai-agent-android17-intelligent-os-ecosystem-control-trust/background_4.jpeg" alt=""/></figure>
]]></content:encoded>
					
		
		
			</item>
		<item>
		<title>谷歌UCP对决OpenAI ACP：两大巨头争夺AI代理电商标准，一个是安卓式开放，一个是轻量级接入，谁才是未来商家的首选？｜Google UCP OpenAI ACP Agentic Commerce Protocol decentralized standard</title>
		<link>https://lukefan.com/2026/01/15/google-ucp-ai-decentralized-commerce-protocol/</link>
		
		<dc:creator><![CDATA[老范 讲故事]]></dc:creator>
		<pubDate>Thu, 15 Jan 2026 00:44:56 +0000</pubDate>
				<category><![CDATA[Google的故事]]></category>
		<category><![CDATA[电商故事]]></category>
		<category><![CDATA[Agentic Commerce]]></category>
		<category><![CDATA[AI Driven Retail]]></category>
		<category><![CDATA[AI Interactions]]></category>
		<category><![CDATA[AI Shopping Standard]]></category>
		<category><![CDATA[Amazon Rufus]]></category>
		<category><![CDATA[Context Isolation]]></category>
		<category><![CDATA[Conversational Commerce]]></category>
		<category><![CDATA[Decentralized Commerce Protocol]]></category>
		<category><![CDATA[Decentralized Standard]]></category>
		<category><![CDATA[Digital Retail]]></category>
		<category><![CDATA[Future of Ecommerce]]></category>
		<category><![CDATA[Google Gemini]]></category>
		<category><![CDATA[Google Search AI]]></category>
		<category><![CDATA[Google UCP]]></category>
		<category><![CDATA[OpenAI ACP]]></category>
		<category><![CDATA[Shopify UCP]]></category>
		<category><![CDATA[Smart Ecommerce]]></category>
		<category><![CDATA[Tokenized Payment]]></category>
		<category><![CDATA[UCP]]></category>
		<category><![CDATA[Universal Commerce Protocol]]></category>
		<guid isPermaLink="false">https://lukefan.com/?p=3245</guid>

					<description><![CDATA[谷歌搞了个大新闻！UCP协议横空出世，电商要变天了🔥

以后买东西不用搜、不用刷，直接跟AI聊天就能下单！🤖💬 比如你跟Gemini聊着聊着，突然它就给你推荐了想要的东西，一键购买直接送到家。这转化率，简直高到离谱！

最狠的是，这个协议号称“去中心化”，说白了就是“去亚马逊化”😂 目前Shopify、沃尔玛、PayPal等大佬已经站队，但亚马逊自己玩起了Rufus购物助手，直接拒绝加入。这场巨头大战，戏码十足！

隐私问题也超有趣：AI聊天内容商家完全看不到！比如古代某女子聊天时说想“防虫处理”，AI推荐了砒霜，但商家只知道她买了砒霜，至于她回家是防虫还是“喂药”就不知道了…🤫 这个“上下文隔离”设计，细思极恐啊！

未来已来：搜索电商→推荐电商→智能电商。以后可能你刚说“想做饭”，AI就把菜刀、食材全给你买齐了🍳 作为商家，不接入就可能错过下一波流量红利；作为用户，准备好跟AI“唠嗑式购物”了吗？

#AI购物革命 #谷歌黑科技 #电商新模式 #智能生活

标题1：亚马逊拒绝加入的围剿战：谷歌联合Shopify与沃尔玛构建去中心化电商联盟，这是从搜索到AI代理的生死局，谁能掌控下一代流量入口？｜Universal Commerce Protocol UCP Google UCP AI Mode
标题2：潘金莲买砒霜商家却不知情？揭秘AI购物的上下文隔离机制：如何一边保护隐私一边让Gemini精准带货，商家必看的流量变局与转化红利｜Gemini Google Search open standard agentic commerce
标题3：搜索电商已死，推荐电商触顶？谷歌发布智能电商新标准，从“人找货”到“货找人”再到“AI意图交易”，高转化率的未来已来｜Universal Commerce Protocol UCP AI shopping standard instant sales
标题4：谷歌UCP对决OpenAI ACP：两大巨头争夺AI代理电商标准，一个是安卓式开放，一个是轻量级接入，谁才是未来商家的首选？｜Google UCP OpenAI ACP Agentic Commerce Protocol decentralized standard
标题5：别再死守传统广告位了！Shopify与支付宝抢先入局，AI Agent正在重构流量分发逻辑，商家如何利用新协议实现无缝交易闭环？｜Universal Commerce Protocol UCP Merchant of Record business logic
简介：谷歌近期重磅发布Universal Commerce Protocol（UCP），正式宣告电商模式从传统的搜索与推荐向AI驱动的智能电商转型。这项新标准旨在打破亚马逊的封闭生态，通过去中心化协议联合Shopify、沃尔玛等巨头，实现跨平台的agentic commerce。在Gemini等大模型的加持下，商家可利用AI精确识别用户意图并完成交易，开启流量与转化率的新增长点。]]></description>
										<content:encoded><![CDATA[
<figure class="wp-block-embed is-type-video is-provider-youtube wp-block-embed-youtube wp-embed-aspect-16-9 wp-has-aspect-ratio"><div class="wp-block-embed__wrapper">
<iframe loading="lazy" title="搜索电商已死，推荐电商触顶？谷歌发布智能电商新标准，从“人找货”到“货找人”再到“AI意图交易”，高转化率的未来已来｜Universal Commerce Protocol UCP AI" width="900" height="506" src="https://www.youtube.com/embed/sIc-QhzS1mk?feature=oembed" frameborder="0" allow="accelerometer; autoplay; clipboard-write; encrypted-media; gyroscope; picture-in-picture; web-share" referrerpolicy="strict-origin-when-cross-origin" allowfullscreen></iframe>
</div></figure>



<figure class="wp-block-image size-large"><img decoding="async" src="https://pictures.lukefan.com/google-ucp-ai-decentralized-commerce-protocol/blog_1.jpeg" alt=""/></figure>



<h1 class="wp-block-heading">谷歌发布了UCP通用商业协议</h1>



<p class="wp-block-paragraph"><strong>摘要：</strong>电商模式正式从传统的人找货（也就是搜索电商）和货找人（也就是推荐电商），转向了对话及交易的智能电商。</p>



<p class="wp-block-paragraph">大家好，欢迎收听<a href="https://youtube.com/@StoryTellerFan" target="_blank" rel="noopener">老范讲故事的YouTube频道</a>。</p>



<h2 class="wp-block-heading">什么是UCP（通用商业协议）？</h2>



<p class="wp-block-paragraph">1月11日，谷歌在纽约举行的全美零售联合会年度博览会上发布了UCP。所谓UCP叫Universal Commerce Protocol（通用商业协议），AI驱动的去中心化电商通用协议。</p>



<p class="wp-block-paragraph">这里头跟去中心化有什么关系？你说这玩意是不是用币？不是。这个里头所谓的去中心化，说白了就是“去亚马逊”。不去别人，就去它。</p>



<figure class="wp-block-image size-large"><img decoding="async" src="https://pictures.lukefan.com/google-ucp-ai-decentralized-commerce-protocol/blog_2.jpeg" alt=""/></figure>



<h3 class="wp-block-heading">协议包含的功能模块</h3>



<p class="wp-block-paragraph">这个协议涵盖了电商的所有流程和模块，包括：</p>



<ul class="wp-block-list">
<li><strong>自动发现：</strong>也就是一个网站到底提供什么样的电商服务，这个会被发现。</li>



<li><strong>基本电商能力：</strong>什么购物车、价格计算、库存检索、支付确认或者支付授权，这个都有。</li>



<li><strong>订单全流程：</strong>还有下单的订单管理、订单状态、追踪售后、退货。</li>



<li><strong>其他支持：</strong>以及支付，还有用户管理和会员权益、风险管控和反欺诈。</li>
</ul>



<p class="wp-block-paragraph">这是属于电商需要的所有东西，它都给你定义了一遍。同时支持MCP A to A（也就是Agent to Agent），还有传统的API格式，统统都是支持的。</p>



<span id="more-3245"></span>



<h3 class="wp-block-heading">开放性与谷歌的控制权</h3>



<p class="wp-block-paragraph">UCP这个东西是开放的吗？还是谷歌说了算？这个非常非常有谷歌特色。</p>



<p class="wp-block-paragraph">一方面它是开放的，这个协议相关的所有文档和代码都是在GitHub上托管的，使用的是阿帕奇2.0的开源许可证，大家都可以去用。</p>



<p class="wp-block-paragraph">但是也不是完全开放的，这个东西有点像安卓里边的GMS一样，叫Google Mobile Service。GMS这个东西是需要谷歌去审核的，不是说谁愿意接谁就可以接上的。如果谷歌审核不通过、不给你发认证的话，你进不去。UCP也是如此，需要谷歌的认证和准入，而且数据格式的定义，这个权利也是在谷歌手里边的。你不能说我自己随便定义一些数据就放进去，这事是不允许的。所以这个东西的开放状态很像安卓。</p>



<figure class="wp-block-image size-large"><img decoding="async" src="https://pictures.lukefan.com/google-ucp-ai-decentralized-commerce-protocol/blog_3.jpeg" alt=""/></figure>



<h2 class="wp-block-heading">安全与隐私问题</h2>



<p class="wp-block-paragraph">UCP它会带来一些安全和隐私的问题。</p>



<h3 class="wp-block-heading">1. 代币化支付</h3>



<p class="wp-block-paragraph">首先咱们先说安全吧，它在支付的时候使用的是代币化支付。那你说去中心化，不是不用Token？那刚才老范不是说了吗，虽然叫去中心化，但是咱不用代币。</p>



<p class="wp-block-paragraph">这里讲的是什么？就是AI真的是看不到信用卡信息的，也看不到你的支付相关的信息，它只能看到一个Token。但是这个Token并不是你的比特币钱包，而是比如说PayPal或者是Visa，他们来给的这个Token。它只要拿到Token就可以去验证了，是这样的一个代币化支付。</p>



<h3 class="wp-block-heading">2. 上下文隔离</h3>



<p class="wp-block-paragraph">还有一个重要的安全属性，是要上下文隔离。什么意思？就是你想我们以后是怎么买东西：我们跟谷歌的Gemini聊天，聊着聊着，突然他就给你推荐商品了，你一确认就给你买回来了。这个聊天的过程叫上下文，商家是看不到的。商家只能看到交易数据，谁买了什么他知道；但是为什么买、上下文聊什么，这个是不会发给商家的。</p>



<p class="wp-block-paragraph">比如说吧，中国古代有一位女子，聊天的时候说：“我想给家里头的衣物做一下防虫处理，有什么办法没有？”她有可能聊了这个。当然另外一种可能，她聊的是：“西门大官人，我看着这个甚是欢喜，但是家里有个三寸钉应该怎么办？”这两种聊天都是有可能发生的。</p>



<p class="wp-block-paragraph">但是这两种聊天，最后都会触发共同的结果，就是AI回复说：“你去买一些砒霜吧。”</p>



<figure class="wp-block-image size-large"><img decoding="async" src="https://pictures.lukefan.com/google-ucp-ai-decentralized-commerce-protocol/blog_4.jpeg" alt=""/></figure>



<p class="wp-block-paragraph">大家不要觉得砒霜这个东西是毒药——它确实是毒药，但是在中国古代，这个东西是有正规用途的。一方面它可以包裹种子去播种，这样可以防病虫害、防杂草；另外就是刚才咱们讲的，就是家里头的衣物防虫也是用砒霜的，只是要少用一点点。就是甭管她前面说的是哪种情况，AI都会给她推荐砒霜。她买的时候，商家只知道她买了砒霜，至于你拿回去干嘛使，他就不知道了。然后这位女子把砒霜拿到手以后，就可以喊：“大郎，该吃药了。”就会变成这样了。这个就叫上下文隔离。</p>



<h3 class="wp-block-heading">3. 数据归属权的转移</h3>



<p class="wp-block-paragraph">但是商家会知道，某位顾客（或者说某位女子吧），什么时间购买了多少砒霜、送去了哪里，这些东西是这个商家会知道的。上下文没有了。但是这个其实跟现在我们普遍使用的安全隐私方式还是有一些差距的。</p>



<p class="wp-block-paragraph">因为原来这些数据会在亚马逊这些平台手里边，他会把这个东西截留下来，并不会发给商家。因为最早的时候，中国做跨境电商的时候，是收集了大量的美国用户的家庭住址和电话的。后来说不行，这玩意我们要保护隐私，然后就改成了说：“你们把这个数据通通都留在亚马逊，不要发给中国卖家。”</p>



<p class="wp-block-paragraph">但是你如果使用了UCP，谁是最终的销售者，谁就可以得到用户的电话、用户的地址。这些数据回到商家手里边有什么好处？商家可以更好的接触用户，进行售后服务，也可以再去促成二次销售。</p>



<p class="wp-block-paragraph">比如说吧，你从某个商家手里买了台打印机，那么商家可能每过一段时间就会问你说：“要不要换个墨盒？要不要换个硒鼓？”他有这种二次销售的机会。那像原来美国人为了保护隐私，他把这些数据都留在亚马逊手里了，那亚马逊说：“你该买硒鼓了，该买墨盒了，你不要到原来那个商家去买，你在我这买，我给你推荐别的商家。”为什么？因为那个商家给我钱了，给我广告费了。他希望在新的二次购买机会发生的时候，亚马逊可以再收一次广告费，把这个二次销售的决定权放在自己手里边。所有跟隐私保护相关的条款，实际上背后都是有商业利益的。</p>



<h2 class="wp-block-heading">参与者与生态伙伴</h2>



<p class="wp-block-paragraph">那么在这样的一个协议发布以后，咱们先看看谁参加进来了。</p>



<figure class="wp-block-image size-large"><img decoding="async" src="https://pictures.lukefan.com/google-ucp-ai-decentralized-commerce-protocol/blog_5.jpeg" alt=""/></figure>



<h3 class="wp-block-heading">共同发起方</h3>



<ul class="wp-block-list">
<li><strong>Shopify：</strong>第一个叫共同发起方。头一个就是Shopify，它排的头一个。为什么？很简单，它算是一个相对比较零碎的电商平台，上面有大量的网站去卖各种不同的商品。而Shopify是靠什么活下来的？就是靠不停的买谷歌广告，谷歌搜索广告。搜索了以后，你要去给我推荐Shopify上面的商品。既然这样的话，谷歌说我要做UCP，那Shopify第一个站出来，说：“来，咱们一起来发起吧。”所以它是共同发起方之一。</li>



<li><strong>Etsy：</strong>这个应该是美国的一个手工工艺品的电商，他们也是发起方。</li>



<li><strong>Wayfair：</strong>应该也是一个商家。</li>



<li><strong>Target：</strong>美国很常见的一个比较廉价的超市。</li>



<li><strong>沃尔玛：</strong>他们都是联合发起方。</li>
</ul>



<p class="wp-block-paragraph">这些其实原来都是谷歌搜索广告的大客户。</p>



<h3 class="wp-block-heading">生态合作伙伴与背书</h3>



<ul class="wp-block-list">
<li><strong>支付类：</strong>Adyen（做支付的）、PayPal（做支付的）、Stripe（支付平台）、蚂蚁国际（阿里系的，也冲进来了）。</li>



<li><strong>信用卡类：</strong>美国运通、万事达、Visa卡。</li>



<li><strong>零售商类：</strong>Best Buy（在国内叫百思买，后来就好像国内都关干净了，他们也参与进来了）、梅西百货、家得宝（家装平台）。</li>
</ul>



<p class="wp-block-paragraph">在这个里边实际上分几类。第一类是原来的这种电商平台（但是不是亚马逊），就是一些小的电商平台或者是传统的商超平台，他们都加进来了。然后这些支付平台基本上都进来了。</p>



<p class="wp-block-paragraph">因为对于支付平台来说，甭管你谁把东西卖掉了，从我这能把货钱支付出去就OK。支付平台，你说怎么就这么雷锋？千万别这么想。支付平台挣的不是这钱，支付平台挣的是利息，他是希望你在支付的过程中向他贷款的。所以支付平台会非常非常积极的参与这种事情。目前开通的支付就是Google Pay，马上就会开PayPal。其他的生态合作伙伴里的这些支付平台，会逐步的加入进来。阿里系的蚂蚁国际也准备加到这个里边来，让大家去用支付宝进行支付。</p>



<h3 class="wp-block-heading">物流与交付</h3>



<p class="wp-block-paragraph">咱们要注意，整个这个UCP是涉及很多环节了。除了电商平台或者说商超平台、支付平台之外，还有物流交付和售后这块。谷歌官方并没有给出合作伙伴的名单，但是有一个叫<strong>PIPE 17</strong>，他宣布支持UCP，专门做物流和订单管理的。这一块可能没有一些特别大的企业，但是他们都会积极的参与进来。</p>



<h3 class="wp-block-heading">流量入口（大模型）</h3>



<p class="wp-block-paragraph">大模型或者叫流量入口，这也是一个重要参与方。你说我做了半天UCP，没有流量入口，没有新的聊天的流量进来，那不是胡扯了吗？</p>



<ul class="wp-block-list">
<li><strong>谷歌体系：</strong>目前只有谷歌搜索的AI模式和Gemini APP这个里边接了。官方表示有其他平台接入，但是并没有公布。</li>



<li><strong>微软：</strong>这个里头微软的Copilot通过Shopify是做了整合的，已经接入了UCP。</li>



<li><strong>苹果：</strong>Siri，因为以后的Siri里边是Gemini整合，所以苹果平台也接入了这个体系。</li>
</ul>



<p class="wp-block-paragraph">所以这个流量入口还是非常非常巨大的。</p>



<h2 class="wp-block-heading">谁没来？（缺席者与竞争者）</h2>



<p class="wp-block-paragraph">这是谁来了，那谁没来？<strong>亚马逊</strong>嘛。咱们刚才讲了，去中心化去的就是亚马逊。亚马逊说：“你们冲谁来的？别以为我不知道。”</p>



<p class="wp-block-paragraph">然后Meta、Shein、TikTok和Temu也都没有表态，但是也没有说我就不去，只是说我们观望一下。这些就是美国现在比较主流的一些电商的平台。</p>



<figure class="wp-block-image size-large"><img decoding="async" src="https://pictures.lukefan.com/google-ucp-ai-decentralized-commerce-protocol/blog_6.jpeg" alt=""/></figure>



<h3 class="wp-block-heading">缺席者的替代方案</h3>



<h4 class="wp-block-heading">1. 亚马逊：Rufus</h4>



<p class="wp-block-paragraph">首先说亚马逊吧。亚马逊自己出了一个叫做Rufus的购物助手。大家现在可以在亚马逊里头跟它聊天了。聊完了以后，它就会给你推荐商品，在亚马逊内部完成交易闭环。</p>



<p class="wp-block-paragraph">亚马逊想干的事是什么？希望通过最完善的电商服务闭环体系，击败像UCP这种组织起来的草台班子。大家注意，你像UCP一旦组织起来，谁的货他不管了，谁负责物流和交付，谷歌可能会做一些简单的审核，但是一定没有亚马逊这种完全闭环的质量高。他希望通过这种购物体验打败谷歌。</p>



<h4 class="wp-block-heading">2. OpenAI：ACP</h4>



<p class="wp-block-paragraph">OpenAI其实也推出一个类似的东西叫ACP。谷歌这个UCP，U是通用的Universal；这个A是代理的意思，叫Agentic。所以OpenAI推出的叫代理商务协议。OpenAI的这个协议相对来说要轻量很多，它通过工具的方式将电商交互融入到Agentic里边去。它做了这样的一个事情。</p>



<p class="wp-block-paragraph">OpenAI跟这个协议，是OpenAI跟Stripe合作推出的一个开源协议。这块都得开源，你不开源没人敢上。然后Shopify跟这个Etsy首批加盟，他们就是甭管你谁上，这东西我都去加盟去。为什么？这就是有销售的机会吗，这是不能放弃的。亚马逊已经明确的表达，我拒绝加入，我自己玩自己的，我不跟你玩。</p>



<h4 class="wp-block-heading">3. Perplexity：一键购物</h4>



<p class="wp-block-paragraph">下一个就是Perplexity。它推出了一个叫“一键购物”的功能。你可以直接在Perplexity聊天的时候，就把东西买走。这一块Perplexity是直接奔着超级入口去的，他就没有说我开放个协议大家来加入，他没这么大野心在这块。亚马逊是直接起诉了Perplexity，你非法爬取了亚马逊的数据。起诉的同时，亚马逊对Perplexity实行了数据封锁，以后不让你爬了，你看看你到底卖什么。</p>



<h2 class="wp-block-heading">AI购物革命与电商模式的演变</h2>



<p class="wp-block-paragraph">AI最终还是会走向交易成功的，未必会是谷歌的UCP，因为UCP这个东西还是有点太复杂了。最终的接口位置、也就是你的协议在什么地方、各个平台提供什么样的服务、接口可能还需要有一段时间的拉扯。但是AI购物的革命正在到来。</p>



<h3 class="wp-block-heading">第一阶段：搜索购物</h3>



<p class="wp-block-paragraph">原来是搜索购物，像亚马逊、淘宝天猫、京东，还有像拼多多，这都属于是搜索销售。我要买什么东西我跟人说，说完了以后找一大堆的商品我在里头挑，是这样的一种销售方式。这些电商平台在里边去收广告费，你搜索完了以后，谁排前头谁排后头，有哪些广告位，他们是卖这玩意的。</p>



<h3 class="wp-block-heading">第二阶段：推荐销售</h3>



<p class="wp-block-paragraph">后来开始出现像抖音、TikTok、快手这样的直播平台。他们干的是什么？他们干的实际上是推荐销售。他们是靠推荐算法，将不同的直播间推到我面前来，让我形成购买。我现在大量的电商交易都是在抖音上做的，我是比较吃推荐算法的。</p>



<h3 class="wp-block-heading">第三阶段：智能电商（意图交易）</h3>



<figure class="wp-block-image size-large"><img decoding="async" src="https://pictures.lukefan.com/google-ucp-ai-decentralized-commerce-protocol/blog_7.jpeg" alt=""/></figure>



<p class="wp-block-paragraph">现在随着用户注意力的转移，更多的用户时长被聊天助手给劫持了。我现在每天面对电脑、面对手机的时候，大量的时间不是在这刷抖音，而是去跟豆包、跟ChatGPT、跟Gemini去聊天去了。在这个过程中就要让它形成交易，而不是说一个月找我收20美金就算结束了。你想，我如果在这个里头买东西的话，他挣到的钱绝对比一个月20美金要多得多，而且是上不封顶。你1月20美金，它是上边封顶的。所以现在甭管是OpenAI也好，还是谷歌也好，都在向这一块狂奔。</p>



<p class="wp-block-paragraph">AI能够更加理解用户的需求和意图。前面咱们讲这个潘姓小娘子的案例，甭管你是说我们家衣服被虫子咬了，还是说西门大官人甚得我心、我们家有个三寸钉，这个意图会被AI理解掉。理解完了以后就说：“这样的问题，我们可以通过购买一种叫砒霜或者叫鹤顶红的东西可以解决掉。”那么这个潘姓小娘子就直接下单就购买了。</p>



<p class="wp-block-paragraph">在AI购物的过程中，大模型可以根据用户意图，直接在聊天的过程中进行交易。绝对是润物细无声的，而且成交的转换率极高。更多的长尾服务会达成交易。以后就不会说大家去抢推荐算法的入口了，或者去抢什么最上面这个广告栏了，以后就是每个人聊自己的，AI会通过我们聊天的过程，发现每一个人所需要的服务或者是需要的这个商品，然后向我们推荐。那这玩意转化率多高？一卖一个不吱声，绝对的。</p>



<p class="wp-block-paragraph">如果谷歌可以继续做流量入口，那么谷歌这个UCP这条路就算走通了。原来那些依赖谷歌搜索广告的商家，就像什么Shopify、像什么其他的一些小型的这些商家，会跟着谷歌走的。从谷歌最近快速蚕食OpenAI的流量，以及跟苹果签了Siri协议来看，这种可能性还是很大的。</p>



<h2 class="wp-block-heading">总结</h2>



<p class="wp-block-paragraph">总结一下吧，谷歌发布了UCP的通用商业协议这样的一个东西。未来的电商模式已经到来了，从搜索电商到推荐电商，现在最终到了智能电商。</p>



<figure class="wp-block-image size-large"><img decoding="async" src="https://pictures.lukefan.com/google-ucp-ai-decentralized-commerce-protocol/blog_8.jpeg" alt=""/></figure>



<p class="wp-block-paragraph">所谓的智能电商，其实就是对话过程中的意图发现，并最终实现电商交易的一个过程。用户未必直接聊天，而是表达意图之后，AI Agent将意图分解，分别完成交易。比如我说了，我今天想去做满汉全席。跟AI聊了半天，菜谱都确定了，AI就会分别下单，把满汉全席所需要的所有东西都给我买回来，包括什么菜谱、什么菜刀，他是这样来去工作的。更长尾、更高转换率，而且去中心化，这就是未来电商的模式。</p>



<p class="wp-block-paragraph">亚马逊、Temu和Shein这些传统的电商平台会首先受到冲击。Meta和TikTok这些社交推荐电商平台，也会随着用户注意力的转移受到影响，但是没有那么快。所以他们只是说我们看看，我们先不着急。而亚马逊就是非常非常激烈的反对、推出竞品，要跟你去竞争。它是这样的不同的反馈。</p>



<h2 class="wp-block-heading">最后的建议</h2>



<p class="wp-block-paragraph">最后给大家一些建议吧。</p>



<ul class="wp-block-list">
<li><strong>如果是商家或者说是服务的提供者：</strong>义无反顾的接进去。没有人会嫌流量多的，你有更多的曝光机会肯定要上。而且要去研究如何优化这样的一个发现过程。既然AI去聊天了，去进行意图匹配了，那怎么能够让意图匹配的过程更大的几率匹配到你？这就是以后大家要去研究的方向了。当然最简单的可能还是向谷歌交钱，交完钱以后，你这个匹配成功的几率就会上升。</li>



<li><strong>如果是其他应用和服务的开发者：</strong>也可以将交易作为一个组件接入系统了。比如说我今天是一个导游系统的开发者，那我原来可能导游的过程中，怎么买票、怎么去定机加酒、怎么去定本地的一些落地服务……那么以后，可能我就可以把当地的一些土特产就通通都可以加进去了。这个就完完全全会让这些AI Agent的能力上到另外一个台阶去。</li>
</ul>



<p class="wp-block-paragraph">当然，未来越来越多的普通人会成为应用和服务的开发和提供者。所以这件事情，应该是跟每一个人都有关系的。</p>



<p class="wp-block-paragraph">好，这个故事今天就跟大家讲到这里，感谢大家收听。请帮忙点赞、点小铃铛，参加<a href="https://discord.gg/ppKsNkttTv" target="_blank" rel="noopener">Discord讨论群</a>。也欢迎有兴趣、有能力的朋友加入我们的<a href="https://www.youtube.com/channel/UCUGLhcs3-3y_yhZZsgRzrzw/join" target="_blank" rel="noopener">付费频道</a>。再见。</p>



<hr class="wp-block-separator has-alpha-channel-opacity"/>



<h1 class="wp-block-heading">背景图片</h1>



<p class="wp-block-paragraph">Prompt：<strong>High-contrast luminous watercolor realism of a split e-commerce office interior: loft workstation area with matte black steel frame, exposed ducts, concrete columns, glass rail mezzanine, rows of wooden desks with precise monitor stands, keyboards, mousepads, desk lamps, tidy cable management; adjacent logistics warehouse with galvanized pallet racking, corrugated cardboard boxes with packing tape seams, bubble wrap rolls, label printer, scale, shipping cartons, plastic totes, hand pallet jack on polished concrete, crisp aisle geometry; cinematic wide shot, 35mm equivalent, eye-level, clean separation line between the two zones, strong depth cues, sharp subject separation, extremely legible bright negative space in upper background for typography, high-key lighting + neon cyan rimlight, realistic glossy reflections on floor and screens, crystal-clear atmospheric glow, minimal vivid palette (ink blue, deep navy gradients, neon cyan, warm gold, subtle coral), controlled ink outlines, micro-texture and clean surface wear &#8211;ar 16:9 &#8211;stylize 120 &#8211;chaos 4 &#8211;no text, watermark, logo, clutter, lowres &#8211;v 7.0 &#8211;p lh4so59</strong></p>



<figure class="wp-block-image size-large"><img decoding="async" src="https://pictures.lukefan.com/google-ucp-ai-decentralized-commerce-protocol/background_1.jpeg" alt=""/></figure>



<figure class="wp-block-image size-large"><img decoding="async" src="https://pictures.lukefan.com/google-ucp-ai-decentralized-commerce-protocol/background_2.jpeg" alt=""/></figure>



<figure class="wp-block-image size-large"><img decoding="async" src="https://pictures.lukefan.com/google-ucp-ai-decentralized-commerce-protocol/background_3.jpeg" alt=""/></figure>



<figure class="wp-block-image size-large"><img decoding="async" src="https://pictures.lukefan.com/google-ucp-ai-decentralized-commerce-protocol/background_4.jpeg" alt=""/></figure>
]]></content:encoded>
					
		
		
			</item>
		<item>
		<title>所有人都在唱衰谷歌将被AI颠覆，财报却显示搜索广告暴涨15%！真相是谷歌做了一个违背祖训的决定，从让用户快走变成把人留在聊天窗口｜Google AI Mode、Search Monetization</title>
		<link>https://lukefan.com/2025/12/22/google-ai-advertising-transformation-monetization/</link>
		
		<dc:creator><![CDATA[Luke Fan]]></dc:creator>
		<pubDate>Mon, 22 Dec 2025 12:45:47 +0000</pubDate>
				<category><![CDATA[AIGC]]></category>
		<category><![CDATA[Google的故事]]></category>
		<category><![CDATA[Ad Revenue Strategy]]></category>
		<category><![CDATA[AdSense Decline]]></category>
		<category><![CDATA[AI User Intent]]></category>
		<category><![CDATA[AI-Powered Search]]></category>
		<category><![CDATA[Answer Engines]]></category>
		<category><![CDATA[Automated Ad Creatives]]></category>
		<category><![CDATA[Digital Advertising Transformation]]></category>
		<category><![CDATA[Gemini 3]]></category>
		<category><![CDATA[Gemini Ads]]></category>
		<category><![CDATA[Generative AI Advertising]]></category>
		<category><![CDATA[Google Ad Manager]]></category>
		<category><![CDATA[Google AI Mode]]></category>
		<category><![CDATA[Google Search Future]]></category>
		<category><![CDATA[Google vs OpenAI]]></category>
		<category><![CDATA[Long Tail Economy]]></category>
		<category><![CDATA[Niche Product Marketing]]></category>
		<category><![CDATA[Post-Keyword Era]]></category>
		<category><![CDATA[Publisher Monetization]]></category>
		<category><![CDATA[Search Monetization]]></category>
		<category><![CDATA[Smart Ad Matching]]></category>
		<category><![CDATA[Sponsored AI Results]]></category>
		<category><![CDATA[TPU Ecosystem]]></category>
		<guid isPermaLink="false">https://lukefan.com/?p=3152</guid>

					<description><![CDATA[AI时代，谷歌居然把广告玩出新花样了！😱 你以为AI会干掉搜索广告？错！谷歌财报啪啪打脸，广告收入不降反升！🔥

以前搜索完就跑，现在谷歌让你赖着不走！🤯 跟AI聊天聊上瘾，广告看到手软！原来谷歌偷偷学百度，肥水不流外人田，答案广告一站式搞定！💸

最绝的是，AI让广告精准到可怕！👀 你搜“冷感木质香”，AI立马给你推小众手作香水；你找“宽脚跑鞋”，它连你半马训练路线都知道！这哪是广告，简直是肚里蛔虫！🐛

传统广告门槛高到爆炸，现在谷歌全包了！🎯 自动生成素材、智能匹配用户，连中国人最擅长的“素材海战术”都被AI秒杀！护城河？不存在的！🌊

黑五战报更搞笑：订单量降了，单价却涨了！💰 多出来的钱去哪了？全进谷歌广告费了！小众需求被疯狂挖掘，中产的钱包瑟瑟发抖！👜

谷歌这波操作，直接给AI时代指明赚钱方向：不是收月费，而是无限放大的广告变现！🚀 搜索只是方法，交易才是目的！AI时代，每个人都能做更小众的生意，讲更精彩的故事！📖

所以别担心AI让你失业，它正在创造新机会！💪 赶紧想想你的小众技能，怎么被AI放大到全世界吧！🌍

#谷歌逆天改命 #AI广告新玩法 #小众生意爆发 #黑五真相 #未来已来

标题1：所有人都在唱衰谷歌将被AI颠覆，财报却显示搜索广告暴涨15%！真相是谷歌做了一个违背祖训的决定，从让用户快走变成把人留在聊天窗口｜Google AI Mode、Search Monetization、Gemini Ads、Post-Keyword Era
标题2：OpenAI的订阅制其实是存量博弈的有毒模式？谷歌财报揭示无限增长的新解法：不是卖20美元的会员，而是用AI自动生成素材匹配无限长尾需求｜Google AI Mode、Search Monetization、Gemini Ads、AI-Powered Search
标题3：别再纠结SEO排名了，AdSense收入已下滑3%！谷歌AI现在自动抓取商品库并生成视频广告，精准匹配那些你没想过的小众长尾需求与极窄人群｜Google AI Mode、Search Monetization、Gemini Ads、Google Ad Manager
标题4：链接跳转的时代正在终结，谷歌不再希望你点击进入网页？将用户留在AI界面不仅没死，反而通过意图识别让广告单价与转化率双双飙升的底层逻辑曝光｜Google AI Mode、Search Monetization、Gemini Ads、Agentic Search
标题5：AI时代不仅没有杀死广告，反而让黑五平均客单价上涨8%？全民发钱不现实，未来是靠内容故事与非标商品匹配生存，谷歌已通过新生态指明方向｜Google AI Mode、Search Monetization、Digital Advertising Transformation、Sponsored AI Results
简介：谷歌财报打破了“AI将杀死搜索”的预言，搜索广告收入逆势上涨15%的背后，是谷歌从追求“快速离开”到“留住用户”的战略巨变。通过 **Google AI Mode** 自动生成素材并精准匹配长尾需求，谷歌验证了 **Search Monetization** 在 **Post-Keyword Era** 的无限潜力。这不仅是 **Digital Advertising Transformation**，更为AI时代的商业变现指明了方向。]]></description>
										<content:encoded><![CDATA[
<figure class="wp-block-embed is-type-video is-provider-youtube wp-block-embed-youtube wp-embed-aspect-16-9 wp-has-aspect-ratio"><div class="wp-block-embed__wrapper">
<iframe loading="lazy" title="所有人都在唱衰谷歌将被AI颠覆，财报却显示搜索广告暴涨15%！真相是谷歌做了一个违背祖训的决定，从让用户快走变成把人留在聊天窗口｜Google AI Mode、Search Monetization" width="900" height="506" src="https://www.youtube.com/embed/TIuRup13V_A?feature=oembed" frameborder="0" allow="accelerometer; autoplay; clipboard-write; encrypted-media; gyroscope; picture-in-picture; web-share" referrerpolicy="strict-origin-when-cross-origin" allowfullscreen></iframe>
</div></figure>



<figure class="wp-block-image size-large"><img decoding="async" src="https://pictures.lukefan.com/google-ai-advertising-transformation-monetization/blog_1.JPEG" alt=""/></figure>



<h1 class="wp-block-heading">谷歌的价值被认同：为AI后的时代指明方向</h1>



<p class="wp-block-paragraph">大家好。欢迎收听老范讲故事的YouTube频道。咱们今天讲一讲谷歌的价值被认同，不仅仅是因为Gemini 3和TPU，更重要的是，<strong>谷歌为AI后的时代指明了方向。</strong></p>



<p class="wp-block-paragraph">指明方向这件事，还是可以讲的，至少说在谷歌身上问题不太大。谷歌的价值在上升，在美股七姐妹中算是一枝独秀了。很多人认为是Gemini 3遥遥领先，以及TPU终于打破了英伟达的垄断，以及OpenAI的泡沫越来越让人担忧。这些其实只是表象。<strong>AI不但没有杀死搜索和广告，反而让广告商的收益上升了，这才是关键。</strong></p>



<h2 class="wp-block-heading">AI时代，搜索与广告的生存悖论</h2>



<figure class="wp-block-image size-large"><img decoding="async" src="https://pictures.lukefan.com/google-ai-advertising-transformation-monetization/blog_2.JPEG" alt=""/></figure>



<p class="wp-block-paragraph">以前搜索，我们输入关键词，得到一大堆网页，点击其中一个网页，进到网页里边去，看到很多的广告，原来它是这样的一种生存方式。</p>



<p class="wp-block-paragraph">在AI出来了以后，包括我在内都在担心说，以后AI只生成一个唯一正确的答案，它就没有搜索的过程，你没有那么多地方放广告了，也没有需要点击、跳入其他网页的机会了。整个的网络广告就全废了，甭管是搜索广告，还是跳出去以后谷歌的AdSense，这些就都没有了。所以当时大家一致认为是AI会干掉谷歌，甚至谷歌也拉响了红色警报。</p>



<p class="wp-block-paragraph">OpenAI发明了这种20美金一个月，以及花钱买TOKEN的商业模式。从OpenAI 20美金一个月收钱那天开始，我就讲过说这个东西是一个有毒的商业模式，这事是错的。为什么？</p>



<blockquote class="wp-block-quote is-layout-flow wp-block-quote-is-layout-flow">
<p class="wp-block-paragraph">因为20美金是死的，每个人就交20美金；而广告这个数是活的，它可以不断的刺激我买东西，不断的让我去在购物的过程中，让它的广告主给它支付广告费用。<strong>这个数是无限的，而20美金这个数是有限的。</strong></p>
</blockquote>



<p class="wp-block-paragraph">当时我就下了这样的结论，但是从来没有想明白过，AI时代以后广告和搜索到底怎么活下去。但是现在谷歌和Meta的财报都证明了，他们的广告收入不但没有下降，反而在上升。特别是以谷歌的财报更为明显，它的上升比例其实没有Meta高，它大概上升了12%，Meta大概上升了26%。但是谷歌本来份额大，它是老大，还能上升12%；而且谷歌是搜索广告，而Meta的话很多是社交广告，所以Meta的那个也不是那么明显。但是谷歌这个真的是为未来指明了方向。</p>



<span id="more-3152"></span>



<h2 class="wp-block-heading">谷歌2025 Q3财报：一个违背祖训的决定</h2>



<figure class="wp-block-image size-large"><img decoding="async" src="https://pictures.lukefan.com/google-ai-advertising-transformation-monetization/blog_3.JPEG" alt=""/></figure>



<p class="wp-block-paragraph">谷歌2025年Q3的财报显示：</p>



<ul class="wp-block-list">
<li><strong>搜索广告收入：</strong>上升了15%</li>



<li><strong>YouTube广告收入：</strong>上升了15%</li>



<li><strong>网络广告（AdSense）：</strong>下降了3%</li>



<li><strong>总体上升：</strong>12.6%</li>
</ul>



<p class="wp-block-paragraph">其实YouTube广告收入上升这件事，大家是可以想到的，转到社交媒体，还要加上YouTube SHORTS，要去跟TikTok抢份额，所以它的广告收入上升大家能想到。但是真没有想到，搜索广告收入居然也上升了15%。但是有一项是下降的，就是网络广告下降了。什么是网络广告？就是AdSense那部分下降了3%。</p>



<p class="wp-block-paragraph">那到底发生了什么？<strong>谷歌做了一个违背祖训的决定。</strong>所有违背祖训的决定，最好由谁来做出？不是不肖子孙，而是由祖先自己来做出。所以这个决定大概是谢尔盖·布林自己做的。</p>



<p class="wp-block-paragraph">以前的谷歌要求大家是什么？<strong>尽可能快的离开。</strong>你如果在谷歌页面里在停了很长时间，说明你没找到你要的东西。所以你越快的离开谷歌，就说明我提供的服务越好。以前的谷歌很多图书里面，包括他们的一些文章和演讲，里边都在讲这件事情。</p>



<h3 class="wp-block-heading">从“快速离开”到“留下来”</h3>



<p class="wp-block-paragraph">但是现在不是这样了，你在谷歌搜索里头可以待半天。他们现在把这个事给做反过来了。为什么？因为他开了AI搜索，开了AI模式，你可以在里边跟他聊天了。所以谷歌现在不再追求让用户快速进入、快速找到答案、快速离开这件事了，而是让更多的用户时常留在谷歌的AI搜索和AI模式里头。</p>



<p class="wp-block-paragraph">搜索的目的本身就不是找到网页，而是解决用户的问题。原来说我们在搜索，搜索完了以后，点击到网页里头再看广告，但是你在这个过程中，并没有直接解决用户的问题，你还要让用户跳到网页里边去看去。现在不用了，我直接给你把问题解决掉。那在这个过程中，我直接给你看广告就完了。<strong>用户留下来了，用户时长上升了，更多的广告就有了展示的机会。</strong></p>



<p class="wp-block-paragraph">原来你没有那么多展示机会，像我们以前搜索谷歌，可能撑死了看一页，有的看两页，也就这样了。所以你说他能给你看几个广告？看不了几个。但我现在在谷歌AI模式里头跟他扯半天，那就很多很多的搜索，就都是很多很多的广告就都展示出来了。找到了答案了，也点过广告了，那就没有必要再跳转到目标网站瞎浪费时间了嘛。</p>



<p class="wp-block-paragraph">所以我们看到什么？AdSense的收入在下降，下降了3%。所以我们现在如果再辛辛苦苦做网站，想去靠SEO再把这个钱挣回来，已经比较难了。因为现在确实跳转的少了，肥水不流外人田，都在谷歌自己这把这钱挣完了。这点有点像百度，百度也是肥水不流外人田，你在百度搜索看广告，点击了去百度知道、去百度贴吧接着看广告，而且都是百度自己家的流量。谷歌现在说我也是照着学，你们都别走了，在我这把这个答案找到了，把广告看完了，不要去其他任何网站了。</p>



<h2 class="wp-block-heading">AI时代最关键的问题：怎么赚钱？</h2>



<figure class="wp-block-image size-large"><img decoding="async" src="https://pictures.lukefan.com/google-ai-advertising-transformation-monetization/blog_4.JPEG" alt=""/></figure>



<p class="wp-block-paragraph">那很多人说谷歌，你这也太不要脸了。不是这样的，事情没有这么简单。AI时代到来了，最关键的问题被谷歌找到了解决方案。AI时代是最关键的问题是什么？是AGI吗？是ASI吗（超级人工智能吗）？都不是。</p>



<p class="wp-block-paragraph"><strong>AI时代最关键的一个问题是：AI到底怎么赚钱？以及AI之后的时代，大家到底怎么过日子？这个答案现在被谷歌给带出来了。</strong></p>



<p class="wp-block-paragraph">到底怎么做这件事？有些人在设想工作是可选项，马斯克说的你想工作就工作，不想工作拉倒吧；还有人在去设想全民发钱，这是山姆·奥特曼想的，当然马斯克讲的要比他好一点，要发很多的钱，大家都是富翁，想怎么花怎么花。但是这几件事情，其实对于大部分人来说，是比较难以想象的。为什么？钱还没发下来，AI公司也还没挣着钱，我先失业了。现在我们遇到了这样的一个问题，这也是为什么很多人觉得AI是泡沫的一个根本原因：吹了半天牛，最后你也没挣着钱，还把大家的工作搞没了。</p>



<p class="wp-block-paragraph">那么谷歌的解法是什么？<strong>还是广告变现。</strong>但是AI时代了，广告又往前进了很大的一步。</p>



<h2 class="wp-block-heading">互联网的长尾与传统广告的门槛</h2>



<figure class="wp-block-image size-large"><img decoding="async" src="https://pictures.lukefan.com/google-ai-advertising-transformation-monetization/blog_5.JPEG" alt=""/></figure>



<p class="wp-block-paragraph">在互联网到来的时候，我们经历了一个很神奇的东西，叫长尾现象。什么是长尾现象？原来只有做的最好的那一两样东西能卖掉，那些小众需求的这些东西，他们只能在很小的圈子里头去流传，不可能说在全世界范围内去卖一些很小众的商品。在互联网普及之前，这件事是不存在的。这种小众产品我们就要长尾，就是你搜索一开始是比较高的，然后他是这样慢慢越走越长的，一条这样的一个曲线。现在后边这些都有销售的机会，这就是长尾现象。像淘宝、亚马逊，都得益于长尾现象。</p>



<p class="wp-block-paragraph">传统广告的投放，还是要稍微有一点点小麻烦的。跟大家讲一下传统广告是怎么投放的：</p>



<ol class="wp-block-list">
<li><strong>要有商品：</strong>首先你要有一个商品。</li>



<li><strong>选择卖点和关键词：</strong>我到底要宣传什么？在这一点上雷军还是比较强的，经常讲一些有的没的东西，把一个很司空见惯的东西吹的天花乱坠。</li>



<li><strong>制造素材：</strong>我不能说“2200兆帕的什么超硬钢”这个东西是卖点了，那你这是一句话，你最后还是要把它做成图片，做成视频。这个图片还分不同的尺寸和大小，你每过一段时间大家会有审美疲劳的，你还要做新的。</li>



<li><strong>充值与设置预算：</strong>那就像广告平台（就像谷歌这些公司）充值，要把钱充进去，设置预算。</li>



<li><strong>设置投放范围与出价：</strong>我到底出多少钱来投放？1000次展示是一美金了。谷歌的推荐引擎，它会去到广告库里去比价格，谁出的价高我先放谁的。然后要设置覆盖范围：手机、YouTube、搜索页？印度还是美国？男的女的？</li>



<li><strong>投放优化：</strong>广告平台搜集用户画像，进行竞价排序，展示广告，消耗预算。</li>
</ol>



<p class="wp-block-paragraph">所以传统的互联网广告的门槛还是挺高的。能够找到卖点、能够做策划的人，价值就很高。中国人的传统技能就是做素材，对于老外来说基本上就是噩梦。中国人的超级极限玩法，成就了谷歌Meta。什么是超级极限玩法？我们把所有的利润都投成广告，一分钱都不剩下来，甚至还亏钱去投广告。这才是传统广告，它门槛非常非常高。</p>



<h2 class="wp-block-heading">AI带来的广告新场景：自动匹配与生成</h2>



<figure class="wp-block-image size-large"><img decoding="async" src="https://pictures.lukefan.com/google-ai-advertising-transformation-monetization/blog_5.JPEG" alt=""/></figure>



<p class="wp-block-paragraph">下面我们来看几个新的场景，这就是AI来带给我们的广告新场景。</p>



<h3 class="wp-block-heading">场景一：小众的手作香水</h3>



<p class="wp-block-paragraph">有一些香水是手工制作的，那商品肯定是一个非标准化的商品。比如说叫“雨后柏树冷杉”。用户偏好的信号，可能广告平台也收到了，最近在搜索“冷感木质香”、“不甜不腻”、“雨天味道”。他在YouTube里头，正好有一个展示机会了。那这个时候AI就会去匹配了。它会从商品的页面文案里头，包括配图和评论里边，抽出来木制、冷感、雨后这些词，<strong>它自动的生成一个素材，就直接给用户看了。</strong>看完了以后，就有可能能够促成一个交易。这是真正比较有意思的地方。</p>



<h3 class="wp-block-heading">场景二：极窄人群的跑鞋</h3>



<p class="wp-block-paragraph">比如说某小众品牌的跑鞋，主打的是前掌落地、低落差、宽楦，页面写的很散，参数也不全。用户的偏好，比如在谷歌上搜索了“前脚掌跑步的”、“膝盖不疼的鞋”，或者是“宽脚跑鞋”。最近在地图上，还搜索过半马训练的路线。这些数据被谷歌找到了，那它就会去进行匹配了。从跑鞋的测试文章、用户评论里边（宽楦、低落差、缓震偏硬），并且识别用户是训练型而非潮流型，它就会根据用户搜索的GE，直接给你生成对应的广告。那这个广告转化率就会非常非常高。</p>



<h3 class="wp-block-heading">场景三：宠物定制粮</h3>



<p class="wp-block-paragraph">比如说有一个商品，单一蛋白、没有谷物、还有低致敏，但是商家只写了一个“毛孩子吃了就不挠了”。用户的偏好是什么？他跑去搜索去了，说“我的猫频繁挠耳朵”、“换猫粮软便怎么办”；在论坛里头看到了“敏感肠胃猫粮”。这个时候AI又在干活了，就把这个挠痒、软便映射到了低致敏、单一蛋白上，并且把无谷成分透明作为卖点——这个卖点等于是AI替你找到了——然后制作了一条广告素材，强调单一蛋白加上低致敏试吃装，而不是泛泛的告诉你说猫粮打折这件事。</p>



<h2 class="wp-block-heading">AI时代的广告革命：更长的长尾与更高的转化</h2>



<figure class="wp-block-image size-large"><img decoding="async" src="https://pictures.lukefan.com/google-ai-advertising-transformation-monetization/blog_6.JPEG" alt=""/></figure>



<p class="wp-block-paragraph">这些场景代表的是什么意思？<strong>在AI时代，我们会迎来比互联网时代更长的长尾。</strong>互联网时代就已经很长尾了，但是AI时代里头，会有非常非常多小众的需求被满足。</p>



<p class="wp-block-paragraph">充值跟预算你还是必不可少的。但是谷歌会干什么？</p>



<ul class="wp-block-list">
<li><strong>商品自动入库：</strong>谷歌就直接把你的商品库全都扒走了，根据你的商品的各种描述、用户评论，通通都拎出来作为你的商品特性，AI系统会自动的总结关键卖点和差异性。</li>



<li><strong>更深度的用户理解：</strong>通过将用户留存在搜索页面上，在AI聊天窗口里，可以进一步的了解用户的属性，包括用户的各种长期记忆。AI系统绝对比我们自己还了解我们自己，更多的广告展示机会就来了。</li>



<li><strong>更大的竞价商品池：</strong>现在我不用你们去想这个卖点，也不用你们去做素材，我替你们搞，可以参与竞价的商品一下就变多了。那他就可以挑一个更贵的去给你展示，我挣到更多的钱。</li>



<li><strong>自动生成素材：</strong>不需要再设置详细的投放参数和范围了，由AI系统直接搞定。你原来没有做视频，谷歌替你做。</li>



<li><strong>更高的广告转化率：</strong>当你的广告转化率上升了以后，广告主就会愿意为你的广告设置更高的单价。</li>
</ul>



<p class="wp-block-paragraph">从谷歌的财报上，是可以看出端倪的。它的整个的CPC（付费有效点击）涨了7%，总收入涨了12%。既然有效点击涨了7%，总收入涨12%的话，那就是广告单价上升了。广告主为什么愿意支付更高的广告单价？因为每次展示的时候，参与竞价的商品更多了，而且转化率也更高了，他就会成形成一个正向循环。</p>



<h2 class="wp-block-heading">黑五战报的启示</h2>



<figure class="wp-block-image size-large"><img decoding="async" src="https://pictures.lukefan.com/google-ai-advertising-transformation-monetization/blog_10.JPEG" alt=""/></figure>



<p class="wp-block-paragraph">今年黑五的战报上，也可以看出相应的差异了。美国黑五的战报今年特别有趣，<strong>订单量下降了1%，但是平均价格涨了8%。</strong></p>



<p class="wp-block-paragraph">这是什么意思？就是黑五钱更多了，但是东西更少了，每样东西都变更贵了。那你说为啥？最直接的一个原因，川大爷玩关税战。但是关税战给价格带来的平均涨幅是4.9%，剩下的3%左右的这个价格涨幅去哪了？是不是商家当利润揣口袋里了？不要太天真，卖东西的都是中国人，中国人挣出来利润，哪舍得往自己口袋里装？<strong>都给谷歌了，都给Meta了，都去交广告费去了。这才是事实的真相。</strong></p>



<h2 class="wp-block-heading">谷歌价值的三个层面</h2>



<p class="wp-block-paragraph">谷歌的价值，其实我们应该分三层去理解。</p>



<ol class="wp-block-list">
<li><strong>技术领先：</strong>谷歌的Gemini确实遥遥领先了，TPU也确实是实现了全生态。而且现在已经开始向OpenAI、Meta以及Anthropic进行溢出了。</li>



<li><strong>全场景渗透：</strong>用户量和广泛的用户场景，正在快速的被Gemini渗透。谷歌有安卓、Chrome、搜索、YouTube、Gmail等，谷歌现在正在用自己的AI的大模型，把所有产业链上，或者所有用户场景都重新做一遍。每一个场景的应用，都会给谷歌带来巨大的用户流量以及用户留存。</li>



<li><strong>底层逻辑重构：</strong>谷歌的底层逻辑，从岌岌可危到了重新被验证。现在看广告联盟确实是完了，但是搜索广告起来了，而且广告还是未来的方向。</li>
</ol>



<h2 class="wp-block-heading">AI时代的未来：交易与内容</h2>



<figure class="wp-block-image size-large"><img decoding="async" src="https://pictures.lukefan.com/google-ai-advertising-transformation-monetization/blog_7.JPEG" alt=""/></figure>



<p class="wp-block-paragraph">那么AI时代以后到底会是什么样子？我相信大家还是要去努力工作的。更多小众的、细节的、长尾的交易，将得到推荐，将被发现，并且有交付的机会。</p>



<p class="wp-block-paragraph">真正在消费价值中不断上升的，其实是<strong>内容</strong>。这个内容包括什么？包括你们现在在看我YouTube的节目，这就是一个内容。我做了，你们看了，广告也播放了，相应的交易也被执行了，那我就分到钱了。所有被传播的内容都会被标价，进行售卖。大家买到的东西会越来越贵，因为你GDP上升了吧，你吃的粮食不会变多，但你值那怎么办？只能让粮食变贵。那多出来的钱是什么？<strong>多出来的钱就是广告费，广告费会分给内容创作者。</strong></p>



<p class="wp-block-paragraph">AI让以前无法实现的生意可以实现了，让天下没有难做的生意。还记得前面我讲豆包手机那期吗？目的跟方法是有差异的。</p>



<ul class="wp-block-list">
<li>微信是个方法，跟人聊天才是目的。</li>



<li>谷歌也终于搞明白了，他们要实现的<strong>目的是交易，而不是搜索。</strong></li>
</ul>



<p class="wp-block-paragraph">交易与交付才是最终的目的。原来的搜索仅仅是方法。AI会改变方法，但是不会改变目的。AI不仅仅擅长编故事，还擅长进行非标准的匹配。AI做了匹配以后，就可以将故事以及附带在故事上面的交易做完。原来的方法崩塌了——就是搜索以及让你到网站上去看广告这个方法已经崩塌了——被AI颠覆了。</p>



<h2 class="wp-block-heading">总结</h2>



<figure class="wp-block-image size-large"><img decoding="async" src="https://pictures.lukefan.com/google-ai-advertising-transformation-monetization/blog_8.JPEG" alt=""/></figure>



<p class="wp-block-paragraph">AI时代商品经济依然是无可替代的。人们要为了享受更好的商品和服务，继续努力劳作，不可能说直接给你发钱你就可以不干活了。人们也要通过交易，筛选出更好的产品和服务，让科技商业和社会找到未来的方向。</p>



<p class="wp-block-paragraph">我一直觉得交易这件事情，才是推动整个社会前进的一个最核心的点。竞争的过程，就是要把那个最好的挑出来，要告诉社会我们要向哪个方向发展。而在整个的这个过程中，谷歌现在已经验证了，说OK这条路还是走得通的。这条路还是走得通的。当然了，这些靠谷歌广告的这些网络广告商，他们的日子确实会难做一点点。但是这些人也要重新去思考，说我再做一点什么样的新的内容，能够重新符合新的这种运作模式。</p>



<p class="wp-block-paragraph">这个才是今天我们要讲的故事：<strong>就是谷歌为AI后时代指明了方向，会把这个广告整个干掉，却让交易更高效地发生。</strong></p>



<p class="wp-block-paragraph">背景图片：<br><strong>high-contrast watercolor illustration, massive cross-border logistics warehouse during Christmas season, towering staggered shelves cluttered yet orderly, autonomous logistics robots gliding on tracks carrying goods, scattered computer workstations where designers create Christmas advertising materials, cargo boxes wrapped in festive red packaging, warm yellow spotlights mounted on the ceiling casting a cozy holiday glow throughout, neon cyan rimlight, deep navy background, glossy reflections on surfaces, sharp subject separation, extremely legible negative space for text overlay, minimal palette of ink blue neon cyan and gold accents, cinematic composition, ultra-detailed, intricate linework, &#8211;ar 16:9 &#8211;raw &#8211;s 250 &#8211;v 7.0 &#8211;p lh4so59</strong></p>



<figure class="wp-block-image size-large"><img decoding="async" src="https://pictures.lukefan.com/google-ai-advertising-transformation-monetization/background_1.JPEG" alt=""/></figure>



<figure class="wp-block-image size-large"><img decoding="async" src="https://pictures.lukefan.com/google-ai-advertising-transformation-monetization/background_2.JPEG" alt=""/></figure>



<figure class="wp-block-image size-large"><img decoding="async" src="https://pictures.lukefan.com/google-ai-advertising-transformation-monetization/background_3.JPEG" alt=""/></figure>



<figure class="wp-block-image size-large"><img decoding="async" src="https://pictures.lukefan.com/google-ai-advertising-transformation-monetization/background_4.JPEG" alt=""/></figure>



<figure class="wp-block-image size-large"><img decoding="async" src="https://pictures.lukefan.com/google-ai-advertising-transformation-monetization/background_5.JPEG" alt=""/></figure>
]]></content:encoded>
					
		
		
			</item>
		<item>
		<title>游戏天才到诺奖得主，他凭什么断言AGI只差临门一脚？揭秘哈萨比斯开挂人生背后的逻辑｜Demis Hassabis、Google DeepMind、AGI 时间表、5到10年</title>
		<link>https://lukefan.com/2025/12/10/demis-hassabis-deepmind-agi-challenges-world-model-agents/</link>
		
		<dc:creator><![CDATA[Luke Fan]]></dc:creator>
		<pubDate>Wed, 10 Dec 2025 00:58:24 +0000</pubDate>
				<category><![CDATA[AIGC]]></category>
		<category><![CDATA[Google的故事]]></category>
		<category><![CDATA[5到10年]]></category>
		<category><![CDATA[AGI]]></category>
		<category><![CDATA[AGI 时间表]]></category>
		<category><![CDATA[AI Agent]]></category>
		<category><![CDATA[AI突破]]></category>
		<category><![CDATA[AI路线图]]></category>
		<category><![CDATA[AI进展]]></category>
		<category><![CDATA[AI预测]]></category>
		<category><![CDATA[AlphaFold]]></category>
		<category><![CDATA[AlphaGo]]></category>
		<category><![CDATA[Axios AI峰会]]></category>
		<category><![CDATA[Demis Hassabis]]></category>
		<category><![CDATA[Gemini]]></category>
		<category><![CDATA[Gemini 3]]></category>
		<category><![CDATA[Google Deepmind]]></category>
		<category><![CDATA[世界模型]]></category>
		<category><![CDATA[人类水平AI]]></category>
		<category><![CDATA[大模型局限]]></category>
		<category><![CDATA[强化学习]]></category>
		<category><![CDATA[德米斯·哈萨比斯]]></category>
		<category><![CDATA[技术挑战]]></category>
		<category><![CDATA[持续学习]]></category>
		<category><![CDATA[智能体系统]]></category>
		<category><![CDATA[蛋白质折叠]]></category>
		<category><![CDATA[认知神经科学]]></category>
		<category><![CDATA[诺贝尔奖得主]]></category>
		<category><![CDATA[谷歌AI]]></category>
		<category><![CDATA[谷歌大脑]]></category>
		<category><![CDATA[通用人工智能]]></category>
		<category><![CDATA[长期规划]]></category>
		<guid isPermaLink="false">https://lukefan.com/?p=3119</guid>

					<description><![CDATA[🔥家人们！谷歌AI掌门人刚刚放话：AGI（通用人工智能）只剩俩Alpha Go级别的突破了！5-10年？我直接笑死，这哥们德米斯·哈萨比斯简直是人类版“爽文男主”💥

7岁国际象棋大师，8岁用奖金买电脑写代码，诺奖都上手了！Alpha Go算啥？他顺手搞出Alpha Fold预测蛋白质，直接拿诺奖化学奖，还把谷歌大脑干趴了，现在Gemini 3在他手里帅炸——问《搏击俱乐部》戒指象征啥？人家秒答“抛开身份，极端蜕变”，绝不哄你开心，高冷又自信！🤯（不像某GPT，说错就秒怂“对不起”🤣）

谷歌为啥这么狂？全程科研“怪兽模式”🛒——人才多到像中国吃西瓜（全球70%！），多路并行砸钱：世界模型搞虚拟宇宙，智能体直接替你写PPT、规划旅行！难点？AI还不会跨对话记事（忘记你叫老范就离谱），但突破在即💥兄弟们押注5年内AGI？我赌一包辣条，谷歌又要杀疯！

👉点赞的今年AI帮你写年终总结！评论区喊“冲AGI”，抽3人送Gemini 3黑科技体验～（别卷了，这赛道我直接躺赢！）💯 #AI未来已来 #谷歌杀疯了

标题1：诺奖得主震撼预测：AGI并非遥不可及，仅差最后两项AlphaGo级突破，5到10年内将至？｜通用人工智能、Demis Hassabis、Google DeepMind、AGI 时间表
标题2：谷歌模式VS普通公司：当别家还在追热点，谷歌已用怪物级投入锁定AGI终局，未来胜负已分？｜Google DeepMind、AGI 时间表、5到10年、人类水平AI
标题3：别再盲目乐观！谷歌CEO亲承Gemini仍有4大死穴，持续学习与长期规划难题不解决，AGI就是空谈｜技术挑战、AI突破、AI进展、Gemini、AI路线图
标题4：从游戏天才到诺奖得主，他凭什么断言AGI只差临门一脚？揭秘哈萨比斯开挂人生背后的逻辑｜Demis Hassabis、Google DeepMind、AGI 时间表、5到10年
标题5：通往AGI的最后两块拼图已锁定！DeepMind CEO首次公开具体路线：搞定世界模型与智能体系统就够了｜通用人工智能、Demis Hassabis、AI路线图、AI突破
简介：Google DeepMind CEO Demis Hassabis 在Axios AI峰会投下震撼弹：实现通用人工智能（AGI）仅需5到10年，关键在于攻克“世界模型”与“智能体系统”两大技术挑战。这究竟是基于Gemini成功的乐观预测，还是忽略了AI发展的核心风险？本期将深入解读哈萨比斯给出的AGI时间表，以及这位诺奖得主为何有此底气。]]></description>
										<content:encoded><![CDATA[
<figure class="wp-block-embed is-type-video is-provider-youtube wp-block-embed-youtube wp-embed-aspect-16-9 wp-has-aspect-ratio"><div class="wp-block-embed__wrapper">
<iframe loading="lazy" title="通往AGI的最后两块拼图已锁定！DeepMind CEO首次公开具体路线：搞定世界模型与智能体系统就够了｜通用人工智能、Demis Hassabis、AI路线图、AI突破" width="900" height="506" src="https://www.youtube.com/embed/uZUI2kPjrNk?feature=oembed" frameborder="0" allow="accelerometer; autoplay; clipboard-write; encrypted-media; gyroscope; picture-in-picture; web-share" referrerpolicy="strict-origin-when-cross-origin" allowfullscreen></iframe>
</div></figure>



<figure class="wp-block-image size-large"><img decoding="async" src="https://pictures.lukefan.com/demis-hassabis-deepmind-agi-challenges-world-model-agents/blog_1.JPEG" alt=""/></figure>



<h1 class="wp-block-heading">谷歌Deepmind的CEO说：“我们与AGI之间，只差一到两个AlphaGo级别的技术难关了。”</h1>



<p class="wp-block-paragraph">大家好，欢迎收听<a href="https://youtube.com/@StoryTellerFan" target="_blank" rel="noopener">老范讲故事的YouTube频道</a>。</p>



<p class="wp-block-paragraph">现在Gemini 3正在大杀四方，谷歌里面负责开发Gemini的部门叫Deepmind，他的CEO出来接受访谈，关注度还是比较高的。</p>



<p class="wp-block-paragraph">谷歌Deepmind的首席执行官叫德米斯·哈萨比斯，2025年12月4日接受了一个访谈，是在旧金山举行的Axios AI大会。和他对谈的人呢，是Axios的创始人和主编，叫Mike Allen。在这上面他讲到说，我们距离AGI还差一到两个类似于AlphaGo这样级别的突破，突破过去就可以了。</p>



<h2 class="wp-block-heading">哈萨比斯：爽文男主般的开挂人生</h2>



<figure class="wp-block-image size-large"><img decoding="async" src="https://pictures.lukefan.com/demis-hassabis-deepmind-agi-challenges-world-model-agents/blog_2.JPEG" alt=""/></figure>



<p class="wp-block-paragraph">哈萨比斯到底是一个什么样的人呢？绝对的爽文男主，挂b一样的存在。</p>



<h3 class="wp-block-heading">从国际象棋神童到认知神经科学博士</h3>



<figure class="wp-block-image size-large"><img decoding="async" src="https://pictures.lukefan.com/demis-hassabis-deepmind-agi-challenges-world-model-agents/blog_3.JPEG" alt=""/></figure>



<p class="wp-block-paragraph">哈萨比斯是一个英国人，Deepmind本身是一个英国公司，后来被谷歌收购的。他呢，76年在伦敦出生，这个姓氏是个希腊姓氏。他的父亲呢，是来自塞浦路斯的希腊裔，而他的母亲呢，是来自于新加坡的华裔。所以哈萨比斯呢，可以算是半个华人。</p>



<p class="wp-block-paragraph">从小，这哥们是一个国际象棋神童。像这样的人，肯定都是有异于常人之处。4岁就开始下棋，13岁就达到了国际象棋大师水准。8岁就用自己的国际象棋奖金，给自己买了台电脑，开始学习编程了。</p>



<p class="wp-block-paragraph">本科和硕士呢都是剑桥的，学的CS就是计算机科学，在校期间一直代表剑桥参加各种国际象棋比赛。博士呢是伦敦大学学院，专业方向是认知神经科学和神经科学。</p>



<span id="more-3119"></span>



<h3 class="wp-block-heading">从游戏制作人到AI先驱</h3>



<figure class="wp-block-image size-large"><img decoding="async" src="https://pictures.lukefan.com/demis-hassabis-deepmind-agi-challenges-world-model-agents/blog_4.JPEG" alt=""/></figure>



<p class="wp-block-paragraph">工作，这哥们一开始做游戏的。先去加入了很著名的牛蛙工作室，这个牛蛙工作室呢，最著名的作品叫做《地下城守护者》。但是哈萨比斯当时进去的时候，应该还没有开发这个产品，牛蛙工作室最终是被EA给收购了。后来呢，他自己创建了一个工作室接着做游戏，叫做仙丹工作室。2004年出了一个游戏叫《邪恶天才》，是一个模拟经营游戏，就是一帮邪恶天才在一个小岛上做各种各样坏事的这样的一个游戏。只是呢，这个游戏并不怎么挣钱，这种超级天才做出来的游戏都未必能挣钱。</p>



<p class="wp-block-paragraph">他呢就把工作室关掉了。后来呢，《邪恶天才》的IP被收购了，2021年《邪恶天才2》发布，但是呢，《邪恶天才2》就已经跟哈萨比斯没有什么关系了。</p>



<p class="wp-block-paragraph">关闭这个游戏工作室之后，他就去创建了Deepmind。Deepmind主要还是游戏方向，他呢在里边去训练AI下围棋。这哥们是个国际象棋大师，但是呢开始训练AI下围棋，也就是AlphaGo这个东西就出来了。在这中间呢，还训练AI去打各种游戏，星际争霸呀，做一些其他这样的训练。</p>



<h3 class="wp-block-heading">收购、AlphaFold与内部整合</h3>



<figure class="wp-block-image size-large"><img decoding="async" src="https://pictures.lukefan.com/demis-hassabis-deepmind-agi-challenges-world-model-agents/blog_5.JPEG" alt=""/></figure>



<p class="wp-block-paragraph">2014年，Deepmind就被谷歌给收购了，6.5亿美金的价格。但是这个数字呢，并不是特别统一，很多的报道里的这个数字是有一些偏差的。有人说是4亿美金，也有人说是6.5亿美金，还有人说是4亿英镑。因为收购的时候，谷歌自己并没有公布价格，这些价格呢都是后续的报道里边去写的。</p>



<p class="wp-block-paragraph">在谷歌收购以后呢，哈萨比斯在Deepmind里头又开发了叫AlphaFold这样的一个产品。这个产品是解决蛋白质折叠难题的。蛋白质实际上是这种超大分子，这些超大分子，我们算清楚有多少碳、多少氢、多少氧、还有氮，它并不是一个平面的结构，它是一个立体的结构，3D的。在这样的一个结构里头，它到底是怎么去排列和折叠的呢？原来大家是去预测呀、去猜呀，或者通过一些很复杂的设备去进行扫描，通过这样的方式去识别，成本是很高的。你要想去用蛋白质开发各种药品，你就必须要搞清楚它的3D架构空间，你搞不清楚，这事没法往前走。</p>



<p class="wp-block-paragraph">哈萨比斯就去搞了AlphaFold，用AI去预测蛋白质的3D折叠空间到底是怎么回事。2020年呢，这个AlphaFold在蛋白质预测大赛中夺得头筹，比第二名强好几倍，这个事基本上就算解决了。现在只要是知道这个蛋白质的分子结构，这个AlphaFold的预测结果就极其准确。2024年，哈萨比斯依靠这个AlphaFold获得了诺贝尔化学奖，这哥们是个诺贝尔奖得主。</p>



<p class="wp-block-paragraph">这还没完，他呢还在内部斗争中战胜了谷歌大脑。这是一个什么故事呢？谷歌内部一直是有两个AI部门的，一个是Deepmind，另外一个叫谷歌大脑，相互内斗，相互争夺资源。直到什么时候呢？直到ChatGPT出来，三年前谷歌拉响了红色警报，说不能再这样了，你们俩两家打来打去，这个不行了。那怎么办呢？最终是Deepmind合并了谷歌大脑，所以现在整个的谷歌AI是由Deepmind来去负责的，由哈萨比斯来去管理。</p>



<p class="wp-block-paragraph">现在的Gemini 3使用的技术，大多都是原来谷歌大脑研究的方向：Transformer、大语言模型都是那边研究的。而Deepmind呢，原来在英国这帮人研究的呢，就是AlphaGo、AlphaZero（AlphaZero是AlphaGo之后的一个下棋的模型）以及各种可以自动玩游戏的AI产品，还有呢就是AlphaFold，做这个蛋白质分析的。</p>



<p class="wp-block-paragraph">哈萨比斯除了是Deepmind的CEO之外，他自己还有一间专门做药的公司，专门用AlphaFold去做蛋白质研究，做各种新创新药的公司，他也是那个公司的创始人。所以哈萨比斯管理了整个的谷歌AI方向，以及谷歌Gemini这个产品化方向，都是归他管的。所以，爽文人生，绝对没有任何问题吧？</p>



<h2 class="wp-block-heading">通往AGI之路：还差哪两个AlphaGo级别的突破？</h2>



<figure class="wp-block-image size-large"><img decoding="async" src="https://pictures.lukefan.com/demis-hassabis-deepmind-agi-challenges-world-model-agents/blog_6.JPEG" alt=""/></figure>



<p class="wp-block-paragraph">哈萨比斯认为，我们距离AGI到底还差哪两个AlphaGo级别的突破呢？他自己做AlphaGo的，所以AlphaGo到他这儿变成了一个衡量单位，再出现两次AlphaGo这样的突破，我们就达到AGI了。</p>



<h3 class="wp-block-heading">Gemini 3的惊人进展</h3>



<figure class="wp-block-image size-large"><img decoding="async" src="https://pictures.lukefan.com/demis-hassabis-deepmind-agi-challenges-world-model-agents/blog_7.JPEG" alt=""/></figure>



<p class="wp-block-paragraph">他呢首先讲到Gemini 3，现在确实让人震惊，已经从文本专家变成了多模态理解系统了。他举了一个案例，说有一个电影叫《搏击俱乐部》，主角上去打斗之前把戒指摘下来了。他就去问这个Gemini，说这代表什么意思。它没有告诉你把戒指摘了就完了，而是告诉你说，这是主角抛开了身份、摆脱了规则的象征，是角色从现实到极端的转变。这个确实挺让人震惊的，这个Gemini 3模型有了自己的判断，不再只是迎合了。</p>



<p class="wp-block-paragraph">到GPT这儿，你说你错了，它就会说“对不起，我错了”。到Gemini 3上，你说你错了，它会很耐心地给你解释，或者跟你去讨论这个事，是不会直接承认的。说Gemini 3的性格，叫“简洁，冷静，有自信，不讨好”。这个是哈萨比斯自己作为一个科学家，非常非常喜欢Gemini 3的一个地方。</p>



<p class="wp-block-paragraph">而且Gemini 3呢，现在已经从生成内容，在向着打造产品的方向前进了。我们现在使用Gemini 3去做PPT，去做简单的应用原型，效果已经非常好了。它已经可以去执行一个比较简短的、连续的这种AI agent的工作了，这个是Gemini 3真正强的地方。</p>



<h3 class="wp-block-heading">大模型当前面临的难题</h3>



<figure class="wp-block-image size-large"><img decoding="async" src="https://pictures.lukefan.com/demis-hassabis-deepmind-agi-challenges-world-model-agents/blog_8.JPEG" alt=""/></figure>



<p class="wp-block-paragraph">哈萨比斯说了，现在的大模型还是有很多问题没法解决的。</p>



<ol class="wp-block-list">
<li><strong>不具备持续学习的能力。</strong>很多人都在担心，说我跟大模型聊了半天，是不是大模型就拿聊天的结果回去做训练去了。其实有时候确实他干，但主要做的是什么呢？就是强化学习。因为我们跟Gemini聊天，他经常会出俩答案让你挑一个，你在挑选的时候呢，实际上就已经在开始帮助大模型进行训练了。但是搜索的结果、我生成的内容、我提出的问题，我让这些东西去进入到大模型里头去进行训练的话，这个是不行的。大模型必须要进行数据筛选，然后才能训练。日常的这些内容，你拿去训练大模型的话，大模型可能会越训越笨的，特别是很多互联网上的垃圾信息，你塞到大模型里去训练，根本就没有办法达到预期的效果。所以大模型是没有办法自己去找内容去训练的，还是需要人先去提出要求，然后去进行数据清洗、数据处理。现在都是由大模型根据原始数据，再去生成最后的预训练数据，然后才能再去训练。所以这个事情，还没有办法让大模型自己去干，这是第一个问题。</li>



<li><strong>无法执行长期的规划。</strong>虽然现在Gemini 3已经可以走一个一两个小时的规划，它还是能够走完的。但是你说我这有一个很多步骤，还是并行的，这种步骤需要去执行，执行完了以后需要连续执行几天、甚至几个月的这种任务，这个Gemini 3还搞不定。现在谁都搞不定这个事情。所以现在人去使用大模型，我们还需要自己去理解问题、自己去拆解问题，然后把这个拆解好的问题扔给大模型，而在对大模型的结果进行确认和验证之后，再把结果拼凑起来，让大模型去做下一步。它没有办法说你一开始给他个要求就做出来，“上帝说有光，于是就有了光”，这个事现在还做不到。</li>



<li><strong>智能体系统很不稳定。</strong>为什么它没法连续干下去？就是它可能干着干着就跑偏，而且跑偏的过程中呢，自己不知道跑偏。在这个过程中，就有可能会浪费大量的TOKEN和算力，最后呢得出一个完全不可用或者说有害的一个结果出来。这个是目前为止大模型无法避免的问题。</li>



<li><strong>缺乏跨对话的稳定记忆。</strong>现在大模型已经开始有记忆了，但是大量的记忆呢，还是在对话内的。而对话外的这种记忆，就是跨对话的记忆呢，它也不是说没有，像ChatGPT也好、Gemini也好，都是有一些跨对话记忆的。但是呢，这个记忆的空间都很小，你不可能说让他记很多的东西，然后跟你进行跨对话的去聊天。为什么呢？对于计算机来说吧，让它记住什么事是非常非常容易的，往硬盘里写不就记住了吗？但是让它忘掉是很难的。到底应该记住哪一部分、忘掉哪一部分，在下一次工作的时候我应该使用其中的哪部分去参与工作，这件事是非常难去抉择的。这就是大模型跨对话记忆的这个难点。所以他讲的，现在缺乏跨对话的稳定记忆，就是你让他记住可以，但是呢不一定下次就想起什么事来，可能他会找一个完全不相关的知识点，就参与到你这一次新的对话里去了。现在我们使用大模型的方式还是比较简单粗暴的，你发现讲着讲着驴唇不对马嘴了，怎么办？开始新话题，就是把原来的记忆都清干净。我们开始一个新的，甭管是Gemini也好，还是ChatGPT也好，它会有一些跟我们个人相关的这种个性化记忆。比如说我就告诉这个ChatGPT：“你记住了，我叫老范，我是个Youtuber，每天都要做什么事情。你要给我去总结信息，或者我要找你提问题，你要先去经过验证才能给我。”就这些玩意，我是可以让他记住的。但是如果你给他特别多的东西让他记，或者说我们在整个的聊天过程中让他把所有聊天内容都记下来，他就没法干活了。</li>
</ol>



<h3 class="wp-block-heading">两大关键突破点</h3>



<figure class="wp-block-image size-large"><img decoding="async" src="https://pictures.lukefan.com/demis-hassabis-deepmind-agi-challenges-world-model-agents/blog_9.JPEG" alt=""/></figure>



<p class="wp-block-paragraph">这些问题关键的突破点是什么呢？咱们前头讲了两个关键突破点。</p>



<ul class="wp-block-list">
<li><strong>世界模型：</strong>让AI理解物理世界的运行规律，这个是非常重要的。Deepmind内部呢，有一个叫Genius模型（天才模型），这呢是一个世界模型，通过物理一致性和时间连贯性生成虚拟世界，最后输出视频的。大方向上呢，跟李飞飞的方向是比较接近的。但是Deepmind的这个模型，是更接近于游戏世界一点点。这个哈萨比斯，不愧是从游戏公司里出来的，人生的第一份工作都是对一个人有重要的作用的。</li>



<li><strong>智能体系统：</strong>现在Gemini虽然也算是智能体，但是距离智能体系统还是有一些差距的。什么是智能体系统？就是从回答问题到完成任务。现在Gemini依然是在回答问题。他说未来呢，Gemini会嵌入眼镜、工作场景和工作流里面，能够记忆、推理或者是代办，不再只是回答问题，而是直接完成各种各样的任务。你让他做一个什么事的，切咔切咔给你做完了。可以自主规划、执行任务，并且根据结果调整的这种稳定的智能系统，这就是未来方向。</li>
</ul>



<p class="wp-block-paragraph">所以呢，两个AlphaGo级别的突破，一个是世界模型，第二个是智能体系统。</p>



<h2 class="wp-block-heading">谷歌：科研领域的“怪物”</h2>



<figure class="wp-block-image size-large"><img decoding="async" src="https://pictures.lukefan.com/demis-hassabis-deepmind-agi-challenges-world-model-agents/blog_10.JPEG" alt=""/></figure>



<p class="wp-block-paragraph">讲到这儿，要再跟大家啰嗦几句。其实大部分的科技公司，是无法想象谷歌的运作方式的，就像是大部分国家的人也无法想象中国是一个什么样的存在，是一样的。</p>



<p class="wp-block-paragraph">中国的这种存在方式呢，联合国里边专门有一个效应，叫“中国效应”，就是各种统计的时候，一定要把中国排出去。为什么？因为你一旦把中国加上，所有统计数据就没有任何意义了。咱们举一个最简单的例子，吃西瓜。全世界的人都没法想象中国人到底一年吃多少西瓜，咱本身人就多，咱们一年大概吃全世界70%的西瓜。你把这个统计起来，全世界每个国家大家平均吃多少西瓜，你把中国算进去，这事没法算了。包括像什么发电、炼钢，只要是跟制造相关的，你就不能把中国搁里头统计，因为这个完完全全是另外一个维度了，它会让整个的统计结果完全失衡。中国属于是全产业链内卷，而且全产业链都产能过剩的一个国家。</p>



<p class="wp-block-paragraph">谷歌呢，在科研上就有点像中国在产业链上的这个状态，很多方面呢都会尝试和探索。谷歌呢，具有非常高的人才密度、充足的科研经费，还有海量的数据，这个是缺一不可。而且呢，这些科研团队，他们的时间压力也不是很高，大家就自己按照自己的喜好去研究就行了。他们还在不断的收购新的、最前沿的公司，Deepmind就是买回来的嘛。</p>



<p class="wp-block-paragraph">谷歌在AI领域里头，同时在探索强化学习（AlphaGo、AlphaZero这些产品）、认知架构、神经科学建模，以及Transformer大语言模型，这些都在研究。不是说我们觉得哪块有机会了，我就往这一个方向去研究。我记得特别清楚，我进入盛大网络参加入职培训的时候，他们就跟我讲说：“全世界只有一种游戏，这种游戏叫MMORPG，其他都不行。”后来我说那我们玩的其他游戏，他们说：“那些游戏不挣钱，我们不研究那个，我们只研究这一个最挣钱的。”这其实是大部分的公司的思考方式，我们既然已经证明了这玩意挣钱，其他的不挣钱，那咱就研究这就完了，特别很多中国公司是喜欢走这条路的。</p>



<p class="wp-block-paragraph">但是谷歌不，它是所有的方向都要去试一试。而且很多方向呢，你都不知道什么时候能挣回钱来，他也要去试一试，比如说量子计算。前面咱们还专门讲过谷歌的量子计算是怎么回事。很多的这种科技成果，都没有办法给谷歌挣钱，也没有办法在谷歌内部取得成绩，很多人最终是离开了谷歌才创业成功的。现在的AI行业里头，创始人或者是创始的核心团队，大多都在谷歌混过。所以现在我们所看到的AI行业，或者叫AI革命，你基本上可以认为是一帮从谷歌出来的人在去折騰这个事情。</p>



<p class="wp-block-paragraph">中国呢老说自己是“睡狮”，一旦被吵醒了会很吓人的。谷歌在科研领域里头，其实也是这么回事。拉一次红色警报，就有可能拎出像Gemini 3这样的大杀器出来吓唬人。现在Gemini 3火了，但是谷歌依然不会去收敛方向，照着唯一正确的方向前进，这不是谷歌的路子。谷歌的路子是什么？还是全面探索，严格追踪数据表现，保留多个可能性，并且不断验证。</p>



<p class="wp-block-paragraph">普通公司能够解决当前的问题，预言一个未来的热门方向——大家注意，不热门他不去干，去一定是热门方向——他们才会愿意说我花一点精力、花点钱去折腾。像谷歌这个，都是这么多方向，哪块云彩下雨都不知道，到底什么时候做出来也不知道，就开始撒人、撒钱进去干活去了。在普通公司里头，能够去预言一个热门方向的，就已经算是很强的了。大量的都是别人做出来，特别是谷歌做出来，他在后边再接着跟着改。而且这些公司实在是搞不清楚什么是热门方向，或者热门方向搞不定怎么办？还有一条最简单的路：上谷歌挖人，或者直接从谷歌出来创业。这个就是普通公司跟谷歌之间的差异。所以谷歌呢，在科研领域里头完完全全就是一个怪物。</p>



<h2 class="wp-block-heading">总结与展望</h2>



<p class="wp-block-paragraph">好，最后总结一下吧。谷歌Deepmind的CEO哈萨比斯，携Gemini 3成功之势参加了Axios AI大会，说再有一到两个AlphaGo级别的突破，就可以实现AGI了。这两个是什么呢？就是世界模型以及智能体系统。可能要5到10年，把这两个实现了以后，我们就达到AGI了。</p>



<p class="wp-block-paragraph">本节目的特点，咱们八卦了一下哈萨比斯的开挂人生，也稍微介绍了一下谷歌这个绝对的科研领域的怪物。我们也希望谷歌，以及所在谷歌里头工作过的这些人，未来还会给我们带来更多的惊喜。</p>



<hr class="wp-block-separator has-alpha-channel-opacity"/>



<p class="wp-block-paragraph">好，这个故事就讲到这里，感谢大家收听。请帮忙点赞、点小铃铛、参加<a href="https://discord.gg/ppKsNkttTv" target="_blank" rel="noopener">DISCORD讨论群</a>，也欢迎有兴趣、有能力的朋友加入我们的<a href="https://www.youtube.com/channel/UCUGLhcs3-3y_yhZZsgRzrzw/join" target="_blank" rel="noopener">付费频道</a>。再见。</p>
]]></content:encoded>
					
		
		
			</item>
		<item>
		<title>谷歌一出手，OpenAI的“凛冬”真来了？山姆·奥特曼内部备忘录罕见示弱，承认可能暂时落后｜Google vs OpenAI、AI Race、Google、OpenAI</title>
		<link>https://lukefan.com/2025/11/25/google-ai-gemini-nano-threatens-openai-model-as-app-startup-strategy/</link>
		
		<dc:creator><![CDATA[Luke Fan]]></dc:creator>
		<pubDate>Tue, 25 Nov 2025 01:18:11 +0000</pubDate>
				<category><![CDATA[AIGC]]></category>
		<category><![CDATA[Google的故事]]></category>
		<category><![CDATA[AI]]></category>
		<category><![CDATA[AI Agent]]></category>
		<category><![CDATA[AI Competition]]></category>
		<category><![CDATA[AI Dominance]]></category>
		<category><![CDATA[AI Ecosystems]]></category>
		<category><![CDATA[AI Race]]></category>
		<category><![CDATA[AI strategy]]></category>
		<category><![CDATA[AI创业公司]]></category>
		<category><![CDATA[AI开发者]]></category>
		<category><![CDATA[Anti-gravity IDE]]></category>
		<category><![CDATA[ChatGPT]]></category>
		<category><![CDATA[Future of AI]]></category>
		<category><![CDATA[Gemini]]></category>
		<category><![CDATA[Gemini 3 Pro]]></category>
		<category><![CDATA[Google]]></category>
		<category><![CDATA[Google TPU]]></category>
		<category><![CDATA[Google vs OpenAI]]></category>
		<category><![CDATA[Nano Banana Pro]]></category>
		<category><![CDATA[OpenAI]]></category>
		<category><![CDATA[Startups]]></category>
		<category><![CDATA[人工智能]]></category>
		<category><![CDATA[凛冬将至]]></category>
		<category><![CDATA[大模型]]></category>
		<category><![CDATA[大模型评测]]></category>
		<category><![CDATA[山姆奥特曼]]></category>
		<category><![CDATA[微信式逆袭]]></category>
		<category><![CDATA[模型即应用]]></category>
		<category><![CDATA[行业变革]]></category>
		<category><![CDATA[谷歌AI]]></category>
		<guid isPermaLink="false">https://lukefan.com/?p=3010</guid>

					<description><![CDATA[🔥老铁们！OpenAI掌门人Sam Altman连夜哭晕：“凛冬将至”❄️ 而Google新出Gemini 3 Pro+Nano Banana Pro直接掀桌打脸——这哪是模型升级？纯纯AI界“灭霸打完响指”啊！💥

实测爆笑：让Nano Banana Pro设计北京宫廷宴菜单🍗，它秒出0翻车神作！老北京炸酱面+烤鸭精致到流泪；反观某国产4.0…宫保鸡丁乱入现场（川菜混进宫宴？笑裂🤣），京酱肉丝硬画成红烧肉块…根本不懂“肉丝是条状”啊喂！核心暴击：它原生思考，不是调用外部工具包——这才是“模型即应用”的王炸真相！

凛冬警告⚠️：创业狗别死磕模型了！OpenAI都慌成狗，你的AI agent项目怕是要凉❄️ 但兄弟别逃！扎进冷门场景做专家（比如专攻宠物殡葬菜单？🐶→🐱），冬天尽头就是春天🌱 Google用户生态一爆发，新超级APP说不准就在你手！

#评论区嚎一嗓子：你焦虑不？点赞过万🔥，爆Google反重力IDE偷跑黑科技！凛冬？拿来吧你！💪

标题1：谷歌一出手，OpenAI的“凛冬”真来了？山姆·奥特曼内部备忘录罕见示弱，承认可能暂时落后｜Google vs OpenAI、AI Race、Google、OpenAI、Artificial Intelligence (AI)
标题2：一个北京烤鸭菜单测试，戳破无数AI应用泡沫！Gemini 3 Pro凭“模型即应用”打法让对手窒息｜Google vs OpenAI、AI Race、Google、OpenAI、ChatGPT、Gemini
标题3：AI泡沫要破了？错！谷歌正以一己之力改写牌局，击鼓传花游戏或将终结，行业迎来真洗牌｜Google vs OpenAI、AI Race、Google、OpenAI、AI Dominance、Future of AI
标题4：AI创业者警惕：别再卷模型和Agent了！谷歌正用“平台级”打法降维打击，未来生存法则已变｜Google vs OpenAI、AI Race、Startups、AI Dominance、Future of AI
标题5：重演微信式逆袭？谷歌Gemini绝地反击，奥特曼罕见承认OpenAI不再战无不胜，老大地位动摇｜Google vs OpenAI、AI Race、AI Competition、AI Dominance、Future of AI
简介：谷歌Gemini 3 Pro的发布正引发AI行业剧震，连OpenAI CEO山姆·奥特曼也发出“凛冬将至”的内部警告。本期将深入剖析，谷歌凭借“模型即应用”的强大整合能力，如何实现技术反超，并探讨这场Google vs OpenAI的巅峰对决将如何重塑AI Race格局。对于大量AI创业公司而言，这既是生存危机，也可能预示着新机遇的到来，调整AI Strategy已迫在眉睫。]]></description>
										<content:encoded><![CDATA[
<figure class="wp-block-embed is-type-video is-provider-youtube wp-block-embed-youtube wp-embed-aspect-16-9 wp-has-aspect-ratio"><div class="wp-block-embed__wrapper">
<iframe loading="lazy" title="AI泡沫要破了？错！谷歌正以一己之力改写牌局，击鼓传花游戏或将终结，行业迎来真洗牌｜Google vs OpenAI、AI Race、Google、OpenAI、AI Dominance" width="900" height="506" src="https://www.youtube.com/embed/kLuleFEcT4E?feature=oembed" frameborder="0" allow="accelerometer; autoplay; clipboard-write; encrypted-media; gyroscope; picture-in-picture; web-share" referrerpolicy="strict-origin-when-cross-origin" allowfullscreen></iframe>
</div></figure>



<figure class="wp-block-image size-large"><img decoding="async" src="https://pictures.lukefan.com/google-ai-gemini-nano-threatens-openai-model-as-app-startup-strategy/blog-1.jpeg" alt=""/></figure>



<h1 class="wp-block-heading">Gemini 3 Pro和Nano Banana Pro发布之后，OpenAI的山姆·奥特曼开始喊“凛冬将至”了</h1>



<p class="wp-block-paragraph">大家好，欢迎收听<a href="https://youtube.com/@StoryTellerFan" target="_blank" rel="noopener">老范讲故事的YouTube频道</a>。凛冬将至（winter is coming），这是一个《权游》里边的梗，大家要小心准备了。以前呢，OpenAI每一次发布会之后，都会有一群的创业公司原地死亡。这次谷歌没有开发布会，直接发布了新产品之后，OpenAI虽然不至于原地死亡，但是凛冬将至了。</p>



<h2 class="wp-block-heading">奥特曼的内部警告：“凛冬将至”</h2>



<p class="wp-block-paragraph">山姆·奥特曼到底是怎么说的呢？对外肯定不能跌面子，讲的是祝贺谷歌发布了Gemini 3，看起来是一个很棒的模型。但是曝光的一些内部备忘录里边，寒意已经体现出来了。奥特曼罕见的表现出了危机感，直言公司当前的氛围充满了不太妙的低迷气氛，大家都觉得有问题了。</p>



<p class="wp-block-paragraph">OpenAI如今不得不拼命追赶，谷歌的AI进展可能给OpenAI创造暂时的<strong>“经济阻力”</strong>。大家注意，这个词叫“经济阻力”，它的收入可能会有问题。如果收入有问题的话，他前面画的1.3万亿这种大饼，这是会出大问题的，会让整个行业崩塌的。</p>



<figure class="wp-block-image size-large"><img decoding="async" src="https://pictures.lukefan.com/google-ai-gemini-nano-threatens-openai-model-as-app-startup-strategy/blog-2.jpeg" alt=""/></figure>



<p class="wp-block-paragraph">现在，山姆·奥特曼要求团队进入战时状态，聚焦长远，即便意味着我们在当前阶段会暂时落后，也要押注更有雄心的突破。这个非常非常正确。首先，他承认了“我们现在可能暂时落后”，而且一段时间未必追得上。但是，如果只是跟着谷歌的脚步往前追的话，这是没法整的。因为谷歌最擅长的事情就是极限拉扯、极限迭代升级，你像Chrome到现在100多版了，安卓一年一个大版、一堆的小版，所以任何想在这后边跟版本的人，都会被谷歌拉死的。你要想跟谷歌竞争，一定要跳到谷歌外面去，自己做一些完完全全创新的东西，让用户有感知的东西，这个才是需要去干的活。</p>



<p class="wp-block-paragraph">而且，山姆·奥特曼讲到，公司的估值虽然很高，但是要清醒看到，我们还有不少的功课要补，AI研发的严冬考验就在眼前，OpenAI必须奋起直追了。这也就是“凛冬将至”的出处。</p>



<p class="wp-block-paragraph">大家还记得国内互联网企业是什么时候开始喊这句话的吗？谁喊的？任正非喊的。任正非喊“我们要让大家感受到寒意”之后，华为确实有在裁员，但是业绩并没有大的问题。但是华为身边的这些公司，就在大量的原地消失，直接就不见了。这就是凛冬到来的时候，我们会看到的景象。</p>



<span id="more-3010"></span>



<h2 class="wp-block-heading">Gemini 3 Pro到底有多强？</h2>



<p class="wp-block-paragraph">Gemini 3 Pro到底强到一个什么样的程度，能让行业公认的老大OpenAI的山姆·奥特曼发出“凛冬将至”这样的声音呢？</p>



<p class="wp-block-paragraph">我这几天呢，其实一直在用Gemini 3 Pro，本身感受并没有那么明显，只是觉得快了很多，回答的质量高了很多。Nano Banana Pro，那简直是强到没有朋友。</p>



<h3 class="wp-block-heading">实战对比：Nano Banana Pro vs. 即梦4.0</h3>



<p class="wp-block-paragraph">我拿Nano Banana Pro跟国内的“即梦4.0”比较了一下，我的提示词是什么呢？说：“你给我设计一个北京烤鸭为主菜的北京宫廷宴菜馆的菜单，主要的菜品要有配图，要写上菜品名，要有这个菜品的配料以及口味的简单描述以及价格，其他的菜就不需要这个图片了。”</p>



<figure class="wp-block-image size-large"><img decoding="async" src="https://pictures.lukefan.com/google-ai-gemini-nano-threatens-openai-model-as-app-startup-strategy/Gemini_Generated_Image_p3ge8ep3ge8ep3ge.png" alt=""/></figure>



<figure class="wp-block-image size-large"><img decoding="async" src="https://pictures.lukefan.com/google-ai-gemini-nano-threatens-openai-model-as-app-startup-strategy/jimeng-2025-11-24-9282-%E5%8F%A4%E4%BB%A3%E8%AF%9D%E6%9C%AC%E5%B0%8F%E8%AF%B4%E5%8B%BE%E7%BA%BF%E4%B8%8A%E8%89%B2%E9%A3%8E%E6%A0%BC%E7%9A%84%E5%8C%97%E4%BA%AC%E7%83%A4%E9%B8%AD%E9%A4%90%E9%A6%86%E5%A4%8D%E5%8F%A4%E5%AE%AB%E5%BB%B7%E9%A3%8E%E5%8D%95%E9%A1%B5%E8%8F%9C%E5%8D%95%E3%80%82%E7%94%BB%E9%9D%A2%E6%95%B4%E4%BD%93%E9%87%87%E7%94%A8%E5%8F%A4%E4%BB%A3%E8%AF%9D%E6%9C%AC%E5%B0%8F....png" alt=""/></figure>



<p class="wp-block-paragraph">两边都干活去了，其实干出来的结果都还不错。先说即梦吧，即梦呢画的很漂亮，上头也写着是多少多少钱一只烤鸭，烤鸭画的也还可以吧。但是呢，它在菜单里头混入了宫保鸡丁和麻婆豆腐，这两道菜其实是川菜，它不是北京菜。而且呢，它里头选用的北京菜京酱肉丝，它配的图呢是一个红烧肉的图。京酱肉丝，你里头必须得要有肉丝，得是条状的；而红烧肉是肉块，到最后画出来的是个肉块，就出现了这样的翻车现象。</p>



<p class="wp-block-paragraph">Nano Banana Pro画的图是什么样的呢？非常的漂亮，上面是北京烤鸭，然后呢是其他的各种北京菜、老北京炸酱面呀，没有任何川菜混在里面。但是它也有一个bug，就是它写的价格是“文银多少两”，这个是很有趣的一点。即梦的这个价格都是58、68，相对来说是比较准确的。</p>



<p class="wp-block-paragraph">这个例子大家看出来差在哪了吗？它们画的图，艺术感其实没有太大区别，差就差在：<strong>Nano Banana Pro自己是一个完整的模型，它把AI agent的活干完了</strong>，他自己在这个模型里头搜索了、思考了、推理了、研究了，然后把一个正确的东西画出来——但不能说一点瑕疵没有。而这个即梦干的活是什么呢？先调用了外部的工具，它可能也搜索了一些，甚至可能连搜索都没搜索，它可能调用的是豆包的这种大模型，使用豆包自己的知识体系，进行了一定的思考和生成，然后就去画图了。其实画的图两边差异不大，差异大就大在你到底是原生的模型进行思考、进行推理、进行搜索，还是说我是外部的。画的质量其实是一样的。</p>



<h2 class="wp-block-heading">谷歌的新武器：Anti Gravity IDE</h2>



<p class="wp-block-paragraph">另外呢，这两天还试了一下Anti Gravity，它叫“反重力”，谷歌这次出的IDE。当然，这种产品大家要试用的时候，一定要注意一点是什么？不停的升级。因为这种产品迭代非常非常快，今天我去升级了以后，发现已经跟我第一天下载这个产品完全是天翻地覆的变化了，大概升了两个版本。变在哪了？因为我下载这个产品的时候，Nano Banana Pro还没发布呢，今天升级上去以后，已经把Nano Banana Pro挂进去了。这个产品是谁做的呢？就是当时谷歌花钱收购了Windsurf团队的核心成员，让他们进来给做的。所以这个产品做的呢，还可以。</p>



<p class="wp-block-paragraph">这个产品现在彻底打通了MVC。这个什么东西？我们写程序的时候呢，一般是把程序分成三块儿：model、Controller和view这三块儿。model呢是所有跟数据相关的，你数据模型是什么样的，数据底层是什么样的，这种底层的一些API接口，这些都在model里头。Controller呢是各种的业务逻辑，写在这块。view呢是所有的让大家能看得到、能够交互的东西，就是视图。</p>



<figure class="wp-block-image size-large"><img decoding="async" src="https://pictures.lukefan.com/google-ai-gemini-nano-threatens-openai-model-as-app-startup-strategy/blog-3.jpeg" alt=""/></figure>



<p class="wp-block-paragraph">为什么写程序会把这三块分开写呢？就是为了这三块可以让不同的人去做，把接口留清楚，就可以独立的去进行更新，而不要说眉毛胡子一把刷，牵一发动全身。为什么要专门强调这件事呢？因为以前的AI编程的工具，或者是Web coding的工具，他们主要是做后端，虽然前端也做一些，但是呢对于画图设计，还是要差一些的。</p>



<p class="wp-block-paragraph">现在就不用费这个劲了。你直接向它描述，我今儿向它描述，我说：“你给我去做一个读书软件，我要求是羊皮纸的背景，要有各种图书相关的元素进去。”这个Anti Gravity就直接调用Nano Banana Pro去给我画图去了。先给我生成了一个羊皮纸的背景，然后呢给我生成了一个古色古香的页头，就是像那种花体字这样的东西，然后呢给我生成了所有的、跟看书相关的图标：有打开的书、有合起来的书、有笔，生成了全套的图标，还给我生成了一本书。生成完了以后，那边写程序把这玩意儿全挂进去了，这个是多么开心的一件事情！</p>



<h2 class="wp-block-heading">谷歌真正的可怕之处：生态与“微信式逆袭”</h2>



<p class="wp-block-paragraph">通过Nano Banana Pro和Gemini 3 Pro更新的情况来看，现在呢，谷歌已经真的开始靠谱了，有用了，可以干活了。而且谷歌最可怕的还不是模型变强了，<strong>谷歌最可怕的是用户生态强</strong>。但是呢，Gemini现在的月活用户数是6亿多，比GPT的还是要少一些的，大概少个一两亿的样子。但是谷歌后边还有Gmail、Google Workspace、安卓、YouTube这么多用户群体，这么多用户场景在那等着它呢。</p>



<figure class="wp-block-image size-large"><img decoding="async" src="https://pictures.lukefan.com/google-ai-gemini-nano-threatens-openai-model-as-app-startup-strategy/blog-4.jpeg" alt=""/></figure>



<p class="wp-block-paragraph">所以，谷歌一旦实现了AI突破的话，这对于OpenAI来说，不能说灭顶之灾，但是已经是非常非常危险的了。这也是为什么OpenAI的山姆·奥特曼会去警告员工公司营收增速可能下滑的一个原因，而且告诉员工说：“我们不再是战无不胜的了。”</p>



<p class="wp-block-paragraph">现在呢，我们其实正在看一场微信一样的逆袭。什么是微信一样的逆袭？就是在微信出现之前，其实国内出了很多这些移动端的即时通讯工具。腾讯在PC端是老大呀，那么我怎么办？直接用PC端的QQ跟你们竞争，又竞争不过你们，因为包袱实在太重。说：“算了，咱们去做微信。”然后呢，是携着原来QQ积攒下来的社交关系链，直接碾压所有对手，就把当时的米聊、各种的talk、这talk那talk什么，全都给干翻了。所以，这就是一次微信式的逆袭。</p>



<p class="wp-block-paragraph">那你说只有OpenAI感受到了“凛冬将至”吗？咱们再想想前面讲的华为任正非的故事，老大感受到凛冬将至了，那你原地死亡的人一定会更多。</p>



<h2 class="wp-block-heading">“模型即应用”：创业者的残酷现实</h2>



<figure class="wp-block-image size-large"><img decoding="async" src="https://pictures.lukefan.com/google-ai-gemini-nano-threatens-openai-model-as-app-startup-strategy/blog-5.jpeg" alt=""/></figure>



<p class="wp-block-paragraph">Gemini的胜利，再次重申了AI创业领域里头一个非常让人不喜欢的论点，这个论点就叫做<strong>“模型即应用”</strong>。刚才我讲了Nano Banana Pro跟即梦之间的差异的例子，大家就知道为什么“模型即应用”是最厉害的。这个，虽然很多做应用的人非常非常讨厌这一条，但是目前来看，这条依然成立。</p>



<p class="wp-block-paragraph">原来那些做应用开发的，特别是这些做AI agent的开发的，比如像ConflUI、像Cursor这些人，现在一定是感受到巨大的压力。如果你说我在这个圈子里头，还不在ConflUI和Cursor这样的领军位置的话，就可以直接宣布原地死亡了，就不用再去努力了。那些通过模型的调整、做复杂提示词工程和流程管理的，基本上是天塌了，因为这一部分活现在都直接被模型功能给覆盖掉了。</p>



<h2 class="wp-block-heading">特立独行的谷歌：AI圈的“局外人”</h2>



<p class="wp-block-paragraph">这回是不是一个戳破泡沫的钉子呢？是不是谷歌直接逆袭了以后，AI泡沫就破了呢？很多人说：“不对，这不是AI又往前走了吗？AI有用了呀！”</p>



<p class="wp-block-paragraph">但是呢，谷歌在整个AI游戏里边的位置是很尴尬的，参与了，但好像又没有参与的一个位置。你说谷歌是不是在做AI？肯定是，Gemini 3出来了，它不做AI谁做AI呢？而且它也有投资，它投资了Anthropic。但是呢，它又没有彻底参与到整个硅谷的AI军备竞赛里头去。前面咱们讲什么“击鼓传花”呀，“左脚踩右脚”，这里头跟谷歌其实关系不大。它没有用英伟达的芯片，它用的是自己家的TPU；它也没有投资了谁谁谁，买一堆芯片，然后再去建这个机房，它都是自有资金。跟外边讲的OpenAI投资什么项目、英伟达投资OpenAI、AMD投资OpenAI、OpenAI再去到Oracle那去订购算力订单……跟整个这个循环是没关系的。</p>



<figure class="wp-block-image size-large"><img decoding="async" src="https://pictures.lukefan.com/google-ai-gemini-nano-threatens-openai-model-as-app-startup-strategy/blog-6.jpeg" alt=""/></figure>



<p class="wp-block-paragraph">那谷歌为什么这么另类呢？它为什么不跟大家一起玩耍呢？一个幼儿园里头，这个小朋友就看着这么奇怪，这么不合群呢？原因很简单，大家知道OpenAI，这个open要open谁呢？就是要open谷歌呀。建立OpenAI的原因，就是因为谷歌太不开放了。所以，整个的AI产业链，基本上都是从谷歌内部孵化出来的，每一个在做AI创业公司的人都在讲：“谷歌有问题，我要出来反它，我要出来干它。”它是这样的一个位置，谷歌在整个AI领域里头可以算是<strong>举世皆敌</strong>。</p>



<p class="wp-block-paragraph">OpenAI这头，微软给了钱了，那头软银给了钱了，跟英伟达还有关系，跟AMD有关系，跟Oracle、亚马逊，它全都有关系。谷歌说：“我跟你们都没关系，你们都是从我这来的，我要收拾你们。”所以谷歌在整个的AI圈子里头，是最另类的一个，就像相声界里的郭德纲一样。</p>



<p class="wp-block-paragraph">一旦谷歌成了，整个行业都会瑟瑟发抖。因为英伟达的芯片不再是必须的了，现在使用谷歌TPU，人家也把这事搞定了。OpenAI、微软还要继续回去跟谷歌争夺用户和应用场景了。原来说OpenAI的技术最好、用户体验最好，所以我不需要去跟你抢用户场景，用户自然而然就向我这边迁移了。现在谷歌的用户体验做的也很好了，那大家回去了，Office跟Workspace接着打，只能变成这样的一个状态，那对于他们来说是非常非常不利的。</p>



<p class="wp-block-paragraph">而Oracle、Coreweave这些下游厂商建立起来的这些算力中心，就未必有人用了。很多人在去质疑，说你OpenAI四处建算力中心，四处去签这种巨额的算力协议，这到底能不能实现？现在就悬了。谷歌的Gemini模型是不会跑到这些算力中心上的，谷歌的这些Gemini模型一定会跑在谷歌云上，跟他们是没关系的。“击鼓传花”的游戏有可能就玩不下去了，所以整个行业现在都很害怕。</p>



<h2 class="wp-block-heading">凛冬已至，创业者何去何从？</h2>



<p class="wp-block-paragraph">Gemini 3 Pro发布之后，创业者应该怎么办呢？咱们不能说“凛冬将至”，大家躺平，对吧？这肯定不是老范的风格。</p>



<figure class="wp-block-image size-large"><img decoding="async" src="https://pictures.lukefan.com/google-ai-gemini-nano-threatens-openai-model-as-app-startup-strategy/blog-7.jpeg" alt=""/></figure>



<ul class="wp-block-list">
<li><strong>不要去做大模型了。</strong>中国几个大厂除外，像什么豆包、千问，他们愿意折腾去折腾去。因为为什么？谷歌进不来，OpenAI也进不来，他们还是有一个巨大的市场可以去玩耍的。甚至在国内证明成功了以后，还可以开源出去，给老外那边再去搅和搅和。以后的模型呢就是大厂竞争了：谷歌、OpenAI、xAI和Anthropic，基本上就是他们四家搞了。至于Meta在里边要站在一个什么位置呢，现在还看不太出来。如果你说我一定要整点什么模型呢，可以在中国开源模型的基础上呢，做一些小的调整，重新训练新的模型。这个阶段已经过去了，现在剩下这四家——谷歌、OpenAI、xAI和Anthropic——也未必最后都能活得下来。那些单纯的图片、音视频的模型，最终应该都会被顶端的这些大模型公司统统干掉，像Midjourney、Flux未必能活得下去。</li>



<li><strong>不要去做那些模型未来会覆盖的领域。</strong>模型会越来越强，这个是必然；模型会越来越快，这个也是必然的。还有一个必然是什么？模型一定会越来越便宜。你说：“哎，我现在尝试去做一个应用，我在哪个地方用更便宜的模型，哪个地方用稍微贵一点的，达到一个在当前的成本下最好的效果。”别费这个劲！等你把这个产品做好了、上线的时候，那个最贵的模型的成本也降下来了。所以不用费这个劲，咱就直接使最贵的就完事了。那些只做工具调用、流程安排、结果确认的工具，或者是AI agent的产品，都会被模型覆盖掉的，大家就别费劲在这块卷了。</li>



<li><strong>要做“时间的朋友”和“平台的朋友”。</strong>这个就是在移动互联网时代里头我们反复在强调的事情，现在AI时代也在走这条老路了。什么叫“时间的朋友”和“平台的朋友”？以前做安卓App和iOS App的时候，我们一定要做苹果公司和谷歌公司的朋友。我们要考虑他们未来向哪个方向发展，我不能挡在人路上，那就不是“时间的朋友”了。我们也要考虑谷歌跟苹果这样的大平台，他们的诉求是什么，你不能把人家该干的活给人干了，那就不是“平台的朋友”了。所以我们要做时间的朋友，要做平台的朋友。而平台的话，在新的时代里就是这些大模型——咱们讲这4家公司的大模型。时间会让模型变得越来越强大，开发者必须在这个大前提下干活，你不能挡在这个模型的路上，不能随着时间的发展被模型淹没掉。</li>



<li><strong>要跟具体的用户和场景打交道。</strong>模型就是新的平台，再强大，其边缘依然是粗糙的。特别是在美国，他们这些大厂，他不会把每一个细节和边缘、方方面面都照顾到的。所以在这个时候，依然是需要我们去做很多的这种边边角角的事情。而且做了这些边边角角事情以后，未必没有机会去发展出新的超级App来，就像现在微信在iOS和安卓上变成超级App，这个过程是一样的。所以呢，不要觉得这个生意小、这个生意不挣钱、这个生意用户少，我们就不去做，先努力地扎下去再说。利用模型的能力解决具体的需求，与行业和场景进行深度的捆绑，成为行业专家——这就是咱们现在真正这些开发者或者是这些创业者该去干的活。不要尝试去编写代码弥补模型缺陷，直接等模型升级就行了。特别是Gemini 3 Pro发布以后，马斯克说了，我明年一二月份就要去发布Grok 5，那个时候我们就直接上6万亿大参数模型，大家等着看吧，拭目以待就可以了。</li>
</ul>



<h2 class="wp-block-heading">跨越临界点：零和博弈的终结与新机遇</h2>



<p class="wp-block-paragraph">最后，凛冬将至，春天可能也就不远了。到了冬天了，后边就应该是春天了嘛。</p>



<figure class="wp-block-image size-large"><img decoding="async" src="https://pictures.lukefan.com/google-ai-gemini-nano-threatens-openai-model-as-app-startup-strategy/blog-8.jpeg" alt=""/></figure>



<p class="wp-block-paragraph">谷歌已经基本上达到临界点了。什么是临界点？AI可用的临界点。这个东西能干活了，能够挣钱了。跨过临界点之后会怎么样呢？我多吃一口，你就少吃一口，市场规模是固定的，这玩意就叫零和博弈。一旦跨过临界点，这个零和博弈就被打破了，行业就会大爆发。以很多以前没法做、不值得做的事情，现在就有经济价值了。在这样的一个情况下，就会有很多的新的应用、新的产业就会产生。</p>



<p class="wp-block-paragraph">我们没有4G网络的时候，谁会想到说大家可以刷短视频、刷抖音这样的东西？抖音会成为超级App，谁也想不到这个东西。因为那个时候网很慢，服务器的带宽也很贵，用户的手机带宽也很贵。但是你一旦过了这个坎，“哦，还可以干这样的事情”，整个变出了一个新的行业出来。</p>



<p class="wp-block-paragraph">但是呢，要提醒大家，现在的很多投资，特别是股市上面的很多泡沫，还是有很大的打水漂可能性的。特别是OpenAI和英伟达之间的这种“左脚踩右脚”的生意，还是很危险的。当然了，全行业都会努力地拯救这些投资，这个跟谷歌无关。对于谷歌来说，叫“杀死你，与我无关”，这句话引自于《三体》。</p>



<h2 class="wp-block-heading">总结</h2>



<p class="wp-block-paragraph">最后总结一下，Gemini 3 Pro发布了，绝对是挑战与机遇并存，不同层次的AI行业参与者，必须要重新给自己找到定位了。</p>



<p class="wp-block-paragraph">好，这就是咱们今天要讲的故事：凛冬将至。</p>



<p class="wp-block-paragraph">感谢大家收听，请帮忙点赞、点小铃铛、参加<a href="https://discord.gg/ppKsNkttTv" target="_blank" rel="noopener">Discord讨论群</a>，也欢迎有兴趣、有能力的朋友加入我们的<a href="https://www.youtube.com/channel/UCUGLhcs3-3y_yhZZsgRzrzw/join" target="_blank" rel="noopener">付费频道</a>。再见。</p>
]]></content:encoded>
					
		
		
			</item>
		<item>
		<title>我们都被骗了？Nano Banana Pro 真相揭秘：它根本不是Gemini 3简单叠加，原生多模态骨架才是颠覆关键｜Nano Banana Pro、Gemini 3 Pro、Gemini 3</title>
		<link>https://lukefan.com/2025/11/23/nano-banana-pro-gemini-3-ai-image-features-cost/</link>
		
		<dc:creator><![CDATA[Luke Fan]]></dc:creator>
		<pubDate>Sun, 23 Nov 2025 00:55:47 +0000</pubDate>
				<category><![CDATA[AIGC]]></category>
		<category><![CDATA[Google的故事]]></category>
		<category><![CDATA[4K图像]]></category>
		<category><![CDATA[AI Studio]]></category>
		<category><![CDATA[AI图像生成]]></category>
		<category><![CDATA[AI绘画]]></category>
		<category><![CDATA[Gemini 3 Pro]]></category>
		<category><![CDATA[Gemini API]]></category>
		<category><![CDATA[Gemini使用教程]]></category>
		<category><![CDATA[Google AI]]></category>
		<category><![CDATA[MidJourney对比]]></category>
		<category><![CDATA[Nano Banana Pro]]></category>
		<category><![CDATA[Nano Banana Pro价格]]></category>
		<category><![CDATA[Nano Banana Pro免费]]></category>
		<category><![CDATA[Nano Banana Pro测评]]></category>
		<category><![CDATA[PPT设计]]></category>
		<category><![CDATA[信息图表]]></category>
		<category><![CDATA[图像编辑]]></category>
		<category><![CDATA[多图融合]]></category>
		<category><![CDATA[多模态AI]]></category>
		<category><![CDATA[搜索增强绘图]]></category>
		<category><![CDATA[文字渲染]]></category>
		<category><![CDATA[文生图]]></category>
		<category><![CDATA[自然语言修图]]></category>
		<category><![CDATA[角色一致性]]></category>
		<category><![CDATA[谷歌AI绘画]]></category>
		<guid isPermaLink="false">https://lukefan.com/?p=2990</guid>

					<description><![CDATA[💥炸裂！谷歌新出的「纳米香蕉Pro」让设计师集体破防！男生亲测：直男做PPT竟比女友化妆还快！🤯

兄弟们，还记得那个画头像糊成马赛克的「纳米香蕉」吗？现在谷歌憋出**Nano Banana Pro**——直接把Gemini 3.0 Pro塞进画笔里！🔥 分辨率狂飙4K✨（修图再也不用抠头发丝了），写字稳如高考状元✍️（阿拉伯语花体？中文百字攻略？全是神还原！）。最离谱是：**一句话生成宫崎骏风土基熔岩堆PPT**，连PayPal黑帮老大彼得·蒂尔都能P上唐装喝小酒！🍷（GPT：这我绝不！谷歌：越权？我直接开画！）

💥**真香3连**：
1️⃣ **修图像点外卖**：“把西装换成宇航服，背景加火星”——秒改！再也不用PS抠到秃头🥹
2️⃣ **多脸齐聚不翻车**：14个头像一锅炖？Pro表示：稳！全家福、分镜故事，一键封神👨👩👧👦
3️⃣ **搜完再画超聪明**：让它画“大行D9折叠车拆解图”，它真会先搜图！这哪是AI？这是赛博丁真啊！🔍

💸价格小贵（4K图24美分），但**免费用户每天3张**！去Gemini.Google.com选“思考”+“绘图”，3秒出图（水印？咸鱼买账号秒解💧）。
**设计师说：天塌了。**
**我说：兄弟，赶紧去画个“你和马斯克撸串”的图！评论区Battle，点赞最高的送纳米香蕉电子皮肤！👇**
（直男福音实锤：再也不用求UI小姐姐了！😂）

⚠️警告：试完你会回来谢我！#AI神器 #打工人逆袭 #谷歌爸爸干得漂亮

标题1：Nano Banana Pro 对比 Nano Banana：不只是简单升级，背后是原生多模态的代差级碾压，设计师饭碗真悬了｜Nano Banana Pro、Gemini 3 Pro、Google、AI图像生成
标题2：价格暴涨6倍，从4美分飙到24美分一张图！Nano Banana Pro到底值不值？深度解析新增功能与高昂价格的背后｜Nano Banana Pro Gemini 3 Pro Google AI图像生成 价格
标题3：我们都被骗了？Nano Banana Pro 真相揭秘：它根本不是Gemini 3简单叠加，原生多模态骨架才是颠覆关键｜Nano Banana Pro、Gemini 3 Pro、Google、AI图像生成、Gemini 3
标题4：一句话生成带几十个字的复杂PPT，我用它画出PayPal黑帮关系图后彻底被震撼，工程师也能秒杀设计师了？｜Nano Banana Pro Gemini 3 Pro AI图像生成 文生图 图像编辑
标题5：Google彻底放飞自我？宫崎骏、哆啦A梦随便画，Nano Banana Pro 在版权红线上演惊天反转，竟比OpenAI还激进｜Nano Banana Pro、Gemini 3 Pro、Google、AI图像生成、功能
简介：Google 发布的 Nano Banana Pro 并非一次简单升级，而是由强大的 Gemini 3 Pro 驱动的代际飞跃。本文将深度解析其核心功能：从颠覆性的4K图像输出、精准的文本渲染能力，到一句话生成完整PPT页面的强大推理。我们将探讨它与前代的本质区别、高昂价格背后的价值，以及它将如何改变AI图像生成的游戏规则。
]]></description>
										<content:encoded><![CDATA[
<figure class="wp-block-embed is-type-video is-provider-youtube wp-block-embed-youtube wp-embed-aspect-16-9 wp-has-aspect-ratio"><div class="wp-block-embed__wrapper">
<iframe loading="lazy" title="我们都被骗了？Nano Banana Pro 真相揭秘：它根本不是Gemini 3简单叠加，原生多模态骨架才是颠覆关键｜Nano Banana Pro、Gemini 3 Pro、Gemini 3" width="900" height="506" src="https://www.youtube.com/embed/nnwN9AsGDlA?feature=oembed" frameborder="0" allow="accelerometer; autoplay; clipboard-write; encrypted-media; gyroscope; picture-in-picture; web-share" referrerpolicy="strict-origin-when-cross-origin" allowfullscreen></iframe>
</div></figure>



<h1 class="wp-block-heading">Nano Banana Pro发布了，它在Nano Banana的基础上到底做了些什么新东西？</h1>



<p class="wp-block-paragraph">大家好，欢迎收听老范讲故事的YouTube频道。</p>



<p class="wp-block-paragraph">大家等了半天的Nano Banana 2没有来，出来的是Nano Banana Pro。当然，前面Nano Banana Pro也是隐姓埋名，在各种的大模型评测平台上偷跑了好长时间。所以很多人呢，信誓旦旦地说：“我已经用到了这个东西，强的没边了。”现在终于发布出来了。</p>



<h2 class="wp-block-heading">从Nano Banana到Nano Banana Pro：核心区别是什么？</h2>



<p class="wp-block-paragraph">从名字上呢，一个叫Nano Banana，另外一个呢加了个Pro，它们到底差在哪呢？原来的Nano Banana，其实是叫做Gemini 2.5 Flash image。现在的Nano Banana Pro呢，它背后的模型是Gemini 3.0 Pro image，是两个不同版本。而且一个呢是Flash，一个呢是Pro。Flash一定是比较快，出来的东西呢相对比较粗糙；而Pro的话，出来的东西就会比较笨重了，或者说比较昂贵，而且出来的东西非常非常细致和完善，它们核心的区别就在这里。</p>



<p class="wp-block-paragraph">Nano Banana也是先在外边测试了很久然后才发布，这个名字也是当时他们测试的时候使用的名字。当然这一次测试呢，并没有叫纳米香蕉，这次换了个名字，因为纳米香蕉这名字你用过了嘛，好像叫GENIMG，大概是这样的一个名字去测试的。</p>



<span id="more-2990"></span>



<h2 class="wp-block-heading">回顾：初代Nano Banana的革命与短板</h2>



<p class="wp-block-paragraph">当时Nano Banana为什么会轰动呢？就是一致性的问题彻底被解决了，包括多图融合，融合以后的一致性，这个问题已经彻底解决掉了。但Nano Banana生成图片也有很多的问题：</p>



<ul class="wp-block-list">
<li><strong>分辨率低：</strong>也就是1024乘1024或者1K的图片。</li>



<li><strong>无法处理复杂内容：</strong>你说我要写很多文字上去，这搞不定。你只能是相对来说，主体比较简单的图片可以搞定。</li>



<li><strong>文字错误多：</strong>写字经常写错，甭管是写中文、写英文，经常写错，这是当时的一个问题。</li>
</ul>



<p class="wp-block-paragraph">但是因为它的一致性一下就得到了突破，所以呢还是火起来了。我记得当时Nano Banana出来的时候，最火的大家玩什么？就给它一张自己的照片，说：“来，给我生成一个图片，这个图片上是电脑，电脑里头呢，有我这个照片相关的3D玩偶的一个设计模型，桌子上呢要摆我的这个照片，以及呢用这个照片生成的3D玩偶的手办。要保证你电脑里边显示的模型、你的照片跟这个手办，要完全的能够对得上，这是同一个人。”他的一致性要很强，而且要不同的风格下的一致性依然很强，当时大家玩这个梗都玩疯了。</p>



<p class="wp-block-paragraph">所以呢，当时很多人在玩什么？就是多张人像图片合成一个统一场景，同时呢保证一致，同一个人在多张图片里头五官、发型、服饰相对一致，或者同一个人在多张图里头保持风格统一。对于很多的用户来说，可以去轻松地制作全家福、多角色合影、连续故事分镜，都是可以做出来了，有极强的可玩性。</p>



<p class="wp-block-paragraph">而且呢，Nano Banana是有相对比较强的世界知识和场景理解能力的，因为它后面的是Gemini 2.5 Flash的一个模型，所以你问它很多东西，它的基础知识是存在的，它继承了Gemini模型的语义和知识能力。这点对于像吉梦，还有像Midjourney这样的纯画图模型来说，就绝对遥遥领先了。能够跟Nano Banana去比语义理解能力的，也就是GPT image，就是在GPT-4o的基础上画图的这个模型。</p>



<p class="wp-block-paragraph">Nano Banana呢，对于地理场景，比如说像地标建筑、服饰文化元素；场景，比如医生、厨师、程序员，都可以很好地去理解，而且感觉都似模似样的，或者我们叫“对齐”了——这算是大语言模型带给我们语言的一个污染，现在大家都在讲“对齐”这个词——所以它跟我们日常认知是可以对齐的。</p>



<p class="wp-block-paragraph">而且呢，Nano Banana是可以做自然语言修图和局部编辑的。很多人特别讨厌做修图的原因是什么？你需要做选择，这一块是衣服，那一块是手，这一块是背景，你要拿这个线把这个后边的背景抠出来，这个是很烦的。但是Nano Banana就不需要，你只需要告诉他说：“现在请把衣服给我换成这身，请把这个鞋给我换成那个。”或者说：“请把这个瓶子上的文字给我换一下。”就可以搞定了，再也不需要上去打点勾线了。这个事儿，是Nano Banana给大家带来的非常非常好的体验。</p>



<p class="wp-block-paragraph">还有一点很重要的是什么？就是低延迟、低成本。Nano Banana画图是很便宜的，他画一张图的话，调用API大概是3.9美分画一张，非常非常便宜。而且呢，因为它画的很像，在Nano Banana发布以后呢，社交媒体直接就炸了。因为社交媒体，你的社会关系要去参加到交往过程中，如果我画完了以后，这个大美女、大帅哥看不出来是谁，这个事是没法整的。Nano Banana画出来的就可以看出来是谁了，所以Nano Banana当时出来了以后直接就炸裂了，而且是出来了以后，谷歌的股价在涨，谷歌Gemini用户量在暴涨，所以这个是真正拯救谷歌的一个产品。</p>



<h2 class="wp-block-heading">Nano Banana Pro：不仅仅是简单的升级</h2>



<p class="wp-block-paragraph">现在好了，Nano Banana Pro来了。它在Nano Banana的基础上到底加了什么？它到底是不是Gemini 3 Pro加上Nano Banana呢？首先要确定这个东西不是。为什么？因为那个Nano Banana是Gemini 2.5 Flash image，而现在的Nano Banana Pro是Gemini 3.0 Pro，所以它们是完完全全两个不同量级、不同版本的模型。</p>



<p class="wp-block-paragraph">首先，Gemini 3 Pro就是比Gemini 2.5 Pro要强很多很多的一个模型，它在推理上强的没朋友。你在这样的一个基础上去做绘图的话，那一定也是会强到没朋友的。而且Gemini 3跟Gemini 2.5还有一个很本质的区别是什么？就是它是原生多模态。它直接把图片、视频这些东西通通一把训练进去了，在最一开始的时候就训练进去的。</p>



<p class="wp-block-paragraph">Nano Banana Pro是复用了Gemini 3的多模态和推理骨干。你用Nano Banana Pro画图的时候，不是上来就画图，而是说我要先搜索一下，然后我要推理一下。你可以把整个推理的过程都拉出来看，他要先画几张，画完了以后自己在那改，改完了最后出了一个他觉得还可以的结果。因为整个的推理的过程中是有图片生成的，有图片的参考，你甚至可以告诉他说：“去给我参考一下哪个哪个车，给我画一个拆解图来。”比如说我有一辆大行D9的折叠车，我说：“你给我画一辆大行D9的折叠自行车的拆解图。”夸夸夸给我画出来了。我说：“你这个车架画错了。”然后又给我画，画的还是不太对。我说：“你这样，我说你去网上搜索一个D9的图片去，然后再给我回来画。”回来就给你画对了。他就可以干这样的事情。</p>



<p class="wp-block-paragraph">咱们今天讲的东西呢，都是纯语言描述，我就不跟大家去做案例了，大家自己去试，这个成本非常非常低。所以咱们今天呢，还是主要讲它的原理。Nano Banana Pro是叠加了搜索和推理的一个绘图，它当时的测试的名字叫Gempix 2。所以呢，更准确的说法不是“Gemini 3加上Nano Banana等于Nano Banana Pro”，应该是Nano的Banana Pro是Gemini 3 Pro的大脑，加上新一代的高端图像的头，并不是简单的这种拼接。</p>



<h2 class="wp-block-heading">绘图能力对比：Pro版本强在哪里？</h2>



<p class="wp-block-paragraph">咱们先看看它的画图部分怎么样吧。在这儿跟大家确认，它在艺术性上依然是没有办法战胜Midjourney的，Midjourney在这块还是当仁不让的王者。但是Midjourney对于物理的理解、对于整个语言的理解，是没有Nano Banana Pro好的。但是咱们就说氛围和艺术感这件事，Midjourney是老大，谁都超不过它。</p>



<p class="wp-block-paragraph">不考虑推理和搜索的情况下，Nano Banana Pro跟Nano Banana比起来到底是强在哪？</p>



<h3 class="wp-block-heading">1. 分辨率和细节极大提升</h3>



<p class="wp-block-paragraph">Nano Banana也就是1K，1024*1024这么大的一个分辨率，而且呢，它呢主要用途是画头像、画这种社交媒体插图、画缩略图。而Nano Banana Pro的话，是可以支持1K、2K、4K等多档的输出，你可以输出一个很高分辨率的图片出来。特别是在4K模式下，你做UI设计稿、做产品渲染、线条比较多的这种信息图，细节很清晰的图片呀，上边的细节清晰度会明显的提高。对于需要二次剪裁或者排版的这种专业场景，是相对来说比较友好的。所以我Nendo Banana用了一段时间，我后面不用了，因为它出的图实在是没法使，但Nano Banana Pro是没毛病的。</p>



<h3 class="wp-block-heading">2. 文字渲染能力显著增强</h3>



<p class="wp-block-paragraph">Nano Banana虽然也能写字，甚至也能写中文，但是字多了它会写错的。而且多语言，你比如说阿拉伯语、中文，特别是花体或者很复杂的一些字体，你要去要求他写的时候呢，会给你写成一塌糊涂。但是Nano Banana Pro就没有这个问题，我测试了，让他写一篇的字都没毛病。甚至有人测试什么呢？你在上头给他出一道题，然后呢他就生生的把这个题和整个题的解题步骤和结果全都给你画在图片里。我做了一个测试是什么呢？我前面跟土拨鼠一起跟大家去做过视频，讲解中国的“土基熔岩堆”。我说：“你给我画一个示意图，做一个土基熔岩堆出来。”我给他上传了一个我的照片，说：“你按照宫崎骏的风格，去给我做一个土鸡熔岩堆的讲解，哪一块是什么样的功能，进去什么、出来什么。”画的非常好，一个页面上应该有几十个字，甚至上百字，都写的非常非常好。我也尝试过一些这种花体字，原来我经常用吉梦去做这种叫创意字体，我把吉梦的提示词直接扔到Nano Banana Pro里边去，效果呢我觉得没有吉梦好，但是已经可以做各种各样的花体字了。但是拼中文，现在它距离吉梦还是稍微有一点点小差距。</p>



<p class="wp-block-paragraph">现在呢，很多人拿这个Nano Banana Pro是干嘛使？直接做这个PPT。按道理说，我们应该是PPT里头写字，然后拼图，然后再排，这是一个完整PPT。现在不需要了，你直接告诉他说：“我要画一页PPT，要写一个什么样的东西。”比如像刚才我讲土基熔岩堆“土变油”的过程，给你写好了。而且你告诉他要宫崎骏风格，给你画出来了。甚至我后来又提了一个要求，我说：“给我把PayPal黑帮里头这几个老大之间的关系是什么样的，以及他们跟现在美国政府之间是什么关系，给我画出一个示意图来。”咔咔给我画好了，上面有彼得·蒂尔、埃隆·马斯克、杰里·万斯，头像全给我画上了，效果好的一塌糊涂。上面一开始写的是英文，后来我说：“你给我写成中文。”然后把谁原来在Paypal里是什么职位，现在Paypal黑帮里他是一个什么样的位置，比如彼得·蒂尔就是黑帮教父这样的一个位置，JD Vans跟他们是什么样的关系，全都给我写好了，非常漂亮，而且把所有人的头像给我画上了。你甚至可以要求他换什么风格的头像，都给你画的好好的。这一次就可以生成一个完整的PPT页面，不用再去做各种各样的调整，一句话搞定。怎么说呢，对于工程师来说足够使了，所以属于补上设计师最后短板的一个工具。</p>



<h3 class="wp-block-heading">3. 多人物、多图片编辑和一致性更强</h3>



<p class="wp-block-paragraph">原来Nano Banana的话，出个可能四五张图、五六张图进去还是可以搞定的。现在的话，可以一次塞进去十几张图，一次上了14个脑袋，这个事儿有的人也是成功了，但是有的时候有问题，但是它正常6个脑袋是没毛病的。</p>



<h3 class="wp-block-heading">4. 控制力更强</h3>



<p class="wp-block-paragraph">相机的角度、俯拍、仰拍、广角长焦，光线的效果，局部遮罩，比如只改脸、只改衣服、只改背景，图表、UI、信息图的这种结构化编辑，这些东西你都可以搞定。咱们说了这么多意思是什么？就是你一次可以写很多很多的文字进去，它一次允许我们写64K，就是64,000个TOKEN进去，它会很好的服从这64,000个TOKEN的指令，把你说的这一大堆东西都给你做出来，而且保证你最后画出来的东西是一致的。</p>



<h3 class="wp-block-heading">5. 一致性和稳定性更强</h3>



<p class="wp-block-paragraph">由于背后挂着Gemini 3 Pro的多模态的骨架，所以呢，它是可以进行多轮对话的。它在多轮对话的修改过程中，可以生成同一风格的画面，这个过程是非常稳定的。你不会说：“给我改点什么东西。”改完了以后呢，你想改的没改对，没想改的地方竟然给改的乱七八糟。他不会干这个事，保证你想改什么改什么，整个的风格不会发生变化，你不想改的地方绝对不会发生改变的。所以绝对是生产力工具这东西。</p>



<h2 class="wp-block-heading">训练揭秘：思考后再出图的黑盒</h2>



<p class="wp-block-paragraph">那你说这玩意咋训练出来的呢？谷歌对于Nano Banana以及Nano Banana Pro的训练细节呢，基本上啥也没说，用相对文明一点的话说，叫“公开的很克制”。主要讲的就是共享了多模态的主干，就是我训练大模型的时候，我就直接是用多模态的方式去训练的。它的Nano Banana系列呢，就已经不再是一个孤立的图像模型了，它后边是有Gemini多模态主干的这个图像头的。它的文本指令、世界知识、场景理解是由主干来处理，处理完了以后，再用处理好的结果再去画图，他是这样的一个工作方式。</p>



<p class="wp-block-paragraph">而且呢，他们在训练的时候使用的叫联合训练和多任务目标。就是在通用图片生成的基础上，加入：</p>



<ul class="wp-block-list">
<li><strong>角色一致性任务</strong>（前后两张图片中的人物保持相似）</li>



<li><strong>多图融合任务</strong>（也就是多张输入的图在单一的一个场景里边进行输出）</li>



<li><strong>编辑任务</strong>（就输入图加修改指令）</li>
</ul>



<p class="wp-block-paragraph">还有这三个任务是同时进行训练的。很可能通过额外的损失函数和特殊数据集成和特殊数据集来强化这些能力。但是数据集这一块呢，反正谷歌就写了一个官话，说：“我们使用合法途径获得的开放数据集，以及人工标注数据集来进行训练的。”具体使用的什么数据集，他也没说。</p>



<p class="wp-block-paragraph">Pro在这块呢增加了什么？就是思考后再出图，以及搜索增强。Pro版本强调在生成前有一轮内部的规划和思考，对于教育插图、历史场景、信息图，支持输入Google search作为知识矫正，你可以要求他去搜索。我看很多人这几天在画李白坐在桌边，跟穿着唐装的哆啦A梦一块喝酒对诗，他是可以知道哆啦A梦长什么样，也知道李白长什么样，还知道唐装长什么样，让他们一点都不违和地坐在那去写诗。</p>



<p class="wp-block-paragraph">安全评估和红队测试呢，谷歌肯定也是做的呀，因为谷歌嘛，毕竟还是一个大企业、上市公司，你要是在这块犯错误的话，会有些问题的。但是它主要做的是什么呢？就是暴力、色情、仇恨、政治敏感内容，在这一块呢，做了重点的过滤以及红队测试。这会体现在某些指令明明技术上做到，但是呢给你的反馈是拒绝或者是模糊响应。不过我现在输出的各种图片还都比较正常，我没有让它测试一些比较奇怪的东西。所以呢，Nano Banana Pro在学习上呢，是一个完全闭源的，并没有告诉大家具体是怎么做的。现在我们能够看到的呢，都是总结了谷歌自己公开的一些很克制的信息，总结出来的一个结果。</p>



<h2 class="wp-block-heading">版权与安全：更宽松的策略</h2>



<p class="wp-block-paragraph">我刚才讲到的一些提示词，大家听到有什么问题了没有？我要用宫崎骏的画风去画一个土基熔岩堆，要画埃隆·马斯克、彼得·蒂尔、杰里·万斯这些人的头像，后面我还让他画机器猫，他也给你画出来了。大家觉得是不是有问题了？</p>



<p class="wp-block-paragraph">Nano Banana Pro对于风格和人物肖像这一块，是要比GPT image要松很多的。就是刚才我们讲的这些内容，你让GPT去画，好多它是画不出来的。它会告诉你，万斯现在是美国总统，他属于叫敏感政治人物，我不给你画。宫崎骏风格的不给你画。你说吉卜力工作室，他有可能给你画，但是你要宫崎骏风格，他就不给你画。现在吉卜力工作室还在起诉OpenAI，官司还打着呢。但是谷歌说：“没事，我都给你画。”机器猫呢，它属于有这个IP的品牌形象，你画了机器猫，甭管你画成什么样，实际上都属于侵权。但是谷歌说：“我就给你画了。”这一点其实做的一点都不谷歌，以前这个谷歌在这一块是要比OpenAI还要严苛的，现在直接就放松了，随便玩去。</p>



<p class="wp-block-paragraph">我去问谷歌的Gemini 3 Pro，你们为什么干了这么一件事呢？他给我的回复是什么呢？“我们现在呢，是用了更深层次的安全措施。一方面呢，我们提醒你了，所有遇到版权问题你自己去应对，跟我没关系。”所以如果以后有人说，你怎么用了宫崎骏风格，他会直接把这个东西扔给创作者，而不是自己来承担这个责任。第二方面呢，他会去判断，你让马斯克坐在这喝咖啡，那是允许的；你让马斯克去做一些很奇怪的事情、有侮辱性的事情，他就不允许了。所以呢，他说我们不会在前向直接禁止你，而是会在后向看看你的意图是什么。你想做一个深度伪造，你想去骗人，还是想要去侮辱这个人，这些我们就不做了。但是如果你只是想要一个马斯克的头像，我们就给你做了。至于说机器猫的头像，因为我们比如做完了以后，也是会发到Twitter或者发到YouTube上，他就是说你发上来了，最后我来处罚你的YouTube作品就完了，我就自己不承担这个责任了。</p>



<p class="wp-block-paragraph">这个是谷歌这一次采用的安全措施。OpenAI是反过来的，OpenAI是前置合规，就是你只要提名字，我就不给你画了。OpenAI呢，其实前置跟后置他都做。有的时候你让OpenAI给你画图的时候，他会先画，画完了以后，你看这图已经出到百分之七八十了，然后突然告诉你说：“对不起，我审核了，你这事有问题。”咔，给你把图删了。我遇到过几次了，所以我现在已经基本上不再使用OpenAI画图了，我现在画图基本上是Midjourney、吉梦和Nano Banana Pro了。</p>



<h2 class="wp-block-heading">价格不菲的“Pro”体验</h2>



<p class="wp-block-paragraph">既然叫Pro了，有一个很重要的问题是什么？贵。它叫Pro了，一定比原来的这个叫Flash的要贵很多。刚才咱们讲了Nano Banana，也就是Gemini 2.5 Flash image，它画一张图是3.9美分，基本上是4美分的样子。而这个Nano Banana Pro画一张图是多少钱呢？</p>



<ul class="wp-block-list">
<li><strong>1K或2K的图：</strong>13美分一张，这个就要贵很多了。</li>



<li><strong>4K的大图：</strong>24美分一张。</li>
</ul>



<p class="wp-block-paragraph">它要比咱们使用的GPT、使用的Midjourney、吉梦都要贵很多。吉梦是最便宜的，吉梦大概画一张图出来2K的图片不要钱，4K的也很便宜，可能就是几分钱人民币，换成美分就是零点几美分。Nano Banana Pro非常非常贵，大家画图的时候一定要小心。</p>



<h2 class="wp-block-heading">如何使用Nano Banana Pro？</h2>



<p class="wp-block-paragraph">我们怎么拿Nano Banana Pro去画图呢？</p>



<ul class="wp-block-list">
<li><strong>免费用户：</strong>在<a href="http://gemini.google.com/" target="_blank" rel="noopener">Gemini.Google.com</a>上就可以使用了，但是呢一天只允许画3张。你在APP上画也是可以的，Gemini APP上一天只允许画3张。</li>



<li><strong>Pro用户：</strong>大概一天是可以画个几十张，有时候是100张，他并没有给我们一个特别明确的数据，还是要看服务器忙不忙，服务器不忙就多给你画几张，大概是这样的一个情况。因为我的Gemini账号呢，是拿我儿子的edu邮箱注册的Pro账号，可以免费使15个月的Pro账号，所以呢我现在是可以在Gemini网页或者是Gemini APP上开开心心的画图的。</li>
</ul>



<p class="wp-block-paragraph">那你说画超了怎么办？画超了以后就给你降级，降级成Nano Banana，就没有那个Pro了，你就会快速地得到一张比较粗糙的图，大概就是这样的一个情况。</p>



<p class="wp-block-paragraph">那你说我怎么开启Nano Banana Pro的绘图呢？很简单。</p>



<ol class="wp-block-list">
<li>你要在APP或者是<a href="http://gemini.google.com/" target="_blank" rel="noopener">Gemini.Google.com</a>上选择“思考”，一旦选择“思考”了以后，你就进入Gemini 3 Pro的这个思考模式了。</li>



<li>然后呢，你再去添加工具“绘图”，上头画了一个香蕉，你就进入了Nano Banana Pro的绘制方式了。</li>
</ol>



<p class="wp-block-paragraph">你如果一开始选的是Gemini 2.5 Flash，你再去画图的话，就是Nano Banana，就没有这个Pro了，所以这块大家一定要注意。</p>



<p class="wp-block-paragraph">那你说，我在AI&nbsp;<a href="http://studio.google.com/" target="_blank" rel="noopener">studio.Google.com</a>里去画行不行呢？也行，但是要注意这个里头呢，有一些跟以前不太一样的地方。很多的谷歌模型，甭管是Gemini模型还是画图的模型，我们都可以在AI studio.Google.com里边去使用，但是使用Nano Banana Pro之前要去给它设置一个API key，不设置的话它是不让你用的。而且设置API key还是挺麻烦的，你要先去里边创建一个project，先创建一个工程，然后在这个工程里头再创建一个API key。到这还不行，还要给API key挂支付，没有支付的API key，它是不允许你使用的，必须有支付。</p>



<p class="wp-block-paragraph">那你说我是不是在这个AI studio里头每画一张图都要钱呢？也不是。现在有人测试呢，是画了三张以后要求你开始付钱，13美分一张或者是24美分一张。也有人呢是测试了，可能能够免费画个十几二十张，甚至有画到50张以上才开始收费的。我估计还是跟服务器的繁忙程度有关，服务器不太忙的时候，你可能一天还是可以在上面画个十几二十张的；服务器忙的时候，画3张然后从你的API key里边扣钱。</p>



<p class="wp-block-paragraph">但是有一点我们要注意是什么呢？在<a href="http://gemini.google.com/" target="_blank" rel="noopener">Gemini.Google.com</a>里边画出来的图右下角是有水印的，它里有一个菱形的Gemini的logo的水印在上头。而你在AI studio里头，就是你自己花钱13美分一张也好，24美分一张也好，是没有这个水印的，那个图是比较干净的。那你说我是不是就直接可以用AI studio或者直接用API把这个图画出来，就可以冒充是真实图片了呢？不行的。因为这个里边呢还有水纹。水纹是什么？就是你在外面你看不着，但是呢，你可以把这个图片扔给Gemini，问他说：“这个图是不是你生成的？”他是会给你进行精准判断的。所以只是在外表看不出来而已，在里边还能有这个痕迹。</p>



<p class="wp-block-paragraph">所以大家如果想画图的话，最简单的方式，如果你不太在意这个水印，就是这个菱形的标的话，就是去开这个Pro账号。特别是你如果有edu的邮箱，你去开那个，可以开开心心的使用的。至于你说：“我没有EDU邮箱怎么办？”有一个APP叫咸鱼，或者你到淘宝的网站上，你问问别人有没有办法来解决这个问题，也只能讲到这了。如果你说：“我就想用没有水印的图片。”那您就老老实实地交钱就行了。</p>



<h2 class="wp-block-heading">结语：设计师的天又塌了？</h2>



<p class="wp-block-paragraph">好，这就是咱们今天讲的Nano Banana Pro。现在设计师，特别是平面设计师的天，又一次塌下来了。像我这种工程师直男，现在也可以开开心心地去做各种界面设计、做各种的PPT设计、什么信息图表设计，效果好的一塌糊涂。我们今天没有给大家做任何演示，请大家自己去尝试，以我刚才说的这些提示词自己去试就完了，也没有那么严谨，你说的跟我稍微有些差异都没有任何问题，我相信Nano Banana Pro会震惊你们的。</p>



<p class="wp-block-paragraph">好，这期就讲到这里，感谢大家收听。请帮忙点赞、点小铃铛、参加<a href="https://discord.gg/ppKsNkttTv" target="_blank" rel="noopener">Discord讨论群</a>，也欢迎有兴趣、有能力的朋友参加我们的<a href="https://www.youtube.com/channel/UCUGLhcs3-3y_yhZZsgRzrzw/join" target="_blank" rel="noopener">付费频道</a>，再见。</p>
]]></content:encoded>
					
		
		
			</item>
		<item>
		<title>Gemini 3 Pro对决GPT-5.1：理科状元与全能大师终极一战，谁在定义AI的下半场？｜Gemini 3 Pro、Reasoning、Agentic Capabilities、Multimodal、Google</title>
		<link>https://lukefan.com/2025/11/20/gemini-3-pro-graph-reasoning-training/</link>
		
		<dc:creator><![CDATA[Luke Fan]]></dc:creator>
		<pubDate>Thu, 20 Nov 2025 00:43:05 +0000</pubDate>
				<category><![CDATA[AIGC]]></category>
		<category><![CDATA[Google的故事]]></category>
		<category><![CDATA[AI Agent]]></category>
		<category><![CDATA[AI Studio]]></category>
		<category><![CDATA[AI发展趋势]]></category>
		<category><![CDATA[AI工具调用]]></category>
		<category><![CDATA[AI编程助手]]></category>
		<category><![CDATA[Claude 4.5]]></category>
		<category><![CDATA[Gemini 3 Pro]]></category>
		<category><![CDATA[Generative AI]]></category>
		<category><![CDATA[Google Deepmind]]></category>
		<category><![CDATA[GPT-5.1]]></category>
		<category><![CDATA[Graph Reasoning]]></category>
		<category><![CDATA[Grok 4.1]]></category>
		<category><![CDATA[LMArena跑分]]></category>
		<category><![CDATA[TPU v6]]></category>
		<category><![CDATA[人工智能]]></category>
		<category><![CDATA[原生多模态]]></category>
		<category><![CDATA[合成数据训练]]></category>
		<category><![CDATA[多塔MOE]]></category>
		<category><![CDATA[大模型训练]]></category>
		<category><![CDATA[大模型评测]]></category>
		<category><![CDATA[投机采样]]></category>
		<category><![CDATA[科技前沿]]></category>
		<category><![CDATA[谷歌AI]]></category>
		<category><![CDATA[超强推理]]></category>
		<category><![CDATA[过程奖励模型]]></category>
		<guid isPermaLink="false">https://lukefan.com/?p=2969</guid>

					<description><![CDATA[🔥卧槽！谷歌Gemini 3偷偷上线了？这波真是王炸中的核弹啊！！🤯 2025年了，其他模型还在卷情商（Grok 4.1：段子手附体🤣），Gemini 3直接化身“衡水中学开挂版理科状元”——推理分破1500🔥！人类首次啊兄弟们！GPT-5.1还在当文员，它已经每步推导都精准纠错，工具调用稳如老狗🐶，中间崩？不存在的！💥

更离谱的是训练方式：谷歌拿AI重写全人类论文📚，删光修辞直接喂“硬核推理链”，多模态直接视频+代码配对！小球落地？输出重力加速度Python！🤯 原生工具支撑+TPU V6，速度飞到前任Gemini 2.5的N倍🚀，程序员狂喜到泪目！但...跟它聊天像和学霸对话，爷们我CPU干烧了💥（但真香！）

👉赶紧冲aistudio.google.com试Pro Preview版！别等Grok又截胡了！不点赞？你数学能考满分我倒立吃键盘！👇 评论区喊“Gemini救我”抽三兄弟免梯体验！✨（P.S. 巴菲特加仓信号+1，这波AI泡沫？我先囤卡了！）

#AI核武器 #打工人续命神器 #科技界衡水中学

标题1：Gemini 3 Pro对决GPT-5.1：理科状元与全能大师终极一战，谁在定义AI的下半场？｜Gemini 3 Pro、Reasoning、Agentic Capabilities、Multimodal、Google
标题2：首次突破1500分！谷歌Gemini 3推理封神背后，是这套“衡水中学式”训练法颠覆了规则｜Gemini 3 Pro、Reasoning、Deep Think、Benchmarks、Training
标题3：性能王炸，体验却劝退？实测一天Gemini 3后我悟了：为何最强模型不一定最好用｜Gemini 3 Pro、Reasoning、Agentic Capabilities、Multimodal、Thinking Level
标题4：别只看跑分了，Gemini 3真正的王牌是原生图状推理与过程奖励模型，这才是谷歌甩开对手的秘密｜Gemini 3 Pro、Reasoning、Graph Reasoning、Training、Developers
标题5：谷歌为何放弃发布会，悄悄上线Gemini 3？这场AI巨头间的“截胡”大战，真正被颠覆的不是技术｜Gemini 3 Pro、Reasoning、Google、API、Generative AI
简介：谷歌Gemini 3 Pro已正式上线，其核心亮点在于前所未有的超强Reasoning能力，首次在LMArena Benchmarks中突破1500分。本文深度解析其“图状推理”与原生Multimodal架构的技术突破，探讨它与GPT-5.1等模型的差异，并揭示为何这位“理科状元”将深刻改变Coding和开发者生态。]]></description>
										<content:encoded><![CDATA[
<figure class="wp-block-embed is-type-video is-provider-youtube wp-block-embed-youtube wp-embed-aspect-16-9 wp-has-aspect-ratio"><div class="wp-block-embed__wrapper">
<iframe loading="lazy" title="谷歌为何放弃发布会，悄悄上线Gemini 3？这场AI巨头间的“截胡”大战，真正被颠覆的不是技术｜Gemini 3 Pro、Reasoning、Google、API、Generative AI" width="900" height="506" src="https://www.youtube.com/embed/pcSgOWnyDXQ?feature=oembed" frameborder="0" allow="accelerometer; autoplay; clipboard-write; encrypted-media; gyroscope; picture-in-picture; web-share" referrerpolicy="strict-origin-when-cross-origin" allowfullscreen></iframe>
</div></figure>



<h1 class="wp-block-heading">Gemini 3终于发布了，这一次是真王炸了吧？</h1>



<p class="wp-block-paragraph">大家好，欢迎收听<a href="https://youtube.com/@StoryTellerFan" target="_blank" rel="noopener">老范讲故事的YouTube频道</a>。</p>



<h2 class="wp-block-heading">千呼万唤始出来：Gemini 3的发布背景</h2>



<p class="wp-block-paragraph">2025年11月18日，谷歌<strong>Gemini 3 Pro Preview</strong>版本就这么上架了。为什么要用这样的一个词，“就这么上架了呢”？因为第一，它是千呼万唤始出来。大概从10月份开始，大家就开始传说，谷歌要开始上Gemini 3了。传来传去始终也没上来，到11月份说这个月肯定上。我还听说过是11月22号上，还听说过最晚12月份上，大家一直在等待这样的一个产品。</p>



<p class="wp-block-paragraph">跟它一起传的还有另外一个产品，叫<strong>Nano Banana 2</strong>。因为上一次谷歌引起大家关注、引起大家去下载和使用的产品呢，就是Nano Banana 2，这个生图和改图的模型。这一次说Gemini 3跟Nano Banana 2一起来，而且都在进行测试，甚至很多人信誓旦旦说我用到了，我已经看到了。谷歌从Nano Banana一开始，就采用了一个很奇葩的玩法，就是在大模型发布之前，先给它们起个名字，隐姓埋名，跑到其他的这种测试平台上去测试去。大家觉得这个名字很奇怪，不知道是谁，测完了以后发现巨好，这是不是Gemini 3？那个生图模型是不是Nano Banana 2？大家都在猜这种事情。</p>



<span id="more-2969"></span>



<h2 class="wp-block-heading">巨头争霸：你方唱罢我登场</h2>



<p class="wp-block-paragraph">Nano Banana 2还没有发布，据说是在这个月或者下个月要发布。但是Gemini 3就这么直不愣登就来了。在用户们剥离层层迷雾，寻找Gemini 3和Nano Banana 2期间，其他的大模型厂商也在争先恐后的发东西，比如说<strong>GPT-5.1</strong>、<strong>GPT Atlas</strong>（也就是OpenAI的浏览器），还有<strong>Grok 4.1</strong>。这回是不是真的要来了？为什么会有这样的猜测？因为这帮大公司就跟小孩似的，特别喜欢截胡别人，我要先几天给你发布了，把你这个热点给你抢下去。最爱干这种活的是OpenAI。只要是谷歌说明天开谷歌I/O了，要开大的发布会了，他一定在这个前面一两天给你整点事出来。最有名的是在去年谷歌I/O之前的一天，OpenAI发了<strong>GPT-4o</strong>，一下就把大家震惊住了。</p>



<p class="wp-block-paragraph">这一次的话，Gemini 3之前发布的非常接近的一个产品是谁呢？是Grok 4.1那个产品，也是非常神奇的一个产品，有机会再跟大家细讲。那你说这大公司，他就不能保个密吗？这真没法保密。你要开发布会，要租场地，要动用公关公司，有多少资源在这折腾，所以你是没有办法保密的。即使是你说我不开发布会，我就是偷偷的直接上线了，甭管是谷歌的人，还是Grok的人，或者是OpenAI的人，大家原来都是老同学、老同事，你想瞒真瞒不住。所以在他们的这个圈子里头，是没有什么秘密的。</p>



<h2 class="wp-block-heading">发布前的“小插曲”</h2>



<p class="wp-block-paragraph">在等待Gemini 3期间，我们还遇到了对AI泡沫的质疑，大空头来做空来了。我们还遇到了巴菲特加仓谷歌，因为他原来不怎么买这种科技股或者是互联网公司的。巴菲特原来持仓里边，最大的科技股就是苹果，其他的像什么谷歌这些公司，他基本上不买的。突然减持苹果，大规模加仓谷歌，而且是在巴菲特退休之前的最后一单，说巴菲特是不是老爷子知道点什么了。</p>



<h2 class="wp-block-heading">新的发布潮流：不开发布会，直接上线</h2>



<p class="wp-block-paragraph">就在这样的氛围下，谷歌就突然发布了。而且它的发布没有发布会，这也算是一个新的潮流吧，就是不开发布会，直接写一篇长文，或者写一篇博客，然后产品就直接上线了。这个是最近这一两年里头，突然流行的一种新的玩法。现在的产品发布都是什么呢？第一步，先隐姓埋名，跑到其他的，比如像Open Router这种大模型平台上面去进行测试。等这个传的满城风雨了，啪，一篇文章扔出来，产品就上架了。</p>



<h2 class="wp-block-heading">Gemini 3 Pro Preview 在哪里可以使用？</h2>



<p class="wp-block-paragraph">现在这个产品可以在哪用呢？</p>



<ul class="wp-block-list">
<li>第一个是<strong>AI studio</strong>，大家上<a href="http://aistudio.google.com/" target="_blank" rel="noopener">aistudio.google.com</a>上就可以使用Gemini 3 Pro了。大家注意，它是Gemini 3 Pro Preview，它后边有Preview这个单词，所以未来这个产品应该还会进行快速的迭代，所以有什么做的不太合适的地方，请多担待。</li>



<li>第二个，<strong>Gemini的网站</strong>也可以直接使用了，就是<a href="http://gemini.google.com/" target="_blank" rel="noopener">gemini.google.com</a>上，现在也可以选择Gemini 3 Pro Preview这个版本了。但是呢，它的客户端上，Gemini的APP上还不能使用。</li>



<li>另外呢，他们还发布了一个IDE，这个IDE呢叫<strong>Anti Gravity</strong>，叫做反重力，里面带的Gemini 3 Pro的这个版本，大家可以拿它去写程序了。</li>
</ul>



<h2 class="wp-block-heading">这次是真王炸了吗？大模型差异的感知难题</h2>



<p class="wp-block-paragraph">这次是真王炸了吧？是不是比别人都遥遥领先很多呢？大模型的差异，想要让人有感知，已经越来越困难了。就像是两个人站在你面前，一个人是高考状元，另外一个人呢是高考第二名，你能够通过聊天的过程，把他们俩谁是状元分别出来吗？你分别不出来的。所以现在的大模型，他们的智力已经在很多方面远远超越人类了。所以我们再想去评估说哪个大模型有一定的差异，非常非常困难。</p>



<p class="wp-block-paragraph">很多国内的大模型发布了半天，吹了半天牛，大家为什么没感觉呢？比如像什么GLM 4.6、千问Max呀、Kimi K2 thinking或者是Mini Max M2，这些模型发出来以后说我怎么这么强，大家没感觉，因为你很难感受到他比别人强在哪、差在哪。虽然有跑分，但是现在大家不怎么看跑分了，跑分是比较容易刷的，我们可以刷题就可以直接把跑分刷上去，所以大家不看了。</p>



<p class="wp-block-paragraph">而国际大厂的发布的话，通常还是会有体感的。比如说最近发布的<strong>GPT-5.1</strong>，它要在5.0的基础上多了这个点一出来，确实是更人性了一些，说话不再那么愣了。<strong>Grok 4.1</strong>情商更高，在所有的跑分里头，马斯克的Grok 4.1是情商跑分最高的。而<strong>Gemini 3 Pro</strong>绝对是理工科学霸的感觉，在推理这一块，它遥遥领先超过其他所有人了。</p>



<h2 class="wp-block-heading">Gemini 3 Pro Preview：核心特性一览</h2>



<p class="wp-block-paragraph">分数呢还是要跑的，在很多的跑分方面，要比GPT-5.1、比Grok 4.1、Claude 4.5都要强非常的多。它最关键的领先就在于推理能力，真的是遥遥领先。</p>



<p class="wp-block-paragraph">Gemini 3 Pro Preview到底有什么新特性呢？</p>



<ul class="wp-block-list">
<li><strong>超强推理</strong>：待会咱们就主要讲这个超强推理。</li>



<li><strong>原生多模态</strong>。</li>



<li><strong>开发者跟企业非常友好</strong>：它主要是给程序员和理工科的人去准备的。</li>



<li><strong>原生的工具支撑</strong>：待会咱們去讲什么叫原生工具支撑。</li>



<li><strong>速度飞快</strong>：这个挺难想象的，跑的比原来的模型快好多。</li>
</ul>



<h2 class="wp-block-heading">深入解析：Gemini 的推理能力进化之路</h2>



<p class="wp-block-paragraph">那么Gemini的推理到底是怎么进化到现在这个状态的呢？首先看跑分，他们使用了一个叫<strong>LMArena Elo</strong>的一个跑分，这个跑分呢大于1500分了。这个非常非常关键，是人类做大模型第一次超过1500分，它大概是1501分，从来没有其他大模型超过1500分。那什么意思呢？</p>



<ul class="wp-block-list">
<li><strong>1000-1200分</strong>：入门级会答题了，但是呢逻辑是很容易崩的。</li>



<li><strong>1200-1400分</strong>：中级的，有一定的推理能力。</li>



<li><strong>1400-1500分</strong>：强者，接近当代顶级了。</li>



<li><strong>超过1500分</strong>：进入超强推理者级别了，明显比普通强者要更稳定、更强的一个状态。</li>
</ul>



<p class="wp-block-paragraph">现在呢，GPT也好、Claude 4.5也好、Grok，包括国内的这些模型呢，一般都是在1480-1490之间晃悠，但是很难超过1500。而这个Gemini 3 Pro是第一次超过1500。</p>



<h3 class="wp-block-heading">推理范式的演进</h3>



<p class="wp-block-paragraph">谷歌的推理范式到底是怎么一步一步走到这的呢？所有这些推理模型，第一步走的都是叫<strong>链式推理</strong>，先干什么后干什么，这叫链式推理。从链式推理再往前发展的叫<strong>树状推理</strong>。我除了先干什么后干什么呀，我可以分叉了，我走到某一步搜索完了一个结果以后，我是不是可以一下分出5个X来，把这五个分支都处理掉，这叫树状推理。树状推理再往后呢，叫<strong>图状推理</strong>。这个有什么区别呢？树是只允许分叉，不允许合并的，走到每一个节点只能是越分越细，你不能说我走着走着再把它合并起来。你如果说走着走着又合并起来了，还可以进行反复的去确认，正向走逆向走都可以了，这就是一个图状推理了，这就更进一步了。而最后一步是什么？就是在图的每一个节点都进行工具调用的这种推理。谷歌呢，现在Gemini 3已经走到这一步了。</p>



<p class="wp-block-paragraph">像刚才咱们甭管是链式的，它也是很多个节点，先干什么、后干什么、最后干什么，这是每一个节点里头正常情况下它是不调用工具的。它都是说我自己先想明白了，最后我把整个都想清楚了以后，我们再去调用工具。或者说我一开始先调用一次工具，比如说我搜索了或者读文件了，读完了以后我再去推理，它是这样来工作的。树状推理呢也是这样的，在每一个节点，我都是在大模型内部使用，或者说我根据你提供的上下文去干活，最后给你一个结果。如果要调用工具的话，要么在开始调，要么在结尾调，一般情况下不会在推理的过程中去调用一大堆工具的。而现在谷歌说咱别费劲了，我们在每一个节点上，图节点有可能是分叉的、有可能合并、有可能正向、有可能逆向的这些节点上，我们在任何一个节点上，如果有需要，我就去调用工具了。而且我能够保证它不崩。别人不是说不想干，别人你要想在这个中间节点上调用工具，他有可能逻辑就直接崩掉了。谷歌说我们不用担心这个，我们逻辑特别强，中间不崩。这是Gemini 3这一次做出的最大的创新。</p>



<h3 class="wp-block-heading">与其他模型的对比</h3>



<p class="wp-block-paragraph">其他几家是怎么干的呢？</p>



<ul class="wp-block-list">
<li><strong>OpenAI (GPT)</strong>：它从来不公开这件事，所以GPT是个黑盒子。现在呢，猜测它可能也是这么干的，但是具体是怎么实现的，OpenAI是三缄其口，这压根没说。</li>



<li><strong>Claude</strong>：走的是另外一条路，Claude走的是外挂的路，它的很多的工具调用都是通过像Claude code呀、cursor或者是Claude的客户端，它通过这个东西来去调用的。所以导致什么呢？我们可以在Claude code里去换大模型，因为调用工具的部分是外置的，不是在模型里面的。所以呢，它的调用一方面灵活性提升了，但是呢，它调用模型的这个过程稍微有一些割裂。</li>



<li><strong>国内（如Deepseek）</strong>：走的就是超强的这种推理链，在这个链式推理的基础上不断的往前推进，但是他们在调用工具上就要稍微的差一些。</li>
</ul>



<h2 class="wp-block-heading">“衡水中学”式训练法？Gemini 3是如何炼成的</h2>



<p class="wp-block-paragraph">Gemini 3他到底是怎么训练成这样的？我看了他的训练介绍以后，我觉得这玩意是衡水中学的老师给训练的吧？</p>



<h3 class="wp-block-heading">改变工作方式：预测下一个正确的思维过程</h3>



<p class="wp-block-paragraph">首先呢，Gemini 3改变了工作方式。原来大模型呢是预测下一个词，我下一个词放哪个词出来是最优解，它是这样来工作的。但是呢，Gemini 3不这么工作，它的工作方式是<strong>预测下一个正确的思维过程</strong>。你就不要给我下一个词了，你直接给我一个下一个你要干嘛，然后我们来看看这个是不是最优解。所以在这块呢，就已经发生改变了。</p>



<h3 class="wp-block-heading">训练数据：高质量合成数据</h3>



<p class="wp-block-paragraph">那你说我要想训练Gemini 3，我到底哪找数据去？数据是不是已经被大模型吃干抹净都用完了呢？谷歌已经承认了，所有的人类数据早就被大模型收拾干净了。所以这一次，Gemini 3使用的数据是<strong>合成数据</strong>。怎么合成呢？是用谷歌自己最强的模型阅读人类知识，再生成高质量的推理步骤。它直接训练的都是推理步骤，把所有的教科书、所有的科技论文都通过AI重写，生成训练数据。大家注意，这个里头有两个关键词，第一个关键词叫“<strong>所有</strong>”，谷歌基本上是可以认为它有所有的信息的，他把他能够找到所有的信息都塞进去了。第二个关键词叫“<strong>重写</strong>”，我们写的很多论文也好，或者是很多教材也好，为了让人类可以很好的理解，或者说为了抖个机灵，里头还有非常多的修辞，有非常多的人文的东西在里面，比较啰嗦的东西在里面。他通过重写把这玩意全去了，变成非常非常原始、非常简单的这种推理步骤。你如果遇到这样问题应该怎么推，遇到那样问题怎么推，他是拿这种数据去训练的。</p>



<h3 class="wp-block-heading">原生多模态：Video + Code 配对</h3>



<p class="wp-block-paragraph">而多模态的话是原生对齐。怎么个原生对齐法？原来咱们也号称是各种多模态模型，是用图片跟文字去配对的。就是这是一张图，后边呢是一堆文字，我们把这个东西堆到大模型的数据里头去训练，训练完了以后呢，他就可以去反应那边是一个马还是一个驴，还是在打仗还是什么，他拿这玩意去训练的。现在呢，谷歌用了一个叫<strong>video和code的配对</strong>。你给它一视频，比如说是一个小球落到地上的视频，后边呢你配的不是一个文字“小球掉地上了”，而是一个重力加速度的Python代码。他把这样的一个视频和代码的对儿放到数据集里头去训练多模态模型去了。所以呢，他的模型上来就是世界模型，他是理解物理世界的各种规律的，这个很恐怖。</p>



<h3 class="wp-block-heading">训练策略：过程奖励模型</h3>



<p class="wp-block-paragraph">有了数据了，那下边怎么训练呢？训练策略也很重要。第一个叫<strong>过程奖励模型 (Process Reward Model)</strong>，这个是Gemini 3跟其他人不一样的。现在的大模型呢，拿了一大堆数据去给你去做预训练去，训练好了以后，这个初级模型呢要去做强化学习，让他回答问题，然后让人去纠错。Grok 4.1就属于强化学习做的特别好的这种模型。谷歌说别费劲了，人看不过来，原来都是人看着，现在咱们直接派一个模型看着。他专门训练了一个找错的模型，让他去看着Gemini 3这个预训练模型去做后续的强化学习，然后呢是由人去监督这个找错的模型，看看他工作的状态行不行就OK了。真正底下干脏活累活的已经变成大模型了。针对推理步骤进行评判，即使结果是正确的，只要中间步骤有错误，通通打回去重来。这就是为什么是可以做推理冠军，就是这样了。你做题做到10步的过程中，必须每步都对，然后得出正确答案，我们才认为你是真的学会这道题了。你说我推了中间有三步是错的，但我答案是对的，对不起，从第三步往后通通都没分了。他是这样来控错的。所以我说为什么这个训练过程让我想起了人大附中和衡水中学这种感觉呢。</p>



<h3 class="wp-block-heading">训练创新：预训练阶段即集成工具调用</h3>



<p class="wp-block-paragraph">在训练上呢还有一点跟以前的大模型有一个很大的区别是什么，就是Gemini 3的工具调用是<strong>直接在预训练里头做的</strong>。传统的大模型，甭管是OpenAI的，还是Anthropic或者是国内这些模型，他们都是先把模型训练好，然后呢通过强化学习再把工具调用，哪个地方该搜索了、哪个地方该读什么文件了、哪个地方应该去调用哪个工具了，再往后边再去加进去。Gemini 3它是在预训练的时候就直接把这些搜索呀、调用工具呀这些东西作为初始数据就给训练到模型里去了。这也是为什么谷歌的Gemini它可以在推理的任何一个节点上去进行工具调用，而别的大模型干这事就比较费劲，因为他们都是先做好基础后训练出来的，这个事就比较难了。这就是Gemini 3训练的一个创新点吧。</p>



<h2 class="wp-block-heading">为何如此之快？揭秘Gemini 3的速度奥秘</h2>



<p class="wp-block-paragraph">那你说为什么Gemini 3这么大的模型还飞快呢？它叫Gemini 3 Pro，它不叫Gemini 3 Flash。过个一两个月吧，Gemini 3 Flash应该还会发布，那个时候肯定会比Pro版本要快更多。Gemini 3 Pro就已经比Gemini 2.5 Pro要快非常非常多了。原因呢几个：</p>



<ul class="wp-block-list">
<li><strong>硬件</strong>：谷歌自己家的TPU V6版本已经全面都装到算力中心里去了，都开始干活了，所以速度很快。而且你想他自己设计的芯片，自己做的算法，那一定是配合的紧密无间，没有任何问题。</li>



<li><strong>架构优化</strong>：原来呢，这些模型都是MOE模型，叫做符合专家模型。但是现在呢，Gemini 3叫多塔MOE。什么叫多塔呢？就是你的图文、声音、视频、代码，你到不同的塔里去干活去，每个塔里还有一个专家小组在等着你呢，所以他这样速度就很快了。</li>



<li><strong>投机采样</strong>：最后呢，他们使用了一个东西叫投机采样，就是用一个极小的草稿模型先快速的猜出后边的几十个词，然后由大模型一次性验证，这比大模型一个字一个字往外蹦要快非常非常多了。</li>
</ul>



<h2 class="wp-block-heading">全面领先？四大顶尖模型角色定位</h2>



<p class="wp-block-paragraph">Gemini 3现在到底算不算全面领先了呢？这么讲吧，Gemini 3 Pro就是一个理科状元加上多模态分析师的一个形象。但是呢，你跟他聊天也像是在跟理科状元聊天。你想想理科状元那个语气、语调都是什么样的，大家自己脑补一下，就知道Gemini 3到底擅长干什么、不擅长干什么了。</p>



<ul class="wp-block-list">
<li><strong>Grok 4.1</strong>：是互联网老司机加上自信段子手，没有什么他不敢说的，胆子比较大，情商测试第一名。你如果想找人去陪你聊天，想聊着开心，你就找这个Grok 4.1没跑，在这点上它要比Gemini 3要强很多。</li>



<li><strong>OpenAI家的GPT-5.1</strong>：算是全能型创作大师加上生态整合之王。因为毕竟他是老大嘛，头一个做出来的，所以他生态整合，就是跟各种工具的结合，还是非常非常好的。而且呢，他很适合做各种的文档创作，像是一个四平八稳的文员吧。</li>



<li><strong>Claude 4.5 sonnet</strong>：算是语言艺术家加上安全派哲思者，它很适合做各种的合规、企业内的这种需要进行反复验证的这种文档，它写的要比GPT-5.1还要好一点点。GPT-5.1更创意一点吧，Claude 4.5 sonnet更擅长做长篇写作、逻辑清晰、道德判断、企业合规表达。</li>
</ul>



<p class="wp-block-paragraph">而Claude 4.5呢原来是编程冠军，现在的话肯定要经受Gemini 3的挑战了，到底哪个好使哪个不好使，要过几天再出结果。</p>



<p class="wp-block-paragraph">至于国内的大模型呢，还在努力追赶吧。国内大模型的唯一优势就是开源，巨大的模型开源呢，你们拿愿意拿回去自己折腾都没关系。</p>



<h2 class="wp-block-heading">总结</h2>



<p class="wp-block-paragraph">最后总结一下：</p>



<ul class="wp-block-list">
<li>今天的内容全部是Gemini 3 Pro整理生成的。如果哪说错了不要骂我，去骂Gemini 3 Pro。</li>



<li>第二个，我其实呢并不喜欢用Gemini 3 Pro，今天用了一天，原因也很简单，跟理科状元聊天还是有点累的。</li>



<li>AI还在快速的发展，Gemini 3真正的价值不是说它给我们训练出了一个理科状元，而是提出了一套新的方法论，怎么能够训练出一个理科状元来，这个是非常非常有价值的。有卡的公司就可以照着这个思路去尝试了。</li>



<li>至于没卡的公司怎么办，那就是另外一回事了。希望这一轮对AI泡沫的质疑可以快一些过去吧，Gemini 3 Pro确确实实是可以解决很多原来无法解决的问题的。</li>
</ul>



<p class="wp-block-paragraph">好，今天就讲到这里，感谢大家收听。请帮忙点赞、点小铃铛、参加<a href="https://discord.gg/ppKsNkttTv" target="_blank" rel="noopener">discord讨论群</a>，也欢迎有兴趣、有能力的朋友加入我们的<a href="https://www.youtube.com/channel/UCUGLhcs3-3y_yhZZsgRzrzw/join" target="_blank" rel="noopener">付费频道</a>。再见。</p>
]]></content:encoded>
					
		
		
			</item>
		<item>
		<title>谷歌这次玩大了？Willow芯片用“时间倒放”算法成功模拟分子，让量子计算不再是实验室玩具，首次展现出改变药物和材料科学的潜力｜量子计算 谷歌 量子突破 实际应用 医学应用</title>
		<link>https://lukefan.com/2025/10/26/google-willow-quantum-chip-breakthrough-verified-applications-china/</link>
		
		<dc:creator><![CDATA[Luke Fan]]></dc:creator>
		<pubDate>Sun, 26 Oct 2025 00:44:23 +0000</pubDate>
				<category><![CDATA[Google的故事]]></category>
		<category><![CDATA[Willow芯片]]></category>
		<category><![CDATA[九章量子计算机]]></category>
		<category><![CDATA[人工智能]]></category>
		<category><![CDATA[分子模拟]]></category>
		<category><![CDATA[医学应用]]></category>
		<category><![CDATA[可验证的量子优势]]></category>
		<category><![CDATA[实际应用]]></category>
		<category><![CDATA[性能超越]]></category>
		<category><![CDATA[技术突破]]></category>
		<category><![CDATA[材料科学]]></category>
		<category><![CDATA[稀释制冷机]]></category>
		<category><![CDATA[约瑟夫森结]]></category>
		<category><![CDATA[药物研发]]></category>
		<category><![CDATA[谷歌]]></category>
		<category><![CDATA[谷歌量子AI]]></category>
		<category><![CDATA[超导量子计算机]]></category>
		<category><![CDATA[超级计算机]]></category>
		<category><![CDATA[量子回声算法]]></category>
		<category><![CDATA[量子处理器]]></category>
		<category><![CDATA[量子比特]]></category>
		<category><![CDATA[量子突破]]></category>
		<category><![CDATA[量子算法]]></category>
		<category><![CDATA[量子计算]]></category>
		<category><![CDATA[量子霸权]]></category>
		<guid isPermaLink="false">https://lukefan.com/?p=2756</guid>

					<description><![CDATA[兄弟们！谷歌量子芯片又又又炸了！💥 以前量子计算像岳云鹏说相声——73×58=79？算得飞快但瞎扯！😅 现在Willow直接甩王炸：它能煮汤还分得清生抽老抽！🍲 把二甲基联苯分子当猪肘子炖，微波一怼就记录"扭屁股"细节，还和核磁共振结果对上号！这波真·厨房黑科技，药物研发直接开挂！💊

重点来了：结果终于能验证了！不再是"别管对不对，你问快不快"😂 诺贝尔物理学奖亲爹研发的"约瑟夫森结"，让氦3/氦4在冰箱里跳探戈（对，就是一台200万美金的稀释分层制冷器！），把原子振动按头静音。🤯

中国九章3号也狂飙！光学路线常温能干，LNG厂+核电站补氦气，冰箱厂已开工🇨🇳 虽然规模小，但咱造冰箱谁不会？？？

别等了！量子时代真要卷进你火锅了🍲 点个赞，让我看看多少人想用它煮老抽实验？？？评论区吼一句"生抽yyds"👇 #量子真香 #科技狂人

标题1：别只看中美路线之争了，量子计算的真正战场已经转移！从“算得快但算不对”到结果可验证，这才是决定未来的关键｜量子计算 谷歌 Willow芯片 量子突破 可验证的量子优势
标题2：超越最强超算13000倍只是个开始！谷歌解决了“算得快但算不对”的核心难题，结果首次可被稳定验证｜量子计算 谷歌 Willow芯片 量子突破 超级计算机 实际应用
标题3：谷歌这次玩大了？Willow芯片用“时间倒放”算法成功模拟分子，让量子计算不再是实验室玩具，首次展现出改变药物和材料科学的潜力｜量子计算 谷歌 量子突破 实际应用 医学应用
标题4：量子计算的“岳云鹏相声”时代结束了！过去算得快但没人知道对不对，现在谷歌Willow芯片首次实现结果可验证｜量子计算 谷歌 量子突破 可验证的量子优势 算法 实际应用
标题5：这次不再是抽象的数学游戏！谷歌用量子芯片成功模拟真实分子活动，精度堪比核磁共振，新药研发和材料科学的未来已来｜量子计算 谷歌 Willow芯片 实际应用 医学应用 材料科学
简介：谷歌在量子计算领域取得重大进展。其最新的Willow芯片不仅在性能上远超传统超级计算机，更关键的是首次实现了可验证的量子优势，解决了过去“算得快但结果不准”的难题。通过成功模拟真实分子，这一技术突破为药物研发、材料科学等实际应用开启了新的可能性。]]></description>
										<content:encoded><![CDATA[
<figure class="wp-block-embed is-type-video is-provider-youtube wp-block-embed-youtube wp-embed-aspect-16-9 wp-has-aspect-ratio"><div class="wp-block-embed__wrapper">
<iframe loading="lazy" title="谷歌这次玩大了？Willow芯片用“时间倒放”算法成功模拟分子，让量子计算不再是实验室玩具，首次展现出改变药物和材料科学的潜力｜量子计算 谷歌 量子突破 实际应用 医学应用" width="900" height="506" src="https://www.youtube.com/embed/2aUCMvCggbQ?feature=oembed" frameborder="0" allow="accelerometer; autoplay; clipboard-write; encrypted-media; gyroscope; picture-in-picture; web-share" referrerpolicy="strict-origin-when-cross-origin" allowfullscreen></iframe>
</div></figure>



<p class="wp-block-paragraph">谷歌的Willow量子芯片又有了新突破，听我给大家讲一讲它到底干了什么。</p>



<p class="wp-block-paragraph">大家好，欢迎收听<a href="https://youtube.com/@StoryTellerFan" target="_blank" rel="noopener">老范讲故事的YouTube频道</a>。今天呢，准备挑战一下自己的极限，尽量用通俗易懂的语言，将Willow量子芯片的成果跟大家讲个热闹。注意，咱们是讲个热闹，如果您就是研究量子计算的，不要上我这来较真。</p>



<p class="wp-block-paragraph">今天呢，咱们讲几块：第一个，这东西到底长啥样？第二个，Willow和今年的诺贝尔物理学奖到底是什么关系？第三个，这一次具体做了点什么？第四个，这一次的意义在哪里？第五个，中国量子计算机跑到什么地方了？</p>



<p class="wp-block-paragraph">首先，这个机器到底长什么样呢？其实没有公开的照片。现在大家能够看到的照片，就是很多管子一层一层叠下，其实是外边的一个巨大的冰箱。当然，你说管这玩意叫冰箱呢，我觉得是侮辱了这个制冷器，因为它要比冰箱强大很多，但是它工作的原理就是制冷。这个东西呢，叫稀释分层制冷器。稀释呢，就是我把一个浓盐水稀释成稀盐水。分层的意思是什么？就是上面呢比较热，一层一层地把这个热量传递出去，越往下呢它越冷，所以它是一个叫分层制冷器。</p>



<span id="more-2756"></span>



<p class="wp-block-paragraph">那么这个东西怎么制冷的呢？它不像咱们的冰箱似的，冰箱是有制冷剂，它实际上是一个物理过程，要把这个热量吸走，再把气态的这些制冷剂呢，送到外边这个压缩机里，重新把它压缩，因为压缩就要散发热量，再把这热量散掉，然后再把它循环起来。而今天我们看到的这个很科幻的、叫稀释分层制冷器呢，它的制冷原理是使用氦3和氦4的吸热循环过程。什么意思呢？就是氦呢有两个同位素。咱们大部分的氦实际上是氦4，就是两个质子、两个中子，它的原子量是4，所以这东西叫氦4。这个东西呢，其实相对来说还是比较容易获得的，在LNG制备过程中的一个副产品，就是咱们去做那个液化天然气的时候，它就会产生一点点氦4。那氦3呢，实际上是氦的一个同位素，就是它有两个质子，但是呢只有一个中子。这个玩意呢就比较费劲了，它是要到核反应堆里边去制备，等于拿氦4制备以后呢，就可以得到氦3。</p>



<p class="wp-block-paragraph">在很低的温度下，氦3跟氦4呢都是液体，它们叫氦池，氦3在上面，氦4在底下。氦3呢有一部分呢，就会融入到氦4里边去，在这个过程中呢把热量吸走，它是这样来工作的。制冷剂嘛，总要循环。你再把这个已经融入了一部分氦3的这些氦4呢，放到旁边的一个小罐里，再稍微加热一下，因为氦3的沸点呢，是相对来说比较容易达到，所以氦3就直接挥发掉了，氦4留下来了。然后呢，把挥发掉的氦3重新再去压缩，把这个氦4再重新塞回到池子里去，它就等于做这样的一个循环。这东西呢，其实也不是特别贵，就看着说的很复杂。一台机器的话，大概是50万到200万美金之间，大概是跟功率和你到底提供多少氦3有关。刚才咱们讲氦4比较容易得到，氦3是一个相对来说比较难搞的东西。通常的每台机器里头会给几十升，有的会给上百升氦3。氦3大概一升是两三千美金吧，也不是特别昂贵的一个东西。功率呢也不是很高，这个东西几千瓦。这就是现在我们看到的Willow外边这个大冰柜，或者叫制冷剂，它的一个基本情况。</p>



<p class="wp-block-paragraph">Willow呢，是在低温超导环境下进行量子计算的。那么Willow跟今年的诺贝尔物理学奖有什么关系？今年的诺贝尔物理学奖呢，颁给了一个叫量子隧穿的技术，就是我们可以把一些量子在赋予一定的能量之后，让它穿越到物质的另一侧去。今年得奖的这些人呢，有一个是原来Willow实验室的老大，还有一个是现在还在Willow实验室，所以呢今年物理学奖就是Willow芯片的一个底层逻辑得奖了。这个里边有一个东西叫约瑟夫森结，也就是当你给这个电子加到一定能量以后，他就会穿越这个约瑟夫森节，去模拟一个电子跃迁的过程。那你说光有电子直接跃迁不就完事了吗？那你观察不到。你必须要有更多的粒子结合在一起，让它穿越这个约瑟夫森结，模拟电子跃迁的这个过程，我们才可以去观察到。</p>



<p class="wp-block-paragraph">所以呢，Willow这个芯片里头呢，是有很多很多的这种超导电路，每一个超导电路里头模拟一个原子。具体这个原子到底是碳原子、还是氢原子还是什么原子，这个不重要。模拟的方式呢，就是当我有很多的能量进去的时候，这些电子是可以跃迁的，原子呢也可以进行自旋。这个Willow里头有门，叫单门和双门，这是它真正干活的一个主要的东西。什么叫单门？就是这有一个电路，里头模拟了一个电子，有能量进去，就会通过约瑟夫森杰，去模拟这种能量跃迁一个过程。这就是一个单门，里头一个原子。什么是双门呢？就是俩原子中间有一个小门，这个门呢如果打开了，这两个原子之间的运动状态就会相互影响。比如说这边是怎么转呢，你打开了以后，另外一个就会跟着一起转，或者是有一些能量就会传递过去，这玩意叫双门。现在的Willow呢，可以准确的开关这些双门，就是Willow可以干活的一个关键了。所以呢，它是低温超导，可以过滤掉原子振动的这些杂波。你如果没有超低温的话，你旁边这些设备的原子就开始振动了，你就没法去观察。所以这个结果呢，必须在低温超导下才可以去阅读。这就是它到底长什么样，以及这个东西跟今年的诺贝尔物理学奖到底有什么关系。</p>



<p class="wp-block-paragraph">那么这一次到底做了什么呢？每一次呢，咱们去解释量子芯片工作原理的时候，都要去讲一个东西，叫高尔顿钉板。这个东西是什么呢？就是有一大堆钉子，这个小球从上头开始往下掉，每过一层你会碰到一个钉子，每过一层碰到一个钉。碰到钉子以后呢，你有50%的几率向左，有50%的几率向右。很多层钉板以后，底下有一个槽，你到底是落在哪个槽里头？他是这样的一个东西。那你说这玩意有什么难的呀？但是你每一次扔下一个球去以后，然后计算在哪一个槽里掉落的这个几率有多少，这个玩意你要用普通的计算机去算，你到底掉多少层，哪一层的几率是什么样，这个很麻烦。但是你如果用量子计算机去算，你就相对来说容易一点。他干嘛呢？我就别算了，直接往下扔吧，扔完了以后到底下去数不就完了吗？</p>



<p class="wp-block-paragraph">正常的高尔顿钉板，你没有任何人去干扰他的情况下，扔下去的结果是什么呢？一定是一个钟形，这样的一个形状，越往中间下落的这个比例越高，越往边上比例越低。但如果有人去干预了，中间我碰了他一下，或者是哪个地方我去拨了他一把，在这种情况下的话，你这个钟型就会跟原来有差异，然后我去进行比较。所以好多的量子计算的算法就是这样的，就是我们直接把量子扔出去，然后到那头去数数，我看看结果是什么样的，我就不用再去设计好逻辑去算概率什么，就不用费这劲了。你直接跑就完了。</p>



<p class="wp-block-paragraph">那么这一次，谷歌做的是一个什么东西呢？它叫乱序时间相关器，叫out of time order correlator，OTOC就这样的一个简称。别研究这个东西什么意思，我也不去跟大家具体讲。我们先让一个系统让它转起来，就是这一个芯片上，有这么多的量子位，它们相互之间开始影响了。刚才我也讲了，它是很多个模拟原子，它们之间开始发生影响，开始运动起来了。它在这个时候呢，拨动其中一个，实际上怎么拨动？就是通过外边的微波呀去照射呀，或者去影响其中的某一个特定的原子，然后让这个原子发生了一些的运动，然后把整个的过程记录下来，再去进行倒放。说现在我们重新倒序地把这个过程重新放一遍。他们做两次，一次呢是你拨了这个原子的，一次是你没拨的。然后他拿俩数去对比，对比完了以后得到一个结果。乱序时间相关器，大概是干这么个活。</p>



<p class="wp-block-paragraph">那你说这个到底是干嘛使的呢？或者说有没有形象一点的案例？有。这个相当于什么呢？咱们煮了一锅汤。这锅汤呢一开始是白水，我们在这边下盐、下醋、下酱油、下猪肘子、下葱花、下料酒，反正炖出一锅猪肘子吧。他有办法可以经过精确的观察，把这个下料的过程以及这个料里边的一些味觉的元素扩散的过程都记下来，还可以倒放。下一次呢，我们酱油从生抽换成老抽，我们再观察一次，然后再把这两个倒放的结果呢，去比较看一下，生抽跟老抽在里边到底有什么区别。大概就干这么个活。所以呢，这个量子计算，它并不是我们平时去算什么1+1=2，或者2*2=4，不是算这东西。它算的是什么呢？一般都是说我们要设计一个物理实验，设计完物理实验以后呢，去进行观察，看看这数到底是多少，然后呢我们去验证这个结果对不对，再去得到最终的结果。这是一般的量子计算机干活的一个原理。</p>



<p class="wp-block-paragraph">继续讲前面那高尔顿钉板。现在等于是我可以把小球扔下去了，一把小球都扔下去，看看形成钟型的这个过程是什么样的，然后倒放回来，把里头每一个细节都记录下来。再往后再往下扔小球的时候，我中间对其中的某一个小球或者某一些元素进行了改变，得到了一个不是完美钟形的结果，然后再倒放，然后把两个倒放的去比较，就看看你这个改变到底是怎么影响最底下这个钟的。他基本上这一次就干了这么个活。</p>



<p class="wp-block-paragraph">那你说这样的系统能不能编程呢？这个是谷歌做的一个很大的贡献，它这个系统是可以编程的。因为它有门嘛，它这个门是可以开可以关的，所以可以编程。但是呢，编程并没有那么简单，不是说我直接像在计算机一样，我写了个程序，把这参数改了一下，然后命令编译执行就完事了，不是这么简单的。因为呢，它是一个设计实验的过程。所以呢，我们可以编说这个门哪什么时候开，什么时候关，怎么快速地开，怎么快速地关，我们要去设计。这个数据是如何回收的，以及呢数据是如何进行验证的，把这些东西都调试完了以后，才可以去做下一个算法。所以呢，你用Willow这样的芯片去换一个算法的话，大概也需要几周甚至几个月的时间。因为你需要在里头调很多很多的细节，这个门到底是怎么开的怎么关的，我发现这个数据被污染没法用了，我再换一个方式。甚至有的时候你可能还写不出来，我怎么着也没法去收集到稳定可辨识的这个数据出来，我每次算出来数都不一样，那你就没法整。</p>



<p class="wp-block-paragraph">那么这一次实验的意义到底在什么地方呢？咱们讲了半天说Willow很厉害。第一个，就是他的结果可验证。这个对于量子计算来说，是非常非常难的。什么叫结果可验证？大家还记得原来岳云鹏有一个段子吗？他说我这人数学特别好，算的可快了。人家就问他那73*58等于几？他说等于79。人家说对吗？这怎么可能等于79呢？他说你别管对不对，你就问快不快吧。原来的量子计算呢，就属于这样的一个状态。它每次都给你算一数来，而且每次数还都不一样，飞快飞快就给你得到结论了，因为你最后是观察出来的结果嘛。但是你不知道对不对，你没法验证这个东西。</p>



<p class="wp-block-paragraph">那么现在呢，谷歌说我可以验证了。去年12月份他们就有了一种验证方法，就是我把很多个量子比特结合在一起，做成一个逻辑比特，以后他每一次的结果是可验证的。我记得当时他们是把49个量子比特做成一个的逻辑比特，去进行可验证的，就是计算结果的一个回收。这一次的实验也是可以验证。用谷歌的这个Willow，你去反复多少次，他这个结果是一致的。你要用其他的不同结构的量子芯片，你去算这个东西，它的结果也是一致的。即使是用传统的计算机去算，它号称是比传统的现在最强的这种超算快13,000倍，但是呢他们也是可以进行相应的检验，就是这个结果是对的。这是非常非常难的。2019年谷歌在喊量子霸权的时候，量子计算机的那个计算结果还是不可观测，或者说不可验证的。现在已经可以验证你得到的结果是正确的了。</p>



<p class="wp-block-paragraph">第二个重大意义是什么呢？就是这一次的实验，它是有实际意义。以前的所有量子计算机的实验，都是一些抽象的数学问题，在现实工程中是没有意义的。那么这一次它有什么意义呢？他们这一次拿了一些化学的这种分子，直接去进行观察了。他们这次呢，用的叫二甲基联苯的一个分子，先做核磁得到一个核磁光谱，然后呢用芯片里边去模拟这些分子上的这些原子，去做这个两个苯环之间的扭转角度到底有什么样的变化，他来做这样的一个实验。做完了以后呢，再对这个结果去进行核磁共振的验证，说我做了这样的一个互动以后，光谱就应该发生什么样的变化。然后我们再对真实的二甲基联苯也做同样的处理，在芯片里头是模拟了一个原子，我对它进行了一个触动，在这个分子里头，我就直接找微波去照射那个原子，不就完了吗？或者我找一些能量数去照射这个原子，我对它赋能了。然后我们看看这个苯环发生了一些什么样的变化，发生变化了以后，你这个核磁光谱就会发生变化。然后他对两个进行验证，发现对上了，我们计算的结果是正确的。在这样的一个结果出来以后的话，那么应用的方式大家也就能想明白了：药物以及材料学领域，它就已经有被应用的可能性了。</p>



<p class="wp-block-paragraph">那你说这个东西是不是马上就可以改变我们生活了呢？还有点距离。因为现在的Willow有一个很大的问题，比较难以攻克，是什么？就是规模。它现在里边也就是100多个量子比特，你说我想再扩大到几万个，或者是这个几千个，这非常非常难。因为咱们前头讲那冰箱，那个冰箱做起来也很费劲。你把这么多的设备搁在一起以后，再让它去稳定的运行，还能够观测到不受干扰的结果出来，目前呢谷歌还在努力往前走。所以呢，我们如果真的想让它去实际起作用，还要稍微的再等几年。</p>



<p class="wp-block-paragraph">再往后呢是，中国的量子计算机发展成什么样了？咱每次讲完老外的，咱得讲讲咱自己的。咱们呢叫九章算术，九章3号现在已经做出来了。咱们的这个路径呢，跟谷歌这不太一样，咱们呢是使用的叫光学量子计算机，谷歌呢叫超导门型量子计算机。那咱们这个光学量子计算机呢，现在优点是什么？就是咱们在常温里头就可以干活了，你不需要把它送到低温超导里头去。当然你最后读那个数据的时候，还需要低温，但是不像他那么要求严格。而且呢，光子天然就可以抗衡跑偏，这块呢要比他那个强。因为他是模拟了一个原子嘛，所以呢很适合做量子通讯以及专用的一些采样。所以这个是我们比较强的。我们现在呢，应该是做了一些波色子采样的一些实验，也就是验证了量子计算呢，是可以使用的。但是呢，具体实际应用，我们现在还都没做出来。</p>



<p class="wp-block-paragraph">但是这个光学的也有缺点。第一是光子损耗很大，单光子源以及探测的效果呢，是受影响的。可编程大规模集成是非常非常困难。现在我们使用的通过这种分光器，通过物理的方式来去干活的，它不像谷歌那个东西，它有门，你可以控制它开门关门，咱们呢现在还没有办法来做这个事情。所以现在呢，我们是可以叫采样演示，就这边干完活，那边我可以把数读出来了。但是呢，离彻底的纠错，因为你不纠错，这事只是算的快，离彻底的纠错和实际应用呢，还有一定的距离。</p>



<p class="wp-block-paragraph">谷歌的这种超导门型计算机呢，它的优点是门控通用性强，您可以开门关门，可以写程序，而且呢跟纠错的这个算法天然匹配。产业链包括制冷、控制电子、工艺也相对来说比较成熟了。但是它的缺点是什么呢？就是超低温基础设施和制造的良品率、抗干扰泄漏，这些都是需要攻克的。他怎么扩张到百万级的物理单元里头去？这个呢，对于工程上都有挑战。所以现在甭管是他们这条路，还是咱们这条路，想要真正达到实用，还是要再等一等。当然现在谷歌这个还是要比咱们更领先。那领先嘛，好办。中国人也不是不会造冰箱。所以国内呢，现在也有几个大厂在去造这种西式分级制冷器，咱们现在也能造。而且你想咱们是LNG也都有，也买美国的，咱自己也能造出来。咱们也有一大堆的核电站，所以甭管是氦3还是氦4呢，咱们都是可以有能力制备的。这块国内应该有四五个吧，甚至更多一些造这个制冷机的公司。咱们的很多的科研院所也开始在复建谷歌这条路。</p>



<p class="wp-block-paragraph">最后总结一下吧。量子计算呢正在向我们走来，也在做实用性的探索。这一次呢就是第一次实用性探索。距离应用呢虽然还有差距，但是我觉得应该离我们不是特别遥远了。</p>



<p class="wp-block-paragraph">最后呢，我也给自己了一个挑战，研究了一上午，尽可能用通俗的方式呢跟大家讲解，至少让大家听个热闹，不会说听完了以后，听了一脑子，最后啥也没听明白，尽量让大家有一些稍微形象一点的认知吧。</p>



<p class="wp-block-paragraph">好，这个故事就跟大家讲到这里，感谢大家收听。请帮忙点赞、点小铃铛、参加<a href="https://discord.gg/ppKsNkttTv" target="_blank" rel="noopener">DISCORD讨论群</a>。也欢迎有兴趣、有能力的朋友加入我们的<a href="https://www.youtube.com/channel/UCUGLhcs3-3y_yhZZsgRzrzw/join" target="_blank" rel="noopener">付费频道</a>。再见。</p>
]]></content:encoded>
					
		
		
			</item>
	</channel>
</rss>
