<?xml version="1.0" encoding="UTF-8"?><rss version="2.0"
	xmlns:content="http://purl.org/rss/1.0/modules/content/"
	xmlns:wfw="http://wellformedweb.org/CommentAPI/"
	xmlns:dc="http://purl.org/dc/elements/1.1/"
	xmlns:atom="http://www.w3.org/2005/Atom"
	xmlns:sy="http://purl.org/rss/1.0/modules/syndication/"
	xmlns:slash="http://purl.org/rss/1.0/modules/slash/"
	>

<channel>
	<title>Google的故事 &#8211; 老范讲故事｜AI、大模型与商业世界的故事</title>
	<atom:link href="https://lukefan.com/category/google%e7%9a%84%e6%95%85%e4%ba%8b/feed/" rel="self" type="application/rss+xml" />
	<link>https://lukefan.com</link>
	<description>这里是老范讲故事的主站，持续更新 AIGC、大模型、互联网平台、商业冲突与资本市场观察，帮你看清热点背后的底层逻辑。</description>
	<lastBuildDate>Tue, 03 Mar 2026 00:45:59 +0000</lastBuildDate>
	<language>zh-Hans</language>
	<sy:updatePeriod>
	hourly	</sy:updatePeriod>
	<sy:updateFrequency>
	1	</sy:updateFrequency>
	<generator>https://wordpress.org/?v=6.9.4</generator>

<image>
	<url>https://lukefan.com/wp-content/uploads/2026/03/cropped-jimeng-2026-02-28-5245-用图一的人物形象，替换图二中的人物，使用图二的风格。文字替换：老范讲故事，Yo-32x32.jpeg</url>
	<title>Google的故事 &#8211; 老范讲故事｜AI、大模型与商业世界的故事</title>
	<link>https://lukefan.com</link>
	<width>32</width>
	<height>32</height>
</image> 
	<item>
		<title>尼姑的光头（跨应用操作），为什么和尚（Google）摸得，阿Q（豆包）摸不得？Elon Musk应该也摸不得。</title>
		<link>https://lukefan.com/2026/03/03/google-vs-doubao-cross-app-ai-agent-android17-intelligent-os-ecosystem-control-trust/</link>
		
		<dc:creator><![CDATA[老范 讲故事]]></dc:creator>
		<pubDate>Tue, 03 Mar 2026 00:45:57 +0000</pubDate>
				<category><![CDATA[AIGC]]></category>
		<category><![CDATA[Google的故事]]></category>
		<category><![CDATA[字节跳动，故事多]]></category>
		<category><![CDATA[AI助手入口流量争夺战]]></category>
		<category><![CDATA[Android App Functions接口]]></category>
		<category><![CDATA[Gemini跨应用操作]]></category>
		<category><![CDATA[Google Android 17 agentic AI]]></category>
		<category><![CDATA[MCP远端调用协议]]></category>
		<category><![CDATA[UI Automation自动化框架]]></category>
		<category><![CDATA[三星Galaxy S26智能操作系统]]></category>
		<category><![CDATA[豆包手机封禁事件]]></category>
		<guid isPermaLink="false">https://lukefan.com/?p=3589</guid>

					<description><![CDATA[跨应用 AI agent 正在变成“新入口”，但为什么谷歌在安卓17/Galaxy S26 上能做，豆包手机却被超级APP、支付与银行应用迅速封禁？本文拆解谷歌的三条路径：MCP 远端调用、APP Functions 接口、以及 UI 自动化，并对比豆包几乎只能走 UI 自动化导致的合规与信任风险。同时从生态位、标准制定权、信誉与上线节奏解释“谁能摸、谁不能摸”，并延伸到马斯克跨平台自动化同样面临的阻力，给出企业与个人如何适配 AI 分发时代的建议。]]></description>
										<content:encoded><![CDATA[
<figure class="wp-block-embed is-type-video is-provider-youtube wp-block-embed-youtube wp-embed-aspect-16-9 wp-has-aspect-ratio"><div class="wp-block-embed__wrapper">
<iframe title="跨应用AI Agent来了：谷歌安卓17为何能做豆包做不了？Musk的巨硬，应该也很难。" width="900" height="506" src="https://www.youtube.com/embed/Jndny4tVouE?feature=oembed" frameborder="0" allow="accelerometer; autoplay; clipboard-write; encrypted-media; gyroscope; picture-in-picture; web-share" referrerpolicy="strict-origin-when-cross-origin" allowfullscreen></iframe>
</div></figure>



<figure class="wp-block-image size-large"><img decoding="async" src="https://pictures.lukefan.com/google-vs-doubao-cross-app-ai-agent-android17-intelligent-os-ecosystem-control-trust/blog_1.jpeg" alt="一张复古羊皮纸风格的插画：桌上摊开一部智能手机，屏幕上有“跨应用 AI assistant”字样与多个APP图标被线条连接，旁边一只手犹豫地伸向屏幕，暗示“能不能摸”的争议，羊皮纸，钢笔彩色手绘的统一风格。"/></figure>



<p><strong>小尼姑的光头和尚摸得，我就摸不得吗？</strong>跨应用 AI agent，谷歌摸得，为什么豆包就摸不得？马斯克估计也摸不得。</p>



<p>大家好，欢迎收听老范讲故事的 Youtube 频道。</p>



<p>咱们想象这样的一个场景：中兴公司的老板跑到巴塞罗那去，看到谷歌跟三星联合推出的新一代智能手机操作系统，无语落泪。为什么？因为去年跟豆包合作、推出豆包手机的就是中兴。巴塞罗那 MWC2026 上，谷歌跟三星推出了 agentic AI，加上跨应用的能力，实际上就是跟去年豆包手机差不多的一个东西。</p>



<p>谷歌也发声了：在三星 Galaxy S26 上，我们发布了这样的一个东西，这是一个智能操作系统。它直接用了 Intelligent OS 这样一个词，我们都不好意思再叫安卓了，其实还是安卓，但是我们给它起了个新名字，叫智能操作系统。这不就是去年的豆包手机吗？</p>



<p>豆包手机推出以后，闪电般地被各种超级 APP、电商应用、支付和银行应用给封禁了，所以这个东西就无疾而终了。谷歌这次推出的产品，却被赞为下一代的智能操作系统。小尼姑的头谷歌摸得，豆包就摸不得，所以中兴的老板看着只能在那里无语落泪了。</p>



<span id="more-3589"></span>



<h2 class="wp-block-heading">今天故事分六块</h2>



<ol class="wp-block-list">
<li>谷歌到底干了什么</li>



<li>从技术角度上说，谷歌跟豆包到底有什么相同和不同</li>



<li>除了技术之外，在市场地位、信誉以及行动的激进程度上，谷歌跟豆包到底有什么不一样</li>



<li>为什么说小尼姑的头埃隆·马斯克他也摸不得</li>



<li>新的智能终端、APP 这种形式必然被革命，但是过程很重要</li>



<li>我们到底能够在这过程中做些什么</li>
</ol>



<h2 class="wp-block-heading">一、谷歌到底干了什么</h2>



<figure class="wp-block-image size-large"><img decoding="async" src="https://pictures.lukefan.com/google-vs-doubao-cross-app-ai-agent-android17-intelligent-os-ecosystem-control-trust/blog_2.jpeg" alt="复古羊皮纸插画：发布会舞台上写着“Android 17 / Intelligent OS”，左侧是谷歌标志与Gemini图形，右侧是三星Galaxy S26手机特写，台下观众席中几位手机厂商代表在记笔记，羊皮纸，钢笔彩色手绘的统一风格。"/></figure>



<p>首先，谷歌干什么了？它其实是推出了安卓 17 版。大家注意，谷歌每一次出安卓版本之后，三星、小米、中兴，所有在国外去卖手机的这些厂商，他们要去跟谷歌签协议，签完了以后回来去定制。谷歌的安卓 17 在三星 Galaxy S26 上，这个定制版本就实现了跨应用访问的这样的一个能力。</p>



<p>它其实是 Gemini APP 的一个 Beta 版，先在美国和韩国部分设备、部分品类，也就是外卖、订餐和打车上上线了，其他的一些还没有上去。咱们刚才讲这段话是什么意思？就是谷歌其实是非常谨慎的，只在很少的设备上、很少的国家和地区、很少的场景上上线了，而不是像豆包似的，咔一把全来了。</p>



<p>目前就是在三星 Galaxy S26 上可用。谷歌自己家的亲儿子 Pixel 10，部分功能可用，还没有三星上的功能那么多。原因也很简单，这种东西功能多了以后会很耗电的，三星在这一块应该是控制得会更好一些吧。它精选场景、精选 APP 起步，不是上来什么都来。</p>



<p>只在美国和韩国推出，因为你像打车、订餐这个东西，一下我就全世界推出了，我一点餐发现这个餐馆在埃塞俄比亚，你让我咋去？所以一定是分地区开的。这个功能的未来会逐步扩大到更多的手机厂商型号和国家那里去，但是这个扩充的过程一定是手机厂商要上来配合。</p>



<p>你比如小米吧，说我们也想上这功能怎么办？你要去跟谷歌签协议，看看在哪个国家可以上哪些 APP，怎么去做这个事。因为要说服这些 APP 接入这套系统，也是要用力的。谷歌要去跟他们谈，跟这些 APP 去沟通，三星也要去跟他们谈。</p>



<p>那以后比如说小米说我想到欧洲去接这个东西，因为华为退出了以后，华为在欧洲的市场基本上被小米吃了。假设他们想去干这个事，他就得到欧洲去挨个跟人餐厅、跟打车公司、跟一些外卖派送公司去谈这个事去。谈好了以后，你才可以上架这些功能。</p>



<h2 class="wp-block-heading">二、技术层面：谷歌与豆包的相同与不同</h2>



<figure class="wp-block-image size-large"><img decoding="async" src="https://pictures.lukefan.com/google-vs-doubao-cross-app-ai-agent-android17-intelligent-os-ecosystem-control-trust/blog_3.jpeg" alt="羊皮纸插画：一张技术示意图，中央是“Gemini/Agent”圆形节点，向外分三条路径：服务器API(MCP)的云端箭头、APP functions的模块接口拼图、UI Automation的手指点击手机屏幕，三条路径用不同颜色标注，羊皮纸，钢笔彩色手绘的统一风格。"/></figure>



<p>谷歌跟豆包到底有什么不同？咱们先说技术层面。谷歌是通过三种方式来获得应用的数据和功能的。</p>



<h3 class="wp-block-heading">1）MCP 远端调用</h3>



<p>第一种叫 MCP 远端调用。比如说你这是一个送外卖的平台，你在服务器上是有接口的，我们通过这个接口直接调用就完了，我压根不在你手机上去折腾。这个其实是各种外卖平台最喜欢的一种方式。</p>



<h3 class="wp-block-heading">2）APP functions（APP 功能）</h3>



<p>第二种，谷歌出了一个新的接口规范，叫 APP functions，就是 APP 功能。这个什么意思？就是你这一个应用，可以把很多希望别人调用的这些功能把它包装出来，包装出来以后，我们的 Gemini APP 就会去读每一个 APP 的这些接口，到时候我就按照你的要求从这里进入，然后去调用相应的数据和功能。</p>



<h3 class="wp-block-heading">3）UI Automation framework</h3>



<p>第三种方式，叫 UI Automation framework。就是当你没有接口的时候，AI 会自动地通过 UI 去识别你的界面，然后去点击、去使用这个应用。</p>



<p>但是谷歌也强调，如果我们用这样的方式来去使用应用的话，一定是用户透明和可控的。就是用户一定是知道我们在干这件事了，完全可知的，而且完全可控，随时可以停下来。</p>



<p>豆包其实就只有第三条路，它前两条路都没法走。因为毕竟安卓不是他家的嘛，你说我做了一个新的规则，请你们开放接口给我，谁理他呀？所以这种事只能操作系统公司去干，谷歌去干了，华为鸿蒙里头也干了类似这样的事情。</p>



<p>至于 MCP 的远端调用，中国现在这些大的超级 APP 还在建墙：我不希望你去调用我，我希望你整体都在我这里来工作。豆包也没去折腾这个事，所以它只能通过自动界面识别、自动点击，只能干这一件事。</p>



<p>而且谷歌还承诺，就算我走第三条路，也仅仅是备用方案。如果你愿意去加这个 APP functions，或者加这个服务端的 MCP 调用，我就绝对不会去干这个活；而且即使干了，也一定用户知情。差异就差在这了。</p>



<h2 class="wp-block-heading">三、非技术层面：市场地位、信誉与激进程度</h2>



<figure class="wp-block-image size-large"><img decoding="async" src="https://pictures.lukefan.com/google-vs-doubao-cross-app-ai-agent-android17-intelligent-os-ecosystem-control-trust/blog_4.jpeg" alt="羊皮纸插画：一架天平，左盘放着“Google/Android”与一叠协议文件、信誉徽章，右盘放着“豆包手机”与被封禁的红色印章、破碎的APP图标围墙，天平明显倾斜，羊皮纸，钢笔彩色手绘的统一风格。"/></figure>



<p>那你说除了技术之外，谷歌跟豆包在市场地位和信誉以及行动的激进程度上有什么不一样？怎么谷歌摸得豆包就摸不得？其实前面技术上算是有一定的原因，但是后边这个才是更重要的。</p>



<h3 class="wp-block-heading">1）市场地位不同</h3>



<p>谷歌的地位跟豆包手机的地位肯定是不一样的。谷歌是安卓里头的真正扛把子，这东西是他发明的，是他去指定、掌握标准的，所有流量都在他手里面。所有这些服务和应用到谷歌的安卓平台上，实际上都是等着谷歌赏饭吃的：再多给我点流量吧，多让我这里做几单生意吧，少让他那边做几单生意。</p>



<p>假设这边有一个叫 Uber，另外还有其他的一些打车平台，我们要到谷歌上去竞争，那你到底是打 Uber 的还是打其他的？这谷歌说了算。你想获得用户和流量，谷歌去给你分配去，它是这样的一个关系。所以在手机应用这一块，谷歌是所有人的爸爸；而豆包的话是其他人的竞争对手，这个是绝对不一样的。</p>



<h3 class="wp-block-heading">2）信誉不同</h3>



<p>第二个，谷歌的信誉也是豆包所不能比的。人家毕竟做了这么多年了，而且这些年里头风风雨雨，有各种各样的问题，人家也都跟这些应用开发厂商、跟这些手机厂商风雨同舟一起过来了，这些信誉是逐渐积累起来的。</p>



<p>就跟人家说小尼姑的光头为什么和尚摸得？和尚跟小尼姑之间本身是一种共生关系，而且小尼姑可能还有些事情要有求于大和尚，这样情况下人家和尚才摸得。而豆包的话你就相当于那个阿 Q 似的，你就摸不得。你摸了以后对小尼姑没有任何好处，人家凭什么让你摸？摸了以后还臭名声，这肯定不能让你摸，所以他是这样的一个关系。</p>



<h3 class="wp-block-heading">3）行动更谨慎</h3>



<p>而且谷歌这一次也要比豆包谨慎很多。豆包是非常非常激进，它是没有跟任何人打招呼，就直接上来读了别人的界面，就直接上去点击去了，那这个是肯定任何一个 APP 都不能允许的。你相当于是给人借口了：你做了一个非常不安全的事情，你直接破解了我的应用。我这是个银行应用，我这是个支付应用，我微信里头有钱的，那我肯定要封你，这没什么好说的。</p>



<p>但是谷歌就很谨慎。第一个，过于敏感的 APP 不碰：你这是银行 APP，你这是支付 APP，我绝对绝对不碰你。谁愿意来我就跟谁合作，谁不愿意来我坚决不碰你。极个别情况下用户一定要用的时候，我们再去做自动化，而且一定要在用户监督下才能去做，这个是谷歌能够去保证的事情。</p>



<p>用户也可以选择说你现在不许干了，或者说用户可以删除 Gemini 所看到的数据。比如说你让 Gemini 帮你操作了一些支付，或者是这种订单相关的数据，说现在 Gemini 把我的家庭住址把这些东西都给我删了，然后 Gemini 假假模假式说行，放心吧我给你删了。其实删没删你自己也不知道，但是谷歌靠信誉嘛，说你看我给你删了，你就信了。</p>



<p>而且谷歌还强调说不会将数据用于广告，这个也是谷歌信誉的保证。咱们就信了吧。</p>



<p>而且谷歌只在小范围内上线：一款半机型，一款就是三星的 Galaxy S26，半款是它的 Pixel 10，一部分的功能是在 Pixel 10 上可用的；然后只有两个国家，美国跟韩国，因为韩国三星自己可以搞定嘛，美国的话谷歌自己去搞定去；然后少量的高频、低危险度、高价值的应用场景，只上了这些，不是上来我就什么都上了。所以谷歌的行动非常非常的谨慎。</p>



<h3 class="wp-block-heading">4）和尚与阿 Q 的区别</h3>



<p>那么和尚跟阿 Q 的区别在哪？表面上和尚的信誉一定要比阿 Q 好，一定是这样的。第二个，与尼姑属于相互需要，甚至可能还拿捏着尼姑的把柄。第三个，和尚是懂得分寸的，不会上来就不分场合蛮干；但阿 Q 就什么也不懂，尼姑刚出来就伸手去摸人家光头，这个肯定是不行的，那尼姑肯定不愿意。</p>



<h2 class="wp-block-heading">四、为什么说马斯克也摸不得</h2>



<figure class="wp-block-image size-large"><img decoding="async" src="https://pictures.lukefan.com/google-vs-doubao-cross-app-ai-agent-android17-intelligent-os-ecosystem-control-trust/blog_5.jpeg" alt="羊皮纸插画：一台笔记本电脑与一部手机并排，屏幕上有“截图识别/模拟点击”的小窗口；旁边是一位戴墨镜的企业家剪影伸手想跨设备操作，前方却立着苹果、谷歌、微软形状的高墙与“Access Denied”标牌，羊皮纸，钢笔彩色手绘的统一风格。"/></figure>



<p>那为什么说小尼姑的头马斯克也摸不得？这事跟马斯克有啥关系，是不是老范在这生蹭马斯克的热度？还真不是。马斯克做了一公司叫“巨硬”，这一次也跟 xAI 一起被卖给了 SpaceX 了。它的 xAI 未来还有一个很重要的部门叫巨硬，这公司走的就是豆包这条路：它通过直接截屏，通过视觉模型去识别屏幕信息，进行模拟点击，实现跨平台跨应用的自动化。他就想干这活。</p>



<p>他想干的活可能比豆包还要再狠一点，因为豆包只做手机上，他可能要把 PC、Windows、Mac 都要干一遍。</p>



<p>马斯克的名声就算比豆包好一些吧，但是在手机个人办公设备应用场景方面的生态位，马斯克并不比豆包强，甚至可能还要稍微弱一些。Grok 的用户数连豆包的零头都没有，它 X 用户数是稍微多一些，但是你跟 TikTok 比，你也是比不了的。</p>



<p>准备在跨越移动和个人电脑系统的应用上去蛮干，这就是马斯克想干的活。马斯克跟微软、谷歌、苹果的关系好像也没有那么融洽，在这一点上更是和字节跳动这种手中有多个冠军应用、完全在移动平台上成长起来的公司是没法比的。你马斯克造汽车造得再好，造火箭再造得再好，你跟这些应用平台来比，你跟这些 App Store 去攀关系，你根本攀不上。这就是为什么这个小尼姑的头，马斯克大概率也摸不得的一个原因。</p>



<h2 class="wp-block-heading">五、新的智能终端会革命 APP，但过程很重要</h2>



<p>再往后，新的智能终端，APP 这种形态必然被革命，但是过程很重要。APP 模式是必然消亡的，这是扎克伯格的一个梦想，因为他原来作为 APP 上到苹果上，天天被苹果欺负，说这玩意太不科学了、太落后了，我们一定要把这个模式干掉。</p>



<p>功能数据一定会聚集在 AI agent 手里面，根据用户的需求去完成更复杂、更有价值的操作，这是未来的方向。原来以 APP 为单位各玩各的所遗留下来的很多商业模式必然被淘汰。比如说吧，广告展示：我做了个 APP 上面有功能，你要想用我这功能，必须要先看三个广告才能去用，这就是传统的玩法。</p>



<p>但是你一旦把 APP 这个模式打破了，你把这功能在底下开放出来，让谷歌自己去调去了，那你怎么去盈利？大家就重新需要去思考：真正我们提供的不是你看了多少次广告、点击了哪些东西，而是我真的给你实现了哪些功能，那我怎么通过实现功能来赚取收入？这个是未来大家需要去思考的东西。</p>



<p>最终各个服务商卖的应该是结果，而不是打开 APP 的 DAU 与停留时长。比如说吧，你有个电商 APP，你真正希望的是更多的成交，把东西卖掉，而不是说用户每天打开 APP 在这瞎转悠。在这样的情况下，电商是不是更愿意开放接口，让谷歌的 Gemini 上我这来去获取数据，然后去直接完成交易？你哪怕不打开我的 APP，你只要把交易都做完就完了，我很开心，就这样的一个情况。</p>



<p>当然了，电商其实在这里还有一些问题。问题在哪？就是电商平台最主要的收入其实不是卖东西，电商平台最主要的收入是做广告。在这样的情况下，他就要重新去定位了：说我卖掉更多东西，我怎么能够挣到这个服务费？至于广告费的话，让谷歌去赚就好了，他要调整这个心态了。</p>



<p>新的入口争夺战马上就要开始了。原来的入口在各个超级 APP 之间抢来抢去，未来的入口一定是 AI 助手，就像豆包、像 Gemini、像 ChatGPT，这些会成为未来的入口。现在我打开手机可能更多的是使用 ChatGPT、Gemini、豆包这些东西，其实我现在使用那些超级 APP 像微信这些的频度已经下降非常非常多了。</p>



<p>真正有价值的未来会是什么？会是场景：我要看视频，我要打游戏，我要去付费阅读，什么样的这种信息和资源，这个是未来的一个场景。大家最终交付的是这个场景里边的结果，而不是把用户生生地框在你的应用里。</p>



<h2 class="wp-block-heading">六、我们在这过程中能做些什么</h2>



<figure class="wp-block-image size-large"><img decoding="async" src="https://pictures.lukefan.com/google-vs-doubao-cross-app-ai-agent-android17-intelligent-os-ecosystem-control-trust/blog_6.jpeg" alt="羊皮纸插画：一个用户站在路口，面前分成两条路，一边是“筑墙的超级APP城堡”高墙与封禁印章，另一边是“开放接口/AI友好”道路，路牌写着“APP functions / MCP / 可控透明”，用户手里拿着放大镜在对比服务，羊皮纸，钢笔彩色手绘的统一风格。"/></figure>



<p>最后咱们行动起来吧。首先在美国的朋友们可以去买个三星手机玩耍一下试试，如果有在韩国的话也可以试试，但是我的观众里头好像韩国的比较少。</p>



<p>很多场景会被打散，而不是筑墙包围起来。原来的社交场景会筑起高墙，将其他的场景进行捆绑，像微信就是干这活的：你谁想去碰微信的东西都不行。今年春节的时候，微信还通过封禁阿里的红包，去给大家表演了一下什么叫强势筑墙。</p>



<p>那么以后的话，AI 助手将成为新的入口，可以极大地解放这些长尾场景。比如说我现在想去跟大家玩砍一刀，以前砍一刀是完全在微信这个圈子里玩的，我们就可以设计出一些新的场景来，让这个 AI 助手能够识别一些场景，能够拉着客户一起来互动，这就需要去想了：怎么去适应 AI 场景。</p>



<p>我们尽量要去挑选那些&nbsp;<strong>AI 友好</strong>的应用和服务去使用。那些对 AI 不友好的应用和服务的话，这个一定是有猫腻的：他希望把你的眼蒙上，把你的耳遮住，让你只能选择他的服务，他希望捆绑你，这个一定是不好的。我们要在 AI agent 里头、在 AI 助手里边去货比三家，让他去获取更多的信息，然后给我们一个最优解，这才是未来的方向。这也可以帮助 AI 手机也好、AI 操作系统也好，更快地走向下一个阶段。</p>



<p>然后是检查我们各自的所在公司，或者是自己所提供的服务与产品，是不是适合新的流量分发模式。现在是 AI 分发流量直达、最终交付成果的一个时候，不是说我把你骗进来，让你在我这个应用里转来转去，找不着最终要的那东西，不是这样的一个时代了。要上来就把结果交出去，你要让 AI 转来转去，它就不推荐你了，所以要尽早调整。</p>



<p>越早调整越赚便宜，为什么？因为每一次发生流量转变的时候，会形成流量的早期红利效应。现在 AI 来挑服务了，发现别人都不提供，只有你提供，那你可能就赚到了。所以这个流量的早期红利是很香的，很多原来依托超级 APP 的小众场景都有新的机会了。</p>



<h2 class="wp-block-heading">结尾</h2>



<p>今天咱们讲这故事，用的是鲁迅《阿 Q 正传》里头这个典故：</p>



<blockquote class="wp-block-quote is-layout-flow wp-block-quote-is-layout-flow">
<p>“这个尼姑的脑袋，和尚摸得，我就摸不得？”</p>
</blockquote>



<p>把这故事串起来了。但是我们真正需要去思考的问题，不是我们能不能去摸小尼姑的光头，而是当我们自己是光头小尼姑的时候，愿意被谁摸，被谁摸了头不会臭了名声，还能有最大的好处。</p>



<p>好，这个故事今天就讲到这里。感谢大家收听，请帮忙点赞、点小铃铛、参加 DISCORD 讨论群，也欢迎有兴趣有能力的朋友加入我们的付费频道。再见。</p>



<hr class="wp-block-separator has-alpha-channel-opacity"/>



<h2 class="wp-block-heading">背景图片</h2>



<p>Prompt：<strong>Spanish comic watercolor style, expressive ink outlines, soft layered washes, Barcelona smartphone showroom interior, empty and serene retail space with no people, walls richly decorated with intricate Buddhist-style murals, lotus motifs, mandala geometry, sacred ornamental patterns integrated with modern phone displays, clean aisles and glass counters, eye-level 24mm wide establishing shot, balanced depth layers, gentle daylight through windows, Buddhist color palette of saffron yellow, vermilion red, indigo blue, jade green, muted antique gold, handcrafted painterly detail &#8211;no people, no staff, no crowds, photorealism, neon overload, text, watermark, logo &#8211;ar 16:9 &#8211;stylize 190 &#8211;chaos 6 &#8211;v 7.0 &#8211;p qaczhqj</strong></p>



<figure class="wp-block-image size-large"><img decoding="async" src="https://pictures.lukefan.com/google-vs-doubao-cross-app-ai-agent-android17-intelligent-os-ecosystem-control-trust/background_1.jpeg" alt=""/></figure>



<figure class="wp-block-image size-large"><img decoding="async" src="https://pictures.lukefan.com/google-vs-doubao-cross-app-ai-agent-android17-intelligent-os-ecosystem-control-trust/background_2.jpeg" alt=""/></figure>



<figure class="wp-block-image size-large"><img decoding="async" src="https://pictures.lukefan.com/google-vs-doubao-cross-app-ai-agent-android17-intelligent-os-ecosystem-control-trust/background_3.jpeg" alt=""/></figure>



<figure class="wp-block-image size-large"><img decoding="async" src="https://pictures.lukefan.com/google-vs-doubao-cross-app-ai-agent-android17-intelligent-os-ecosystem-control-trust/background_4.jpeg" alt=""/></figure>
]]></content:encoded>
					
		
		
			</item>
		<item>
		<title>谷歌UCP对决OpenAI ACP：两大巨头争夺AI代理电商标准，一个是安卓式开放，一个是轻量级接入，谁才是未来商家的首选？｜Google UCP OpenAI ACP Agentic Commerce Protocol decentralized standard</title>
		<link>https://lukefan.com/2026/01/15/google-ucp-ai-decentralized-commerce-protocol/</link>
		
		<dc:creator><![CDATA[老范 讲故事]]></dc:creator>
		<pubDate>Thu, 15 Jan 2026 00:44:56 +0000</pubDate>
				<category><![CDATA[Google的故事]]></category>
		<category><![CDATA[电商故事]]></category>
		<category><![CDATA[Agentic Commerce]]></category>
		<category><![CDATA[AI Driven Retail]]></category>
		<category><![CDATA[AI Interactions]]></category>
		<category><![CDATA[AI Shopping Standard]]></category>
		<category><![CDATA[Amazon Rufus]]></category>
		<category><![CDATA[Context Isolation]]></category>
		<category><![CDATA[Conversational Commerce]]></category>
		<category><![CDATA[Decentralized Commerce Protocol]]></category>
		<category><![CDATA[Decentralized Standard]]></category>
		<category><![CDATA[Digital Retail]]></category>
		<category><![CDATA[Future of Ecommerce]]></category>
		<category><![CDATA[Google Gemini]]></category>
		<category><![CDATA[Google Search AI]]></category>
		<category><![CDATA[Google UCP]]></category>
		<category><![CDATA[OpenAI ACP]]></category>
		<category><![CDATA[Shopify UCP]]></category>
		<category><![CDATA[Smart Ecommerce]]></category>
		<category><![CDATA[Tokenized Payment]]></category>
		<category><![CDATA[UCP]]></category>
		<category><![CDATA[Universal Commerce Protocol]]></category>
		<guid isPermaLink="false">https://lukefan.com/?p=3245</guid>

					<description><![CDATA[谷歌搞了个大新闻！UCP协议横空出世，电商要变天了🔥

以后买东西不用搜、不用刷，直接跟AI聊天就能下单！🤖💬 比如你跟Gemini聊着聊着，突然它就给你推荐了想要的东西，一键购买直接送到家。这转化率，简直高到离谱！

最狠的是，这个协议号称“去中心化”，说白了就是“去亚马逊化”😂 目前Shopify、沃尔玛、PayPal等大佬已经站队，但亚马逊自己玩起了Rufus购物助手，直接拒绝加入。这场巨头大战，戏码十足！

隐私问题也超有趣：AI聊天内容商家完全看不到！比如古代某女子聊天时说想“防虫处理”，AI推荐了砒霜，但商家只知道她买了砒霜，至于她回家是防虫还是“喂药”就不知道了…🤫 这个“上下文隔离”设计，细思极恐啊！

未来已来：搜索电商→推荐电商→智能电商。以后可能你刚说“想做饭”，AI就把菜刀、食材全给你买齐了🍳 作为商家，不接入就可能错过下一波流量红利；作为用户，准备好跟AI“唠嗑式购物”了吗？

#AI购物革命 #谷歌黑科技 #电商新模式 #智能生活

标题1：亚马逊拒绝加入的围剿战：谷歌联合Shopify与沃尔玛构建去中心化电商联盟，这是从搜索到AI代理的生死局，谁能掌控下一代流量入口？｜Universal Commerce Protocol UCP Google UCP AI Mode
标题2：潘金莲买砒霜商家却不知情？揭秘AI购物的上下文隔离机制：如何一边保护隐私一边让Gemini精准带货，商家必看的流量变局与转化红利｜Gemini Google Search open standard agentic commerce
标题3：搜索电商已死，推荐电商触顶？谷歌发布智能电商新标准，从“人找货”到“货找人”再到“AI意图交易”，高转化率的未来已来｜Universal Commerce Protocol UCP AI shopping standard instant sales
标题4：谷歌UCP对决OpenAI ACP：两大巨头争夺AI代理电商标准，一个是安卓式开放，一个是轻量级接入，谁才是未来商家的首选？｜Google UCP OpenAI ACP Agentic Commerce Protocol decentralized standard
标题5：别再死守传统广告位了！Shopify与支付宝抢先入局，AI Agent正在重构流量分发逻辑，商家如何利用新协议实现无缝交易闭环？｜Universal Commerce Protocol UCP Merchant of Record business logic
简介：谷歌近期重磅发布Universal Commerce Protocol（UCP），正式宣告电商模式从传统的搜索与推荐向AI驱动的智能电商转型。这项新标准旨在打破亚马逊的封闭生态，通过去中心化协议联合Shopify、沃尔玛等巨头，实现跨平台的agentic commerce。在Gemini等大模型的加持下，商家可利用AI精确识别用户意图并完成交易，开启流量与转化率的新增长点。]]></description>
										<content:encoded><![CDATA[
<figure class="wp-block-embed is-type-video is-provider-youtube wp-block-embed-youtube wp-embed-aspect-16-9 wp-has-aspect-ratio"><div class="wp-block-embed__wrapper">
<iframe title="搜索电商已死，推荐电商触顶？谷歌发布智能电商新标准，从“人找货”到“货找人”再到“AI意图交易”，高转化率的未来已来｜Universal Commerce Protocol UCP AI" width="900" height="506" src="https://www.youtube.com/embed/sIc-QhzS1mk?feature=oembed" frameborder="0" allow="accelerometer; autoplay; clipboard-write; encrypted-media; gyroscope; picture-in-picture; web-share" referrerpolicy="strict-origin-when-cross-origin" allowfullscreen></iframe>
</div></figure>



<figure class="wp-block-image size-large"><img decoding="async" src="https://pictures.lukefan.com/google-ucp-ai-decentralized-commerce-protocol/blog_1.jpeg" alt=""/></figure>



<h1 class="wp-block-heading">谷歌发布了UCP通用商业协议</h1>



<p><strong>摘要：</strong>电商模式正式从传统的人找货（也就是搜索电商）和货找人（也就是推荐电商），转向了对话及交易的智能电商。</p>



<p>大家好，欢迎收听<a href="https://youtube.com/@StoryTellerFan" target="_blank" rel="noopener">老范讲故事的YouTube频道</a>。</p>



<h2 class="wp-block-heading">什么是UCP（通用商业协议）？</h2>



<p>1月11日，谷歌在纽约举行的全美零售联合会年度博览会上发布了UCP。所谓UCP叫Universal Commerce Protocol（通用商业协议），AI驱动的去中心化电商通用协议。</p>



<p>这里头跟去中心化有什么关系？你说这玩意是不是用币？不是。这个里头所谓的去中心化，说白了就是“去亚马逊”。不去别人，就去它。</p>



<figure class="wp-block-image size-large"><img decoding="async" src="https://pictures.lukefan.com/google-ucp-ai-decentralized-commerce-protocol/blog_2.jpeg" alt=""/></figure>



<h3 class="wp-block-heading">协议包含的功能模块</h3>



<p>这个协议涵盖了电商的所有流程和模块，包括：</p>



<ul class="wp-block-list">
<li><strong>自动发现：</strong>也就是一个网站到底提供什么样的电商服务，这个会被发现。</li>



<li><strong>基本电商能力：</strong>什么购物车、价格计算、库存检索、支付确认或者支付授权，这个都有。</li>



<li><strong>订单全流程：</strong>还有下单的订单管理、订单状态、追踪售后、退货。</li>



<li><strong>其他支持：</strong>以及支付，还有用户管理和会员权益、风险管控和反欺诈。</li>
</ul>



<p>这是属于电商需要的所有东西，它都给你定义了一遍。同时支持MCP A to A（也就是Agent to Agent），还有传统的API格式，统统都是支持的。</p>



<span id="more-3245"></span>



<h3 class="wp-block-heading">开放性与谷歌的控制权</h3>



<p>UCP这个东西是开放的吗？还是谷歌说了算？这个非常非常有谷歌特色。</p>



<p>一方面它是开放的，这个协议相关的所有文档和代码都是在GitHub上托管的，使用的是阿帕奇2.0的开源许可证，大家都可以去用。</p>



<p>但是也不是完全开放的，这个东西有点像安卓里边的GMS一样，叫Google Mobile Service。GMS这个东西是需要谷歌去审核的，不是说谁愿意接谁就可以接上的。如果谷歌审核不通过、不给你发认证的话，你进不去。UCP也是如此，需要谷歌的认证和准入，而且数据格式的定义，这个权利也是在谷歌手里边的。你不能说我自己随便定义一些数据就放进去，这事是不允许的。所以这个东西的开放状态很像安卓。</p>



<figure class="wp-block-image size-large"><img decoding="async" src="https://pictures.lukefan.com/google-ucp-ai-decentralized-commerce-protocol/blog_3.jpeg" alt=""/></figure>



<h2 class="wp-block-heading">安全与隐私问题</h2>



<p>UCP它会带来一些安全和隐私的问题。</p>



<h3 class="wp-block-heading">1. 代币化支付</h3>



<p>首先咱们先说安全吧，它在支付的时候使用的是代币化支付。那你说去中心化，不是不用Token？那刚才老范不是说了吗，虽然叫去中心化，但是咱不用代币。</p>



<p>这里讲的是什么？就是AI真的是看不到信用卡信息的，也看不到你的支付相关的信息，它只能看到一个Token。但是这个Token并不是你的比特币钱包，而是比如说PayPal或者是Visa，他们来给的这个Token。它只要拿到Token就可以去验证了，是这样的一个代币化支付。</p>



<h3 class="wp-block-heading">2. 上下文隔离</h3>



<p>还有一个重要的安全属性，是要上下文隔离。什么意思？就是你想我们以后是怎么买东西：我们跟谷歌的Gemini聊天，聊着聊着，突然他就给你推荐商品了，你一确认就给你买回来了。这个聊天的过程叫上下文，商家是看不到的。商家只能看到交易数据，谁买了什么他知道；但是为什么买、上下文聊什么，这个是不会发给商家的。</p>



<p>比如说吧，中国古代有一位女子，聊天的时候说：“我想给家里头的衣物做一下防虫处理，有什么办法没有？”她有可能聊了这个。当然另外一种可能，她聊的是：“西门大官人，我看着这个甚是欢喜，但是家里有个三寸钉应该怎么办？”这两种聊天都是有可能发生的。</p>



<p>但是这两种聊天，最后都会触发共同的结果，就是AI回复说：“你去买一些砒霜吧。”</p>



<figure class="wp-block-image size-large"><img decoding="async" src="https://pictures.lukefan.com/google-ucp-ai-decentralized-commerce-protocol/blog_4.jpeg" alt=""/></figure>



<p>大家不要觉得砒霜这个东西是毒药——它确实是毒药，但是在中国古代，这个东西是有正规用途的。一方面它可以包裹种子去播种，这样可以防病虫害、防杂草；另外就是刚才咱们讲的，就是家里头的衣物防虫也是用砒霜的，只是要少用一点点。就是甭管她前面说的是哪种情况，AI都会给她推荐砒霜。她买的时候，商家只知道她买了砒霜，至于你拿回去干嘛使，他就不知道了。然后这位女子把砒霜拿到手以后，就可以喊：“大郎，该吃药了。”就会变成这样了。这个就叫上下文隔离。</p>



<h3 class="wp-block-heading">3. 数据归属权的转移</h3>



<p>但是商家会知道，某位顾客（或者说某位女子吧），什么时间购买了多少砒霜、送去了哪里，这些东西是这个商家会知道的。上下文没有了。但是这个其实跟现在我们普遍使用的安全隐私方式还是有一些差距的。</p>



<p>因为原来这些数据会在亚马逊这些平台手里边，他会把这个东西截留下来，并不会发给商家。因为最早的时候，中国做跨境电商的时候，是收集了大量的美国用户的家庭住址和电话的。后来说不行，这玩意我们要保护隐私，然后就改成了说：“你们把这个数据通通都留在亚马逊，不要发给中国卖家。”</p>



<p>但是你如果使用了UCP，谁是最终的销售者，谁就可以得到用户的电话、用户的地址。这些数据回到商家手里边有什么好处？商家可以更好的接触用户，进行售后服务，也可以再去促成二次销售。</p>



<p>比如说吧，你从某个商家手里买了台打印机，那么商家可能每过一段时间就会问你说：“要不要换个墨盒？要不要换个硒鼓？”他有这种二次销售的机会。那像原来美国人为了保护隐私，他把这些数据都留在亚马逊手里了，那亚马逊说：“你该买硒鼓了，该买墨盒了，你不要到原来那个商家去买，你在我这买，我给你推荐别的商家。”为什么？因为那个商家给我钱了，给我广告费了。他希望在新的二次购买机会发生的时候，亚马逊可以再收一次广告费，把这个二次销售的决定权放在自己手里边。所有跟隐私保护相关的条款，实际上背后都是有商业利益的。</p>



<h2 class="wp-block-heading">参与者与生态伙伴</h2>



<p>那么在这样的一个协议发布以后，咱们先看看谁参加进来了。</p>



<figure class="wp-block-image size-large"><img decoding="async" src="https://pictures.lukefan.com/google-ucp-ai-decentralized-commerce-protocol/blog_5.jpeg" alt=""/></figure>



<h3 class="wp-block-heading">共同发起方</h3>



<ul class="wp-block-list">
<li><strong>Shopify：</strong>第一个叫共同发起方。头一个就是Shopify，它排的头一个。为什么？很简单，它算是一个相对比较零碎的电商平台，上面有大量的网站去卖各种不同的商品。而Shopify是靠什么活下来的？就是靠不停的买谷歌广告，谷歌搜索广告。搜索了以后，你要去给我推荐Shopify上面的商品。既然这样的话，谷歌说我要做UCP，那Shopify第一个站出来，说：“来，咱们一起来发起吧。”所以它是共同发起方之一。</li>



<li><strong>Etsy：</strong>这个应该是美国的一个手工工艺品的电商，他们也是发起方。</li>



<li><strong>Wayfair：</strong>应该也是一个商家。</li>



<li><strong>Target：</strong>美国很常见的一个比较廉价的超市。</li>



<li><strong>沃尔玛：</strong>他们都是联合发起方。</li>
</ul>



<p>这些其实原来都是谷歌搜索广告的大客户。</p>



<h3 class="wp-block-heading">生态合作伙伴与背书</h3>



<ul class="wp-block-list">
<li><strong>支付类：</strong>Adyen（做支付的）、PayPal（做支付的）、Stripe（支付平台）、蚂蚁国际（阿里系的，也冲进来了）。</li>



<li><strong>信用卡类：</strong>美国运通、万事达、Visa卡。</li>



<li><strong>零售商类：</strong>Best Buy（在国内叫百思买，后来就好像国内都关干净了，他们也参与进来了）、梅西百货、家得宝（家装平台）。</li>
</ul>



<p>在这个里边实际上分几类。第一类是原来的这种电商平台（但是不是亚马逊），就是一些小的电商平台或者是传统的商超平台，他们都加进来了。然后这些支付平台基本上都进来了。</p>



<p>因为对于支付平台来说，甭管你谁把东西卖掉了，从我这能把货钱支付出去就OK。支付平台，你说怎么就这么雷锋？千万别这么想。支付平台挣的不是这钱，支付平台挣的是利息，他是希望你在支付的过程中向他贷款的。所以支付平台会非常非常积极的参与这种事情。目前开通的支付就是Google Pay，马上就会开PayPal。其他的生态合作伙伴里的这些支付平台，会逐步的加入进来。阿里系的蚂蚁国际也准备加到这个里边来，让大家去用支付宝进行支付。</p>



<h3 class="wp-block-heading">物流与交付</h3>



<p>咱们要注意，整个这个UCP是涉及很多环节了。除了电商平台或者说商超平台、支付平台之外，还有物流交付和售后这块。谷歌官方并没有给出合作伙伴的名单，但是有一个叫<strong>PIPE 17</strong>，他宣布支持UCP，专门做物流和订单管理的。这一块可能没有一些特别大的企业，但是他们都会积极的参与进来。</p>



<h3 class="wp-block-heading">流量入口（大模型）</h3>



<p>大模型或者叫流量入口，这也是一个重要参与方。你说我做了半天UCP，没有流量入口，没有新的聊天的流量进来，那不是胡扯了吗？</p>



<ul class="wp-block-list">
<li><strong>谷歌体系：</strong>目前只有谷歌搜索的AI模式和Gemini APP这个里边接了。官方表示有其他平台接入，但是并没有公布。</li>



<li><strong>微软：</strong>这个里头微软的Copilot通过Shopify是做了整合的，已经接入了UCP。</li>



<li><strong>苹果：</strong>Siri，因为以后的Siri里边是Gemini整合，所以苹果平台也接入了这个体系。</li>
</ul>



<p>所以这个流量入口还是非常非常巨大的。</p>



<h2 class="wp-block-heading">谁没来？（缺席者与竞争者）</h2>



<p>这是谁来了，那谁没来？<strong>亚马逊</strong>嘛。咱们刚才讲了，去中心化去的就是亚马逊。亚马逊说：“你们冲谁来的？别以为我不知道。”</p>



<p>然后Meta、Shein、TikTok和Temu也都没有表态，但是也没有说我就不去，只是说我们观望一下。这些就是美国现在比较主流的一些电商的平台。</p>



<figure class="wp-block-image size-large"><img decoding="async" src="https://pictures.lukefan.com/google-ucp-ai-decentralized-commerce-protocol/blog_6.jpeg" alt=""/></figure>



<h3 class="wp-block-heading">缺席者的替代方案</h3>



<h4 class="wp-block-heading">1. 亚马逊：Rufus</h4>



<p>首先说亚马逊吧。亚马逊自己出了一个叫做Rufus的购物助手。大家现在可以在亚马逊里头跟它聊天了。聊完了以后，它就会给你推荐商品，在亚马逊内部完成交易闭环。</p>



<p>亚马逊想干的事是什么？希望通过最完善的电商服务闭环体系，击败像UCP这种组织起来的草台班子。大家注意，你像UCP一旦组织起来，谁的货他不管了，谁负责物流和交付，谷歌可能会做一些简单的审核，但是一定没有亚马逊这种完全闭环的质量高。他希望通过这种购物体验打败谷歌。</p>



<h4 class="wp-block-heading">2. OpenAI：ACP</h4>



<p>OpenAI其实也推出一个类似的东西叫ACP。谷歌这个UCP，U是通用的Universal；这个A是代理的意思，叫Agentic。所以OpenAI推出的叫代理商务协议。OpenAI的这个协议相对来说要轻量很多，它通过工具的方式将电商交互融入到Agentic里边去。它做了这样的一个事情。</p>



<p>OpenAI跟这个协议，是OpenAI跟Stripe合作推出的一个开源协议。这块都得开源，你不开源没人敢上。然后Shopify跟这个Etsy首批加盟，他们就是甭管你谁上，这东西我都去加盟去。为什么？这就是有销售的机会吗，这是不能放弃的。亚马逊已经明确的表达，我拒绝加入，我自己玩自己的，我不跟你玩。</p>



<h4 class="wp-block-heading">3. Perplexity：一键购物</h4>



<p>下一个就是Perplexity。它推出了一个叫“一键购物”的功能。你可以直接在Perplexity聊天的时候，就把东西买走。这一块Perplexity是直接奔着超级入口去的，他就没有说我开放个协议大家来加入，他没这么大野心在这块。亚马逊是直接起诉了Perplexity，你非法爬取了亚马逊的数据。起诉的同时，亚马逊对Perplexity实行了数据封锁，以后不让你爬了，你看看你到底卖什么。</p>



<h2 class="wp-block-heading">AI购物革命与电商模式的演变</h2>



<p>AI最终还是会走向交易成功的，未必会是谷歌的UCP，因为UCP这个东西还是有点太复杂了。最终的接口位置、也就是你的协议在什么地方、各个平台提供什么样的服务、接口可能还需要有一段时间的拉扯。但是AI购物的革命正在到来。</p>



<h3 class="wp-block-heading">第一阶段：搜索购物</h3>



<p>原来是搜索购物，像亚马逊、淘宝天猫、京东，还有像拼多多，这都属于是搜索销售。我要买什么东西我跟人说，说完了以后找一大堆的商品我在里头挑，是这样的一种销售方式。这些电商平台在里边去收广告费，你搜索完了以后，谁排前头谁排后头，有哪些广告位，他们是卖这玩意的。</p>



<h3 class="wp-block-heading">第二阶段：推荐销售</h3>



<p>后来开始出现像抖音、TikTok、快手这样的直播平台。他们干的是什么？他们干的实际上是推荐销售。他们是靠推荐算法，将不同的直播间推到我面前来，让我形成购买。我现在大量的电商交易都是在抖音上做的，我是比较吃推荐算法的。</p>



<h3 class="wp-block-heading">第三阶段：智能电商（意图交易）</h3>



<figure class="wp-block-image size-large"><img decoding="async" src="https://pictures.lukefan.com/google-ucp-ai-decentralized-commerce-protocol/blog_7.jpeg" alt=""/></figure>



<p>现在随着用户注意力的转移，更多的用户时长被聊天助手给劫持了。我现在每天面对电脑、面对手机的时候，大量的时间不是在这刷抖音，而是去跟豆包、跟ChatGPT、跟Gemini去聊天去了。在这个过程中就要让它形成交易，而不是说一个月找我收20美金就算结束了。你想，我如果在这个里头买东西的话，他挣到的钱绝对比一个月20美金要多得多，而且是上不封顶。你1月20美金，它是上边封顶的。所以现在甭管是OpenAI也好，还是谷歌也好，都在向这一块狂奔。</p>



<p>AI能够更加理解用户的需求和意图。前面咱们讲这个潘姓小娘子的案例，甭管你是说我们家衣服被虫子咬了，还是说西门大官人甚得我心、我们家有个三寸钉，这个意图会被AI理解掉。理解完了以后就说：“这样的问题，我们可以通过购买一种叫砒霜或者叫鹤顶红的东西可以解决掉。”那么这个潘姓小娘子就直接下单就购买了。</p>



<p>在AI购物的过程中，大模型可以根据用户意图，直接在聊天的过程中进行交易。绝对是润物细无声的，而且成交的转换率极高。更多的长尾服务会达成交易。以后就不会说大家去抢推荐算法的入口了，或者去抢什么最上面这个广告栏了，以后就是每个人聊自己的，AI会通过我们聊天的过程，发现每一个人所需要的服务或者是需要的这个商品，然后向我们推荐。那这玩意转化率多高？一卖一个不吱声，绝对的。</p>



<p>如果谷歌可以继续做流量入口，那么谷歌这个UCP这条路就算走通了。原来那些依赖谷歌搜索广告的商家，就像什么Shopify、像什么其他的一些小型的这些商家，会跟着谷歌走的。从谷歌最近快速蚕食OpenAI的流量，以及跟苹果签了Siri协议来看，这种可能性还是很大的。</p>



<h2 class="wp-block-heading">总结</h2>



<p>总结一下吧，谷歌发布了UCP的通用商业协议这样的一个东西。未来的电商模式已经到来了，从搜索电商到推荐电商，现在最终到了智能电商。</p>



<figure class="wp-block-image size-large"><img decoding="async" src="https://pictures.lukefan.com/google-ucp-ai-decentralized-commerce-protocol/blog_8.jpeg" alt=""/></figure>



<p>所谓的智能电商，其实就是对话过程中的意图发现，并最终实现电商交易的一个过程。用户未必直接聊天，而是表达意图之后，AI Agent将意图分解，分别完成交易。比如我说了，我今天想去做满汉全席。跟AI聊了半天，菜谱都确定了，AI就会分别下单，把满汉全席所需要的所有东西都给我买回来，包括什么菜谱、什么菜刀，他是这样来去工作的。更长尾、更高转换率，而且去中心化，这就是未来电商的模式。</p>



<p>亚马逊、Temu和Shein这些传统的电商平台会首先受到冲击。Meta和TikTok这些社交推荐电商平台，也会随着用户注意力的转移受到影响，但是没有那么快。所以他们只是说我们看看，我们先不着急。而亚马逊就是非常非常激烈的反对、推出竞品，要跟你去竞争。它是这样的不同的反馈。</p>



<h2 class="wp-block-heading">最后的建议</h2>



<p>最后给大家一些建议吧。</p>



<ul class="wp-block-list">
<li><strong>如果是商家或者说是服务的提供者：</strong>义无反顾的接进去。没有人会嫌流量多的，你有更多的曝光机会肯定要上。而且要去研究如何优化这样的一个发现过程。既然AI去聊天了，去进行意图匹配了，那怎么能够让意图匹配的过程更大的几率匹配到你？这就是以后大家要去研究的方向了。当然最简单的可能还是向谷歌交钱，交完钱以后，你这个匹配成功的几率就会上升。</li>



<li><strong>如果是其他应用和服务的开发者：</strong>也可以将交易作为一个组件接入系统了。比如说我今天是一个导游系统的开发者，那我原来可能导游的过程中，怎么买票、怎么去定机加酒、怎么去定本地的一些落地服务……那么以后，可能我就可以把当地的一些土特产就通通都可以加进去了。这个就完完全全会让这些AI Agent的能力上到另外一个台阶去。</li>
</ul>



<p>当然，未来越来越多的普通人会成为应用和服务的开发和提供者。所以这件事情，应该是跟每一个人都有关系的。</p>



<p>好，这个故事今天就跟大家讲到这里，感谢大家收听。请帮忙点赞、点小铃铛，参加<a href="https://discord.gg/ppKsNkttTv" target="_blank" rel="noopener">Discord讨论群</a>。也欢迎有兴趣、有能力的朋友加入我们的<a href="https://www.youtube.com/channel/UCUGLhcs3-3y_yhZZsgRzrzw/join" target="_blank" rel="noopener">付费频道</a>。再见。</p>



<hr class="wp-block-separator has-alpha-channel-opacity"/>



<h1 class="wp-block-heading">背景图片</h1>



<p>Prompt：<strong>High-contrast luminous watercolor realism of a split e-commerce office interior: loft workstation area with matte black steel frame, exposed ducts, concrete columns, glass rail mezzanine, rows of wooden desks with precise monitor stands, keyboards, mousepads, desk lamps, tidy cable management; adjacent logistics warehouse with galvanized pallet racking, corrugated cardboard boxes with packing tape seams, bubble wrap rolls, label printer, scale, shipping cartons, plastic totes, hand pallet jack on polished concrete, crisp aisle geometry; cinematic wide shot, 35mm equivalent, eye-level, clean separation line between the two zones, strong depth cues, sharp subject separation, extremely legible bright negative space in upper background for typography, high-key lighting + neon cyan rimlight, realistic glossy reflections on floor and screens, crystal-clear atmospheric glow, minimal vivid palette (ink blue, deep navy gradients, neon cyan, warm gold, subtle coral), controlled ink outlines, micro-texture and clean surface wear &#8211;ar 16:9 &#8211;stylize 120 &#8211;chaos 4 &#8211;no text, watermark, logo, clutter, lowres &#8211;v 7.0 &#8211;p lh4so59</strong></p>



<figure class="wp-block-image size-large"><img decoding="async" src="https://pictures.lukefan.com/google-ucp-ai-decentralized-commerce-protocol/background_1.jpeg" alt=""/></figure>



<figure class="wp-block-image size-large"><img decoding="async" src="https://pictures.lukefan.com/google-ucp-ai-decentralized-commerce-protocol/background_2.jpeg" alt=""/></figure>



<figure class="wp-block-image size-large"><img decoding="async" src="https://pictures.lukefan.com/google-ucp-ai-decentralized-commerce-protocol/background_3.jpeg" alt=""/></figure>



<figure class="wp-block-image size-large"><img decoding="async" src="https://pictures.lukefan.com/google-ucp-ai-decentralized-commerce-protocol/background_4.jpeg" alt=""/></figure>
]]></content:encoded>
					
		
		
			</item>
		<item>
		<title>所有人都在唱衰谷歌将被AI颠覆，财报却显示搜索广告暴涨15%！真相是谷歌做了一个违背祖训的决定，从让用户快走变成把人留在聊天窗口｜Google AI Mode、Search Monetization</title>
		<link>https://lukefan.com/2025/12/22/google-ai-advertising-transformation-monetization/</link>
		
		<dc:creator><![CDATA[Luke Fan]]></dc:creator>
		<pubDate>Mon, 22 Dec 2025 12:45:47 +0000</pubDate>
				<category><![CDATA[AIGC]]></category>
		<category><![CDATA[Google的故事]]></category>
		<category><![CDATA[Ad Revenue Strategy]]></category>
		<category><![CDATA[AdSense Decline]]></category>
		<category><![CDATA[AI User Intent]]></category>
		<category><![CDATA[AI-Powered Search]]></category>
		<category><![CDATA[Answer Engines]]></category>
		<category><![CDATA[Automated Ad Creatives]]></category>
		<category><![CDATA[Digital Advertising Transformation]]></category>
		<category><![CDATA[Gemini 3]]></category>
		<category><![CDATA[Gemini Ads]]></category>
		<category><![CDATA[Generative AI Advertising]]></category>
		<category><![CDATA[Google Ad Manager]]></category>
		<category><![CDATA[Google AI Mode]]></category>
		<category><![CDATA[Google Search Future]]></category>
		<category><![CDATA[Google vs OpenAI]]></category>
		<category><![CDATA[Long Tail Economy]]></category>
		<category><![CDATA[Niche Product Marketing]]></category>
		<category><![CDATA[Post-Keyword Era]]></category>
		<category><![CDATA[Publisher Monetization]]></category>
		<category><![CDATA[Search Monetization]]></category>
		<category><![CDATA[Smart Ad Matching]]></category>
		<category><![CDATA[Sponsored AI Results]]></category>
		<category><![CDATA[TPU Ecosystem]]></category>
		<guid isPermaLink="false">https://lukefan.com/?p=3152</guid>

					<description><![CDATA[AI时代，谷歌居然把广告玩出新花样了！😱 你以为AI会干掉搜索广告？错！谷歌财报啪啪打脸，广告收入不降反升！🔥

以前搜索完就跑，现在谷歌让你赖着不走！🤯 跟AI聊天聊上瘾，广告看到手软！原来谷歌偷偷学百度，肥水不流外人田，答案广告一站式搞定！💸

最绝的是，AI让广告精准到可怕！👀 你搜“冷感木质香”，AI立马给你推小众手作香水；你找“宽脚跑鞋”，它连你半马训练路线都知道！这哪是广告，简直是肚里蛔虫！🐛

传统广告门槛高到爆炸，现在谷歌全包了！🎯 自动生成素材、智能匹配用户，连中国人最擅长的“素材海战术”都被AI秒杀！护城河？不存在的！🌊

黑五战报更搞笑：订单量降了，单价却涨了！💰 多出来的钱去哪了？全进谷歌广告费了！小众需求被疯狂挖掘，中产的钱包瑟瑟发抖！👜

谷歌这波操作，直接给AI时代指明赚钱方向：不是收月费，而是无限放大的广告变现！🚀 搜索只是方法，交易才是目的！AI时代，每个人都能做更小众的生意，讲更精彩的故事！📖

所以别担心AI让你失业，它正在创造新机会！💪 赶紧想想你的小众技能，怎么被AI放大到全世界吧！🌍

#谷歌逆天改命 #AI广告新玩法 #小众生意爆发 #黑五真相 #未来已来

标题1：所有人都在唱衰谷歌将被AI颠覆，财报却显示搜索广告暴涨15%！真相是谷歌做了一个违背祖训的决定，从让用户快走变成把人留在聊天窗口｜Google AI Mode、Search Monetization、Gemini Ads、Post-Keyword Era
标题2：OpenAI的订阅制其实是存量博弈的有毒模式？谷歌财报揭示无限增长的新解法：不是卖20美元的会员，而是用AI自动生成素材匹配无限长尾需求｜Google AI Mode、Search Monetization、Gemini Ads、AI-Powered Search
标题3：别再纠结SEO排名了，AdSense收入已下滑3%！谷歌AI现在自动抓取商品库并生成视频广告，精准匹配那些你没想过的小众长尾需求与极窄人群｜Google AI Mode、Search Monetization、Gemini Ads、Google Ad Manager
标题4：链接跳转的时代正在终结，谷歌不再希望你点击进入网页？将用户留在AI界面不仅没死，反而通过意图识别让广告单价与转化率双双飙升的底层逻辑曝光｜Google AI Mode、Search Monetization、Gemini Ads、Agentic Search
标题5：AI时代不仅没有杀死广告，反而让黑五平均客单价上涨8%？全民发钱不现实，未来是靠内容故事与非标商品匹配生存，谷歌已通过新生态指明方向｜Google AI Mode、Search Monetization、Digital Advertising Transformation、Sponsored AI Results
简介：谷歌财报打破了“AI将杀死搜索”的预言，搜索广告收入逆势上涨15%的背后，是谷歌从追求“快速离开”到“留住用户”的战略巨变。通过 **Google AI Mode** 自动生成素材并精准匹配长尾需求，谷歌验证了 **Search Monetization** 在 **Post-Keyword Era** 的无限潜力。这不仅是 **Digital Advertising Transformation**，更为AI时代的商业变现指明了方向。]]></description>
										<content:encoded><![CDATA[
<figure class="wp-block-embed is-type-video is-provider-youtube wp-block-embed-youtube wp-embed-aspect-16-9 wp-has-aspect-ratio"><div class="wp-block-embed__wrapper">
<iframe title="所有人都在唱衰谷歌将被AI颠覆，财报却显示搜索广告暴涨15%！真相是谷歌做了一个违背祖训的决定，从让用户快走变成把人留在聊天窗口｜Google AI Mode、Search Monetization" width="900" height="506" src="https://www.youtube.com/embed/TIuRup13V_A?feature=oembed" frameborder="0" allow="accelerometer; autoplay; clipboard-write; encrypted-media; gyroscope; picture-in-picture; web-share" referrerpolicy="strict-origin-when-cross-origin" allowfullscreen></iframe>
</div></figure>



<figure class="wp-block-image size-large"><img decoding="async" src="https://pictures.lukefan.com/google-ai-advertising-transformation-monetization/blog_1.JPEG" alt=""/></figure>



<h1 class="wp-block-heading">谷歌的价值被认同：为AI后的时代指明方向</h1>



<p>大家好。欢迎收听老范讲故事的YouTube频道。咱们今天讲一讲谷歌的价值被认同，不仅仅是因为Gemini 3和TPU，更重要的是，<strong>谷歌为AI后的时代指明了方向。</strong></p>



<p>指明方向这件事，还是可以讲的，至少说在谷歌身上问题不太大。谷歌的价值在上升，在美股七姐妹中算是一枝独秀了。很多人认为是Gemini 3遥遥领先，以及TPU终于打破了英伟达的垄断，以及OpenAI的泡沫越来越让人担忧。这些其实只是表象。<strong>AI不但没有杀死搜索和广告，反而让广告商的收益上升了，这才是关键。</strong></p>



<h2 class="wp-block-heading">AI时代，搜索与广告的生存悖论</h2>



<figure class="wp-block-image size-large"><img decoding="async" src="https://pictures.lukefan.com/google-ai-advertising-transformation-monetization/blog_2.JPEG" alt=""/></figure>



<p>以前搜索，我们输入关键词，得到一大堆网页，点击其中一个网页，进到网页里边去，看到很多的广告，原来它是这样的一种生存方式。</p>



<p>在AI出来了以后，包括我在内都在担心说，以后AI只生成一个唯一正确的答案，它就没有搜索的过程，你没有那么多地方放广告了，也没有需要点击、跳入其他网页的机会了。整个的网络广告就全废了，甭管是搜索广告，还是跳出去以后谷歌的AdSense，这些就都没有了。所以当时大家一致认为是AI会干掉谷歌，甚至谷歌也拉响了红色警报。</p>



<p>OpenAI发明了这种20美金一个月，以及花钱买TOKEN的商业模式。从OpenAI 20美金一个月收钱那天开始，我就讲过说这个东西是一个有毒的商业模式，这事是错的。为什么？</p>



<blockquote class="wp-block-quote is-layout-flow wp-block-quote-is-layout-flow">
<p>因为20美金是死的，每个人就交20美金；而广告这个数是活的，它可以不断的刺激我买东西，不断的让我去在购物的过程中，让它的广告主给它支付广告费用。<strong>这个数是无限的，而20美金这个数是有限的。</strong></p>
</blockquote>



<p>当时我就下了这样的结论，但是从来没有想明白过，AI时代以后广告和搜索到底怎么活下去。但是现在谷歌和Meta的财报都证明了，他们的广告收入不但没有下降，反而在上升。特别是以谷歌的财报更为明显，它的上升比例其实没有Meta高，它大概上升了12%，Meta大概上升了26%。但是谷歌本来份额大，它是老大，还能上升12%；而且谷歌是搜索广告，而Meta的话很多是社交广告，所以Meta的那个也不是那么明显。但是谷歌这个真的是为未来指明了方向。</p>



<span id="more-3152"></span>



<h2 class="wp-block-heading">谷歌2025 Q3财报：一个违背祖训的决定</h2>



<figure class="wp-block-image size-large"><img decoding="async" src="https://pictures.lukefan.com/google-ai-advertising-transformation-monetization/blog_3.JPEG" alt=""/></figure>



<p>谷歌2025年Q3的财报显示：</p>



<ul class="wp-block-list">
<li><strong>搜索广告收入：</strong>上升了15%</li>



<li><strong>YouTube广告收入：</strong>上升了15%</li>



<li><strong>网络广告（AdSense）：</strong>下降了3%</li>



<li><strong>总体上升：</strong>12.6%</li>
</ul>



<p>其实YouTube广告收入上升这件事，大家是可以想到的，转到社交媒体，还要加上YouTube SHORTS，要去跟TikTok抢份额，所以它的广告收入上升大家能想到。但是真没有想到，搜索广告收入居然也上升了15%。但是有一项是下降的，就是网络广告下降了。什么是网络广告？就是AdSense那部分下降了3%。</p>



<p>那到底发生了什么？<strong>谷歌做了一个违背祖训的决定。</strong>所有违背祖训的决定，最好由谁来做出？不是不肖子孙，而是由祖先自己来做出。所以这个决定大概是谢尔盖·布林自己做的。</p>



<p>以前的谷歌要求大家是什么？<strong>尽可能快的离开。</strong>你如果在谷歌页面里在停了很长时间，说明你没找到你要的东西。所以你越快的离开谷歌，就说明我提供的服务越好。以前的谷歌很多图书里面，包括他们的一些文章和演讲，里边都在讲这件事情。</p>



<h3 class="wp-block-heading">从“快速离开”到“留下来”</h3>



<p>但是现在不是这样了，你在谷歌搜索里头可以待半天。他们现在把这个事给做反过来了。为什么？因为他开了AI搜索，开了AI模式，你可以在里边跟他聊天了。所以谷歌现在不再追求让用户快速进入、快速找到答案、快速离开这件事了，而是让更多的用户时常留在谷歌的AI搜索和AI模式里头。</p>



<p>搜索的目的本身就不是找到网页，而是解决用户的问题。原来说我们在搜索，搜索完了以后，点击到网页里头再看广告，但是你在这个过程中，并没有直接解决用户的问题，你还要让用户跳到网页里边去看去。现在不用了，我直接给你把问题解决掉。那在这个过程中，我直接给你看广告就完了。<strong>用户留下来了，用户时长上升了，更多的广告就有了展示的机会。</strong></p>



<p>原来你没有那么多展示机会，像我们以前搜索谷歌，可能撑死了看一页，有的看两页，也就这样了。所以你说他能给你看几个广告？看不了几个。但我现在在谷歌AI模式里头跟他扯半天，那就很多很多的搜索，就都是很多很多的广告就都展示出来了。找到了答案了，也点过广告了，那就没有必要再跳转到目标网站瞎浪费时间了嘛。</p>



<p>所以我们看到什么？AdSense的收入在下降，下降了3%。所以我们现在如果再辛辛苦苦做网站，想去靠SEO再把这个钱挣回来，已经比较难了。因为现在确实跳转的少了，肥水不流外人田，都在谷歌自己这把这钱挣完了。这点有点像百度，百度也是肥水不流外人田，你在百度搜索看广告，点击了去百度知道、去百度贴吧接着看广告，而且都是百度自己家的流量。谷歌现在说我也是照着学，你们都别走了，在我这把这个答案找到了，把广告看完了，不要去其他任何网站了。</p>



<h2 class="wp-block-heading">AI时代最关键的问题：怎么赚钱？</h2>



<figure class="wp-block-image size-large"><img decoding="async" src="https://pictures.lukefan.com/google-ai-advertising-transformation-monetization/blog_4.JPEG" alt=""/></figure>



<p>那很多人说谷歌，你这也太不要脸了。不是这样的，事情没有这么简单。AI时代到来了，最关键的问题被谷歌找到了解决方案。AI时代是最关键的问题是什么？是AGI吗？是ASI吗（超级人工智能吗）？都不是。</p>



<p><strong>AI时代最关键的一个问题是：AI到底怎么赚钱？以及AI之后的时代，大家到底怎么过日子？这个答案现在被谷歌给带出来了。</strong></p>



<p>到底怎么做这件事？有些人在设想工作是可选项，马斯克说的你想工作就工作，不想工作拉倒吧；还有人在去设想全民发钱，这是山姆·奥特曼想的，当然马斯克讲的要比他好一点，要发很多的钱，大家都是富翁，想怎么花怎么花。但是这几件事情，其实对于大部分人来说，是比较难以想象的。为什么？钱还没发下来，AI公司也还没挣着钱，我先失业了。现在我们遇到了这样的一个问题，这也是为什么很多人觉得AI是泡沫的一个根本原因：吹了半天牛，最后你也没挣着钱，还把大家的工作搞没了。</p>



<p>那么谷歌的解法是什么？<strong>还是广告变现。</strong>但是AI时代了，广告又往前进了很大的一步。</p>



<h2 class="wp-block-heading">互联网的长尾与传统广告的门槛</h2>



<figure class="wp-block-image size-large"><img decoding="async" src="https://pictures.lukefan.com/google-ai-advertising-transformation-monetization/blog_5.JPEG" alt=""/></figure>



<p>在互联网到来的时候，我们经历了一个很神奇的东西，叫长尾现象。什么是长尾现象？原来只有做的最好的那一两样东西能卖掉，那些小众需求的这些东西，他们只能在很小的圈子里头去流传，不可能说在全世界范围内去卖一些很小众的商品。在互联网普及之前，这件事是不存在的。这种小众产品我们就要长尾，就是你搜索一开始是比较高的，然后他是这样慢慢越走越长的，一条这样的一个曲线。现在后边这些都有销售的机会，这就是长尾现象。像淘宝、亚马逊，都得益于长尾现象。</p>



<p>传统广告的投放，还是要稍微有一点点小麻烦的。跟大家讲一下传统广告是怎么投放的：</p>



<ol class="wp-block-list">
<li><strong>要有商品：</strong>首先你要有一个商品。</li>



<li><strong>选择卖点和关键词：</strong>我到底要宣传什么？在这一点上雷军还是比较强的，经常讲一些有的没的东西，把一个很司空见惯的东西吹的天花乱坠。</li>



<li><strong>制造素材：</strong>我不能说“2200兆帕的什么超硬钢”这个东西是卖点了，那你这是一句话，你最后还是要把它做成图片，做成视频。这个图片还分不同的尺寸和大小，你每过一段时间大家会有审美疲劳的，你还要做新的。</li>



<li><strong>充值与设置预算：</strong>那就像广告平台（就像谷歌这些公司）充值，要把钱充进去，设置预算。</li>



<li><strong>设置投放范围与出价：</strong>我到底出多少钱来投放？1000次展示是一美金了。谷歌的推荐引擎，它会去到广告库里去比价格，谁出的价高我先放谁的。然后要设置覆盖范围：手机、YouTube、搜索页？印度还是美国？男的女的？</li>



<li><strong>投放优化：</strong>广告平台搜集用户画像，进行竞价排序，展示广告，消耗预算。</li>
</ol>



<p>所以传统的互联网广告的门槛还是挺高的。能够找到卖点、能够做策划的人，价值就很高。中国人的传统技能就是做素材，对于老外来说基本上就是噩梦。中国人的超级极限玩法，成就了谷歌Meta。什么是超级极限玩法？我们把所有的利润都投成广告，一分钱都不剩下来，甚至还亏钱去投广告。这才是传统广告，它门槛非常非常高。</p>



<h2 class="wp-block-heading">AI带来的广告新场景：自动匹配与生成</h2>



<figure class="wp-block-image size-large"><img decoding="async" src="https://pictures.lukefan.com/google-ai-advertising-transformation-monetization/blog_5.JPEG" alt=""/></figure>



<p>下面我们来看几个新的场景，这就是AI来带给我们的广告新场景。</p>



<h3 class="wp-block-heading">场景一：小众的手作香水</h3>



<p>有一些香水是手工制作的，那商品肯定是一个非标准化的商品。比如说叫“雨后柏树冷杉”。用户偏好的信号，可能广告平台也收到了，最近在搜索“冷感木质香”、“不甜不腻”、“雨天味道”。他在YouTube里头，正好有一个展示机会了。那这个时候AI就会去匹配了。它会从商品的页面文案里头，包括配图和评论里边，抽出来木制、冷感、雨后这些词，<strong>它自动的生成一个素材，就直接给用户看了。</strong>看完了以后，就有可能能够促成一个交易。这是真正比较有意思的地方。</p>



<h3 class="wp-block-heading">场景二：极窄人群的跑鞋</h3>



<p>比如说某小众品牌的跑鞋，主打的是前掌落地、低落差、宽楦，页面写的很散，参数也不全。用户的偏好，比如在谷歌上搜索了“前脚掌跑步的”、“膝盖不疼的鞋”，或者是“宽脚跑鞋”。最近在地图上，还搜索过半马训练的路线。这些数据被谷歌找到了，那它就会去进行匹配了。从跑鞋的测试文章、用户评论里边（宽楦、低落差、缓震偏硬），并且识别用户是训练型而非潮流型，它就会根据用户搜索的GE，直接给你生成对应的广告。那这个广告转化率就会非常非常高。</p>



<h3 class="wp-block-heading">场景三：宠物定制粮</h3>



<p>比如说有一个商品，单一蛋白、没有谷物、还有低致敏，但是商家只写了一个“毛孩子吃了就不挠了”。用户的偏好是什么？他跑去搜索去了，说“我的猫频繁挠耳朵”、“换猫粮软便怎么办”；在论坛里头看到了“敏感肠胃猫粮”。这个时候AI又在干活了，就把这个挠痒、软便映射到了低致敏、单一蛋白上，并且把无谷成分透明作为卖点——这个卖点等于是AI替你找到了——然后制作了一条广告素材，强调单一蛋白加上低致敏试吃装，而不是泛泛的告诉你说猫粮打折这件事。</p>



<h2 class="wp-block-heading">AI时代的广告革命：更长的长尾与更高的转化</h2>



<figure class="wp-block-image size-large"><img decoding="async" src="https://pictures.lukefan.com/google-ai-advertising-transformation-monetization/blog_6.JPEG" alt=""/></figure>



<p>这些场景代表的是什么意思？<strong>在AI时代，我们会迎来比互联网时代更长的长尾。</strong>互联网时代就已经很长尾了，但是AI时代里头，会有非常非常多小众的需求被满足。</p>



<p>充值跟预算你还是必不可少的。但是谷歌会干什么？</p>



<ul class="wp-block-list">
<li><strong>商品自动入库：</strong>谷歌就直接把你的商品库全都扒走了，根据你的商品的各种描述、用户评论，通通都拎出来作为你的商品特性，AI系统会自动的总结关键卖点和差异性。</li>



<li><strong>更深度的用户理解：</strong>通过将用户留存在搜索页面上，在AI聊天窗口里，可以进一步的了解用户的属性，包括用户的各种长期记忆。AI系统绝对比我们自己还了解我们自己，更多的广告展示机会就来了。</li>



<li><strong>更大的竞价商品池：</strong>现在我不用你们去想这个卖点，也不用你们去做素材，我替你们搞，可以参与竞价的商品一下就变多了。那他就可以挑一个更贵的去给你展示，我挣到更多的钱。</li>



<li><strong>自动生成素材：</strong>不需要再设置详细的投放参数和范围了，由AI系统直接搞定。你原来没有做视频，谷歌替你做。</li>



<li><strong>更高的广告转化率：</strong>当你的广告转化率上升了以后，广告主就会愿意为你的广告设置更高的单价。</li>
</ul>



<p>从谷歌的财报上，是可以看出端倪的。它的整个的CPC（付费有效点击）涨了7%，总收入涨了12%。既然有效点击涨了7%，总收入涨12%的话，那就是广告单价上升了。广告主为什么愿意支付更高的广告单价？因为每次展示的时候，参与竞价的商品更多了，而且转化率也更高了，他就会成形成一个正向循环。</p>



<h2 class="wp-block-heading">黑五战报的启示</h2>



<figure class="wp-block-image size-large"><img decoding="async" src="https://pictures.lukefan.com/google-ai-advertising-transformation-monetization/blog_10.JPEG" alt=""/></figure>



<p>今年黑五的战报上，也可以看出相应的差异了。美国黑五的战报今年特别有趣，<strong>订单量下降了1%，但是平均价格涨了8%。</strong></p>



<p>这是什么意思？就是黑五钱更多了，但是东西更少了，每样东西都变更贵了。那你说为啥？最直接的一个原因，川大爷玩关税战。但是关税战给价格带来的平均涨幅是4.9%，剩下的3%左右的这个价格涨幅去哪了？是不是商家当利润揣口袋里了？不要太天真，卖东西的都是中国人，中国人挣出来利润，哪舍得往自己口袋里装？<strong>都给谷歌了，都给Meta了，都去交广告费去了。这才是事实的真相。</strong></p>



<h2 class="wp-block-heading">谷歌价值的三个层面</h2>



<p>谷歌的价值，其实我们应该分三层去理解。</p>



<ol class="wp-block-list">
<li><strong>技术领先：</strong>谷歌的Gemini确实遥遥领先了，TPU也确实是实现了全生态。而且现在已经开始向OpenAI、Meta以及Anthropic进行溢出了。</li>



<li><strong>全场景渗透：</strong>用户量和广泛的用户场景，正在快速的被Gemini渗透。谷歌有安卓、Chrome、搜索、YouTube、Gmail等，谷歌现在正在用自己的AI的大模型，把所有产业链上，或者所有用户场景都重新做一遍。每一个场景的应用，都会给谷歌带来巨大的用户流量以及用户留存。</li>



<li><strong>底层逻辑重构：</strong>谷歌的底层逻辑，从岌岌可危到了重新被验证。现在看广告联盟确实是完了，但是搜索广告起来了，而且广告还是未来的方向。</li>
</ol>



<h2 class="wp-block-heading">AI时代的未来：交易与内容</h2>



<figure class="wp-block-image size-large"><img decoding="async" src="https://pictures.lukefan.com/google-ai-advertising-transformation-monetization/blog_7.JPEG" alt=""/></figure>



<p>那么AI时代以后到底会是什么样子？我相信大家还是要去努力工作的。更多小众的、细节的、长尾的交易，将得到推荐，将被发现，并且有交付的机会。</p>



<p>真正在消费价值中不断上升的，其实是<strong>内容</strong>。这个内容包括什么？包括你们现在在看我YouTube的节目，这就是一个内容。我做了，你们看了，广告也播放了，相应的交易也被执行了，那我就分到钱了。所有被传播的内容都会被标价，进行售卖。大家买到的东西会越来越贵，因为你GDP上升了吧，你吃的粮食不会变多，但你值那怎么办？只能让粮食变贵。那多出来的钱是什么？<strong>多出来的钱就是广告费，广告费会分给内容创作者。</strong></p>



<p>AI让以前无法实现的生意可以实现了，让天下没有难做的生意。还记得前面我讲豆包手机那期吗？目的跟方法是有差异的。</p>



<ul class="wp-block-list">
<li>微信是个方法，跟人聊天才是目的。</li>



<li>谷歌也终于搞明白了，他们要实现的<strong>目的是交易，而不是搜索。</strong></li>
</ul>



<p>交易与交付才是最终的目的。原来的搜索仅仅是方法。AI会改变方法，但是不会改变目的。AI不仅仅擅长编故事，还擅长进行非标准的匹配。AI做了匹配以后，就可以将故事以及附带在故事上面的交易做完。原来的方法崩塌了——就是搜索以及让你到网站上去看广告这个方法已经崩塌了——被AI颠覆了。</p>



<h2 class="wp-block-heading">总结</h2>



<figure class="wp-block-image size-large"><img decoding="async" src="https://pictures.lukefan.com/google-ai-advertising-transformation-monetization/blog_8.JPEG" alt=""/></figure>



<p>AI时代商品经济依然是无可替代的。人们要为了享受更好的商品和服务，继续努力劳作，不可能说直接给你发钱你就可以不干活了。人们也要通过交易，筛选出更好的产品和服务，让科技商业和社会找到未来的方向。</p>



<p>我一直觉得交易这件事情，才是推动整个社会前进的一个最核心的点。竞争的过程，就是要把那个最好的挑出来，要告诉社会我们要向哪个方向发展。而在整个的这个过程中，谷歌现在已经验证了，说OK这条路还是走得通的。这条路还是走得通的。当然了，这些靠谷歌广告的这些网络广告商，他们的日子确实会难做一点点。但是这些人也要重新去思考，说我再做一点什么样的新的内容，能够重新符合新的这种运作模式。</p>



<p>这个才是今天我们要讲的故事：<strong>就是谷歌为AI后时代指明了方向，会把这个广告整个干掉，却让交易更高效地发生。</strong></p>



<p>背景图片：<br><strong>high-contrast watercolor illustration, massive cross-border logistics warehouse during Christmas season, towering staggered shelves cluttered yet orderly, autonomous logistics robots gliding on tracks carrying goods, scattered computer workstations where designers create Christmas advertising materials, cargo boxes wrapped in festive red packaging, warm yellow spotlights mounted on the ceiling casting a cozy holiday glow throughout, neon cyan rimlight, deep navy background, glossy reflections on surfaces, sharp subject separation, extremely legible negative space for text overlay, minimal palette of ink blue neon cyan and gold accents, cinematic composition, ultra-detailed, intricate linework, &#8211;ar 16:9 &#8211;raw &#8211;s 250 &#8211;v 7.0 &#8211;p lh4so59</strong></p>



<figure class="wp-block-image size-large"><img decoding="async" src="https://pictures.lukefan.com/google-ai-advertising-transformation-monetization/background_1.JPEG" alt=""/></figure>



<figure class="wp-block-image size-large"><img decoding="async" src="https://pictures.lukefan.com/google-ai-advertising-transformation-monetization/background_2.JPEG" alt=""/></figure>



<figure class="wp-block-image size-large"><img decoding="async" src="https://pictures.lukefan.com/google-ai-advertising-transformation-monetization/background_3.JPEG" alt=""/></figure>



<figure class="wp-block-image size-large"><img decoding="async" src="https://pictures.lukefan.com/google-ai-advertising-transformation-monetization/background_4.JPEG" alt=""/></figure>



<figure class="wp-block-image size-large"><img decoding="async" src="https://pictures.lukefan.com/google-ai-advertising-transformation-monetization/background_5.JPEG" alt=""/></figure>
]]></content:encoded>
					
		
		
			</item>
		<item>
		<title>游戏天才到诺奖得主，他凭什么断言AGI只差临门一脚？揭秘哈萨比斯开挂人生背后的逻辑｜Demis Hassabis、Google DeepMind、AGI 时间表、5到10年</title>
		<link>https://lukefan.com/2025/12/10/demis-hassabis-deepmind-agi-challenges-world-model-agents/</link>
		
		<dc:creator><![CDATA[Luke Fan]]></dc:creator>
		<pubDate>Wed, 10 Dec 2025 00:58:24 +0000</pubDate>
				<category><![CDATA[AIGC]]></category>
		<category><![CDATA[Google的故事]]></category>
		<category><![CDATA[5到10年]]></category>
		<category><![CDATA[AGI]]></category>
		<category><![CDATA[AGI 时间表]]></category>
		<category><![CDATA[AI Agent]]></category>
		<category><![CDATA[AI突破]]></category>
		<category><![CDATA[AI路线图]]></category>
		<category><![CDATA[AI进展]]></category>
		<category><![CDATA[AI预测]]></category>
		<category><![CDATA[AlphaFold]]></category>
		<category><![CDATA[AlphaGo]]></category>
		<category><![CDATA[Axios AI峰会]]></category>
		<category><![CDATA[Demis Hassabis]]></category>
		<category><![CDATA[Gemini]]></category>
		<category><![CDATA[Gemini 3]]></category>
		<category><![CDATA[Google Deepmind]]></category>
		<category><![CDATA[世界模型]]></category>
		<category><![CDATA[人类水平AI]]></category>
		<category><![CDATA[大模型局限]]></category>
		<category><![CDATA[强化学习]]></category>
		<category><![CDATA[德米斯·哈萨比斯]]></category>
		<category><![CDATA[技术挑战]]></category>
		<category><![CDATA[持续学习]]></category>
		<category><![CDATA[智能体系统]]></category>
		<category><![CDATA[蛋白质折叠]]></category>
		<category><![CDATA[认知神经科学]]></category>
		<category><![CDATA[诺贝尔奖得主]]></category>
		<category><![CDATA[谷歌AI]]></category>
		<category><![CDATA[谷歌大脑]]></category>
		<category><![CDATA[通用人工智能]]></category>
		<category><![CDATA[长期规划]]></category>
		<guid isPermaLink="false">https://lukefan.com/?p=3119</guid>

					<description><![CDATA[🔥家人们！谷歌AI掌门人刚刚放话：AGI（通用人工智能）只剩俩Alpha Go级别的突破了！5-10年？我直接笑死，这哥们德米斯·哈萨比斯简直是人类版“爽文男主”💥

7岁国际象棋大师，8岁用奖金买电脑写代码，诺奖都上手了！Alpha Go算啥？他顺手搞出Alpha Fold预测蛋白质，直接拿诺奖化学奖，还把谷歌大脑干趴了，现在Gemini 3在他手里帅炸——问《搏击俱乐部》戒指象征啥？人家秒答“抛开身份，极端蜕变”，绝不哄你开心，高冷又自信！🤯（不像某GPT，说错就秒怂“对不起”🤣）

谷歌为啥这么狂？全程科研“怪兽模式”🛒——人才多到像中国吃西瓜（全球70%！），多路并行砸钱：世界模型搞虚拟宇宙，智能体直接替你写PPT、规划旅行！难点？AI还不会跨对话记事（忘记你叫老范就离谱），但突破在即💥兄弟们押注5年内AGI？我赌一包辣条，谷歌又要杀疯！

👉点赞的今年AI帮你写年终总结！评论区喊“冲AGI”，抽3人送Gemini 3黑科技体验～（别卷了，这赛道我直接躺赢！）💯 #AI未来已来 #谷歌杀疯了

标题1：诺奖得主震撼预测：AGI并非遥不可及，仅差最后两项AlphaGo级突破，5到10年内将至？｜通用人工智能、Demis Hassabis、Google DeepMind、AGI 时间表
标题2：谷歌模式VS普通公司：当别家还在追热点，谷歌已用怪物级投入锁定AGI终局，未来胜负已分？｜Google DeepMind、AGI 时间表、5到10年、人类水平AI
标题3：别再盲目乐观！谷歌CEO亲承Gemini仍有4大死穴，持续学习与长期规划难题不解决，AGI就是空谈｜技术挑战、AI突破、AI进展、Gemini、AI路线图
标题4：从游戏天才到诺奖得主，他凭什么断言AGI只差临门一脚？揭秘哈萨比斯开挂人生背后的逻辑｜Demis Hassabis、Google DeepMind、AGI 时间表、5到10年
标题5：通往AGI的最后两块拼图已锁定！DeepMind CEO首次公开具体路线：搞定世界模型与智能体系统就够了｜通用人工智能、Demis Hassabis、AI路线图、AI突破
简介：Google DeepMind CEO Demis Hassabis 在Axios AI峰会投下震撼弹：实现通用人工智能（AGI）仅需5到10年，关键在于攻克“世界模型”与“智能体系统”两大技术挑战。这究竟是基于Gemini成功的乐观预测，还是忽略了AI发展的核心风险？本期将深入解读哈萨比斯给出的AGI时间表，以及这位诺奖得主为何有此底气。]]></description>
										<content:encoded><![CDATA[
<figure class="wp-block-embed is-type-video is-provider-youtube wp-block-embed-youtube wp-embed-aspect-16-9 wp-has-aspect-ratio"><div class="wp-block-embed__wrapper">
<iframe loading="lazy" title="通往AGI的最后两块拼图已锁定！DeepMind CEO首次公开具体路线：搞定世界模型与智能体系统就够了｜通用人工智能、Demis Hassabis、AI路线图、AI突破" width="900" height="506" src="https://www.youtube.com/embed/uZUI2kPjrNk?feature=oembed" frameborder="0" allow="accelerometer; autoplay; clipboard-write; encrypted-media; gyroscope; picture-in-picture; web-share" referrerpolicy="strict-origin-when-cross-origin" allowfullscreen></iframe>
</div></figure>



<figure class="wp-block-image size-large"><img decoding="async" src="https://pictures.lukefan.com/demis-hassabis-deepmind-agi-challenges-world-model-agents/blog_1.JPEG" alt=""/></figure>



<h1 class="wp-block-heading">谷歌Deepmind的CEO说：“我们与AGI之间，只差一到两个AlphaGo级别的技术难关了。”</h1>



<p>大家好，欢迎收听<a href="https://youtube.com/@StoryTellerFan" target="_blank" rel="noopener">老范讲故事的YouTube频道</a>。</p>



<p>现在Gemini 3正在大杀四方，谷歌里面负责开发Gemini的部门叫Deepmind，他的CEO出来接受访谈，关注度还是比较高的。</p>



<p>谷歌Deepmind的首席执行官叫德米斯·哈萨比斯，2025年12月4日接受了一个访谈，是在旧金山举行的Axios AI大会。和他对谈的人呢，是Axios的创始人和主编，叫Mike Allen。在这上面他讲到说，我们距离AGI还差一到两个类似于AlphaGo这样级别的突破，突破过去就可以了。</p>



<h2 class="wp-block-heading">哈萨比斯：爽文男主般的开挂人生</h2>



<figure class="wp-block-image size-large"><img decoding="async" src="https://pictures.lukefan.com/demis-hassabis-deepmind-agi-challenges-world-model-agents/blog_2.JPEG" alt=""/></figure>



<p>哈萨比斯到底是一个什么样的人呢？绝对的爽文男主，挂b一样的存在。</p>



<h3 class="wp-block-heading">从国际象棋神童到认知神经科学博士</h3>



<figure class="wp-block-image size-large"><img decoding="async" src="https://pictures.lukefan.com/demis-hassabis-deepmind-agi-challenges-world-model-agents/blog_3.JPEG" alt=""/></figure>



<p>哈萨比斯是一个英国人，Deepmind本身是一个英国公司，后来被谷歌收购的。他呢，76年在伦敦出生，这个姓氏是个希腊姓氏。他的父亲呢，是来自塞浦路斯的希腊裔，而他的母亲呢，是来自于新加坡的华裔。所以哈萨比斯呢，可以算是半个华人。</p>



<p>从小，这哥们是一个国际象棋神童。像这样的人，肯定都是有异于常人之处。4岁就开始下棋，13岁就达到了国际象棋大师水准。8岁就用自己的国际象棋奖金，给自己买了台电脑，开始学习编程了。</p>



<p>本科和硕士呢都是剑桥的，学的CS就是计算机科学，在校期间一直代表剑桥参加各种国际象棋比赛。博士呢是伦敦大学学院，专业方向是认知神经科学和神经科学。</p>



<span id="more-3119"></span>



<h3 class="wp-block-heading">从游戏制作人到AI先驱</h3>



<figure class="wp-block-image size-large"><img decoding="async" src="https://pictures.lukefan.com/demis-hassabis-deepmind-agi-challenges-world-model-agents/blog_4.JPEG" alt=""/></figure>



<p>工作，这哥们一开始做游戏的。先去加入了很著名的牛蛙工作室，这个牛蛙工作室呢，最著名的作品叫做《地下城守护者》。但是哈萨比斯当时进去的时候，应该还没有开发这个产品，牛蛙工作室最终是被EA给收购了。后来呢，他自己创建了一个工作室接着做游戏，叫做仙丹工作室。2004年出了一个游戏叫《邪恶天才》，是一个模拟经营游戏，就是一帮邪恶天才在一个小岛上做各种各样坏事的这样的一个游戏。只是呢，这个游戏并不怎么挣钱，这种超级天才做出来的游戏都未必能挣钱。</p>



<p>他呢就把工作室关掉了。后来呢，《邪恶天才》的IP被收购了，2021年《邪恶天才2》发布，但是呢，《邪恶天才2》就已经跟哈萨比斯没有什么关系了。</p>



<p>关闭这个游戏工作室之后，他就去创建了Deepmind。Deepmind主要还是游戏方向，他呢在里边去训练AI下围棋。这哥们是个国际象棋大师，但是呢开始训练AI下围棋，也就是AlphaGo这个东西就出来了。在这中间呢，还训练AI去打各种游戏，星际争霸呀，做一些其他这样的训练。</p>



<h3 class="wp-block-heading">收购、AlphaFold与内部整合</h3>



<figure class="wp-block-image size-large"><img decoding="async" src="https://pictures.lukefan.com/demis-hassabis-deepmind-agi-challenges-world-model-agents/blog_5.JPEG" alt=""/></figure>



<p>2014年，Deepmind就被谷歌给收购了，6.5亿美金的价格。但是这个数字呢，并不是特别统一，很多的报道里的这个数字是有一些偏差的。有人说是4亿美金，也有人说是6.5亿美金，还有人说是4亿英镑。因为收购的时候，谷歌自己并没有公布价格，这些价格呢都是后续的报道里边去写的。</p>



<p>在谷歌收购以后呢，哈萨比斯在Deepmind里头又开发了叫AlphaFold这样的一个产品。这个产品是解决蛋白质折叠难题的。蛋白质实际上是这种超大分子，这些超大分子，我们算清楚有多少碳、多少氢、多少氧、还有氮，它并不是一个平面的结构，它是一个立体的结构，3D的。在这样的一个结构里头，它到底是怎么去排列和折叠的呢？原来大家是去预测呀、去猜呀，或者通过一些很复杂的设备去进行扫描，通过这样的方式去识别，成本是很高的。你要想去用蛋白质开发各种药品，你就必须要搞清楚它的3D架构空间，你搞不清楚，这事没法往前走。</p>



<p>哈萨比斯就去搞了AlphaFold，用AI去预测蛋白质的3D折叠空间到底是怎么回事。2020年呢，这个AlphaFold在蛋白质预测大赛中夺得头筹，比第二名强好几倍，这个事基本上就算解决了。现在只要是知道这个蛋白质的分子结构，这个AlphaFold的预测结果就极其准确。2024年，哈萨比斯依靠这个AlphaFold获得了诺贝尔化学奖，这哥们是个诺贝尔奖得主。</p>



<p>这还没完，他呢还在内部斗争中战胜了谷歌大脑。这是一个什么故事呢？谷歌内部一直是有两个AI部门的，一个是Deepmind，另外一个叫谷歌大脑，相互内斗，相互争夺资源。直到什么时候呢？直到ChatGPT出来，三年前谷歌拉响了红色警报，说不能再这样了，你们俩两家打来打去，这个不行了。那怎么办呢？最终是Deepmind合并了谷歌大脑，所以现在整个的谷歌AI是由Deepmind来去负责的，由哈萨比斯来去管理。</p>



<p>现在的Gemini 3使用的技术，大多都是原来谷歌大脑研究的方向：Transformer、大语言模型都是那边研究的。而Deepmind呢，原来在英国这帮人研究的呢，就是AlphaGo、AlphaZero（AlphaZero是AlphaGo之后的一个下棋的模型）以及各种可以自动玩游戏的AI产品，还有呢就是AlphaFold，做这个蛋白质分析的。</p>



<p>哈萨比斯除了是Deepmind的CEO之外，他自己还有一间专门做药的公司，专门用AlphaFold去做蛋白质研究，做各种新创新药的公司，他也是那个公司的创始人。所以哈萨比斯管理了整个的谷歌AI方向，以及谷歌Gemini这个产品化方向，都是归他管的。所以，爽文人生，绝对没有任何问题吧？</p>



<h2 class="wp-block-heading">通往AGI之路：还差哪两个AlphaGo级别的突破？</h2>



<figure class="wp-block-image size-large"><img decoding="async" src="https://pictures.lukefan.com/demis-hassabis-deepmind-agi-challenges-world-model-agents/blog_6.JPEG" alt=""/></figure>



<p>哈萨比斯认为，我们距离AGI到底还差哪两个AlphaGo级别的突破呢？他自己做AlphaGo的，所以AlphaGo到他这儿变成了一个衡量单位，再出现两次AlphaGo这样的突破，我们就达到AGI了。</p>



<h3 class="wp-block-heading">Gemini 3的惊人进展</h3>



<figure class="wp-block-image size-large"><img decoding="async" src="https://pictures.lukefan.com/demis-hassabis-deepmind-agi-challenges-world-model-agents/blog_7.JPEG" alt=""/></figure>



<p>他呢首先讲到Gemini 3，现在确实让人震惊，已经从文本专家变成了多模态理解系统了。他举了一个案例，说有一个电影叫《搏击俱乐部》，主角上去打斗之前把戒指摘下来了。他就去问这个Gemini，说这代表什么意思。它没有告诉你把戒指摘了就完了，而是告诉你说，这是主角抛开了身份、摆脱了规则的象征，是角色从现实到极端的转变。这个确实挺让人震惊的，这个Gemini 3模型有了自己的判断，不再只是迎合了。</p>



<p>到GPT这儿，你说你错了，它就会说“对不起，我错了”。到Gemini 3上，你说你错了，它会很耐心地给你解释，或者跟你去讨论这个事，是不会直接承认的。说Gemini 3的性格，叫“简洁，冷静，有自信，不讨好”。这个是哈萨比斯自己作为一个科学家，非常非常喜欢Gemini 3的一个地方。</p>



<p>而且Gemini 3呢，现在已经从生成内容，在向着打造产品的方向前进了。我们现在使用Gemini 3去做PPT，去做简单的应用原型，效果已经非常好了。它已经可以去执行一个比较简短的、连续的这种AI agent的工作了，这个是Gemini 3真正强的地方。</p>



<h3 class="wp-block-heading">大模型当前面临的难题</h3>



<figure class="wp-block-image size-large"><img decoding="async" src="https://pictures.lukefan.com/demis-hassabis-deepmind-agi-challenges-world-model-agents/blog_8.JPEG" alt=""/></figure>



<p>哈萨比斯说了，现在的大模型还是有很多问题没法解决的。</p>



<ol class="wp-block-list">
<li><strong>不具备持续学习的能力。</strong>很多人都在担心，说我跟大模型聊了半天，是不是大模型就拿聊天的结果回去做训练去了。其实有时候确实他干，但主要做的是什么呢？就是强化学习。因为我们跟Gemini聊天，他经常会出俩答案让你挑一个，你在挑选的时候呢，实际上就已经在开始帮助大模型进行训练了。但是搜索的结果、我生成的内容、我提出的问题，我让这些东西去进入到大模型里头去进行训练的话，这个是不行的。大模型必须要进行数据筛选，然后才能训练。日常的这些内容，你拿去训练大模型的话，大模型可能会越训越笨的，特别是很多互联网上的垃圾信息，你塞到大模型里去训练，根本就没有办法达到预期的效果。所以大模型是没有办法自己去找内容去训练的，还是需要人先去提出要求，然后去进行数据清洗、数据处理。现在都是由大模型根据原始数据，再去生成最后的预训练数据，然后才能再去训练。所以这个事情，还没有办法让大模型自己去干，这是第一个问题。</li>



<li><strong>无法执行长期的规划。</strong>虽然现在Gemini 3已经可以走一个一两个小时的规划，它还是能够走完的。但是你说我这有一个很多步骤，还是并行的，这种步骤需要去执行，执行完了以后需要连续执行几天、甚至几个月的这种任务，这个Gemini 3还搞不定。现在谁都搞不定这个事情。所以现在人去使用大模型，我们还需要自己去理解问题、自己去拆解问题，然后把这个拆解好的问题扔给大模型，而在对大模型的结果进行确认和验证之后，再把结果拼凑起来，让大模型去做下一步。它没有办法说你一开始给他个要求就做出来，“上帝说有光，于是就有了光”，这个事现在还做不到。</li>



<li><strong>智能体系统很不稳定。</strong>为什么它没法连续干下去？就是它可能干着干着就跑偏，而且跑偏的过程中呢，自己不知道跑偏。在这个过程中，就有可能会浪费大量的TOKEN和算力，最后呢得出一个完全不可用或者说有害的一个结果出来。这个是目前为止大模型无法避免的问题。</li>



<li><strong>缺乏跨对话的稳定记忆。</strong>现在大模型已经开始有记忆了，但是大量的记忆呢，还是在对话内的。而对话外的这种记忆，就是跨对话的记忆呢，它也不是说没有，像ChatGPT也好、Gemini也好，都是有一些跨对话记忆的。但是呢，这个记忆的空间都很小，你不可能说让他记很多的东西，然后跟你进行跨对话的去聊天。为什么呢？对于计算机来说吧，让它记住什么事是非常非常容易的，往硬盘里写不就记住了吗？但是让它忘掉是很难的。到底应该记住哪一部分、忘掉哪一部分，在下一次工作的时候我应该使用其中的哪部分去参与工作，这件事是非常难去抉择的。这就是大模型跨对话记忆的这个难点。所以他讲的，现在缺乏跨对话的稳定记忆，就是你让他记住可以，但是呢不一定下次就想起什么事来，可能他会找一个完全不相关的知识点，就参与到你这一次新的对话里去了。现在我们使用大模型的方式还是比较简单粗暴的，你发现讲着讲着驴唇不对马嘴了，怎么办？开始新话题，就是把原来的记忆都清干净。我们开始一个新的，甭管是Gemini也好，还是ChatGPT也好，它会有一些跟我们个人相关的这种个性化记忆。比如说我就告诉这个ChatGPT：“你记住了，我叫老范，我是个Youtuber，每天都要做什么事情。你要给我去总结信息，或者我要找你提问题，你要先去经过验证才能给我。”就这些玩意，我是可以让他记住的。但是如果你给他特别多的东西让他记，或者说我们在整个的聊天过程中让他把所有聊天内容都记下来，他就没法干活了。</li>
</ol>



<h3 class="wp-block-heading">两大关键突破点</h3>



<figure class="wp-block-image size-large"><img decoding="async" src="https://pictures.lukefan.com/demis-hassabis-deepmind-agi-challenges-world-model-agents/blog_9.JPEG" alt=""/></figure>



<p>这些问题关键的突破点是什么呢？咱们前头讲了两个关键突破点。</p>



<ul class="wp-block-list">
<li><strong>世界模型：</strong>让AI理解物理世界的运行规律，这个是非常重要的。Deepmind内部呢，有一个叫Genius模型（天才模型），这呢是一个世界模型，通过物理一致性和时间连贯性生成虚拟世界，最后输出视频的。大方向上呢，跟李飞飞的方向是比较接近的。但是Deepmind的这个模型，是更接近于游戏世界一点点。这个哈萨比斯，不愧是从游戏公司里出来的，人生的第一份工作都是对一个人有重要的作用的。</li>



<li><strong>智能体系统：</strong>现在Gemini虽然也算是智能体，但是距离智能体系统还是有一些差距的。什么是智能体系统？就是从回答问题到完成任务。现在Gemini依然是在回答问题。他说未来呢，Gemini会嵌入眼镜、工作场景和工作流里面，能够记忆、推理或者是代办，不再只是回答问题，而是直接完成各种各样的任务。你让他做一个什么事的，切咔切咔给你做完了。可以自主规划、执行任务，并且根据结果调整的这种稳定的智能系统，这就是未来方向。</li>
</ul>



<p>所以呢，两个AlphaGo级别的突破，一个是世界模型，第二个是智能体系统。</p>



<h2 class="wp-block-heading">谷歌：科研领域的“怪物”</h2>



<figure class="wp-block-image size-large"><img decoding="async" src="https://pictures.lukefan.com/demis-hassabis-deepmind-agi-challenges-world-model-agents/blog_10.JPEG" alt=""/></figure>



<p>讲到这儿，要再跟大家啰嗦几句。其实大部分的科技公司，是无法想象谷歌的运作方式的，就像是大部分国家的人也无法想象中国是一个什么样的存在，是一样的。</p>



<p>中国的这种存在方式呢，联合国里边专门有一个效应，叫“中国效应”，就是各种统计的时候，一定要把中国排出去。为什么？因为你一旦把中国加上，所有统计数据就没有任何意义了。咱们举一个最简单的例子，吃西瓜。全世界的人都没法想象中国人到底一年吃多少西瓜，咱本身人就多，咱们一年大概吃全世界70%的西瓜。你把这个统计起来，全世界每个国家大家平均吃多少西瓜，你把中国算进去，这事没法算了。包括像什么发电、炼钢，只要是跟制造相关的，你就不能把中国搁里头统计，因为这个完完全全是另外一个维度了，它会让整个的统计结果完全失衡。中国属于是全产业链内卷，而且全产业链都产能过剩的一个国家。</p>



<p>谷歌呢，在科研上就有点像中国在产业链上的这个状态，很多方面呢都会尝试和探索。谷歌呢，具有非常高的人才密度、充足的科研经费，还有海量的数据，这个是缺一不可。而且呢，这些科研团队，他们的时间压力也不是很高，大家就自己按照自己的喜好去研究就行了。他们还在不断的收购新的、最前沿的公司，Deepmind就是买回来的嘛。</p>



<p>谷歌在AI领域里头，同时在探索强化学习（AlphaGo、AlphaZero这些产品）、认知架构、神经科学建模，以及Transformer大语言模型，这些都在研究。不是说我们觉得哪块有机会了，我就往这一个方向去研究。我记得特别清楚，我进入盛大网络参加入职培训的时候，他们就跟我讲说：“全世界只有一种游戏，这种游戏叫MMORPG，其他都不行。”后来我说那我们玩的其他游戏，他们说：“那些游戏不挣钱，我们不研究那个，我们只研究这一个最挣钱的。”这其实是大部分的公司的思考方式，我们既然已经证明了这玩意挣钱，其他的不挣钱，那咱就研究这就完了，特别很多中国公司是喜欢走这条路的。</p>



<p>但是谷歌不，它是所有的方向都要去试一试。而且很多方向呢，你都不知道什么时候能挣回钱来，他也要去试一试，比如说量子计算。前面咱们还专门讲过谷歌的量子计算是怎么回事。很多的这种科技成果，都没有办法给谷歌挣钱，也没有办法在谷歌内部取得成绩，很多人最终是离开了谷歌才创业成功的。现在的AI行业里头，创始人或者是创始的核心团队，大多都在谷歌混过。所以现在我们所看到的AI行业，或者叫AI革命，你基本上可以认为是一帮从谷歌出来的人在去折騰这个事情。</p>



<p>中国呢老说自己是“睡狮”，一旦被吵醒了会很吓人的。谷歌在科研领域里头，其实也是这么回事。拉一次红色警报，就有可能拎出像Gemini 3这样的大杀器出来吓唬人。现在Gemini 3火了，但是谷歌依然不会去收敛方向，照着唯一正确的方向前进，这不是谷歌的路子。谷歌的路子是什么？还是全面探索，严格追踪数据表现，保留多个可能性，并且不断验证。</p>



<p>普通公司能够解决当前的问题，预言一个未来的热门方向——大家注意，不热门他不去干，去一定是热门方向——他们才会愿意说我花一点精力、花点钱去折腾。像谷歌这个，都是这么多方向，哪块云彩下雨都不知道，到底什么时候做出来也不知道，就开始撒人、撒钱进去干活去了。在普通公司里头，能够去预言一个热门方向的，就已经算是很强的了。大量的都是别人做出来，特别是谷歌做出来，他在后边再接着跟着改。而且这些公司实在是搞不清楚什么是热门方向，或者热门方向搞不定怎么办？还有一条最简单的路：上谷歌挖人，或者直接从谷歌出来创业。这个就是普通公司跟谷歌之间的差异。所以谷歌呢，在科研领域里头完完全全就是一个怪物。</p>



<h2 class="wp-block-heading">总结与展望</h2>



<p>好，最后总结一下吧。谷歌Deepmind的CEO哈萨比斯，携Gemini 3成功之势参加了Axios AI大会，说再有一到两个AlphaGo级别的突破，就可以实现AGI了。这两个是什么呢？就是世界模型以及智能体系统。可能要5到10年，把这两个实现了以后，我们就达到AGI了。</p>



<p>本节目的特点，咱们八卦了一下哈萨比斯的开挂人生，也稍微介绍了一下谷歌这个绝对的科研领域的怪物。我们也希望谷歌，以及所在谷歌里头工作过的这些人，未来还会给我们带来更多的惊喜。</p>



<hr class="wp-block-separator has-alpha-channel-opacity"/>



<p>好，这个故事就讲到这里，感谢大家收听。请帮忙点赞、点小铃铛、参加<a href="https://discord.gg/ppKsNkttTv" target="_blank" rel="noopener">DISCORD讨论群</a>，也欢迎有兴趣、有能力的朋友加入我们的<a href="https://www.youtube.com/channel/UCUGLhcs3-3y_yhZZsgRzrzw/join" target="_blank" rel="noopener">付费频道</a>。再见。</p>
]]></content:encoded>
					
		
		
			</item>
		<item>
		<title>谷歌一出手，OpenAI的“凛冬”真来了？山姆·奥特曼内部备忘录罕见示弱，承认可能暂时落后｜Google vs OpenAI、AI Race、Google、OpenAI</title>
		<link>https://lukefan.com/2025/11/25/google-ai-gemini-nano-threatens-openai-model-as-app-startup-strategy/</link>
		
		<dc:creator><![CDATA[Luke Fan]]></dc:creator>
		<pubDate>Tue, 25 Nov 2025 01:18:11 +0000</pubDate>
				<category><![CDATA[AIGC]]></category>
		<category><![CDATA[Google的故事]]></category>
		<category><![CDATA[AI]]></category>
		<category><![CDATA[AI Agent]]></category>
		<category><![CDATA[AI Competition]]></category>
		<category><![CDATA[AI Dominance]]></category>
		<category><![CDATA[AI Ecosystems]]></category>
		<category><![CDATA[AI Race]]></category>
		<category><![CDATA[AI strategy]]></category>
		<category><![CDATA[AI创业公司]]></category>
		<category><![CDATA[AI开发者]]></category>
		<category><![CDATA[Anti-gravity IDE]]></category>
		<category><![CDATA[ChatGPT]]></category>
		<category><![CDATA[Future of AI]]></category>
		<category><![CDATA[Gemini]]></category>
		<category><![CDATA[Gemini 3 Pro]]></category>
		<category><![CDATA[Google]]></category>
		<category><![CDATA[Google TPU]]></category>
		<category><![CDATA[Google vs OpenAI]]></category>
		<category><![CDATA[Nano Banana Pro]]></category>
		<category><![CDATA[OpenAI]]></category>
		<category><![CDATA[Startups]]></category>
		<category><![CDATA[人工智能]]></category>
		<category><![CDATA[凛冬将至]]></category>
		<category><![CDATA[大模型]]></category>
		<category><![CDATA[大模型评测]]></category>
		<category><![CDATA[山姆奥特曼]]></category>
		<category><![CDATA[微信式逆袭]]></category>
		<category><![CDATA[模型即应用]]></category>
		<category><![CDATA[行业变革]]></category>
		<category><![CDATA[谷歌AI]]></category>
		<guid isPermaLink="false">https://lukefan.com/?p=3010</guid>

					<description><![CDATA[🔥老铁们！OpenAI掌门人Sam Altman连夜哭晕：“凛冬将至”❄️ 而Google新出Gemini 3 Pro+Nano Banana Pro直接掀桌打脸——这哪是模型升级？纯纯AI界“灭霸打完响指”啊！💥

实测爆笑：让Nano Banana Pro设计北京宫廷宴菜单🍗，它秒出0翻车神作！老北京炸酱面+烤鸭精致到流泪；反观某国产4.0…宫保鸡丁乱入现场（川菜混进宫宴？笑裂🤣），京酱肉丝硬画成红烧肉块…根本不懂“肉丝是条状”啊喂！核心暴击：它原生思考，不是调用外部工具包——这才是“模型即应用”的王炸真相！

凛冬警告⚠️：创业狗别死磕模型了！OpenAI都慌成狗，你的AI agent项目怕是要凉❄️ 但兄弟别逃！扎进冷门场景做专家（比如专攻宠物殡葬菜单？🐶→🐱），冬天尽头就是春天🌱 Google用户生态一爆发，新超级APP说不准就在你手！

#评论区嚎一嗓子：你焦虑不？点赞过万🔥，爆Google反重力IDE偷跑黑科技！凛冬？拿来吧你！💪

标题1：谷歌一出手，OpenAI的“凛冬”真来了？山姆·奥特曼内部备忘录罕见示弱，承认可能暂时落后｜Google vs OpenAI、AI Race、Google、OpenAI、Artificial Intelligence (AI)
标题2：一个北京烤鸭菜单测试，戳破无数AI应用泡沫！Gemini 3 Pro凭“模型即应用”打法让对手窒息｜Google vs OpenAI、AI Race、Google、OpenAI、ChatGPT、Gemini
标题3：AI泡沫要破了？错！谷歌正以一己之力改写牌局，击鼓传花游戏或将终结，行业迎来真洗牌｜Google vs OpenAI、AI Race、Google、OpenAI、AI Dominance、Future of AI
标题4：AI创业者警惕：别再卷模型和Agent了！谷歌正用“平台级”打法降维打击，未来生存法则已变｜Google vs OpenAI、AI Race、Startups、AI Dominance、Future of AI
标题5：重演微信式逆袭？谷歌Gemini绝地反击，奥特曼罕见承认OpenAI不再战无不胜，老大地位动摇｜Google vs OpenAI、AI Race、AI Competition、AI Dominance、Future of AI
简介：谷歌Gemini 3 Pro的发布正引发AI行业剧震，连OpenAI CEO山姆·奥特曼也发出“凛冬将至”的内部警告。本期将深入剖析，谷歌凭借“模型即应用”的强大整合能力，如何实现技术反超，并探讨这场Google vs OpenAI的巅峰对决将如何重塑AI Race格局。对于大量AI创业公司而言，这既是生存危机，也可能预示着新机遇的到来，调整AI Strategy已迫在眉睫。]]></description>
										<content:encoded><![CDATA[
<figure class="wp-block-embed is-type-video is-provider-youtube wp-block-embed-youtube wp-embed-aspect-16-9 wp-has-aspect-ratio"><div class="wp-block-embed__wrapper">
<iframe loading="lazy" title="AI泡沫要破了？错！谷歌正以一己之力改写牌局，击鼓传花游戏或将终结，行业迎来真洗牌｜Google vs OpenAI、AI Race、Google、OpenAI、AI Dominance" width="900" height="506" src="https://www.youtube.com/embed/kLuleFEcT4E?feature=oembed" frameborder="0" allow="accelerometer; autoplay; clipboard-write; encrypted-media; gyroscope; picture-in-picture; web-share" referrerpolicy="strict-origin-when-cross-origin" allowfullscreen></iframe>
</div></figure>



<figure class="wp-block-image size-large"><img decoding="async" src="https://pictures.lukefan.com/google-ai-gemini-nano-threatens-openai-model-as-app-startup-strategy/blog-1.jpeg" alt=""/></figure>



<h1 class="wp-block-heading">Gemini 3 Pro和Nano Banana Pro发布之后，OpenAI的山姆·奥特曼开始喊“凛冬将至”了</h1>



<p>大家好，欢迎收听<a href="https://youtube.com/@StoryTellerFan" target="_blank" rel="noopener">老范讲故事的YouTube频道</a>。凛冬将至（winter is coming），这是一个《权游》里边的梗，大家要小心准备了。以前呢，OpenAI每一次发布会之后，都会有一群的创业公司原地死亡。这次谷歌没有开发布会，直接发布了新产品之后，OpenAI虽然不至于原地死亡，但是凛冬将至了。</p>



<h2 class="wp-block-heading">奥特曼的内部警告：“凛冬将至”</h2>



<p>山姆·奥特曼到底是怎么说的呢？对外肯定不能跌面子，讲的是祝贺谷歌发布了Gemini 3，看起来是一个很棒的模型。但是曝光的一些内部备忘录里边，寒意已经体现出来了。奥特曼罕见的表现出了危机感，直言公司当前的氛围充满了不太妙的低迷气氛，大家都觉得有问题了。</p>



<p>OpenAI如今不得不拼命追赶，谷歌的AI进展可能给OpenAI创造暂时的<strong>“经济阻力”</strong>。大家注意，这个词叫“经济阻力”，它的收入可能会有问题。如果收入有问题的话，他前面画的1.3万亿这种大饼，这是会出大问题的，会让整个行业崩塌的。</p>



<figure class="wp-block-image size-large"><img decoding="async" src="https://pictures.lukefan.com/google-ai-gemini-nano-threatens-openai-model-as-app-startup-strategy/blog-2.jpeg" alt=""/></figure>



<p>现在，山姆·奥特曼要求团队进入战时状态，聚焦长远，即便意味着我们在当前阶段会暂时落后，也要押注更有雄心的突破。这个非常非常正确。首先，他承认了“我们现在可能暂时落后”，而且一段时间未必追得上。但是，如果只是跟着谷歌的脚步往前追的话，这是没法整的。因为谷歌最擅长的事情就是极限拉扯、极限迭代升级，你像Chrome到现在100多版了，安卓一年一个大版、一堆的小版，所以任何想在这后边跟版本的人，都会被谷歌拉死的。你要想跟谷歌竞争，一定要跳到谷歌外面去，自己做一些完完全全创新的东西，让用户有感知的东西，这个才是需要去干的活。</p>



<p>而且，山姆·奥特曼讲到，公司的估值虽然很高，但是要清醒看到，我们还有不少的功课要补，AI研发的严冬考验就在眼前，OpenAI必须奋起直追了。这也就是“凛冬将至”的出处。</p>



<p>大家还记得国内互联网企业是什么时候开始喊这句话的吗？谁喊的？任正非喊的。任正非喊“我们要让大家感受到寒意”之后，华为确实有在裁员，但是业绩并没有大的问题。但是华为身边的这些公司，就在大量的原地消失，直接就不见了。这就是凛冬到来的时候，我们会看到的景象。</p>



<span id="more-3010"></span>



<h2 class="wp-block-heading">Gemini 3 Pro到底有多强？</h2>



<p>Gemini 3 Pro到底强到一个什么样的程度，能让行业公认的老大OpenAI的山姆·奥特曼发出“凛冬将至”这样的声音呢？</p>



<p>我这几天呢，其实一直在用Gemini 3 Pro，本身感受并没有那么明显，只是觉得快了很多，回答的质量高了很多。Nano Banana Pro，那简直是强到没有朋友。</p>



<h3 class="wp-block-heading">实战对比：Nano Banana Pro vs. 即梦4.0</h3>



<p>我拿Nano Banana Pro跟国内的“即梦4.0”比较了一下，我的提示词是什么呢？说：“你给我设计一个北京烤鸭为主菜的北京宫廷宴菜馆的菜单，主要的菜品要有配图，要写上菜品名，要有这个菜品的配料以及口味的简单描述以及价格，其他的菜就不需要这个图片了。”</p>



<figure class="wp-block-image size-large"><img decoding="async" src="https://pictures.lukefan.com/google-ai-gemini-nano-threatens-openai-model-as-app-startup-strategy/Gemini_Generated_Image_p3ge8ep3ge8ep3ge.png" alt=""/></figure>



<figure class="wp-block-image size-large"><img decoding="async" src="https://pictures.lukefan.com/google-ai-gemini-nano-threatens-openai-model-as-app-startup-strategy/jimeng-2025-11-24-9282-%E5%8F%A4%E4%BB%A3%E8%AF%9D%E6%9C%AC%E5%B0%8F%E8%AF%B4%E5%8B%BE%E7%BA%BF%E4%B8%8A%E8%89%B2%E9%A3%8E%E6%A0%BC%E7%9A%84%E5%8C%97%E4%BA%AC%E7%83%A4%E9%B8%AD%E9%A4%90%E9%A6%86%E5%A4%8D%E5%8F%A4%E5%AE%AB%E5%BB%B7%E9%A3%8E%E5%8D%95%E9%A1%B5%E8%8F%9C%E5%8D%95%E3%80%82%E7%94%BB%E9%9D%A2%E6%95%B4%E4%BD%93%E9%87%87%E7%94%A8%E5%8F%A4%E4%BB%A3%E8%AF%9D%E6%9C%AC%E5%B0%8F....png" alt=""/></figure>



<p>两边都干活去了，其实干出来的结果都还不错。先说即梦吧，即梦呢画的很漂亮，上头也写着是多少多少钱一只烤鸭，烤鸭画的也还可以吧。但是呢，它在菜单里头混入了宫保鸡丁和麻婆豆腐，这两道菜其实是川菜，它不是北京菜。而且呢，它里头选用的北京菜京酱肉丝，它配的图呢是一个红烧肉的图。京酱肉丝，你里头必须得要有肉丝，得是条状的；而红烧肉是肉块，到最后画出来的是个肉块，就出现了这样的翻车现象。</p>



<p>Nano Banana Pro画的图是什么样的呢？非常的漂亮，上面是北京烤鸭，然后呢是其他的各种北京菜、老北京炸酱面呀，没有任何川菜混在里面。但是它也有一个bug，就是它写的价格是“文银多少两”，这个是很有趣的一点。即梦的这个价格都是58、68，相对来说是比较准确的。</p>



<p>这个例子大家看出来差在哪了吗？它们画的图，艺术感其实没有太大区别，差就差在：<strong>Nano Banana Pro自己是一个完整的模型，它把AI agent的活干完了</strong>，他自己在这个模型里头搜索了、思考了、推理了、研究了，然后把一个正确的东西画出来——但不能说一点瑕疵没有。而这个即梦干的活是什么呢？先调用了外部的工具，它可能也搜索了一些，甚至可能连搜索都没搜索，它可能调用的是豆包的这种大模型，使用豆包自己的知识体系，进行了一定的思考和生成，然后就去画图了。其实画的图两边差异不大，差异大就大在你到底是原生的模型进行思考、进行推理、进行搜索，还是说我是外部的。画的质量其实是一样的。</p>



<h2 class="wp-block-heading">谷歌的新武器：Anti Gravity IDE</h2>



<p>另外呢，这两天还试了一下Anti Gravity，它叫“反重力”，谷歌这次出的IDE。当然，这种产品大家要试用的时候，一定要注意一点是什么？不停的升级。因为这种产品迭代非常非常快，今天我去升级了以后，发现已经跟我第一天下载这个产品完全是天翻地覆的变化了，大概升了两个版本。变在哪了？因为我下载这个产品的时候，Nano Banana Pro还没发布呢，今天升级上去以后，已经把Nano Banana Pro挂进去了。这个产品是谁做的呢？就是当时谷歌花钱收购了Windsurf团队的核心成员，让他们进来给做的。所以这个产品做的呢，还可以。</p>



<p>这个产品现在彻底打通了MVC。这个什么东西？我们写程序的时候呢，一般是把程序分成三块儿：model、Controller和view这三块儿。model呢是所有跟数据相关的，你数据模型是什么样的，数据底层是什么样的，这种底层的一些API接口，这些都在model里头。Controller呢是各种的业务逻辑，写在这块。view呢是所有的让大家能看得到、能够交互的东西，就是视图。</p>



<figure class="wp-block-image size-large"><img decoding="async" src="https://pictures.lukefan.com/google-ai-gemini-nano-threatens-openai-model-as-app-startup-strategy/blog-3.jpeg" alt=""/></figure>



<p>为什么写程序会把这三块分开写呢？就是为了这三块可以让不同的人去做，把接口留清楚，就可以独立的去进行更新，而不要说眉毛胡子一把刷，牵一发动全身。为什么要专门强调这件事呢？因为以前的AI编程的工具，或者是Web coding的工具，他们主要是做后端，虽然前端也做一些，但是呢对于画图设计，还是要差一些的。</p>



<p>现在就不用费这个劲了。你直接向它描述，我今儿向它描述，我说：“你给我去做一个读书软件，我要求是羊皮纸的背景，要有各种图书相关的元素进去。”这个Anti Gravity就直接调用Nano Banana Pro去给我画图去了。先给我生成了一个羊皮纸的背景，然后呢给我生成了一个古色古香的页头，就是像那种花体字这样的东西，然后呢给我生成了所有的、跟看书相关的图标：有打开的书、有合起来的书、有笔，生成了全套的图标，还给我生成了一本书。生成完了以后，那边写程序把这玩意儿全挂进去了，这个是多么开心的一件事情！</p>



<h2 class="wp-block-heading">谷歌真正的可怕之处：生态与“微信式逆袭”</h2>



<p>通过Nano Banana Pro和Gemini 3 Pro更新的情况来看，现在呢，谷歌已经真的开始靠谱了，有用了，可以干活了。而且谷歌最可怕的还不是模型变强了，<strong>谷歌最可怕的是用户生态强</strong>。但是呢，Gemini现在的月活用户数是6亿多，比GPT的还是要少一些的，大概少个一两亿的样子。但是谷歌后边还有Gmail、Google Workspace、安卓、YouTube这么多用户群体，这么多用户场景在那等着它呢。</p>



<figure class="wp-block-image size-large"><img decoding="async" src="https://pictures.lukefan.com/google-ai-gemini-nano-threatens-openai-model-as-app-startup-strategy/blog-4.jpeg" alt=""/></figure>



<p>所以，谷歌一旦实现了AI突破的话，这对于OpenAI来说，不能说灭顶之灾，但是已经是非常非常危险的了。这也是为什么OpenAI的山姆·奥特曼会去警告员工公司营收增速可能下滑的一个原因，而且告诉员工说：“我们不再是战无不胜的了。”</p>



<p>现在呢，我们其实正在看一场微信一样的逆袭。什么是微信一样的逆袭？就是在微信出现之前，其实国内出了很多这些移动端的即时通讯工具。腾讯在PC端是老大呀，那么我怎么办？直接用PC端的QQ跟你们竞争，又竞争不过你们，因为包袱实在太重。说：“算了，咱们去做微信。”然后呢，是携着原来QQ积攒下来的社交关系链，直接碾压所有对手，就把当时的米聊、各种的talk、这talk那talk什么，全都给干翻了。所以，这就是一次微信式的逆袭。</p>



<p>那你说只有OpenAI感受到了“凛冬将至”吗？咱们再想想前面讲的华为任正非的故事，老大感受到凛冬将至了，那你原地死亡的人一定会更多。</p>



<h2 class="wp-block-heading">“模型即应用”：创业者的残酷现实</h2>



<figure class="wp-block-image size-large"><img decoding="async" src="https://pictures.lukefan.com/google-ai-gemini-nano-threatens-openai-model-as-app-startup-strategy/blog-5.jpeg" alt=""/></figure>



<p>Gemini的胜利，再次重申了AI创业领域里头一个非常让人不喜欢的论点，这个论点就叫做<strong>“模型即应用”</strong>。刚才我讲了Nano Banana Pro跟即梦之间的差异的例子，大家就知道为什么“模型即应用”是最厉害的。这个，虽然很多做应用的人非常非常讨厌这一条，但是目前来看，这条依然成立。</p>



<p>原来那些做应用开发的，特别是这些做AI agent的开发的，比如像ConflUI、像Cursor这些人，现在一定是感受到巨大的压力。如果你说我在这个圈子里头，还不在ConflUI和Cursor这样的领军位置的话，就可以直接宣布原地死亡了，就不用再去努力了。那些通过模型的调整、做复杂提示词工程和流程管理的，基本上是天塌了，因为这一部分活现在都直接被模型功能给覆盖掉了。</p>



<h2 class="wp-block-heading">特立独行的谷歌：AI圈的“局外人”</h2>



<p>这回是不是一个戳破泡沫的钉子呢？是不是谷歌直接逆袭了以后，AI泡沫就破了呢？很多人说：“不对，这不是AI又往前走了吗？AI有用了呀！”</p>



<p>但是呢，谷歌在整个AI游戏里边的位置是很尴尬的，参与了，但好像又没有参与的一个位置。你说谷歌是不是在做AI？肯定是，Gemini 3出来了，它不做AI谁做AI呢？而且它也有投资，它投资了Anthropic。但是呢，它又没有彻底参与到整个硅谷的AI军备竞赛里头去。前面咱们讲什么“击鼓传花”呀，“左脚踩右脚”，这里头跟谷歌其实关系不大。它没有用英伟达的芯片，它用的是自己家的TPU；它也没有投资了谁谁谁，买一堆芯片，然后再去建这个机房，它都是自有资金。跟外边讲的OpenAI投资什么项目、英伟达投资OpenAI、AMD投资OpenAI、OpenAI再去到Oracle那去订购算力订单……跟整个这个循环是没关系的。</p>



<figure class="wp-block-image size-large"><img decoding="async" src="https://pictures.lukefan.com/google-ai-gemini-nano-threatens-openai-model-as-app-startup-strategy/blog-6.jpeg" alt=""/></figure>



<p>那谷歌为什么这么另类呢？它为什么不跟大家一起玩耍呢？一个幼儿园里头，这个小朋友就看着这么奇怪，这么不合群呢？原因很简单，大家知道OpenAI，这个open要open谁呢？就是要open谷歌呀。建立OpenAI的原因，就是因为谷歌太不开放了。所以，整个的AI产业链，基本上都是从谷歌内部孵化出来的，每一个在做AI创业公司的人都在讲：“谷歌有问题，我要出来反它，我要出来干它。”它是这样的一个位置，谷歌在整个AI领域里头可以算是<strong>举世皆敌</strong>。</p>



<p>OpenAI这头，微软给了钱了，那头软银给了钱了，跟英伟达还有关系，跟AMD有关系，跟Oracle、亚马逊，它全都有关系。谷歌说：“我跟你们都没关系，你们都是从我这来的，我要收拾你们。”所以谷歌在整个的AI圈子里头，是最另类的一个，就像相声界里的郭德纲一样。</p>



<p>一旦谷歌成了，整个行业都会瑟瑟发抖。因为英伟达的芯片不再是必须的了，现在使用谷歌TPU，人家也把这事搞定了。OpenAI、微软还要继续回去跟谷歌争夺用户和应用场景了。原来说OpenAI的技术最好、用户体验最好，所以我不需要去跟你抢用户场景，用户自然而然就向我这边迁移了。现在谷歌的用户体验做的也很好了，那大家回去了，Office跟Workspace接着打，只能变成这样的一个状态，那对于他们来说是非常非常不利的。</p>



<p>而Oracle、Coreweave这些下游厂商建立起来的这些算力中心，就未必有人用了。很多人在去质疑，说你OpenAI四处建算力中心，四处去签这种巨额的算力协议，这到底能不能实现？现在就悬了。谷歌的Gemini模型是不会跑到这些算力中心上的，谷歌的这些Gemini模型一定会跑在谷歌云上，跟他们是没关系的。“击鼓传花”的游戏有可能就玩不下去了，所以整个行业现在都很害怕。</p>



<h2 class="wp-block-heading">凛冬已至，创业者何去何从？</h2>



<p>Gemini 3 Pro发布之后，创业者应该怎么办呢？咱们不能说“凛冬将至”，大家躺平，对吧？这肯定不是老范的风格。</p>



<figure class="wp-block-image size-large"><img decoding="async" src="https://pictures.lukefan.com/google-ai-gemini-nano-threatens-openai-model-as-app-startup-strategy/blog-7.jpeg" alt=""/></figure>



<ul class="wp-block-list">
<li><strong>不要去做大模型了。</strong>中国几个大厂除外，像什么豆包、千问，他们愿意折腾去折腾去。因为为什么？谷歌进不来，OpenAI也进不来，他们还是有一个巨大的市场可以去玩耍的。甚至在国内证明成功了以后，还可以开源出去，给老外那边再去搅和搅和。以后的模型呢就是大厂竞争了：谷歌、OpenAI、xAI和Anthropic，基本上就是他们四家搞了。至于Meta在里边要站在一个什么位置呢，现在还看不太出来。如果你说我一定要整点什么模型呢，可以在中国开源模型的基础上呢，做一些小的调整，重新训练新的模型。这个阶段已经过去了，现在剩下这四家——谷歌、OpenAI、xAI和Anthropic——也未必最后都能活得下来。那些单纯的图片、音视频的模型，最终应该都会被顶端的这些大模型公司统统干掉，像Midjourney、Flux未必能活得下去。</li>



<li><strong>不要去做那些模型未来会覆盖的领域。</strong>模型会越来越强，这个是必然；模型会越来越快，这个也是必然的。还有一个必然是什么？模型一定会越来越便宜。你说：“哎，我现在尝试去做一个应用，我在哪个地方用更便宜的模型，哪个地方用稍微贵一点的，达到一个在当前的成本下最好的效果。”别费这个劲！等你把这个产品做好了、上线的时候，那个最贵的模型的成本也降下来了。所以不用费这个劲，咱就直接使最贵的就完事了。那些只做工具调用、流程安排、结果确认的工具，或者是AI agent的产品，都会被模型覆盖掉的，大家就别费劲在这块卷了。</li>



<li><strong>要做“时间的朋友”和“平台的朋友”。</strong>这个就是在移动互联网时代里头我们反复在强调的事情，现在AI时代也在走这条老路了。什么叫“时间的朋友”和“平台的朋友”？以前做安卓App和iOS App的时候，我们一定要做苹果公司和谷歌公司的朋友。我们要考虑他们未来向哪个方向发展，我不能挡在人路上，那就不是“时间的朋友”了。我们也要考虑谷歌跟苹果这样的大平台，他们的诉求是什么，你不能把人家该干的活给人干了，那就不是“平台的朋友”了。所以我们要做时间的朋友，要做平台的朋友。而平台的话，在新的时代里就是这些大模型——咱们讲这4家公司的大模型。时间会让模型变得越来越强大，开发者必须在这个大前提下干活，你不能挡在这个模型的路上，不能随着时间的发展被模型淹没掉。</li>



<li><strong>要跟具体的用户和场景打交道。</strong>模型就是新的平台，再强大，其边缘依然是粗糙的。特别是在美国，他们这些大厂，他不会把每一个细节和边缘、方方面面都照顾到的。所以在这个时候，依然是需要我们去做很多的这种边边角角的事情。而且做了这些边边角角事情以后，未必没有机会去发展出新的超级App来，就像现在微信在iOS和安卓上变成超级App，这个过程是一样的。所以呢，不要觉得这个生意小、这个生意不挣钱、这个生意用户少，我们就不去做，先努力地扎下去再说。利用模型的能力解决具体的需求，与行业和场景进行深度的捆绑，成为行业专家——这就是咱们现在真正这些开发者或者是这些创业者该去干的活。不要尝试去编写代码弥补模型缺陷，直接等模型升级就行了。特别是Gemini 3 Pro发布以后，马斯克说了，我明年一二月份就要去发布Grok 5，那个时候我们就直接上6万亿大参数模型，大家等着看吧，拭目以待就可以了。</li>
</ul>



<h2 class="wp-block-heading">跨越临界点：零和博弈的终结与新机遇</h2>



<p>最后，凛冬将至，春天可能也就不远了。到了冬天了，后边就应该是春天了嘛。</p>



<figure class="wp-block-image size-large"><img decoding="async" src="https://pictures.lukefan.com/google-ai-gemini-nano-threatens-openai-model-as-app-startup-strategy/blog-8.jpeg" alt=""/></figure>



<p>谷歌已经基本上达到临界点了。什么是临界点？AI可用的临界点。这个东西能干活了，能够挣钱了。跨过临界点之后会怎么样呢？我多吃一口，你就少吃一口，市场规模是固定的，这玩意就叫零和博弈。一旦跨过临界点，这个零和博弈就被打破了，行业就会大爆发。以很多以前没法做、不值得做的事情，现在就有经济价值了。在这样的一个情况下，就会有很多的新的应用、新的产业就会产生。</p>



<p>我们没有4G网络的时候，谁会想到说大家可以刷短视频、刷抖音这样的东西？抖音会成为超级App，谁也想不到这个东西。因为那个时候网很慢，服务器的带宽也很贵，用户的手机带宽也很贵。但是你一旦过了这个坎，“哦，还可以干这样的事情”，整个变出了一个新的行业出来。</p>



<p>但是呢，要提醒大家，现在的很多投资，特别是股市上面的很多泡沫，还是有很大的打水漂可能性的。特别是OpenAI和英伟达之间的这种“左脚踩右脚”的生意，还是很危险的。当然了，全行业都会努力地拯救这些投资，这个跟谷歌无关。对于谷歌来说，叫“杀死你，与我无关”，这句话引自于《三体》。</p>



<h2 class="wp-block-heading">总结</h2>



<p>最后总结一下，Gemini 3 Pro发布了，绝对是挑战与机遇并存，不同层次的AI行业参与者，必须要重新给自己找到定位了。</p>



<p>好，这就是咱们今天要讲的故事：凛冬将至。</p>



<p>感谢大家收听，请帮忙点赞、点小铃铛、参加<a href="https://discord.gg/ppKsNkttTv" target="_blank" rel="noopener">Discord讨论群</a>，也欢迎有兴趣、有能力的朋友加入我们的<a href="https://www.youtube.com/channel/UCUGLhcs3-3y_yhZZsgRzrzw/join" target="_blank" rel="noopener">付费频道</a>。再见。</p>
]]></content:encoded>
					
		
		
			</item>
		<item>
		<title>我们都被骗了？Nano Banana Pro 真相揭秘：它根本不是Gemini 3简单叠加，原生多模态骨架才是颠覆关键｜Nano Banana Pro、Gemini 3 Pro、Gemini 3</title>
		<link>https://lukefan.com/2025/11/23/nano-banana-pro-gemini-3-ai-image-features-cost/</link>
		
		<dc:creator><![CDATA[Luke Fan]]></dc:creator>
		<pubDate>Sun, 23 Nov 2025 00:55:47 +0000</pubDate>
				<category><![CDATA[AIGC]]></category>
		<category><![CDATA[Google的故事]]></category>
		<category><![CDATA[4K图像]]></category>
		<category><![CDATA[AI Studio]]></category>
		<category><![CDATA[AI图像生成]]></category>
		<category><![CDATA[AI绘画]]></category>
		<category><![CDATA[Gemini 3 Pro]]></category>
		<category><![CDATA[Gemini API]]></category>
		<category><![CDATA[Gemini使用教程]]></category>
		<category><![CDATA[Google AI]]></category>
		<category><![CDATA[MidJourney对比]]></category>
		<category><![CDATA[Nano Banana Pro]]></category>
		<category><![CDATA[Nano Banana Pro价格]]></category>
		<category><![CDATA[Nano Banana Pro免费]]></category>
		<category><![CDATA[Nano Banana Pro测评]]></category>
		<category><![CDATA[PPT设计]]></category>
		<category><![CDATA[信息图表]]></category>
		<category><![CDATA[图像编辑]]></category>
		<category><![CDATA[多图融合]]></category>
		<category><![CDATA[多模态AI]]></category>
		<category><![CDATA[搜索增强绘图]]></category>
		<category><![CDATA[文字渲染]]></category>
		<category><![CDATA[文生图]]></category>
		<category><![CDATA[自然语言修图]]></category>
		<category><![CDATA[角色一致性]]></category>
		<category><![CDATA[谷歌AI绘画]]></category>
		<guid isPermaLink="false">https://lukefan.com/?p=2990</guid>

					<description><![CDATA[💥炸裂！谷歌新出的「纳米香蕉Pro」让设计师集体破防！男生亲测：直男做PPT竟比女友化妆还快！🤯

兄弟们，还记得那个画头像糊成马赛克的「纳米香蕉」吗？现在谷歌憋出**Nano Banana Pro**——直接把Gemini 3.0 Pro塞进画笔里！🔥 分辨率狂飙4K✨（修图再也不用抠头发丝了），写字稳如高考状元✍️（阿拉伯语花体？中文百字攻略？全是神还原！）。最离谱是：**一句话生成宫崎骏风土基熔岩堆PPT**，连PayPal黑帮老大彼得·蒂尔都能P上唐装喝小酒！🍷（GPT：这我绝不！谷歌：越权？我直接开画！）

💥**真香3连**：
1️⃣ **修图像点外卖**：“把西装换成宇航服，背景加火星”——秒改！再也不用PS抠到秃头🥹
2️⃣ **多脸齐聚不翻车**：14个头像一锅炖？Pro表示：稳！全家福、分镜故事，一键封神👨👩👧👦
3️⃣ **搜完再画超聪明**：让它画“大行D9折叠车拆解图”，它真会先搜图！这哪是AI？这是赛博丁真啊！🔍

💸价格小贵（4K图24美分），但**免费用户每天3张**！去Gemini.Google.com选“思考”+“绘图”，3秒出图（水印？咸鱼买账号秒解💧）。
**设计师说：天塌了。**
**我说：兄弟，赶紧去画个“你和马斯克撸串”的图！评论区Battle，点赞最高的送纳米香蕉电子皮肤！👇**
（直男福音实锤：再也不用求UI小姐姐了！😂）

⚠️警告：试完你会回来谢我！#AI神器 #打工人逆袭 #谷歌爸爸干得漂亮

标题1：Nano Banana Pro 对比 Nano Banana：不只是简单升级，背后是原生多模态的代差级碾压，设计师饭碗真悬了｜Nano Banana Pro、Gemini 3 Pro、Google、AI图像生成
标题2：价格暴涨6倍，从4美分飙到24美分一张图！Nano Banana Pro到底值不值？深度解析新增功能与高昂价格的背后｜Nano Banana Pro Gemini 3 Pro Google AI图像生成 价格
标题3：我们都被骗了？Nano Banana Pro 真相揭秘：它根本不是Gemini 3简单叠加，原生多模态骨架才是颠覆关键｜Nano Banana Pro、Gemini 3 Pro、Google、AI图像生成、Gemini 3
标题4：一句话生成带几十个字的复杂PPT，我用它画出PayPal黑帮关系图后彻底被震撼，工程师也能秒杀设计师了？｜Nano Banana Pro Gemini 3 Pro AI图像生成 文生图 图像编辑
标题5：Google彻底放飞自我？宫崎骏、哆啦A梦随便画，Nano Banana Pro 在版权红线上演惊天反转，竟比OpenAI还激进｜Nano Banana Pro、Gemini 3 Pro、Google、AI图像生成、功能
简介：Google 发布的 Nano Banana Pro 并非一次简单升级，而是由强大的 Gemini 3 Pro 驱动的代际飞跃。本文将深度解析其核心功能：从颠覆性的4K图像输出、精准的文本渲染能力，到一句话生成完整PPT页面的强大推理。我们将探讨它与前代的本质区别、高昂价格背后的价值，以及它将如何改变AI图像生成的游戏规则。
]]></description>
										<content:encoded><![CDATA[
<figure class="wp-block-embed is-type-video is-provider-youtube wp-block-embed-youtube wp-embed-aspect-16-9 wp-has-aspect-ratio"><div class="wp-block-embed__wrapper">
<iframe loading="lazy" title="我们都被骗了？Nano Banana Pro 真相揭秘：它根本不是Gemini 3简单叠加，原生多模态骨架才是颠覆关键｜Nano Banana Pro、Gemini 3 Pro、Gemini 3" width="900" height="506" src="https://www.youtube.com/embed/nnwN9AsGDlA?feature=oembed" frameborder="0" allow="accelerometer; autoplay; clipboard-write; encrypted-media; gyroscope; picture-in-picture; web-share" referrerpolicy="strict-origin-when-cross-origin" allowfullscreen></iframe>
</div></figure>



<h1 class="wp-block-heading">Nano Banana Pro发布了，它在Nano Banana的基础上到底做了些什么新东西？</h1>



<p>大家好，欢迎收听老范讲故事的YouTube频道。</p>



<p>大家等了半天的Nano Banana 2没有来，出来的是Nano Banana Pro。当然，前面Nano Banana Pro也是隐姓埋名，在各种的大模型评测平台上偷跑了好长时间。所以很多人呢，信誓旦旦地说：“我已经用到了这个东西，强的没边了。”现在终于发布出来了。</p>



<h2 class="wp-block-heading">从Nano Banana到Nano Banana Pro：核心区别是什么？</h2>



<p>从名字上呢，一个叫Nano Banana，另外一个呢加了个Pro，它们到底差在哪呢？原来的Nano Banana，其实是叫做Gemini 2.5 Flash image。现在的Nano Banana Pro呢，它背后的模型是Gemini 3.0 Pro image，是两个不同版本。而且一个呢是Flash，一个呢是Pro。Flash一定是比较快，出来的东西呢相对比较粗糙；而Pro的话，出来的东西就会比较笨重了，或者说比较昂贵，而且出来的东西非常非常细致和完善，它们核心的区别就在这里。</p>



<p>Nano Banana也是先在外边测试了很久然后才发布，这个名字也是当时他们测试的时候使用的名字。当然这一次测试呢，并没有叫纳米香蕉，这次换了个名字，因为纳米香蕉这名字你用过了嘛，好像叫GENIMG，大概是这样的一个名字去测试的。</p>



<span id="more-2990"></span>



<h2 class="wp-block-heading">回顾：初代Nano Banana的革命与短板</h2>



<p>当时Nano Banana为什么会轰动呢？就是一致性的问题彻底被解决了，包括多图融合，融合以后的一致性，这个问题已经彻底解决掉了。但Nano Banana生成图片也有很多的问题：</p>



<ul class="wp-block-list">
<li><strong>分辨率低：</strong>也就是1024乘1024或者1K的图片。</li>



<li><strong>无法处理复杂内容：</strong>你说我要写很多文字上去，这搞不定。你只能是相对来说，主体比较简单的图片可以搞定。</li>



<li><strong>文字错误多：</strong>写字经常写错，甭管是写中文、写英文，经常写错，这是当时的一个问题。</li>
</ul>



<p>但是因为它的一致性一下就得到了突破，所以呢还是火起来了。我记得当时Nano Banana出来的时候，最火的大家玩什么？就给它一张自己的照片，说：“来，给我生成一个图片，这个图片上是电脑，电脑里头呢，有我这个照片相关的3D玩偶的一个设计模型，桌子上呢要摆我的这个照片，以及呢用这个照片生成的3D玩偶的手办。要保证你电脑里边显示的模型、你的照片跟这个手办，要完全的能够对得上，这是同一个人。”他的一致性要很强，而且要不同的风格下的一致性依然很强，当时大家玩这个梗都玩疯了。</p>



<p>所以呢，当时很多人在玩什么？就是多张人像图片合成一个统一场景，同时呢保证一致，同一个人在多张图片里头五官、发型、服饰相对一致，或者同一个人在多张图里头保持风格统一。对于很多的用户来说，可以去轻松地制作全家福、多角色合影、连续故事分镜，都是可以做出来了，有极强的可玩性。</p>



<p>而且呢，Nano Banana是有相对比较强的世界知识和场景理解能力的，因为它后面的是Gemini 2.5 Flash的一个模型，所以你问它很多东西，它的基础知识是存在的，它继承了Gemini模型的语义和知识能力。这点对于像吉梦，还有像Midjourney这样的纯画图模型来说，就绝对遥遥领先了。能够跟Nano Banana去比语义理解能力的，也就是GPT image，就是在GPT-4o的基础上画图的这个模型。</p>



<p>Nano Banana呢，对于地理场景，比如说像地标建筑、服饰文化元素；场景，比如医生、厨师、程序员，都可以很好地去理解，而且感觉都似模似样的，或者我们叫“对齐”了——这算是大语言模型带给我们语言的一个污染，现在大家都在讲“对齐”这个词——所以它跟我们日常认知是可以对齐的。</p>



<p>而且呢，Nano Banana是可以做自然语言修图和局部编辑的。很多人特别讨厌做修图的原因是什么？你需要做选择，这一块是衣服，那一块是手，这一块是背景，你要拿这个线把这个后边的背景抠出来，这个是很烦的。但是Nano Banana就不需要，你只需要告诉他说：“现在请把衣服给我换成这身，请把这个鞋给我换成那个。”或者说：“请把这个瓶子上的文字给我换一下。”就可以搞定了，再也不需要上去打点勾线了。这个事儿，是Nano Banana给大家带来的非常非常好的体验。</p>



<p>还有一点很重要的是什么？就是低延迟、低成本。Nano Banana画图是很便宜的，他画一张图的话，调用API大概是3.9美分画一张，非常非常便宜。而且呢，因为它画的很像，在Nano Banana发布以后呢，社交媒体直接就炸了。因为社交媒体，你的社会关系要去参加到交往过程中，如果我画完了以后，这个大美女、大帅哥看不出来是谁，这个事是没法整的。Nano Banana画出来的就可以看出来是谁了，所以Nano Banana当时出来了以后直接就炸裂了，而且是出来了以后，谷歌的股价在涨，谷歌Gemini用户量在暴涨，所以这个是真正拯救谷歌的一个产品。</p>



<h2 class="wp-block-heading">Nano Banana Pro：不仅仅是简单的升级</h2>



<p>现在好了，Nano Banana Pro来了。它在Nano Banana的基础上到底加了什么？它到底是不是Gemini 3 Pro加上Nano Banana呢？首先要确定这个东西不是。为什么？因为那个Nano Banana是Gemini 2.5 Flash image，而现在的Nano Banana Pro是Gemini 3.0 Pro，所以它们是完完全全两个不同量级、不同版本的模型。</p>



<p>首先，Gemini 3 Pro就是比Gemini 2.5 Pro要强很多很多的一个模型，它在推理上强的没朋友。你在这样的一个基础上去做绘图的话，那一定也是会强到没朋友的。而且Gemini 3跟Gemini 2.5还有一个很本质的区别是什么？就是它是原生多模态。它直接把图片、视频这些东西通通一把训练进去了，在最一开始的时候就训练进去的。</p>



<p>Nano Banana Pro是复用了Gemini 3的多模态和推理骨干。你用Nano Banana Pro画图的时候，不是上来就画图，而是说我要先搜索一下，然后我要推理一下。你可以把整个推理的过程都拉出来看，他要先画几张，画完了以后自己在那改，改完了最后出了一个他觉得还可以的结果。因为整个的推理的过程中是有图片生成的，有图片的参考，你甚至可以告诉他说：“去给我参考一下哪个哪个车，给我画一个拆解图来。”比如说我有一辆大行D9的折叠车，我说：“你给我画一辆大行D9的折叠自行车的拆解图。”夸夸夸给我画出来了。我说：“你这个车架画错了。”然后又给我画，画的还是不太对。我说：“你这样，我说你去网上搜索一个D9的图片去，然后再给我回来画。”回来就给你画对了。他就可以干这样的事情。</p>



<p>咱们今天讲的东西呢，都是纯语言描述，我就不跟大家去做案例了，大家自己去试，这个成本非常非常低。所以咱们今天呢，还是主要讲它的原理。Nano Banana Pro是叠加了搜索和推理的一个绘图，它当时的测试的名字叫Gempix 2。所以呢，更准确的说法不是“Gemini 3加上Nano Banana等于Nano Banana Pro”，应该是Nano的Banana Pro是Gemini 3 Pro的大脑，加上新一代的高端图像的头，并不是简单的这种拼接。</p>



<h2 class="wp-block-heading">绘图能力对比：Pro版本强在哪里？</h2>



<p>咱们先看看它的画图部分怎么样吧。在这儿跟大家确认，它在艺术性上依然是没有办法战胜Midjourney的，Midjourney在这块还是当仁不让的王者。但是Midjourney对于物理的理解、对于整个语言的理解，是没有Nano Banana Pro好的。但是咱们就说氛围和艺术感这件事，Midjourney是老大，谁都超不过它。</p>



<p>不考虑推理和搜索的情况下，Nano Banana Pro跟Nano Banana比起来到底是强在哪？</p>



<h3 class="wp-block-heading">1. 分辨率和细节极大提升</h3>



<p>Nano Banana也就是1K，1024*1024这么大的一个分辨率，而且呢，它呢主要用途是画头像、画这种社交媒体插图、画缩略图。而Nano Banana Pro的话，是可以支持1K、2K、4K等多档的输出，你可以输出一个很高分辨率的图片出来。特别是在4K模式下，你做UI设计稿、做产品渲染、线条比较多的这种信息图，细节很清晰的图片呀，上边的细节清晰度会明显的提高。对于需要二次剪裁或者排版的这种专业场景，是相对来说比较友好的。所以我Nendo Banana用了一段时间，我后面不用了，因为它出的图实在是没法使，但Nano Banana Pro是没毛病的。</p>



<h3 class="wp-block-heading">2. 文字渲染能力显著增强</h3>



<p>Nano Banana虽然也能写字，甚至也能写中文，但是字多了它会写错的。而且多语言，你比如说阿拉伯语、中文，特别是花体或者很复杂的一些字体，你要去要求他写的时候呢，会给你写成一塌糊涂。但是Nano Banana Pro就没有这个问题，我测试了，让他写一篇的字都没毛病。甚至有人测试什么呢？你在上头给他出一道题，然后呢他就生生的把这个题和整个题的解题步骤和结果全都给你画在图片里。我做了一个测试是什么呢？我前面跟土拨鼠一起跟大家去做过视频，讲解中国的“土基熔岩堆”。我说：“你给我画一个示意图，做一个土基熔岩堆出来。”我给他上传了一个我的照片，说：“你按照宫崎骏的风格，去给我做一个土鸡熔岩堆的讲解，哪一块是什么样的功能，进去什么、出来什么。”画的非常好，一个页面上应该有几十个字，甚至上百字，都写的非常非常好。我也尝试过一些这种花体字，原来我经常用吉梦去做这种叫创意字体，我把吉梦的提示词直接扔到Nano Banana Pro里边去，效果呢我觉得没有吉梦好，但是已经可以做各种各样的花体字了。但是拼中文，现在它距离吉梦还是稍微有一点点小差距。</p>



<p>现在呢，很多人拿这个Nano Banana Pro是干嘛使？直接做这个PPT。按道理说，我们应该是PPT里头写字，然后拼图，然后再排，这是一个完整PPT。现在不需要了，你直接告诉他说：“我要画一页PPT，要写一个什么样的东西。”比如像刚才我讲土基熔岩堆“土变油”的过程，给你写好了。而且你告诉他要宫崎骏风格，给你画出来了。甚至我后来又提了一个要求，我说：“给我把PayPal黑帮里头这几个老大之间的关系是什么样的，以及他们跟现在美国政府之间是什么关系，给我画出一个示意图来。”咔咔给我画好了，上面有彼得·蒂尔、埃隆·马斯克、杰里·万斯，头像全给我画上了，效果好的一塌糊涂。上面一开始写的是英文，后来我说：“你给我写成中文。”然后把谁原来在Paypal里是什么职位，现在Paypal黑帮里他是一个什么样的位置，比如彼得·蒂尔就是黑帮教父这样的一个位置，JD Vans跟他们是什么样的关系，全都给我写好了，非常漂亮，而且把所有人的头像给我画上了。你甚至可以要求他换什么风格的头像，都给你画的好好的。这一次就可以生成一个完整的PPT页面，不用再去做各种各样的调整，一句话搞定。怎么说呢，对于工程师来说足够使了，所以属于补上设计师最后短板的一个工具。</p>



<h3 class="wp-block-heading">3. 多人物、多图片编辑和一致性更强</h3>



<p>原来Nano Banana的话，出个可能四五张图、五六张图进去还是可以搞定的。现在的话，可以一次塞进去十几张图，一次上了14个脑袋，这个事儿有的人也是成功了，但是有的时候有问题，但是它正常6个脑袋是没毛病的。</p>



<h3 class="wp-block-heading">4. 控制力更强</h3>



<p>相机的角度、俯拍、仰拍、广角长焦，光线的效果，局部遮罩，比如只改脸、只改衣服、只改背景，图表、UI、信息图的这种结构化编辑，这些东西你都可以搞定。咱们说了这么多意思是什么？就是你一次可以写很多很多的文字进去，它一次允许我们写64K，就是64,000个TOKEN进去，它会很好的服从这64,000个TOKEN的指令，把你说的这一大堆东西都给你做出来，而且保证你最后画出来的东西是一致的。</p>



<h3 class="wp-block-heading">5. 一致性和稳定性更强</h3>



<p>由于背后挂着Gemini 3 Pro的多模态的骨架，所以呢，它是可以进行多轮对话的。它在多轮对话的修改过程中，可以生成同一风格的画面，这个过程是非常稳定的。你不会说：“给我改点什么东西。”改完了以后呢，你想改的没改对，没想改的地方竟然给改的乱七八糟。他不会干这个事，保证你想改什么改什么，整个的风格不会发生变化，你不想改的地方绝对不会发生改变的。所以绝对是生产力工具这东西。</p>



<h2 class="wp-block-heading">训练揭秘：思考后再出图的黑盒</h2>



<p>那你说这玩意咋训练出来的呢？谷歌对于Nano Banana以及Nano Banana Pro的训练细节呢，基本上啥也没说，用相对文明一点的话说，叫“公开的很克制”。主要讲的就是共享了多模态的主干，就是我训练大模型的时候，我就直接是用多模态的方式去训练的。它的Nano Banana系列呢，就已经不再是一个孤立的图像模型了，它后边是有Gemini多模态主干的这个图像头的。它的文本指令、世界知识、场景理解是由主干来处理，处理完了以后，再用处理好的结果再去画图，他是这样的一个工作方式。</p>



<p>而且呢，他们在训练的时候使用的叫联合训练和多任务目标。就是在通用图片生成的基础上，加入：</p>



<ul class="wp-block-list">
<li><strong>角色一致性任务</strong>（前后两张图片中的人物保持相似）</li>



<li><strong>多图融合任务</strong>（也就是多张输入的图在单一的一个场景里边进行输出）</li>



<li><strong>编辑任务</strong>（就输入图加修改指令）</li>
</ul>



<p>还有这三个任务是同时进行训练的。很可能通过额外的损失函数和特殊数据集成和特殊数据集来强化这些能力。但是数据集这一块呢，反正谷歌就写了一个官话，说：“我们使用合法途径获得的开放数据集，以及人工标注数据集来进行训练的。”具体使用的什么数据集，他也没说。</p>



<p>Pro在这块呢增加了什么？就是思考后再出图，以及搜索增强。Pro版本强调在生成前有一轮内部的规划和思考，对于教育插图、历史场景、信息图，支持输入Google search作为知识矫正，你可以要求他去搜索。我看很多人这几天在画李白坐在桌边，跟穿着唐装的哆啦A梦一块喝酒对诗，他是可以知道哆啦A梦长什么样，也知道李白长什么样，还知道唐装长什么样，让他们一点都不违和地坐在那去写诗。</p>



<p>安全评估和红队测试呢，谷歌肯定也是做的呀，因为谷歌嘛，毕竟还是一个大企业、上市公司，你要是在这块犯错误的话，会有些问题的。但是它主要做的是什么呢？就是暴力、色情、仇恨、政治敏感内容，在这一块呢，做了重点的过滤以及红队测试。这会体现在某些指令明明技术上做到，但是呢给你的反馈是拒绝或者是模糊响应。不过我现在输出的各种图片还都比较正常，我没有让它测试一些比较奇怪的东西。所以呢，Nano Banana Pro在学习上呢，是一个完全闭源的，并没有告诉大家具体是怎么做的。现在我们能够看到的呢，都是总结了谷歌自己公开的一些很克制的信息，总结出来的一个结果。</p>



<h2 class="wp-block-heading">版权与安全：更宽松的策略</h2>



<p>我刚才讲到的一些提示词，大家听到有什么问题了没有？我要用宫崎骏的画风去画一个土基熔岩堆，要画埃隆·马斯克、彼得·蒂尔、杰里·万斯这些人的头像，后面我还让他画机器猫，他也给你画出来了。大家觉得是不是有问题了？</p>



<p>Nano Banana Pro对于风格和人物肖像这一块，是要比GPT image要松很多的。就是刚才我们讲的这些内容，你让GPT去画，好多它是画不出来的。它会告诉你，万斯现在是美国总统，他属于叫敏感政治人物，我不给你画。宫崎骏风格的不给你画。你说吉卜力工作室，他有可能给你画，但是你要宫崎骏风格，他就不给你画。现在吉卜力工作室还在起诉OpenAI，官司还打着呢。但是谷歌说：“没事，我都给你画。”机器猫呢，它属于有这个IP的品牌形象，你画了机器猫，甭管你画成什么样，实际上都属于侵权。但是谷歌说：“我就给你画了。”这一点其实做的一点都不谷歌，以前这个谷歌在这一块是要比OpenAI还要严苛的，现在直接就放松了，随便玩去。</p>



<p>我去问谷歌的Gemini 3 Pro，你们为什么干了这么一件事呢？他给我的回复是什么呢？“我们现在呢，是用了更深层次的安全措施。一方面呢，我们提醒你了，所有遇到版权问题你自己去应对，跟我没关系。”所以如果以后有人说，你怎么用了宫崎骏风格，他会直接把这个东西扔给创作者，而不是自己来承担这个责任。第二方面呢，他会去判断，你让马斯克坐在这喝咖啡，那是允许的；你让马斯克去做一些很奇怪的事情、有侮辱性的事情，他就不允许了。所以呢，他说我们不会在前向直接禁止你，而是会在后向看看你的意图是什么。你想做一个深度伪造，你想去骗人，还是想要去侮辱这个人，这些我们就不做了。但是如果你只是想要一个马斯克的头像，我们就给你做了。至于说机器猫的头像，因为我们比如做完了以后，也是会发到Twitter或者发到YouTube上，他就是说你发上来了，最后我来处罚你的YouTube作品就完了，我就自己不承担这个责任了。</p>



<p>这个是谷歌这一次采用的安全措施。OpenAI是反过来的，OpenAI是前置合规，就是你只要提名字，我就不给你画了。OpenAI呢，其实前置跟后置他都做。有的时候你让OpenAI给你画图的时候，他会先画，画完了以后，你看这图已经出到百分之七八十了，然后突然告诉你说：“对不起，我审核了，你这事有问题。”咔，给你把图删了。我遇到过几次了，所以我现在已经基本上不再使用OpenAI画图了，我现在画图基本上是Midjourney、吉梦和Nano Banana Pro了。</p>



<h2 class="wp-block-heading">价格不菲的“Pro”体验</h2>



<p>既然叫Pro了，有一个很重要的问题是什么？贵。它叫Pro了，一定比原来的这个叫Flash的要贵很多。刚才咱们讲了Nano Banana，也就是Gemini 2.5 Flash image，它画一张图是3.9美分，基本上是4美分的样子。而这个Nano Banana Pro画一张图是多少钱呢？</p>



<ul class="wp-block-list">
<li><strong>1K或2K的图：</strong>13美分一张，这个就要贵很多了。</li>



<li><strong>4K的大图：</strong>24美分一张。</li>
</ul>



<p>它要比咱们使用的GPT、使用的Midjourney、吉梦都要贵很多。吉梦是最便宜的，吉梦大概画一张图出来2K的图片不要钱，4K的也很便宜，可能就是几分钱人民币，换成美分就是零点几美分。Nano Banana Pro非常非常贵，大家画图的时候一定要小心。</p>



<h2 class="wp-block-heading">如何使用Nano Banana Pro？</h2>



<p>我们怎么拿Nano Banana Pro去画图呢？</p>



<ul class="wp-block-list">
<li><strong>免费用户：</strong>在<a href="http://gemini.google.com/" target="_blank" rel="noopener">Gemini.Google.com</a>上就可以使用了，但是呢一天只允许画3张。你在APP上画也是可以的，Gemini APP上一天只允许画3张。</li>



<li><strong>Pro用户：</strong>大概一天是可以画个几十张，有时候是100张，他并没有给我们一个特别明确的数据，还是要看服务器忙不忙，服务器不忙就多给你画几张，大概是这样的一个情况。因为我的Gemini账号呢，是拿我儿子的edu邮箱注册的Pro账号，可以免费使15个月的Pro账号，所以呢我现在是可以在Gemini网页或者是Gemini APP上开开心心的画图的。</li>
</ul>



<p>那你说画超了怎么办？画超了以后就给你降级，降级成Nano Banana，就没有那个Pro了，你就会快速地得到一张比较粗糙的图，大概就是这样的一个情况。</p>



<p>那你说我怎么开启Nano Banana Pro的绘图呢？很简单。</p>



<ol class="wp-block-list">
<li>你要在APP或者是<a href="http://gemini.google.com/" target="_blank" rel="noopener">Gemini.Google.com</a>上选择“思考”，一旦选择“思考”了以后，你就进入Gemini 3 Pro的这个思考模式了。</li>



<li>然后呢，你再去添加工具“绘图”，上头画了一个香蕉，你就进入了Nano Banana Pro的绘制方式了。</li>
</ol>



<p>你如果一开始选的是Gemini 2.5 Flash，你再去画图的话，就是Nano Banana，就没有这个Pro了，所以这块大家一定要注意。</p>



<p>那你说，我在AI&nbsp;<a href="http://studio.google.com/" target="_blank" rel="noopener">studio.Google.com</a>里去画行不行呢？也行，但是要注意这个里头呢，有一些跟以前不太一样的地方。很多的谷歌模型，甭管是Gemini模型还是画图的模型，我们都可以在AI studio.Google.com里边去使用，但是使用Nano Banana Pro之前要去给它设置一个API key，不设置的话它是不让你用的。而且设置API key还是挺麻烦的，你要先去里边创建一个project，先创建一个工程，然后在这个工程里头再创建一个API key。到这还不行，还要给API key挂支付，没有支付的API key，它是不允许你使用的，必须有支付。</p>



<p>那你说我是不是在这个AI studio里头每画一张图都要钱呢？也不是。现在有人测试呢，是画了三张以后要求你开始付钱，13美分一张或者是24美分一张。也有人呢是测试了，可能能够免费画个十几二十张，甚至有画到50张以上才开始收费的。我估计还是跟服务器的繁忙程度有关，服务器不太忙的时候，你可能一天还是可以在上面画个十几二十张的；服务器忙的时候，画3张然后从你的API key里边扣钱。</p>



<p>但是有一点我们要注意是什么呢？在<a href="http://gemini.google.com/" target="_blank" rel="noopener">Gemini.Google.com</a>里边画出来的图右下角是有水印的，它里有一个菱形的Gemini的logo的水印在上头。而你在AI studio里头，就是你自己花钱13美分一张也好，24美分一张也好，是没有这个水印的，那个图是比较干净的。那你说我是不是就直接可以用AI studio或者直接用API把这个图画出来，就可以冒充是真实图片了呢？不行的。因为这个里边呢还有水纹。水纹是什么？就是你在外面你看不着，但是呢，你可以把这个图片扔给Gemini，问他说：“这个图是不是你生成的？”他是会给你进行精准判断的。所以只是在外表看不出来而已，在里边还能有这个痕迹。</p>



<p>所以大家如果想画图的话，最简单的方式，如果你不太在意这个水印，就是这个菱形的标的话，就是去开这个Pro账号。特别是你如果有edu的邮箱，你去开那个，可以开开心心的使用的。至于你说：“我没有EDU邮箱怎么办？”有一个APP叫咸鱼，或者你到淘宝的网站上，你问问别人有没有办法来解决这个问题，也只能讲到这了。如果你说：“我就想用没有水印的图片。”那您就老老实实地交钱就行了。</p>



<h2 class="wp-block-heading">结语：设计师的天又塌了？</h2>



<p>好，这就是咱们今天讲的Nano Banana Pro。现在设计师，特别是平面设计师的天，又一次塌下来了。像我这种工程师直男，现在也可以开开心心地去做各种界面设计、做各种的PPT设计、什么信息图表设计，效果好的一塌糊涂。我们今天没有给大家做任何演示，请大家自己去尝试，以我刚才说的这些提示词自己去试就完了，也没有那么严谨，你说的跟我稍微有些差异都没有任何问题，我相信Nano Banana Pro会震惊你们的。</p>



<p>好，这期就讲到这里，感谢大家收听。请帮忙点赞、点小铃铛、参加<a href="https://discord.gg/ppKsNkttTv" target="_blank" rel="noopener">Discord讨论群</a>，也欢迎有兴趣、有能力的朋友参加我们的<a href="https://www.youtube.com/channel/UCUGLhcs3-3y_yhZZsgRzrzw/join" target="_blank" rel="noopener">付费频道</a>，再见。</p>
]]></content:encoded>
					
		
		
			</item>
		<item>
		<title>Gemini 3 Pro对决GPT-5.1：理科状元与全能大师终极一战，谁在定义AI的下半场？｜Gemini 3 Pro、Reasoning、Agentic Capabilities、Multimodal、Google</title>
		<link>https://lukefan.com/2025/11/20/gemini-3-pro-graph-reasoning-training/</link>
		
		<dc:creator><![CDATA[Luke Fan]]></dc:creator>
		<pubDate>Thu, 20 Nov 2025 00:43:05 +0000</pubDate>
				<category><![CDATA[AIGC]]></category>
		<category><![CDATA[Google的故事]]></category>
		<category><![CDATA[AI Agent]]></category>
		<category><![CDATA[AI Studio]]></category>
		<category><![CDATA[AI发展趋势]]></category>
		<category><![CDATA[AI工具调用]]></category>
		<category><![CDATA[AI编程助手]]></category>
		<category><![CDATA[Claude 4.5]]></category>
		<category><![CDATA[Gemini 3 Pro]]></category>
		<category><![CDATA[Generative AI]]></category>
		<category><![CDATA[Google Deepmind]]></category>
		<category><![CDATA[GPT-5.1]]></category>
		<category><![CDATA[Graph Reasoning]]></category>
		<category><![CDATA[Grok 4.1]]></category>
		<category><![CDATA[LMArena跑分]]></category>
		<category><![CDATA[TPU v6]]></category>
		<category><![CDATA[人工智能]]></category>
		<category><![CDATA[原生多模态]]></category>
		<category><![CDATA[合成数据训练]]></category>
		<category><![CDATA[多塔MOE]]></category>
		<category><![CDATA[大模型训练]]></category>
		<category><![CDATA[大模型评测]]></category>
		<category><![CDATA[投机采样]]></category>
		<category><![CDATA[科技前沿]]></category>
		<category><![CDATA[谷歌AI]]></category>
		<category><![CDATA[超强推理]]></category>
		<category><![CDATA[过程奖励模型]]></category>
		<guid isPermaLink="false">https://lukefan.com/?p=2969</guid>

					<description><![CDATA[🔥卧槽！谷歌Gemini 3偷偷上线了？这波真是王炸中的核弹啊！！🤯 2025年了，其他模型还在卷情商（Grok 4.1：段子手附体🤣），Gemini 3直接化身“衡水中学开挂版理科状元”——推理分破1500🔥！人类首次啊兄弟们！GPT-5.1还在当文员，它已经每步推导都精准纠错，工具调用稳如老狗🐶，中间崩？不存在的！💥

更离谱的是训练方式：谷歌拿AI重写全人类论文📚，删光修辞直接喂“硬核推理链”，多模态直接视频+代码配对！小球落地？输出重力加速度Python！🤯 原生工具支撑+TPU V6，速度飞到前任Gemini 2.5的N倍🚀，程序员狂喜到泪目！但...跟它聊天像和学霸对话，爷们我CPU干烧了💥（但真香！）

👉赶紧冲aistudio.google.com试Pro Preview版！别等Grok又截胡了！不点赞？你数学能考满分我倒立吃键盘！👇 评论区喊“Gemini救我”抽三兄弟免梯体验！✨（P.S. 巴菲特加仓信号+1，这波AI泡沫？我先囤卡了！）

#AI核武器 #打工人续命神器 #科技界衡水中学

标题1：Gemini 3 Pro对决GPT-5.1：理科状元与全能大师终极一战，谁在定义AI的下半场？｜Gemini 3 Pro、Reasoning、Agentic Capabilities、Multimodal、Google
标题2：首次突破1500分！谷歌Gemini 3推理封神背后，是这套“衡水中学式”训练法颠覆了规则｜Gemini 3 Pro、Reasoning、Deep Think、Benchmarks、Training
标题3：性能王炸，体验却劝退？实测一天Gemini 3后我悟了：为何最强模型不一定最好用｜Gemini 3 Pro、Reasoning、Agentic Capabilities、Multimodal、Thinking Level
标题4：别只看跑分了，Gemini 3真正的王牌是原生图状推理与过程奖励模型，这才是谷歌甩开对手的秘密｜Gemini 3 Pro、Reasoning、Graph Reasoning、Training、Developers
标题5：谷歌为何放弃发布会，悄悄上线Gemini 3？这场AI巨头间的“截胡”大战，真正被颠覆的不是技术｜Gemini 3 Pro、Reasoning、Google、API、Generative AI
简介：谷歌Gemini 3 Pro已正式上线，其核心亮点在于前所未有的超强Reasoning能力，首次在LMArena Benchmarks中突破1500分。本文深度解析其“图状推理”与原生Multimodal架构的技术突破，探讨它与GPT-5.1等模型的差异，并揭示为何这位“理科状元”将深刻改变Coding和开发者生态。]]></description>
										<content:encoded><![CDATA[
<figure class="wp-block-embed is-type-video is-provider-youtube wp-block-embed-youtube wp-embed-aspect-16-9 wp-has-aspect-ratio"><div class="wp-block-embed__wrapper">
<iframe loading="lazy" title="谷歌为何放弃发布会，悄悄上线Gemini 3？这场AI巨头间的“截胡”大战，真正被颠覆的不是技术｜Gemini 3 Pro、Reasoning、Google、API、Generative AI" width="900" height="506" src="https://www.youtube.com/embed/pcSgOWnyDXQ?feature=oembed" frameborder="0" allow="accelerometer; autoplay; clipboard-write; encrypted-media; gyroscope; picture-in-picture; web-share" referrerpolicy="strict-origin-when-cross-origin" allowfullscreen></iframe>
</div></figure>



<h1 class="wp-block-heading">Gemini 3终于发布了，这一次是真王炸了吧？</h1>



<p>大家好，欢迎收听<a href="https://youtube.com/@StoryTellerFan" target="_blank" rel="noopener">老范讲故事的YouTube频道</a>。</p>



<h2 class="wp-block-heading">千呼万唤始出来：Gemini 3的发布背景</h2>



<p>2025年11月18日，谷歌<strong>Gemini 3 Pro Preview</strong>版本就这么上架了。为什么要用这样的一个词，“就这么上架了呢”？因为第一，它是千呼万唤始出来。大概从10月份开始，大家就开始传说，谷歌要开始上Gemini 3了。传来传去始终也没上来，到11月份说这个月肯定上。我还听说过是11月22号上，还听说过最晚12月份上，大家一直在等待这样的一个产品。</p>



<p>跟它一起传的还有另外一个产品，叫<strong>Nano Banana 2</strong>。因为上一次谷歌引起大家关注、引起大家去下载和使用的产品呢，就是Nano Banana 2，这个生图和改图的模型。这一次说Gemini 3跟Nano Banana 2一起来，而且都在进行测试，甚至很多人信誓旦旦说我用到了，我已经看到了。谷歌从Nano Banana一开始，就采用了一个很奇葩的玩法，就是在大模型发布之前，先给它们起个名字，隐姓埋名，跑到其他的这种测试平台上去测试去。大家觉得这个名字很奇怪，不知道是谁，测完了以后发现巨好，这是不是Gemini 3？那个生图模型是不是Nano Banana 2？大家都在猜这种事情。</p>



<span id="more-2969"></span>



<h2 class="wp-block-heading">巨头争霸：你方唱罢我登场</h2>



<p>Nano Banana 2还没有发布，据说是在这个月或者下个月要发布。但是Gemini 3就这么直不愣登就来了。在用户们剥离层层迷雾，寻找Gemini 3和Nano Banana 2期间，其他的大模型厂商也在争先恐后的发东西，比如说<strong>GPT-5.1</strong>、<strong>GPT Atlas</strong>（也就是OpenAI的浏览器），还有<strong>Grok 4.1</strong>。这回是不是真的要来了？为什么会有这样的猜测？因为这帮大公司就跟小孩似的，特别喜欢截胡别人，我要先几天给你发布了，把你这个热点给你抢下去。最爱干这种活的是OpenAI。只要是谷歌说明天开谷歌I/O了，要开大的发布会了，他一定在这个前面一两天给你整点事出来。最有名的是在去年谷歌I/O之前的一天，OpenAI发了<strong>GPT-4o</strong>，一下就把大家震惊住了。</p>



<p>这一次的话，Gemini 3之前发布的非常接近的一个产品是谁呢？是Grok 4.1那个产品，也是非常神奇的一个产品，有机会再跟大家细讲。那你说这大公司，他就不能保个密吗？这真没法保密。你要开发布会，要租场地，要动用公关公司，有多少资源在这折腾，所以你是没有办法保密的。即使是你说我不开发布会，我就是偷偷的直接上线了，甭管是谷歌的人，还是Grok的人，或者是OpenAI的人，大家原来都是老同学、老同事，你想瞒真瞒不住。所以在他们的这个圈子里头，是没有什么秘密的。</p>



<h2 class="wp-block-heading">发布前的“小插曲”</h2>



<p>在等待Gemini 3期间，我们还遇到了对AI泡沫的质疑，大空头来做空来了。我们还遇到了巴菲特加仓谷歌，因为他原来不怎么买这种科技股或者是互联网公司的。巴菲特原来持仓里边，最大的科技股就是苹果，其他的像什么谷歌这些公司，他基本上不买的。突然减持苹果，大规模加仓谷歌，而且是在巴菲特退休之前的最后一单，说巴菲特是不是老爷子知道点什么了。</p>



<h2 class="wp-block-heading">新的发布潮流：不开发布会，直接上线</h2>



<p>就在这样的氛围下，谷歌就突然发布了。而且它的发布没有发布会，这也算是一个新的潮流吧，就是不开发布会，直接写一篇长文，或者写一篇博客，然后产品就直接上线了。这个是最近这一两年里头，突然流行的一种新的玩法。现在的产品发布都是什么呢？第一步，先隐姓埋名，跑到其他的，比如像Open Router这种大模型平台上面去进行测试。等这个传的满城风雨了，啪，一篇文章扔出来，产品就上架了。</p>



<h2 class="wp-block-heading">Gemini 3 Pro Preview 在哪里可以使用？</h2>



<p>现在这个产品可以在哪用呢？</p>



<ul class="wp-block-list">
<li>第一个是<strong>AI studio</strong>，大家上<a href="http://aistudio.google.com/" target="_blank" rel="noopener">aistudio.google.com</a>上就可以使用Gemini 3 Pro了。大家注意，它是Gemini 3 Pro Preview，它后边有Preview这个单词，所以未来这个产品应该还会进行快速的迭代，所以有什么做的不太合适的地方，请多担待。</li>



<li>第二个，<strong>Gemini的网站</strong>也可以直接使用了，就是<a href="http://gemini.google.com/" target="_blank" rel="noopener">gemini.google.com</a>上，现在也可以选择Gemini 3 Pro Preview这个版本了。但是呢，它的客户端上，Gemini的APP上还不能使用。</li>



<li>另外呢，他们还发布了一个IDE，这个IDE呢叫<strong>Anti Gravity</strong>，叫做反重力，里面带的Gemini 3 Pro的这个版本，大家可以拿它去写程序了。</li>
</ul>



<h2 class="wp-block-heading">这次是真王炸了吗？大模型差异的感知难题</h2>



<p>这次是真王炸了吧？是不是比别人都遥遥领先很多呢？大模型的差异，想要让人有感知，已经越来越困难了。就像是两个人站在你面前，一个人是高考状元，另外一个人呢是高考第二名，你能够通过聊天的过程，把他们俩谁是状元分别出来吗？你分别不出来的。所以现在的大模型，他们的智力已经在很多方面远远超越人类了。所以我们再想去评估说哪个大模型有一定的差异，非常非常困难。</p>



<p>很多国内的大模型发布了半天，吹了半天牛，大家为什么没感觉呢？比如像什么GLM 4.6、千问Max呀、Kimi K2 thinking或者是Mini Max M2，这些模型发出来以后说我怎么这么强，大家没感觉，因为你很难感受到他比别人强在哪、差在哪。虽然有跑分，但是现在大家不怎么看跑分了，跑分是比较容易刷的，我们可以刷题就可以直接把跑分刷上去，所以大家不看了。</p>



<p>而国际大厂的发布的话，通常还是会有体感的。比如说最近发布的<strong>GPT-5.1</strong>，它要在5.0的基础上多了这个点一出来，确实是更人性了一些，说话不再那么愣了。<strong>Grok 4.1</strong>情商更高，在所有的跑分里头，马斯克的Grok 4.1是情商跑分最高的。而<strong>Gemini 3 Pro</strong>绝对是理工科学霸的感觉，在推理这一块，它遥遥领先超过其他所有人了。</p>



<h2 class="wp-block-heading">Gemini 3 Pro Preview：核心特性一览</h2>



<p>分数呢还是要跑的，在很多的跑分方面，要比GPT-5.1、比Grok 4.1、Claude 4.5都要强非常的多。它最关键的领先就在于推理能力，真的是遥遥领先。</p>



<p>Gemini 3 Pro Preview到底有什么新特性呢？</p>



<ul class="wp-block-list">
<li><strong>超强推理</strong>：待会咱们就主要讲这个超强推理。</li>



<li><strong>原生多模态</strong>。</li>



<li><strong>开发者跟企业非常友好</strong>：它主要是给程序员和理工科的人去准备的。</li>



<li><strong>原生的工具支撑</strong>：待会咱們去讲什么叫原生工具支撑。</li>



<li><strong>速度飞快</strong>：这个挺难想象的，跑的比原来的模型快好多。</li>
</ul>



<h2 class="wp-block-heading">深入解析：Gemini 的推理能力进化之路</h2>



<p>那么Gemini的推理到底是怎么进化到现在这个状态的呢？首先看跑分，他们使用了一个叫<strong>LMArena Elo</strong>的一个跑分，这个跑分呢大于1500分了。这个非常非常关键，是人类做大模型第一次超过1500分，它大概是1501分，从来没有其他大模型超过1500分。那什么意思呢？</p>



<ul class="wp-block-list">
<li><strong>1000-1200分</strong>：入门级会答题了，但是呢逻辑是很容易崩的。</li>



<li><strong>1200-1400分</strong>：中级的，有一定的推理能力。</li>



<li><strong>1400-1500分</strong>：强者，接近当代顶级了。</li>



<li><strong>超过1500分</strong>：进入超强推理者级别了，明显比普通强者要更稳定、更强的一个状态。</li>
</ul>



<p>现在呢，GPT也好、Claude 4.5也好、Grok，包括国内的这些模型呢，一般都是在1480-1490之间晃悠，但是很难超过1500。而这个Gemini 3 Pro是第一次超过1500。</p>



<h3 class="wp-block-heading">推理范式的演进</h3>



<p>谷歌的推理范式到底是怎么一步一步走到这的呢？所有这些推理模型，第一步走的都是叫<strong>链式推理</strong>，先干什么后干什么，这叫链式推理。从链式推理再往前发展的叫<strong>树状推理</strong>。我除了先干什么后干什么呀，我可以分叉了，我走到某一步搜索完了一个结果以后，我是不是可以一下分出5个X来，把这五个分支都处理掉，这叫树状推理。树状推理再往后呢，叫<strong>图状推理</strong>。这个有什么区别呢？树是只允许分叉，不允许合并的，走到每一个节点只能是越分越细，你不能说我走着走着再把它合并起来。你如果说走着走着又合并起来了，还可以进行反复的去确认，正向走逆向走都可以了，这就是一个图状推理了，这就更进一步了。而最后一步是什么？就是在图的每一个节点都进行工具调用的这种推理。谷歌呢，现在Gemini 3已经走到这一步了。</p>



<p>像刚才咱们甭管是链式的，它也是很多个节点，先干什么、后干什么、最后干什么，这是每一个节点里头正常情况下它是不调用工具的。它都是说我自己先想明白了，最后我把整个都想清楚了以后，我们再去调用工具。或者说我一开始先调用一次工具，比如说我搜索了或者读文件了，读完了以后我再去推理，它是这样来工作的。树状推理呢也是这样的，在每一个节点，我都是在大模型内部使用，或者说我根据你提供的上下文去干活，最后给你一个结果。如果要调用工具的话，要么在开始调，要么在结尾调，一般情况下不会在推理的过程中去调用一大堆工具的。而现在谷歌说咱别费劲了，我们在每一个节点上，图节点有可能是分叉的、有可能合并、有可能正向、有可能逆向的这些节点上，我们在任何一个节点上，如果有需要，我就去调用工具了。而且我能够保证它不崩。别人不是说不想干，别人你要想在这个中间节点上调用工具，他有可能逻辑就直接崩掉了。谷歌说我们不用担心这个，我们逻辑特别强，中间不崩。这是Gemini 3这一次做出的最大的创新。</p>



<h3 class="wp-block-heading">与其他模型的对比</h3>



<p>其他几家是怎么干的呢？</p>



<ul class="wp-block-list">
<li><strong>OpenAI (GPT)</strong>：它从来不公开这件事，所以GPT是个黑盒子。现在呢，猜测它可能也是这么干的，但是具体是怎么实现的，OpenAI是三缄其口，这压根没说。</li>



<li><strong>Claude</strong>：走的是另外一条路，Claude走的是外挂的路，它的很多的工具调用都是通过像Claude code呀、cursor或者是Claude的客户端，它通过这个东西来去调用的。所以导致什么呢？我们可以在Claude code里去换大模型，因为调用工具的部分是外置的，不是在模型里面的。所以呢，它的调用一方面灵活性提升了，但是呢，它调用模型的这个过程稍微有一些割裂。</li>



<li><strong>国内（如Deepseek）</strong>：走的就是超强的这种推理链，在这个链式推理的基础上不断的往前推进，但是他们在调用工具上就要稍微的差一些。</li>
</ul>



<h2 class="wp-block-heading">“衡水中学”式训练法？Gemini 3是如何炼成的</h2>



<p>Gemini 3他到底是怎么训练成这样的？我看了他的训练介绍以后，我觉得这玩意是衡水中学的老师给训练的吧？</p>



<h3 class="wp-block-heading">改变工作方式：预测下一个正确的思维过程</h3>



<p>首先呢，Gemini 3改变了工作方式。原来大模型呢是预测下一个词，我下一个词放哪个词出来是最优解，它是这样来工作的。但是呢，Gemini 3不这么工作，它的工作方式是<strong>预测下一个正确的思维过程</strong>。你就不要给我下一个词了，你直接给我一个下一个你要干嘛，然后我们来看看这个是不是最优解。所以在这块呢，就已经发生改变了。</p>



<h3 class="wp-block-heading">训练数据：高质量合成数据</h3>



<p>那你说我要想训练Gemini 3，我到底哪找数据去？数据是不是已经被大模型吃干抹净都用完了呢？谷歌已经承认了，所有的人类数据早就被大模型收拾干净了。所以这一次，Gemini 3使用的数据是<strong>合成数据</strong>。怎么合成呢？是用谷歌自己最强的模型阅读人类知识，再生成高质量的推理步骤。它直接训练的都是推理步骤，把所有的教科书、所有的科技论文都通过AI重写，生成训练数据。大家注意，这个里头有两个关键词，第一个关键词叫“<strong>所有</strong>”，谷歌基本上是可以认为它有所有的信息的，他把他能够找到所有的信息都塞进去了。第二个关键词叫“<strong>重写</strong>”，我们写的很多论文也好，或者是很多教材也好，为了让人类可以很好的理解，或者说为了抖个机灵，里头还有非常多的修辞，有非常多的人文的东西在里面，比较啰嗦的东西在里面。他通过重写把这玩意全去了，变成非常非常原始、非常简单的这种推理步骤。你如果遇到这样问题应该怎么推，遇到那样问题怎么推，他是拿这种数据去训练的。</p>



<h3 class="wp-block-heading">原生多模态：Video + Code 配对</h3>



<p>而多模态的话是原生对齐。怎么个原生对齐法？原来咱们也号称是各种多模态模型，是用图片跟文字去配对的。就是这是一张图，后边呢是一堆文字，我们把这个东西堆到大模型的数据里头去训练，训练完了以后呢，他就可以去反应那边是一个马还是一个驴，还是在打仗还是什么，他拿这玩意去训练的。现在呢，谷歌用了一个叫<strong>video和code的配对</strong>。你给它一视频，比如说是一个小球落到地上的视频，后边呢你配的不是一个文字“小球掉地上了”，而是一个重力加速度的Python代码。他把这样的一个视频和代码的对儿放到数据集里头去训练多模态模型去了。所以呢，他的模型上来就是世界模型，他是理解物理世界的各种规律的，这个很恐怖。</p>



<h3 class="wp-block-heading">训练策略：过程奖励模型</h3>



<p>有了数据了，那下边怎么训练呢？训练策略也很重要。第一个叫<strong>过程奖励模型 (Process Reward Model)</strong>，这个是Gemini 3跟其他人不一样的。现在的大模型呢，拿了一大堆数据去给你去做预训练去，训练好了以后，这个初级模型呢要去做强化学习，让他回答问题，然后让人去纠错。Grok 4.1就属于强化学习做的特别好的这种模型。谷歌说别费劲了，人看不过来，原来都是人看着，现在咱们直接派一个模型看着。他专门训练了一个找错的模型，让他去看着Gemini 3这个预训练模型去做后续的强化学习，然后呢是由人去监督这个找错的模型，看看他工作的状态行不行就OK了。真正底下干脏活累活的已经变成大模型了。针对推理步骤进行评判，即使结果是正确的，只要中间步骤有错误，通通打回去重来。这就是为什么是可以做推理冠军，就是这样了。你做题做到10步的过程中，必须每步都对，然后得出正确答案，我们才认为你是真的学会这道题了。你说我推了中间有三步是错的，但我答案是对的，对不起，从第三步往后通通都没分了。他是这样来控错的。所以我说为什么这个训练过程让我想起了人大附中和衡水中学这种感觉呢。</p>



<h3 class="wp-block-heading">训练创新：预训练阶段即集成工具调用</h3>



<p>在训练上呢还有一点跟以前的大模型有一个很大的区别是什么，就是Gemini 3的工具调用是<strong>直接在预训练里头做的</strong>。传统的大模型，甭管是OpenAI的，还是Anthropic或者是国内这些模型，他们都是先把模型训练好，然后呢通过强化学习再把工具调用，哪个地方该搜索了、哪个地方该读什么文件了、哪个地方应该去调用哪个工具了，再往后边再去加进去。Gemini 3它是在预训练的时候就直接把这些搜索呀、调用工具呀这些东西作为初始数据就给训练到模型里去了。这也是为什么谷歌的Gemini它可以在推理的任何一个节点上去进行工具调用，而别的大模型干这事就比较费劲，因为他们都是先做好基础后训练出来的，这个事就比较难了。这就是Gemini 3训练的一个创新点吧。</p>



<h2 class="wp-block-heading">为何如此之快？揭秘Gemini 3的速度奥秘</h2>



<p>那你说为什么Gemini 3这么大的模型还飞快呢？它叫Gemini 3 Pro，它不叫Gemini 3 Flash。过个一两个月吧，Gemini 3 Flash应该还会发布，那个时候肯定会比Pro版本要快更多。Gemini 3 Pro就已经比Gemini 2.5 Pro要快非常非常多了。原因呢几个：</p>



<ul class="wp-block-list">
<li><strong>硬件</strong>：谷歌自己家的TPU V6版本已经全面都装到算力中心里去了，都开始干活了，所以速度很快。而且你想他自己设计的芯片，自己做的算法，那一定是配合的紧密无间，没有任何问题。</li>



<li><strong>架构优化</strong>：原来呢，这些模型都是MOE模型，叫做符合专家模型。但是现在呢，Gemini 3叫多塔MOE。什么叫多塔呢？就是你的图文、声音、视频、代码，你到不同的塔里去干活去，每个塔里还有一个专家小组在等着你呢，所以他这样速度就很快了。</li>



<li><strong>投机采样</strong>：最后呢，他们使用了一个东西叫投机采样，就是用一个极小的草稿模型先快速的猜出后边的几十个词，然后由大模型一次性验证，这比大模型一个字一个字往外蹦要快非常非常多了。</li>
</ul>



<h2 class="wp-block-heading">全面领先？四大顶尖模型角色定位</h2>



<p>Gemini 3现在到底算不算全面领先了呢？这么讲吧，Gemini 3 Pro就是一个理科状元加上多模态分析师的一个形象。但是呢，你跟他聊天也像是在跟理科状元聊天。你想想理科状元那个语气、语调都是什么样的，大家自己脑补一下，就知道Gemini 3到底擅长干什么、不擅长干什么了。</p>



<ul class="wp-block-list">
<li><strong>Grok 4.1</strong>：是互联网老司机加上自信段子手，没有什么他不敢说的，胆子比较大，情商测试第一名。你如果想找人去陪你聊天，想聊着开心，你就找这个Grok 4.1没跑，在这点上它要比Gemini 3要强很多。</li>



<li><strong>OpenAI家的GPT-5.1</strong>：算是全能型创作大师加上生态整合之王。因为毕竟他是老大嘛，头一个做出来的，所以他生态整合，就是跟各种工具的结合，还是非常非常好的。而且呢，他很适合做各种的文档创作，像是一个四平八稳的文员吧。</li>



<li><strong>Claude 4.5 sonnet</strong>：算是语言艺术家加上安全派哲思者，它很适合做各种的合规、企业内的这种需要进行反复验证的这种文档，它写的要比GPT-5.1还要好一点点。GPT-5.1更创意一点吧，Claude 4.5 sonnet更擅长做长篇写作、逻辑清晰、道德判断、企业合规表达。</li>
</ul>



<p>而Claude 4.5呢原来是编程冠军，现在的话肯定要经受Gemini 3的挑战了，到底哪个好使哪个不好使，要过几天再出结果。</p>



<p>至于国内的大模型呢，还在努力追赶吧。国内大模型的唯一优势就是开源，巨大的模型开源呢，你们拿愿意拿回去自己折腾都没关系。</p>



<h2 class="wp-block-heading">总结</h2>



<p>最后总结一下：</p>



<ul class="wp-block-list">
<li>今天的内容全部是Gemini 3 Pro整理生成的。如果哪说错了不要骂我，去骂Gemini 3 Pro。</li>



<li>第二个，我其实呢并不喜欢用Gemini 3 Pro，今天用了一天，原因也很简单，跟理科状元聊天还是有点累的。</li>



<li>AI还在快速的发展，Gemini 3真正的价值不是说它给我们训练出了一个理科状元，而是提出了一套新的方法论，怎么能够训练出一个理科状元来，这个是非常非常有价值的。有卡的公司就可以照着这个思路去尝试了。</li>



<li>至于没卡的公司怎么办，那就是另外一回事了。希望这一轮对AI泡沫的质疑可以快一些过去吧，Gemini 3 Pro确确实实是可以解决很多原来无法解决的问题的。</li>
</ul>



<p>好，今天就讲到这里，感谢大家收听。请帮忙点赞、点小铃铛、参加<a href="https://discord.gg/ppKsNkttTv" target="_blank" rel="noopener">discord讨论群</a>，也欢迎有兴趣、有能力的朋友加入我们的<a href="https://www.youtube.com/channel/UCUGLhcs3-3y_yhZZsgRzrzw/join" target="_blank" rel="noopener">付费频道</a>。再见。</p>
]]></content:encoded>
					
		
		
			</item>
		<item>
		<title>谷歌这次玩大了？Willow芯片用“时间倒放”算法成功模拟分子，让量子计算不再是实验室玩具，首次展现出改变药物和材料科学的潜力｜量子计算 谷歌 量子突破 实际应用 医学应用</title>
		<link>https://lukefan.com/2025/10/26/google-willow-quantum-chip-breakthrough-verified-applications-china/</link>
		
		<dc:creator><![CDATA[Luke Fan]]></dc:creator>
		<pubDate>Sun, 26 Oct 2025 00:44:23 +0000</pubDate>
				<category><![CDATA[Google的故事]]></category>
		<category><![CDATA[Willow芯片]]></category>
		<category><![CDATA[九章量子计算机]]></category>
		<category><![CDATA[人工智能]]></category>
		<category><![CDATA[分子模拟]]></category>
		<category><![CDATA[医学应用]]></category>
		<category><![CDATA[可验证的量子优势]]></category>
		<category><![CDATA[实际应用]]></category>
		<category><![CDATA[性能超越]]></category>
		<category><![CDATA[技术突破]]></category>
		<category><![CDATA[材料科学]]></category>
		<category><![CDATA[稀释制冷机]]></category>
		<category><![CDATA[约瑟夫森结]]></category>
		<category><![CDATA[药物研发]]></category>
		<category><![CDATA[谷歌]]></category>
		<category><![CDATA[谷歌量子AI]]></category>
		<category><![CDATA[超导量子计算机]]></category>
		<category><![CDATA[超级计算机]]></category>
		<category><![CDATA[量子回声算法]]></category>
		<category><![CDATA[量子处理器]]></category>
		<category><![CDATA[量子比特]]></category>
		<category><![CDATA[量子突破]]></category>
		<category><![CDATA[量子算法]]></category>
		<category><![CDATA[量子计算]]></category>
		<category><![CDATA[量子霸权]]></category>
		<guid isPermaLink="false">https://lukefan.com/?p=2756</guid>

					<description><![CDATA[兄弟们！谷歌量子芯片又又又炸了！💥 以前量子计算像岳云鹏说相声——73×58=79？算得飞快但瞎扯！😅 现在Willow直接甩王炸：它能煮汤还分得清生抽老抽！🍲 把二甲基联苯分子当猪肘子炖，微波一怼就记录"扭屁股"细节，还和核磁共振结果对上号！这波真·厨房黑科技，药物研发直接开挂！💊

重点来了：结果终于能验证了！不再是"别管对不对，你问快不快"😂 诺贝尔物理学奖亲爹研发的"约瑟夫森结"，让氦3/氦4在冰箱里跳探戈（对，就是一台200万美金的稀释分层制冷器！），把原子振动按头静音。🤯

中国九章3号也狂飙！光学路线常温能干，LNG厂+核电站补氦气，冰箱厂已开工🇨🇳 虽然规模小，但咱造冰箱谁不会？？？

别等了！量子时代真要卷进你火锅了🍲 点个赞，让我看看多少人想用它煮老抽实验？？？评论区吼一句"生抽yyds"👇 #量子真香 #科技狂人

标题1：别只看中美路线之争了，量子计算的真正战场已经转移！从“算得快但算不对”到结果可验证，这才是决定未来的关键｜量子计算 谷歌 Willow芯片 量子突破 可验证的量子优势
标题2：超越最强超算13000倍只是个开始！谷歌解决了“算得快但算不对”的核心难题，结果首次可被稳定验证｜量子计算 谷歌 Willow芯片 量子突破 超级计算机 实际应用
标题3：谷歌这次玩大了？Willow芯片用“时间倒放”算法成功模拟分子，让量子计算不再是实验室玩具，首次展现出改变药物和材料科学的潜力｜量子计算 谷歌 量子突破 实际应用 医学应用
标题4：量子计算的“岳云鹏相声”时代结束了！过去算得快但没人知道对不对，现在谷歌Willow芯片首次实现结果可验证｜量子计算 谷歌 量子突破 可验证的量子优势 算法 实际应用
标题5：这次不再是抽象的数学游戏！谷歌用量子芯片成功模拟真实分子活动，精度堪比核磁共振，新药研发和材料科学的未来已来｜量子计算 谷歌 Willow芯片 实际应用 医学应用 材料科学
简介：谷歌在量子计算领域取得重大进展。其最新的Willow芯片不仅在性能上远超传统超级计算机，更关键的是首次实现了可验证的量子优势，解决了过去“算得快但结果不准”的难题。通过成功模拟真实分子，这一技术突破为药物研发、材料科学等实际应用开启了新的可能性。]]></description>
										<content:encoded><![CDATA[
<figure class="wp-block-embed is-type-video is-provider-youtube wp-block-embed-youtube wp-embed-aspect-16-9 wp-has-aspect-ratio"><div class="wp-block-embed__wrapper">
<iframe loading="lazy" title="谷歌这次玩大了？Willow芯片用“时间倒放”算法成功模拟分子，让量子计算不再是实验室玩具，首次展现出改变药物和材料科学的潜力｜量子计算 谷歌 量子突破 实际应用 医学应用" width="900" height="506" src="https://www.youtube.com/embed/2aUCMvCggbQ?feature=oembed" frameborder="0" allow="accelerometer; autoplay; clipboard-write; encrypted-media; gyroscope; picture-in-picture; web-share" referrerpolicy="strict-origin-when-cross-origin" allowfullscreen></iframe>
</div></figure>



<p>谷歌的Willow量子芯片又有了新突破，听我给大家讲一讲它到底干了什么。</p>



<p>大家好，欢迎收听<a href="https://youtube.com/@StoryTellerFan" target="_blank" rel="noopener">老范讲故事的YouTube频道</a>。今天呢，准备挑战一下自己的极限，尽量用通俗易懂的语言，将Willow量子芯片的成果跟大家讲个热闹。注意，咱们是讲个热闹，如果您就是研究量子计算的，不要上我这来较真。</p>



<p>今天呢，咱们讲几块：第一个，这东西到底长啥样？第二个，Willow和今年的诺贝尔物理学奖到底是什么关系？第三个，这一次具体做了点什么？第四个，这一次的意义在哪里？第五个，中国量子计算机跑到什么地方了？</p>



<p>首先，这个机器到底长什么样呢？其实没有公开的照片。现在大家能够看到的照片，就是很多管子一层一层叠下，其实是外边的一个巨大的冰箱。当然，你说管这玩意叫冰箱呢，我觉得是侮辱了这个制冷器，因为它要比冰箱强大很多，但是它工作的原理就是制冷。这个东西呢，叫稀释分层制冷器。稀释呢，就是我把一个浓盐水稀释成稀盐水。分层的意思是什么？就是上面呢比较热，一层一层地把这个热量传递出去，越往下呢它越冷，所以它是一个叫分层制冷器。</p>



<span id="more-2756"></span>



<p>那么这个东西怎么制冷的呢？它不像咱们的冰箱似的，冰箱是有制冷剂，它实际上是一个物理过程，要把这个热量吸走，再把气态的这些制冷剂呢，送到外边这个压缩机里，重新把它压缩，因为压缩就要散发热量，再把这热量散掉，然后再把它循环起来。而今天我们看到的这个很科幻的、叫稀释分层制冷器呢，它的制冷原理是使用氦3和氦4的吸热循环过程。什么意思呢？就是氦呢有两个同位素。咱们大部分的氦实际上是氦4，就是两个质子、两个中子，它的原子量是4，所以这东西叫氦4。这个东西呢，其实相对来说还是比较容易获得的，在LNG制备过程中的一个副产品，就是咱们去做那个液化天然气的时候，它就会产生一点点氦4。那氦3呢，实际上是氦的一个同位素，就是它有两个质子，但是呢只有一个中子。这个玩意呢就比较费劲了，它是要到核反应堆里边去制备，等于拿氦4制备以后呢，就可以得到氦3。</p>



<p>在很低的温度下，氦3跟氦4呢都是液体，它们叫氦池，氦3在上面，氦4在底下。氦3呢有一部分呢，就会融入到氦4里边去，在这个过程中呢把热量吸走，它是这样来工作的。制冷剂嘛，总要循环。你再把这个已经融入了一部分氦3的这些氦4呢，放到旁边的一个小罐里，再稍微加热一下，因为氦3的沸点呢，是相对来说比较容易达到，所以氦3就直接挥发掉了，氦4留下来了。然后呢，把挥发掉的氦3重新再去压缩，把这个氦4再重新塞回到池子里去，它就等于做这样的一个循环。这东西呢，其实也不是特别贵，就看着说的很复杂。一台机器的话，大概是50万到200万美金之间，大概是跟功率和你到底提供多少氦3有关。刚才咱们讲氦4比较容易得到，氦3是一个相对来说比较难搞的东西。通常的每台机器里头会给几十升，有的会给上百升氦3。氦3大概一升是两三千美金吧，也不是特别昂贵的一个东西。功率呢也不是很高，这个东西几千瓦。这就是现在我们看到的Willow外边这个大冰柜，或者叫制冷剂，它的一个基本情况。</p>



<p>Willow呢，是在低温超导环境下进行量子计算的。那么Willow跟今年的诺贝尔物理学奖有什么关系？今年的诺贝尔物理学奖呢，颁给了一个叫量子隧穿的技术，就是我们可以把一些量子在赋予一定的能量之后，让它穿越到物质的另一侧去。今年得奖的这些人呢，有一个是原来Willow实验室的老大，还有一个是现在还在Willow实验室，所以呢今年物理学奖就是Willow芯片的一个底层逻辑得奖了。这个里边有一个东西叫约瑟夫森结，也就是当你给这个电子加到一定能量以后，他就会穿越这个约瑟夫森节，去模拟一个电子跃迁的过程。那你说光有电子直接跃迁不就完事了吗？那你观察不到。你必须要有更多的粒子结合在一起，让它穿越这个约瑟夫森结，模拟电子跃迁的这个过程，我们才可以去观察到。</p>



<p>所以呢，Willow这个芯片里头呢，是有很多很多的这种超导电路，每一个超导电路里头模拟一个原子。具体这个原子到底是碳原子、还是氢原子还是什么原子，这个不重要。模拟的方式呢，就是当我有很多的能量进去的时候，这些电子是可以跃迁的，原子呢也可以进行自旋。这个Willow里头有门，叫单门和双门，这是它真正干活的一个主要的东西。什么叫单门？就是这有一个电路，里头模拟了一个电子，有能量进去，就会通过约瑟夫森杰，去模拟这种能量跃迁一个过程。这就是一个单门，里头一个原子。什么是双门呢？就是俩原子中间有一个小门，这个门呢如果打开了，这两个原子之间的运动状态就会相互影响。比如说这边是怎么转呢，你打开了以后，另外一个就会跟着一起转，或者是有一些能量就会传递过去，这玩意叫双门。现在的Willow呢，可以准确的开关这些双门，就是Willow可以干活的一个关键了。所以呢，它是低温超导，可以过滤掉原子振动的这些杂波。你如果没有超低温的话，你旁边这些设备的原子就开始振动了，你就没法去观察。所以这个结果呢，必须在低温超导下才可以去阅读。这就是它到底长什么样，以及这个东西跟今年的诺贝尔物理学奖到底有什么关系。</p>



<p>那么这一次到底做了什么呢？每一次呢，咱们去解释量子芯片工作原理的时候，都要去讲一个东西，叫高尔顿钉板。这个东西是什么呢？就是有一大堆钉子，这个小球从上头开始往下掉，每过一层你会碰到一个钉子，每过一层碰到一个钉。碰到钉子以后呢，你有50%的几率向左，有50%的几率向右。很多层钉板以后，底下有一个槽，你到底是落在哪个槽里头？他是这样的一个东西。那你说这玩意有什么难的呀？但是你每一次扔下一个球去以后，然后计算在哪一个槽里掉落的这个几率有多少，这个玩意你要用普通的计算机去算，你到底掉多少层，哪一层的几率是什么样，这个很麻烦。但是你如果用量子计算机去算，你就相对来说容易一点。他干嘛呢？我就别算了，直接往下扔吧，扔完了以后到底下去数不就完了吗？</p>



<p>正常的高尔顿钉板，你没有任何人去干扰他的情况下，扔下去的结果是什么呢？一定是一个钟形，这样的一个形状，越往中间下落的这个比例越高，越往边上比例越低。但如果有人去干预了，中间我碰了他一下，或者是哪个地方我去拨了他一把，在这种情况下的话，你这个钟型就会跟原来有差异，然后我去进行比较。所以好多的量子计算的算法就是这样的，就是我们直接把量子扔出去，然后到那头去数数，我看看结果是什么样的，我就不用再去设计好逻辑去算概率什么，就不用费这劲了。你直接跑就完了。</p>



<p>那么这一次，谷歌做的是一个什么东西呢？它叫乱序时间相关器，叫out of time order correlator，OTOC就这样的一个简称。别研究这个东西什么意思，我也不去跟大家具体讲。我们先让一个系统让它转起来，就是这一个芯片上，有这么多的量子位，它们相互之间开始影响了。刚才我也讲了，它是很多个模拟原子，它们之间开始发生影响，开始运动起来了。它在这个时候呢，拨动其中一个，实际上怎么拨动？就是通过外边的微波呀去照射呀，或者去影响其中的某一个特定的原子，然后让这个原子发生了一些的运动，然后把整个的过程记录下来，再去进行倒放。说现在我们重新倒序地把这个过程重新放一遍。他们做两次，一次呢是你拨了这个原子的，一次是你没拨的。然后他拿俩数去对比，对比完了以后得到一个结果。乱序时间相关器，大概是干这么个活。</p>



<p>那你说这个到底是干嘛使的呢？或者说有没有形象一点的案例？有。这个相当于什么呢？咱们煮了一锅汤。这锅汤呢一开始是白水，我们在这边下盐、下醋、下酱油、下猪肘子、下葱花、下料酒，反正炖出一锅猪肘子吧。他有办法可以经过精确的观察，把这个下料的过程以及这个料里边的一些味觉的元素扩散的过程都记下来，还可以倒放。下一次呢，我们酱油从生抽换成老抽，我们再观察一次，然后再把这两个倒放的结果呢，去比较看一下，生抽跟老抽在里边到底有什么区别。大概就干这么个活。所以呢，这个量子计算，它并不是我们平时去算什么1+1=2，或者2*2=4，不是算这东西。它算的是什么呢？一般都是说我们要设计一个物理实验，设计完物理实验以后呢，去进行观察，看看这数到底是多少，然后呢我们去验证这个结果对不对，再去得到最终的结果。这是一般的量子计算机干活的一个原理。</p>



<p>继续讲前面那高尔顿钉板。现在等于是我可以把小球扔下去了，一把小球都扔下去，看看形成钟型的这个过程是什么样的，然后倒放回来，把里头每一个细节都记录下来。再往后再往下扔小球的时候，我中间对其中的某一个小球或者某一些元素进行了改变，得到了一个不是完美钟形的结果，然后再倒放，然后把两个倒放的去比较，就看看你这个改变到底是怎么影响最底下这个钟的。他基本上这一次就干了这么个活。</p>



<p>那你说这样的系统能不能编程呢？这个是谷歌做的一个很大的贡献，它这个系统是可以编程的。因为它有门嘛，它这个门是可以开可以关的，所以可以编程。但是呢，编程并没有那么简单，不是说我直接像在计算机一样，我写了个程序，把这参数改了一下，然后命令编译执行就完事了，不是这么简单的。因为呢，它是一个设计实验的过程。所以呢，我们可以编说这个门哪什么时候开，什么时候关，怎么快速地开，怎么快速地关，我们要去设计。这个数据是如何回收的，以及呢数据是如何进行验证的，把这些东西都调试完了以后，才可以去做下一个算法。所以呢，你用Willow这样的芯片去换一个算法的话，大概也需要几周甚至几个月的时间。因为你需要在里头调很多很多的细节，这个门到底是怎么开的怎么关的，我发现这个数据被污染没法用了，我再换一个方式。甚至有的时候你可能还写不出来，我怎么着也没法去收集到稳定可辨识的这个数据出来，我每次算出来数都不一样，那你就没法整。</p>



<p>那么这一次实验的意义到底在什么地方呢？咱们讲了半天说Willow很厉害。第一个，就是他的结果可验证。这个对于量子计算来说，是非常非常难的。什么叫结果可验证？大家还记得原来岳云鹏有一个段子吗？他说我这人数学特别好，算的可快了。人家就问他那73*58等于几？他说等于79。人家说对吗？这怎么可能等于79呢？他说你别管对不对，你就问快不快吧。原来的量子计算呢，就属于这样的一个状态。它每次都给你算一数来，而且每次数还都不一样，飞快飞快就给你得到结论了，因为你最后是观察出来的结果嘛。但是你不知道对不对，你没法验证这个东西。</p>



<p>那么现在呢，谷歌说我可以验证了。去年12月份他们就有了一种验证方法，就是我把很多个量子比特结合在一起，做成一个逻辑比特，以后他每一次的结果是可验证的。我记得当时他们是把49个量子比特做成一个的逻辑比特，去进行可验证的，就是计算结果的一个回收。这一次的实验也是可以验证。用谷歌的这个Willow，你去反复多少次，他这个结果是一致的。你要用其他的不同结构的量子芯片，你去算这个东西，它的结果也是一致的。即使是用传统的计算机去算，它号称是比传统的现在最强的这种超算快13,000倍，但是呢他们也是可以进行相应的检验，就是这个结果是对的。这是非常非常难的。2019年谷歌在喊量子霸权的时候，量子计算机的那个计算结果还是不可观测，或者说不可验证的。现在已经可以验证你得到的结果是正确的了。</p>



<p>第二个重大意义是什么呢？就是这一次的实验，它是有实际意义。以前的所有量子计算机的实验，都是一些抽象的数学问题，在现实工程中是没有意义的。那么这一次它有什么意义呢？他们这一次拿了一些化学的这种分子，直接去进行观察了。他们这次呢，用的叫二甲基联苯的一个分子，先做核磁得到一个核磁光谱，然后呢用芯片里边去模拟这些分子上的这些原子，去做这个两个苯环之间的扭转角度到底有什么样的变化，他来做这样的一个实验。做完了以后呢，再对这个结果去进行核磁共振的验证，说我做了这样的一个互动以后，光谱就应该发生什么样的变化。然后我们再对真实的二甲基联苯也做同样的处理，在芯片里头是模拟了一个原子，我对它进行了一个触动，在这个分子里头，我就直接找微波去照射那个原子，不就完了吗？或者我找一些能量数去照射这个原子，我对它赋能了。然后我们看看这个苯环发生了一些什么样的变化，发生变化了以后，你这个核磁光谱就会发生变化。然后他对两个进行验证，发现对上了，我们计算的结果是正确的。在这样的一个结果出来以后的话，那么应用的方式大家也就能想明白了：药物以及材料学领域，它就已经有被应用的可能性了。</p>



<p>那你说这个东西是不是马上就可以改变我们生活了呢？还有点距离。因为现在的Willow有一个很大的问题，比较难以攻克，是什么？就是规模。它现在里边也就是100多个量子比特，你说我想再扩大到几万个，或者是这个几千个，这非常非常难。因为咱们前头讲那冰箱，那个冰箱做起来也很费劲。你把这么多的设备搁在一起以后，再让它去稳定的运行，还能够观测到不受干扰的结果出来，目前呢谷歌还在努力往前走。所以呢，我们如果真的想让它去实际起作用，还要稍微的再等几年。</p>



<p>再往后呢是，中国的量子计算机发展成什么样了？咱每次讲完老外的，咱得讲讲咱自己的。咱们呢叫九章算术，九章3号现在已经做出来了。咱们的这个路径呢，跟谷歌这不太一样，咱们呢是使用的叫光学量子计算机，谷歌呢叫超导门型量子计算机。那咱们这个光学量子计算机呢，现在优点是什么？就是咱们在常温里头就可以干活了，你不需要把它送到低温超导里头去。当然你最后读那个数据的时候，还需要低温，但是不像他那么要求严格。而且呢，光子天然就可以抗衡跑偏，这块呢要比他那个强。因为他是模拟了一个原子嘛，所以呢很适合做量子通讯以及专用的一些采样。所以这个是我们比较强的。我们现在呢，应该是做了一些波色子采样的一些实验，也就是验证了量子计算呢，是可以使用的。但是呢，具体实际应用，我们现在还都没做出来。</p>



<p>但是这个光学的也有缺点。第一是光子损耗很大，单光子源以及探测的效果呢，是受影响的。可编程大规模集成是非常非常困难。现在我们使用的通过这种分光器，通过物理的方式来去干活的，它不像谷歌那个东西，它有门，你可以控制它开门关门，咱们呢现在还没有办法来做这个事情。所以现在呢，我们是可以叫采样演示，就这边干完活，那边我可以把数读出来了。但是呢，离彻底的纠错，因为你不纠错，这事只是算的快，离彻底的纠错和实际应用呢，还有一定的距离。</p>



<p>谷歌的这种超导门型计算机呢，它的优点是门控通用性强，您可以开门关门，可以写程序，而且呢跟纠错的这个算法天然匹配。产业链包括制冷、控制电子、工艺也相对来说比较成熟了。但是它的缺点是什么呢？就是超低温基础设施和制造的良品率、抗干扰泄漏，这些都是需要攻克的。他怎么扩张到百万级的物理单元里头去？这个呢，对于工程上都有挑战。所以现在甭管是他们这条路，还是咱们这条路，想要真正达到实用，还是要再等一等。当然现在谷歌这个还是要比咱们更领先。那领先嘛，好办。中国人也不是不会造冰箱。所以国内呢，现在也有几个大厂在去造这种西式分级制冷器，咱们现在也能造。而且你想咱们是LNG也都有，也买美国的，咱自己也能造出来。咱们也有一大堆的核电站，所以甭管是氦3还是氦4呢，咱们都是可以有能力制备的。这块国内应该有四五个吧，甚至更多一些造这个制冷机的公司。咱们的很多的科研院所也开始在复建谷歌这条路。</p>



<p>最后总结一下吧。量子计算呢正在向我们走来，也在做实用性的探索。这一次呢就是第一次实用性探索。距离应用呢虽然还有差距，但是我觉得应该离我们不是特别遥远了。</p>



<p>最后呢，我也给自己了一个挑战，研究了一上午，尽可能用通俗的方式呢跟大家讲解，至少让大家听个热闹，不会说听完了以后，听了一脑子，最后啥也没听明白，尽量让大家有一些稍微形象一点的认知吧。</p>



<p>好，这个故事就跟大家讲到这里，感谢大家收听。请帮忙点赞、点小铃铛、参加<a href="https://discord.gg/ppKsNkttTv" target="_blank" rel="noopener">DISCORD讨论群</a>。也欢迎有兴趣、有能力的朋友加入我们的<a href="https://www.youtube.com/channel/UCUGLhcs3-3y_yhZZsgRzrzw/join" target="_blank" rel="noopener">付费频道</a>。再见。</p>
]]></content:encoded>
					
		
		
			</item>
		<item>
		<title>想不到吧？谷歌居然暴涨7% vs 英伟达回调：AI神话被戳破？一场判决如何引爆软件巨头反击战｜Google、Apple、AI、stock rally、Alphabet、monopoly</title>
		<link>https://lukefan.com/2025/09/05/google-apple-rally-antitrust-ruling-ai-outlook/</link>
		
		<dc:creator><![CDATA[Luke Fan]]></dc:creator>
		<pubDate>Fri, 05 Sep 2025 00:08:40 +0000</pubDate>
				<category><![CDATA[Google的故事]]></category>
		<category><![CDATA[AI]]></category>
		<category><![CDATA[AI搜索引擎]]></category>
		<category><![CDATA[Alphabet]]></category>
		<category><![CDATA[Apple]]></category>
		<category><![CDATA[Chrome浏览器]]></category>
		<category><![CDATA[Gemini]]></category>
		<category><![CDATA[Google]]></category>
		<category><![CDATA[TPU芯片]]></category>
		<category><![CDATA[YouTube广告]]></category>
		<category><![CDATA[云计算]]></category>
		<category><![CDATA[反垄断法]]></category>
		<category><![CDATA[市场反应]]></category>
		<category><![CDATA[投资理财]]></category>
		<category><![CDATA[搜索协议]]></category>
		<category><![CDATA[搜索广告]]></category>
		<category><![CDATA[搜索引擎]]></category>
		<category><![CDATA[法院判决]]></category>
		<category><![CDATA[科技巨头]]></category>
		<category><![CDATA[科技股]]></category>
		<category><![CDATA[科技股分析]]></category>
		<category><![CDATA[美股上涨]]></category>
		<category><![CDATA[股票投资]]></category>
		<category><![CDATA[英伟达]]></category>
		<category><![CDATA[苹果股价]]></category>
		<category><![CDATA[谷歌反垄断]]></category>
		<category><![CDATA[谷歌垄断案]]></category>
		<category><![CDATA[谷歌财报]]></category>
		<guid isPermaLink="false">https://lukefan.com/?p=2512</guid>

					<description><![CDATA[💥兄弟们！科技股暴跌我直接躺平啃泡面，结果谷歌苹果突然原地起飞7%+3.5%？！万亿大象跳街舞？我钱包都惊出八块腹肌！😱

真相笑死：谷歌反垄断案赢麻了！不用拆Chrome了！苹果狂喜：200亿美金年入稳了💰（占服务收入20%啊！）Firefox哭晕厕所：求别拆谷歌，我饭碗全靠它！😂 法官神操作：钱照给，但别独家～AI时代搜索已凉，谷歌靠Gemini和YouTube广告续命，云计算暴涨32%！

现在谷歌PE才20倍（英伟达50倍！），抄底还是观望？兄弟们速评：我重仓科技股差点哭晕，这波反转直接原地复活！🔥 评论区Battle起来👇点赞过500，下期爆肝英伟达100万卡烧钱计划！#美股神操作 #AI革命 #韭菜的自我修养

（老铁们，看完不点赞的今晚美股绿你！🤣）

想不到吧？谷歌居然暴涨7% vs 英伟达回调：AI神话被戳破？一场判决如何引爆软件巨头反击战｜Google、Apple、AI、stock rally、Alphabet、monopoly

一场关键的 antitrust ruling 让暴跌数日的美股科技股意外反弹，Google 和 Apple 的股价为何双双大涨？尽管法院认定谷歌存在 monopoly 行为，但并未要求其拆分核心业务，暂时解除了危机。而苹果则成为隐形赢家，得以继续收取每年200亿美金的巨额费用。本期内容将深入解读判决细节，剖析这轮 stock rally 背后的利益博弈，以及AI如何成为改变战局的关键变量。]]></description>
										<content:encoded><![CDATA[
<figure class="wp-block-embed is-type-video is-provider-youtube wp-block-embed-youtube wp-embed-aspect-4-3 wp-has-aspect-ratio"><div class="wp-block-embed__wrapper">
<iframe loading="lazy" title="想不到吧？谷歌居然暴涨7% vs 英伟达回调：AI神话被戳破？一场判决如何引爆软件巨头反击战｜Google、Apple、AI、stock rally、Alphabet、monopoly" width="900" height="675" src="https://www.youtube.com/embed/7NJzAbpxctk?feature=oembed" frameborder="0" allow="accelerometer; autoplay; clipboard-write; encrypted-media; gyroscope; picture-in-picture; web-share" referrerpolicy="strict-origin-when-cross-origin" allowfullscreen></iframe>
</div></figure>



<p>你绝对想不到，美股科技股连续暴跌几天之后，居然是谷歌跟苹果这两个老兄弟，把大家又重新拉起来了。</p>



<p>到底是怎么回事？今天跟大家讲一讲。大家好，欢迎收听<a href="https://youtube.com/@StoryTellerFan" target="_blank" rel="noopener">《老范讲故事》的YouTube频道</a>。</p>



<p>我呢是重仓美国科技股的，前面几天真的是跌麻了。然后谷歌直接跳了一个7%的上涨，苹果涨了一个3.5%。大家注意，这都是上万亿美金的公司，谷歌大概1.7万亿，苹果大概2.9……还是二点几万亿美金的。这种市值公司，按照这样的速度往上涨，这个真的是非常非常恐怖。</p>



<p>同时，英伟达、AMD还在小幅调整，还稍微跌了那么一点点。很多人都在跟我们讲：“AI往前发展了，以前都是英伟达自己涨。现在呢，硬件就这样了，后边该软件涨了。”难道已经到这一天了吗？大家不要着急，还没有到那一天。</p>



<p>那么谷歌和苹果到底是怎么涨起来的？像这样的大象能够跳起来，肯定背后是有原因的。</p>



<span id="more-2512"></span>



<p>原因呢，其实也很简单：谷歌在反垄断案上，得到了一个对自己非常有利的判决。原来是说，你必须得把Chrome拆了。这种反垄断案，大家注意谁在告他？谁是原告？是美国司法部以及多州，联合起诉了谷歌，而这个母公司的名字叫Alphabet，就起诉都是起诉它。谷歌呢，只是Alphabet下边的一个子公司。最后是判下来不用拆了，那谷歌还不疯狂地涨起来？</p>



<p>原来说把Chrome拆掉的时候，这整个市场都疯了。Plexcity说我345亿美金我要买，OpenAI说我也要买，一堆人说我们都要买。为什么？因为这个东西实在是太值钱了。拆出来以后到底值多少钱不好说，但是在谷歌里面实在是太值钱了。谷歌现在干的活是什么？就是把它所有的东西都给你送在一起。我的浏览器跟我的搜索引擎、跟我的Gemini、跟我的各种网盘、Office、Workspace，包括它整个的账号体系、Gmail都给你捆在一起。你一旦是把Chrome给它拆掉了，就剩下这些东西拼不上了，搞得七零八落的。谷歌你的核心收入是来自于搜索广告，一旦是把Chrome给你拆掉了以后，你的搜索广告一下就不行了。即使是说现在AI起来了以后，你的搜索广告受到很大的影响，但是呢，你还可以苟延残喘一段时间。虽然AI的快速普及或者快速的上升，让你的搜索广告受到了一定打击，但是只要你原来这个架子不拆，你还是有一个软着陆的机会的。但是一旦给这玩意拆了的话，就彻底没戏了。</p>



<p>所以现在大家其实并不是特别看好谷歌的时候，突然来了一个对谷歌有利的判决，那大家就很开心，说：“谷歌你又行了，咱们接着干吧！”所以一下就涨起来了7%。</p>



<p>那你说这玩意跟苹果有啥关系呢？人谷歌开心一下就行了，你苹果有啥事呢？原因很简单，还是这一个案子的判决。</p>



<p>它这个判决完整是什么？首先，你谷歌确实垄断了，你还是有罪的。但是呢，你并不需要把Chrome拆掉。原来你是跟一堆人去签独家绑定协议，比如你跟苹果签了独家绑定，我们的这个产品，我们每年给钱。现在呢，说你不能跟人签独家绑定协议了，但是呢，你可以接着给钱。这苹果就很开心了，我一方面可以接着找谷歌收钱，我还可以跟微软去说：“你想把谷歌干掉吗？多给一些。” 苹果就很开心，它涨了3.5%是这么来的。</p>



<p>那这个钱有多少钱？就是每年谷歌给苹果的钱，一年200亿美金，大概占苹果的服务收入的20%。就是苹果卖硬件、卖手机是有一块收入，另外一块收入就是服务收入，就是完完全全是收license钱。这里头20%是谷歌给的。那这个钱还可以接着挣，甚至呢，如果微软、OpenAI说，我们也想去跟谷歌竞争一下，也想去抢这一块市场，来竞价排名一下，或者说价高者得之，这个都是可以去玩了。所以对他们都是利好。</p>



<p>这一次的判决，除了要求说必须要去把排他性去掉，还干了些什么呢？这一次你不能再说：“苹果你收了我的钱，你就必须用我的搜索引擎，不允许再用其他人了。”比如说三星，还有其他这些手机厂商，你收了我的钱，你就要用我的搜索引擎，不允许再用其他人了。你要用我的Chrome，因为安卓手机嘛，苹果手机是用Safari的。这个原来都是绑定的，现在呢，不允许再绑定了。你可以接着给钱，给钱没毛病。说用三星手机，使用了谷歌搜索引擎，看了广告产生的收益，你接着可以跟人分成，这个没问题。但是呢，你不可以排他，你交了钱别人还可以接着来。这个是这一次的核心判决。</p>



<p>另外一点是什么呢？就是谷歌要把它的搜索排名的数据，公开给它的竞争对手。你原来说哪个词搜索的靠前，哪个词搜索的多，搜索完了以后是怎么去做排序的，有一些这样的内部数据，要把它公开出来。因为这属于是谷歌的不传之秘，他就靠这玩意吃饭呢。你拿出来跟微软，还有一些搜索引擎的竞争对手，你要去跟人分享一下。大概做了这样的一个判决。</p>



<p>实际上对谷歌还是相当有利的。但是呢，做完这个判决以后，诉辩双方——就是美国司法部和谷歌两边——我们都不服，我们都要再上诉。所以这个事情对于谷歌来说，得到的就是Chrome现在不用拆了；苹果得到的是说，我可以接着找谷歌要钱了。这个是现在已经确定的事情。</p>



<p>谷歌说：“我现在还不想把我的数据公开给别人。我可以承诺，比如说我不去跟人签排他协议，我给人钱了，你看这个后边怎么办。”因为给钱这件事呢，你如果不给钱，整个这个产业就崩了，不光是谷歌一家的事。其实很少有人能给出谷歌这么多的钱来，你要完全靠钱竞争，其实依然是排他的。微软说我也愿意给钱，但是它在这块打不过谷歌。虽然它的市值比谷歌高，但是呢，它花钱的地方也比谷歌多。你说我现在开始跟谷歌争拼，这一块市场下来不划算。而且呢，现在搜索广告呢，本来就是已经有点日暮西山的感觉了，应该也不会再有人去跟谷歌说：“我跟你抢，你愿意一年给苹果200亿，我愿意给苹果300亿，把这个市场抢回来。”大概率没人干这个活。</p>



<p>而且就算你抢下来又怎么样呢？因为谷歌这个判例在那呢，你哪怕300亿给苹果了，苹果也不能给你设成独家，你最多叫默认。比如说微软给了300亿以后，默认的搜索引擎是微软的Bing了，但是它依然可以自己换成谷歌。那这300亿你说你花的冤不冤吧？就是用户可以自己手动换的，这个是这一次判例里头的一个很关键的点，你不是唯一的，不是独家了，它是可以换的。所以这块呢，大概率对谷歌没有什么太大影响。</p>



<p>你说这个法官为什么突然就转身了呢？原来都说是我们要把谷歌好好的分拆一下，要把它这个Chrome拆掉，甚至以后可能还要拆安卓，还要把它的数字广告都拆开，要把它拆的七零八落了。怎么这个法官突然就大发慈悲，就放过了谷歌呢？是不是里头有一些什么别的交易、桌面下的事情？这咱不知道，咱不能瞎猜。能够知道的是什么？法官出来讲了，说这里头呢有几个问题。</p>



<p>第一个问题是，谷歌给的钱呢，确实是养活了很多的人，养活了很多的产业，包括苹果、三星这些做手机的厂商，都从谷歌这分到钱了。你一下说这个钱不许付了，或者你不许再去用这种商业模式往前走了，那这个收益就没了呀。当时喊着说要去拆Chrome的时候，谁第一个死掉了？Firefox第一个死掉了。说：“不行，我没法活了。”为什么？因为Firefox作为Chrome的竞争对手，他最大的一笔收入就是谷歌给的。每年谷歌会给他钱，给他钱干嘛？说你Firefox上来以后，你要绑定谷歌搜索引擎，所有的这个搜索引擎产生的收益，我给你分红。原来是干这样的事情的。现在谷歌说：“我这生意做不下去了，还顾得上你吗？我不给钱了。”那Firefox就赶快裁员，“求求你千万不要收拾谷歌，一定要给我留一口饭吃。”这是反垄断调查，他的竞争对手的哀嚎，多么神奇的事情，想不到吧？所以法官觉得，这个钱还是要让他继续流转下去的，原来这个生意还要接着做。只是呢，你把垄断所获得的数据跟大家分享一下，把垄断里头这个条款去掉，你可以接着给钱，但是不能独家了，不能排他，这个事就算过去了。这是第一个原因。</p>



<p>第二个原因是什么？第二个原因是，苹果的人跑去作证去了。谷歌这么多年，都在我这做这个搜索引擎绑定，22年来，谷歌搜索引擎在苹果Safari里头的使用比例首次发生下降。这个时代过去了，已经不再是谷歌搜索引擎一统天下的时候了。那么法官觉得，既然这个垄断的时代已经过去了，已经有你的其他竞争对手去覆盖你了，我们就没有必要一定要把你拆开了。那大家想，谷歌搜索引擎在苹果Safari浏览器里边的使用比例为什么会发生下降呢？大家都去用OpenAI了，都去用Perplexity了，用这种AI搜索引擎了，不再用这玩意了。哪怕你说你去用Gemini了，他也不是在用谷歌搜索引擎了。所以谷歌搜索引擎的这个时代，其实已经过去了。</p>



<p>其实很多美国的案子都是这样，就反垄断案，像原来拆微软也是这样的。应该是1998年起诉微软Windows绑定IE，把网景（也就是刚才咱们讲那Firefox的前身）把它干死了，“这事不行，我要拆IE出来。而且你这个Windows里还绑定Office，这不行，我要把你Office也拆出来。”微软也是据理抗争，这官司打到2000年，打了两年作出判决说要拆。然后又折腾了一年，到2001年最后达成和解说不拆了。他的Office也要开始去支持什么苹果，他的这个IE呢，也不能直接这么捆绑在里头了，他也可以在里边去装Firefox，这个事才算混过去。但是真正让这个事混过去的原因是什么呢？不是说微软服了软了，而是微软的时代过去了。那个是什么时代起来了？就是互联网时代起来了。2001年嘛，谷歌呀、Facebook呀，就这些公司开始启动了。微软你已经不再具有垄断地位了，虽然你这个市场地位还在这，但是呢，换赛道了。所以他当时就没有拆。现在谷歌其实也遇到了相同的问题，原来搜索引擎就是所有的入口，所有广告都从这里走，那么你就是垄断的。现在有AI上来了，换赛道了，你原来那个搜索引擎已经日暮西山了，就没必要对你穷追猛打了。</p>



<p>所以这一次法官是基于这两个大的原因：第一个，你钱得付，不付钱了有些市场会崩溃的；第二个，你那个已经是昨日黄花了，不用再穷追猛打了。即使判决出来了，两边都不满意，还在接着上诉，但是最终的结果是什么呢？就是谷歌的搜索引擎份额一定会越来越少。大家可能更多地去使用ChatGPT、去使用Claude呀、或者是Gemini呀，是使用这样的工具了，就不再使用搜索了。原来以搜索来带动的整个搜索广告收入这一块呢，应该就会慢慢地退出历史舞台。到那个时候就再去起诉，比如“OpenAI你垄断了”，或者“Gemini你又垄断了”，到那个时候再去起诉新的东西就行了。所以最终呢，可能就是不了了之了。对于谷歌来说呢，他也不会出去分享数据去，你要求我分享数据，我就接着上诉，他就一直耗下去，耗到最后说：“算了，你这数据也不值钱了，就这样吧。”也就如此了。</p>



<p>那你说谷歌现在它的广告收入还占多少呢？谷歌曾经它的搜索广告收入是占可能百分之七八十的，现在其实已经少很多了。谷歌现在的广告收入，就是搜索及其广告收入吧，大概是占整个收入的百分之五十几，而且是在不断地下降。所以呢，它整个的收入状态已经在开始出现这种多元化了。那你说搜索广告不干了，他靠什么玩意挣钱呢？这么大一公司，10万人这样的一个公司，他到底怎么挣钱的？</p>



<p>第一个，你们现在看我视频了吧？谷歌靠这玩意挣钱的，就是他的YouTube广告在快速上升，两位数的上升。虽然挣得还没有那么多吧。谷歌一个季度的收入，大概是不到1000亿美金，964亿美金，这是2025年Q2的财报上写的。它的广告收入呢是542亿美金，大概是占50%多一些，56%吧，我去年同期呢是57%，降了1%。它的这个YouTube广告是96亿美金，占比呢是10%，同比上升了13%，还是涨得很快的。另外一块呢是它的云计算，AI这一块收入是136亿美金，占比是14%，要比YouTube的广告收入还要再高一些。而且呢，这一块呢，是同比大涨32%。就现在大家就看，微软的收入到底有多少是卖Office、卖Windows来的，卖license来的收入有多少，有多少是来自于云计算的。阿里也是这样，你有多少收入是来自于云计算的？因为云计算是代表你的AI收入，这玩意才是大家要看的东西。</p>



<p>像谷歌的这个136亿美金的云计算收入里头，我也做贡献了。我怎么贡献的呢？我大量的视频打标签、分段，这些都是由Gemini模型来去提供服务的。我每个月大概还要给他交个十几美金、20美金的样子，不是买license，而是买TOKEN。这个是我调他API花的钱。所以这一块的收入，他确实是在上升的。</p>



<p>现在呢，谷歌的股价一下跳了7%。一个原因呢，是大家觉得你短期内的Chrome被分拆这个问题已经解决了，你可以继续地一边努力地增长你的AI收入、增长你的YouTube的广告收入，然后一边呢，让你的这个搜索广告收入的下降呢相对来说平缓一些。你依然可以捆绑着Chrome，就不叫独家了，就是一种合作协议，还可以让这个商业模式继续跑下去。</p>



<p>另外一方面的话，谷歌的AI这一块现在确实也很强。Gemini 2.5——甭管是Gemini 2.5 Pro，还是Gemini 2.5的Flash，包括咱们最近玩的Nano Banana——确实是非常非常强。在做AI这一块上，咱们不要看OpenAI的声音很大，最有钱、最有卡、最有数据、最有人才的这个公司就是谷歌。谷歌之所以现在老觉得被人摁在地上摩擦，最主要的原因是什么？公司太大，规矩太多，瞻前顾后。但是所有的做AI所需要的数据、钱、算力、人才，谷歌都是最好的。只要他们想明白了，往前做的话，想在这一次把它淘汰掉，基本上不太可能。</p>



<p>而现在的谷歌呢，它整个的PE大概只有20-25倍，所以是非常非常便宜的。作为一个互联网公司来说，它的利润跟它的市值之间比是PE嘛，只有二十几倍，这个稍微有点看不太起它。所以现在很多人说，是不是要去抄底这个东西了？要知道英伟达的PE有多少倍？英伟达的PE有50倍，是谷歌的一倍。英伟达挣的钱比谷歌其实多不了多少，但是呢，它现在是全世界最值钱的公司。</p>



<p>那你说未来到底是谷歌强，还是英伟达强？我们是不是应该换个阵，把这个英伟达的股票卖了，去买谷歌的股票？这个怎么说呢……我只能说未来一段时间，或者未来两三年里头，谷歌不会掉队，它依然是在全世界科技股里边、AI这个赛道里头能够占有一席之地，这个是没有任何问题的。但是真正说能够再往前飞一段的，应该还是英伟达。</p>



<p>为什么呢？虽然谷歌是不怎么买英伟达芯片的，谷歌自己的芯片都是自己做的，它那个东西叫TPU。TPU呢，虽然都叫一个名字，但是它是分服务器端的和手机端的。它现在手机端的TPU其实卖的很少，就是它自己那个叫Pixel 10吧，它里头是用自己的TPU的，其他人家我好像还没听说谁家的手机买它们家的芯片。在服务器端呢，也就是自己用自己的。谷歌家的TPU是除了英伟达之外，唯一成功训练出大模型的这个算力卡，其他再没有了。除了英伟达和谷歌的TPU之外，就再也没有第三个算力卡真正独立训练出来过这种大规模模型的，这个也是独一份的本事吧。</p>



<p>但是英伟达在今年和明年这一段时间里头，应该还会长足的发展。大家都已经买了这么多卡了，马斯克手里有20万，微软手里有可能有40万，Meta号称自己有60万，字节跳动在海外还在疯狂地买，阿里在海外都在疯狂地买。他们在国内肯定不会去买H20了，但是在海外都在买，像新加坡、马来西亚、迪拜什么这种地方，都是有大量的算力中心，中国人开的算力中心，里边装的都是英伟达的显卡。都已经这么多了还买吗？这些公司还没怎么挣钱呢，特别像OpenAI、Anthropic，这些公司都是赔钱的，他们还买这么多卡，这玩意烧的下去烧不下去？有没有泡沫？</p>



<p>OpenAI的5000亿美金“星际之门”到底做成什么样还不知道，马斯克已经张嘴说了：“我要做1万亿美金，他那5000亿美金不算多，我要做1万亿美金。这20万块卡、30万块卡不算多，我现在要到100万块卡、1000万块卡。”这个继续前进吧。所以在未来的可能一两年里头，大家知道方向是什么。</p>



<p>从我个人的角度上来说，我是不会具体去买哪一个股票的，我应该还是去买一些科技股基金。但是我们要强调，咱们这个频道呢主要讲故事，听个乐就完事了，不做任何具体的投资意见和建议。您挣了钱是您自己的，亏了钱别找我。但是我坚定地相信，未来一段时间依然是AI领涨，而且AI里边，英伟达应该还可以再领跑一段时间。</p>



<p>好，这就是咱们今天讲的故事，感谢大家收听。请帮忙点赞、点小铃铛、参加<a href="https://discord.gg/ppKsNkttTv" target="_blank" rel="noopener">DISCORD讨论群</a>，也欢迎有兴趣、有能力的朋友加入我们的<a href="https://www.youtube.com/channel/UCUGLhcs3-3y_yhZZsgRzrzw/join" target="_blank" rel="noopener">付费频道</a>。再见！</p>
]]></content:encoded>
					
		
		
			</item>
		<item>
		<title>设计师又要失业了？谷歌 Gemini 2.5 Flash Image 发布，AI 修图能力太逆天！</title>
		<link>https://lukefan.com/2025/08/28/%e8%ae%be%e8%ae%a1%e5%b8%88%e5%8f%88%e8%a6%81%e5%a4%b1%e4%b8%9a%e4%ba%86%ef%bc%9f%e8%b0%b7%e6%ad%8c-gemini-2-5-flash-image-%e5%8f%91%e5%b8%83%ef%bc%8cai-%e4%bf%ae%e5%9b%be%e8%83%bd%e5%8a%9b%e5%a4%aa/</link>
		
		<dc:creator><![CDATA[Luke Fan]]></dc:creator>
		<pubDate>Thu, 28 Aug 2025 00:48:18 +0000</pubDate>
				<category><![CDATA[AIGC]]></category>
		<category><![CDATA[Google的故事]]></category>
		<category><![CDATA[3D玩偶生成]]></category>
		<category><![CDATA[AI Agent]]></category>
		<category><![CDATA[AI修图]]></category>
		<category><![CDATA[AI发展趋势]]></category>
		<category><![CDATA[AI取代人工]]></category>
		<category><![CDATA[AI生成]]></category>
		<category><![CDATA[AI科普]]></category>
		<category><![CDATA[AI绘画]]></category>
		<category><![CDATA[AI视频生成]]></category>
		<category><![CDATA[DALL·E]]></category>
		<category><![CDATA[Gemini 2.5 Flash image]]></category>
		<category><![CDATA[MidJourney]]></category>
		<category><![CDATA[Nano Banana]]></category>
		<category><![CDATA[OpenAI]]></category>
		<category><![CDATA[stable diffusion]]></category>
		<category><![CDATA[VEO 3]]></category>
		<category><![CDATA[YouTube]]></category>
		<category><![CDATA[产品图设计]]></category>
		<category><![CDATA[保持一致性]]></category>
		<category><![CDATA[偷跑模型]]></category>
		<category><![CDATA[千问]]></category>
		<category><![CDATA[可灵]]></category>
		<category><![CDATA[国内大模型]]></category>
		<category><![CDATA[图像编辑]]></category>
		<category><![CDATA[多图融合]]></category>
		<category><![CDATA[多模态大模型]]></category>
		<category><![CDATA[局部编辑]]></category>
		<category><![CDATA[技术评测]]></category>
		<category><![CDATA[模型评测]]></category>
		<category><![CDATA[电商作图]]></category>
		<category><![CDATA[科技前沿]]></category>
		<category><![CDATA[科技评论]]></category>
		<category><![CDATA[移除瑕疵]]></category>
		<category><![CDATA[美工]]></category>
		<category><![CDATA[老范讲故事]]></category>
		<category><![CDATA[职业危机]]></category>
		<category><![CDATA[自然语言编辑]]></category>
		<category><![CDATA[草图转设计图]]></category>
		<category><![CDATA[行业变革]]></category>
		<category><![CDATA[视觉推理]]></category>
		<category><![CDATA[视觉设计]]></category>
		<category><![CDATA[设计师]]></category>
		<category><![CDATA[谷歌AI]]></category>
		<category><![CDATA[谷歌DeepMind]]></category>
		<category><![CDATA[豆包]]></category>
		<category><![CDATA[迭代式修改]]></category>
		<guid isPermaLink="false">https://lukefan.com/?p=2491</guid>

					<description><![CDATA[付费频道订阅：https://www.youtube.com/channel/UCUGLhcs3-3y_yhZZsgRzrzw/join

美工要失业？先别慌，听我爆料：全网火的“香蕉小模”Nano Banana，其实是谷歌偷跑的Gemini 2.5 Flash Image🍌！这货不是生图花架子，是改图王者：一句话把你的自拍→桌面场景→PVC手办→相框合影，一条龙安排💥；多图合成、局部精修、模糊擦瑕、迭代修改还牢牢守住人脸一致性，推理力拉满🧠🎯。更骚的是先偷跑再官宣，不翻车那套懂的都懂😏

怎么玩？上AI Studio就能试，4美分一张🪙；视频党用VEO 3 fast，带BGM秒出短片🎬🎵，成本直接砍半。四大门派你站谁：MJ的美、OpenAI的懂、Gemini的稳、SD的家族军？🧪

兄弟们，设计师真要慌了吗？评论区开杠，顺手点个赞让我冲热榜🔥

设计师又要失业了？谷歌 Gemini 2.5 Flash Image 发布，AI 修图能力太逆天！

谷歌 Gemini 2.5 Flash Image 震撼发布，其颠覆性的 AI 修图与图像编辑能力，让“设计师失业”的讨论再次引爆！这款曾以“Nano Banana”之名偷跑并爆火的模型，真正强大的并非从零生图，而在于对现有图片的精准修改和二次创作，这恰恰是商业设计领域的核心需求。

本期视频将深度解析 Gemini 2.5 Flash Image 的核心特性：它如何通过强大的多模态推理能力，实现自然语言驱动的局部编辑、完美保持主体外观一致性、合成多张图片内容，以及进行多轮次迭代修改。我们将探讨这种“改图”能力的提升，对电商作图、产品设计、广告创意等行业意味着怎样的冲击，并将其与 Midjourney、DALL-E 及 Stable Diffusion 等主流 AI 绘图工具进行横向对比，分析当前图片生成模型的竞争格局。

如果你对最新的 AI 工具和商业趋势感兴趣，或是正在思考人工智能将如何改变设计行业，千万不要错过本期内容。欢迎点赞、订阅并开启小铃铛，第一时间获取前沿资讯！

#Gemini #谷歌AI #设计师 #AI绘图 #人工智能
]]></description>
										<content:encoded><![CDATA[
<figure class="wp-block-embed is-type-video is-provider-youtube wp-block-embed-youtube wp-embed-aspect-16-9 wp-has-aspect-ratio"><div class="wp-block-embed__wrapper">
<iframe loading="lazy" title="设计师又要失业了？谷歌 Gemini 2.5 Flash Image 发布，AI 修图能力太逆天！" width="900" height="506" src="https://www.youtube.com/embed/lXX5Kt5J6IM?feature=oembed" frameborder="0" allow="accelerometer; autoplay; clipboard-write; encrypted-media; gyroscope; picture-in-picture; web-share" referrerpolicy="strict-origin-when-cross-origin" allowfullscreen></iframe>
</div></figure>



<p>美工，或者说设计师，又要失业了吗？Gemini 2.5 Flash image发布了。</p>



<p>大家好，欢迎收听<a href="https://youtube.com/@StoryTellerFan" target="_blank" rel="noopener">老范讲故事的YouTube频道</a>。</p>



<p>前一段时间，有一个叫“小香蕉”的模型，叫Nano Banana。这样的一个模型呢，在很多的开源模型评比网站上，突然就火了。这种网站是干嘛的呢？还有很多的同类型的模型放在上头，你去向他提出要求，他让不同的模型同时生成结果以后，大家去做评比用的。很多人发现，这个模型很棒。</p>



<p>最近在很多的社交媒体上出现这种：有一个照片，旁边是根据这个照片做的3D PVC的打印玩偶的一个图像。这种图其实都是用这个叫Nano Banana做出来的。你先给他个照片，然后你给他提示词说：“请按照这个照片给我布置一个桌面，桌面的左边是个电脑，电脑上应该有这个3D设计软件，正在设计3D人偶。右边呢，是一个相框，里头是他的照片。桌面上放一个有支架的PVC的3D打印人偶，这个人偶就是根据这个照片打出来的。”给它这样的一个提示词，它就一次性给你搞定了。这个还是非常非常强悍的。</p>



<p>这个模型到底谁家的？搞不清楚。而且很多人还去造假的Nano Banana，为什么？因为太有流量了。一堆一堆人上来说：“我这也有一个Nano Banana，你们赶快来试一下。”我就被人骗过，上去了以后发现效果一般嘛，就很失望就走掉了。大家就猜说，这有可能是谷歌家新出的图片模型。到8月26号，突然这个模型就发布了——谷歌的Gemini 2.5 Flash image。拿出来一看，就是这个Nano Banana。而且呢，在谷歌发布这个模型之前，Deepmind——就是谷歌下边做AI这个部门的——很多人都发了画了一只香蕉的Twitter，说：“你看我们在暗示点什么吗？你们自己来猜一下，我们到底要干什么。”实际上，大家都已经明白他们要干什么了。</p>



<span id="more-2491"></span>



<p>这种偷跑小模型的方式呢，是最近比较流行的一种方式。前边GPT-O SS也被发现偷跑过，现在Gemini 2.5 Flash image也是偷跑了一段时间，而且引起了轰动。这种偷跑模型的方式，跟大家藏着掖着，像苹果开发布会似的，发布之前大家谁都不许说，签保密协议，谁谁敢说出去就如何如何，到底有什么差别呢？差别就是，你如果是前面保密的话，最后发出来就是一锤子买卖，如果翻车，你就直接倒霉。谷歌其实翻车过好几次了，Gemini最开始发布的时候就翻车了，怎么各种问题都答不对，然后股价暴跌。现在这种偷跑模式呢，如果反馈不好呢，我就再接着改，我就不发布了；如果反馈特别好，我就赶快给它发布出来。它就不会翻车了，它是这样的一个策略。所以现在越来越多的人喜欢采用这种偷跑方式。</p>



<p>咱们说回来，这个Gemini 2.5 Flash image到底是一个什么样的模型呢？上一次大家喊设计师和美工失业的时候，是什么时候？是Gemini 2.0 Flash image发布的时候，就是它上一个版本发布的时候。</p>



<p>上一次是怎么出圈的呢？其实谷歌的Gemini画图效果一般，不是特别惊艳，上一次出圈也是因为改图。只有改图改得好，才容易出圈。很多人说不对，说这个生图模型都在干这些事情，为什么改图改得好就能出圈呢？大家要注意，跟设计师和美工相关的需求，特别是有商业价值、或者叫有人付钱的需求，是生图多还是改图多？一定是改图多。</p>



<p>咱们举一个最标准的例子。我们现在要做电商网站，我们在网站上需要有一个商品的展示图。我有一个商品图片了，然后呢，我需要把这个图片放在各种场景、灯光和环境下，再去出一些新的图片出来。这个就是需要美工去干活的。像在亚马逊，他们用了一个特别笨的办法，他们找一照相机，三视图1、2、3拍三张照片，这就是你产品的照片了，那这产品卖得好才怪了。京东在这个北京，专门有一个巨大的影视基地，没想到吧？干嘛的呢？就是拍这个产品图的。你们谁要卖东西了，到那去把这个产品给他，他给你搭好布景，打好灯光。比如说你要卖一个杯子，他在杯子旁边给你摆上瓜果蔬菜，摆上一些小点心，把这杯子都拍一遍，再在后边给你P上各种的图片。而且这些P了图以后还要注意什么呢？这个图P上去的这部分要有版权，这个是非常非常重要的。你不能说我卖东西，这个图后边比如说我P了一个椅子或者P了一个什么东西，这个图片你没版权，这是会被人告的。阿里也有这样的巨大的拍摄基地。你卖任何东西，你想把东西卖好，你就上拍摄基地去拍去。即使拍完了以后，他还是需要上设计师、上美工上去来修这个图。或者说我这还缺点字，那个地方还需要一些别的东西摆在一起。因为你不可能说，我要把所有拍的东西都摆一块嘛，那有的时候你就需要去抠图，然后再把它摆上去。所以这是真正设计师干得比较多的活。所以在这一块干得好，大家才会说设计师跟美工要失业了。</p>



<p>那么，改图是不是要比生成图片要难呢？大家想没想过这个问题？答案是很肯定的：改图绝对要比生成图片要难。为什么呢？你需要先理解这张图片，这个图里哪个地方是人，这人哪个是脸，哪个是身子，哪个是腿。当我们发生一些什么样变化的时候，我怎么能够保持它的一致性？说比如说，我拍了一个低头的照片，说这不太好，你抬起头来，然后再笑一笑。我把演员拎回来，或者把模特拎回来，说你再给我拍一次，成本很高。那我们直接叫给这个改图模型，你去给我干这件事情，它就可以干得很好。这个非常非常难。在原来2.0 Flash的时候，这玩意儿还干不太好，特别是跟人脸有关的事情。但是到2.5 Flash，这个已经干得非常非常强了。大家可以去看一看网上流传的一些有趣的事例吧，我也会做一点点小的事例，放到咱们YouTube的shorts里头，这个还是挺好玩的一件事情。所以，如果我们没有办法对图片进行很深刻的理解，把需要改的部分抠出来，改完了以后再把它贴回原来那个地方去，这个是做不成的。所以这是推理能力的上升，不是它的图片生成能力上升，而是推理能力上升了。</p>



<p>Gemini 2.5 Flash image到底有什么新特性呢？第一个，它是基于Gemini 2.5多模态大模型做的推理。我们现在国内的模型，千问3是一个多模态模型，Deepseek还是一个纯文本模型，它是没有多模态理解能力的。豆包1.6最新的版本，它是一个多模态模型，可以直接进行视觉推理的。GPT-O3、GPT-5，这都属于多模态的推理模型。你没有这种底层的话，是干不了这活的。给你一张图片，你连图片到底画的是什么都理解不了，你连图片上到底是画了几样东西、每个人的边界在什么地方、他们到底是在说话还是在打架、还是在聊天，你都分不清楚的话，你就没有办法做后边改图这个事情。你比如说给他一张图说：“现在让他给我穿上西服革履。”你必须要把人身上的衣服都理解清楚，这个是衣服，穿上西装以后到底应该长什么样，这事要理解明白了，推理清楚了，他才有可能生成出结果来。</p>



<p>那么第一个就是多模态大模型。第二个，支持自然语言驱动的精准局部编辑、模糊背景、移除瑕疵、添加颜色、擦除物品，这个都可以。而且呢，在编辑的过程中，能够完美的保持人物、动物等主体的外观和姿态的一致性，这个是修图里边最难的。像我们经常让豆包去修图，或者可灵去修图，修完了以后经常发现什么问题？不像了。你像我上传一张照片，说：“来，给我把背景换成一个海滨的背景。”海滨背景换了，但是前面那人不是我了，可能看着稍微有些似是而非，但是绝对不是我。那这个就失去了修图的意义。你必须要保持一致性，而保持一致性是整个修图里边最难的。</p>



<p>再往后呢，它可以合成3张以上的不同图片的内容，创造出组合的新作品。我看到有人做的Demo是把6张照片，六个人照片搁一块，说：“来，把这六个人的照片给我生成一张大的合影。”然后这六个人合在一起了。他有时候也会翻车，不是说每次都成功，但是呢，他已经有这样的能力了。还有人去测试什么呢？我给你一屋子，给你一书柜的照片，给你一床的照片，说：“来，把这书柜跟床给我摆屋子里。”他就可以把这个事给你办好。</p>



<p>支持多轮次迭代式的图像修改，不影响已确定的无关元素。这话什么意思呢？就是你给他一张图，这次给我加一床，下次给我加一个床头柜，再在床头柜上给我放本书。你可以这样迭代地、一次一次地去要求他改。你说在床头柜上加书的时候，那个床不会发生任何变化。这个很难的。像国内豆包什么这些模型，你让他在床头柜上加书的时候，那个床就发生扭曲，就发生变化了，因为他是把所有东西重新生成了一下。</p>



<p>这个Gemini 2.5 Flash image呢，还能够理解和转换手绘的草图，用于教育和设计应用。比如说我们手画了一张图，这应该有个按钮，那个地方应该有个窗口，你把这东西扔给他，说：“来，给我生成界面。”咔咔给你搞定。这个还是非常非常强的功能。</p>



<p>最后呢，是禁止生成不当内容，并为所有AI生图嵌入水印和原数据。就是谁生成的图是可以看出来的。它不会像GROK家的这个生图模型似的，你让它做各种过分的事情都可以做。这个Gemini 2.5 Flash image还是相对来说比较克制的。其实谷歌的大模型一直都是比较克制的。咱们看看这几家，OpenAI还没上市，虽然它是老大，但是毕竟不是上市公司。谷歌这是上市公司，多少年的行业老大了，它真丢不起这人。它出一点点小问题，就马上会股价暴跌。我记得上一次谷歌的生图模型给他们惹这种麻烦是什么时候？说你给我生成第一次世界大战的这个战场，图片里头发现男的女的、黑人白人黄种人在一块。说这不对，西线应该都是白人，都是男的，不应该是这样。他说不，我们要多元性。最后导致被认定为翻车，导致他们整个的产品下线。</p>



<p>现在呢，拿这个模型去生图还是挺便宜的，它是4美分生成一张图，整个的价格还是比较低的。跟国内的同类生图模型的成本应该差不太多，但是它的效果要好一些。同时呢，谷歌还发布了另外一个更新，就是VEO 3出了一个fast版本，就是快速版本。VEO 3呢是谷歌现在的视频模型，效果也是很不错的。它们大概是40美分生成一秒钟，这个成本也降下来了，原来大概是要80美分生成一秒钟，成本直接砍半。</p>



<p>这些新的工具到底怎么用呢？我们今天就不给大家看演示了，我会未来一段时间慢慢的把生成的结果给大家看看吧，大家自己去玩就好了。你说我现在想去使用Gemini 2.5 Flash image，可以用AI studio这个网站，<a rel="noreferrer noopener" href="https://xn--aistudio-bf1nt91a5mk0i6a4m8b.google.com/" target="_blank">它的域名是aistudio.google.com</a>。进去了以后，你就选择Gemini 2.5 Flash image，选完了以后，你就提交各种的提示词也好，给他参考图也好，多给几张参考图也好，你就命令他去干就完了。我印象里应该免费，但是我不太确定了，因为我的这个账号是已经开始付费了，所以我现在是肯定能用的。我上去了以后，它会提醒我说免费的是有一些限制的。如果你想开心使用的话，你可以通过API去调用，也可以去使用一些调用了Gemini 2.5 Flash image模型的这些应用，他们也会给大家提供一些服务的。</p>



<p>下一个就是API调用。API调用的话，我准备过几天去玩儿吧，这个应该也是比较有趣的。它因为实在是太新了，它更新了以后，所有挂他的像什么Defi、N8N这些东西都没有更新呢，可能要等到再过一周的版本，这些产品就更新了。但我现在去调的话，通过http直接访问，应该也是可以使用的。那就是4美分一张图，4美分一张图，是这样来用的。</p>



<p>你说我现在想去画视频、想去生成视频，行不行？VEO 3 fast没有任何问题。如果你有Gemini Pro的这个账号，个人的Gemini账号是Pro版本的，一个月20美金的这个版本的，每天呢可以生成三条，每条8秒钟。这个已经是效果非常非常好了。而且它这个VEO 3 fast的话是带音乐的。我刚才命令它说这个图片让它动起来，让它给我去跳一个街舞，然后它就直接把音乐给我配好了。待会我会把这个视频给大家发到short里边去，挺好玩的。</p>



<p>那你说我现在不想在Gemini Pro里头充20美金，行不行呢？可以。你像我这样有一个上大学的儿子，我就用他的大学edu的邮箱去申请了一下，我就可以使15个月的Gemini Pro，免费就可以用了。你说你没有这样的儿子，去找一下。现在我看淘宝上好像有人去做这个生意，20人民币帮你去做验证，就是EDU邮箱，去收一个邮件去验证一下，你就可以使15个月了。但是这种我估计用的人多了以后可能会被封，这个比较危险。</p>



<p>当前图片生成模型的格局是什么样的呢？Gemini 2.5 Flash image这个模型出来了以后，会不会打破现在这个格局呢？现在呢，基本上是四大门派。第一个门派是Midjourney，它生成的东西呢，最精细，最有艺术感，对于各种的艺术风格模拟的最像，这个是别人谁都比不了的。第二个呢就是OpenAI。OpenAI呢属于是理解能力很强，因为它自己的推理模型非常强嘛，就是你给它很多的元素，给它非常复杂的逻辑的时候，它都可以给你画上，但是画的结果呢差强人意，也就只能如此了。OpenAI他们去做一些改图呢，也没有Gemini 2.5 Flash image好，但是呢保持一致性上做的还可以，要比Midjourney要做的好。Midjourney就属于一个纯生图模型，改图这一块一般，或者是说一致性参考这一块呢，效果都一般。第三个，Gemini呢，特别特别适合改图，它的这个生成的部分属于将就，还能看，但是这个效果比前面两个就要差一些了。第四波就是stable diffusion以及他的朋友们。就跟郭德纲上去讲，说中国相声界的复兴是需要靠于谦和他的家人们，每次就是于谦的爸爸、于谦他老婆、于谦的什么，全靠这玩意讲的。另外一波也是这样，stable diffusion和他的家人们，比如说stable diffusion，然后包括Flex，它们的改图有一个叫Konnect的模型，k开头的，不是c开头的，有这样的一个模型是可以进行改图的。像马斯克XAI里边应该用的是他们家的东西，或者是在这个模型基础上再训练，再改出来的东西。国内呢，包括可灵、豆包、千问，他们的这些图片模型呢，应该都是在这个基础上去做出来的，都是一脉相承的。他们也在卷改图，但是比这个Gemini 2.5 Flash image来说，就差的非常非常远了。</p>



<p>Gemini的2.5 Flash image的成功，给中国的大模型公司带来什么启示没有？这个咱还是要讲一嘴的。就是基层模型的、或者叫底层模型的推理能力上升的时候，一切能力就都会上升。所以大家其实卷的是最底层的这个模型，而最底层的这个模型，你就真的是需要20万块以上的H100才能够有所提升。现在已经没有什么奇迹了，说我现在用很少的算力卡就可以把这种模型训练出来，然后去追赶美国，这个事有些难度。所以国内的模型在这一块上，底层推理模型上，能力还是需要去追赶的。</p>



<p>而国内各个大模型公司呢，他们的图片模型、图形模型和推理模型一般是分开发展的，还没有真正发展到说我们要把它结合在一起。你像豆包，豆包的推理模型是推理模型，图片模型是单独的另外一个模型，它两边一点关系没有。所以这一块呢，还是需要改变的。千问也是这样的，千问呢有专门的千问的image模型，也有千问image Edit模型。我昨前两天还在玩千问image Edit，效果也还行吧，但是你要跟这个Gemini 2.5 Flash image比，这事就没法比了。但是呢，都是各玩各的。其实谷歌家一开始也是各玩各的。谷歌原来是Gemini模型是Gemini模型，然后呢他们有一个叫IMAGEN这样的一个模型，现在已经发展到4.0了，这个模型可能用的人也不是很多，所以就直接开始转型了，把Gemini模型跟这个图片模型直接合在一起了。OpenAI家其实干的也是一样的活，它最早的那个图片生成模型叫达利，DALL·E，达利2、达利3，达利3完了以后再往后就没了，再往后再出的图片模型叫GPT Image。大家走的都是同一条路。所以国内后边想要迎头赶上的话，就要把这些专门的图像模型扔掉，要把这些生图的功能跟大的推理模型，或者叫基座推理模型，要捆绑在一起，才有可能进一步的提升。</p>



<p>现在呢，当推理能力上升的时候，完全可以使用agent的模式，极大的提升绘图跟改图的能力。刚才我讲改图，实际上是做视觉推理。你把这个图理解的很清楚了，说我到底要画什么，哪一块是动的，哪一块是不动的，你把这个东西搞明白了以后，他才可以去调用这些生图的模型，把每一个小块生成好，然后再拼在一起。像loveart这些设计师的AI agent呢，其实干的活也是一样。但是现在从谷歌搞的Gemini 2.5 Flash image这种模型来看，我觉得loveart这种设计师的AI agent就稍微悬了，又被覆盖了。</p>



<p>好，讲到这里，大家也觉得比较无聊了，赶快都去玩起来，这个东西非常非常的好玩。老范以后再看到有类似的事情，再跟大家慢慢的分享，给大家带来乐趣才是我的核心目的。</p>



<p>好，这个故事今天就讲到这里，感谢大家收听。请帮忙点赞、点小铃铛、参加<a href="https://discord.gg/ppKsNkttTv" target="_blank" rel="noopener">DISCORD讨论群</a>，也欢迎有兴趣、有能力的朋友加入我们的<a href="https://www.youtube.com/channel/UCUGLhcs3-3y_yhZZsgRzrzw/join" target="_blank" rel="noopener">付费频道</a>。再见。</p>



<p></p>
]]></content:encoded>
					
		
		
			</item>
	</channel>
</rss>
