<?xml version="1.0" encoding="UTF-8"?><rss version="2.0"
	xmlns:content="http://purl.org/rss/1.0/modules/content/"
	xmlns:wfw="http://wellformedweb.org/CommentAPI/"
	xmlns:dc="http://purl.org/dc/elements/1.1/"
	xmlns:atom="http://www.w3.org/2005/Atom"
	xmlns:sy="http://purl.org/rss/1.0/modules/syndication/"
	xmlns:slash="http://purl.org/rss/1.0/modules/slash/"
	>

<channel>
	<title>Gemini 3.5 Flash 评测 &#8211; 老范讲故事｜AI、大模型与商业世界的故事</title>
	<atom:link href="https://lukefan.com/tag/gemini-3-5-flash-%e8%af%84%e6%b5%8b/feed/" rel="self" type="application/rss+xml" />
	<link>https://lukefan.com</link>
	<description>这里是老范讲故事的主站，持续更新 AIGC、大模型、互联网平台、商业冲突与资本市场观察，帮你看清热点背后的底层逻辑。</description>
	<lastBuildDate>Sun, 24 May 2026 01:13:57 +0000</lastBuildDate>
	<language>zh-Hans</language>
	<sy:updatePeriod>
	hourly	</sy:updatePeriod>
	<sy:updateFrequency>
	1	</sy:updateFrequency>
	<generator>https://wordpress.org/?v=7.0</generator>

<image>
	<url>https://lukefan.com/wp-content/uploads/2026/03/cropped-jimeng-2026-02-28-5245-用图一的人物形象，替换图二中的人物，使用图二的风格。文字替换：老范讲故事，Yo-32x32.jpeg</url>
	<title>Gemini 3.5 Flash 评测 &#8211; 老范讲故事｜AI、大模型与商业世界的故事</title>
	<link>https://lukefan.com</link>
	<width>32</width>
	<height>32</height>
</image> 
	<item>
		<title>Google I/O失焦与Gemini困局</title>
		<link>https://lukefan.com/2026/05/24/google-io-gemini-antigravity-agent-reliability/</link>
		
		<dc:creator><![CDATA[老范 讲故事]]></dc:creator>
		<pubDate>Sun, 24 May 2026 01:13:55 +0000</pubDate>
				<category><![CDATA[AIGC]]></category>
		<category><![CDATA[Google的故事]]></category>
		<category><![CDATA[Antigravity 2.0 使用体验]]></category>
		<category><![CDATA[Gemini]]></category>
		<category><![CDATA[Gemini 3.5 Flash 评测]]></category>
		<category><![CDATA[Gemini Spark 与 Workspace 集成]]></category>
		<category><![CDATA[Google AI Ultra 用户限制]]></category>
		<category><![CDATA[Google I/O 2026]]></category>
		<category><![CDATA[Google I/O 2026 发布了什么]]></category>
		<category><![CDATA[Google 智能体战略]]></category>
		<guid isPermaLink="false">https://lukefan.com/?p=3790</guid>

					<description><![CDATA[本文复盘 Google I/O 2026 的核心发布与争议，重点分析 Gemini 3.5 Flash 体验、AI智能体可靠性、Gemini Spark 与 Antigravity 2.0 的产品困局。文章指出，Google 并非输在技术，而是输在入口过多、主线分散和产品取舍不足：Flash 快但不够可靠，Omni 强但用户感知弱，Spark 受限于开放范围，Antigravity 又难以成为统一入口。适合关注 Google AI 发布会、智能体工具和大模型产品策略的读者。
]]></description>
										<content:encoded><![CDATA[
<figure class="wp-block-embed is-type-video is-provider-youtube wp-block-embed-youtube wp-embed-aspect-16-9 wp-has-aspect-ratio"><div class="wp-block-embed__wrapper">
<iframe title="Google I/O失焦：Gemini为何做不好新产品?" width="900" height="506" src="https://www.youtube.com/embed/6CktIqU3C-U?feature=oembed" frameborder="0" allow="accelerometer; autoplay; clipboard-write; encrypted-media; gyroscope; picture-in-picture; web-share" referrerpolicy="strict-origin-when-cross-origin" allowfullscreen></iframe>
</div></figure>



<figure class="wp-block-image size-large"><img decoding="async" src="https://pictures.lukefan.com/google-io-gemini-antigravity-agent-reliability/blog_1.jpg" alt="巨大的 Google I/O 舞台投影在黄昏色背景中，前景是一位评论者拿着讲稿和放大镜审视散落的 Gemini、Spark、Antigravity 图标，构图呈现“技术巨人与疲态发布会”的对照，浅色背景的商业评论版橡皮泥平面信息图的统一风格。"/></figure>



<p class="wp-block-paragraph">今天咱们聊一聊 Google I/O。</p>



<p class="wp-block-paragraph">我本人应该是在 2005 年、2006 年都去现场参加过 Google I/O。当时还是在旧金山市中心的 Moscone Center。后来 Google I/O 搬到 Mountain View 以后，我就没有再去参加过了，因为 Google I/O 越办越大，Moscone Center 已经不够用了。</p>



<p class="wp-block-paragraph">今天讲 Google I/O，其实是要讲一个日暮西山的巨人，还在坚持一些很守旧的东西，给我们展现各种疲态。以前每年 Google I/O，我们还会关注今年发布了什么、有什么有意思的东西。现在看完以后，只会觉得很失望。当然，还是有很多人在尬吹 Google I/O，看得我脚底板都快抠出两室一厅来。</p>



<span id="more-3790"></span>



<h2 class="wp-block-heading">一次让我放弃使用 Gemini 的经历</h2>



<figure class="wp-block-image size-large"><img decoding="async" src="https://pictures.lukefan.com/google-io-gemini-antigravity-agent-reliability/blog_2.jpg" alt="一个人坐在电脑前询问 Gemini Spark，屏幕里的机器人却把 Apache Spark、讯飞 Spark 和 Google Spark 三个标签混成一团，桌面上放着直播讲稿草稿，浅色背景的商业评论版橡皮泥平面信息图的统一风格。"/></figure>



<p class="wp-block-paragraph">今年最有意思的，不是 Google 发布了多少东西，而是我本来想用 Google 自己最新的 AI 来准备这一期 Google I/O 的直播讲稿。我原来有这样的习惯：讲谁家的产品，就一定用谁家的大模型去准备，也算稍微体现一下他们的能力。但是稍微点了几下以后，我就放弃了。</p>



<p class="wp-block-paragraph">事情是这样的：我去问 Gemini，而且还不是在 Gemini App 或者 Gemini 网页里问。我还专门跑到 Antigravity 2.0 里，做了一个升级以后去问。我说：“Gemini Spark 这个我很喜欢，我想用一下，怎么用？”</p>



<p class="wp-block-paragraph">它也搜索了，也思考了，然后告诉我：有一个东西叫 Apache Spark，还有一个东西好像叫科大讯飞还是谁的 Spark，你到底要用哪个？当时把我问傻了。我说我要用 Google 的，刚在 I/O 上发布的那个 Spark。然后它说：“那你真的要用 Apache Spark 吗？”</p>



<p class="wp-block-paragraph">我已经不知道该怎么接了，于是我就放弃了。</p>



<p class="wp-block-paragraph">所以今天这个稿子依然是用 GPT 来准备的。刚才这个故事发生在 Google 刚刚升级的 Antigravity 2.0 和 Google 刚刚发布的 Gemini 3.5 Flash 上。3.5 Flash 没搞定，我就换成 3.1 Pro，结果还是在那胡说八道。后来我到 Google 的 Gemini App 或者 Gemini 网页上试，依然如此。</p>



<p class="wp-block-paragraph">我为什么要出来骂街、抱怨这件事？因为我自己的使用体验非常非常差。这不是一个单纯的吐槽。Google 在发布会上讲的是智能体时代，它也意识到现在是智能体时代，是 harness agent 的时代。但是普通用户真正关心的是什么？就是你能不能听懂我在说什么，能不能按我的话去干活，能不能少犯点低级错误。</p>



<p class="wp-block-paragraph">聊天机器人胡说八道，最多让人一笑。但是<strong>智能体胡说八道是很危险的</strong>：它会改错文件、发错邮件、删错代码、安排错会议。这是我们不能忍受的。所以 AI 从聊天进入干活阶段以后，可靠性要比速度和价格重要得多。</p>



<figure class="wp-block-image size-large"><img decoding="async" src="https://pictures.lukefan.com/google-io-gemini-antigravity-agent-reliability/blog_3.jpg" alt="一个 AI 智能体像机械手一样同时伸向文件夹、邮件、代码窗口和日历，但每个目标上都有红色错误标记，旁边的用户紧张地按下停止按钮，浅色背景的商业评论版橡皮泥平面信息图的统一风格。"/></figure>



<p class="wp-block-paragraph">今天先稍微回顾一下 Google I/O 2026 到底发了点什么，然后讲 Gemini 3.5 Flash 为什么让我发疯、让我愤怒。后面再说 Gemini Omni、Spark 和 Antigravity 各自的问题在哪里，以及 Google 为什么总是在撒胡椒面。</p>



<h2 class="wp-block-heading">Google I/O 这次到底发了什么</h2>



<figure class="wp-block-image size-large"><img decoding="async" src="https://pictures.lukefan.com/google-io-gemini-antigravity-agent-reliability/blog_4.jpg" alt="Google I/O 发布会大屏上同时挤满搜索、Workspace、安卓、Chrome、YouTube、Cloud 等图标，主持人站在中央撒出一把胡椒面般的小亮点，观众席人物露出困惑表情，浅色背景的商业评论版橡皮泥平面信息图的统一风格。"/></figure>



<p class="wp-block-paragraph">Google 还是在玩宏大叙事。几年之前，Google 的宏大叙事、微软的宏大叙事，我们看着还是很爽的。但是这几年下来，我们越来越讨厌看宏大叙事了。这跟咱们是中国人没有关系，不要胡乱联想。即使是 Google 的宏大叙事，我们也看不下去了。</p>



<p class="wp-block-paragraph">Google 这次本来应该只讲一个主题：我们做 agent，就完事了。它本来应该说：我们要做智能体引擎，Google 不只是模型公司，而是智能体时代的基础设施公司。</p>



<p class="wp-block-paragraph">但是你去看它讲了什么：搜索、Workspace、安卓、Chrome、YouTube、Google Cloud，包括怎么写邮件、怎么做日历、怎么安排日历、怎么写文档、怎么在你的网盘上做事情。它把所有东西都讲了一遍，最后就让人觉得很烦。</p>



<p class="wp-block-paragraph">Google 的潜台词是：如果智能体时代真的来了，谁最适合做你 24 小时的 AI 助理？应当是 Google。</p>



<p class="wp-block-paragraph">这很像微软原来那套词：你看，我有 Windows，我有 IE，我有 Office，你应该在我这里待着。但是微软错过了移动互联网时代。Google 现在真的在向这条路上继续狂奔。</p>



<h2 class="wp-block-heading">Gemini 3.5 Flash：快、便宜，但不靠谱</h2>



<figure class="wp-block-image size-large"><img decoding="async" src="https://pictures.lukefan.com/google-io-gemini-antigravity-agent-reliability/blog_5.jpg" alt="一枚写着 Gemini 3.5 Flash 的高速小火箭冲出起跑线，旁边的价格标签很小但机身零件松动，终点处摆着“可靠性”高墙，浅色背景的商业评论版橡皮泥平面信息图的统一风格。"/></figure>



<p class="wp-block-paragraph">首先说 Gemini 3.5 Flash。这个产品主打快和便宜。快不快？确实很快。便宜不便宜？它其实没有国内的 DeepSeek V4 Pro 便宜，也没有像 MiniMax 或者其他一些中国模型便宜。所以在“便宜”这件事上，它并没有什么优势。</p>



<p class="wp-block-paragraph">Google 为什么发布这样的东西，而不是发布 Gemini 3.5 Pro？这里可能有三个考量。</p>



<h3 class="wp-block-heading">第一种可能：Gemini 3.5 Pro 不够惊艳</h3>



<p class="wp-block-paragraph">Gemini 3.5 Pro 可能没有办法明显压制 GPT、Claude、DeepSeek 这些东西。那么 3.5 Pro 就过两天凑合发出来，反正拿出来也比不过别人。</p>



<p class="wp-block-paragraph">其实 Google 的 Gemini 系列模型从来也没有压制过 GPT 和 Claude。虽然有一段时间它确实很猛，导致 OpenAI 拉过一次红色警报，但它也仅仅是追上了 OpenAI，达到了一个将就能用的状态。</p>



<p class="wp-block-paragraph">那一次拉红色警报，我觉得最核心的原因不是 Gemini 3.5 Pro，而是 Nano Banana，通过画图的方式把用户拉走了。现在不要求你每一块都做得好，而是要求你有一个不可替代的点。所以 GPT 通过 GPT Image 2 又把用户拎回来了。</p>



<h3 class="wp-block-heading">第二种可能：智能体时代需要更快、更便宜的模型</h3>



<p class="wp-block-paragraph">既然到了智能体时代，大家都在做智能体，那么可能确实需要一个更快、更便宜的模型，不一定要上 Pro 模型去做深度思考。所以这也是一种可能：把成本压缩下来。</p>



<h3 class="wp-block-heading">第三种可能：Google 留了后手</h3>



<p class="wp-block-paragraph">也许 Google 确实留了一个后手，可能还有一个非常非常强的模型在憋劲。但是我觉得稍微有点难。Google 其实给自己选了一条特别难的路。</p>



<p class="wp-block-paragraph">问题在于，智能体不能光便宜。我们现在是在智能体里使用大模型，并不是一定要便宜。我宁肯花贵一点的钱，宁肯慢一点，但是它一定要靠谱。</p>



<p class="wp-block-paragraph">因为现在不管是养虾也好，养马也好，系统本身没有那么靠谱，我们又要让它去干一些真实工作，所以可靠性才是最重要的。我宁肯花更多的钱订 GPT 或者 Claude，也不要为了贪一点小便宜，让它每次干活都惹我生气。</p>



<p class="wp-block-paragraph">现在看到的 Gemini 3.5 Flash，真的能把你气死，而且是在它自家的 harness agent 框架，也就是 Antigravity 2.0 上，能气得你完全没招。</p>



<p class="wp-block-paragraph">我们真正需要的模型是：</p>



<ul class="wp-block-list">
<li>不跑题；</li>



<li>不瞎猜；</li>



<li>不把旧知识硬套到新产品上；</li>



<li>不自信地犯错。</li>
</ul>



<p class="wp-block-paragraph">现在这几条它都犯了。</p>



<p class="wp-block-paragraph"><strong>Gemini 3.5 Flash 证明了一件事：只省钱、只提速是没有任何意义的。</strong>你把这样的东西放到 harness agent 里，放到 Antigravity 里，没有人敢放心地把事情交给它干。</p>



<p class="wp-block-paragraph">原来我让 Gemini 跟我聊天，它胡说八道一下也就算了。最多是我被它骗了，拿一些错误信息跟大家讲故事，最后被大家挑错：“老范你又不懂了吧。”这个我认了。但是你到了 harness agent 里，是要在我电脑上操作文件的，是要操作我的邮箱的，这就太恐怖了。</p>



<h2 class="wp-block-heading">Gemini Omni：技术路线强大，用户感知很差</h2>



<figure class="wp-block-image size-large"><img decoding="async" src="https://pictures.lukefan.com/google-io-gemini-antigravity-agent-reliability/blog_6.jpg" alt="一个写着 Gemini Omni 的多模态机器核心连接图片、视频、声音和动作四个彩色模块，但用户面前的输出屏幕平淡无趣，旁边另一块屏幕播放更有冲击力的视频画面，浅色背景的商业评论版橡皮泥平面信息图的统一风格。"/></figure>



<p class="wp-block-paragraph">再往后一个发布的东西叫 Gemini Omni。“Omni”这个单词每次出来，意思都是全能。这一次 Gemini Omni 的技术路线极其强大，但是效果并不好。</p>



<p class="wp-block-paragraph">它讲的是一个世界模型的故事。也就是说，我不是文字模型了，我能够理解图片、视频、声音和动作，什么都可以理解。</p>



<p class="wp-block-paragraph">像 GPT、Gemini 3.1 Pro，其实 3.0 Pro 往后的版本，都是可以输入图片、声音、视频、动作的，都是全模态输入。但是原来的 Gemini 3.0 Pro、Gemini 3.1 Pro 只能输出文字，不能输出其他东西。也就是输入是全模态的，输出只有文字。</p>



<p class="wp-block-paragraph">这一次 Gemini Omni，输入是全模态的，输出也是全模态的。</p>



<p class="wp-block-paragraph">但更重要的是，它是一个世界模型。它可以理解物理模型，可以理解世界规律，可以保证它输出的所有东西在物理世界里逻辑自洽。</p>



<p class="wp-block-paragraph">可是大家拿它做视频测试，和最强的字节跳动 Seedance 2.0 比较，到底谁强谁弱？结果发现，Gemini Omni 输出的视频确实在物理上自洽了，但是没有表现力。Seedance 3.0 出来的东西才有表现力，包括国内的可灵 3.0，这类东西出来才会让人想去分享。</p>



<p class="wp-block-paragraph">这个非常重要。因为这个东西很贵，烧完 token 以后，如果你没有任何想分享的欲望，那肯定没法整。</p>



<p class="wp-block-paragraph">所以我觉得，这是非常强大的模型，但是用户感知很差。用户试了半天以后会说：虽然 Seedance 2.0 的逻辑不一定自洽，有时候还穿模，有时候还有一些乱七八糟的东西，但是就是帅，我就是想看这个。那 Gemini Omni 就打不过。</p>



<p class="wp-block-paragraph">有些人可能会说：不对，我们希望有强大内核，是你们没有用出来，是你技术不对。千万不要对用户提出这种要求。</p>



<h3 class="wp-block-heading">iPhone、尼康和佳能的例子</h3>



<p class="wp-block-paragraph">大家知道 iPhone 是怎么干掉尼康和佳能的吗？虽然尼康、佳能现在还在卖相机，卖得也还可以，但是在整体使用量、照片量上，绝对被 iPhone 碾压。</p>



<p class="wp-block-paragraph">尼康、佳能玩的是“还原”：色彩要准，畸变要小，宽容度要高，能够留给后期更大的空间。但你要不会玩，这个机器拍出来的片子也就那么回事。</p>



<p class="wp-block-paragraph">iPhone 搞的是什么？它不关心畸变。你拿 iPhone 拍照片，一个人如果站在图片侧边，脑袋就是斜的，畸变得一塌糊涂。色彩加上各种滤镜以后，也完全不是还原。虽然现在 iPhone 可以出 RAW 格式了，但跟尼康、佳能比起来差远了。</p>



<p class="wp-block-paragraph">可是要想清楚一点：大部分用户就是要随手拍一张照片，然后发出去。如果拍完以后还需要做半天后期才能往外发，那就没意思了。</p>



<p class="wp-block-paragraph">Gemini Omni 就是按照尼康、佳能的路子在做，确实很强大，但是用户感觉不出来。用户更喜欢要一个 iPhone，Seedance 2.0 可能就更像 iPhone 一点。</p>



<p class="wp-block-paragraph">所以核心是：<strong>你做出强大的产品，一定要让用户有感知。</strong></p>



<h2 class="wp-block-heading">Google 并不擅长前端和用户体验</h2>



<p class="wp-block-paragraph">其实 Google 一直不是一个特别擅长做用户感知和用户体验的公司。很多人可能不同意，因为不管是 Google 搜索还是安卓，Google 都在定义各种设计标准，也一直在建用户体验、点击率和用户流失的数据模型。</p>



<p class="wp-block-paragraph">但是我要说，Google 从来就没有真正做好过这件事。</p>



<p class="wp-block-paragraph">虽然我们觉得 Gmail 很棒，Google 搜索很好使，但这从来不是因为它们前端设计得好。我曾经听过 Google 前端给我们讲课。他讲，当时雅虎、百度的搜索，上面是一个搜索框，“搜索”按钮在下面。而 Google 不这样做。Google 做了很多数据实验，把按钮放在搜索框后面。为什么？因为你输完以后，注意力就在那个地方，鼠标也在那里，所以把按钮放在那里多么有道理，数据比别人好多少。</p>



<p class="wp-block-paragraph">Google 真的是靠把搜索按钮换个地方赢的吗？纯扯淡。Google 赢的原因是搜索结果好。</p>



<p class="wp-block-paragraph">Google 真正强的地方，是后端算法特别强，可以提供别人无可替代的结果。包括 YouTube、Gmail 也是如此。Gmail 真正强的地方是反垃圾邮件；YouTube 是数据量特别大，推荐算法特别好。至于前端，至于视频编辑这些东西，跟国内抖音之类的根本没法比。</p>



<p class="wp-block-paragraph">所以 Google 从来就不是一个做前端、做客户端软件的公司。大家觉得它好用，是因为它后端做得太好了，其他人赶不上它。</p>



<h2 class="wp-block-heading">Gemini Spark：我期待，但 Google 觉得我不配</h2>



<figure class="wp-block-image size-large"><img decoding="async" src="https://pictures.lukefan.com/google-io-gemini-antigravity-agent-reliability/blog_7.jpg" alt="云端办公室里漂浮着 Gmail、Drive、Docs、Sheets 和日历文件，一个写着 Spark 的小龙虾智能体站在云上准备工作，但门口有“Ultra 用户限定”和“美国限定”的门禁牌，浅色背景的商业评论版橡皮泥平面信息图的统一风格。"/></figure>



<p class="wp-block-paragraph">下一个产品叫 Gemini Spark。这个产品其实是我比较期待的，因为 Google 说要做自己的 agent，要把自己的“龙虾”装到云端上去。</p>



<p class="wp-block-paragraph">我为什么期待这样的产品？因为 Codex、Claude Code，包括 Openclaw、Hermes，这些“龙虾”产品都有一个严重问题：</p>



<ul class="wp-block-list">
<li>如果在云端运转，它们没有数据。你不能光靠聊天，必须上传大量数据，上传以后还要让它把数据吐出来，这个交互过程并不方便。</li>



<li>如果让它在本地干活，又不安全。因为这种东西干活必须有巨大的权限。一般我们会单独买一个 Mac mini 让它去干活，不敢让它在真正的本地生产机上干活。</li>
</ul>



<p class="wp-block-paragraph">这个矛盾到目前为止解决不了。</p>



<p class="wp-block-paragraph">而 Google 正好可以解决这个矛盾。因为 Google 从诞生那天开始就在跟微软打仗。微软说，你把所有东西都放在本地，装 Windows、装 Office，文件都在 C 盘、D 盘。Google 一上来就不是这套，Google 说，你把所有东西都放到云端。</p>



<p class="wp-block-paragraph">Google 的 Workspace，包括 Documents、Sheets、Slides 这些东西，本来就都在云端。所以 Google 一开始玩的就是云端电脑这一套。</p>



<p class="wp-block-paragraph">一旦云端有了 Spark 这样的“龙虾”，功能就会非常强大。我不需要到本地来，也不用担心怎么传文件，因为我的文件本来就在云端。</p>



<p class="wp-block-paragraph">所以 Google 想做 AI agent 时代的基础设施，这条路是通的，饼是画圆了的，路径没有问题。</p>



<p class="wp-block-paragraph">我希望 Spark 可以帮我：</p>



<ul class="wp-block-list">
<li>读邮件、写邮件；</li>



<li>整理日程；</li>



<li>在 Google Drive 上做文件助手；</li>



<li>写幻灯片、做文档；</li>



<li>填表格、算数据；</li>



<li>把该干的活都干起来。</li>
</ul>



<p class="wp-block-paragraph">这应该是非常有吸引力的事情。</p>



<p class="wp-block-paragraph">但是问题是，Google 觉得我不配。Google 现在讲的是，这个 App 产品只是内测，只向一些可信任的用户开放，而且要求这些用户必须在美国，还必须是 Google AI Ultra 用户。像我这种 Pro 用户，对不起，不能用。</p>



<p class="wp-block-paragraph">而且以我现在测试 Gemini 3.5 Flash 的水平，我建议大家谨慎使用。因为它的底层模型非常不靠谱，一旦它在 Google Spark 或 Gemini Spark 上用了 Gemini 3.5 Flash，可能就会发生各种惨绝人寰的事故。所以千万要谨慎。</p>



<h2 class="wp-block-heading">Antigravity 2.0：方向对，但不是 Google 的超级入口</h2>



<figure class="wp-block-image size-large"><img decoding="async" src="https://pictures.lukefan.com/google-io-gemini-antigravity-agent-reliability/blog_8.jpg" alt="一个写着 Antigravity 2.0 的应用窗口站在十字路口，周围 Codex、Claude Code、Android Studio、AI Studio、Firebase Studio 多个入口牌子互相争抢箭头，用户站在中间不知该点哪一个，浅色背景的商业评论版橡皮泥平面信息图的统一风格。"/></figure>



<p class="wp-block-paragraph">再往后一个东西是 Antigravity 2.0。这个方向是对的，但是 Antigravity 2.0 并不是 Google 超级 App 的入口。</p>



<p class="wp-block-paragraph">现在大家在抢什么？抢超级 App 入口。</p>



<p class="wp-block-paragraph">Claude 的入口就是 Claude 客户端、Claude Code，这就是 Anthropic 给的超级 App 入口。剩下的它不弄了，只在这上面加各种技能插件。现在我们在 macOS 上使用 Claude App，它上头都可以直接调用 Claude Code，所以这是一个统一入口。</p>



<p class="wp-block-paragraph">对于 OpenAI 来说，Codex 就是他们家的统一入口，这就是未来的超级 App。</p>



<p class="wp-block-paragraph">Antigravity 升级到 2.0 以后，也确实在向这个方向努力，但非常非常难用。难用的原因不是这帮人做不好，我并不认为做这个东西有多么费劲。做不好的核心原因是：<strong>Google 内部的入口实在太多了。</strong></p>



<p class="wp-block-paragraph">它并没有想明白：我是不是要把 Antigravity 2.0 做成 Google 未来超级 App 的唯一入口？这才是 Antigravity 出问题的最核心原因。</p>



<p class="wp-block-paragraph">你会发现这东西长得跟 Codex 很像，但是让它操作浏览器、操作文件、操作这些东西，真的不那么好用，各种报错。而且我用了 Gemini 3.5 Flash、Gemini 3.1 Pro，效果都很烂。</p>



<h3 class="wp-block-heading">一次安装 Antigravity CLI 的经历</h3>



<p class="wp-block-paragraph">我原来装了 Gemini client。现在我让它把 Gemini client 卸了，改成 Antigravity client，因为他们现在有一个 Antigravity 的命令行工具。</p>



<p class="wp-block-paragraph">Gemini 3.5 Flash 折腾半天，什么也没折腾出来，然后给我说了一堆我连看都懒得看的话。</p>



<p class="wp-block-paragraph">Gemini 3.5 Pro 又在那吭哧瘪肚地折腾半天，最后也没跑出来。后来我看到里面还有 Claude Opus 4.6，我说你去搞吧。结果它很快就把原来的 Gemini CLI 卸掉了，然后告诉我：你现在有问题，我没法接着装，你要继续安装 Antigravity IDE。</p>



<p class="wp-block-paragraph">现在它等于变成两个软件：一个是 Antigravity App，一个是 Antigravity IDE。它说你把 IDE 装起来，装完以后就有 Antigravity CLI。最后我照着它说的，一点点把 Antigravity CLI 装出来了。</p>



<p class="wp-block-paragraph">但真正干活的是谁？是 Claude Opus。这就有点让人哭笑不得。</p>



<p class="wp-block-paragraph">现在看来，做客户端的超级 App，做客户端的 harness agent 超级入口，还是需要很大的人力物力，甚至需要很大的 token 倾斜。Antigravity 作为众多入口之一，还要争宠、抢注意力，肯定没有足够的人力物力把它做得很精细。这块差得还比较远。</p>



<p class="wp-block-paragraph">为什么 Google 不愿意多投入一点？因为这帮人是“后娘养的”。这是从外面收购回来的，原来 Win Server 的团队，买回来以后做的产品。跟 Google 那一大堆“亲儿子”比起来，肯定还有差距。所以就做了这么一个半拉拉的东西拿出来给大家看，实在难用。</p>



<p class="wp-block-paragraph">到目前为止，这里面还在跑 Claude Opus。你说它能有多三心二意？</p>



<p class="wp-block-paragraph">它还不敢把 Claude Opus 去掉。为什么？因为也要看 KPI。如果把 Claude Opus 去掉，可能 Antigravity 的 KPI 就崩了，用户量下滑，那就没法整了。</p>



<h3 class="wp-block-heading">Antigravity 成功的难度</h3>



<p class="wp-block-paragraph">Antigravity 有没有可能成功？我觉得以 Google 现在的体量和体系来说，基本不太可能。</p>



<p class="wp-block-paragraph">如果 Google 真想把 Antigravity 做成可以跟 Codex、Claude Code 竞争的客户端超级 App 唯一入口，它首先要干嘛？先把 Android Studio 干掉。</p>



<p class="wp-block-paragraph">Android Studio 是 Google 自己根红苗正维护多年的 IDE，现在还在升级，而且升级得很开心。更重要的是，Android Studio 后面是另一个 IDE 的底壳，还不是 VSCode 底壳。</p>



<p class="wp-block-paragraph">还有 AI Studio，后面也是一整套东西。Google 还在说 AI Studio 可以独立做成应用，不需要其他东西。</p>



<p class="wp-block-paragraph">还有 Firebase Studio，这是 Google Cloud 做的一套系统，也在竞争。还有 Google 的云工具 Gemini Code Assist。怎么一大堆东西都在抢入口？</p>



<p class="wp-block-paragraph">除非把它们统统干掉，否则 Antigravity 也只能这样。做 Antigravity 的人本身三心二意，后面还有一堆“亲儿子”在说：“就你也敢上我爹那去争宠？”所以起不来，想都不用想。</p>



<h2 class="wp-block-heading">Google 的根本问题：好牌太多，主线太散</h2>



<figure class="wp-block-image size-large"><img decoding="async" src="https://pictures.lukefan.com/google-io-gemini-antigravity-agent-reliability/blog_9.jpg" alt="一张会议桌上堆满搜索、YouTube、安卓、Chrome、Gmail、Drive、Gemini、TPU 等好牌，每个小人都伸手抢主牌位置，中央的路线图被拉成多条分叉线，浅色背景的商业评论版橡皮泥平面信息图的统一风格。"/></figure>



<p class="wp-block-paragraph">先替 Google 说一句公道话：技术真强。这个没什么好说的。</p>



<p class="wp-block-paragraph">Google 搜索、YouTube、安卓、Chrome、Gmail、Drive、Docs、Sheets、Google Cloud、Gemini、TPU、DeepMind，没有哪一个差。任何一个拎出来，都可以把现在市面上这些独角兽打得满地找牙。</p>



<p class="wp-block-paragraph">但是它们凑在一起以后，相互掣肘，就走不动了。</p>



<blockquote class="wp-block-quote is-layout-flow wp-block-quote-is-layout-flow">
<p class="wp-block-paragraph">一个和尚挑水喝，两个和尚抬水喝，三个和尚没水喝。</p>
</blockquote>



<p class="wp-block-paragraph">Google 现在就是给大家表演“三个和尚”。甚至不是三个和尚，可能有几十个和尚。他们想把这碗水喝到嘴里，非常不容易。</p>



<p class="wp-block-paragraph">每一张牌都可以当主牌来打：搜索是入口，安卓是入口，Gemini App 是入口，Workspace 是入口，Cloud 是入口，Antigravity 也要入口。最后到底怎么打？</p>



<p class="wp-block-paragraph">OpenAI 现在也在合并，也在砍这砍那。Google 还舍不得。入口太多，主线不清楚，这就是它的问题。所以它永远在那撒胡椒面，大家都要沾一点。</p>



<p class="wp-block-paragraph">今年的 Google I/O，除了刚才讲的这些东西之外，还有一大堆东西，像眼镜也还在发布。人家足足开了两天。</p>



<p class="wp-block-paragraph">大公司玩的是什么？“我在拥抱 AI 了，我整个公司都动起来了。”但是它整个体系架构打不破，每个部门都有每个部门的利益。这么多个和尚到底怎么把这碗水喝到肚子里？这才是真正需要思考的问题。</p>



<h2 class="wp-block-heading">Google 如果想有救，需要两个信号</h2>



<h3 class="wp-block-heading">第一个信号：Workspace 加 Spark 必须跑起来</h3>



<p class="wp-block-paragraph">Workspace 加上 Spark 必须得能跑起来，而且要下放到 Pro 账号，或者下放到一些更便宜的账号里。</p>



<p class="wp-block-paragraph">如果你必须买 200 美金或者 100 美金的 Ultra 账号才给用，这事不太行。而且模型必须在 Workspace 加 Spark 的环境下不能胡说八道。</p>



<p class="wp-block-paragraph">现在它最新出的 Gemini 3.5 Flash 放上去一定会出事故，所以大家一定要小心。如果它做成了，那么 Google 可以继续维持它的用户盘子，接着往前走。</p>



<h3 class="wp-block-heading">第二个信号：Antigravity 能不能成为默认入口</h3>



<p class="wp-block-paragraph">另一个信号是 Antigravity 能不能成为默认入口。如果最后成不了，依然是在你方唱罢我登场、相互掐来掐去，那 Google 这一次的客户端战争估计就要输。</p>



<p class="wp-block-paragraph">至于其他东西，比如眼镜，我从来不看好。</p>



<h2 class="wp-block-heading">TPU 的问题：强，但不一定适合所有人</h2>



<p class="wp-block-paragraph">说到 TPU，有一个特别有意思的事情。很多人都觉得 TPU 很强，比英伟达的显卡强，而且更便宜、更省电。</p>



<p class="wp-block-paragraph">但是有个比较悲催的事情：Midjourney 的 CEO 这两天出来抱怨，说自己鬼迷心窍，把整个算法都搬到 Google Cloud 的 TPU 上去了。确实省钱了，公司也盈利了，但是在训练这一块就不行了，现在比所有同行慢了一年。</p>



<p class="wp-block-paragraph">为什么？TPU 想做训练，需要大量适配和调教。这个事对于 Google 可能是 OK 的，因为它有的是工程师。对于 Anthropic 也是 OK 的，因为它的工程师也很强。但是对于 Midjourney 这样的小公司来说，想把它调通，一年未必搞得定，非常痛苦。</p>



<p class="wp-block-paragraph">在英伟达上，你不需要调这些东西，它都有预置好的工具，你只要往上干就完了。实在搞不明白，还可以到社区里问，有的是人会玩，会教你。但是在 Google TPU 上，每一家在上面做训练的人都会遇到各种新问题。</p>



<p class="wp-block-paragraph">现在全世界能够训练大模型的算力卡只有三种：</p>



<ul class="wp-block-list">
<li>第一种是英伟达；</li>



<li>第二种是 TPU，现在 Gemini 和 Anthropic 的部分模型是用 TPU 训练的；</li>



<li>第三种是昇腾。</li>
</ul>



<p class="wp-block-paragraph">哪个模型是用昇腾芯片训练的？就是 DeepSeek V4 Flash。它的 Pro 不是用昇腾训练的，但 Flash 是用昇腾训练的。这也是 DeepSeek 一帮大神折腾了这么长时间、延后了这么长时间以后，终于可以出来吹个牛：我的 Flash 是用昇腾训练的。</p>



<p class="wp-block-paragraph">但是训练 Flash 模型是怎么训练的？你先把 Pro 在英伟达算力卡上训练好，然后蒸馏。蒸馏完以后，再到昇腾芯片上跑起来，最后拿到一个 Flash 出来用。大概是这样的过程。</p>



<p class="wp-block-paragraph">因为一旦用小众算力卡训练，就会面临一大堆从来没人踩过的坑。TPU 在这块确实还是差一些。想训练模型，最简单的方式就是上英伟达，没有任何其他可选择的东西。</p>



<h2 class="wp-block-heading">不要跟学霸学怎么上学，也别迷信 Google 的开发工具</h2>



<p class="wp-block-paragraph">还有一点：千万不要去跟学霸学怎么上学。一个人上来说：“我跟大家分享一下怎么考上清华。”千万别听。你听完以后，考不上清华。</p>



<p class="wp-block-paragraph">为什么讲这个梗？因为千万不要用 Google 家的开发工具。</p>



<p class="wp-block-paragraph">Google 家真的都是学霸，而且都是编程界的翘楚。他们会说：我们认为应该这么写程序，这样写程序才是最对的。甚至不行的话，我可以自己做一大堆工具出来，我们自己写程序。</p>



<p class="wp-block-paragraph">但是这些东西给普通程序员用，巨难使无比。你用 Google 家的各种开发工具，就像是在听考上清华的学霸分享自己怎么考上清华一样。</p>



<h2 class="wp-block-heading">现在再开发布会，已经不是好选择了</h2>



<p class="wp-block-paragraph">最后说一下，现在这个时间点再去开发布会，已经不是一个特别好的选择。</p>



<p class="wp-block-paragraph">我们发现很多 AI 大厂已经不再开发布会了。他们把发布会搬到线上，做一场直播，或者干脆写个博客、发个推文。甚至连推文都懒得发，直接上线就完事了。甚至不上线，只要泄露了，大家都会觉得有新产品出来，然后疯狂上去用。</p>



<p class="wp-block-paragraph">现在谁还在开发布会？苹果，在挤牙膏：芯片又升级了，摄像头又升级了，又环保了一点。小米也在开发布会，也在挤牙膏，它的发布会我连看都懒得看了。这都是老掉牙的公司才在这开发布会。</p>



<p class="wp-block-paragraph">如果没有人跟你竞争，像苹果那样开发布会，这叫挤牙膏。如果你本来就落后，还要追赶别人，又开了一个发布会，发了一堆完全没法使的东西出来，那不就是应了今天这个主题吗？Google I/O 今年拉了一坨大的吗？</p>



<p class="wp-block-paragraph">现在只要产品还不错，模型很好，工具很好，不需要发布会，它自然就传播起来了。你有那钱，还不如多给大家点额度，让大家去玩。</p>



<p class="wp-block-paragraph">Sam Altman 原来特别喜欢狙击 Google I/O。我记得有一年 Google I/O 开之前，Sam Altman 发了 GPT-4o；还有一年是在 Google I/O 开之前一天发了 GPT Image。今年人家不费这个劲了，只说一句话：我把大家的 Codex 额度重置了。那谁还看 Google I/O？我要回去写程序了。</p>



<p class="wp-block-paragraph">另外，Karpathy 大神直接上了一个八卦，说自己去 Anthropic 上班了，注意力一下就全走了。</p>



<p class="wp-block-paragraph">所以现在再开发布会，很难获得长期注意力。国内谁还在努力开发布会？小米刚开了一个，但我觉得也很烂。百度李彦宏开了一个大发布会，什么百度 Build、百度文心一言 5.1，好强好强。有人用吗？没人用。包括刚开完发布会的千问 3.7，有人使吗？其实也没什么人使。</p>



<p class="wp-block-paragraph">其他人就不费劲了，像 DeepSeek、Timi、MiniMax、GLM 都不开发布会，直接把产品一发，然后发一条推文、一个博客，完事了。你们用去就完了。谁好使谁不好使，公道自在人心。DeepSeek V4 根本没有任何发布会，连视频都没有，直接上线，大家开开心心用起来，不就完事了吗？</p>



<p class="wp-block-paragraph">所以现在这个时间点再去开发布会，是一个极不划算的事情。</p>



<h2 class="wp-block-heading">总结：Google 没输在技术，而是输在大公司病</h2>



<figure class="wp-block-image size-large"><img decoding="async" src="https://pictures.lukefan.com/google-io-gemini-antigravity-agent-reliability/blog_10.jpg" alt="一座写着 Google 技术的坚固机器城堡内部齿轮精密运转，但外部多条产品路线互相缠绕打结，管理层小人站在分叉路牌前犹豫不决，浅色背景的商业评论版橡皮泥平面信息图的统一风格。"/></figure>



<p class="wp-block-paragraph">最后总结一下，Google 没有输在技术上。Google 技术依然很强。现在大家再去挖 Google 的人，或者 Google 的人出来创业，依然会有人给钱。</p>



<p class="wp-block-paragraph">但是 Google 输在了大公司病上，输在了整个产品决策上。所以不要说 Google 不行了。Google 当然很强，DeepMind 很强，TPU 很强，搜索、YouTube、Android、Workspace 都很强，没有哪个不强。</p>



<p class="wp-block-paragraph">真正的问题是：<strong>没有取舍，没有决断，没有一个唯一的中心和突出点。</strong></p>



<p class="wp-block-paragraph">它敢不敢让某一个产品成为绝对主线？不敢。敢不敢让其他部门给它让路？也不敢。当年微信起来，是牺牲了手机 QQ 的。Google 现在还没有下这种决心：我是不是应该牺牲谁、扶持谁？还没有。</p>



<p class="wp-block-paragraph">更悲催的是，全村的希望是“后娘养的”，外来的孩子是 Antigravity，这就特别尴尬，也非常痛苦。</p>



<p class="wp-block-paragraph">它敢不敢承认有些入口应该降级？不敢。敢不敢砍掉一些重复产品？比如前面讲的这么多 IDE，你能不能把其他东西都干掉？干不掉。敢不敢把“所有地方都有 AI”改成“某一个入口真正好用”？也不敢。</p>



<p class="wp-block-paragraph">Google 这样的大公司只能说：你看，我有 Gemini 大模型了，每个地方我都用上了。它不能说我要把入口统一，因为那就是要削藩、要收权，在这种公司里搞不定。</p>



<p class="wp-block-paragraph">如果让我选的话，就是两条路：</p>



<ul class="wp-block-list">
<li><strong>Spark 加 Workspace</strong> 这条路如果跑通，Google 可以继续带着它的用户、数据和生态往前跑。</li>



<li><strong>Antigravity</strong> 这条路如果跑通，Google 在客户端上就有一个超级 App，可以跟 Claude Code、Codex 竞争，但难度很大。</li>
</ul>



<p class="wp-block-paragraph">最后一句话：Google 的问题不是看不到未来，它的问题是看见了太多未来，却还没有决定哪一个未来才是自己真正要压上去的。</p>



<p class="wp-block-paragraph">这个时候要 all in 了，all in 的不是 AI，而是某一个具体路线，要把所有其他的孩子都掐死。这个是 Google 可能很难下决心去做的事情。</p>



<p class="wp-block-paragraph">好，这就是咱们今天的一个结果了。</p>
]]></content:encoded>
					
		
		
			</item>
	</channel>
</rss>
