<?xml version="1.0" encoding="UTF-8"?><rss version="2.0"
	xmlns:content="http://purl.org/rss/1.0/modules/content/"
	xmlns:wfw="http://wellformedweb.org/CommentAPI/"
	xmlns:dc="http://purl.org/dc/elements/1.1/"
	xmlns:atom="http://www.w3.org/2005/Atom"
	xmlns:sy="http://purl.org/rss/1.0/modules/syndication/"
	xmlns:slash="http://purl.org/rss/1.0/modules/slash/"
	>

<channel>
	<title>任务自动化 &#8211; 老范讲故事｜AI、大模型与商业世界的故事</title>
	<atom:link href="https://lukefan.com/tag/%e4%bb%bb%e5%8a%a1%e8%87%aa%e5%8a%a8%e5%8c%96/feed/" rel="self" type="application/rss+xml" />
	<link>https://lukefan.com</link>
	<description>这里是老范讲故事的主站，持续更新 AIGC、大模型、互联网平台、商业冲突与资本市场观察，帮你看清热点背后的底层逻辑。</description>
	<lastBuildDate>Sun, 07 Dec 2025 01:06:31 +0000</lastBuildDate>
	<language>zh-Hans</language>
	<sy:updatePeriod>
	hourly	</sy:updatePeriod>
	<sy:updateFrequency>
	1	</sy:updateFrequency>
	<generator>https://wordpress.org/?v=7.0</generator>

<image>
	<url>https://lukefan.com/wp-content/uploads/2026/03/cropped-jimeng-2026-02-28-5245-用图一的人物形象，替换图二中的人物，使用图二的风格。文字替换：老范讲故事，Yo-32x32.jpeg</url>
	<title>任务自动化 &#8211; 老范讲故事｜AI、大模型与商业世界的故事</title>
	<link>https://lukefan.com</link>
	<width>32</width>
	<height>32</height>
</image> 
	<item>
		<title>微信支付宝联手封杀，豆包手机凭什么搅动万亿市场？一场围绕“小院高墙”的攻防战已经打响｜豆包手机助手 AI Agent 生态壁垒 AI手机 跨App</title>
		<link>https://lukefan.com/2025/12/07/doubao-ai-agent-phone-break-app-barriers/</link>
		
		<dc:creator><![CDATA[Luke Fan]]></dc:creator>
		<pubDate>Sun, 07 Dec 2025 01:06:28 +0000</pubDate>
				<category><![CDATA[AIGC]]></category>
		<category><![CDATA[字节跳动，故事多]]></category>
		<category><![CDATA[AI Agent]]></category>
		<category><![CDATA[AI大模型]]></category>
		<category><![CDATA[AI手机]]></category>
		<category><![CDATA[AI硬件]]></category>
		<category><![CDATA[App壁垒]]></category>
		<category><![CDATA[GEO优化]]></category>
		<category><![CDATA[互联网大厂]]></category>
		<category><![CDATA[任务自动化]]></category>
		<category><![CDATA[努比亚]]></category>
		<category><![CDATA[原生AI]]></category>
		<category><![CDATA[字节跳动]]></category>
		<category><![CDATA[小院高墙]]></category>
		<category><![CDATA[微信封禁]]></category>
		<category><![CDATA[操作系统]]></category>
		<category><![CDATA[智能手机未来]]></category>
		<category><![CDATA[智能终端]]></category>
		<category><![CDATA[模拟点击]]></category>
		<category><![CDATA[流量闭环]]></category>
		<category><![CDATA[生态壁垒]]></category>
		<category><![CDATA[用户隐私]]></category>
		<category><![CDATA[端侧智能]]></category>
		<category><![CDATA[系统级助手]]></category>
		<category><![CDATA[豆包手机]]></category>
		<category><![CDATA[跨App]]></category>
		<guid isPermaLink="false">https://lukefan.com/?p=3108</guid>

					<description><![CDATA[🔥震惊！3000块的“工程样机”炒到1万+，租一天600块？兄弟们，这破手机比我的命还金贵啊！💥字节跳动悄悄搞出的豆包手机，3万台秒光，二手商笑疯——它凭啥这么野？

因为这玩意儿是AI卷王本王！自动比美团京东外卖谁便宜、抢红包快过光速⚡️（但微信直接封号：你敢监控我，我就删号！吓得我晚上手机都抱被窝里😭）。银行都急哭：AI算24点赢钱太容易？游戏党手残福音？统统被禁！最后豆包退步：不碰支付、不薅羊毛，连刷券都怂了😂

但重点来了‼️未来手机根本不用搞新花样——还是直板大屏📱，内核却彻底重生！AI agent直接跨APP干活：点外卖？比价？签到？全交给它！微信支付宝这些“小院高墙”，迟早被用户用脚投票踹开大门！目的打败手段，沟通干啥非用微信？抖音聊不香吗？💥

刷到就是缘分！点赞收藏等明年豆包2.0 👉 评论区喊：AI必须给我抢红包+自动点奶茶！手残党活该被AI拯救嘛🤣（别问，问就是上次红包错过一个亿…）✨

#AI革命 #手机真相 #打工人刚需

标题1：微信支付宝联手封杀，豆包手机凭什么搅动万亿市场？一场围绕“小院高墙”的攻防战已经打响｜豆包手机助手 AI Agent 生态壁垒 AI手机 跨App
标题2：3万台工程机秒光，二手价炒到1万，日租金600超小米汽车！豆包手机揭示了什么残酷真相？｜豆包手机助手 AI Agent 生态壁垒 AI手机 跨App App壁垒
标题3：别再幻想AI Pin了，真相残酷！豆包手机的终极启示：替代手机的设备可能还是手机，但它将彻底干掉App｜豆包手机助手 AI Agent 生态壁垒 AI手机
标题4：为什么我们必须在多个App间反复横跳？豆包手机的“野蛮”闯入，正在终结我们被App绑架的时代｜豆包手机助手 AI Agent 生态壁垒 AI手机 跨App
标题5：行业洗牌进行时：字节跳动用豆包手机捅破窗户纸，苹果腾讯迎来最大挑战者，谁将定义下一代原生AI操作系统？｜AI Agent 生态壁垒 AI手机 跨App 字节跳动
简介：豆包手机的“技术演示版”引爆了科技圈，它通过内置的AI Agent，试图实现真正的跨App任务自动化，直接冲击了微信、支付宝等巨头构建的生态壁垒。尽管遭遇联合封杀，但其展示的“原生AI”理念，预示了未来智能设备可能的发展方向：一个不再被App孤岛束缚，能直接为用户解决问题的强大终端。]]></description>
										<content:encoded><![CDATA[
<figure class="wp-block-embed is-type-video is-provider-youtube wp-block-embed-youtube wp-embed-aspect-16-9 wp-has-aspect-ratio"><div class="wp-block-embed__wrapper">
<iframe title="微信支付宝联手封杀，豆包手机凭什么搅动万亿市场？一场围绕“小院高墙”的攻防战已经打响｜豆包手机助手 AI Agent 生态壁垒 AI手机 跨App" width="900" height="506" src="https://www.youtube.com/embed/hqW7k_YZ05g?feature=oembed" frameborder="0" allow="accelerometer; autoplay; clipboard-write; encrypted-media; gyroscope; picture-in-picture; web-share" referrerpolicy="strict-origin-when-cross-origin" allowfullscreen></iframe>
</div></figure>



<figure class="wp-block-image size-large"><img decoding="async" src="https://pictures.lukefan.com/doubao-ai-agent-phone-break-app-barriers/blog_1.JPEG" alt=""/></figure>



<h1 class="wp-block-heading">豆包手机带来的启示：替代手机的AI设备，可能还是一只手机</h1>



<p class="wp-block-paragraph">大家好，欢迎收听<a href="https://youtube.com/@StoryTellerFan" target="_blank" rel="noopener">老范讲故事的YouTube频道</a>。</p>



<h2 class="wp-block-heading">谦卑的发布：豆包工程样机</h2>



<p class="wp-block-paragraph">豆包手机12月1号发布的，非常非常谦卑和谨慎的发布。首先，它叫<strong>“工程样机”</strong>，或者叫做<strong>“技术演示版”</strong>，而且只做了3万台，没有再多做，也没有说我发布了以后，大家来赶快跟我合作啊，这些都没有。对吧？用非常非常谦卑的方式进行了发布。</p>



<p class="wp-block-paragraph">这个机器，应该是中兴下面的努比亚M153，它的配置算是现在标准旗舰机的配置：</p>



<ul class="wp-block-list">
<li>高通骁龙的至尊芯片</li>



<li>16+256的内存</li>



<li>背后三摄，前头一摄</li>
</ul>



<p class="wp-block-paragraph">大概就是这样的一个情况。标准旗舰价格大概3,000来块钱，具体3,000多少其实也不重要了，配置到底是什么样也不重要了，配置里头只有一件事情是很重要的，叫<strong>“同质化”</strong>。</p>



<h2 class="wp-block-heading">“同质化”的手机市场</h2>



<figure class="wp-block-image size-large"><img decoding="async" src="https://pictures.lukefan.com/doubao-ai-agent-phone-break-app-barriers/blog_2.JPEG" alt=""/></figure>



<p class="wp-block-paragraph">现在的手机，你不看牌子，你根本分不清谁是谁，完完全全同质化。一个大直板，一个大屏幕，后边两到三个摄像头，正面一个摄像头，没了。其他可能侧面有点按键就完事了，也就如此了。所以现在的手机就是同质化，你说我想在这个基础上走个什么高端化，那你只能编爱国故事了，否则你真走不出高端化来。就算是苹果手机，其实在同质化这块也没有好到哪去。对吧？刚才咱们讲的这些东西，你再拿出一个苹果来，是不是也是一大直板，后边来仨摄像头，前头一个摄像头？总体来说相差不大。所以，现在的手机同质化是非常严重的。</p>



<span id="more-3108"></span>



<h2 class="wp-block-heading">AI Agent的能力：突破传统的手机体验</h2>



<p class="wp-block-paragraph">那么，能够做到的事情肯定是很多，因为它使用了一个模拟点击的方式，直接侵入了各种的应用，直接在这个上面替你去点微信，替你去点支付宝，替你去点游戏，做所有事情都做了。你可以直接在上头说：“哎，我现在想吃午饭了，帮我去看看最近有什么券，有什么优惠，帮我去找一找，挑一个最合适的这种套餐，各个平台给我横向比较一下，我要去点外卖。”这个他都可以直接做到。能做的事情，肯定是传统的手机无法望尘的。</p>



<h2 class="wp-block-heading">冲突爆发：当AI Agent挑战“沙箱模式”</h2>



<figure class="wp-block-image size-large"><img decoding="async" src="https://pictures.lukefan.com/doubao-ai-agent-phone-break-app-barriers/blog_3.JPEG" alt=""/></figure>



<p class="wp-block-paragraph">这样的一个手机发布出来，冲突的爆发就是必然的了。原来的手机都是走的<strong>沙箱模式</strong>。什么叫沙箱模式？甭管是苹果还是安卓，我们是一个大的操作系统，下面的每一个应用都在沙箱里面，大家只可以访问自己的数据，这样相对来说是比较安全的。像我以前在猎豹移动做清理工具，我们要干的活是什么？就是突破沙箱，因为我们要把其他应用的垃圾删掉。但是这个事情后来是被安卓限制了，苹果从来就不允许干，安卓原来是允许干的，后来也不让干了。</p>



<p class="wp-block-paragraph">现在呢，豆包说：“来，我要突破沙箱，进去点微信，去进去点这个银行账户，帮你去做支付，进去点支付宝，去到美团、到抖音的外卖平台里头，我去看一看谁家的更便宜。”他就要干这样的事情。那么，这肯定是大型的平台、超级APP所不能容忍的。</p>



<h3 class="wp-block-heading">第一个挑战者：微信的封禁</h3>



<p class="wp-block-paragraph">第一个跳出来的是谁？是微信，直接上来给封了。你只要是在手机上启动微信，直接微信就退出，说：“对不起，我发现后台有驻留程序，有黑客要攻击我，我直接退出了。”如果你坚持登录，他会封你的账号。那大家就害怕了，因为现在你把微信账号封了以后，那这个人就不是一个人了。你像我现在要想证明我是我，我需要在微信里头找到我的驾照、身份证、医保卡，什么都在里头，还有各种的支付全都在里头。所以，微信现在通过这样的一个方式，说你们不能去用豆包手机。</p>



<p class="wp-block-paragraph">豆包做了一些退让和修复。豆包手机里头不再监控微信了，只要是跟微信相关的任务就不执行了。再把这一步退出来以后，微信允许登录了。任何的程序，只要敢监控微信了，只要敢在上面挂着了，就通通不登录。如果能够从外面操纵微信，咱们不说其他东西，最简单的一件事：抢红包绝对手快。呃，以前我们经常说我睡觉了，有人在群里发了个红包，我睡醒了以后错过一个亿。现在不用了，你直接可以让豆包在后台盯着，谁发红包，直接上去收不就完事了吗？但是微信是不允许你干这件事的，这对于微信来说非常非常危险。</p>



<h3 class="wp-block-heading">连锁反应：更多超级APP的抵制</h3>



<p class="wp-block-paragraph">微信之后，淘宝、支付宝、农行、建行等应用，也都进行了封禁。你想通过豆包的AI agent去访问淘宝、访问支付宝、访问建行、访问农行，通通不允许。只要发现有模拟点击的操作，就直接退出，如果反复登录就封账号，用这样的一个方式来进行了抗争。</p>



<h3 class="wp-block-heading">豆包的退让与调整</h3>



<p class="wp-block-paragraph">豆包也做出了一些调整。它调整就是，所有这些什么淘宝、支付宝、农行、建行，包括其他的各种金融机构的APP，通通都不操作了，往后退一退。其他的包括什么刷券、什么签到，这个也都不干了。因为如果可以自动刷券、自动签到，也相当于是对那种辛辛苦苦刷券的人是不公平，所以这个也不弄了。还有的一些游戏也不参与了。原来可以说，我手残，我打不了游戏，现在这个豆包，你替我打。现在通通都不干了。为什么？因为你一旦是用豆包这样的系统来替你打游戏，你比如说你打了个手残游戏，这也就算了，你要是万一打一个双方赌博的游戏，比如说我们现在利用豆包去跟其他的人打这种24点，那这玩意谁还赢得过你？豆包算二十四点，那玩意算多快？给你4张牌，怎么加减乘除乘出24来，肯定普通人是没法跟他玩游戏的。所以豆包说这个游戏也不打了。等于对所有这种跟支付相关的、跟敏感操作相关的、跟公平性相关的（刷券、刷卡、签到的这种），还有跟游戏相关的（像刚才我们讲算24点这样的），就通通都退出来了。</p>



<h2 class="wp-block-heading">“小院高墙”背后的博弈</h2>



<figure class="wp-block-image size-large"><img decoding="async" src="https://pictures.lukefan.com/doubao-ai-agent-phone-break-app-barriers/blog_4.JPEG" alt=""/></figure>



<p class="wp-block-paragraph">为什么像微信、支付宝这些人要去玩这个<strong>“小院高墙”</strong>？我不能允许你进来，我必须要把它封起来。安全确实是一个绕不过去的问题。我们以前是做这种云端虚拟手机的，可以在上面模仿各种操作，模仿你去加入别人的微信群，去群聊，去发各种信息。甚至有些人说我去炒股了，加入了一个炒股微信群，最后发现那群里200多人，只有他一个是真人，其他全都是机器人。像我们以前专门投资过这样的案子，这个对于微信来说是绝对不允许的，太容易骗钱了。所以安全确实是一个绕不過う的问题，建行、农行这些，他们确确实实是有安全审核的责任。但是像微信、支付宝这样的，更多的是希望把流量留在自己的平台上，实现流量闭环，在流量内部去赚取超额的利润。</p>



<p class="wp-block-paragraph">那你说这些平台，甭管是不是有私心，让用户更安全，这不是好事吗？曾经就有人说过：</p>



<blockquote class="wp-block-quote is-layout-flow wp-block-quote-is-layout-flow">
<p class="wp-block-paragraph">“用户为了方便，是可以放弃隐私，放弃所有安全的。这些东西都没有任何意义。”</p>
</blockquote>



<p class="wp-block-paragraph">这话谁说的？这话是李彦宏说的，百度的李彦宏。当时他做百度的手机助手的时候，人家说你怎么侵犯用户隐私？（他说）我只要给用户方便了，用户不介意的。这种事属于是能做不能说，你去做这本身没毛病，用户也确实会用脚投票，但是如果你站出来说，就有点过分了。</p>



<p class="wp-block-paragraph">当然，平台肯定会为了变现、为了自己的利益，高举安全大旗，说你们不可以侵犯用户隐私，不可以做这些不安全的事情。这个里边做的最过分的是谁？就是苹果。苹果是号称必须要安全，必须要保护用户隐私，我们把这些数据都通通藏起来。但是苹果最后得到的是什么？就是原来像Facebook这样的公司，可以通过苹果的一些数据去挑选用户，说我展示这个广告，我只给这部分人展示就可以了；展示另外一个广告，给另外一部分人去展示。这样的话，可以让每一次展示的点击率上升。他原来有一些数据，是可以获得这些信息的。后来苹果说不行，我这有一筐的萝卜，你不能光挑这光溜的买啊，你必须得蒙上盖头，把烂萝卜、小萝卜和好萝卜按统一的价格一起买走。实际上就是隐私保护，对于像苹果这样的公司最大的好处。</p>



<h2 class="wp-block-heading">另一条路：华为鸿蒙的“规矩”</h2>



<p class="wp-block-paragraph">那你说应对“小院高墙”，有没有什么其他的方法？有啊，华为的鸿蒙就有一套自己的玩法：自己盖个房子，自己定规矩，邀请愿意遵守规矩的人入住。用了这样的一个方式。那他怎么控制微信呢？鸿蒙是可以控制微信的啊。鸿蒙系统里头依然是一个沙箱，各自玩耍，不允许访问其他沙箱里的数据。但是，鸿蒙要求微信去开放很多的接口。鸿蒙有专门的鸿蒙AI agent接口，要求微信去对接。这样，如果微信对接了鸿蒙自己的AI（它叫“小艺”），就可以通过这些接口去访问微信内部的一些功能，包括支付、订阅一些内容的这种使用，它都可以直接通过这个接口去做。但是它的方式就是我要求你开接口，我给你接口规范，最后开不开、怎么个开法，是微信自己来决定的。大家都是在统一的协议的基础上，咱们来商量着干。微信前面之所以跟鸿蒙兼容搞得这么费劲，好多接口他也不愿意去接，但是鸿蒙说你必须得接，有这样的强制要求的。微信也是跟他们折腾了半天。但是具体开哪个接口、给多少权限，是微信自己可以控制。</p>



<p class="wp-block-paragraph">像今天的豆包，就不用费这劲，我也不跟你商量，直接去读这个屏幕上的所有信息，分析了以后模拟点击了。他是这样来干的。鸿蒙属于虽然很霸道——“我自己盖了房子，我自己定了规矩，邀请你入住，但是你必须守我规矩”——这是一个相对比较霸道的方式。豆包玩的是什么？我不跟你说什么，我这有一个新的楼，你敢进来，我也没规矩，我直接闯进你们家去，该干什么我就自己干了，你们也别说什么，你们也没有能力去说。因为他是直接跟手机厂商合作，拿到了最高的权限。所以这是两种不同的玩法。</p>



<h2 class="wp-block-heading">未来展望：豆包手机的下一步棋</h2>



<figure class="wp-block-image size-large"><img decoding="async" src="https://pictures.lukefan.com/doubao-ai-agent-phone-break-app-barriers/blog_5.JPEG" alt=""/></figure>



<p class="wp-block-paragraph">前面也讲了，微信、淘宝、支付宝、建行、农行去封禁了豆包的AI agent，那么豆包也做出了各种退让。后边该怎么办？因为它前面就发了3万台工程样机、技术演示版，用了非常谦卑的方式发了3万台，秒光，马上发出来就没有了。而且现在这些手机的二手回收价格已经翻番了，它原来是3,000多，现在二手市场上都卖到一万多。还有一些人在租这个手机，一天600块钱。你现在去租一辆小米汽车，一天都租不到600块钱，他租个手机一天600块钱。很多人要去尝试产品到底怎么样。</p>



<p class="wp-block-paragraph">呃，很多用户使用了以后，或者评测了以后，也都觉得这可能就是未来的方向。那字节跳动会不会赶快加班加点再做一款？不会的。人家讲了，下一批等明年年底再发布，中间这一年我们啥也不干，收集一些数据，重新训练模型，做各种的调整。那你说为什么中间他不干？或者说字节为什么不愿意自己做手机？因为他也很清楚，现在他这种手机的运作方式，别说微信和支付宝不乐意了，现有的法律法规也都是不能允许的。因为现有的法律法规要求是，每一个应用只能够搜集自己必须的用户隐私，然后在此基础上为用户提供服务。任何情况下，如果你搜集的用户隐私超出了必须的范围，都会被警告，都会被封禁，工信部会直接下文点名他的。所以我们只能叫做工程样机，叫技术演示版，不能去快速的铺开。而且在这样的一个监管环境下，直接跳出来跟各大手机厂商、跟各大超级APP的提供商刚正面，不划算。因为你只要出的量大了以后，一定会被政府机构点名的。所以现在不做，明年一年都不做，明年到年底再出来干活。</p>



<p class="wp-block-paragraph">但是在这样的一个情况下，已经给大家打了样了：未来的手机可能就是这样。我们不再被这些APP、被这些沙箱所困，我们可以让这个手机完整地去执行一个跨APP的任务。比如我们可以去比较京东外卖、美团外卖和淘宝闪送，谁家的套餐更便宜，直接去下单，谁家发了券了，这个券应该怎么算，他可以直接来干这个事情，非常爽。未来很多的服务，肯定会在这一年之中发生变化，更多的产品和服务会选择直接提供API，或者完善他们的<strong>GEO</strong>。什么叫GEO？SEO大家知道叫搜索引擎优化，GEO就是生成式AI的优化，更容易被AI agent所选中。以前很多的网站都要做SEO，现在很多的网站要做GEO。那么未来可能很多的服务也要做好GEO，让AI agent可以更好地去选中它。那么这些服务和产品会对AI agent更加开放，这就是这一年应该会发生的故事。</p>



<blockquote class="wp-block-quote is-layout-flow wp-block-quote-is-layout-flow">
<p class="wp-block-paragraph">“我们走后，他们会给你们修建学校和医院，会提高你们的工资。这不是因为他们良心发现，也不是因为他们变成了好人，而是因为我们来过。”</p>
</blockquote>



<p class="wp-block-paragraph">这个话是谁说的？叫切·格瓦拉。豆包手机在整个的手机生态里边，就是在起这样的作用。</p>



<h2 class="wp-block-heading">AI硬件的终极形态：可能还是一部手机</h2>



<figure class="wp-block-image size-large"><img decoding="async" src="https://pictures.lukefan.com/doubao-ai-agent-phone-break-app-barriers/blog_6.JPEG" alt=""/></figure>



<p class="wp-block-paragraph">那么，AI硬件可能是另外一只手机，这是咱们的标题。很多人在AI出来以后，都在去尝试做下一代的AI硬件，有AI Pin，有AI的各种设备，他们都在避免让自己长得像手机。但今天看到了豆包手机以后，我发现下一支AI设备，继续长得像一个手机是没有任何问题的。它只是把里面的操作系统和APP干掉。硬件，其实手机现在这个形态就已经很好了：一个大直板，完全同质化的硬件，后边有摄像头，前面有摄像头，有一个屏幕，可能再稍微的有几个按键，开机关机、声大声小就够了，其他啥也不需要了。这个东西是我们通过智能手机时代已经验证过的智能设备形态，我们继续使用这个形态就挺好了。</p>



<h3 class="wp-block-heading">目的与手段：第一性原理的思考</h3>



<p class="wp-block-paragraph">那你说这些设备跟原来的手机到底有什么区别？这里我们要搞清楚一件事：目的、手段和<strong>第一性原理</strong>。我们要去社交，要去跟人联系，这个东西是我们的目的；通过微信，这是手段。把这个事情我们要搞清楚。而所谓的第一性原理，就是我们只要目的，只要结果，手段是不重要的，手段是可以重新去定位的。咱们去看看，前面封杀豆包手机的这些人，其实他们都是什么？他们都是手段。微信实际上是个手段，我们最终的目的是为了跟别人去沟通；支付宝是个手段，我们最终的目的是支付。那么只要是把这个支付的过程通过API包装起来了，我们就不再需要支付宝了，我们直接就可以实现我们的目的，让AI直接把结果做掉。所以遵循第一性原理，我们可以把手段抛弃掉，直接得到目的。</p>



<p class="wp-block-paragraph">是不是还会有人继续搞“小院高墙”呢？还会。但是这些搞“小院高墙”的，会越来越被压缩。大家最后说算了，我不用你不就完事了吗？未来的各种服务，不再会说你必须要进来验证了以后才能用，不会变成这样了，而是写好自己的简历，或者是叫功能描述，直接在AI agent上面去挂靠，等着AI Agent的出来翻牌子，未来可能会变成这样的一个状态。通过模拟点击的方式，算是直接拆房子，已经是震慑到了现在这些做超级APP的公司，让大家看到了用户是如何用脚投票的。携程想要让大家来订酒店，或者是美团想让大家在我这订外卖，那未来这些人，他们就干脆说我提供服务，你们这些AI自己来挑就完了。他们会通过做GEO（AI的生成优化）获得AI的青睐，说你们下次再去订酒店的时候，优先推荐我的。当然了，最终肯定不是说单纯的做GEO，最终一定还是得花钱，花买路钱。当然，买路钱未来就是像豆包、像OpenAI他们会去收。以前携程的微信小程序，我要让别人在微信小程序里找到我，我必须要到腾讯那边去交买路钱，以后就通通到豆包这来交就可以了。AI会根据功能的描述来决定，我在做一个完整的项目的过程中，到底调哪些功能。未来会变成这样，直接实现结果。</p>



<h2 class="wp-block-heading">AI Agent开启的全新可能</h2>



<figure class="wp-block-image size-large"><img decoding="async" src="https://pictures.lukefan.com/doubao-ai-agent-phone-break-app-barriers/blog_7.JPEG" alt=""/></figure>



<p class="wp-block-paragraph">而且，当AI agent真正的能够去运转起来以后，更细致的差异和匹配就有了可能。现在比如说我们去使用美团、拼多多，里头有非常多的优惠券、各种的套餐、各种买几减几这些东西，这个已经没有办法变得更复杂了，因为已经复杂到头了，我现在已经基本上看的这些东西就直接晕菜了。但是当有了AI以后，再复杂的这些套餐，都是有可能被AI理解和实现的。比如说我已经规定好了，喝普洱茶的人，你们今天去买我的陈皮一定会打折的。我喜欢买张三家的普洱，买李四家的陈皮，以前都是这样的，我们会去看，说张三家的普洱是什么样的一个折扣，李四家的陈皮是什么样的一个折扣。但是这次，张三家的普洱跟王五家的陈皮做了一个联合的活动。原来我们要想去做这样的复杂比较，是很痛苦的。但是现在agent就可以一次性把这事搞定。他说这个捆绑起来，发现王五家的陈皮好像评价不是很好，那算了，咱们不要去捆绑了，咱们还是买张三家的普洱，买李四家的陈皮。他来替你来做这个决定。很复杂的这些操作就都可以实现了，那么这样交易就会变得更加的活跃，这个一定是最重要的。</p>



<p class="wp-block-paragraph">而且未来的游戏可能就不再是说，你看我这个算24点，AI算的比人快，就不会是这样了，可能会有更多的直击心灵的游戏、娱乐方式，让我们可以在AI的帮助下享受更大的愉悦，这可能才是未来的游戏与娱乐的形式。最简单的，我们现在看电视剧，它这个电视剧是直接拍好的，不可能说根据我个人的喜好随时去发生变化。但是有了AI以后，它就完完全全可以根据我的个人喜好去发生变化。我喜欢某个明星演的某个角色，那他可能到我面前就是这个明星演的；我希望里头某一个地方有一些新的分支，哪个人应该提前死掉，或者哪个人不要死掉，那么AI都是可以实时来生成这些东西的。在这样的情况下，就不需要再推荐了，它直接就知道我需要什么，就直接给我生成我最喜欢的就够了。那可能未来整个的娱乐方式也会发生改变。甚至一些原来已经有的技术，只是因为复杂度太高，没法去推广的技术，也可以在AI agent的帮助下得以大量的普及与推广。这个讲的东西叫<strong>“智能合约”</strong>。当有智能合约的时候，这些AI agent可以去自动地阅读智能合约的各种说明，然后来决定是不是来帮你去实现这些合约。</p>



<p class="wp-block-paragraph">所以未来的智能终端，应该是一个长得像一只手机一样的、但是有全新系统的一个智能设备。所谓的原生AI手机到底是什么？是由AI agent控制，可以玩更复杂的业务逻辑，打破APP的壁障，解决各种问题的一个设备。它长得是不是像现在的手机这件事，一点都不重要，那都是形式，真正重要的是我们能够解决问题。</p>



<h2 class="wp-block-heading">谁将赢得AI硬件的未来？</h2>



<figure class="wp-block-image size-large"><img decoding="async" src="https://pictures.lukefan.com/doubao-ai-agent-phone-break-app-barriers/blog_8.JPEG" alt=""/></figure>



<p class="wp-block-paragraph">那么谁最有可能走通下一步呢？真正做出这样的AI智能设备（我们就不要再管它叫手机了）。现有的超级APP是不会束手就擒的啊，微信、淘宝、支付宝都不会。用户也不是必须要使用这些手段，用户需要达到的是目的。不是说我一定要通过微信跟你联系，我只是需要跟你联系。为了达到更重要的目的，用户也愿意放弃和牺牲一些东西。我记得在iPhone 1发布的时候，iPhone 1的电池续航不是很好，就是每天必须要充电，连续打电话的时间大概是50分钟还是几十分钟，就跟当时其他的手机比都没法比。当时其他的手机是可以待机两三天，甚至有的可以待机一星期的，连续打电话可以打几个小时。但是大家为了使用iPhone，最后说，我们愿意放弃这些不那么重要的东西。我记得当时的用户留下了一句名言：“如果乔布斯认为我们每天打50分钟电话就够了，那我们每天就打50分钟电话。”</p>



<p class="wp-block-paragraph">不知道大家现在每天还打多长时间电话？我现在已经很长时间不打电话了，就算是需要跟人进行语音通话，也都是使用微信或者是Discord，我是不会再直接打电话了。现在我能接到的电话，除了送外卖的之外，都是垃圾电话。电话已经彻底沦为了可有可无的东西，甚至很鸡肋的一个东西。所以一些服务会被抛弃掉。用户在iPhone面前选择了放弃超长待机、放弃超长通话，他们觉得社交更重要。大家注意，打败电话和短信的不是iPhone，而是什么呢？是Twitter和Facebook。就是iPhone之所以能够成功，一方面它设计确实很好，另外一方面非常重要的是什么？就是当时的社交网络已经大行其道了。大家觉得我在手机上可以刷Twitter了，可以刷Facebook，我可以随时拍照，可以随时发上去，这个才是真正打败打电话的需求、打败收短信的需求的核心底层逻辑。所以最终永远是目的打败手段，不可能说我通过手段来绑架你的目的。</p>



<p class="wp-block-paragraph">还有一些不愿意接受妥协的，比如说其他那些手机厂商怎么办？他们最后就被淘汰了，像诺基亚，直接最后就没了。银行本身并不需要这些流量，他们只需要提供基础服务就好了，他们是会屈从的。当然也不是通过模拟点击这种方式，他们还是会提供API或者是类似的这种接口，来向AI agent提供相应的服务。或者是，有一些愿意承担中间责任的第三方去做银行接口，也是有可能的。</p>



<h3 class="wp-block-heading">更有可能成功的玩家</h3>



<p class="wp-block-paragraph">那么，如果自己本身就拥有超级APP，拥有巨大的流量和完整的用户场景，那么这样的厂商去走下一步就更容易成功一些。你说我原来什么都没有，我做了一个大家就来使，就像华为这样，我原来啥也没有，除了做手机我啥也不会，那我做出一个新的手机来请大家来使，这事就没法整。他只能跟一个一个的，像微信、像抖音去跟人商量去，这就很麻烦。但你说我原来自己就有超级APP了，有用户了，他就更容易一些。</p>



<ul class="wp-block-list">
<li><strong>字节跳动：</strong>他有今日头条、有西瓜视频、有抖音，包括抖音里头还有小程序、还有抖音直播、有抖音电商、有抖音团购、抖音支付，他是完整的一套东西。那么他去做相应的这套服务就会更容易一些。对吧？这一次豆包手机跟字节家自己的产品配合的就很好，没有哪一个说我把你封禁掉的。比如抖音就不可能说把豆包手机封了。以后微信把豆包手机封掉了，那说我们不需要微信来沟通了，我们在抖音里边，它也是有群聊的，有这个抖音聊天工具，我们在那里聊就完了，为什么一定要到微信里去聊？他就可以去替代。因为我们最终要解决的是沟通的问题，而不是要用微信，微信是个手段，我们刚才讲了。那你说我现在要买东西，那我就别去淘宝了，我直接在抖音里买了不就完了吗？那你说我要叫外卖，抖音里也可以叫，你为什么要出去叫？我要打车，那以后抖音是不是也可以打车？那么，他实现这套系统的阻碍就会小很多。那其他那些人说我不愿意跟你接了，像微信说我不愿意跟你接，那你不接就不接呗，这有什么大不了的吗？你再过个两年，可能大家就愿意接受这件事情，我不在微信里跟大家聊天了，我在抖音里跟你聊天不就完事了吗？所以字节实现这套体系的可能性是比较大的。</li>



<li><strong>X (马斯克)：</strong>马斯克讲了说我要再做一个微信，我要再做一个超级APP，我要让人在这里边做所有的事情。他还有自己的xAI group整套的模型，自己还能做硬件，他能做汽车，能做火箭，能做卫星，那他去做下一代的手机应该也不难。所以，X也是有可能能够走通这条路的公司。</li>



<li><strong>谷歌：</strong>这个没有任何问题，现在最强模型Gemini 3在人手里头，安卓系统本来就是他的。现在谷歌也说，我们准备做新的操作系统了，安卓还是要退休了。</li>



<li><strong>OpenAI：</strong>这肯定也是有机会的，OpenAI已经挖了iPhone最早的设计师回来，他其实也在做类似的事情。在做AI硬件这件事情上，千万不要纠结这个东西为什么长得还像手机，不是问题，解决用户需求才是最重要的。长得是不是像原来的手机，这事一点都不重要。</li>
</ul>



<h3 class="wp-block-heading">面临挑战的巨头</h3>



<ul class="wp-block-list">
<li><strong>Meta：</strong>是比较痛苦的，没有自己的大模型，自己的大模型团队现在正在分崩离析。如果未来他没有办法做好自己的大模型的话，那这条路他走不通。</li>



<li><strong>腾讯：</strong>它其实跟Meta的情况比较像，虽然它是超级APP，手里有大量的用户，但是它没有大模型这一块，对于它来说也是比较痛苦的。它不可能说我整个做完了以后交给DeepMind，这个挺难的。</li>



<li><strong>苹果：</strong>其实跟他们的情况也很像，自己手里没有模型，这个模型是别人的，甭管他最后是用Gemini还是用OpenAI，这个都是很痛苦的。那你说现在苹果里头也没有搜索，用谷歌搜索，苹果手机照样比别人卖的贵很多，为什么到AI这块就不行了？很简单，AI时代同质化会更加严重。我们要的就是这个手机，你只要经用就可以了，至于你这个手机的其他的附加价值、品牌价值就都已经不重要了。所以苹果在未来想要转过这个弯来，要么有自己的大模型，要么就沦为努比亚呀、或者是小米这些相同的一个境遇，我们就生产同质化的设备就可以了。所以这个对于苹果来说也非常痛苦。</li>
</ul>



<h2 class="wp-block-heading">总结：豆包手机捅破的窗户纸</h2>



<p class="wp-block-paragraph">总结一下，豆包手机算是捅破了一层窗户纸，他通过我不跟你商量，直接上来就干的方式来解决问题，但是展示了一下未来的一种可能性，而且向整个行业证明了用户喜欢这种交互方式，还可以通过这种方式搜集用户数据。他为了这一次的展示，用了非常谦卑、非常谨慎的方式：工程样机、技术演示版、只有3万台。做完了以后不会马上更新迭代，也不会去跟别人合作，也不会自己做手机，而是明年年底再去准备出下一版。他用这样的方式来给大家演示了一种可能性：未来的智能终端，可能长得还是手机的样子，但是内核已经完全不同了。</p>



<p class="wp-block-paragraph">好，这就是今天的故事。感谢大家收听，请帮忙点赞、点小铃铛、参加<a href="https://discord.gg/ppKsNkttTv" target="_blank" rel="noopener">Discord讨论群</a>，也欢迎有兴趣、有能力的朋友加入我们的<a href="https://www.youtube.com/channel/UCUGLhcs3-3y_yhZZsgRzrzw/join" target="_blank" rel="noopener">付费频道</a>。再见。</p>
]]></content:encoded>
					
		
		
			</item>
		<item>
		<title>OpenAI ChatGPT Atlas，为AI浏览器指明方向。谷歌股价应声下跌5%，Chrome霸权终结？｜OpenAI Atlas、Agent Mode、AI Browser</title>
		<link>https://lukefan.com/2025/10/24/openai-atlas-ai-browser-memory-agent-modes/</link>
		
		<dc:creator><![CDATA[Luke Fan]]></dc:creator>
		<pubDate>Fri, 24 Oct 2025 00:47:18 +0000</pubDate>
				<category><![CDATA[AIGC]]></category>
		<category><![CDATA[Agent模式]]></category>
		<category><![CDATA[AI Agent]]></category>
		<category><![CDATA[AI工作流]]></category>
		<category><![CDATA[AI浏览器]]></category>
		<category><![CDATA[Atlas使用教程]]></category>
		<category><![CDATA[ChatGPT]]></category>
		<category><![CDATA[Cloudflare自动化]]></category>
		<category><![CDATA[GPT-4o浏览器]]></category>
		<category><![CDATA[Mac M芯片]]></category>
		<category><![CDATA[OpenAI]]></category>
		<category><![CDATA[OpenAI Atlas]]></category>
		<category><![CDATA[个性化浏览]]></category>
		<category><![CDATA[任务自动化]]></category>
		<category><![CDATA[复杂后台操作]]></category>
		<category><![CDATA[搜索新体验]]></category>
		<category><![CDATA[智能浏览器]]></category>
		<category><![CDATA[浏览器插件限制]]></category>
		<category><![CDATA[浏览器新方向]]></category>
		<category><![CDATA[浏览器记忆]]></category>
		<category><![CDATA[浏览器评测]]></category>
		<category><![CDATA[用户数据]]></category>
		<category><![CDATA[网页自动化]]></category>
		<category><![CDATA[谷歌Chrome]]></category>
		<category><![CDATA[隐私安全]]></category>
		<category><![CDATA[默认浏览器]]></category>
		<guid isPermaLink="false">https://lukefan.com/?p=2743</guid>

					<description><![CDATA[💥救命！OpenAI这新浏览器把爷心态干崩了！谷歌Gemini连夜改PPT跌5%股票😭

家人们！OpenAI搞了个「ChatGPT Atlas」，直接给AI浏览器立规矩了！Mac老铁速冲——M1/M2芯片专属，Win党哭晕厕所🙈 它凭啥封神？🤯

✨ **Agent模式骚操作炸裂！**
银行菜单找不到？云后台像迷宫？爷直接甩手给它：「自己点去！」看着它丝滑填表、点按钮💻，连Cloudflare「管道功能」秒搞定！再也不用对着中文菜单对照英文攻略了，产品经理狂怒！🔥（但画火影血轮眼歪到离谱…细节党哭死😭）

🌪️ **记忆功能又爱又怕！**
刷小红书2小时被精准记录？浏览历史连草榴都敢扒？后背发凉但真香！昨天看的文章手一抖就找回，打工人泪目：再也不用翻30个标签页找PPT了…⚠️社死警告：下次让写周报，小心它把深夜刷的「恋爱脑语录」塞进去😂

🌟 **最绝哲学暴击：浏览器要留白！**
豆包夸克堆满按钮像菜市场？谷歌保守如老古董？Atlas直接搬出《道德经》：「有之以为利，无之以为用！」空白区域才是王道，简洁优雅到像给浏览器做了医美💉

👉 **Mac车主听我求：立刻设默认浏览器！送7天会员爽翻！**
免费？不存在的！下周你肯定跪着交20刀…但爷已经戒掉Chrome了：性能稳如狗🐶，就是插件失踪、1Password登录哭晕（别问，问就是心碎💔）

🔥 **不说人谎：这破功能=给未来产品经理判死刑！**
以后再搞「不说人话」的后台？Atlas直接替你扫雷！新商业模式更吓人：它知道你爱刷小红书，购物车推荐必精准收割钱包💸

现在不冲？等谷歌缓过劲儿再截胡？M1/M2老铁闭眼下载！Win党…等大爷我心疼你😭
👇**评论区喊出你最想让它干的骚事！** 我赌1毛你被测出「深夜刷情侣头像」🤣
（P.S. 别TM点不开就怪我…只有Mac能香！）

#AI黑科技 #救命神器 #打工人的命也是命 💯

标题1：谷歌股价应声下跌5%，Chrome霸权终结？OpenAI用记忆与Agent模式重新定义浏览器，老用户面临艰难选择｜OpenAI Atlas、Agent Mode、AI Browser、Browser Memory
标题2：银行后台、云平台配置太复杂？别再手动死磕了，亲测这招让它自动完成90%的繁琐操作，效率飙升｜OpenAI Atlas、Agent Mode、AI Browser、Task Automation
标题3：看似智能，实则后脊梁发凉：它记得你刷过的一切，连小红书关注谁都一清二楚，隐私与效率的博弈开始了｜OpenAI Atlas、Browser Memory、Privacy Controls、User Data Training
标题4：行业风向标已定：OpenAI正用“Nexus手机”的思路打样，揭示未来AI浏览器的三大核心与两大商业陷阱｜OpenAI Atlas、Agent Mode、AI Browser、OpenAI、ChatGPT
标题5：先别急着换！实测一周后发现它虽强，但两大硬伤（无插件、仅限Mac）劝退重度用户，选择前必看｜OpenAI Atlas、AI Browser、Google Chrome、macOS、Release Notes
简介：OpenAI Atlas 横空出世，正以“行业标杆”的姿态挑战传统浏览器。本文深度解析其两大核心功能：革命性的 Agent Mode 如何自动完成银行后台等复杂任务，以及备受争议的 Browser Memory 如何在提供极致个性化的同时引发隐私担忧。这款全新的 AI Browser 不仅让谷歌感受到了巨大压力，其创新的记忆与自动化模式也预示着新的商业模式雏形，为整个行业指明了方向。
]]></description>
										<content:encoded><![CDATA[
<figure class="wp-block-embed is-type-video is-provider-youtube wp-block-embed-youtube wp-embed-aspect-16-9 wp-has-aspect-ratio"><div class="wp-block-embed__wrapper">
<iframe title="ChatGPT Atlas 看似智能，实则后脊梁发凉：它记得你刷过的一切，连小红书关注谁都一清二楚，隐私与效率的博弈开始了｜OpenAI Atlas、Browser Memory" width="900" height="506" src="https://www.youtube.com/embed/SuPAk7mi_kU?feature=oembed" frameborder="0" allow="accelerometer; autoplay; clipboard-write; encrypted-media; gyroscope; picture-in-picture; web-share" referrerpolicy="strict-origin-when-cross-origin" allowfullscreen></iframe>
</div></figure>



<p class="wp-block-paragraph">OpenAI的ChatGPT Atlas，又为行业指明了什么新方向呢？</p>



<p class="wp-block-paragraph">大家好，欢迎收听<a href="https://youtube.com/@StoryTellerFan" target="_blank" rel="noopener">老范讲故事的YouTube频道</a>。</p>



<p class="wp-block-paragraph">这是AI浏览器真正的王者吗？又一次成功地截胡了谷歌。因为谷歌原来这个礼拜，据说要发Gemini 3的，把AI Studio网站都改了，结果他整了这么一出戏，据说谷歌的Gemini 3又往后推了。</p>



<p class="wp-block-paragraph">AI浏览器未来到底是什么样的方向？很多厂商呢，实际上都在努力地折腾AI浏览器。比如说像谷歌的Chrome，里面就有了Gemini，只是只能在美区使用，我在非美区还没有体验过这个东西，好像也没有什么特别的功能。Perplexity他们做了一个叫Comet的一个浏览器，据说是专业性很强，用它做各种搜索和分析，效果非常好。还有一个公司呢，叫做浏览器公司（The Browser Company），他们呢一开始做了一个产品叫ARC，后来呢又做了一个叫DAI还是DIA的一个产品。总之就是做了两款这种全新的AI浏览器，极大地改变了大家对于浏览器的使用习惯。我试过其中的ARC，但是没有感觉怎么喜欢，就放弃了。</p>



<p class="wp-block-paragraph">国内的话，像360、纳米搜索呀、夸克呀，还有字节的豆包，实际上都是AI浏览器，大家都在往这一个方向去努力。</p>



<span id="more-2743"></span>



<p class="wp-block-paragraph">OpenAI的ChatGPT Atlas终于王者登场了。这个产品呢，有点像谷歌最早期发布的Nexus手机一样。Nexus手机其实当时发出来以后，卖得并不是很好，但是谷歌的意思就是：我打个样，你们看看手机应该咋做，不要给我做出这种神头鬼脸的东西出来，都照我这模样来。有点这样的感觉。</p>



<p class="wp-block-paragraph">OpenAI的ChatGPT Atlas的安装和使用过程是什么样的呢？咱们先简单介绍一下。</p>



<p class="wp-block-paragraph">首先，只有Mac版，而且必须是M系列芯片。你说我是英特尔芯片的老Mac行不行？装不了，必须是M系列芯片的Mac才可以装。其他的版本据说是要等一等。OpenAI自己给出的解释就是，Mac电脑的一致性是比较强的，不像Windows电脑似的，各种的CPU、显卡，各种配置都很复杂。第二个呢就是安全性，因为你到Windows电脑里头，它没有很好的沙箱保护，而且很多人喜欢在里边去做各种各样的测试，或者是各种破解，安全性是不太容易保证的。还有呢就是算力，M系列的CPU呢，它的算力还是有保障的。基于这三个原因吧，那现在第一个版本只有Mac版。</p>



<p class="wp-block-paragraph">它安装以后呢，可以导入Chrome或者是Safari的数据，你原来的收藏夹呀、登录的密码通通都可以导进来。如果你把它设置成默认浏览器呢，可以送7天会员。我相信这几天OpenAI的订阅数应该在暴涨，因为这个产品做得还可以。</p>



<p class="wp-block-paragraph">它整体呢，长得跟Chrome其实差不太多，因为底层是Chrome。基本的配置呢，其实是现在绝大部分的AI浏览器的一个底层配置。新建的所有窗口都是聊天窗口，在这一点上呢，跟豆包、夸克很像，360我没使过不知道。但你像Chrome，现在新建的窗口依然是一个浏览器窗口，而现在标准的AI浏览器的话，新建窗口都是聊天窗口。</p>



<p class="wp-block-paragraph">我们正常用浏览器打开<a href="http://chatgpt.com/" target="_blank" rel="noopener">ChatGPT.com</a>这个网站的时候，会有一个侧边栏，里头是你的聊天记录。现在呢，这东西不见了。浏览器的工具栏最左上方有一个按钮，长得像侧边栏一个按钮，你一点，这个侧边栏就出来了，你可以看到以前的聊天记录。没有一大堆的功能入口，咱们使用夸克也好，使用豆包也好，在这个对话框底下，都是巨多的这个标签：画画、写字、写程序、做视频，有一大堆这样的东西。OpenAI还是要脸的，它没有把一大堆的这些东西都露出来。</p>



<p class="wp-block-paragraph">模型选择在页面的最左上角。大家注意，边栏不在页面里头，那个按钮它在页面外边，是在工具栏上。而在页面里头最左上角的地方就是选择模型，默认是GPT-4o。如果大家强制说，“你一定要使用GPT-4o thinking的话”，你要上那去选去。或者说，“我想使GPT-4o”，你要在那去选。其他的跟我们正常使用<a href="http://chatgpt.com/" target="_blank" rel="noopener">ChatGPT.com</a>这个网站是一样的。</p>



<p class="wp-block-paragraph">下面的备选项呢，很有趣。在上面有一个条让你去聊天，底下有一堆备选项。但是呢，在有趣的同时，也让人头皮发麻。为什么呢？它是根据过去一天的工作，给出的一些总结和建议。因为ChatGPT的这个Atlas，它最重要的一个属性就是它会把你以前的浏览记录都留下来，然后说你原来是做了哪些事情，你可以搜索一下，“我记得我昨天好像看到一个网页上说什么事了”，他马上给你找出来。</p>



<p class="wp-block-paragraph">这个事呢，对于很多人来说是很吓人的，但是可能是我们日常使用中经常遇到的一个情况。“我看了个网页，但我忘了在哪打开的了，那里头说一什么事，我现在需要把它摘出来，放到我的演讲稿里去。”这个现在是可以很好地去工作了。</p>



<p class="wp-block-paragraph">像我这个对话框底下，第一条是“刷小红书”，因为我有时候去刷小红书。它会告诉你你是几点到几点刷了多少次，都刷了哪些内容，重点关注了哪些博主，他都给你记着。你看了以后还是觉得有一点点后脊梁发凉的那种感觉。第二条呢叫“内容创作”，他上来告诉我说，你在WordPress，就是我的博客站上，做了哪些的修改和添加；在这个YouTube Studio，就是我们的油管的后台，处理了哪些内容；在Streamyard开了几次直播。大家反正好好看一看，不断地矫正自己，做一个更好的人吧。这就是过去浏览内容的记忆。</p>



<p class="wp-block-paragraph">当我们离开了一开始的这个聊天界面以后，我们会进入一个很有针对性的结果页。什么叫结果页？比如说你在谷歌上搜索了一个条目，它会给你列出一堆结果，这个页面我们叫结果页。这个Atlas的结果页长什么样呢？跟传统的GPT页面呢，还是不太一样的。</p>



<p class="wp-block-paragraph">页面最上头一导航栏，第一栏呢是一小房子，这个呢就是Home吧，小房子一般是Home的意思，这就是聊天页面。第二栏呢是一个小地球，是搜索结果列表页面，你基本上可以把它当成搜索引擎来使用。第三栏呢是一个小画片，是图片搜索结果的页面。第四栏是一个拍电影的那个打板器，就是“啪”打一下，这是第几场第几幕，这样一个打板器，它呢是视频相关的结果。第五栏呢，上面画了一张报纸，这是新闻结果，就是我们从严肃新闻媒体里上找到的，跟你现在要聊的这个事情相关的这些页面。</p>



<p class="wp-block-paragraph">这个长得很像什么？长得很像谷歌的搜索结果页。你在谷歌里搜一个东西以后，上面也是有这样的一个导航栏的，只是谷歌的导航栏的第一项呢，是搜索结果，第二项是可能图片，第三项是什么，它是这样来排的。它只是排得稍微有一些区别，所以在这一点呢，他跟国内的这些豆包或者是夸克还是有一些区别。所以我说，这是完完全全针对谷歌搜索引擎去的一个结果页。当然这个也是有效果的，Atlas发布，谷歌的股票马上应声跌落5%，后来爬回来一点，当天收盘应该跌了2%。</p>



<p class="wp-block-paragraph">然后在右边呢，有一个边栏。这个其实是很多的Chrome上的插件都可以实现的功能，就是我在网页的右侧开一个边栏，可以在里边去聊天，可以根据网页上的内容去进行问答、去总结。在Atlas里头也是有的。这些呢都算是中规中矩，不算是它创新，原来也有。里头可能唯一比较创新的一点就是记忆，这个还需要经过时间的考验，因为这个功能我感觉非常非常危险，就是你看到他这样去工作的时候，总是觉得不那么舒服。</p>



<p class="wp-block-paragraph">当然，我最喜欢并且让我长时间使用Atlas的功能，还不是这些，是什么呢？是Agent模式。</p>



<p class="wp-block-paragraph">其实原来ChatGPT也有Agent的模式，只是呢，它的工作方式是在云端开一台虚拟机，在这个虚拟机里头，把你需要去浏览的网页一个一个打开进去，点击，点击完了以后呢，去进行登录、买东西、结果的处理，它是这样来去做的。现在呢，直接在本机上跑了。因为Chrome本身是可以开很多页面，自己就相当于每一个页面、每一个Tab就是一个虚拟机，所以它现在在这边跑。</p>



<p class="wp-block-paragraph">那你说这样的功能到底有什么用呢？特别是我们在国内，我们也不可能说拿这东西上美国的Amazon上去买东西。但是我想问大家，有没有遇到过这样的情况？到了银行网站，找不着需要操作的菜单，找不着需要买的产品？或者说需要填表的时候，你不知道该填啥？使用很繁琐的云计算控制台，或者叫Control Panel的时候，找不到自己想要的功能？</p>



<p class="wp-block-paragraph">云计算也好，银行也好，他那个后台都是很复杂的，你要找半天。而且经常是怎么说呢，叫“不说人话的产品经理”，让你根本不知道你要找什么。因为很多的产品经理，在长期的工作过程中，他形成了一套自我的认知，觉得应该怎么去跟你讲这个话，应该怎么去向你描述这个功能，但实际上普通人根本看不懂。这个是非常非常常见的情况。</p>



<p class="wp-block-paragraph">而且呢，这些后台还都必须要登录。云计算后台也好，银行的后台也好，包括保险公司，或者这种复杂业务系统的后台，你都需要登录。你交给别人去替你操作呢，分分钟上当受骗的这种感觉，所以又不太可能交给别人。这就是一个很痛苦的过程。</p>



<p class="wp-block-paragraph">现在的问题解决了。我自己呢就做一个Cloudflare的一个案例。我前几天呢，听说Cloudflare上有一个功能，叫做“管道功能”，可以让我们在内网上把一些服务公开到外网上去。但是呢，整个的操作过程很复杂，也是问ChatGPT，给了你一个小作文，告诉你第一步怎么办，第二步怎么样。而且呢，ChatGPT给的小作文呢，都是按照英文菜单给的，我的Cloudflare进去以后是个中文菜单，对不上。所以我看了几次以后就放弃了。</p>



<p class="wp-block-paragraph">有了这样的功能，说我试一下呗。登到Cloudflare上去，我就打开了这个Agent模式，我说：“来，我现在要干这样的一个事情，给我干去吧。”然后你就看着它右侧是你的聊天栏，左侧你浏览器的这个主要空间里头，就蒙上了一层灰色的，这种或叫蓝灰色的薄膜似的东西，在那闪动。就看着他点东西、填表格，一项一项菜单地点进去，就把这事干完了。基本上不需要我参与，就把整个的这些服务都开好、定好，也不用我付费，把这个事情就解决了。我现在已经把自己NAS上的一些服务公开到公网上去，当然也只有我自己登录了才能使，大家就别费劲了。</p>



<p class="wp-block-paragraph">所以再遇到这种复杂的、需要操作的东西，就可以直接搞定了。我并不认为这个你可以现在就拿它去，比如定吃的东西，去做什么西红柿炒鸡蛋，或者做几人份的什么什么菜，这个可能还稍微远了一点点。但是当你遇到这种很复杂的、自己搞不明白的后台页面的时候，你交给他，效果可好了。</p>



<p class="wp-block-paragraph">当然这东西呢，也不是万能的。第一个是这东西有次数限制，这个是让我很郁闷的，不是可以无限使用的。因为原来ChatGPT Agent就是有次数限制的，我是Plus用户嘛，每周使40次。这个功能免费用户是没有的，但是如果你把它设成默认浏览器，它会给你7天的试用会员，估计到那个时候你就直接投降了，一个月交20美金就从了，也算是一个小小的诡计吧。</p>



<p class="wp-block-paragraph">原来呢，我们使用的Agent是在OpenAI的服务器上去开虚拟机，你对于它来说是有很沉重的压力的，甭管是内存压力、算力压力，还是说各种的安全相关的压力，这些压力是很大的。现在的话，它在我本机跑，在我自己的浏览器里边开了个窗口，在这去跑虚拟机的话，他居然还是走的原来的这套记次数的方式，还是一周40次，这个让我觉得挺诧异的。但是现在呢，有的时候这个次数会出来，有的时候次数出不来，所以我现在也没有太搞清楚这次数到底是怎么做的。</p>



<p class="wp-block-paragraph">我也问了ChatGPT，他说我们现在确实依然在记这个次数。他说：“你提的问题也是很有道理的，我们也在看以后如何去调整这个次数的限制。”可能以后呢，OpenAI会推出这种叫“边缘Agent”，就是在你本地跑的这个Agent，会单独去计数，而不是去跟服务器上的Agent一起来计数。但是呢，他提醒我什么呢？他说即使是在你本机跑的Agent，它使用的TOKEN的量都是很大的。因为它需要把整个的网页抓下来，而且这个网页并不是说我们看到的这部分，因为有些人觉得我看到这部分，剩下一部分在这个浏览器的外面，你需要滚动它，它不是这样的。它是通过这个浏览器里边，这个网页的源文件，甭管是多少，需要滚动多少，它一把都抓出来，它这个消耗的TOKEN的量还是很大的。所以他说，即使是给你开了边缘Agent的次数，也还是会有限制的，不会让你无限制地使下去的。</p>



<p class="wp-block-paragraph">下一个问题呢，就是太复杂、太细节的操作，这个Agent模式是搞不定的。在有人尝试呢，使用Agent在Figma网页上画画，画这个火影忍者的“血轮眼”。血轮眼长什么样？一个红色的圆圈，应该是你的眼球；中间呢，是一个白色的瞳孔，就是里面有一个小圈；再往外呢，是三个小黑点，黑点后边有水滴状的尾部，它会在这个里头转。它要求ChatGPT Agent去给它画这个玩意儿，因为想要考验一下他对细节的把控能力。</p>



<p class="wp-block-paragraph">ChatGPT呢，把外边这个红色的圆圈画了，把中间这个白色的小圆圈也画了。应该是等分的三个小黑点呢，他画了两个，第三个呢也画上了，但是呢不是等分了，就画歪了。再往后的火焰也好，或者水滴也好，尾巴就没了。所以大家感觉是什么？太细节搞不定。而且呢，太复杂、太长的Agent流程，他也搞不定。这点还证明一个什么？就是ChatGPT是知道血轮眼是什么的，他能够理解你让他去干什么，只是呢这个没有很好地完成。</p>



<p class="wp-block-paragraph">我自己呢也尝试让Atlas的Agent去格式化我的博客文章，因为我的博客文章一般都比较长，都是拿演讲稿直接去改的，它没有中间的分段，什么标题都没有，阅读的体验不是很好。所以我说：“你去给我加个标题，做一些缩进，做一些段落的设置。”他就真的很努力地在WordPress后台去干活去了。但是呢，干到一半他退出来了。因为那文章比较长，大概有五六千字，他大概处理了我觉得有2000字到3000字左右吧，就退出来了。这一块呢，应该还有待提升和加强。我看今天好像Atlas已经迎来了第一次升级，这种产品都是会快速地迭代和升级的，希望它能够处理更复杂、更长的这些Agent的请求。</p>



<p class="wp-block-paragraph">我现在呢，开始使用ChatGPT Atlas，已经不是说在我的电脑上主要使用Chrome了。原因也很简单，因为它整体的稳定性和性能还是不错的。虽然它底层都是Chrome的底层，但是它毕竟轻嘛，它有好多的功能给你屏蔽了，没有了，所以它整体感觉使用上性能还是不错的，也比较稳定。你像在这一点上呢，豆包就差一些。我曾经尝试使用了大概三五天的豆包作为主要浏览器，但是发现有些网页打不开，或者打开了以后显示的有问题，我就放弃了，还是转回了Chrome。在这一点上的话，OpenAI做得还是不错的，它呢挖了Chrome底层的核心开发人员回来，这是有效果的。</p>



<p class="wp-block-paragraph">但是我目前为止，还没有将它设置成默认浏览器。就如果你原来没有付过费，不是ChatGPT的付费会员，你设成默认浏览器以后，它让你使7天会员。像我这种原来就是Plus会员了，我再把它设成默认浏览器呢，它现在告诉我说可以增加使用额度。我现在还在犹豫，我为什么还没有去换这个默认浏览器？因为也有一些地方做得不够好。</p>



<p class="wp-block-paragraph">很多地方被人吐槽，Atlas被吐槽的地方都是什么呢？</p>



<p class="wp-block-paragraph">第一个是只有Mac版。刚才讲了，Mac是一致性最好的、最安全的、算力最有保障的平台，所以他们先做Mac版是最不容易翻车的。</p>



<p class="wp-block-paragraph">第二个被吐槽比较多的地方是什么呢？就是Atlas里头是没有插件的。Chrome实际上是有插件市场，你可以去往里装插件。Atlas呢，它自己没有插件市场，但是它可以去通过Chrome的插件市场往里装插件。装完了以后呢，这些插件又没有地方显示。你Chrome装完插件以后，在Chrome的工具栏右侧，会有一个显示插件的地方。在这个Atlas里头，你装完插件以后，有些插件呢会漂浮在页面上，半透明地飘在上头，也挺难看的，而且我现在都不知道应该怎么把这东西删掉，因为它没有插件的菜单，也没有可删的地方。有些插件你装上去以后呢，它就不显示，你也不知道该怎么激活它。</p>



<p class="wp-block-paragraph">这个里头让我觉得最痛苦的是什么呢？有一个插件叫1Password，我大量的网站密码，还有包括登录辅助都在这上面，它这个插件是显示不出来的，也无法激活，所以我很多的网站登录就很痛苦。这个事为什么这么做呢？因为插件的很多行为是需要联网的，直接跟后台去沟通和交流的。对于像Atlas这样留存了用户浏览记录，还要拿这些浏览记录去进行分析和使用的平台来说，这种安全设置是不可接受的。因为一旦是让这些插件上网了的话，可能你的所有浏览记录就直接被拎走了，这个是很危险的。所以它是不允许插件的。这个Chrome插件，也算是一条充满辛酸泪的细分赛道。当时Chrome出插件市场的时候，很多人说安卓的下一代的应用市场出来了，我们要在里边去深耕。我们以前的公司也在里边做了很多的产品，后来发现压根不挣钱，很多人做了半天没挣出钱来。现在呢，Atlas就准备把这个东西彻底抛弃掉了，就不玩了。</p>



<p class="wp-block-paragraph">还有一个被吐槽的呢，就是很多的开发者相关的功能被关闭了。大家知道，Chrome底层是有一整套的开发功能的，我们可以去调试前端网页。我觉得应该也是因为安全性的原因，把它们有一些阉割掉了，有一些关闭了。像OpenAI这种产品的话，它一定是有一些系统提示词在里面，就是OpenAI自己写的提示词在里面。你上我这天天调来调去的，你把我这个底裤都扒干净了怎么办？我并不想把这个系统提示词给你看，或者让你随便去修改我的系统提示词，那么它就关闭了一些开发和调试的功能。</p>



<p class="wp-block-paragraph">那么，Atlas真正的对行业的意义是什么呢？就像咱们标题讲的，它真正的意义是指明了方向。那它到底指明了一个什么方向？</p>



<p class="wp-block-paragraph">首先，浏览器是大家寄予厚望的一个AI的应用场景。因为我们不可能让AI全知全能，一定是要靠全世界这么多网站、这么多内容来跟AI一起结合工作，才能够达到更好的效果。所以大家都要去做浏览器。但是浏览器呢，是一种很特殊的产品。大家想一想，这个浏览器怎么奇怪了？《道德经》里边有一段，我觉得讲这个很合适，叫：</p>



<p class="wp-block-paragraph">“三十辐共一毂，当其无，有车之用。埏埴以为器，当其无，有器之用。凿户牖以为室，当其无，有室之用。故有之以为利，无之以为用。”</p>



<p class="wp-block-paragraph">这话什么意思呢？就是30个车条装在一个车轮里，因为中间有空，所以呢这个车才能使它。泥巴捏出这个器具来，中间是空的，因为中间是空的，你才有这个罐子呀、才有这些器具可以用。凿了门和窗户，因为中间是空的，你才有屋子才能用。你说我这是一池塘了，你就没有屋子用。所以呢，“有”呢是必须要的，甭管是车轮还是泥巴，还是屋子，你必须要有这个“有”的部分，而大家用的东西呢，是这个“空”的这一块。这就是《道德经》上讲的这一部分。</p>



<p class="wp-block-paragraph">浏览器的核心，实际上是中间那一大块空白，你要在那个地方去装网页，你在其他地方放太多功能的话，就容易喧宾夺主。所以这就是有无之道。</p>



<p class="wp-block-paragraph">咱们对比一下现在这些产品。谷歌呢，有一些太保守了，它基本上就是一个传统浏览器，所有的这些功能呢，都给你反正不是做得那么显眼。它也怕我做得太显眼了以后，或者做得太喧宾夺主了以后，用户会流失。因为对于它来说，用户已经不可能上涨了，再出任何的问题，用户都会流失的。如果某些特定的功能做得特别突出，用户规模肯定起不来。你比如说像Perplexity的这个叫Comet这样的一个浏览器，它呢就是在搜索、验证、研究这一块做得非常非常强，这就基本上是给学生或者是一些科研人员使的，普通人用不了这东西。而对于像ARC，它呢就属于是极大地改变了用户行为习惯，人家原来都习惯这么去用，你非要给人改一个不一样的，就很难推广开。</p>



<p class="wp-block-paragraph">国内的豆包跟夸克呢，完全是画蛇添足的感觉，很多乱七八糟功能都给它堆着，功能极其杂乱。视频加字幕、视频总结、文本总结，它给了你好多好多这样的功能在里头，各种奇奇怪怪的功能都加上。而且呢，还要抢这个露出位置，因为他人多嘛，每一个项目可能都是一个小团队，一堆人在那开发，开发完了以后，你的KPI就是有多少人用。那怎么有人用呢？你给我一个位置让我露个小脸，才能有人用。所以他们那个产品就显得很杂乱。</p>



<p class="wp-block-paragraph">而Atlas呢，还算是一款比较优雅的AI IDE，适合大众使用。它要比谷歌的Chrome要更AI一点点，但是呢也没有像豆包搞得那么乱七八糟的。比Perplexity和ARC这样的这种浏览器呢，也要稍微的平和一些，优雅一些。</p>



<p class="wp-block-paragraph">而Atlas真正的价值，在于记忆模式和Agent模式。现在我相信甭管是夸克、豆包，还有国内各平台应该都在追赶了。国外的话，Perplexity他们可能也会向这个方向前进，但是呢并没有那么容易。Atlas的其他的这些功能呢，豆包其实都有，只是摆放得比较丑而已，甚至豆包的功能要比Atlas要丰富好多倍。但是记忆功能呢，现在豆包跟千问（或者叫夸克吧）都在往里加，只是呢，记忆的隐私悖论实在太严重了。因为你一旦把过去所有浏览的页面都记下来了，你在回答问题的时候都是根据过去的页面来去给你回答的，这个太容易出事了。后边估计会有一些倒霉蛋“社死”。比如说你浏览了一些像草榴社区这样的网站，还看得很开心，你去做正经事，说：“来，根据我过去几天看的科学文献，给我总结点什么事。”他没准就把草榴里的东西给你总结进去了。所以这个大家以后使用的时候，还是要稍微小心一点。我呢现在毕竟用的时间短，也不怎么看这些很奇怪的网站，而且我现在的这个默认浏览器还是Chrome，这一块我还是比较谨慎的。</p>



<p class="wp-block-paragraph">至于Agent模式呢，其实非常考验前端和浏览器内核底层的功底。你技术不达标的话，做Agent的模式会作死的。因为这个网页千变万化，而且写网页的人的技术水平和使用习惯也是千差万别。在这样的一个情况下，你希望在所有的网页上都可以顺畅地去执行，这个还是挺考验功夫的。当然在中国人这一块呢，应该是可以快速赶上。因为中国人有一个笨办法。美国人，比如OpenAI，他们使用的方式是什么呢？我用最好的浏览器内核的人员，用最好的能够掌握这些前端技术标准的人员，你们坐在这，给我去写这个Agent的代码，然后就可以了。但是有的时候跑不出来呢，我们直接就放弃就拉倒了。因为网页这种东西经常会被更新嘛，更新了以后，原来能跑，这次就未必能跑得通了。所以跑Agent就是一定会面临很多问题。而中国人的处理方式是个笨办法：把所有常用网站都跑一遍，然后把它记下来，大概应该怎么用。是这么来去做这个事情。然后我们会不断地去收集用户在不同的网站上，或者在不同的应用上是怎么去工作的，它每一个应用和网站的这个行为都把它记下来，每一次升级，我们也都把它记下来，分不同版本的。中国人是可以用笨办法来搞定这件事的，但是压力会稍微大一些。</p>



<p class="wp-block-paragraph">未来那些“不说人话的产品经理”设计出来的复杂后台，对于普通人也会变得稍微友好一点儿。</p>



<p class="wp-block-paragraph">而新的商业模式、新的交易应该就在记忆和Agent里面。你像我用Agent，其实是做了一大堆的复杂后台使用，而OpenAI给大家演示什么？去买东西去了。买东西就说明它可以去引导交易了，他可以决定买张家的，不买李家的。那么为什么买张家的不买李家的？给钱，你要去花钱买广告的。所以这个就是新的商业模式。而记忆更是新的商业模式里头最重要的一点，因为它是根据记忆来去决定买张家的还是买李家的。当然另外一块还是要给钱的。你是一个喜欢吃素的人，那我下次就给你买素食；你喜欢什么什么样的品牌，那这个品牌跟那个差不多，我就给你推荐新的，还便宜一些，这个花钱买广告不就管用了吗？所以这就是新商业模式的一个雏形了。</p>



<p class="wp-block-paragraph">最后总结一下，OpenAI作为老大需要做的事情，就是为行业指明方向。现在国内的厂商肯定会追，国外的厂商应该也会追，但是可能没有咱们追得那么快。谷歌后边的日子绝对不好过，虽然方向指明了，他想去抄但是没有那么容易，他的包袱实在太重了，转身非常非常困难。</p>



<p class="wp-block-paragraph">对于普通用户来说，如果有M系列芯片的Mac电脑，就赶快玩耍起来吧，其他的并没有那么重要。</p>



<p class="wp-block-paragraph">好，这个故事就跟大家讲到这里，感谢大家收听。请帮忙点赞、点小铃铛、参加<a href="https://discord.gg/ppKsNkttTv" target="_blank" rel="noopener">DISCORD讨论群</a>，也欢迎有兴趣、有能力的朋友加入我们的<a href="https://www.youtube.com/channel/UCUGLhcs3-3y_yhZZsgRzrzw/join" target="_blank" rel="noopener">付费频道</a>。再见！</p>
]]></content:encoded>
					
		
		
			</item>
	</channel>
</rss>
