<?xml version="1.0" encoding="UTF-8"?><rss version="2.0"
	xmlns:content="http://purl.org/rss/1.0/modules/content/"
	xmlns:wfw="http://wellformedweb.org/CommentAPI/"
	xmlns:dc="http://purl.org/dc/elements/1.1/"
	xmlns:atom="http://www.w3.org/2005/Atom"
	xmlns:sy="http://purl.org/rss/1.0/modules/syndication/"
	xmlns:slash="http://purl.org/rss/1.0/modules/slash/"
	>

<channel>
	<title>PPT生成 &#8211; 老范讲故事｜AI、大模型与商业世界的故事</title>
	<atom:link href="https://lukefan.com/tag/ppt%e7%94%9f%e6%88%90/feed/" rel="self" type="application/rss+xml" />
	<link>https://lukefan.com</link>
	<description>这里是老范讲故事的主站，持续更新 AIGC、大模型、互联网平台、商业冲突与资本市场观察，帮你看清热点背后的底层逻辑。</description>
	<lastBuildDate>Sun, 20 Jul 2025 00:41:30 +0000</lastBuildDate>
	<language>zh-Hans</language>
	<sy:updatePeriod>
	hourly	</sy:updatePeriod>
	<sy:updateFrequency>
	1	</sy:updateFrequency>
	<generator>https://wordpress.org/?v=6.9.4</generator>

<image>
	<url>https://lukefan.com/wp-content/uploads/2026/03/cropped-jimeng-2026-02-28-5245-用图一的人物形象，替换图二中的人物，使用图二的风格。文字替换：老范讲故事，Yo-32x32.jpeg</url>
	<title>PPT生成 &#8211; 老范讲故事｜AI、大模型与商业世界的故事</title>
	<link>https://lukefan.com</link>
	<width>32</width>
	<height>32</height>
</image> 
	<item>
		<title>ChatGPT Agent重磅发布，山姆奥特曼亲自站台却惨遭现场翻车，这究竟是Manus的机遇还是整个泛Agent赛道的丧钟？</title>
		<link>https://lukefan.com/2025/07/20/chatgpt-agent%e9%87%8d%e7%a3%85%e5%8f%91%e5%b8%83%ef%bc%8c%e5%b1%b1%e5%a7%86%e5%a5%a5%e7%89%b9%e6%9b%bc%e4%ba%b2%e8%87%aa%e7%ab%99%e5%8f%b0%e5%8d%b4%e6%83%a8%e9%81%ad%e7%8e%b0%e5%9c%ba%e7%bf%bb/</link>
		
		<dc:creator><![CDATA[Luke Fan]]></dc:creator>
		<pubDate>Sun, 20 Jul 2025 00:41:29 +0000</pubDate>
				<category><![CDATA[AIGC]]></category>
		<category><![CDATA[AGI]]></category>
		<category><![CDATA[AI Agent]]></category>
		<category><![CDATA[AI创业]]></category>
		<category><![CDATA[AI行业分析]]></category>
		<category><![CDATA[API]]></category>
		<category><![CDATA[ChatGPT Agent]]></category>
		<category><![CDATA[Deep Research]]></category>
		<category><![CDATA[Manus]]></category>
		<category><![CDATA[OpenAI]]></category>
		<category><![CDATA[OpenAI发布会]]></category>
		<category><![CDATA[Operator]]></category>
		<category><![CDATA[PPT生成]]></category>
		<category><![CDATA[Sam Altman]]></category>
		<category><![CDATA[SDK]]></category>
		<category><![CDATA[TOKEN成本]]></category>
		<category><![CDATA[YouTube频道]]></category>
		<category><![CDATA[二次验证]]></category>
		<category><![CDATA[产品评测]]></category>
		<category><![CDATA[人工智能]]></category>
		<category><![CDATA[人工智能代理]]></category>
		<category><![CDATA[任务打断]]></category>
		<category><![CDATA[创业公司危机]]></category>
		<category><![CDATA[商业模式]]></category>
		<category><![CDATA[技术前沿]]></category>
		<category><![CDATA[技术局限]]></category>
		<category><![CDATA[数据分析]]></category>
		<category><![CDATA[未来科技]]></category>
		<category><![CDATA[模型即应用]]></category>
		<category><![CDATA[沙盒]]></category>
		<category><![CDATA[浏览器模拟]]></category>
		<category><![CDATA[演示翻车]]></category>
		<category><![CDATA[生产力工具]]></category>
		<category><![CDATA[用户体验]]></category>
		<category><![CDATA[科技评论]]></category>
		<category><![CDATA[竞品分析]]></category>
		<category><![CDATA[老范讲故事]]></category>
		<category><![CDATA[自动化任务]]></category>
		<category><![CDATA[自动化流程]]></category>
		<category><![CDATA[虚拟机]]></category>
		<category><![CDATA[跨设备同步]]></category>
		<category><![CDATA[连接器]]></category>
		<category><![CDATA[长链路任务]]></category>
		<guid isPermaLink="false">https://lukefan.com/?p=2406</guid>

					<description><![CDATA[救命啊！！家人们真的要看这个史诗级抓马现场😱
OpenAI的智能体居然被订票网站吊打！！！
（本宫已经反复拉进度条笑出八块腹肌hhh）

🎯重点先说：
GPT智能体发布新功能本来要封神👉
结果现场上演墨西哥湾神秘棒球场事件！！
奥特曼强行挽尊的样子像极了甲方对接人🤦♀

💣史诗级翻车实录：
当智能体要预定30个棒球场门票时
✨前半段：帅气抓取数据生成地图
💥后半段：把纽约波士顿的球场全扔进墨西哥湾！！！
更绝的是订票卡在二次验证环节👇
系统：等您60秒回我验证码哦~
智能体：对方已挂断（疯狂弹出红字报错）

🆘笑疯全网名场面：
台下憋笑憋到面部扭曲
奥特曼紧急救场说"之后修bug"
（翻译：本程序员今晚别想下班了）

💼创业公司生死局：
1️⃣ OpenAI用钞能力硬砸智能体（每月可用400次！！）
2️⃣ 每次任务耗费天价算力（普通公司根本烧不起）
3️⃣ 最绝的是演示证明这赛道压根不靠谱！！！
（连亲儿子都hold不住浏览器操作）

👉结论亮瞎眼：
OpenAI这波等于官宣👉
"泛用型智能体暂时没搞头！友商别送人头了"
（建议Manus转行教AI避坑指南🙏）

————————————
姐妹们觉得这波GPT智能体表现打几分？
本宫已经连夜囤了十包瓜子等续集了hhh！
（坐等智能体下次表演买鞋翻车秀🛒）

ChatGPT Agent重磅发布，山姆奥特曼亲自站台却惨遭现场翻车，这究竟是Manus的机遇还是整个泛Agent赛道的丧钟？

OpenAI在Sam Altman亲自坐镇下，重磅发布了最新的ChatGPT Agent，然而，一场尴尬的现场翻车事件，让人们不禁为Manus的未来捏了一把汗。这款集成了Operator网页交互与Deep Research深度分析能力的智能体，虽然展示了强大的跨应用任务处理能力，但其依赖模拟浏览器点击的模式，在面对二次验证等现实问题时显得力不从心。这不仅暴露了当前泛Agent赛道的技术瓶颈，更揭示了一个残酷的商业现实：高昂的TOKEN成本。OpenAI可以凭借自有模型优势承担亏损，但对于依赖外部模型的Manus而言，这无异于被釜底抽薪，其商业模式将难以为继。因此，ChatGPT Agent的发布，与其说是对Manus的直接打击，不如说是为整个泛Agent赛道划定了天花板，证实了这条技术路径的局限与高昂代价。]]></description>
										<content:encoded><![CDATA[
<figure class="wp-block-embed is-type-video is-provider-youtube wp-block-embed-youtube wp-embed-aspect-16-9 wp-has-aspect-ratio"><div class="wp-block-embed__wrapper">
<iframe title="ChatGPT Agent重磅发布，山姆奥特曼亲自站台却惨遭现场翻车，这究竟是Manus的机遇还是整个泛Agent赛道的丧钟？" width="900" height="506" src="https://www.youtube.com/embed/BiVSfZWJEmA?feature=oembed" frameborder="0" allow="accelerometer; autoplay; clipboard-write; encrypted-media; gyroscope; picture-in-picture; web-share" referrerpolicy="strict-origin-when-cross-origin" allowfullscreen></iframe>
</div></figure>



<p>ChatGPT Agent来了。</p>



<p>Manus到底是该哭还是该笑呢？</p>



<p>大家好，欢迎收听<a href="https://youtube.com/@StoryTellerFan" target="_blank" rel="noopener">老范讲故事的YouTube频道</a>。</p>



<p>ChatGPT重磅发布了他的Agent。怎么个重磅法？山姆·奥特曼亲自坐台。现在很多ChatGPT自己产品的发布，山姆·奥特曼都不在前台坐着，这次是亲自坐台。而且旁边坐了四位主讲，很多时候发布会就是俩人或者仨人，这次是山姆·奥特曼坐在这，旁边坐了四个人。而且呢，足足讲了25分钟。</p>



<p>很多人就想起Manus来了，好像有些测试还不如Manus。因为他现场有翻车的，大老板在旁边坐着，你测试翻车的话还是压力挺大的。在这个时候就有人说了，GPT也就这样，你们现在还觉得Manus做的不好吗？就有一些讨论在发生了。</p>



<span id="more-2406"></span>



<p>ChatGPT的Agent到底会给Manus带来什么呢？Manus到底是该哭还是该笑呢？今天咱们讲讲这个事儿。</p>



<p>首先呢，咱们先回顾一下GPT Agent的一个发布过程。时间呢是太平洋时间2025年7月17号上午10点，也就是北京时间7月18号的凌晨1点。山姆·奥特曼坐在最边上，他不是主讲，他就是一个串场的。另外一头呢坐着一个印度老哥，中间呢是三个亚洲脸，两位男士呢应该确认是中国人，还有一位女士呢，虽然看起来是亚洲脸，但是是不是华人不知道。</p>



<p>25分钟的视频演示也很无奈，他这种演示你没法短，因为很多的任务，跑起来的时间就非常长，特别是婚礼差旅一条龙的。这个任务基本上是从头跑到尾，就是一开始布置任务下去，中间穿插了几个其他任务，最后到那个结束的时候，算是差不多跑完。</p>



<p>让Agent去帮忙参加朋友婚礼，挑酒店、挑礼物、定穿搭，中间还打断他说，我还要再买双鞋。这个其实挺好玩的，因为以前这种Agent，最讨厌的一点是什么呢？就是你只要让他开始跑，半个小时或者多长时间，你没法打断他，发现他错了以后呢你也没办法，只能让他重新开始。现在呢，我说我可以打断你，或者中间可以把你叫停，让你去帮我调整一些东西，加一双鞋或者做一些其他的。这个呢，算是一个，我觉得算是用户体验角度上的一个比较大的前进吧。</p>



<p>从技术角度上来说呢，并没有那么费劲。只是呢，在Agent的执行框架上需要做一些调整，你比如说多线程，或者是一些守护线程，他需要做一些这样的东西。在大家做了这么长时间的手机应用、前端后端应用以后，这个不是那么费劲的。</p>



<p>手机端呢，也可以进行即时的创意，也就是在iPhone上请求制作团队吉祥物贴纸，就是做了一些可以做设计的任务。这个应该是对着像LoveArt这种设计Agent去的。然后呢，做了一个财务数据分析，他讲的是去我的Google Drive上，把评估指标拉出来，给我做一个汇报。幻灯片还做的可以吧。</p>



<p>后面就是演示了随时打断和二次确认，在Agent里头点击打断，可以进行指令修改，Agent结束前弹窗确认邮件内容。但是呢，在现场还失败了一个，找球场这个是一个失败演示。</p>



<p>他干了一什么呢？规划一场夏季旅行，走遍30座职业棒球球场，并给每座球场买两张最便宜的日场票。给了他这样的一个任务。一开始呢，是先用文本浏览器，抓取了2025年赛程和票价，到这呢数据还是正常的。然后是通过脚本去终端执行，通过终端去执行脚本，生成Excel和绘制地图。但是呢，这儿就开始出错了，地图坐标严重错位，纽约、波士顿等东海岸的球队就没了，墨西哥湾里头凭空出现了一些球场，引起场下的一些窃笑了。</p>



<p>再往后呢，是用可视化浏览器，跳转到一个订票网站上，要去下单订票了。但是呢，因为这是一个跟金融和这种高风险相关的操作，所以呢进入了人工模式，就是你必须要确认一下要花钱了吗。然后就遇到了一个问题，Agent自动去填邮箱了以后呢，它网站需要跳这个叫二次验证，二次验证，就比如说我给你发个邮件，你给把这个邮件里头那个码给我呀，或者是给你发个短信，就是这种验证程序。这个Agent就跑不动了，他呢触发了订票网站等待用户的一个进程，要求你60秒钟之内呢要去接管，结果呢他也没有好好的接管这个东西，就直接超时终止了。这个稍微有些丢人，还跳出了红色的长串错误信息，反正现场就有点绷不住了。主持人呢只能尴尬收场，这个主持人是谁？山姆·奥特曼。他呢出来打了个圆场，说买票这步我们之后会在debug的。这是整场直播唯一强制终止的一个demo。</p>



<p>最新的ChatGPT Agent到底有哪些新特性呢？第一个呢，它是Operator加上Deep Research，这两个功能加一块的东西。Operator其实应该是今年年初的时候发布过一次，所谓Operator，就是在一个虚拟机上打开浏览器，给大家去做各种的操作，模仿真人去点击各种的网页。但是呢，这个功能呢，一直是在200美金的用户那里使用，像我这种20美金的用户是没使过的。而且即使是200美金的用户呢，应该对这个功能也不太感冒，因为你要去使用互联网的网站的话，难度还是很大的。</p>



<p>咱们做各种软件里头，最难做的一个软件不是操作系统，而是浏览器。为什么？因为每家做的网站都不一样，我到底用的是谁家的前端库后端库，在里边隐藏了哪些信息，怎么去做的缓存，做了哪些防刷以及防骗的这种工具，做了哪些多次验证的东西，这个真的是千奇百怪的。所以你要想完全兼容这种东西是很难的，你让一个机器人去点网页，成功率还是不太高的。所以这个产品虽然发布了，但是大家使得并不是那么爽。</p>



<p>现在说Deep Research这功能做的还不错了，那跟Operator两个功能结合起来，就是这一次我们所看到的GPT Agent。这俩功能呢，Operator我从来没用过，Deep Research呢是我经常用，而且经常把额度跑光，需要等到下边一个时间周期，重新分配额度接着跑的一个功能。</p>



<p>它呢是由一台虚拟化电脑，就还是Operator这套东西里头呢，内置了图形界面浏览器和文本浏览器。什么叫图形界面浏览器？就是我真的打开了一个网页，这边是有按钮的，那边是有输入框的有菜单的，这种浏览器呢叫做图形界面浏览器。而文本浏览器的话基本上就是，我把你这个网页抓出来了，直接把里头的内容呢进行了总结归纳，或者说把里头的内容直接提出来了。他们在这个里头是两个都有，大部分情况，你说我只需要进行信息总结的话，就是文本浏览器就够了。实际上文本浏览器大家可以理解为一个爬虫。图像浏览器的话其实，对于这种虚拟机来说是难度很大的。为什么？因为我们写网站的时候，还经常会去研究，比如说设备的自动适配，就是我在手机上，这个网页应该长成啥样，在平板上应该长成啥样，在PC上应该长成啥样，遇到特别大的浏览器应该长成啥样，这个都是不一样的。还有一些比如说我们有些网站上，会写这种不可见的字符，干嘛呢？骗AI的，说你遇到我这个网站就不能爬了，或者说不能做一些其他的工作。还有很多这样的东西。</p>



<p>另外呢，上浏览器的呢，其实还有一点小的问题，大家知道网站上有一个文件叫robots.txt，这个文件干嘛使的？实际上是应对爬虫的，告诉你说哪个爬虫你可以看哪些东西，不可以看哪些东西。而你一旦上浏览器了，Robots这个文件实际上就不起作用了。</p>



<p>那它这个一体化的虚拟电脑，除了图形化浏览器和文本浏览器之外，还有什么呢？还有终端，你可以在上面去跑一些程序，以及API连接器，包括一些模型，都在同一个沙盒里边完成。点击键入运行代码，调用Gmail、Calendar等等这些操作。为什么叫沙盒呢？就是这个盒里头出错了，其他的盒不影响。这个呢，就是这一次的ChatGPT Agent最核心的东西，就是一体化虚拟电脑。</p>



<p>另外呢，就是它可以自动的选择工具，跨步骤的自主执行，将Operator网页交互，加上Deep Research的深度分析，整合在一个流程里边。Agent自行决定何时调用浏览器，何时跑脚本，无需用户指定。这一块呢，确实是做的相当不错的，因为他演示的时候，几个很长的案例中间呢并没有出错，一直在往前走。因为让他去干这种活最怕什么？就中间出错了，中间出错了以后，可能跑非常非常多的TOKEN，而且在里边死循环，都是有可能，你可能早上一起来破产了。这个TOKEN是很贵的。</p>



<p>长链路任务加上时间轴回放，也是一个挺好玩的东西，就是你的一个任务跑完了以后，他们最后是像放这个视频一样去看，说跑了几十分钟很多步骤的工作，第几步跑成什么样了。为什么要看这个呢？就是你中间万一跑错了，或者说这个结果跟我想的不太一样，你可以看看哪错了，让他再去进行调整。否则的话，就是前头下了命令，中间不可干预，然后直接就结束了，你还没法看中间哪错了，你连改进的机会都没有。所以这个呢，也算是一个改进吧。</p>



<p>再往后呢，是它的任务是可以暂停继续和打断的，也算是在用户体验上做了很大的提升吧。当然了，可以打断可以暂停那件事呢，说明另外一个问题，就是这种任务周期很长，而且呢结果经常不可控。实际上它算是个缺陷吧，为了给这个缺陷打个补丁，所以加上这样的功能。</p>



<p>ChatGPT Agent呢，还有一些其他的功能，比如说叫Watch Mode观察模式，以及这种二次确认。为什么呢？就是涉及付款发信这种高后果或者叫高风险的行动，会自动的进入这种叫Watch Mode，用户呢需要保持焦点，并且手动确认，否则的话流程就会超时终止。这个还是不敢直接替你花钱买东西，还要看后边怎么去改进吧。</p>



<p>端到端的成果交付，可以直接生成可编辑的PPT、Excel、PDF等文件。这个算是对标Manus，或者是对标其他人做的Agent，现在大家都是有这功能，所以这一次ChatGPT的Agent也把这功能给你做上来了。他做的PPT还没有Manus做的好看呢。</p>



<p>那另外就是跨设备的无缝切换，专门给大家演示了iOS安卓设备上，你也可以看看，你这个项目跑到多少了，你这个项目跑到什么状态了。像我平时用Deep Research的时候也是这样，我在电脑上说我现在要Deep Research了，然后我的手机上就会弹出来说，你有一个Deep Research的工作开始跑了，跑到什么样状态有个进度条，跑完了以后，他会告诉你说你这个结束了，你去看看结果是不是OK。因为Deep Research一次的话，有的时候长的也要10分钟，快的可能是五六分钟，也能跑出来。你不可能说我这边打了回车以后一直坐这等，还是要去做其他事情的。</p>



<p>这次呢，把ChatGPT的连接器和计划任务呢，也都整进来了。可以通过官方的ChatGPT的Connectors，叫连接器，直接呢连接Gmail、GitHub、Google Drive这些服务。也可以将一次性任务，保持为定期的自动执行任务，比如每周干一什么事，这个现在都是允许的。</p>



<p>然后多层的安全站，它既然已经这么强大了，你可以干各种各样事情了，你要注意，你不要去做一些危害人类的事情，所以OpenAI还是有一点点小底线的吧。也面向开发者呢提供了Agent SDK和API，但是这一块呢，现在应该还是一个预览版吧，我反正没有看到谁去用这个东西。</p>



<p>性能呢，全面的跃升，它去解决各种人类实际问题的评分这块是上升了。这个呢，就是ChatGPT Agent的一个基本特性。</p>



<p>谁能用呢？我还没用上。Pro用户就是200美元的用户，现在已经可以用了，每个月呢可以用400次。这玩意肯定不能让你随便使，因为实在是太耗TOKEN了。Plus用户，就像我这样20美元用户呢，每个月可以使用40次，其实基本也够用。像我现在，用Deep Research我觉得一天用不了一次，但是还是经常把额度跑光。现在Plus用户呢，应该是未来三天进行灰度推送，但是还没轮到我，哈哈，再继续等待。</p>



<p>我自己观看演示以后的感受是什么样的？第一个是产品确实非常强大，能把这么复杂的任务，自己把它分配好，顺序的执行下来中间不乱，这个已经非常非常难了。另外第二个是什么呢？大概率是不会去用的。为什么呢？前面刚夸完人家这个很强大，你咋就不用呢？因为它的结果依然是不太可控的。</p>



<p>直接通过模拟浏览器去点击网站，我一直觉得这个方向有毛病。为什么呢？就是每个网站都不一样，而且这个网站上还有各种防刷防骗的东西。比如说吧，有些网站，你通过一个IP地址打开多少次以后，我就直接把你封掉了，把这个IP地址给你封黑了。那你遇到这样的网站你咋办？因为它这个虚拟机，它的IP地址都一样的，它是跑在微软的机房里头的，你通过统一的机房IP，你去访问人家的这个网站去，那你跑着跑着给你封了。</p>



<p>有的时候你需要二次验证，像前面我们讲的一个翻车，需要做二次验证，你也搞不定这个事你咋办？而且像我们比如说注册了很多账号，像谷歌呀、Twitter什么，这些账号我们都是要去做二次验证的，你不做二次验证就很容易被偷嘛。那你一旦做了二次验证以后，虚拟机里边的这个产品，他怎么去做二次验证？他根本就没法搞。还有一些需要去遵循其他的这种约定俗成的东西，你其实也是没有办法去完全的实现的。而且还有时候呢，这些网站自己还会更新，他更新的时候也不通知你，而且更新了以后到底是不是有bug，其实谁也不知道，经常更新出来那个网站是有bug的嘛。</p>



<p>所以呢，你通过这样的一种非常不确定的方式，去连接各种服务的话，到底未来行会变成什么样，到底能不能稳定的去执行任务，我是表示怀疑的。像他这种用仿真浏览器的方式，去执行任务的这种模式呢，更像什么呢？更像是马斯克的纯视觉自动驾驶，说人既然可以搞定，那我用纯视觉的方式车也可以搞定。其他人说我们不太相信这玩意，我们上激光雷达，它更准确。对于我来说，我可能觉得激光雷达会更好一点。</p>



<p>所以呢，未来可能是很多的服务，比如说订球票这些东西，应该是一些经过验证以后的安全的API出来，或者是MCP这样的这种服务出来，然后再由这些AI Agent去调用，才有可能让大家很好的把各种的交易串联起来，而不是说像现在似的，我们在各种的防骗网站中间，去点击鼠标，模拟人类点击，这个还是太不靠谱了。</p>



<p>那么ChatGPT Agent到底给Manus这种泛Agent的项目带来什么呢？最后我们来回答一下这个问题。首先呢，给结论，这个绝对不是好消息，应该算是又敲响了一次丧钟吧。OpenAI每一次发表新的功能呢，都会有很多的创业项目就直接死掉了。这一次呢应该不算直接枪毙，但是绝对不是一个好的声音。</p>



<p>虽然ChatGPT的Agent演示的，跟这个Manus的演示呢，算是各有所长，有些做的好一点，有些做的其实都不怎么样。但其实的结果是什么？ChatGPT也证明了说，这条路最后大概也就能走成这样的一个半半拉拉的样子就完事了。在一个赛道里边，其实不怕老大强大，而怕老大倒下。如果ChatGPT也就只能做成这个样子，那你所有在这个赛道上前进的人，就都比较危险。这是第一个，证明这种范Agent的模式是有问题的。</p>



<p>而且呢，这一次虽然OpenAI演示翻了一次车，但是它也验证了另外一个事情是什么？就是模型及应用，你跑这种Agent是非常非常消耗TOKEN的。OpenAI模型是我们自己家的，我自己可以优化，可以定价可以亏钱，但是对于Manus这样的公司来说，模型是别人家的，你对它进行底层优化的能力就没有，那你需用了这些模型以后，你就得老老实实去按TOKEN付钱，去跑这种Agent的项目，你要去按TOKEN付钱的话，那是会跑破产的。</p>



<p>在结果不那么靠谱的情况下，无法对模型层面进行优化，完全依靠这个外部调用的话，Manus这种项目其实是没有什么机会的。而OpenAI就是另外一回事，反正没那么靠谱，大家就去用就完了。Plus用户一个月44，Pro用户一个月440，你们就用吧。对于OpenAI来说它又不怕亏钱，每年亏个几十亿上百亿，对于它来说都是正常的。但是你Manus你亏得起这个吗？你亏不起的。</p>



<p>所以最终的结论就是，OpenAI的ChatGPT Agent证明了两件事情。第一件事就是，这种泛应用的Agent依然没那么靠谱，就算是OpenAI，也没有办法让这个东西更加靠谱，因为它需要靠模拟人类去点击浏览器的方式去做事情。原来双十一上的时候，也经常是淘宝网站崩了，或者是银行网站崩了，中间需要多做一次验证什么，这种事多去了。所以你现在想让机器去替代人去做点击的话，我觉得这个这条路是有问题的。</p>



<p>第二个是什么？第二个就是从成本的角度来去分析，Manus在这个赛道上它也跑不远。这就是今天咱们讲这故事。感谢大家收听，请帮忙点赞点小铃铛，参加<a href="https://discord.gg/ppKsNkttTv" target="_blank" rel="noopener">DISCORD讨论群</a>，也欢迎有兴趣、有能力的朋友加入我们的<a href="https://www.youtube.com/channel/UCUGLhcs3-3y_yhZZsgRzrzw/join" target="_blank" rel="noopener">付费频道</a>。再见。</p>



<p></p>
]]></content:encoded>
					
		
		
			</item>
		<item>
		<title>Manus独领风骚成过往？字节扣子空间与百度心想APP强势入局，深度评测揭示AI Agent新格局下谁能主导复杂任务自动化与MCP生态。</title>
		<link>https://lukefan.com/2025/04/24/manus%e7%8b%ac%e9%a2%86%e9%a3%8e%e9%aa%9a%e6%88%90%e8%bf%87%e5%be%80%ef%bc%9f%e5%ad%97%e8%8a%82%e6%89%a3%e5%ad%90%e7%a9%ba%e9%97%b4%e4%b8%8e%e7%99%be%e5%ba%a6%e5%bf%83%e6%83%b3app%e5%bc%ba%e5%8a%bf/</link>
		
		<dc:creator><![CDATA[Luke Fan]]></dc:creator>
		<pubDate>Thu, 24 Apr 2025 00:44:49 +0000</pubDate>
				<category><![CDATA[AIGC]]></category>
		<category><![CDATA[字节跳动，故事多]]></category>
		<category><![CDATA[AI Agent]]></category>
		<category><![CDATA[AI应用]]></category>
		<category><![CDATA[AI竞争格局]]></category>
		<category><![CDATA[Anno 1800]]></category>
		<category><![CDATA[Anthropic]]></category>
		<category><![CDATA[API接口]]></category>
		<category><![CDATA[Baidu]]></category>
		<category><![CDATA[ByteDance]]></category>
		<category><![CDATA[Claude 3.5]]></category>
		<category><![CDATA[Coze Space]]></category>
		<category><![CDATA[Coze Space评测]]></category>
		<category><![CDATA[DeepSeek R1]]></category>
		<category><![CDATA[Gemini 2.5 Pro]]></category>
		<category><![CDATA[Google]]></category>
		<category><![CDATA[GPT-4o]]></category>
		<category><![CDATA[Llama 4]]></category>
		<category><![CDATA[LLM]]></category>
		<category><![CDATA[Manus]]></category>
		<category><![CDATA[MCP (模型控制插件/标准)]]></category>
		<category><![CDATA[Meta]]></category>
		<category><![CDATA[OpenAI]]></category>
		<category><![CDATA[PPT生成]]></category>
		<category><![CDATA[Token消耗]]></category>
		<category><![CDATA[Waiting List]]></category>
		<category><![CDATA[产品体验]]></category>
		<category><![CDATA[产品对比 (Coze vs Manus vs Grok vs XinXiang)]]></category>
		<category><![CDATA[产品评测]]></category>
		<category><![CDATA[代码生成]]></category>
		<category><![CDATA[任务拆解]]></category>
		<category><![CDATA[优劣势分析]]></category>
		<category><![CDATA[免费试用]]></category>
		<category><![CDATA[内容生成]]></category>
		<category><![CDATA[功能演示]]></category>
		<category><![CDATA[可视化网页生成]]></category>
		<category><![CDATA[呼伦贝尔自驾]]></category>
		<category><![CDATA[复杂任务处理]]></category>
		<category><![CDATA[大语言模型]]></category>
		<category><![CDATA[字节跳动]]></category>
		<category><![CDATA[工具调用 (内部/外部)]]></category>
		<category><![CDATA[市场调研]]></category>
		<category><![CDATA[心想APP]]></category>
		<category><![CDATA[扣子空间]]></category>
		<category><![CDATA[扣子空间使用]]></category>
		<category><![CDATA[搜索质量]]></category>
		<category><![CDATA[数据调用]]></category>
		<category><![CDATA[文档生成]]></category>
		<category><![CDATA[旅游攻略]]></category>
		<category><![CDATA[智能体]]></category>
		<category><![CDATA[游戏攻略]]></category>
		<category><![CDATA[现象级产品]]></category>
		<category><![CDATA[用户分析]]></category>
		<category><![CDATA[用户反馈]]></category>
		<category><![CDATA[电动车充电]]></category>
		<category><![CDATA[百度]]></category>
		<category><![CDATA[简历筛选]]></category>
		<category><![CDATA[自动化]]></category>
		<category><![CDATA[自我规划]]></category>
		<category><![CDATA[行程规划]]></category>
		<category><![CDATA[表格生成]]></category>
		<category><![CDATA[访谈记录整理]]></category>
		<category><![CDATA[豆包大模型]]></category>
		<category><![CDATA[通义千问]]></category>
		<category><![CDATA[邀请码]]></category>
		<category><![CDATA[阿里]]></category>
		<category><![CDATA[高德地图]]></category>
		<category><![CDATA[黑神话悟空]]></category>
		<guid isPermaLink="false">https://lukefan.com/?p=2132</guid>

					<description><![CDATA[【🔥AI圈地震！字节下场搞大事！】
啊啊啊啊啊啊啊！家人们不允许还有人不知道这个神器！！！字节最新黑科技「扣子空间」杀疯了🔥输入邀请码就能白嫖AI助理！手把手教你怎么玩转这个新物种👇

1️⃣输入邀请码秒进内测！
老范讲故事 邀请你体验扣子空间，快来和 Agent 一起开始你的工作吧！
https://www.coze.cn/space-preview?invite_code=AMMNLBE0
https://www.coze.cn/space-preview?invite_code=EYWXBAS8
https://www.coze.cn/space-preview?invite_code=Y5OKA3H6
https://www.coze.cn/space-preview?invite_code=1WH2Q2L1

2️⃣甩给它复杂任务直接躺平
3️⃣坐等AI自动生成攻略/行程/PPT
4️⃣生成的邀请码记得分享给姐妹！

刚用它做了呼伦贝尔自驾游攻略🤯全程自动调用高德地图+飞书文档！连充电桩位置都标得明明白白！！！游戏党狂喜🎮扔个游戏名直接出完整时间线/DLC攻略/角色档案，最后还自动生成可视化网页！！

⚠️但要注意！！目前每天只能跑5-10个任务，生成结果需要二次检查（毕竟AI偶尔会抽风）墙裂建议先用规划模式让AI拆解任务，中途还能随时调教！

【划重点】现在国内大厂全在all in这个赛道！百度「心想」APP也在悄悄内测！AI助理真的要取代打工人了？？评论区蹲个课代表总结差异👇

（悄悄说：老范的5个邀请码只剩最后4个了！手慢无！！）

#AI神器 #打工人必备 #职场黑科技 #AIGC #互联网新风口

Manus独领风骚成过往？字节扣子空间与百度心想APP强势入局，深度评测揭示AI Agent新格局下谁能主导复杂任务自动化与MCP生态。

随着现象级产品Manus的后劲显现，字节跳动的扣子空间和百度的心想APP等国产AI Agent（智能体）相继上线，标志着这一赛道进入新阶段。这些工具依托GPT-4O、Claude 3.5、Gemini 2.5 Pro以及国产大模型（如DeepSeek、通义千问、豆包），核心能力在于通过自我规划执行复杂任务，利用内部及通过MCP（Multi-Component Platform）集成的外部工具集成进行自动化的信息搜集和内容生成（如网页、PPT、文档）。本次我们通过邀请码深入体验了字节跳动的扣子空间****免费试用版，测试了其规划与探索模式、文件处理、高德地图/飞书等MCP调用能力，并生成了游戏攻略网页、旅行计划飞书文档等。尽管用户体验显示其框架可用，但内容细节仍需验证，Agent间信息传递偶有错漏。对比Manus及Grok等，各家在搜索质量、数据独特性（如抖音、X平台）、工具丰富度上各有千秋。当前应用仍以信息处理为主，业界普遍期待未来趋势是打通基于MCP的真实交易闭环，那将是AI Agent发展的下一个重要里程碑。]]></description>
										<content:encoded><![CDATA[
<figure class="wp-block-embed is-type-video is-provider-youtube wp-block-embed-youtube wp-embed-aspect-16-9 wp-has-aspect-ratio"><div class="wp-block-embed__wrapper">
<iframe title="Manus独领风骚成过往？字节扣子空间与百度心想APP强势入局，深度评测揭示AI Agent新格局下谁能主导复杂任务自动化与MCP生态。" width="900" height="506" src="https://www.youtube.com/embed/Wauo2C72R2c?feature=oembed" frameborder="0" allow="accelerometer; autoplay; clipboard-write; encrypted-media; gyroscope; picture-in-picture; web-share" referrerpolicy="strict-origin-when-cross-origin" allowfullscreen></iframe>
</div></figure>



<p>Manus的后劲来了。百度、字节都有了自己的agent产品上线。</p>



<p>大家好，欢迎收听老范讲故事的音乐节目频道。字节上线了扣子空间，百度上线了心想APP。Manus的光环不再。Manus本身就属于意外爆火，当时它突然火了以后，咱们还做了直播，说这个东西没有什么技术门槛，只是产品设计的很有意思。</p>



<p>Manus跑去跟阿里合作了之后，那字节、百度说这不行，咱们也得有自己的产品上线。又不是有多难做的东西，那就做呗。我呢，搞了一个字节扣子空间的邀请码，咱们呢试一试，看看这个产品到底怎么个用法儿。</p>



<p>Manus呢，到现在我也没用上。原因也很简单，我去申请测试，等了很久，到现在都已经开始收费了，也没有收到说你可以来玩一下的这个邀请。所以也就别费劲了。我自己呢也没有特别着急，我要特别着急想用的话，随便找两个人去要一些邀请码，也还是可以搞得定的。既然没有那么热心的话，也就没有上心去找嘛。</p>



<span id="more-2132"></span>



<p>AI agent呢，其实主要还是做自我规划、完成复杂任务。就当我看明白这个东西到底是干什么了以后呢，就没有那么着急了。如果对于输出的结果没有什么特殊要求的话，其实用Grok的deep search或者是open AI的deep research都是够用的。只是这些工具呢，输出的都只是一个文档，就是一个Markdown文档，或者说是一个富文本的文档而已。</p>



<p>我想去生成个网页，想去生成个表格，它就稍微差点意思。而且呢，Grok的deep search可以使用的工具是有限的，就是一些内部工具。现在呢还不支持我们去调用外部工具。像Manus这种东西呢，它除了内部工具之外，有一些外部工具，可以通过一些接口放进来。如果是对输出结果有一些要求，说我想输出个网页，我想输出个应用，可能就需要使用Manus这样的工具了。</p>



<p>新的方向有了，大家就冲就好了。现在新方向是什么呢？就是Manus给大家指明的新方向，叫agent加MCP。现在的大模型呢，基本能力已经够用了。GPT4O及以后的版本，Claude 3.5及以后的版本，Gemini 2.5 Pro以及往后再出的各种版本，其实都已经可以实现agent的全套功能。</p>



<p>这里头比较倒霉的就是Meta，他现在出的LLAMA4好像稍微差那么一点点。国内的模型呢，比刚才我们讲的这几个要稍微差一些，但也勉强能用。比如说DeepSeek R1，比如说通义千问的千问QWQ 32b。</p>



<p>通义千问的推理模型，以及豆包1.5的推理模型，最近这两天也发布出来了。百度文心一言呢，他自己号称他的4.0推理模型是可以用的，但是我没有去测试，实在是懒得跟他费劲。</p>



<p>这些大模型给他一个任务以后，他把这个任务拆解出来，进行一些规划，基本上是可以使了。在自我规划之后呢，就是数据调用和内部工具使用，这个就会看出各家的差异来。因为你输出的结果怎么样，跟你搜索的结果是息息相关的。你如果搜索质量差的话，那你输出的内容就会变得很烂。</p>



<p>我为什么很少使用GPT的各种推理模型，包括它的深度思考去干活呢？因为它的搜索质量实在太烂，所以经常出来给我胡说八道。而且有一些比较特殊的资源，只有某些内部可以使用。比如说X上面的帖子，只有Grok能用，其他人你用不了。或者说抖音里边的视频，我们根据字幕来进行一些搜索和总结，这事除了字节，别人也看不了。这就会产生差异出来。</p>



<p>在内部的数据跟工具使用了之后，还可以使用外部工具。现在MCP标准呢，已经基本确立了，各大平台都开始出官方接口了。前几天还跟大家演示过，使用高德地图进行行程规划，还是非常有意思的。</p>



<p>剩下的是什么呢？剩下的就是等就好了。因为这种任务你扔进去以后，没有个十几二十分钟他出不来。等的过程中就是TOKEN在燃烧。后边就是一次一次的调用大模型，哗啦哗啦在那跑，TOKEN就在干这个事了。</p>



<p>今天呢，咱们测试一下扣子空间。扣子空间呢，应该是4月19号吧，低调上线，也没开发布会，什么也没说，这东西就来了。也是需要邀请制或者是报名去等待。我呢，就直接找了人说：“给我发个邀请码过来。”人就给我发过来了。</p>



<p>拿到邀请码以后，你进去完成第一个任务，也就是让扣子空间给你去做第一个项目以后，你就可以生成5个新的邀请码。待会呢，我会在视频的简介里头贴4个邀请码。我的5个邀请码已经有人用了一个了，还剩4个。想试的人呢，可以到那去找邀请码去试去。</p>



<p>你试完了以后呢，也欢迎你把自己在生成的新邀请码，没有用过的，还贴到我们的评论区里头，让其他想试的人可以去使用。在海外的人现在别费劲，<a rel="noreferrer noopener" href="https://xn--coze-uf1gw62h.cn/" target="_blank">只有coze.cn</a>上才可以用，只有在墙内的人才可以用。</p>



<p>现在呢是免费试用，每天呢可以跑5-10个中等复杂度的任务，就是跑十几二十分钟这种，我们算中等复杂度吧。长了呢，可能能够跑个几小时，但是我现在还没有规划这么复杂的任务让他去干。</p>



<p>完成的工作呢，算是有一点点小惊喜吧，待会咱们看一眼。但是呢，内容不能细看。</p>



<p>很多的内容还是比较粗糙的。下面我们来演示一下，这就是我们的扣子空间。进入以后，你点击快速开始。如果像我这样已经有使用权限的，就干活去了。如果你没有使用权限的，可以加入他的waiting list，或者是输入邀请码。邀请码在咱们视频的简介里边去找。</p>



<p>下面是他的一些样例，就是这些是能干什么。这个很重要，为什么呢？就是当你看到了这些样例以后，你就说，我可以去拿他的提示词改一改，就去干活去了。比如说什么股票早报定制、什么深度调研、访谈记录整理。当然访谈记录，你要给他一个很复杂的访谈记录，他才去给你整理去。包括AI产品的用户分析，那你要给他一大堆的用户调研报告，他去干活去。包括什么游戏攻略撰写，待会我们去试试。还有的一些呢，是比如说写旅游攻略、市场信息调研，这个都是可以的。</p>



<p>我们点进去了以后呢，就会到达这里。这就是老范讲故事做的扣子空间了。但是注意这里头有两个模式，一个呢叫探索模式，一个呢叫规划模式。探索模式就是你给它一提示词，它噼里啪啦就给你干完了。规划模式呢，你给他一个提示词，他呢先去做一个规划：这样干行不行？我去按这10步干，还是干这20步干？你在这个时候还可以调整，调整完了以后他去干去。如果你是这个探索模式呢，直接干完就出结果。如果是规划模式的话，中间他遇到问题，他会停下来问你：“对不起，这有一个问题我搞不定了，咱还干不干？”或者有什么其他方法，你可以再跟他聊两句，他再接着往前走。更像个人规划模式。但是，规划模式呢，会更加消耗时间和TOKEN。我就不在这现场给大家试了，因为现场事实在是太慢了，没有个20分钟跑不完一个项目。</p>



<p>这个地方呢是上传文件的，只识别文字的部分。你说我上传个图片给我识别一下，目前还不可以。最多可以上传10个，单个文件的最大是50兆。比如说我有一大堆的这个简历，把它打包扔上去。扔上去以后呢，他把里边的内容都给你找出来，说哪一个是符合我要求的。这个是可以做简历筛选。或者你给他一大堆的用户的调研报告，他也可以去给你分析。</p>



<p>这边呢是MCP扩展，大家看到了有高德地图、飞书云文档。你比如说我添加这个，最后说请把输出的结果写在飞书云文档里，它就给直接给你做完了。或者你说我从里边去读取信息，都是可以的。包括飞书多维表格、飞书电子表格。你说我有一堆的用户调研报告，都是存在这个里边了，你可以让他直接去读去。图像工具呢是可以做文生图，但是效果一般，我试过了。语音合成也是可以。</p>



<p>Notion可以在Notion里边去创建、读取、编辑、更新，包括GitHub、MySQL的一些查询，ClickHouse的一些查询，这个都是允许的。ClickHouse就是有些人把比如用户的数据放在里头，这个都可以拿来去分析。就是你需要哪个，你就在这里头添加。把这都弄完了以后，直接点开始就完了。点一次基本上20分钟就不见了。像我们这种免费用户的话，每天可以点个5-10次。</p>



<p>我们来看一看他干的怎么样。第一个呢是前面有案例说：“请给我分析《黑神话：悟空》的攻略。”现在我说：“你给我做《纪元1800》的详细游戏介绍文档，包括发布后的完整时间线，涵盖每个关卡和DLC的详细介绍，以及基础策略和故事线的介绍。同时列举出主要人物角色和各项任务的情况。最后报告用可视化网页呈现。”</p>



<p>他说：“我接到你的任务了，我要开始干活去了。”先思考一下去搜索：《纪元1800》什么时候发布的？游戏背景是什么？基础信息是什么？思考的过程又去想去了：关卡、DLC、策略，挨着个儿去搜索它。等于就是搜索了大量的内容，再去思考说：“我们现在开始把一些基础信息保存下来。”去生成网页，生成UI。UI完成了，然后生成代码。代码呢要进行解析、分析和检查。完成了以后给它配图，但实际上没有什么图进来，可能有一点小图标进来。配图完成，开始部署。最后就生成完了。大概整个跑了20多分钟。</p>



<p>做出来的结果是什么？就是这样的一个结果，说：《纪元1800》游戏指南。这个游戏背景是回到工业时代之初，19世纪初的工业化。基本上写的都是对的，因为都是搜索出来的嘛。游戏核心呢是城市建设，依托于海岛港口的小型农庄起步，逐步建设各种的养殖场和工厂，以及公共设施，形成繁荣的近代都市贸易系统。一项一项的就去讲去了。</p>



<p>你看它还是有一点点小动画的。这边是时间线：2019年4月16号正式发布的，2020年8月11号有各种组合包，DLC就开始上线。到2023年呢，登录了PS5和Xbox。2024年呢，又在出新的组合包。</p>



<p>然后DLC的一些详情。这个里头呢就告诉你说：植物园的DLC，推荐指数是什么？植物园、沉默的宝藏、植物园航道、权力之座、狮子之地。好像有些DLC我是有的。贸易港，这个里头是说有这么多，哪个是推荐去买的，哪个不是那么推荐的。推荐指数五颗星制。然后呢，是有季票，就是你买了季票以后呢，包含了哪些DLC了。这是第一个季票，第二个季票，大概是这样的一个购买方式。</p>



<p>就是你买了本体以后，还可以买季票，或者买这些DLC继续丰富游戏。策略呢，也告诉你了，说我要先干什么后干什么：初期什么，中期什么，后期什么。这是策略，这是故事线，稍微的跟大家讲解了一下。</p>



<p>然后是角色。这个里头呢，只写了两个，其实他角色是很多的。清公主是比较有名的一个角色了，都是他们有什么特色。然后系统任务有哪些任务：什么拍照任务，解谜任务。其实任务非常多，这个就是非常不完善了。但是呢，这就是给你的一个结果。</p>



<p>前面的提示词大家看到了，最上面是提示词，然后是一项一项的去干活去了。后面我就让他做了一个什么项目呢？做一个PPT说明吧：扣子空间目前免费使用的版本，背后是哪些大模型，内置了哪些工具，可以通过MCP挂载哪些工具，免费试用的用户有多少额度，额度如何计算，每天可以做几个任务，如何计费。扣子空间擅长做哪些任务，为什么没有大张旗鼓的宣传呀？用户对于扣子空间的反馈怎么样？扣子空间跟百度、跟Windows、跟Grok的deep search之间到底有什么差异？他就去挨着个儿搜索，搜索完了以后再去生成PPT，大概是这样的。</p>



<p>右边我们就看到了这个PPT。当然它这个PPT呢，下载下来是一个PDF。有些部分还可以，但是呢，有些部分明显的就没搞明白，包括计费的部分。实际上它属于明显的没搞明白。但是我们就一句话呀，虽然它做了十几二十分钟，但它确实给我们做了一个还能看的PPT出来哈。我们可以在这下载这个PDF：扣子空间介绍功能、使用反馈和优势点PDF。你可以下载下来。</p>



<p>然后呢，我让他做了一个稍微复杂一点的。这个是什么？我需要在5月10号到17号，从北京出发7天，呼伦贝尔大草原自驾旅行，一共两个人，预算5万元左右。我喜欢自然风光、隐藏的宝地和蒙古文化。我想从北京自驾出发，一路开电动车，需要规划充电站。请详细的给我行程安排和一个内容丰富的飞书文档旅行手册，包括地图、景点描述、旅拍和航拍的打卡点、必备的装备、每日行程、一路上的特色美食，以及我们每个行程中可以参考的旅行小贴士。将飞书文档保存到我的飞书账号。但是你使用飞书呢，它就会让你认证一下，说你的飞书账号是哪个，它到时候就给你存进去了。</p>



<p>最后呢，它给我生成了一个什么？这个过程我们就不仔细看了，因为我还调用了高德地图。它里头到底如何开，到了哪个地方，有什么吃的，哪个地方有充电站，这个都是由高德地图来去提供的。做了可能有半个小时吧。</p>



<p>第一天：从北京开车到锡林浩特<br>北京出发，走G6京藏高速。中午到张家口休息，再往锡林浩特方向开，约4小时车程。<br>打卡贝子庙、鄂尔古纳敖包，感受蒙古文化。品尝手抓羊肉、咸奶茶。<br>充电站位置：锡林浩特市区XX充电站。</p>



<p>第二天：锡林浩特到阿尔山<br>上午出发，走S307省道。中午在东乌珠穆沁旗用餐。下午继续前往阿尔山，沿途景点包括XX草原、XX湖。<br>晚上入住阿尔山XX酒店（需提前预订）。<br>景点介绍：普留克（特色美食）、炸柳根鱼（当地特色）。<br>充电站位置：阿尔山市区XX充电站。</p>



<p>第三天：阿尔山到满洲里<br>出发路线：走S203省道。中途在XX镇用餐。<br>满洲里景点：套娃景区、XX民俗村。<br>充电站位置：满洲里市区XX充电站。</p>



<p>第四天：满洲里到黑山头<br>行程安排：上午出发，中午在XX镇用餐。下午抵达黑山头草原活动营地，参与蒙古族民俗活动。<br>充电站位置：黑山镇XX充电站。</p>



<p>第七天：海拉尔返回北京<br>行程调整：第七天应从海拉尔返回北京，建议乘坐飞机或高铁。</p>



<p>旅行装备：<br>&#8211; 衣物：5月份昼夜温差大，需准备保暖外套、长裤。<br>&#8211; 生活用品：牙刷、保温杯、驱蚊用品。<br>&#8211; 摄影器材：相机、三脚架、无人机（航拍必备）。<br>&#8211; 车载用品：充电器、地图导航设备。</p>



<p>旅行小贴士：<br>&#8211; 交通：提前检查车辆（充电车需确认电量），携带驾驶证、行驶证、保险单。<br>&#8211; 饮食：注意饮食卫生，尽量选择正规餐馆。<br>&#8211; 住宿：提前预订酒店，避免旺季无房。</p>



<p>其他注意事项：<br>&#8211; 雨天行车需减速，注意安全。<br>&#8211; 旅拍和航拍打卡点：贝子庙、黑山头草原、套娃景区等。<br>&#8211; 特色活动：参与蒙古族民俗体验，探访俄罗斯后裔家庭。</p>



<p>&#8212;<br>（注：纪元1800任务部分因涉及游戏截图及图标缺失问题，已按用户要求跳过未完成部分。）</p>



<p>我们就不要图标了，然后又接着吭哧吭哧干去了。</p>



<p>我这写着放弃图标和截图，继续完成其余工作。说好的我将放弃这个东西，然后我去干活去了。最后蹭蹭蹭，干到这大概也是20多分钟，不到30分钟吧。干完的这个结果呢，其实给我们生成了很多的这种Markdown文件，就是把所有搜索的信息都放在这。</p>



<p>它搜索完了以后呢，再用这些Markdown文件去生成我们最上面这个GSX。这个是一个用React来去渲染的单个的网页文件，他最后生成了这么一个文件。</p>



<p>主要的人物，这个里头也有谁谁谁：清公主，然后白手起家。这个一般我们管她叫老太太，这个反正最后总要打一仗的，叫欧梅拉，这都是有的。相关的新世界相关的角色有哪些？就是他找的还是挺全的，虽然最后生成的网页里好像没有这么全，但是这边找的还是很全的。</p>



<p>然后呢，给大家看一个他犯的错误：游戏关卡跟DLC，他找了一堆什么使命召唤、守望先锋、吸血鬼幸存者。这什么意思呢？就是他在agent传递的过程中，他忘了我要找纪元1800相关的信息了，传递的时候把这个游戏名扔了。所以呢，他再去找游戏关卡跟DLC的时候，就直接输出了错误的结果。因为当他很多的agent一起配合干活的时候，就很难避免看这个事情。</p>



<p>最后呢，给我们生成了这样的网页。这就是大家能看到的网页，说一是什么什么样的，二是什么。这是我们的时间线。然后呢，是关卡跟DLC，这个还是有点小漂亮的。但是这个呢，就刚才我们看了，它是出错了，所以它给了一堆什么吸血鬼幸存者的DLC、什么激战、什么恶龙绝境的DLC、方舟的DLC。所以这个页面是完完全全错误的，不用管它了。</p>



<p>然后呢是策略和分析，这个很二。他需要展开前期后期主线写的，就非常的简陋了。再往后是人物：清公主，一个一个的人物。但是这个呢写的并没有那么完整吧，就是其实他找人物的时候找的是挺完整的。就刚才我们看到他给的，这个Markdown里头是挺完整的，但是呢最后生成网页里并没有那么完整。</p>



<p>作为基础框架是够的，把这个框架拿出来以后，再套上这些Markdown文件，还是可以继续去丰富的。这就是我们今天演示的扣子空间。</p>



<p><a rel="noreferrer noopener" href="https://xn--space-ep5hp2p0rgd72bre8adiuul9b.coze.cn/" target="_blank">进入的网址呢是space.coze.cn</a>。海外的用户先不要着急使用，国内的现在已经可以跑了。使用的感受是什么样的呢？真的需要跟扣子开会了，不能跟他随便聊天了，太浪费TOKEN了。因为你是跟他说点什么，他都哗啦哗啦去干活去了，不能随便聊了。</p>



<p>所以，我现在都是写很长的提示词，把各种能想到的尽量都罗列清楚。如果你说我实在是一次想不明白怎么办？使用规划模式：你先提出要求，他先把这个任务列出来，你再按照这个任务呢再去调整。修改好任务以后，他再去确认，按这个逻辑来去执行，他再往前跑。而且跑的过程中，他还有时候问你说：“我这块执行不下去了，那块找不着了怎么办？”你还可以跟他再聊两句，继续往前走。</p>



<p>如果你说我不走规划模式，直接用简单方式一次跑到底的话，那你就一开始要把任务提的比较详细一些。整个干活的过程呢，还是很有启发的，就跟思维链似的。你看他先干什么后干什么，先搜索什么后搜索什么，是有启发性的。如果发现哪块没做好呢，我们后面也可以拿这个东西再去修补。输出的结果呢必须要验证，这个没什么好说的，里头一定是有明显错误的。Agent的传递过程中呢，会出现明显错漏，刚才我们演示的时候也看到了。生成的结果呢框架可用，生成结果后面的很多细节，还需要我们再去补充。而且把这种结果放到他们的Agent IDE里头，比如说像trae里边去，也可以拿这个东西再去修修补补。</p>



<p>目前呢，可以输入的东西是搜索，它自己可以搜索。然后呢，通过MCP挂载一些外部工具。但是现在的MCP呢，只能是它挂好的。你说我想挂一些新的MCP进来，目前还没有完全开放。可以输出的信息呢，第一个是文档，它这个文档是Markdown，就是一些程序员的标记语言，也是有一定格式吧，但是没有那么丰富。然后可以输出这种单页的网页文件，你拿这个网页文件以后，后面呢可以让他去生成自己的网站。你说想让他去写一些别的代码，我测试了一下失败了。你说给我写一个什么安卓应用，它最后生成出来的还是一个网页，没有其他东西出来。然后呢，可以把输出的东西写在Notion里去，也可以输出什么PDF、PPT。PPT呢是以PDF形式来输出的，还可以做表格、做飞书，文档存进去都是允许的。</p>



<p>大家看到了这个产品以后，特别是有些人试用了以后，自己去感受一下。字节在做类似这种产品上呢，它有一些优势和劣势。优势呢就是迭代速度还可以，trae现在基本上已经能用了，特别是在Gemini 2.5 Pro这个模型上来以后，现在trae基本上可以跑了，因为把MCP也加上去了。所以呢，像扣子空间这样的工具，经过一段时间迭代之后，应该也是可以运用的。第二个优势呢，是字节有非常丰富的应用场景，它有抖音、有TikTok，有今日头条，都是可以使用的。</p>



<p>然后有流量，就是我们想宣传点什么东西，在自己的这个流量池里头稍微说两句，没有任何问题。最后一个优势是有钱，就是当产品打磨好了以后，铺天盖地的投放推广。</p>



<p>但是字节呢也有些劣势。它的劣势就是包袱太重。你比如说豆包大模型算是基本达标，但是距离DeepSeek R1呢，还是有一点点差距的。不能扔，因为是自己家的，必须抱着往前走，这就叫包袱。还有呢，就是藩镇割据。大公司都是这样的，扣子、火山、trae、飞书、剪映，各玩各的还相互提防。就是说我这边有点什么东西，我绝不能给你看，也绝不能听你的。你需要我什么配合，一定不给你做。咱们是这样的一种合作模式。其实大厂里边都这样，就是宁与外人不与家奴。这个话应该是慈禧说的。什么意思呢？就是他们更喜欢跟外界进行合作。你说我跟内部的一些团队合作了，其实更合适一些吗？因为毕竟大家的基础数据是一致的，应用场景也是一致的。那不行，一旦是内部合作了，就有谁听谁的问题，谁成主谁成辅的问题。这事不能随便乱搞。</p>



<p>总结一下吧。现象级的产品Manus出现之后呢，各大厂商都是要抄一遍的，这也算是对方向的一个认可。agent加MCP呢，应该能够引起一个小的热潮吧，确实可以解决一些实际问题了。未来呢，更好的模型，更多的外部工具，会产生更好的结果。</p>



<p>下一步我们可以期待什么？open AI、谷歌、Anthropic和Meta现在还没有特别明确的类似这种agent加MCP的产品出来，我们还是可以期待一下的。下一个里程碑是真正的交易。什么意思？就是我们现在看到的扣子空间也好，Manus也好，或者其他所有类似这种产品也好，主要做的事情还是叫信息搜集。他并没有真的做交易。你说你给我订个房间，去给我买张机票去，给我买东西去，这个事没干。一旦这一条路打通了就会腾飞。</p>



<p>为什么他们现在不去做交易呢？原因也很简单，现在模型还没有那么靠谱。因为它出问题的几率会很高嘛，受不了。所以现在并没有真正的把交易做进去。现在的各种MCP，也都是以信息查询为主，很少有哪个MCP是可以做交易的。你比如说像美团，如果给我一个MCP，我直接可以通过MCP去在美团上订餐，目前还没有。因为现在的大模型或者是这种agent模式呢，还没有那么靠谱。在等待向前发展那么几个月，可能我们就会看到由MCP驱动的交易大量涌现，这么下一个篇章就真正翻开了。</p>



<p>好，这个故事就跟大家讲到这里。感谢大家收听，请帮忙点赞、点小铃铛。</p>



<p>参加DISCORD讨论群。也欢迎有兴趣、有能力的朋友加入我们的付费频道。再见。</p>
]]></content:encoded>
					
		
		
			</item>
	</channel>
</rss>
