<?xml version="1.0" encoding="UTF-8"?><rss version="2.0"
	xmlns:content="http://purl.org/rss/1.0/modules/content/"
	xmlns:wfw="http://wellformedweb.org/CommentAPI/"
	xmlns:dc="http://purl.org/dc/elements/1.1/"
	xmlns:atom="http://www.w3.org/2005/Atom"
	xmlns:sy="http://purl.org/rss/1.0/modules/syndication/"
	xmlns:slash="http://purl.org/rss/1.0/modules/slash/"
	>

<channel>
	<title>产品体验 &#8211; 老范讲故事｜AI、大模型与商业世界的故事</title>
	<atom:link href="https://lukefan.com/tag/%e4%ba%a7%e5%93%81%e4%bd%93%e9%aa%8c/feed/" rel="self" type="application/rss+xml" />
	<link>https://lukefan.com</link>
	<description>这里是老范讲故事的主站，持续更新 AIGC、大模型、互联网平台、商业冲突与资本市场观察，帮你看清热点背后的底层逻辑。</description>
	<lastBuildDate>Fri, 11 Jul 2025 00:43:10 +0000</lastBuildDate>
	<language>zh-Hans</language>
	<sy:updatePeriod>
	hourly	</sy:updatePeriod>
	<sy:updateFrequency>
	1	</sy:updateFrequency>
	<generator>https://wordpress.org/?v=6.9.4</generator>

<image>
	<url>https://lukefan.com/wp-content/uploads/2026/03/cropped-jimeng-2026-02-28-5245-用图一的人物形象，替换图二中的人物，使用图二的风格。文字替换：老范讲故事，Yo-32x32.jpeg</url>
	<title>产品体验 &#8211; 老范讲故事｜AI、大模型与商业世界的故事</title>
	<link>https://lukefan.com</link>
	<width>32</width>
	<height>32</height>
</image> 
	<item>
		<title>Manus不是第一个，也不会是最后一个！从爆火到出走新加坡，看泛AI Agent赛道如何被国内大厂免费模式玩坏，中国AI创业公司在资本与地缘政治夹缝中求生的辛酸启示。</title>
		<link>https://lukefan.com/2025/07/11/manus%e4%b8%8d%e6%98%af%e7%ac%ac%e4%b8%80%e4%b8%aa%ef%bc%8c%e4%b9%9f%e4%b8%8d%e4%bc%9a%e6%98%af%e6%9c%80%e5%90%8e%e4%b8%80%e4%b8%aa%ef%bc%81%e4%bb%8e%e7%88%86%e7%81%ab%e5%88%b0%e5%87%ba%e8%b5%b0/</link>
		
		<dc:creator><![CDATA[Luke Fan]]></dc:creator>
		<pubDate>Fri, 11 Jul 2025 00:43:09 +0000</pubDate>
				<category><![CDATA[AIGC]]></category>
		<category><![CDATA[AI Agent]]></category>
		<category><![CDATA[AI内卷]]></category>
		<category><![CDATA[AI创业公司]]></category>
		<category><![CDATA[AI应用落地]]></category>
		<category><![CDATA[AI监管政策]]></category>
		<category><![CDATA[Anthropic]]></category>
		<category><![CDATA[Benchmark投资]]></category>
		<category><![CDATA[ChatGPT]]></category>
		<category><![CDATA[Claude]]></category>
		<category><![CDATA[Figure AI]]></category>
		<category><![CDATA[HEYGEN]]></category>
		<category><![CDATA[Kimi]]></category>
		<category><![CDATA[Manus]]></category>
		<category><![CDATA[Manus跑路]]></category>
		<category><![CDATA[OpenAI]]></category>
		<category><![CDATA[Token消耗]]></category>
		<category><![CDATA[中国AI产业]]></category>
		<category><![CDATA[中美科技战]]></category>
		<category><![CDATA[产品体验]]></category>
		<category><![CDATA[人工智能]]></category>
		<category><![CDATA[付费转化率]]></category>
		<category><![CDATA[免费模式]]></category>
		<category><![CDATA[创业故事]]></category>
		<category><![CDATA[周鸿祎]]></category>
		<category><![CDATA[商业模式探讨]]></category>
		<category><![CDATA[团队裁员]]></category>
		<category><![CDATA[地缘政治]]></category>
		<category><![CDATA[大厂竞争]]></category>
		<category><![CDATA[大语言模型 (LLM)]]></category>
		<category><![CDATA[字节跳动Coze]]></category>
		<category><![CDATA[技术壁垒]]></category>
		<category><![CDATA[收费策略]]></category>
		<category><![CDATA[新加坡总部]]></category>
		<category><![CDATA[智谱AI]]></category>
		<category><![CDATA[泛AI Agent]]></category>
		<category><![CDATA[用户增长]]></category>
		<category><![CDATA[百度]]></category>
		<category><![CDATA[科技公司出海]]></category>
		<category><![CDATA[科技新闻]]></category>
		<category><![CDATA[科技评论]]></category>
		<category><![CDATA[稚晖君]]></category>
		<category><![CDATA[算力]]></category>
		<category><![CDATA[美元资本]]></category>
		<category><![CDATA[美国投资限制]]></category>
		<category><![CDATA[老范讲故事]]></category>
		<category><![CDATA[融资]]></category>
		<category><![CDATA[行业观察]]></category>
		<category><![CDATA[资本运作]]></category>
		<category><![CDATA[通义千问]]></category>
		<category><![CDATA[马斯克]]></category>
		<guid isPermaLink="false">https://lukefan.com/?p=2374</guid>

					<description><![CDATA[【🔥爆雷预警！】资本吃相太难看！Manus卷钱跑路新加坡真相！

啊啊啊啊家人们谁懂啊！！！🤯曾经吹爆的AI顶流Manus居然连夜跑路新加坡！这波操作直接看呆我！！！

1️⃣【惊天大瓜🍉】 刚拿7500万美金就关停国内业务！120人团队原地解散留3成核心跑路！救命这哪是创业啊？？妥妥的资本游戏收割机！！！韭菜们哭晕在厕所！！！

2️⃣【真相暴击💔】 美国金主爸爸逼宫！不搬家就不给钱！！！新加坡总部月薪8k刀起跳（人民币5w+）💰💰💰但技术全靠Claude缝合！！！自己连个大模型都没有就敢称神？？？

3️⃣【国内围剿实锤👊】 阿里/字节/百度全员下场搞免费平替！周鸿祎更是放狠话要裁市场部搞AI！！！救命国内大厂卷起来真的不给活路啊！！！！

⚠️重点来了： 泛AI代理全是泡沫！！视频拍得越炫酷实际用起来越拉胯！！抽卡式出结果还要收30刀？？这钱直接打水漂啊宝子们！！！

现在跑去新加坡搞研发？笑死！月薪5w招的工程师怕是天天金沙酒店下午茶！🍸真正写代码的还得找国内外包！！！（懂的都懂😏

AI创业圈大地震！！！地缘政治割韭菜实锤！！所以说...科创公司拿美资=定时炸弹？？？💣


Manus不是第一个，也不会是最后一个！从爆火到出走新加坡，看泛AI Agent赛道如何被国内大厂免费模式玩坏，中国AI创业公司在资本与地缘政治夹缝中求生的辛酸启示。

曾经一码难求的中国AI明星项目Manus，在获得Benchmark领投的巨额融资后，突然宣布“跑路”新加坡，引发行业震动。这一戏剧性转变，不仅揭示了美元资本在地缘政治新规下的无奈选择，也暴露了Manus作为一个依赖OpenAI及Claude等海外模型的泛AI Agent，在国内市场面临的合规困境与技术难题。更重要的是，在阿里、字节等巨头免费策略的大厂围殴下，中国AI创业生态的残酷内卷让其生存空间被极致压缩。Manus的出走，是资本、技术与市场夹击下的必然，也为中国AI公司的未来发展敲响了警钟。]]></description>
										<content:encoded><![CDATA[
<figure class="wp-block-embed is-type-video is-provider-youtube wp-block-embed-youtube wp-embed-aspect-16-9 wp-has-aspect-ratio"><div class="wp-block-embed__wrapper">
<iframe title="Manus不是第一个，也不会是最后一个！从爆火到出走新加坡，看泛AI Agent赛道如何被国内大厂免费模式玩坏，中国AI创业公司在资本与地缘政治夹缝中求生的辛酸启示。" width="900" height="506" src="https://www.youtube.com/embed/eiTydgiSp6s?feature=oembed" frameborder="0" allow="accelerometer; autoplay; clipboard-write; encrypted-media; gyroscope; picture-in-picture; web-share" referrerpolicy="strict-origin-when-cross-origin" allowfullscreen></iframe>
</div></figure>



<p>曾经一码难求的Manus宣布跑路新加坡了。</p>



<p>大家好，欢迎收听<a href="https://youtube.com/@StoryTellerFan" target="_blank" rel="noopener">老范讲故事的YouTube频道</a>。中国AI产业在7月9号呢，应该经历了资本侵袭之日。为什么这么讲？第一个，稚晖君创建的智源科技跑去买壳上市去了，机器人还没造出来呢，先去收购了一个上市公司60%多的股份。这个要干什么，大家心里都明白。</p>



<p>另外一个就是Manus，算是在Deepseek之后，又炒起了中国AI热潮的一个品牌。他们当时是做泛AI agent，就是说可以解决各种各样问题的AI agent，突然宣布在国内裁员，直接关闭，然后搬迁到新加坡。事情没做多少，这个资本的吃相有点太难看了。</p>



<p>Manus到底怎么个跑法呢？原来团队也不大，120人的团队，留下三四十个核心技术人员迁往新加坡，剩下的原地解散了。给2N或者是n加3，估计有些人来的时间实在是太短给n加3，来的时间稍微长一点的可以给2N。反正手里有钱嘛，刚拿了7,500万美金的融资，也不在乎这一点，直接遣散了就完事了。</p>



<span id="more-2374"></span>



<p>然后准备在新加坡设立新总部，在新加坡要设立研发中心，招聘AI工程师、数据科学家等职位，月薪高达8,000-16,000美金。不是人民币，是美金，因为这也没办法。你在新加坡没有这个薪水的话，你活不下去，那个地方生活成本很高的。然后准备在新加坡、东京、硅谷重新设立总部，重新开始。</p>



<p>Manus的爆火到底算不算是个意外呢？当时Manus突然火起来的时候，很多人就觉得这玩意有啥？你这个模型也不是自己家的，里头用的各种技术也不是最新的，你咋就火了呢？这是不是一个德不配位的项目呢？</p>



<p>Manus呢，是第一个能够完成各种炫酷工作的泛AI人工智能。原来呢，也有一些AI agent可以完成一部分工作，但是呢，能够完成各种工作的呢，Manus算头一个，而且它完成的很炫酷。注意，炫酷这两个字是非常重要的。</p>



<p>以前有很多开源项目说，你看我也能干，但是呢，他们做的方式相对来说比较工程师一点吧，或者比较实验室一点。你需要在字符界面，在一大堆代码在里头敲了半天，写了半天以后，给你出一个半半拉拉的结果。</p>



<p>Manus呢，第一次把它封装在一个界面和交互相当不错的产品里头，还录好了视频。这个说明什么呢？就是技术其实在AI时代不是第一生产力。在AI时代里头，最重要的第一生产力是什么？是拍视频跟讲故事的能力。我们现在看看OpenAI，那绝对是拍视频跟讲故事的大师。</p>



<p>Figure AI机器人。</p>



<p>这个也属于是拍视频跟讲故事的一把好手。咱再看看马斯克，那玩意儿全世界第一大网红，他这拍视频讲故事的能力也是没有边了。所以在AI时代，还是要好好的拍视频讲故事。</p>



<p>真正说我视频拍的一般，故事讲的不怎么样，产品做的特别好的，Anthropic算是一个。这个Manus属于是视频拍的很好，故事讲得很圆的一个项目。技术呢，你说真的有多先进？还真没有多先进。他用的是Anthropic的Claude大模型，连当时正在快速发展的MCP都没用上，自己就是把一些需求捆在一起。但是他的整个交互做的挺好，视频绝对很酷，产品设计和体验也还做的不错。算是呢，解决了一些问题，而且呢，给大家带来了新的思路。</p>



<p>这样的情况下，他突然就爆火了。但是爆火之后后边的发展呢，其实并不尽如人意。OpenAI这样的爆火了以后，不断的往前发展，不断的引领潮流，开创了新渠道嘛，然后一直站在这个渠道，带着大家一起往前走，一起探索新方向。大家都是有这样预期给它的。</p>



<p>但是Manus后边并没有那么好用。第一个呢，尝试在国内落地失败了。它本来是用的Anthropic的Claude大模型，你要想在国内落地，这事肯定不行嘛。因为这个规定了，你是不可以在国内使用了。包括像OpenAI的ChatGPT，谷歌的JGemini，这些都是不允许在国内使用的。所以呢，他们挑来挑去，挑中了通义千问的这个模型，说我们试一下，用千问模型能不能在国内落地。然后就没有然后了，估计效果很不好。</p>



<p>因为千问模型我们试过，就是它的指令依存度是比较差的。特别是当时的千问2.5，千问3呢还要更好一些。因为像你要做这么复杂的AI agent，你就需要是很多个AI大模型的运作过程前后相衔接。这个里头你到底说成什么样，说我才华横溢还是磕磕绊绊，这不重要。重要的是什么？就是你指令的依存度。我前面要求你向东，你就不能向西；我要求你撵狗，你就不能打鸡。但是在这块，千问其实做的不好。</p>



<p>Manus如果继续想向前发展的话，他必须要解决Claude、ChatGPT这些美国大模型的合法使用问题。这个问题对于他来说是无解的，因为模型不是他自己的。很多其他的厂商，你像Mini Max也开始做AI agent，那模型是他自己的，他就可以分好说，这个是国际版，那个是国内版，我们自己拆开来用就完事了。但是，Manus他没有这个能力。</p>



<p>而且呢，Manus在国内被一群的大厂去围殴。这种东西你在美国呢……</p>



<p>人家还没有这么多的工程师，这么多的研发力量聚集起来说：“有方向了，我们要出来围殴你一下。”还不会干这个事。</p>



<p>而且，就算你在美国，真的有人把类似的产品做出来，人家还得收费。你在收费的情况下，大家还可以拼一下：谁愿意亏更多的钱？谁愿意给更多的补贴和优惠的问题。但是国内大厂不跟你讲这个，我都免费，产品都差不太多。</p>



<p>国内阿里自己就做了类似这样的产品，也投资了类似这样的产品。字节跳动自己做了Coze空间，而且现在的豆包也支持深度研究了。百度也出了类似这样的产品，这都是大厂吧？直接上来围殴你，都是免费的。</p>



<p>Minimax、Kimi、智谱也都出了这种泛AI Agent，也在进行相应的尝试，而且都是不要钱的。那你怎么跟他打？包括像360的周鸿祎都开始表演了，说：“我们也开始做这种泛AI Agent，各种问题都可以解决掉。”而且为了开演示会，还说：“我要把市场部都裁掉，我让AI Agent把整个市场部的工作都替代掉，我自己一人搞定。”后来也就没有什么后来了，估计裁撤市场部这件事情，没有那么容易。</p>



<p>再往后，Manus开放注册和开始收费之后的话，数据就不再公布了。什么意思呢？因为前面在排队的时候，号称有260万人进去排队，后边说：“我们不需要排队了，大家来玩吧，我们开始收费了。”这个用户增长估计是废掉了。</p>



<p>如果用户增长依然非常迅猛的话，他会出来说：“我们又有多少人开始排队了，我们又有多少人等着去付费了。”如果他真的收到钱，他也会说：“你看我收了这么这么多钱，我盈利了。”但是后边的数据就没有了。</p>



<p>曾经有一个数据，号称是说他们的付费转化率有60%。但是这种数数呢，就是你看着一下就行了。ChatGPT自己也做不到付费转化率60%这样的事情。这个就属于是骗一些不是特别有经验的人吧？这是不可能的。任何行业付费转化率都不可能这么高。</p>



<p>因为这种泛AI Agent的收费模式其实是很难平衡的。为啥？因为它消耗的TOKEN特别多。每一次他提出要求以后，你就要消耗大量的TOKEN去干活。你还别说是这种泛AI Agent，我曾经把自己的一些AI大模型的账号挂到过编程的AI Agent里头去，这还是一个相对来说比较固定的垂类的AI Agent。那一会你问问几个问题，几美金就不见了，这个非常非常贵的。</p>



<p>而且，AI Agent产生的结果呢，是不可预估的。你最后不能说要抽卡吧？抽卡的意思就是你出多次的结果，然后挑一个可以用的。</p>



<p>这个是在AI绘图里边常用的一个新的名词。但是，AI agent出来的这些结果，可用的绝对不会超过一半。绝大部分的这个AI agent的结果都是不可用的。在这样的情况下，你让人去付费，甭管是十几美金、二十几美金，还是三十几美金。一方面，消耗的TOKEN这个钱数根本就cover不住；另外一方面，人家付了钱了，出来的结果基本上不可用，那就属于里外不是人的一个状态了。</p>



<p>这些大模型厂商自己搞AI agent，它还可以干嘛？左手倒右手，我只要在里边做这个账就完了。但是你像Manus这种第三方，你收了这些订阅费以后，你就老老实实的去给人按TOKEN付钱去。这个基本上是无解的。免费很香的东西，收费了以后立马就不香了。</p>



<p>现在关于Manus在国内的很多风评，其实没有那么好。一堆人说，怎么这么贵？当然，只要收费，就一定会有人嫌贵。吃不到葡萄说葡萄是酸的嘛。你像我收199，说大家来做个线下活动，一帮人说，老范你怎么可以割韭菜？永远有这样的声音，这个是没有办法。另外一方面，就是付了钱以后没有得到想要的结果。因为泛AI助理呢，本身你想获得想要的结果，就非常非常难。</p>



<p>拍视频没毛病，拍个视频给大家演示一下，这个事你是可以做的非常非常好的。因为都是摆拍嘛，你这一次没拍好再拍一次嘛。这些数据进去了以后效果不好，再来一批嘛。但是你真的实际使用的时候，所有的挫折和失败，就需要用户自己承担了。那这些人会去骂街的。人家希望付了钱以后一次搞定，你付了钱以后让我反复在这试，那这个肯定是不行的嘛。</p>



<p>为什么说资本是丑恶的呢？资本的丑恶嘴脸在哪呢？这个Manus拿了钱了，拿了谁的钱？叫benchmark给了7,500万美金，估值5亿美金。还没有到独角兽，10亿美金才独角兽呢，距离独角兽还差一半。7,500万美金拿到了，就是他搬离中国大陆去新加坡的一个核心原因。为什么呢？这个是拿钱的一个前提条件。benchmark这个7,500万美金的领投，是美国财政部进行了严格的审查。不搬离中国，搬到新加坡去，你这个投资就不允许落地。</p>



<p>这是为什么呢？美国在2024年10月份签署了行政命令，规定了美国资本对中国AI半导体领域的投资，需要报备和受限。这个命令是在2025年1月生效的。只要是美国资金投了中国项目，就需要去审核。他这个案子就审核了，最后通过的方式就是：这不是一家中国公司，我把中国公司的部分整个关掉，我搬到新加坡去。</p>



<p>而且呢，投资者就明确的要求 Manus 必须迁到新加坡，否则的话你这个审核通不过。而且呢，Manus 搬到新加坡以后，你也可以合规的去使用 OpenAI、Anthropic 这些美国的 AI 大模型了。</p>



<p>Manus 出走的原因，现在已经看得很明白了。不要想什么算力的问题，什么芯片的问题，他自己连大模型都没有，他要那玩意干嘛使？它也不是部署在开源大模型上的，它是部署在人家的 Anthropic 或者是 ChatGPT 这些闭源模型上的。所以它只需要往 Anthropic 或者是 OpenAI 这边去买 TOKEN 就完了，跟算力没啥关系。</p>



<p>Manus 出走的原因第二个，你要合法的使用 Claude 和 ChatGPT。第三个，要合法合规的为海外客户提供定制服务。因为未来的话，你继续去做这种泛 AI 人工智能，其实是有问题的。现在泛 AI agent 的所有服务，其实服务效果都不是特别好。在这样的情况下，只能去给人做定制的垂类的 AI agent。</p>



<p>最重要的一个呢还不是这些，最重要的一个，是避免跟国内这帮卷王继续内耗下去。国内的一众的 AI 真的都是免费的，就算你拿了 7,500 万美金的投资，一个这样的小公司，一百来人的小公司，你想去跟字节卷，还是想去跟百度卷？你卷不过人家的。别看百度现在市值还没有腾讯音乐高呢，但是依然是一个庞然大物。</p>



<p>现在国内的这些 AI agent，它的效果呢也都大差不差的。基本上呢，把国内的 AI agent 或者叫泛 AI agent 这条路给封死了。所以国内谁在说我要去做这个东西，别费劲，没有你任何机会。</p>



<p>那泛 AI 认证的这条路径到底对不对呢？大家都往里冲。前面我们讲了，泛 AI 认的这条路径，到目前为止还是有问题的。他算是一个美好的愿景，大家都希望把它做成，但是目前其实达成的效果都差强人意。</p>



<p>那么泛 AI 的既然解决不了大家实际应用的问题，为什么这么多大厂都进去卷，都免费的给大家提供大量的 TOKEN，让大家去使用呢？原因很简单，泛 AI agent 呢是可以吸引用户的。吸引了用户以后呢，你就可以进行垂直和定制的 AI agent 或者是 AI 应用的开发与销售了，这个是非常重要的。</p>



<p>而且呢，大模型只靠订阅和 TOKEN 是很难实现收支平衡的，必须要提供服务附加值。大模型厂商都在卷泛 AI agent，意思就是说，我再给你提供点别的服务，你再给我多交点钱回来。现在准备在这条路上一直卷到死的，也就是 OpenAI，收 200 美金一个月。</p>



<p>收2,000美金一个月。收2万美金一个月。我把这个东西给你做的非常漂亮。其他人其实也不太敢往这条路上生卷，都是吸引了用户以后，先说我包治百病。你包治百病完了以后，到医院门口的分诊台一看，你这个看个内科吧，你那个看个外科吧。他最后应该是这么来去，把整个的用户需求给消化掉。</p>



<p>那么最后呢，Manus的未来会怎么样呢？在新加坡招人组建团队呢，基本上是个伪命题。当一个人的薪资达到1万多美金的时候，在新加坡这样的一个城市，你想让他踏踏实实的做研发，难度其实是很大的。我有不少的朋友在那边做公司，你真的想让他在当地把研发整个跑起来的话，可能性很小。如果能够在新加坡、日本获得客户的话，估计还是要在大陆重新召集团团队，召集工程师，将项目完成掉。</p>



<p>现在呢，大张旗鼓的把它都裁掉。我现在是新加坡公司了。以后呢，再偷偷摸摸的招募，或者说招完了以后变成外包。这个也方便进行隔离。你到目前为止，字节跳动也没说我把这个研发团队都弄到新加坡去。他整个的研发还是要靠中国大陆。新加坡那边可能做一些运营，管理什么就可以了，或者说摆一些人，稍微给大家演示演示就行了。</p>



<p>要想继续引领潮流，开创新赛道，去新加坡呢，基本上就宣告了他已经放弃了这条路。如果他惦记着说继续引领潮流，说我要继续在泛AI agent这条路上接着跑下去，他就不会去新加坡，他会去美国。去了新加坡就肯定说，我怎么安安稳稳的把拿到手的投资把它消化掉，怎么把这些名声转换成我的客户，怎么变成我的利润和未来的一个发展。他一定是要做成这样的东西。</p>



<p>新加坡呢，当然还可以玩一些歪门邪道的东西。什么东西呢？比如说运营算力中心。我整一个算力中心，在这边做一些运营。比如说让国内的一些团队去使用他的算力，或者说是不是在偷偷的倒腾一点算力卡。这个都是可以在新加坡比较方便做的事情。日本东南亚呢，这种垂直的，定制化的AI agent的需求，其实是可以养活Manus。最后呢，在新加坡上个市，稳定的发展下去，应该也算是一个不错的未来了吧。</p>



<p>总结一下，地缘政治呢，正在割裂AI行业的发展。Manus跑路了。loveart，前面咱们介绍过的这个产品，还有一个叫Jinsmark，一开始就设立在美国。虽然都是中国公司，但是，都是跑到美国去开分公司。最早跑路的其实不是Medos，最早跑路的叫HEYGEN。大家还有没有印象前几年，郭德纲讲英文相声的这种视频，就是这个HEYGEN做的。</p>



<p>他呢，也是拿的benchmark的这个钱，拿了6,000万美金，然后就跑去美国去了。</p>



<p>美元资本呢，现在确实是有尴尬的地方。以前很多项目拿了美元投资以后，可以到美国去上市，滴滴什么这些。你在中国运营，拿了美元资本到美国上市。但是呢，也是滴滴，最后把这条路封死了。</p>



<p>再往后，拿了美元资本的人，就只能到香港去上市，或者说到新加坡、到美国去。这个是没有什么办法的。全世界一多半的AI，各个层级的开发者，其实都是华人，或者都是大陆人，大陆人居多。</p>



<p>美国非要在中间画一条线，那么未来这种神奇的故事就会一次又一次的上演。Manus呢，只是众多跑路的AI项目中的一个，不是第一个，也不会是最后一个。</p>



<p>好，这个故事就跟大家讲到这里。感谢大家收听，请帮忙点赞，点小铃铛，参加<a href="https://discord.gg/ppKsNkttTv" target="_blank" rel="noopener">DISCORD讨论群</a>。也欢迎有兴趣、有能力的朋友加入我们的<a href="https://www.youtube.com/channel/UCUGLhcs3-3y_yhZZsgRzrzw/join" target="_blank" rel="noopener">付费频道</a>。再见。</p>



<p></p>
]]></content:encoded>
					
		
		
			</item>
		<item>
		<title>设计师的未来已来？Lovart垂直AI Agent震撼体验，从Midjourney到多模型协作，揭秘AI如何颠覆传统设计流程与商业模式。</title>
		<link>https://lukefan.com/2025/06/01/%e8%ae%be%e8%ae%a1%e5%b8%88%e7%9a%84%e6%9c%aa%e6%9d%a5%e5%b7%b2%e6%9d%a5%ef%bc%9flovart%e5%9e%82%e7%9b%b4ai-agent%e9%9c%87%e6%92%bc%e4%bd%93%e9%aa%8c%ef%bc%8c%e4%bb%8emidjourney%e5%88%b0%e5%a4%9a/</link>
		
		<dc:creator><![CDATA[Luke Fan]]></dc:creator>
		<pubDate>Sun, 01 Jun 2025 00:41:19 +0000</pubDate>
				<category><![CDATA[AIGC]]></category>
		<category><![CDATA[AI Agent]]></category>
		<category><![CDATA[AI 数字人]]></category>
		<category><![CDATA[AIGC (AI生成内容)]]></category>
		<category><![CDATA[AI产品分析]]></category>
		<category><![CDATA[AI创业]]></category>
		<category><![CDATA[AI动画]]></category>
		<category><![CDATA[AI发展趋势]]></category>
		<category><![CDATA[AI商业模式]]></category>
		<category><![CDATA[AI工具测评]]></category>
		<category><![CDATA[AI教程]]></category>
		<category><![CDATA[AI模型聚合]]></category>
		<category><![CDATA[AI绘画]]></category>
		<category><![CDATA[AI视频生成]]></category>
		<category><![CDATA[AI设计]]></category>
		<category><![CDATA[AI赋能设计]]></category>
		<category><![CDATA[Canva]]></category>
		<category><![CDATA[ComfyUI]]></category>
		<category><![CDATA[Demo演示]]></category>
		<category><![CDATA[Flex]]></category>
		<category><![CDATA[Google Imagine]]></category>
		<category><![CDATA[GPT-4o]]></category>
		<category><![CDATA[LibLib AI]]></category>
		<category><![CDATA[Lovart]]></category>
		<category><![CDATA[MidJourney]]></category>
		<category><![CDATA[Photoshop]]></category>
		<category><![CDATA[stable diffusion]]></category>
		<category><![CDATA[YouTube封面]]></category>
		<category><![CDATA[YouTube封面设计]]></category>
		<category><![CDATA[产品体验]]></category>
		<category><![CDATA[剪映]]></category>
		<category><![CDATA[剪映 (CapCut)]]></category>
		<category><![CDATA[可灵]]></category>
		<category><![CDATA[可灵 (Keling)]]></category>
		<category><![CDATA[垂类Agent]]></category>
		<category><![CDATA[多模态AI]]></category>
		<category><![CDATA[工作流自动化]]></category>
		<category><![CDATA[提示词工程]]></category>
		<category><![CDATA[泛Agent]]></category>
		<category><![CDATA[泡泡玛特风格]]></category>
		<category><![CDATA[科技评论]]></category>
		<category><![CDATA[老范讲故事]]></category>
		<category><![CDATA[设计师]]></category>
		<category><![CDATA[设计师AI]]></category>
		<category><![CDATA[设计师失业]]></category>
		<category><![CDATA[设计师就业]]></category>
		<category><![CDATA[陈冕]]></category>
		<guid isPermaLink="false">https://lukefan.com/?p=2245</guid>

					<description><![CDATA[**设计师要失业了？Lovart这个AI神器真的好用到哭！😱**

啊啊啊啊啊！家人们，我今天必须和你们分享一个炸裂的东西——Lovart！这是一个专门为设计师打造的垂直AI Agent，简直是设计界的“救命神器”！我试用了一下，真的好用到哭，设计师们可能要慌了，小白们却要起飞了！😭

先说最震撼的点：你根本不需要啥设计基础，随便提个需求，比如“给我设计个YouTube封面，16:9比例，皮克斯风格，还要加字”，Lovart就能自动规划路径，调用各种模型（Flux、GPT Image啥的），直接给你生成成品！从图片到视频，从配乐到文字排版，一次搞定！我一个程序直男都能做出有点美感的东西，设计师们是不是要瑟瑟发抖了？😱

再说几个绝绝子的功能：
1. **超智能规划**：它会自己推理怎么做最好，调啥模型，咋排版，省心到爆！
2. **多模型组合**：集合了各种牛逼模型，生成效果吊打单一工具，细节控福音！
3. **一键出成品**：不管是海报、封面还是短视频，提需求就完事，效率直接拉满！

老实说，我用完Lovart的第一感觉就是：设计门槛真的被拉低了！以前做个封面要抠图、拼字、调色，费时费力，现在一句话的事儿，5秒出图不是梦！但也有点小遗憾，比如偶尔比例不对，文字会出错，不过瑕不掩瑜，整体效果还是让我破防了！😭

家人们，不管你是设计师还是小白，这个工具都值得一试！Lovart现在需要邀请码才能用，我已经在视频简介里放了3个，先到先得啊！没抢到的也别急，评论区见，咱们一起分享资源！真的不允许有人不知道Lovart，冲去试试吧，绝对会刷新你的认知！🔥

设计师的未来已来？Lovart垂直AI Agent震撼体验，从Midjourney到多模型协作，揭秘AI如何颠覆传统设计流程与商业模式。

设计师的未来是否会被AI改写？本文深入探讨了现象级产品Lovart——一款专为设计师打造的垂直AI Agent。我们将揭示Lovart如何超越Midjourney等单一模型，通过整合GPT、可灵视频生成及多种AI工具，实现从创意构思到多图层编辑、视频生成的一站式智能设计流程。文章同时分析了垂直AI Agent（如Lovart和AI编程的Cursor）相较于泛AI Agent的独特优势、面临的成本挑战，以及中国团队在AI创业浪潮中（如Lab Lab AI的探索）的机遇。这对于理解AI设计趋势和优化SEO内容策略至关重要。]]></description>
										<content:encoded><![CDATA[
<figure class="wp-block-embed is-type-video is-provider-youtube wp-block-embed-youtube wp-embed-aspect-16-9 wp-has-aspect-ratio"><div class="wp-block-embed__wrapper">
<iframe title="设计师的未来已来？Lovart垂直AI Agent震撼体验，从Midjourney到多模型协作，揭秘AI如何颠覆传统设计流程与商业模式。" width="900" height="506" src="https://www.youtube.com/embed/g_0tRfhUEkk?feature=oembed" frameborder="0" allow="accelerometer; autoplay; clipboard-write; encrypted-media; gyroscope; picture-in-picture; web-share" referrerpolicy="strict-origin-when-cross-origin" allowfullscreen></iframe>
</div></figure>



<p>设计师这次是不是真的要失业了？咱们从Lovart这个为设计师专门设计的垂直agent来看看AI agent在垂直品类里的一些玩法儿。</p>



<p>大家好，欢迎收听老范讲故事的YouTube频道。Lovart又一个现象级产品出来了，设计师专用的一个垂直agent。它呢没有Manus当时引起的那么大的动静，但是呢，我用了一下，感觉比Manus这种泛agent还是要好用一些。</p>



<p>什么叫泛agent？就是它啥都能干。Lovart这种能够专门为设计师工作的agent呢，它就是垂类agent，它其它事干不了。你说你给我去写个文章，给我去做个总结，这它干不了。但是你说你给我画个画，做个视频，设计一个PPT，设计个海报，做的可好了。他们设计的产品在x上被马斯克亲自点赞。因为这种设计类产品嘛，一个图片什么的，你要设计的非常好的话，确实会引起大佬点赞。很多的使用者也是惊为天人，我去使了一下，确实是很神奇，能够解决非常多的问题。</p>



<span id="more-2245"></span>



<p>什么叫设计师垂直agent？大家知道AI agent它可以自我规划，可以调用各种工具，然后完成一个完整的工作。最早的这种AI agent就是从生成图片开始的，Midjourney现在的话应该是Google imagine 4 GPT image，stable diffusion Flex这样的直接生图片的模型还是有很多的，最早也是从这开始。但是这个东西有一个很大的问题是什么？就是很难控制。你说我希望有稳定性，我每一次生成的这个人都要长成一样，我希望写字写对。即使是现在写字写的比较好的，比如说像吉梦模型或者是PPT的模型，但也经常还是会写错。所以我们使用这些模型的时候，经常的工作流程是什么样的呢？先画，画完了以后呢抠图，再到一些像Photoshop或者像我用Canva这种可画的平台里边儿再去拼，然后再把这个人把字儿重新拼在一起。既然这个流程已经确定了，找个agent把它整个儿都串起来，不就完事儿了吗？</p>



<p>再往后发展呢，就是一些可以进行串联，或者说进行一些工作流设定的一些产品。比如说像设计圈里的Confy UI这样的一些产品，你可以把这个工作流画好，它就按照这个工作流整个跑一圈下来。文字生成里头呢，用的像Defi code这种其实也是这种工作流设计软件。现在新的时代到来了，就是自我规划的agent。比如说像文档，各种的deep search。</p>



<p>Deep research这样的东西，你给他提出问题，剩下的该去查哪些网站、该怎么总结、该怎么去分析、如何去校对、如何减少幻觉、如何去把结果做得更漂亮，人家一次搞定。现在就是新的Agent的时代已经到来了。</p>



<p>这个为设计师工作的Agent呢，也走到了这一步。从最早的单模型Midjourney，到Confy UI这样的工作流设计的流程，到最后说干脆我一次给你搞定。现在Lovear就是这样的一个产品。</p>



<p>它呢，把一大堆的模型放在里头，比如说Flex、Google Imagine 4、PPT Image、Flex这些都放进去。这个里头没有Midjourney，Midjourney那个东西不是特别好控制。然后把音乐和音效生成搁里头，你说我最后要出视频，那我需要给你配乐都有，包括一些TTS的阅读也都放在里头，就是数字人的这种也都搁在里头。</p>



<p>视频生成模型，他掉的是可灵1.6，是快手做的视频生成模型，效果也还可以。我已经把模型搁这了，下一件事就是提要求就完了。你说我今天想要一个YouTube的封面，或者我想要YouTube里边的一个小的动画，你提要求就完了。</p>



<p>剩下的这个Lovart就自动地规划路径，还去调用一些推理的模型，比如说GPT O3这样的模型。它推理一下说，我到底怎么把这个路径规划得更好呢？再调用刚才我们讲的Flex呀、GPT Image呀、谷歌的Imagine，然后生成音乐，生成视频，配在一起。</p>



<p>最终呢，完成一个相对比较复杂的任务。而且还有很多Photoshop呀，或者Canva一些功能也搁在里头。这什么功能呢？就是图层。你说我现在要求在哪个图层上干哪些活，要求在什么地方写什么字，他就直接给你写就完了。不要让这个大模型再去费劲给你拼字去了，反正他也拼不对，咱们就别费这个劲了。</p>



<p>所以这个就是一个很完整的设计流程，一次搞定。真的是一个中国团队的产品，虽然这个团队在硅谷，但是呢，确确实实是个中国团队。他们最上面的一个公司呢叫Lab Lab AI。</p>



<p>这个Lab Lab AI呢，是中国最活跃的Stable Diffusion的社区。他们干嘛呢？就是把大量的Stable Diffusion上用到的Laura的这种微调的模型，都放在这展示。展示完了以后呢，我们去交换这些训练出来的这种微调模型就可以了。也有一定的商业模式，但是呢，发展的不是特别好吧，虽然很活跃。因为大家最后还是要去看说……</p>



<p>是不是能够形成正向的商业模式？好在是中国在做这个电商，做这个各种网红经济。在这一块，需要的设计师的量非常大，或者说设计师工作非常多。所以呢，他们也还是在运转。前面融资呢，也融了一些。后面呢，是找了一个很著名的创业者，开了美国的分公司。所以呢，Lovart这个产品是lablab.AI美国分公司做的。他们找的这个创业者，就是Lovart的创始人和CEO呢，叫陈冕，官冕的冕。他呢，是摩拜单车的产品总监。离开摩拜单车以后呢，是剪映和Capcat的全球商业化负责人。2024年离开剪映跑来去创业，做了一个叫Lovart的一个产品，做的还是相当不错的。</p>



<p>口说无凭，咱们来看Demo，看看我用这玩意干了些什么。这就是Lovart的首页。这个设计师做的页面确实是好看，比我们这些程序员直男做的东西要好看多了。这个它的页面就是lovart点ai。现在很多都是AI开始的域名。想要玩这个东西，要有一个邀请码，或者是加入等待链接。我是加入waiting list，等了一周左右得到的邀请码。我现在还有3个邀请码。get start就进来。我会把三个邀请码放在视频的简介里。如果大家想要去玩的话就拿三个邀请码去用啊。但是因为是会员先看到，所以可能公布到公众频道的时候，这个邀请码就已经用完了啊。也欢迎大家拿到新的邀请码以后，分享到我的评论区里头。</p>



<p>大家看到我现在已经没钱了，已经把所有的信用点都花光了。一共上来是给了1,000点。他是拿到邀请码给500点，每个月给500点。我要想再画要等下个月了。好，跟大家看一下他的一些干的活。这个就是我用了1,000点得到的这个结果。上来，请设计YouTube 16:9的封面视频。封面频道名是老范讲故事。视频题目是老范读评。这是每周三晚上8点的直播节目，读一周的观众评论。加上以我照片生成的皮克斯3D风格的角色设计。这是我写的提示词，给了一张照片，他就干活去了。说我先想想，我先思考一下这个活要怎么干，分析一下。说我应该是一个什么样的照片。可能呢，调的是GPT O3做的图像推理。推理完了以后再去调用这个知识库。我有哪些知识，是吧？这是一个哪样的一个设计建议啊？要用GPT image，要用这东西来去做皮克斯3D风格的角色，再加上这些文字要求，画到16：9的横纵比。结束了。这个是他做的一个规划。再去说，我这是一个创意了，我要去创意了。</p>



<p>这个皮克斯3D的东西应该怎么做？自己夸夸夸想去了。“老范读屏”这几个字55%高，要写在什么地方？周三，呃，20点直播，要写在一个什么样的字体？写在哪儿？底下，右下角要写“老范讲故事”。背景应该是一个橙金色的渐变色，而且是有一些什么样的要求？他就一个一个的去给你做去了。然后颜色，主颜色是什么？高亮颜色是什么？你做了一堆这样的要求。原型，一个什么样的东西啊？要写中文，要什么sans，应该是宋体，大概是写黑的。自己去研究了半天，就开始创建图片，干活去了，得到了这个图。现在不知道为什么他把这个大的删了，肯定还是成本问题。让我们来看一下图，就给你画成了这样的一个东西。这个还是很可爱的。“这个老范讲故事”这个“事”字写得稍微有些问题啊。“周三20:00直播”是“老范读评”。大家发现这东西有问题了没有？除了这个“故事”的“事”字写错了之外，还有问题。哪有问题？他不是16:9的，他是3:2的。它这个图的分辨率是1,500*1,000，实际上是3:2。为什么会成这样呢？因为它最后的这个背景图是拿GPT生成的，GPT到头就是3:2，再大的横纵比做不出来了。这是GPT的一个bug。也有问题，这个说你生成的是3:2的，不是16:9的。这是GPT 4o的一个bug，只能出3:2。我理解了，这个有个问题，让我再去做16:9。反正做了半天，他又做了个3:2的图出来，稍微改了改，大概是长成这样了。这个反正能使呗，到时候我再把这个脑袋抠下来，再把这字抠下来，回头下个礼拜读屏的时候，咱就用一次啊。反正也是挺好玩的，一个图就做出来了。但是大家看到的是什么？一句话，我真的是写了一句话，他就做了一个基本凑合还能使的东西。这就是这句话。你说设计师是不是要失业？你像我就是个写程序的直男，我就可以做到这样的结果了。设计师就会稍微有一点点痛苦了。他们的设计的一致性，这种反正我觉得还是有点美感的，设计出来还是可以用的。你看这个胖子还是有点点可爱的嘛，笑得多喜庆。好，咱们再看另外一个demo。这个demo是我让他去画，画视频去了，因为这东西是可以直接出视频的。看，我也是给了一张自己的美照，说：“给我一段视频，YouTube求点赞、关注、点击小铃铛的，用我的形象，生成泡泡玛特风格的人物形象，求点赞、求关注、求小铃当，时长5秒，绿色背景，方便抠图，统一用泡泡玛特可爱风格。”他就又想去了。这次他是使用了Flux，用了这个模型去生成的。这个像吗？</p>



<p>反正泡沫马特风格，大头，而且是这个。大家看这个塑料材质，至于像不像我，这个事就无所谓了，这个不重要。画成这样了，我也不好意思说它像我了。</p>



<p>调用可灵的视频生成，生成了5秒视频。你看，这个就是5秒视频，他就生成声音去了。这个声音其实做的很烂：“like subscribe and click the notification bell”。你看这是点赞、呃订阅、点击这个提醒的小铃铛，大概讲了这么一句话。把这俩东西给我拼一块吧：“like subscribe and click the notification bell”。我觉得不是特别满意，我说啊，别说话了，这个说的太难听了。</p>



<p>配音效加上3D的泡泡玛特风格的点赞，大拇哥的订阅小铃铛换成16:9的，人物要戴上眼镜。他又思考干活去了。这回呢，人戴眼镜了，这没毛病。给我生成了个音乐，这个是成出来的，它里头是有音乐生成的，大模型的，生成了一个视频。这次呢，有小铃铛，但是他这个小铃铛画的就很怪，他没法理解什么是点赞。这个看来可灵在这块还是稍微差一点点，5秒钟搞定。</p>



<p>我说这个做订阅的和小铃铛，这个点赞的3D形象太奇怪了，看不出来是做什么的。去网上搜索一下，它是可以搜索的，这个Agent可以搜索。而且也别来音乐了，改音效：鼠标点击声、气泡破裂声和铃音，给我改三个音效出来。他首先出去搜索了一堆，说这个是该干的，但是他并没有把它做得很漂亮。自己想了半天，又给我生成个头像，这样的头像。这次，他给你整了段音乐回来，说我来给你生成。你说他搜索了一大堆，你不知道他怎么想的，说我给你变成这样的点赞和订阅了。有的时候确实比较难以理解，让他自己配了段音乐给我加上了。不对，16:9你也没做出来呀，对吧？</p>



<p>我再接着提要求，我说这个按钮用这套，我干脆在网上搜了一套。其实刚才自己也搜出来了，用这套：订阅、点赞、评论、转发、小铃铛。静音，别给我配音乐了，后边我自己去配声音就完事了。把视频延长到8秒，但这个后来发现失败了，可灵最多也就是5秒，做不出8秒的来。他先分析一下，因为GPT-o3是可以进行图像推理的，他把我给他那张图片整个分析了一下，说没毛病。又生成了个头像，这次这个头发稍微长一点点，还是戴着眼镜的。说来给我生成，不知道他是为什么，整成这样了，就完全乱掉。呃我觉得已经可以用啊，怎么用啊？把这三个位置给它替换了就完，还是在剪映里，已经可以干活了，再生成。</p>



<p>他说：“我再稍微调整了一下，又换了一种。这次是生成四个小格了，这是四个小头像。到时候我到剪映里头，可以把这四个小头像换成点赞、小铃铛和叫做订阅，还有其他的，比如说评论啊，你就可以来做这个事。到时候自己去替换就好。”</p>



<p>他说：“我现在要去给你做8秒了，但是大家看下头，还是5秒，也就如此了。”他又给你稍微的细化了一下，各种生成。到这儿生成完了以后，又生成了一个版本。他说：“我给你做成这样了。”到这个版本生成完了，我就已经把这个给的1,000点就耗光了，就到这里就使完了。说：“你现在该交费了是吧？不交费不让使了。”</p>



<p>那么我们来看一下它的收费标准。这是零点儿，点击upgrade，这里就是收费标准了。我现在是0，它等于是上来给了500个信用点，有500个额外的限时的bonus，我就得到了这样的一个东西。下个月是不是还有啊？这个就不确定了，他反正没有写清楚。这个看吧，反正我现在把它使完了，是10个agent、125个GPT的图像生成、2,000个Flux图像生成、28个可灵的视频生成。我肯定没用到这么多，但是我确实把1,000点使完了。有限的模型使用，就是这个规则。</p>



<p>19美金一个月呢，是2,000点，每个月2,000点，再单独给2,000点。在第一个月单独给2,000点，就是你交了19美金就得到4,000点，下个月补2,000点。他是这样来工作的：40个agent、500幅GPT的生成、8,000幅Flux生成、111个可零的生成，无限的模型使用。这是可以有商业的license。你像我刚才这个就没有商业license，就是我生成的这些内容是不可以做商业使用的。那我交了钱以后，就可以去做商业使用了。当然还有更贵的了，这个收费标准我就不去评价。</p>



<p>Demo看完了，后边我们来讲一讲这种垂类的agent到底是不是一个方向的问题。现在呢，所有的泛agent的这种效果其实都差强人意。虽然我们使用文档、使用COS空间这样的这种泛agent，或者是grok的这种deep search、Deep research或者Deeper research，所有这些东西你都搁一块儿去使，你发现什么呢？就是你让他们去进行信息收集和总结的时候呢，效果还行，但是有的时候幻觉也是很厉害的。因为我被这玩意坑过好多次，生成的结果呢总是不是那么满意。而且像这种东西，你一开始提出任务，后边他就吭哧吭哧干去了嘛，而且干还干很长时间。</p>



<p>经常是干20分钟，你想在中间打断他，想在中间去补充一些信息，想在中间让他去调整个方向的话，没有办法。你必须让他把它干完了以后才能去调整，所以效果并没有那么好。虽然有很多人说：“你看我们给你一个什么筛选简历，给你一个什么样的案例，效果好极了。”但是这可能就是他们一开始设计的几个案例，就比较适合干这个事。大量的这种案例效果并没有那么好。</p>



<p>因为我现在是每天把各种的AI agent都跑起来，让每一家都给我去收集一遍，结果再去做比对，发现也还是挺累的。为什么？因为这东西话痨。就是你让他去收集了一堆信息了以后，啰里八嗦讲一大堆，而且经常里头是错的。你说你给我按照一个比较好看的方式给我展现出来，这个效果呢也就都将就吧，反正能算是有一点点设计，但是还是挺难看的。所以呢，这种泛agent效果真的不怎么样。</p>



<p>而且现在这些泛agent还面临着什么呢？就是这些模型厂商直接自己上各种深度研究、深度搜索的这种功能，直接把它覆盖掉了。你跟这些玩意比，你没什么优势，因为毕竟人家是模型厂商，对于模型更加了解。你在外面去做这种修修补补的事情，效果并没有那么好。你想说我出一个单独的这种视觉效果，或者出一个网页表现什么的，这块也都差强人意。毕竟咱们原来讲的叫模型及应用，谁做了模型谁就有应用。OpenAI、XAI、谷歌都在不断的去侵袭这些泛agent的这种领地，所以他们的日子其实并不好过。</p>



<p>那垂类的agent到底是不是可以逃脱被覆盖的命运呢？原来我们都讲说，ChatGPT更新了升级了，一堆人失业了，一堆创业项目死了。但是呢，垂类的agent会稍微好那么一点点。垂类agent干嘛？第一个就是专属知识库。我把一些特定的知识库专门总结出来，让他可以在里边去做RAG。就是我们通过一些特定知识库在里边去搜索，会得到更准确、更符合这个行业要求的结果，这是一方面。</p>



<p>第二个呢就是专属的提示词库，或者是干脆训练小模型。你可以让agent的规划做得更好。咱们以今天讲的这个Livechat来为例，他就完全可以做一个专门的提示词库。我就告诉大家说，咱们是如果是做哪些事情的话，应该先调用哪个模型，再调用哪个模型，哪个模型的这个提示词应该如何去写。这些东西是一堆设计师在里边去做的，他按照设计师自己的这个工作流程去给你设计这些提示词库。这个效果还是比这种你直接告诉一个ChatGPT，说来去给我设计提示词去吧。</p>



<p>给我设计流程去吧，要比这个效果要好。毕竟是真人有工作经验。在这里有些说，我需要大量的出这种规划，就是这种流程。规划的时候干脆就设计个小模型，你拿这些小模型直接出设计规划，效果会非常好的。</p>



<p>那么多公司的模型配合工作的，也是这种垂类agent的一个特性。因为刚才我们讲的就是大模型公司，想去覆盖这种泛agent的市场，它一定是什么？就只能调自己家的模型。openAI说我想去调谷歌的Gemini，这肯定搞不定，因为openAI它自己也不会干这个活。谷歌说想去调XAI的grok也不行。但是这些agent公司它是可以的，它是中立的。我可以把一大堆的模型串在一起，让各自干各自最擅长的事情。他这块还是有一定优势的。</p>



<p>特别是在做图像生成的时候，现在图像生成这个领域，还不像是比如说代码生成，或者文字生成。那些领域里头大家在你追我赶，而且跑得很快，相互之间也没有说谁会绝对领先，或者在哪一个领域里头特别的领先，其他人无可替代。所以你并不需要说，我把所有的模型都跑通，才得到一个最好的结果。都用openAI的也可以得到很好的结果，都用谷歌的也可以得到很好的结果。</p>



<p>但是图形这块儿不一样，midjourney、GPT、谷歌、Flex、stable diffusion各有各的长处。每一个模型有自己能够干的最好的这个事情。它把这些东西串在一起，能够去形成一个完整的agent流程的话，确实是可以解决很多用单一公司产品解决不了的问题。所以呢，这种垂类的，特别是像画图这样的这种工作，它的这种a站的产品，是有一些护城河的。它的护城河要比刚才我们讲的那种泛agent的要强一些。</p>



<p>其实有一个这种垂类agent的典型案例，到目前为止还是跑得非常快。这个典型案例叫cursor，就是AI编程现在跑得最快的。它真正强的地方不是它里头使用的cloud 3.7、cloud 4这些模型，它真正强的地方是它整个有一整套的符合程序员工作流程的提示词库，自己也训练了一些小的模型去配合各个模型在里边去工作。所以这种垂类agent确实是有机会的。</p>



<p>但是垂类agent的日子也没有那么好过。为什么这么讲？垂类用户，你既然叫垂直了，潜台词是什么？一定少嘛。你说我是泛agent，我什么都能干，那一定是很多的用户都有需求。你说我就是做设计的，那你说我没有设计需求，那肯定不是你的用户。所以它的用户量比较少，成本很高。</p>



<p>因为你调用的模型都是别人家的，像刚才我们讲的Lovart这种。你看看他这个收费标准你就知道了，他的不同的套餐收费标准里头，代表的是不同模型调用的次数。你像我现在已经把我的所有送的点都用光了，所以他的成本是非常非常难控制的，因为所有都在外边，也没法随随便便做补贴。烧钱他也烧不起，因为做这种特别是设计类的、多模态生成类的，这种模型本身对算力要求都非常高，必须要玩付费转化率。不付钱没法整，因为你没有办法说我大量免费，不停的吸引新用户进来转换，你必须要付费。那么它的启动就会比较难，它的收费规则制定也很复杂，因为你调用这么多家的模型，各家都有优惠，有什么其他的一些收费标准。你要把所有这些收费标准融合在一起，然后放到你这个整体的收费标准里头去，这个事也比较麻烦。</p>



<p>而且呢，他们还有一个成本非常高的地方在哪？他的研发成本也很高。你说这帮人都不去做自己的大模型，都调别人的模型，就是一帮写提示词的，他为什么研发成本高？他们需要干一个特别恶心的事情，叫跟模型。原来我们叫跟核，以前我们做，比如说浏览器底下是Chrome的核，我们需要去跟这个核。现在我们跟这么多的大模型一起打交道，这些模型每天在这升级，你就需要跟所有的模型。这两天比如说Flex新出了一个版本，叫K O N T E X T，可以实现一致性提升。而且他那个一致性提升，非常非常多的细节是掌握的更好。你现在想要把它用上，就要赶快派人去做研究，做研发，这个是非常非常累的。</p>



<p>原来我在Borland做Jbuilder的时候，也是这块儿非常累。为什么？因为当时我们需要去应对各种各样的j2ee的中间件，weblogic的、Oracle的、IBM的，还有Borland的自己的VC broker。这些东西他每天都在升级，那你升级了以后，谁升级了你都得跟着升级，要不然的话你没法支持最新的版本。他这个就很累，你等于非常多的研发成本要在里头，而且最后卖钱，你可能还卖不出这么多来。所以对于这种做垂类的agent的人，这一块的研发成本还是非常高的，而且是个辛苦钱。</p>



<p>还有一个比较讨厌的什么？就是烧钱。跟所有大厂比起来，他们都烧不过人家，所以这一块也是很麻烦。最后一点，如果做大了，容易被大厂惦记上。比如说现在编程这一块儿的垂类agent，windsuf已经被OpenAI收了，cursor现在长得很大，那微软说那我收拾收拾你吧。</p>



<p>GitHub Copilot直接集成到VS Code里头，而且GitHub Copilot直接把Agent的功能全加进去。我就要把你挤死，这个对于Cursor来说，也是有很大的这种压力的。而且其他的大厂，比如说像字节跳动出Trae，阿里也出了0码IDE，就是把它原来的编程插件直接集成到IDE里头来。那这一块的话，对于这些做AI Agent的厂商来说的话，也算是个幸福的烦恼。</p>



<p>什么叫幸福的烦恼？你做的小没人理你，做大了才有人去理你。</p>



<p>最后咱总结一下，垂类Agent其实就有点像中国人的移动APP。为什么是中国人的移动APP？移动APP这个市场里头，大量的排在靠前面的都是中国人做的。为什么呢？就是我们喜欢干这种工匠精神的事，叫知其然而不知其所以然。我也不去研究背后为什么，我就在前头去修修补补，去绣花。甭管是跟核也好，还是跟模型也好，做这个辛苦活，这个事是中国人擅长的。所以，干脆咱就拼勤奋，拼细节得了。</p>



<p>你说我吭哧瘪肚0-1去训练大模型，这事我们搞不定，而且现在芯片还不是那么好使。干脆你们都去训练大模型，我来想办法把这些模型凑在一块，解决一些实际问题。这一块确确实实是中国人比较擅长的。太多大厂懒得做，或者无法投入很多资源去做的领域里头，中国人就可以在里边找到机会。在某一些垂类领域里头，就可以做出一些有趣的产品来。</p>



<p>很多方向的机会，做这种垂类Agent的机会，就跟做APP差不多。举几个例子，比如说Keep这样的健身APP。你说我现在直接给你做成垂类Agent行不行？没有任何问题。营养师的健身教程，再加上训练私有的这种小模型，或者说我去做健身相关信息的这种垂类知识库，把这些东西搁在一起，再去做一些健身课程的规划和设计，健身数据的输入，再拿这个东西进行一对一的去指导。</p>



<p>或者是一些教学类的垂类Agent，比如学英语的，或者是学一些其他课程那种垂类Agent，都是可以做得出来的。或者是旅游行程规划。我最近因为有无人机了，老惦记出去玩儿去，那我就得用各种的泛Agent去测规划，发现巨难使。</p>



<p>我说我现在想规划一个从哪哪出发，到什么什么地方去，到那个地方怎么去玩，怎么去停车，怎么去充电，哪个地方是拍照打卡点，哪个地方是无人机的摄影打卡点，那有什么吃的什么玩的，有什么样的历史古迹，有什么故事，你去给我总结一下。每一次都啰里八嗦，给我整一个几万字的小作文。</p>



<p>弄完了，我连看都懒得看。看完了以后，发现也没有任何直接执行的可能性。为啥？因为写的非常多的东西都是错的。</p>



<p>如果这个东西你把它专门规划好了，做成一个agent，那肯定有人愿意用。或者拿机加酒挣钱就完了，就是买机票和酒店去挣钱，这个都是很好的创业方向。</p>



<p>医疗陪诊：我今天想去看个病，那你是不是可以调用各种医疗系统，帮我去挂号，帮我去选大夫，帮我去处理各种各样的检查结果？这个事是不是OK？</p>



<p>包括视频剪辑：Lovart的创始人叫陈冕，原来是剪映的。现在剪映也准备专门出垂类agent，叫百灵鸟还是叫什么，现在可能在安卓平台上在做，等他出呗。你像我们每次剪辑视频也可麻烦了，美颜一下，调个颜色，然后做音频的处理，这些东西直接上agent不就完事了吗？做一个垂类agent，这块可能在今年就可以看到。</p>



<p>而且在这块，剪映也好、快手也好，可能都会往前冲。因为剪映后边有吉梦，快手后边有可灵，他们自己这样的模型就已经做得很好。所以他们很有可能说，我把自己的剪映客户、快手客户，加上自己的这些模型，拼出一些垂类agent来，那这块也是可以期待一下的。</p>



<p>但这个大家就可能做的时候稍微小心一点。你跟剪映这种公司碰上，或者跟字节跳动这种公司碰上，比较痛苦。多选一些其他的品类，大家就可以在这儿去思考说，我这个行业里头，是不是有机会做一些垂类的agent出来，做一些有趣的、有价值的产品出来。虽然用户量不大，但是大家愿意付钱，让整个商业模式可以跑通。</p>



<p>这就是今天我们要讲的故事。感谢大家收听，请帮忙点赞、点小铃铛，参加Disco讨论群。也欢迎有兴趣、有能力的朋友，加入我们的付费频道。再见！</p>
]]></content:encoded>
					
		
		
			</item>
		<item>
		<title>AI大模型竞赛白热化：Meta于LLAMA CON belatedly 推出官方API与APP，对比OpenAI、谷歌Gemini、XAI及腾讯元宝的策略，其元宇宙捆绑和缓慢步伐是否已彻底错失良机？</title>
		<link>https://lukefan.com/2025/05/05/ai%e5%a4%a7%e6%a8%a1%e5%9e%8b%e7%ab%9e%e8%b5%9b%e7%99%bd%e7%83%ad%e5%8c%96%ef%bc%9ameta%e4%ba%8ellama-con-belatedly-%e6%8e%a8%e5%87%ba%e5%ae%98%e6%96%b9api%e4%b8%8eapp%ef%bc%8c%e5%af%b9%e6%af%94openai/</link>
		
		<dc:creator><![CDATA[Luke Fan]]></dc:creator>
		<pubDate>Mon, 05 May 2025 00:36:54 +0000</pubDate>
				<category><![CDATA[AIGC]]></category>
		<category><![CDATA[Meta的故事]]></category>
		<category><![CDATA[2023年]]></category>
		<category><![CDATA[2024年]]></category>
		<category><![CDATA[2025年预测]]></category>
		<category><![CDATA[AI Agent]]></category>
		<category><![CDATA[AIGC (AI Generated Content)]]></category>
		<category><![CDATA[AI发展]]></category>
		<category><![CDATA[AI战略]]></category>
		<category><![CDATA[Anthropic]]></category>
		<category><![CDATA[API服务]]></category>
		<category><![CDATA[ChatGPT]]></category>
		<category><![CDATA[DeepSeek]]></category>
		<category><![CDATA[Facebook]]></category>
		<category><![CDATA[Gemini]]></category>
		<category><![CDATA[Google]]></category>
		<category><![CDATA[GPT-4o]]></category>
		<category><![CDATA[Grok]]></category>
		<category><![CDATA[Groq]]></category>
		<category><![CDATA[LLaMA]]></category>
		<category><![CDATA[LLAMA API]]></category>
		<category><![CDATA[LLAMA Con]]></category>
		<category><![CDATA[LLAMA发布历史]]></category>
		<category><![CDATA[Meta]]></category>
		<category><![CDATA[Meta AI APP]]></category>
		<category><![CDATA[OpenAI]]></category>
		<category><![CDATA[Qwen (通义千问)]]></category>
		<category><![CDATA[XAI (马斯克)]]></category>
		<category><![CDATA[云计算]]></category>
		<category><![CDATA[亚马逊云]]></category>
		<category><![CDATA[产品体验]]></category>
		<category><![CDATA[人工智能]]></category>
		<category><![CDATA[元宇宙战略影响]]></category>
		<category><![CDATA[免费策略]]></category>
		<category><![CDATA[商业模式]]></category>
		<category><![CDATA[大语言模型 (LLM)]]></category>
		<category><![CDATA[字节]]></category>
		<category><![CDATA[应用程序 (APP)]]></category>
		<category><![CDATA[开发者大会]]></category>
		<category><![CDATA[开源模型]]></category>
		<category><![CDATA[微软云]]></category>
		<category><![CDATA[战略失误]]></category>
		<category><![CDATA[战略惯性]]></category>
		<category><![CDATA[扎克伯格]]></category>
		<category><![CDATA[扎克伯格 (Mark Zuckerberg)]]></category>
		<category><![CDATA[技术社区]]></category>
		<category><![CDATA[播客内容]]></category>
		<category><![CDATA[智能眼镜]]></category>
		<category><![CDATA[杨乐坤 (Yann LeCun)]]></category>
		<category><![CDATA[杨乐坤观点]]></category>
		<category><![CDATA[模型对比]]></category>
		<category><![CDATA[流量入口争夺]]></category>
		<category><![CDATA[深度学习]]></category>
		<category><![CDATA[百度]]></category>
		<category><![CDATA[社交优势]]></category>
		<category><![CDATA[科技评论]]></category>
		<category><![CDATA[竞品分析]]></category>
		<category><![CDATA[老范讲故事]]></category>
		<category><![CDATA[腾讯]]></category>
		<category><![CDATA[腾讯元宝]]></category>
		<category><![CDATA[行业分析]]></category>
		<category><![CDATA[起了个大早赶了个晚集]]></category>
		<category><![CDATA[追赶者]]></category>
		<category><![CDATA[阿里]]></category>
		<category><![CDATA[马斯克 (Elon Musk)]]></category>
		<guid isPermaLink="false">https://lukefan.com/?p=2160</guid>

					<description><![CDATA[**啊啊啊Meta你醒醒啊！！不买眼镜不让用AI是什么迷惑操作？！**

家人们谁懂啊！！最近被Meta气到摔手机！！🤯

事情是这样的⬇️
听说Meta终于出了官方AI助手APP，本科技宅连夜翻墙下载！结果刚打开就弹窗：「请连接Meta智能眼镜」？？？😱
我：？？？现在用AI还得先买雷朋眼镜？？（查价格中）打扰了告辞！！💸

**这波操作有多窒息：**
1️⃣ 全球用户：想用Meta AI？先交1500刀眼镜税！
2️⃣ 竞品狂喜：OpenAI/谷歌APP随便下啊喂！
3️⃣ 元宇宙PTSD：小扎你清醒点！现在2025年了！！

**对比隔壁学霸操作：**
✅ OpenAI：网页/APP/插件全平台打通
✅ 谷歌Gemini：更新慢但至少不卖眼镜！
✅ 腾讯元宝：撒钱送会员求着用户用！

**Meta三大致命伤：**
🔥 战略精分：左手元宇宙右手AI 结果两手空空
🔥 捆绑销售：眼镜滞销救救我们？
🔥 科学家拆台：自家CTO天天说大模型要完！

现在才想起来抄OpenAI作业？别人API都赚两年钱了！！💸
要我说赶紧做三件事：
1. 立刻解除眼镜捆绑！！
2. 学腾讯砸钱换用户！！
3. 把说风凉话的CTO嘴堵上！！！

所以问题来了👉 你会为Meta AI买雷朋眼镜吗？
（反正我不买🙅♀️ 评论区蹲个勇士实测！）

#AI #科技八卦 #Meta翻车 #信息差 #数码吐槽大会
（配图建议：Meta眼镜价格截图+卸载APP动图+扎克伯格元宇宙表情包）

AI大模型竞赛白热化：Meta于LLAMA CON belatedly 推出官方API与APP，对比OpenAI、谷歌Gemini、XAI及腾讯元宝的策略，其元宇宙捆绑和缓慢步伐是否已彻底错失良机？

Meta在其首届**LLAMA CON 开发者大会**上宣布推出对标**ChatGPT**的**Meta AI APP 智能助手**及官方**LLAMA API**服务，试图弥补其在大模型应用部署上“**起了个大早赶了个晚集**”的尴尬局面。然而，这款新**APP**竟要求用户必须连接**Meta**与**雷朋**合作的**智能眼镜**才能使用，形成了强制**捆绑**，而官方**API 服务**的推出也远落后于**OpenAI**、**Anthropic**等竞争对手，后者早已通过完善的**API**和多平台**客户端**积极抢占**流量入口**。与此同时，**谷歌Gemini**已调整策略迎头赶上，**马斯克**的**XAI/Grok**路径飘忽但紧随其后，国内如**腾讯元宝**更是专注于流量争夺。Meta的滞后被认为源于**扎克伯格**对**元宇宙**的持续**战略惯性**，以及其**首席科学家**、**图灵奖**得主**杨乐坤**对当前大模型技术路线的公开质疑。尽管**LLAMA**系列**开源大模型**曾有重要贡献，但其领导地位已被如阿里**Qwen**等超越，且Meta尚未与**Groq**等芯片厂商深入合作部署。分析指出，Meta仅靠模仿竞争对手补课已难以**追赶**，未来必须整合**AI Agent**能力，彻底放弃**眼镜捆绑**策略，并充分利用其庞大的用户基础和**社交场景**进行**变现**创新，才能避免在AI竞赛中彻底掉队。]]></description>
										<content:encoded><![CDATA[
<figure class="wp-block-embed is-type-video is-provider-youtube wp-block-embed-youtube wp-embed-aspect-16-9 wp-has-aspect-ratio"><div class="wp-block-embed__wrapper">
<iframe title="AI大模型竞赛白热化：Meta于LLAMA CON belatedly 推出官方API与APP，对比OpenAI、谷歌Gemini、XAI及腾讯元宝的策略，其元宇宙捆绑和缓慢步伐是否已彻底错失良机？" width="900" height="506" src="https://www.youtube.com/embed/0Oza4_J8cOU?feature=oembed" frameborder="0" allow="accelerometer; autoplay; clipboard-write; encrypted-media; gyroscope; picture-in-picture; web-share" referrerpolicy="strict-origin-when-cross-origin" allowfullscreen></iframe>
</div></figure>



<p>Meta召开LLAMA Con开发者大会。他原来丢的这些课程，现在补还来得及吗？</p>



<p>大家好，欢迎收听老范讲故事的YouTube频道。4月29号，Meta召开了首届的LLAMA CON开发者大会。Meta原来是开open大会，他反正每年都会开一到两次的这种开发者大会，这是开了第二次开发者大会了。这一次呢，主要就是对LLAMA进行了一些发布。前面LLAMA4已经发布过了，而且发完了以后还翻车了。现在呢，Meta说我也要去补课了。</p>



<p>补什么课呢？第一个是我要出一个独立的APP智能助手，叫MetaAI APP，对标ChatGPT。另外呢，我要开始面向开发者直接提供官方的LLAMA API服务了。这块呢，还准备去跟Groq这些芯片厂商去合作去，我帮他们去部署。现在呢，LLAMA的这些服务都是免费给大家使用的，LLAMA API未来有可能会收费。</p>



<p>你说人家OpenAI一出ChatGPT就开始给大家提供服务，APP也出了这么长时间了。这Meta真的是起了个大早赶了个晚集，到今天才想起来说我的这些API也要为大家服务了，我的APP也要为大家服务了，还来得及来不及？</p>



<span id="more-2160"></span>



<p>首先跟大家说一下使用的情况。MetaAI APP呢，我去下载了一个。下载完了以后呢，一开始说对不起，在你这个区域不服务，这个也很正常嘛。后来我又使用了一些手段，终于让他跑起来了。跑起来以后第一件事说，请把你的眼镜拿出来。什么眼镜呢？就是Meta的这个智能眼镜，跟雷朋做的这智能眼镜。说我必须要连智能眼镜，我在那跟他折腾了十几二十分钟。我说能不能跳过去，我说咱能不连这东西吗？不能，你只要启动这个软件就必须连这个智能眼镜，连不上它就不往前走了。我只能把它卸载了。</p>



<p>至于说LLAMA API呢，因为原来我们也在云端使用各种LLAMA的模型，LLAMA2、LLAMA3都用过。但是呢，都是由第三方云厂商来提供的，从来没有官方提供的。而第三方厂商提供的这些LLAMA API的话，就都要收费嘛，而且比较贵。现在Meta说我现在要官方提供了，你直接在Meta云上就可以用了，不用再到各个的平台上去找去了。而且你到各个平台上找了，他这个版本也不一致，有大的，有小的，还有各种微调过的版本，服务的水平也不是很一致。这块，你们统一都到官方来。而且你到了官方以后呢，还可以把这种微调的版本存在官方的云上。反正我有这么多GPU，咱跑呗。</p>



<p>现在用的人也少，咱们就免费。像Grok他们家的这个XAI的API，现在其实也是免费的。我现在每个月还是用的蛮多的，但是作为个人吧，应该是没有达到使用的上限。所以你基本上做各种测试、开发都是不要钱的。这后来者必须要靠免费，这是生生的迟到了两年。但是呢，依然做的非常的不彻底。</p>



<p>你想LLAMA1是Meta公司2023年2月24号发布的，当时发布出来这些事就应该干。现在都2025年5月份了，才开始搞这些事情，才开始补这个坑，真的是起了个大早赶了晚集。为什么整成这样呢？就是他一直在纠结元宇宙，直到现在为止还是没有放弃。你现在想要在手机上，甭管安卓手机、苹果手机，你想要用MetaAI APP，对不起，您还得去买他们家的眼镜去。也不知道他到底卖了多少眼镜了，你没有眼镜不让用，这个很神奇。</p>



<p>那么各大厂商都是怎么做的呢？看看人家先进同学、好同学，别人家的孩子怎么干的。OpenAI跟Anthropic肯定是标杆，这两家怎么干，其他人照着抄。每次发布新的模型、新的版本，一定是有官方的API出来。而且这些官方API通常是在它发布之后，有的时候可能就是当天就用了，有的时候会过个几周。比如说前两天发布的GPT4O image，就是画图的这个功能，应该是发布了以后过了两周还是三周，这个API就出来了，大家就可以上去用。而且在很努力的去争夺流量入口，甭管是OpenAI的客户端，安卓、iOS、Windows、Mac，我不知道有没有Linux版本，反正就全都有，包括各种网页都可以用。Anthropic也是如此，安卓、Mac、iOS、Windows都是有的，都在很努力的去抢占各种客户端，抢占流量入口。</p>



<p>还要去做什么？Chrome插件，就是你的浏览器上还要做插件。大家有没有试过在Chrome浏览器上安装OpenAI的插件？装上了以后呢，Chrome就警告，你说它想改这个默认搜索引擎行吗？你一说同意，你再往后在Chrome的地址栏里输入什么东西一打回车，就直接上OpenAI搜索去了，没有任何其他的功能，也要把这个流量入口抢回来。人家都是这么干的。</p>



<p>国内的厂商呢，通常都是站这一队，照这样学，包括是阿里、字节呀、百度。字节学的是最快的，百度跟阿里呢，还是要稍微的慢一点点。国内呢，是分两个阵营，大厂的其实通常都是云计算厂商，包括字节后边都是有云计算服务的。新势力呢基本上就是。</p>



<p>照着OpenAI和Anthropic这条路走，就没毛病了。因为OpenAI跟Anthropic都不是云计算厂商，他们两家的服务器都是部署在其他人的云上的。OpenAI是部署在微软云上的，Anthropic是在亚马逊云上。这个跟国内的云厂商还不太一样，国内蔚小理这些人基本上是一模一样在照抄他们的作业，也是在抢占流量入口。</p>



<p>谷歌的Gemini呢，原来也是有点晕头转向的。虽然事儿干了，Gemini的客户端也出来了，API在官方也提供了，但是呢非常难用。每一次有新模型出来以后，都是在AI studio，就是给程序员用的API接口这块，在这先出来。可能很长很长时间以后，才会去Google Gemini客户端。所以它这个版本更新的都非常奇怪，很多人说新版本出来了，我怎么用不上？你们一帮人在这说好，一帮程序员你们在这自嗨。我说对了，谷歌就是程序员的公司，它就是专门为程序员自嗨设计的。</p>



<p>但是现在好很多了，最新的版本Gemini 2.5 Pro已经在Gemini的客户端上直接可以使用了，而且可以免费使用。这就完完全全在抄OpenAI的作业，现在Google算是醒过味来了，而且这个作业呢基本上算抄对了。Gemini 2.5 Pro是我现在用过的各种模型里效果是非常非常好的一个，特别是对程序员很友好。所以我现在大量的工作都是使用Google Gemini来工作。</p>



<p>马斯克的XAI呢，它的路径比较飘忽。因为公司非常小，它的融资规模很大，但是人很少。他的路径呢经常是看谁家好，就赶快往里边飘一点，那边好就往这边飘一点。要开源，我也开源去了；要提供API，我也去提供API；需要APP吗，我也来了。现在Grok APP是单独的，是在x之外专门有一个APP叫Grok。你说我需要做什么deep research，需要做什么AI agent，这那我也上。一帮人更新了以后，我这个Xai的GROK3好像不是最新了，不是最好用的这个了。更新更新，5月5号这周，马斯克承诺要更新Grok 3.5出来。他就还比较飘忽。</p>



<p>腾讯呢，算是逼不得已自成一派。为什么？他前头走的比较慢，自己做的各种模型压根就没怎么做出来。等到DeepSeek上来以后说算了，我全线拥抱DeepSeek吧，就开始直接抢流量去了。就是底层模型它就不更新了，或者更新了，大家也不太惦记了。所以现在腾讯在用元宝跟大家抢流量。</p>



<p>Meta呢，到目前为止，其实依然没太想明白后边到底要怎么玩。虽然它开发了独立APP，虽然他现在开始提供官方API了，但是未来怎么办，他其实还没想明白，更不要说怎么能够赶上了。那你说Meta到底是，怎么整成这样的一个样子呢？起了个大早，赶了个晚集。</p>



<p>第一个大原因是战略上的惯性。扎克伯格呢，一直惦记搞元宇宙。这个原因也很简单，并不是说扎克伯格看到了元宇宙未来发展的方向，他只是被苹果恶心到了。作为一个这么大公司的老板，这么大的平台，全世界有这么多用户，被苹果狠狠地恶心了一把。因为他的软件必须要在苹果和安卓的设备上才可以去挣钱，才可以去放广告。苹果说我要管你，你的这个权限不能有，那个权限不能有，这个数据不能用，那个数据不能用，差点没被苹果弄死。然后扎克伯格说，我一定要革苹果的命。原来Facebook是个APP嘛，你要上人家的APP store才可以去工作，你上了人家的APP store，人家就要立规矩，你要去遵守。现在说APP是最差的，我坚决不要这东西。但其实呢，他所谓的元宇宙是他自己要坐苹果那个位置。在这个位置上，我要让其他的人都在我这下面做APP。他就惦记说我要去整平台，这就是他整元宇宙这个事的最初始目的。</p>



<p>后来发现搞不定，因为VR、AR都卖的不是很好。搞不定，那怎么办呢？转向这个大语言模型，因为别人都在做这件事，他不转这个向他搞不定。但是呢，内部的各种层级条块之间都不太愿意去放弃元宇宙这个事情。原因很简单，扎克伯格自己没放弃。现在他去开各种的什么财报会、年会、季会什么，还在那讲的，说我元宇宙这事没放弃，我还接着干呢。VR头像其实也还在做。但是呢，现在主要想去做跟雷朋设计的这个眼镜，我也没买过。甚至还出来说，我现在要进入时尚界，这个眼镜是最时尚的事情，在开始搞这样的一个，就是没有梗硬吃的这么一个事情。</p>



<p>现在在这样的一个平台下呢，特别是老大没有放弃的情况下，那只能大家说，什么事都得带上点。你如果不戴上的话，好像就是忠诚的不绝对，就是绝对的不忠诚。我记得原来有首诗词：“宰相巍巍坐庙堂，说着精量便要精量。那个幕僚上一章，头说精良尾说精良。轻狂太守在五洲，闻说精良星夜精良。山东河北久抛荒，好去精良胡不精良。”这个是南宋时期一个词人写的词。什么意思？就是这个宰相在庙堂上坐着，说我要把这个土地丈量一下。他说完了以后呢，拍脑袋说一出是一出。下边这些幕僚官署呢。</p>



<p>一看到这事，这赶快得说呀！我也得上一个章附和一下。从头说丈量，尾巴上也说丈量。有一个很轻狂的太守，听说要丈量土地了，星夜丈量，就是晚上就开始干，不要等明天了。说这个河南、山东、河北这么多地方都被金人侵占了，现在金人走了，这一块都抛荒了，你这怎么不去丈量？讲了这么一首词，其实就很像是Meta现在的一个状态。</p>



<p>做了个APP，还惦记把那个眼镜挂上，不挂眼镜不让你用。这个呢，算是在特定语境下的黑暗森林。黑暗森林法则是什么？就是猜疑链嘛！不知道你是不是好人，我也不知道怎么告诉你我是好人，我也不知道我告诉你是我是好人之后，你会怎么对待我。这个产业链无限延长以后，就没有办法沟通交流了。其实很多大公司都是这样的，现在对于Meta来说就是这样。我不知道你是不是元宇宙这一派的，我也不能告诉你我不是元宇宙这一派的，我是大模型这派的。我不能跟你说，我也不知道我告诉你了，我不是元宇宙这派的，你会怎么反馈。他会有这样的事情。</p>



<p>但我只知道呢，在这个公司里从上到下，你是不能批评元宇宙这个事的。你不能说元宇宙不好，这个事也不容置疑。这个事是变成这样。其实在任何一个语境里头，当某件事情不容置喙的时候，就会形成一个黑洞，就会变成一片黑暗森林。这个是Meta掉队的一个很重要的原因，因为他战略方向一直没有确定下来，还惦记玩元宇宙呢。</p>



<p>另外一个原因是什么呢？就是他的科学领头人太科学、太超前了。他科学领头人是谁？叫杨乐坤，是个法国人，后来跑到美国去。他呢是Meta的副总裁兼首席人工智能科学家，基本上就是他领头的。这光环满满，深度学习三巨头，这个项目是2018年获得图灵奖，所以也叫图灵奖三巨头。因为获图灵奖人多去了，但深度学习这块三个老大。然后呢，还有一个title叫卷积神经网络之父。这样的一个人在这带头，这么有钱的公司，这么多用户，老板也说我要去做大模型了，还有这样的科学带头人在这顶着，那咋就不行呢？</p>



<p>这个老哥每天出去演讲，都在讲什么？大语言模型不行了，靠预测TOKEN这种方式是搞不定的，这条路走不通。作为大学教授、科学家，你愿意讲什么讲什么没问题。他呢只是太超前了。未来一段时间，肯定还是会有新的方法、新的算法来去替代Transformer，来去替代这种TOKEN预测这个方式。你现在作为一个公司的副总裁和首席科学家，你讲这个话真的不合适。你讲这个，你让下边人怎么干活？怎么向你汇报工作？上杨乐坤这汇报工作来了。</p>



<p>我们把LLAMA4再怎么推进了一下，然后他给你讲了半天说这事不行，这条路走不通的。你说你咋办？所以Meta是一个什么样的现状？CEO还惦记搞元宇宙呢，首席科学家总在那说方向错了。那你让下边人怎么干活？好难。</p>



<p>他发了这四个版本的LLAMA，真的是为中国奠定了大模型的基础。没有他们，就绝对没有中国今天的大语言模型。什么人工智能、AIGC，整个都没有，都是从这开始的。所以还是要感谢他们。</p>



<p>但是呢，在自己的产品跟服务之中，只进行了非常有限的改进和融合，并没有完完全全把这些LLAMA用起来。新的流量完全放弃，因为他自己有的是流量。OpenAI、Anthropic、谷歌现在在抢占的这个流量，原来就压根没动过，到今天才开始想起来：“我也得得着这流量，不能让你们都拿走了。”</p>



<p>弄完了以后还眼镜捆绑上去，没有眼镜我不让你玩。我很高傲，玩了这么一套东西。新的技术社区完全任其自生自灭：“我把LLAMA做出来了，做完了以后呢，你不能在我的社区讨论，你也不要到我这儿来。去使用官方API？没有的，你们谁愿意用谁用。反正我头一个我把东西拿出来了，大家都跟着使，就这样就完事了。”</p>



<p>新的技术方向已经基本上失去领导地位了。开源大模型这一块，基本上是被阿里的Qwen站在前面，真正领旗的位置上了。那你说现在还来得及吗？咱们最后来回答这个问题。</p>



<p>结论：再照抄别人的作业，肯定是来不及了。因为人家已经提前跑了两年了，你现在大模型也不比别人先进，甚至还是测评翻车的一个状态。现在想把人家的这个官方API和独立APP这个作业抄上，就想去追赶，这是不可能的。</p>



<p>现在就还需要补更多的课。第一个是什么？就要把AI agent加上，现在他这一块呢还是短板，别人都已经走到这一步了，还得把这个课补上。第二个呢，别再捆绑眼镜了行不行？你想，Meta那么多用户，有多少用眼镜了？你现在是要把所有的Meta用户转换过来来做Meta AI，而不是说眼镜那几个用户。甚至这个眼镜用户，可能还要把这个吃灰的眼镜再拿出来，再去转换Meta AI。所以不要再去捆绑眼镜了。</p>



<p>如果不捆绑的话，过两天我再去试一试。如果真走通了要干嘛？像腾讯现在推元宝这样撒狠钱进去推。但是Meta好像在这块一直都比较佛系，因为流量对于他来说比较富裕嘛。他老觉得这些流量就在这待着，我只要是给了功能，大家就会去使。真砸钱去推这一块的话，Meta好像并不是特别激进。腾讯现在就是砸死了钱往里推。</p>



<p>一个月花多少亿人民币往里砸，现在在干这样的一个事情。Meta真正该干的活是什么呢？就是要放大自己的优势：场景、社交。要跟腾讯学，还有各种变现。Meta的变现就是在Meta上打广告，然后做各种的社交、内部的信息传播。这块是非常强大，有一堆人在围绕这一块去思考，再去写程序，再去创业。</p>



<p>Meta的LLAMA一定要在这一块要往前再走一步。如果这块不走的话，他一点优势都没有。这就是今天咱们讲的故事。Meta现在补作业还来得及来不及？</p>



<p>这个故事今天就讲到这里。感谢大家收听，请帮忙点赞，点小铃铛，参加DISCORD讨论群。也欢迎有兴趣、有能力的朋友加入我们的付费频道。再见！</p>



<p></p>
]]></content:encoded>
					
		
		
			</item>
		<item>
		<title>Manus独领风骚成过往？字节扣子空间与百度心想APP强势入局，深度评测揭示AI Agent新格局下谁能主导复杂任务自动化与MCP生态。</title>
		<link>https://lukefan.com/2025/04/24/manus%e7%8b%ac%e9%a2%86%e9%a3%8e%e9%aa%9a%e6%88%90%e8%bf%87%e5%be%80%ef%bc%9f%e5%ad%97%e8%8a%82%e6%89%a3%e5%ad%90%e7%a9%ba%e9%97%b4%e4%b8%8e%e7%99%be%e5%ba%a6%e5%bf%83%e6%83%b3app%e5%bc%ba%e5%8a%bf/</link>
		
		<dc:creator><![CDATA[Luke Fan]]></dc:creator>
		<pubDate>Thu, 24 Apr 2025 00:44:49 +0000</pubDate>
				<category><![CDATA[AIGC]]></category>
		<category><![CDATA[字节跳动，故事多]]></category>
		<category><![CDATA[AI Agent]]></category>
		<category><![CDATA[AI应用]]></category>
		<category><![CDATA[AI竞争格局]]></category>
		<category><![CDATA[Anno 1800]]></category>
		<category><![CDATA[Anthropic]]></category>
		<category><![CDATA[API接口]]></category>
		<category><![CDATA[Baidu]]></category>
		<category><![CDATA[ByteDance]]></category>
		<category><![CDATA[Claude 3.5]]></category>
		<category><![CDATA[Coze Space]]></category>
		<category><![CDATA[Coze Space评测]]></category>
		<category><![CDATA[DeepSeek R1]]></category>
		<category><![CDATA[Gemini 2.5 Pro]]></category>
		<category><![CDATA[Google]]></category>
		<category><![CDATA[GPT-4o]]></category>
		<category><![CDATA[Llama 4]]></category>
		<category><![CDATA[LLM]]></category>
		<category><![CDATA[Manus]]></category>
		<category><![CDATA[MCP (模型控制插件/标准)]]></category>
		<category><![CDATA[Meta]]></category>
		<category><![CDATA[OpenAI]]></category>
		<category><![CDATA[PPT生成]]></category>
		<category><![CDATA[Token消耗]]></category>
		<category><![CDATA[Waiting List]]></category>
		<category><![CDATA[产品体验]]></category>
		<category><![CDATA[产品对比 (Coze vs Manus vs Grok vs XinXiang)]]></category>
		<category><![CDATA[产品评测]]></category>
		<category><![CDATA[代码生成]]></category>
		<category><![CDATA[任务拆解]]></category>
		<category><![CDATA[优劣势分析]]></category>
		<category><![CDATA[免费试用]]></category>
		<category><![CDATA[内容生成]]></category>
		<category><![CDATA[功能演示]]></category>
		<category><![CDATA[可视化网页生成]]></category>
		<category><![CDATA[呼伦贝尔自驾]]></category>
		<category><![CDATA[复杂任务处理]]></category>
		<category><![CDATA[大语言模型]]></category>
		<category><![CDATA[字节跳动]]></category>
		<category><![CDATA[工具调用 (内部/外部)]]></category>
		<category><![CDATA[市场调研]]></category>
		<category><![CDATA[心想APP]]></category>
		<category><![CDATA[扣子空间]]></category>
		<category><![CDATA[扣子空间使用]]></category>
		<category><![CDATA[搜索质量]]></category>
		<category><![CDATA[数据调用]]></category>
		<category><![CDATA[文档生成]]></category>
		<category><![CDATA[旅游攻略]]></category>
		<category><![CDATA[智能体]]></category>
		<category><![CDATA[游戏攻略]]></category>
		<category><![CDATA[现象级产品]]></category>
		<category><![CDATA[用户分析]]></category>
		<category><![CDATA[用户反馈]]></category>
		<category><![CDATA[电动车充电]]></category>
		<category><![CDATA[百度]]></category>
		<category><![CDATA[简历筛选]]></category>
		<category><![CDATA[自动化]]></category>
		<category><![CDATA[自我规划]]></category>
		<category><![CDATA[行程规划]]></category>
		<category><![CDATA[表格生成]]></category>
		<category><![CDATA[访谈记录整理]]></category>
		<category><![CDATA[豆包大模型]]></category>
		<category><![CDATA[通义千问]]></category>
		<category><![CDATA[邀请码]]></category>
		<category><![CDATA[阿里]]></category>
		<category><![CDATA[高德地图]]></category>
		<category><![CDATA[黑神话悟空]]></category>
		<guid isPermaLink="false">https://lukefan.com/?p=2132</guid>

					<description><![CDATA[【🔥AI圈地震！字节下场搞大事！】
啊啊啊啊啊啊啊！家人们不允许还有人不知道这个神器！！！字节最新黑科技「扣子空间」杀疯了🔥输入邀请码就能白嫖AI助理！手把手教你怎么玩转这个新物种👇

1️⃣输入邀请码秒进内测！
老范讲故事 邀请你体验扣子空间，快来和 Agent 一起开始你的工作吧！
https://www.coze.cn/space-preview?invite_code=AMMNLBE0
https://www.coze.cn/space-preview?invite_code=EYWXBAS8
https://www.coze.cn/space-preview?invite_code=Y5OKA3H6
https://www.coze.cn/space-preview?invite_code=1WH2Q2L1

2️⃣甩给它复杂任务直接躺平
3️⃣坐等AI自动生成攻略/行程/PPT
4️⃣生成的邀请码记得分享给姐妹！

刚用它做了呼伦贝尔自驾游攻略🤯全程自动调用高德地图+飞书文档！连充电桩位置都标得明明白白！！！游戏党狂喜🎮扔个游戏名直接出完整时间线/DLC攻略/角色档案，最后还自动生成可视化网页！！

⚠️但要注意！！目前每天只能跑5-10个任务，生成结果需要二次检查（毕竟AI偶尔会抽风）墙裂建议先用规划模式让AI拆解任务，中途还能随时调教！

【划重点】现在国内大厂全在all in这个赛道！百度「心想」APP也在悄悄内测！AI助理真的要取代打工人了？？评论区蹲个课代表总结差异👇

（悄悄说：老范的5个邀请码只剩最后4个了！手慢无！！）

#AI神器 #打工人必备 #职场黑科技 #AIGC #互联网新风口

Manus独领风骚成过往？字节扣子空间与百度心想APP强势入局，深度评测揭示AI Agent新格局下谁能主导复杂任务自动化与MCP生态。

随着现象级产品Manus的后劲显现，字节跳动的扣子空间和百度的心想APP等国产AI Agent（智能体）相继上线，标志着这一赛道进入新阶段。这些工具依托GPT-4O、Claude 3.5、Gemini 2.5 Pro以及国产大模型（如DeepSeek、通义千问、豆包），核心能力在于通过自我规划执行复杂任务，利用内部及通过MCP（Multi-Component Platform）集成的外部工具集成进行自动化的信息搜集和内容生成（如网页、PPT、文档）。本次我们通过邀请码深入体验了字节跳动的扣子空间****免费试用版，测试了其规划与探索模式、文件处理、高德地图/飞书等MCP调用能力，并生成了游戏攻略网页、旅行计划飞书文档等。尽管用户体验显示其框架可用，但内容细节仍需验证，Agent间信息传递偶有错漏。对比Manus及Grok等，各家在搜索质量、数据独特性（如抖音、X平台）、工具丰富度上各有千秋。当前应用仍以信息处理为主，业界普遍期待未来趋势是打通基于MCP的真实交易闭环，那将是AI Agent发展的下一个重要里程碑。]]></description>
										<content:encoded><![CDATA[
<figure class="wp-block-embed is-type-video is-provider-youtube wp-block-embed-youtube wp-embed-aspect-16-9 wp-has-aspect-ratio"><div class="wp-block-embed__wrapper">
<iframe loading="lazy" title="Manus独领风骚成过往？字节扣子空间与百度心想APP强势入局，深度评测揭示AI Agent新格局下谁能主导复杂任务自动化与MCP生态。" width="900" height="506" src="https://www.youtube.com/embed/Wauo2C72R2c?feature=oembed" frameborder="0" allow="accelerometer; autoplay; clipboard-write; encrypted-media; gyroscope; picture-in-picture; web-share" referrerpolicy="strict-origin-when-cross-origin" allowfullscreen></iframe>
</div></figure>



<p>Manus的后劲来了。百度、字节都有了自己的agent产品上线。</p>



<p>大家好，欢迎收听老范讲故事的音乐节目频道。字节上线了扣子空间，百度上线了心想APP。Manus的光环不再。Manus本身就属于意外爆火，当时它突然火了以后，咱们还做了直播，说这个东西没有什么技术门槛，只是产品设计的很有意思。</p>



<p>Manus跑去跟阿里合作了之后，那字节、百度说这不行，咱们也得有自己的产品上线。又不是有多难做的东西，那就做呗。我呢，搞了一个字节扣子空间的邀请码，咱们呢试一试，看看这个产品到底怎么个用法儿。</p>



<p>Manus呢，到现在我也没用上。原因也很简单，我去申请测试，等了很久，到现在都已经开始收费了，也没有收到说你可以来玩一下的这个邀请。所以也就别费劲了。我自己呢也没有特别着急，我要特别着急想用的话，随便找两个人去要一些邀请码，也还是可以搞得定的。既然没有那么热心的话，也就没有上心去找嘛。</p>



<span id="more-2132"></span>



<p>AI agent呢，其实主要还是做自我规划、完成复杂任务。就当我看明白这个东西到底是干什么了以后呢，就没有那么着急了。如果对于输出的结果没有什么特殊要求的话，其实用Grok的deep search或者是open AI的deep research都是够用的。只是这些工具呢，输出的都只是一个文档，就是一个Markdown文档，或者说是一个富文本的文档而已。</p>



<p>我想去生成个网页，想去生成个表格，它就稍微差点意思。而且呢，Grok的deep search可以使用的工具是有限的，就是一些内部工具。现在呢还不支持我们去调用外部工具。像Manus这种东西呢，它除了内部工具之外，有一些外部工具，可以通过一些接口放进来。如果是对输出结果有一些要求，说我想输出个网页，我想输出个应用，可能就需要使用Manus这样的工具了。</p>



<p>新的方向有了，大家就冲就好了。现在新方向是什么呢？就是Manus给大家指明的新方向，叫agent加MCP。现在的大模型呢，基本能力已经够用了。GPT4O及以后的版本，Claude 3.5及以后的版本，Gemini 2.5 Pro以及往后再出的各种版本，其实都已经可以实现agent的全套功能。</p>



<p>这里头比较倒霉的就是Meta，他现在出的LLAMA4好像稍微差那么一点点。国内的模型呢，比刚才我们讲的这几个要稍微差一些，但也勉强能用。比如说DeepSeek R1，比如说通义千问的千问QWQ 32b。</p>



<p>通义千问的推理模型，以及豆包1.5的推理模型，最近这两天也发布出来了。百度文心一言呢，他自己号称他的4.0推理模型是可以用的，但是我没有去测试，实在是懒得跟他费劲。</p>



<p>这些大模型给他一个任务以后，他把这个任务拆解出来，进行一些规划，基本上是可以使了。在自我规划之后呢，就是数据调用和内部工具使用，这个就会看出各家的差异来。因为你输出的结果怎么样，跟你搜索的结果是息息相关的。你如果搜索质量差的话，那你输出的内容就会变得很烂。</p>



<p>我为什么很少使用GPT的各种推理模型，包括它的深度思考去干活呢？因为它的搜索质量实在太烂，所以经常出来给我胡说八道。而且有一些比较特殊的资源，只有某些内部可以使用。比如说X上面的帖子，只有Grok能用，其他人你用不了。或者说抖音里边的视频，我们根据字幕来进行一些搜索和总结，这事除了字节，别人也看不了。这就会产生差异出来。</p>



<p>在内部的数据跟工具使用了之后，还可以使用外部工具。现在MCP标准呢，已经基本确立了，各大平台都开始出官方接口了。前几天还跟大家演示过，使用高德地图进行行程规划，还是非常有意思的。</p>



<p>剩下的是什么呢？剩下的就是等就好了。因为这种任务你扔进去以后，没有个十几二十分钟他出不来。等的过程中就是TOKEN在燃烧。后边就是一次一次的调用大模型，哗啦哗啦在那跑，TOKEN就在干这个事了。</p>



<p>今天呢，咱们测试一下扣子空间。扣子空间呢，应该是4月19号吧，低调上线，也没开发布会，什么也没说，这东西就来了。也是需要邀请制或者是报名去等待。我呢，就直接找了人说：“给我发个邀请码过来。”人就给我发过来了。</p>



<p>拿到邀请码以后，你进去完成第一个任务，也就是让扣子空间给你去做第一个项目以后，你就可以生成5个新的邀请码。待会呢，我会在视频的简介里头贴4个邀请码。我的5个邀请码已经有人用了一个了，还剩4个。想试的人呢，可以到那去找邀请码去试去。</p>



<p>你试完了以后呢，也欢迎你把自己在生成的新邀请码，没有用过的，还贴到我们的评论区里头，让其他想试的人可以去使用。在海外的人现在别费劲，<a rel="noreferrer noopener" href="https://xn--coze-uf1gw62h.cn/" target="_blank">只有coze.cn</a>上才可以用，只有在墙内的人才可以用。</p>



<p>现在呢是免费试用，每天呢可以跑5-10个中等复杂度的任务，就是跑十几二十分钟这种，我们算中等复杂度吧。长了呢，可能能够跑个几小时，但是我现在还没有规划这么复杂的任务让他去干。</p>



<p>完成的工作呢，算是有一点点小惊喜吧，待会咱们看一眼。但是呢，内容不能细看。</p>



<p>很多的内容还是比较粗糙的。下面我们来演示一下，这就是我们的扣子空间。进入以后，你点击快速开始。如果像我这样已经有使用权限的，就干活去了。如果你没有使用权限的，可以加入他的waiting list，或者是输入邀请码。邀请码在咱们视频的简介里边去找。</p>



<p>下面是他的一些样例，就是这些是能干什么。这个很重要，为什么呢？就是当你看到了这些样例以后，你就说，我可以去拿他的提示词改一改，就去干活去了。比如说什么股票早报定制、什么深度调研、访谈记录整理。当然访谈记录，你要给他一个很复杂的访谈记录，他才去给你整理去。包括AI产品的用户分析，那你要给他一大堆的用户调研报告，他去干活去。包括什么游戏攻略撰写，待会我们去试试。还有的一些呢，是比如说写旅游攻略、市场信息调研，这个都是可以的。</p>



<p>我们点进去了以后呢，就会到达这里。这就是老范讲故事做的扣子空间了。但是注意这里头有两个模式，一个呢叫探索模式，一个呢叫规划模式。探索模式就是你给它一提示词，它噼里啪啦就给你干完了。规划模式呢，你给他一个提示词，他呢先去做一个规划：这样干行不行？我去按这10步干，还是干这20步干？你在这个时候还可以调整，调整完了以后他去干去。如果你是这个探索模式呢，直接干完就出结果。如果是规划模式的话，中间他遇到问题，他会停下来问你：“对不起，这有一个问题我搞不定了，咱还干不干？”或者有什么其他方法，你可以再跟他聊两句，他再接着往前走。更像个人规划模式。但是，规划模式呢，会更加消耗时间和TOKEN。我就不在这现场给大家试了，因为现场事实在是太慢了，没有个20分钟跑不完一个项目。</p>



<p>这个地方呢是上传文件的，只识别文字的部分。你说我上传个图片给我识别一下，目前还不可以。最多可以上传10个，单个文件的最大是50兆。比如说我有一大堆的这个简历，把它打包扔上去。扔上去以后呢，他把里边的内容都给你找出来，说哪一个是符合我要求的。这个是可以做简历筛选。或者你给他一大堆的用户的调研报告，他也可以去给你分析。</p>



<p>这边呢是MCP扩展，大家看到了有高德地图、飞书云文档。你比如说我添加这个，最后说请把输出的结果写在飞书云文档里，它就给直接给你做完了。或者你说我从里边去读取信息，都是可以的。包括飞书多维表格、飞书电子表格。你说我有一堆的用户调研报告，都是存在这个里边了，你可以让他直接去读去。图像工具呢是可以做文生图，但是效果一般，我试过了。语音合成也是可以。</p>



<p>Notion可以在Notion里边去创建、读取、编辑、更新，包括GitHub、MySQL的一些查询，ClickHouse的一些查询，这个都是允许的。ClickHouse就是有些人把比如用户的数据放在里头，这个都可以拿来去分析。就是你需要哪个，你就在这里头添加。把这都弄完了以后，直接点开始就完了。点一次基本上20分钟就不见了。像我们这种免费用户的话，每天可以点个5-10次。</p>



<p>我们来看一看他干的怎么样。第一个呢是前面有案例说：“请给我分析《黑神话：悟空》的攻略。”现在我说：“你给我做《纪元1800》的详细游戏介绍文档，包括发布后的完整时间线，涵盖每个关卡和DLC的详细介绍，以及基础策略和故事线的介绍。同时列举出主要人物角色和各项任务的情况。最后报告用可视化网页呈现。”</p>



<p>他说：“我接到你的任务了，我要开始干活去了。”先思考一下去搜索：《纪元1800》什么时候发布的？游戏背景是什么？基础信息是什么？思考的过程又去想去了：关卡、DLC、策略，挨着个儿去搜索它。等于就是搜索了大量的内容，再去思考说：“我们现在开始把一些基础信息保存下来。”去生成网页，生成UI。UI完成了，然后生成代码。代码呢要进行解析、分析和检查。完成了以后给它配图，但实际上没有什么图进来，可能有一点小图标进来。配图完成，开始部署。最后就生成完了。大概整个跑了20多分钟。</p>



<p>做出来的结果是什么？就是这样的一个结果，说：《纪元1800》游戏指南。这个游戏背景是回到工业时代之初，19世纪初的工业化。基本上写的都是对的，因为都是搜索出来的嘛。游戏核心呢是城市建设，依托于海岛港口的小型农庄起步，逐步建设各种的养殖场和工厂，以及公共设施，形成繁荣的近代都市贸易系统。一项一项的就去讲去了。</p>



<p>你看它还是有一点点小动画的。这边是时间线：2019年4月16号正式发布的，2020年8月11号有各种组合包，DLC就开始上线。到2023年呢，登录了PS5和Xbox。2024年呢，又在出新的组合包。</p>



<p>然后DLC的一些详情。这个里头呢就告诉你说：植物园的DLC，推荐指数是什么？植物园、沉默的宝藏、植物园航道、权力之座、狮子之地。好像有些DLC我是有的。贸易港，这个里头是说有这么多，哪个是推荐去买的，哪个不是那么推荐的。推荐指数五颗星制。然后呢，是有季票，就是你买了季票以后呢，包含了哪些DLC了。这是第一个季票，第二个季票，大概是这样的一个购买方式。</p>



<p>就是你买了本体以后，还可以买季票，或者买这些DLC继续丰富游戏。策略呢，也告诉你了，说我要先干什么后干什么：初期什么，中期什么，后期什么。这是策略，这是故事线，稍微的跟大家讲解了一下。</p>



<p>然后是角色。这个里头呢，只写了两个，其实他角色是很多的。清公主是比较有名的一个角色了，都是他们有什么特色。然后系统任务有哪些任务：什么拍照任务，解谜任务。其实任务非常多，这个就是非常不完善了。但是呢，这就是给你的一个结果。</p>



<p>前面的提示词大家看到了，最上面是提示词，然后是一项一项的去干活去了。后面我就让他做了一个什么项目呢？做一个PPT说明吧：扣子空间目前免费使用的版本，背后是哪些大模型，内置了哪些工具，可以通过MCP挂载哪些工具，免费试用的用户有多少额度，额度如何计算，每天可以做几个任务，如何计费。扣子空间擅长做哪些任务，为什么没有大张旗鼓的宣传呀？用户对于扣子空间的反馈怎么样？扣子空间跟百度、跟Windows、跟Grok的deep search之间到底有什么差异？他就去挨着个儿搜索，搜索完了以后再去生成PPT，大概是这样的。</p>



<p>右边我们就看到了这个PPT。当然它这个PPT呢，下载下来是一个PDF。有些部分还可以，但是呢，有些部分明显的就没搞明白，包括计费的部分。实际上它属于明显的没搞明白。但是我们就一句话呀，虽然它做了十几二十分钟，但它确实给我们做了一个还能看的PPT出来哈。我们可以在这下载这个PDF：扣子空间介绍功能、使用反馈和优势点PDF。你可以下载下来。</p>



<p>然后呢，我让他做了一个稍微复杂一点的。这个是什么？我需要在5月10号到17号，从北京出发7天，呼伦贝尔大草原自驾旅行，一共两个人，预算5万元左右。我喜欢自然风光、隐藏的宝地和蒙古文化。我想从北京自驾出发，一路开电动车，需要规划充电站。请详细的给我行程安排和一个内容丰富的飞书文档旅行手册，包括地图、景点描述、旅拍和航拍的打卡点、必备的装备、每日行程、一路上的特色美食，以及我们每个行程中可以参考的旅行小贴士。将飞书文档保存到我的飞书账号。但是你使用飞书呢，它就会让你认证一下，说你的飞书账号是哪个，它到时候就给你存进去了。</p>



<p>最后呢，它给我生成了一个什么？这个过程我们就不仔细看了，因为我还调用了高德地图。它里头到底如何开，到了哪个地方，有什么吃的，哪个地方有充电站，这个都是由高德地图来去提供的。做了可能有半个小时吧。</p>



<p>第一天：从北京开车到锡林浩特<br>北京出发，走G6京藏高速。中午到张家口休息，再往锡林浩特方向开，约4小时车程。<br>打卡贝子庙、鄂尔古纳敖包，感受蒙古文化。品尝手抓羊肉、咸奶茶。<br>充电站位置：锡林浩特市区XX充电站。</p>



<p>第二天：锡林浩特到阿尔山<br>上午出发，走S307省道。中午在东乌珠穆沁旗用餐。下午继续前往阿尔山，沿途景点包括XX草原、XX湖。<br>晚上入住阿尔山XX酒店（需提前预订）。<br>景点介绍：普留克（特色美食）、炸柳根鱼（当地特色）。<br>充电站位置：阿尔山市区XX充电站。</p>



<p>第三天：阿尔山到满洲里<br>出发路线：走S203省道。中途在XX镇用餐。<br>满洲里景点：套娃景区、XX民俗村。<br>充电站位置：满洲里市区XX充电站。</p>



<p>第四天：满洲里到黑山头<br>行程安排：上午出发，中午在XX镇用餐。下午抵达黑山头草原活动营地，参与蒙古族民俗活动。<br>充电站位置：黑山镇XX充电站。</p>



<p>第七天：海拉尔返回北京<br>行程调整：第七天应从海拉尔返回北京，建议乘坐飞机或高铁。</p>



<p>旅行装备：<br>&#8211; 衣物：5月份昼夜温差大，需准备保暖外套、长裤。<br>&#8211; 生活用品：牙刷、保温杯、驱蚊用品。<br>&#8211; 摄影器材：相机、三脚架、无人机（航拍必备）。<br>&#8211; 车载用品：充电器、地图导航设备。</p>



<p>旅行小贴士：<br>&#8211; 交通：提前检查车辆（充电车需确认电量），携带驾驶证、行驶证、保险单。<br>&#8211; 饮食：注意饮食卫生，尽量选择正规餐馆。<br>&#8211; 住宿：提前预订酒店，避免旺季无房。</p>



<p>其他注意事项：<br>&#8211; 雨天行车需减速，注意安全。<br>&#8211; 旅拍和航拍打卡点：贝子庙、黑山头草原、套娃景区等。<br>&#8211; 特色活动：参与蒙古族民俗体验，探访俄罗斯后裔家庭。</p>



<p>&#8212;<br>（注：纪元1800任务部分因涉及游戏截图及图标缺失问题，已按用户要求跳过未完成部分。）</p>



<p>我们就不要图标了，然后又接着吭哧吭哧干去了。</p>



<p>我这写着放弃图标和截图，继续完成其余工作。说好的我将放弃这个东西，然后我去干活去了。最后蹭蹭蹭，干到这大概也是20多分钟，不到30分钟吧。干完的这个结果呢，其实给我们生成了很多的这种Markdown文件，就是把所有搜索的信息都放在这。</p>



<p>它搜索完了以后呢，再用这些Markdown文件去生成我们最上面这个GSX。这个是一个用React来去渲染的单个的网页文件，他最后生成了这么一个文件。</p>



<p>主要的人物，这个里头也有谁谁谁：清公主，然后白手起家。这个一般我们管她叫老太太，这个反正最后总要打一仗的，叫欧梅拉，这都是有的。相关的新世界相关的角色有哪些？就是他找的还是挺全的，虽然最后生成的网页里好像没有这么全，但是这边找的还是很全的。</p>



<p>然后呢，给大家看一个他犯的错误：游戏关卡跟DLC，他找了一堆什么使命召唤、守望先锋、吸血鬼幸存者。这什么意思呢？就是他在agent传递的过程中，他忘了我要找纪元1800相关的信息了，传递的时候把这个游戏名扔了。所以呢，他再去找游戏关卡跟DLC的时候，就直接输出了错误的结果。因为当他很多的agent一起配合干活的时候，就很难避免看这个事情。</p>



<p>最后呢，给我们生成了这样的网页。这就是大家能看到的网页，说一是什么什么样的，二是什么。这是我们的时间线。然后呢，是关卡跟DLC，这个还是有点小漂亮的。但是这个呢，就刚才我们看了，它是出错了，所以它给了一堆什么吸血鬼幸存者的DLC、什么激战、什么恶龙绝境的DLC、方舟的DLC。所以这个页面是完完全全错误的，不用管它了。</p>



<p>然后呢是策略和分析，这个很二。他需要展开前期后期主线写的，就非常的简陋了。再往后是人物：清公主，一个一个的人物。但是这个呢写的并没有那么完整吧，就是其实他找人物的时候找的是挺完整的。就刚才我们看到他给的，这个Markdown里头是挺完整的，但是呢最后生成网页里并没有那么完整。</p>



<p>作为基础框架是够的，把这个框架拿出来以后，再套上这些Markdown文件，还是可以继续去丰富的。这就是我们今天演示的扣子空间。</p>



<p><a rel="noreferrer noopener" href="https://xn--space-ep5hp2p0rgd72bre8adiuul9b.coze.cn/" target="_blank">进入的网址呢是space.coze.cn</a>。海外的用户先不要着急使用，国内的现在已经可以跑了。使用的感受是什么样的呢？真的需要跟扣子开会了，不能跟他随便聊天了，太浪费TOKEN了。因为你是跟他说点什么，他都哗啦哗啦去干活去了，不能随便聊了。</p>



<p>所以，我现在都是写很长的提示词，把各种能想到的尽量都罗列清楚。如果你说我实在是一次想不明白怎么办？使用规划模式：你先提出要求，他先把这个任务列出来，你再按照这个任务呢再去调整。修改好任务以后，他再去确认，按这个逻辑来去执行，他再往前跑。而且跑的过程中，他还有时候问你说：“我这块执行不下去了，那块找不着了怎么办？”你还可以跟他再聊两句，继续往前走。</p>



<p>如果你说我不走规划模式，直接用简单方式一次跑到底的话，那你就一开始要把任务提的比较详细一些。整个干活的过程呢，还是很有启发的，就跟思维链似的。你看他先干什么后干什么，先搜索什么后搜索什么，是有启发性的。如果发现哪块没做好呢，我们后面也可以拿这个东西再去修补。输出的结果呢必须要验证，这个没什么好说的，里头一定是有明显错误的。Agent的传递过程中呢，会出现明显错漏，刚才我们演示的时候也看到了。生成的结果呢框架可用，生成结果后面的很多细节，还需要我们再去补充。而且把这种结果放到他们的Agent IDE里头，比如说像trae里边去，也可以拿这个东西再去修修补补。</p>



<p>目前呢，可以输入的东西是搜索，它自己可以搜索。然后呢，通过MCP挂载一些外部工具。但是现在的MCP呢，只能是它挂好的。你说我想挂一些新的MCP进来，目前还没有完全开放。可以输出的信息呢，第一个是文档，它这个文档是Markdown，就是一些程序员的标记语言，也是有一定格式吧，但是没有那么丰富。然后可以输出这种单页的网页文件，你拿这个网页文件以后，后面呢可以让他去生成自己的网站。你说想让他去写一些别的代码，我测试了一下失败了。你说给我写一个什么安卓应用，它最后生成出来的还是一个网页，没有其他东西出来。然后呢，可以把输出的东西写在Notion里去，也可以输出什么PDF、PPT。PPT呢是以PDF形式来输出的，还可以做表格、做飞书，文档存进去都是允许的。</p>



<p>大家看到了这个产品以后，特别是有些人试用了以后，自己去感受一下。字节在做类似这种产品上呢，它有一些优势和劣势。优势呢就是迭代速度还可以，trae现在基本上已经能用了，特别是在Gemini 2.5 Pro这个模型上来以后，现在trae基本上可以跑了，因为把MCP也加上去了。所以呢，像扣子空间这样的工具，经过一段时间迭代之后，应该也是可以运用的。第二个优势呢，是字节有非常丰富的应用场景，它有抖音、有TikTok，有今日头条，都是可以使用的。</p>



<p>然后有流量，就是我们想宣传点什么东西，在自己的这个流量池里头稍微说两句，没有任何问题。最后一个优势是有钱，就是当产品打磨好了以后，铺天盖地的投放推广。</p>



<p>但是字节呢也有些劣势。它的劣势就是包袱太重。你比如说豆包大模型算是基本达标，但是距离DeepSeek R1呢，还是有一点点差距的。不能扔，因为是自己家的，必须抱着往前走，这就叫包袱。还有呢，就是藩镇割据。大公司都是这样的，扣子、火山、trae、飞书、剪映，各玩各的还相互提防。就是说我这边有点什么东西，我绝不能给你看，也绝不能听你的。你需要我什么配合，一定不给你做。咱们是这样的一种合作模式。其实大厂里边都这样，就是宁与外人不与家奴。这个话应该是慈禧说的。什么意思呢？就是他们更喜欢跟外界进行合作。你说我跟内部的一些团队合作了，其实更合适一些吗？因为毕竟大家的基础数据是一致的，应用场景也是一致的。那不行，一旦是内部合作了，就有谁听谁的问题，谁成主谁成辅的问题。这事不能随便乱搞。</p>



<p>总结一下吧。现象级的产品Manus出现之后呢，各大厂商都是要抄一遍的，这也算是对方向的一个认可。agent加MCP呢，应该能够引起一个小的热潮吧，确实可以解决一些实际问题了。未来呢，更好的模型，更多的外部工具，会产生更好的结果。</p>



<p>下一步我们可以期待什么？open AI、谷歌、Anthropic和Meta现在还没有特别明确的类似这种agent加MCP的产品出来，我们还是可以期待一下的。下一个里程碑是真正的交易。什么意思？就是我们现在看到的扣子空间也好，Manus也好，或者其他所有类似这种产品也好，主要做的事情还是叫信息搜集。他并没有真的做交易。你说你给我订个房间，去给我买张机票去，给我买东西去，这个事没干。一旦这一条路打通了就会腾飞。</p>



<p>为什么他们现在不去做交易呢？原因也很简单，现在模型还没有那么靠谱。因为它出问题的几率会很高嘛，受不了。所以现在并没有真正的把交易做进去。现在的各种MCP，也都是以信息查询为主，很少有哪个MCP是可以做交易的。你比如说像美团，如果给我一个MCP，我直接可以通过MCP去在美团上订餐，目前还没有。因为现在的大模型或者是这种agent模式呢，还没有那么靠谱。在等待向前发展那么几个月，可能我们就会看到由MCP驱动的交易大量涌现，这么下一个篇章就真正翻开了。</p>



<p>好，这个故事就跟大家讲到这里。感谢大家收听，请帮忙点赞、点小铃铛。</p>



<p>参加DISCORD讨论群。也欢迎有兴趣、有能力的朋友加入我们的付费频道。再见。</p>
]]></content:encoded>
					
		
		
			</item>
	</channel>
</rss>
