<?xml version="1.0" encoding="UTF-8"?><rss version="2.0"
	xmlns:content="http://purl.org/rss/1.0/modules/content/"
	xmlns:wfw="http://wellformedweb.org/CommentAPI/"
	xmlns:dc="http://purl.org/dc/elements/1.1/"
	xmlns:atom="http://www.w3.org/2005/Atom"
	xmlns:sy="http://purl.org/rss/1.0/modules/syndication/"
	xmlns:slash="http://purl.org/rss/1.0/modules/slash/"
	>

<channel>
	<title>工作流自动化 &#8211; 老范讲故事｜AI、大模型与商业世界的故事</title>
	<atom:link href="https://lukefan.com/tag/%e5%b7%a5%e4%bd%9c%e6%b5%81%e8%87%aa%e5%8a%a8%e5%8c%96/feed/" rel="self" type="application/rss+xml" />
	<link>https://lukefan.com</link>
	<description>这里是老范讲故事的主站，持续更新 AIGC、大模型、互联网平台、商业冲突与资本市场观察，帮你看清热点背后的底层逻辑。</description>
	<lastBuildDate>Fri, 29 Aug 2025 00:41:06 +0000</lastBuildDate>
	<language>zh-Hans</language>
	<sy:updatePeriod>
	hourly	</sy:updatePeriod>
	<sy:updateFrequency>
	1	</sy:updateFrequency>
	<generator>https://wordpress.org/?v=6.9.4</generator>

<image>
	<url>https://lukefan.com/wp-content/uploads/2026/03/cropped-jimeng-2026-02-28-5245-用图一的人物形象，替换图二中的人物，使用图二的风格。文字替换：老范讲故事，Yo-32x32.jpeg</url>
	<title>工作流自动化 &#8211; 老范讲故事｜AI、大模型与商业世界的故事</title>
	<link>https://lukefan.com</link>
	<width>32</width>
	<height>32</height>
</image> 
	<item>
		<title>马斯克硬刚微软！“巨硬”Macrohard 到底是什么？揭秘用 AI Agent 颠覆 Windows 和 Office 的疯狂计划。</title>
		<link>https://lukefan.com/2025/08/29/%e9%a9%ac%e6%96%af%e5%85%8b%e7%a1%ac%e5%88%9a%e5%be%ae%e8%bd%af%ef%bc%81%e5%b7%a8%e7%a1%acmacrohard-%e5%88%b0%e5%ba%95%e6%98%af%e4%bb%80%e4%b9%88%ef%bc%9f%e6%8f%ad%e7%a7%98%e7%94%a8/</link>
		
		<dc:creator><![CDATA[Luke Fan]]></dc:creator>
		<pubDate>Fri, 29 Aug 2025 00:41:05 +0000</pubDate>
				<category><![CDATA[AIGC]]></category>
		<category><![CDATA[Musk传奇]]></category>
		<category><![CDATA[AI Agent]]></category>
		<category><![CDATA[AI智能体]]></category>
		<category><![CDATA[AI颠覆]]></category>
		<category><![CDATA[ChatGPT]]></category>
		<category><![CDATA[Copilot]]></category>
		<category><![CDATA[Google Workspace]]></category>
		<category><![CDATA[Macrohard]]></category>
		<category><![CDATA[Office]]></category>
		<category><![CDATA[OpenAI]]></category>
		<category><![CDATA[SpaceX]]></category>
		<category><![CDATA[Windows]]></category>
		<category><![CDATA[X.AI]]></category>
		<category><![CDATA[人工智能]]></category>
		<category><![CDATA[企业定制开发]]></category>
		<category><![CDATA[企业软件]]></category>
		<category><![CDATA[会议纪要]]></category>
		<category><![CDATA[信息权限管理]]></category>
		<category><![CDATA[内容大于形式]]></category>
		<category><![CDATA[合同审批流程]]></category>
		<category><![CDATA[商业分析]]></category>
		<category><![CDATA[商标注册]]></category>
		<category><![CDATA[埃隆·马斯克]]></category>
		<category><![CDATA[大模型]]></category>
		<category><![CDATA[山姆·奥特曼]]></category>
		<category><![CDATA[工作流自动化]]></category>
		<category><![CDATA[巨硬]]></category>
		<category><![CDATA[平台战略]]></category>
		<category><![CDATA[微软]]></category>
		<category><![CDATA[招聘]]></category>
		<category><![CDATA[操作系统]]></category>
		<category><![CDATA[效率提升]]></category>
		<category><![CDATA[数据清洗]]></category>
		<category><![CDATA[比尔·盖茨]]></category>
		<category><![CDATA[特斯拉]]></category>
		<category><![CDATA[科技评论]]></category>
		<category><![CDATA[竞争策略]]></category>
		<category><![CDATA[系统集成]]></category>
		<category><![CDATA[谷歌]]></category>
		<category><![CDATA[软件的未来]]></category>
		<guid isPermaLink="false">https://lukefan.com/?p=2493</guid>

					<description><![CDATA[马斯克又开“整活工厂”了！给X.ai搞了个软件项目，名儿叫Macrohard（巨硬）😂💪。不是公司，商标大概率过不去，但流量他先赚满了📈。他放话：AI完全可以“模拟一家微软”——不抄Windows/Office皮，而是直接端微软的饭碗🍲：企业系统集成！想象下：AI agent上会旁听、催你把空补齐、拉齐各方条款、版本痕迹一键总结，合同从意向到落章全程托管🧠📝。内容形式，格式党让一让，“几号字多少间距”的门槛要塌了⚠️。下一步就是招人+搭平台，敢放弃形式、只看结果的公司会跑得更快🚀。兄弟们，你站内容派还是格式派？评论区集合！#马斯克 #巨硬Macrohard #AIAgent #微软

马斯克硬刚微软！“巨硬”Macrohard 到底是什么？揭秘用 AI Agent 颠覆 Windows 和 Office 的疯狂计划。

揭秘埃隆·马斯克 (Elon Musk) 旗下 x.ai 的神秘项目“巨硬”Macrohard，它并非要重写 Windows 或 Office，而是旨在用全能 AI Agent 彻底颠覆微软赖以生存的企业软件市场。这不仅是马斯克对老对手微软的又一次公开叫板，更是对未来工作模式的一次大胆预言。

本期视频将深入探讨，马斯克注册“巨硬”(Macrohard) 商标背后的商业野心与营销策略。我们将焦点放在其核心理念上：通过先进的 AI 代理技术，重新定义我们处理复杂工作流（如合同审批）的方式。马斯克认为，未来不再需要繁琐的 Office 套件，而是需要一个能理解意图、协调多方、自动处理流程的智能体。我们将详细拆解 AI Agent 如何重塑企业软件的运作逻辑，实现“内容大于形式”的效率革命。

这个计划会成功吗？马斯克的 AI Agent 究竟将如何改变我们的工作？这盘棋的最终目标，可能远比我们想象的更为宏大。

观看完整视频，了解马斯克的“巨硬”将如何挑战软件帝国！喜欢本期内容，请务必点赞、订阅并开启小铃铛，加入我们的社群一同讨论！

###
#马斯克 #人工智能 #商业模式]]></description>
										<content:encoded><![CDATA[
<figure class="wp-block-embed is-type-video is-provider-youtube wp-block-embed-youtube wp-embed-aspect-16-9 wp-has-aspect-ratio"><div class="wp-block-embed__wrapper">
<iframe title="马斯克硬刚微软！“巨硬”Macrohard 到底是什么？揭秘用 AI Agent 颠覆 Windows 和 Office 的疯狂计划。" width="900" height="506" src="https://www.youtube.com/embed/qCs8gU4iW0Y?feature=oembed" frameborder="0" allow="accelerometer; autoplay; clipboard-write; encrypted-media; gyroscope; picture-in-picture; web-share" referrerpolicy="strict-origin-when-cross-origin" allowfullscreen></iframe>
</div></figure>



<p>埃隆·马斯克的巨硬公司，也叫Macrohard公司，到底是干嘛的呢？</p>



<p>大家好，欢迎收听<a href="https://youtube.com/@StoryTellerFan" target="_blank" rel="noopener">老范讲故事的YouTube频道</a>。</p>



<p>今天咱们来聊一聊马斯克玩心很重，起的这个神奇的名字，到底想干点什么。</p>



<p><a rel="noreferrer noopener" href="https://xn--x-dc9ay2t0ldf0m740d.ai/" target="_blank">它呢应该是X.ai</a>这间公司下面的一个软件项目，并没有一个公司叫Macrohard。不像微软似的，Microsoft是一个公司，而Macrohard的话，现在只是一个内部的名称。虽然马斯克8月份跑去申请Marcohard的这个商标注册，但是呢，商标注册一般是很慢的，即使一切顺利，你注册一个商标到可以获批使用的话，大概也要一年的时间。</p>



<p>而且这个商标最后获批使用的几率基本上是0，不太可能的。因为微软大概率会强势维权，微软在这块是非常非常注意的，那也曾经是世界市值第一的公司，而且是在今年是世界市值第一。对于任何擦边球、跟他的名字比较像的这些商标，都会上来维权，直接把他干掉。人家叫Microsoft，叫“微”和“软”，你呢，叫Marcohard，叫“巨”和“硬”，这个肯定属于擦边，微软一定会上去抗辩的。而且美国专利商标局也会进行相似性的检索，你如果检索的过程中，人家就认为你这个相似性太高了，就直接给你拒了，所以可能不需要微软也维权，这个商标就不见了。</p>



<span id="more-2493"></span>



<p>但是马斯克反正人家玩吧，光换来的这个流量，它就已经值钱了，你申请的下来、申请不下来已经无所谓了，像当年的BORING无聊公司那样，这是属于话题，话题足够。马斯克的无聊公司是干嘛的呢？在地上挖隧道，让特斯拉的汽车可以在隧道里边快速前进，躲避拥堵，做这样的一个事情。这个公司到目前为止其实没有什么声音了，但还活着。Macrohard话题足够，会吸引很多人过来讨论这件事情。</p>



<p>马斯克到底想干嘛呢？现在只有只言片语，所以大家只能猜。咱们今天也主要是借着Macrohard的这个事情，跟大家探讨一下AI agent未来会如何改变我们的软件使用方式，这个我觉得还是值得去探讨一下的。Macrohard大概率是要去做manus那样的项目，做一个全能型的AI agent，但是具体怎么去实现，现在大家都在思考。虽然大家都在开始搞AI agent了，但是AI agent最后如何去改变我们使用软件的方式、改变我们工作的方式，目前为止呢，没有一个标准答案。让马斯克也加入进来去摸索一下，这并不是一个什么坏事。</p>



<p>从马斯克现在发出来的信息来看，他说的是：“微软这样的软件公司本身并不生产硬件，而是通过软件产品和订阅服务赚钱。既然如此，那么在理论上完全可以用AI来模拟一家微软。”他写了这样的一个话。这个什么意思呢？你看他是生产硬件的，特斯拉肯定生产硬件的，SpaceX生产硬件的，SolarCity就是他那个太阳能公司，生产硬件的，他的这个脑机接口生产硬件的，所以马斯克是一个硬件公司。而微软呢，你要说他完全不生产硬件，这事也不对，因为微软现在也生产非常多的硬件，比如他生产电脑、生产鼠标键盘、生产Xbox游戏机。你不能算它生产吧，至少是设计和销售这些产品吧。微软其实也算是半个硬件公司。但是软件的这个部分，是不是就可以用AI人工智能重新做一遍呢？这个其实才是大家现在需要去思考的问题。</p>



<p>很多人都讲说AI出来了，要把所有的软件都重做一遍。但是到目前为止呢，其实有一点点举步维艰，并没有办法说把原来的所有软件都重做一遍。我们现在看到的不是大家在招聘，说我们把以前的软件都做一下，而是都在裁员。</p>



<p>马斯克呢，肯定是先要嘲讽一下老冤家，微软跟马斯克之间一直不对付。一方面是比尔·盖茨一直在做空特斯拉，而且是公开喊话。马斯克上去喊，说都已经这样了，你还做空我吗？比尔·盖茨啥也不说，接着在那做空。马斯克还讲说比尔·盖茨去了萝莉岛了，出现在谁谁谁的名单上了。现在比尔·盖茨也无所谓了，反正婚也离了，你爱说什么说什么了，我接着做空你，这样的一个状态。另外一方面呢，微软算是从马斯克手里边截胡了OpenAI，你想这是多大的仇。如果当时微软不给山姆·奥特曼钱的话，山姆·奥特曼最后就要乖乖地在马斯克这就范，最后就是让马斯克来成为OpenAI的CEO，让马斯克带着整个的团队往前走。最后微软说我给你钱，我给你好多钱，咱们去玩儿吧，最后把OpenAI截胡了。所以这个仇大去了，所以一定要上来去嘲讽一下。</p>



<p>先把招聘搞起来，并且预告下一个阶段的方向，这是马斯克干的第二个事。他现在的人力物力是搞不定的，以各个AI公司的情况来看，马斯克现在最缺的就是人。因为他一旦要开始为广大大众提供一些个性化服务的时候，他这点人数是根本不够使。所以后边要具体怎么把人招进来，怎么重新去组织这些人做新的产品来为大家服务，这是他现在需要去思考的问题。即使说我不像微软那样招几十万人来给大家服务，你也得把平台搭起来，让大家在你这个上面去为其他人服务。在iOS跟安卓的时候，其实就已经发生了很大的变化，有很多的人在应用市场里开发应用。当时OpenAI做GPTS的时候，其实也惦记干这个活，但是呢，这个路并不成功。但是至少大家都想去做一个平台，希望其他人在我们的平台上就可以提供定制开发，为最终用户做完整解决方案。但即使要做到这一步，马斯克也要去招聘。至于预告下一阶段的方向的话，“用AI模拟一家微软”，这就是下一个阶段的方向。</p>



<p>那我们来看看，微软这样的一个软件帝国和它的竞争对手们，现在到底是一个什么样的状态呢？既然你要模拟微软，你最后肯定是要跟微软竞争的嘛。咱们看看微软的产品。</p>



<p>首先最如雷贯耳、最响亮的，肯定是Windows操作系统。Mac OS呢，其实完全是另外一种产品，Mac OS跟Windows没有那么大关系。用Windows的人跟用Mac的人就是完全两拨人，所以他们之间其实并不怎么竞争的。Linux桌面版呢，流传的范围非常非常小，基本上可以忽略不计，不是说没人用，但是比例非常少。安卓、iOS的份额其实是远超Windows的，因为手机比电脑多嘛。现在呢，iOS跟安卓其实已经可以做大部分Windows能做的事情了，很多人拿着这个平板电脑直接装上安卓系统。包括像苹果，它现在iPad上也不叫iOS了，人家叫iPadOS了，那意思就是说，你的下一台电脑不需要是电脑，我也不用给你上Mac OS，你就直接上iPadOS，大家就可以干活了。这个是可能未来对于Windows的一个比较大的蚕食吧。</p>



<p>而且新的操作系统呢，它在定义层次上，就已经开始发生转变了。传统的操作系统，你要在一个特定的硬件上，把所有的功能统合起来。现在新的操作系统，你说微信算不算操作系统？绝对算。他把他把功能统合起来了，但是不管理硬件，他还是在手机操作系统上去工作的。但是我们在这个微信里边可以聊天、可以看书看视频、可以买东西、可以投资理财、还可以贷款，没有什么事是你不能干的，所以它已经可以算操作系统了。抖音、TikTok这些东西也都是操作系统。现在最新的说“我是操作系统”的是谁？一个是谷歌的Gemini，还有一个是ChatGPT，这已经开始向操作系统前进了。你可以不离开这些聊天窗口，把所有的事情都做掉。我们参考微信，以后可能在微信里能干的所有事情，在这些聊天窗口里都可以干完。浏览器呢，也算是一种操作系统。</p>



<p>微软在这一块呢，是打不过谷歌的，谷歌的Chrome在这一块绝对的老大。即使是微软的Edge浏览器，其实也是在Chrome的基础上改出来的，底层内核其实都是由谷歌下边的一帮人在维护的。但是呢，Chrome这一块现在正在被反垄断审查，而且勒令分拆销售，现在Perplexity跟OpenAI都想买，买了干嘛？回来做操作系统。现在这一块呢，还是一个比较白热化的竞争了。</p>



<p>除了操作系统之外，微软另外一个被大家所熟知的产品就是Office系列：Word、Excel、PowerPoint，就这些东西。它的竞争对手呢，iWorks就是苹果做的这套Office，算是固守阵地吧，但是固守阵地都难。因为很多人即使用Mac OS的操作系统，也会在上面装Windows。Mac OS上的这些Works呢，最好用的是它的Keynote，就是类似于PowerPoint的这个工具。它的Page就是类似于Office里的Word，苹果的有一个产品叫Number，它就是类似于Excel。剩下两个产品，其实用的人是没有那么多的，会少很多。所以iWorks现在固守阵地都有点难。另外一个现在比较有竞争力的是谁呢？就是Google Workspace，也是一整套，就是一个演示工具、一个表格工具、一个文本编辑工具，这一套现在竞争力很强，快速地在生长。OpenAI呢，现在也盯上这一块，说我也可以做Office的事情，我有Canvas的一个功能，我也向这块前进了。所以Office呢，固然很强大，但是呢也面临着一定的竞争压力。这是微软的第二个产品线。</p>



<p>第三个产品线呢是游戏。微软在这一块呢，本来也就是众多游戏厂商之一，可能还排不到最前面去，索尼再加上任天堂，还有国内的腾讯这样的公司，所以这一块的市场还相对来说比较松散。那你说微软真正赚钱的大头是什么呢？是刚才上面咱们讲的哪一个？其实还不是。微软真正赚钱的大头叫系统集成，就是各种企业软件进行定制开发。这一块呢，应该才是被马斯克盯上的一块。马斯克坐在这儿重新写一Windows、重新写一Office吧，或者写一个浏览器吧？马斯克才懒得干这事呢。微软真正挣钱那部分，说您的企业有什么需求，我来帮您定制一下，这块是他真正盯上的。</p>



<p>AI到底应该如何改变这种企业使用软件的用户体验，或者说用户过程呢？大家还记不记得，2023年微软发布Microsoft Copilot的时候，那个炫酷的视频，让人感同身受的场景，想象力绝对突破天际了，所有人觉得脑洞被打开了，原来还可以这样使用。但是呢，这个会开完也就完了，你想这都是两年前的会了，到目前为止，他当时展示的东西呢，也没有完全实现。当然并不是说大模型的能力不够，也不是微软的工程项目能力不够，现在真正难的东西是什么呢？是信息的清洗，以及信息的边界确认，或者说叫信息的权限管理，这一块呢现在其实是搞不定的。</p>



<p>而且也没有人敢把这一部分交给AI去干，因为AI每一次出来的结果是不一样的。就算是你不交给他，大家三绕两绕，还让AI越狱，还让AI开始胡说八道呢。你把这么敏感的事情交给AI，让它来去管理相应的这些权限，这是不可能的。但是我们想清楚，如果我们想达到一个由AI配合我们去干活的这样的一个结果的话，我们就真的需要让AI明确他到底能得到哪些数据、不能得到哪些数据，才能给我们做出正确的结果出来。这个其实还是比较难的，到目前为止依然没有搞定。</p>



<p>现在对于个人来说呢，微软两年前展示的功能呢，基本在近期算可用了，也就是在最近那么两三个月里头，基本上是可用了。因为个人没有那么多的数据，也没有那么多的权限需要去管理，我们就完全可以要求这些AI agent说，你去搜索一下，或者说你到哪个库里去搜索一下，然后拿出结果来，去给我做什么样的这个事情。这块虽然使起来还稍微的有些不趁手，但是呢功能基本实现了。而对于企业来说的话，你肯定还是要再去做系统集成，这块是微软的老本行。你不去做系统集成，你拿现有的AI工具来说，基本上是没法做的，因为你需要做数据的清理和过滤，需要做权限的设置，而这一部分你还没法交给大模型干，这就是现在没有解决方案的地方。</p>



<p>让我们来想象一下，我们使用Office的场景到底是什么样的吧。我个人呢用的最多的是PowerPoint，但是现在用的也少了，现在可能用的最多的是Xmind。大家看看这个变化是什么？变化就是我把内容搞定了，但是格式我就扔了。我使用Xmind以后，我等于只有提纲，没有格式、没有动画，什么都扔了。这才是真正的未来发展方向，就是内容大于形式，大家一定要记住这句话。</p>



<p>PowerPoint的部分，目前的工具呢，可以做出很惊艳的粗糙模型来，我们可以在这些结果原因上进行再调整。这就是当前甭管是AI PPT或者其他的一些工具可以实现的功能。而且像Canva这些工具的话，都已经提供了MCP，可以直接服从大模型的命令，去做相应的调整。而且也有一些agent开始去做这种设计了，比如说叫Loveart，前面我们专门出视频讲过这个工具。这一块呢，不需要那么紧密的协同就可以干活了。</p>



<p>我自己用的最少的Office工具其实是Excel计算，Captable就已经是我的极限了。什么叫Captable？Captable就是一个公司的股份表，谁占多少股份，原来占多少股份，投资以后占多少股份，或者清仓以后股份如何分配，就这是我的极限了，再复杂的东西算不了。微软呢，倒是在Excel里头加了一个新的函数，我们知道以前有函数，什么求和、求平均数，现在最新的这个函数叫Copilot。你可以在里头写Copilot()，然后“请从哪些单元格里头获取数据，然后给我做一个什么样的结果出来”，你可以做这样的这种命令。因为以前大家都说，谁的Excel公式背的全，现在不需要了，直接用这个Copilot就可以搞定。即使是有这样的函数以后，我也觉得使用Excel还是挺麻烦的一个事情。</p>



<p>Word呢，是我用的比PowerPoint少，但是比Excel多的一个工具。咱们呢，来讲一个流程吧，就是要有一些相互之间的配合，还要使用一些微软Office工具——合同审批，咱们讲这样的一个流程。</p>



<p>第一步，我可能拿了一个合同模板，你不可能从头写这个合同，得先从合同模板。拿到合同模板以后呢，肯定先开会嘛，我投资别人项目，我投你多少钱，占你多少股份，这个事呢，肯定不可能说我拿着合同模板跟人讲，一定是大家拍着脑袋就开始定数了。定完了以后，基本的一些条款、基本的一些要求都说清楚了，就拿着合同模板进行填肉。我们就拿着模板，把这个你叫什么公司、我叫什么公司、甲方是什么、乙方是什么、出多少钱、占多少股份、各自有哪些权利义务，把它都写清楚。写完了以后呢，扔给律师，律师去审核。律师呢，会根据意图、风险，以及当前的一个最新法律条文的一个变化，提出修改意见。</p>



<p>拿到这种修改的稿子以后，我们再跟各方进行沟通，每一方都要再给他的律师看嘛，得到最终的一个修改过的稿件。Word里头最强大的功能不是排版，Word最强大的功能是审批。每一个人在后边去写，说我要在这加点什么东西，我在那减点什么东西，我为什么要在这加，为什么要在这减，或者我把哪句话改成一个什么什么意思了。Word是有很完善的这种版本控制的，像我们以前改一份合同，最后右边这个角标是密密麻麻的，不同的人写“我是张三”、“我是李四”，我为什么要提出这样的要求来，我改了些什么样的东西，大家在最后去确认。</p>



<p>在确认过程可能还要在开会，而且开会是开小会。一个合同里的涉及，比如说五六方不同的相关实体，他们有很多诉求，跟其他各方并不是都有关系。在这个过程中，大家就要捉对厮杀，或者说开一些小范围的会。等都开完了，最后律师协调大家的意见，出汇总版本。当然这汇总版本里还要再保留痕迹，再跟每一方确认，说你看看你当时要求改的东西，这个痕迹在这呢，现在确实给你改上了，别人都改了些什么东西。因为都要在同一个合同上签字嘛，每家改的东西可能跟你没什么太大关系，但是都还是要看一下。等大家都确认了以后，隐藏痕迹，打印最终版本，传签。</p>



<p>什么叫传签？就是把这个合同，比如说有10方要签这个合同，我们就会把这个合同打印10份，然后挨着个儿的快递，这时间都传递一圈回来，把10个人的字都全签上，他是这样的一个过程。然而通常不是打印10份，应该会更多一些，因为每家还要有一个原件留档嘛。这些合同走到这算签完了。这个合同后边还要起作用，起什么作用呢？你在下一次再签合同的时候，你就要拿上一个合同出来参考，原来你答应了什么条款，或者有什么样的约束。你在新的协议里头，你总要做出一些安排来，你说我是继续承认原来的这些约束，还是说我把这些条款进行了一定的修改，我们写清楚，我们有新的条款，原来那个作废了。你是要把它抄过来，还是怎么去约定这个事情。这个合同算是走完了一个完整的周期。</p>



<p>大家想可以思考一下，AI agent应该如何完成这个过程？这个过程刚才我讲了半天，很复杂，但是这就是我原来主要的工作。大家千万不要觉得出去做投资就是像大爷似的，跟人说你过来我要投你，不是这样的，大量的纸面工作，而且你需要跟每一个相关的股东、相关的出资人去进行沟通和确认，这个过程非常非常麻烦的。你说有AI agent以后，这个活会不会变得好一点呢？</p>



<p>在今年开始的时候呢，AI agent元年就算开始了。但是呢，目前为止，AI agent其实还没法干这个事情。之前的AI agent呢，都是为个人服务的，只是不同角色、不同场景的个人。刚才我们讲有不同的公司、不同的角色，大家一起凑起来完成的一个合同审批过程，到目前为止还没有谁说我要去干这个活。这也是微软挣钱最主要的部分，也是这一次马斯克想去替换的一个主要部分。</p>



<p>那我们要去看看这玩意怎么办了。首先，AI应该直接参与到初始谈判中来，你开会的时候，他就得在那，他得听着，或者至少你要把这个会议纪要扔给他。但是会议纪要扔给他，其实已经不是那么好了，为什么呢？因为AI按道理来说，应该根据模板和前面各种协议的约定直接询问。你不可能说我这会议纪要给他了，发现里头有好多该往合同里填的空，你没填上，这事是肯定不行的。所以AI应该是直接参与会议，说：“你们都聊完了吗？那什么什么事你还没说呢。”这个就会让会议的效率提高很多。</p>



<p>如果AI直接参与会议的话，会议纪要也不用给他了，他直接手里就有。然后AI就可以出各种颗粒度的总结提纲，让需要确认的人去确认。比如说我们十方坐这开了一个会，这个提纲是跟这几节有关了，那个提纲跟那几节有关，哪个提纲可能是跟所有人都有关。他就可以分门别类地把这些相关的信息呢，都总结出来，直接给大家发出去，让大家去确认。</p>



<p>有人在这问了，说需不需要全文？你说最后看的合同都是厚的，跟一本书似的好几百页，或者几至少几十页吧，这个怎么就给人一个提纲就完事了呢？其实跟大家讲，几十页的合同跟一两页的意向书，里头实质内容是没有太大区别的。所以我们出去跟人做项目，都是先签意向书，一两页或者两三页。签完意向书以后呢，大家最后都确认完了，然后让律师把它写成合同，但这合同可能就好几百页了。这个是没办法的事情，人写的更严谨嘛，但是所有的约定在意向书里都约定好的。看也没必要去看那个全文，最后看一遍就完了。</p>



<p>确认完了以后呢，就是做意见和反馈的搜集，大家都有什么问题，拿回来我们再去看一看，将变化的部分再次总结。当把所有的信息都汇总了以后，重新组织会议，这个时候就未必是全员开会了，各方单独会议，重新确认各自关心的问题，让每一个人关心的问题都得到确认。生成最终的版本，并将变化过程、最终结果生成全文以及各类的总结，让各方去确认去。在这个过程中呢，适时地查阅、引用各种相关信息和资料，包括法律条文、包括过去协议上面的各种约定。比如说我们上一份协议跟人约定好了，要给这个团队分红，或者说要给他们发股份，那你再签新协议的时候，我们就要把这个事说清楚。所以上一份协议是，或者以前的所有的协议和约定，在这呢都是需要去看的。现在的AI agent还搞不定这个事情。</p>



<p>马斯克的巨硬准备如何颠覆微软呢？肯定第一件事先招聘，这个没什么好说的。AI agent并不需要做出Windows和Office来，而是解决原来大家用Windows和Office能够实现的这些结果。我不需要按你原来的路径走，探索更小、更灵活的公司，用户的需求应该如何得到满足。</p>



<p>那你说原来大公司呢？那些规矩特别森严、等级特别严格的这些大公司怎么办？这种传统的规矩森严、门槛很高的公司，就让他们跟微软一起去死吧。这可能就是未来的一个方向。大家要注意，像谷歌的Workspace去抢占微软地盘的时候，Workspace的各种什么排版、很多这种很细节的功能，其实比微软差远了，做不到那个程度，但是也就可以用了。微软的Office里的大量东西都是跟形式有关的，我怎么能把它排的好看，微软花了极大的功夫来搞这些东西，开发维护的成本都很高，但是对于未来的发展未必有那么大的好处。</p>



<p>你说我这必须是几号字、多少间距，没有这个我就这个文件就打回去加班重做的，这种公司就让他们死吧。能够把事说明白，能够把最后的条款确认好，签了合同接着往前干活的，让这些公司活下来。在这个过程中，马斯克给大家提供一些工具，说让愿意放弃形式、只关注结果的这些公司，可以战胜那些形式大于结果的那些公司。这个可能才是AI真正改变的一个未来方向。</p>



<p>好，这个故事跟大家讲到这里，感谢大家收听。请帮忙点赞、点小铃铛、参加<a href="https://discord.gg/ppKsNkttTv" target="_blank" rel="noopener">DISCORD讨论群</a>，也欢迎有兴趣、有能力的朋友加入我们的<a href="https://www.youtube.com/channel/UCUGLhcs3-3y_yhZZsgRzrzw/join" target="_blank" rel="noopener">付费频道</a>。再见。</p>
]]></content:encoded>
					
		
		
			</item>
		<item>
		<title>设计师的未来已来？Lovart垂直AI Agent震撼体验，从Midjourney到多模型协作，揭秘AI如何颠覆传统设计流程与商业模式。</title>
		<link>https://lukefan.com/2025/06/01/%e8%ae%be%e8%ae%a1%e5%b8%88%e7%9a%84%e6%9c%aa%e6%9d%a5%e5%b7%b2%e6%9d%a5%ef%bc%9flovart%e5%9e%82%e7%9b%b4ai-agent%e9%9c%87%e6%92%bc%e4%bd%93%e9%aa%8c%ef%bc%8c%e4%bb%8emidjourney%e5%88%b0%e5%a4%9a/</link>
		
		<dc:creator><![CDATA[Luke Fan]]></dc:creator>
		<pubDate>Sun, 01 Jun 2025 00:41:19 +0000</pubDate>
				<category><![CDATA[AIGC]]></category>
		<category><![CDATA[AI Agent]]></category>
		<category><![CDATA[AI 数字人]]></category>
		<category><![CDATA[AIGC (AI生成内容)]]></category>
		<category><![CDATA[AI产品分析]]></category>
		<category><![CDATA[AI创业]]></category>
		<category><![CDATA[AI动画]]></category>
		<category><![CDATA[AI发展趋势]]></category>
		<category><![CDATA[AI商业模式]]></category>
		<category><![CDATA[AI工具测评]]></category>
		<category><![CDATA[AI教程]]></category>
		<category><![CDATA[AI模型聚合]]></category>
		<category><![CDATA[AI绘画]]></category>
		<category><![CDATA[AI视频生成]]></category>
		<category><![CDATA[AI设计]]></category>
		<category><![CDATA[AI赋能设计]]></category>
		<category><![CDATA[Canva]]></category>
		<category><![CDATA[ComfyUI]]></category>
		<category><![CDATA[Demo演示]]></category>
		<category><![CDATA[Flex]]></category>
		<category><![CDATA[Google Imagine]]></category>
		<category><![CDATA[GPT-4o]]></category>
		<category><![CDATA[LibLib AI]]></category>
		<category><![CDATA[Lovart]]></category>
		<category><![CDATA[MidJourney]]></category>
		<category><![CDATA[Photoshop]]></category>
		<category><![CDATA[stable diffusion]]></category>
		<category><![CDATA[YouTube封面]]></category>
		<category><![CDATA[YouTube封面设计]]></category>
		<category><![CDATA[产品体验]]></category>
		<category><![CDATA[剪映]]></category>
		<category><![CDATA[剪映 (CapCut)]]></category>
		<category><![CDATA[可灵]]></category>
		<category><![CDATA[可灵 (Keling)]]></category>
		<category><![CDATA[垂类Agent]]></category>
		<category><![CDATA[多模态AI]]></category>
		<category><![CDATA[工作流自动化]]></category>
		<category><![CDATA[提示词工程]]></category>
		<category><![CDATA[泛Agent]]></category>
		<category><![CDATA[泡泡玛特风格]]></category>
		<category><![CDATA[科技评论]]></category>
		<category><![CDATA[老范讲故事]]></category>
		<category><![CDATA[设计师]]></category>
		<category><![CDATA[设计师AI]]></category>
		<category><![CDATA[设计师失业]]></category>
		<category><![CDATA[设计师就业]]></category>
		<category><![CDATA[陈冕]]></category>
		<guid isPermaLink="false">https://lukefan.com/?p=2245</guid>

					<description><![CDATA[**设计师要失业了？Lovart这个AI神器真的好用到哭！😱**

啊啊啊啊啊！家人们，我今天必须和你们分享一个炸裂的东西——Lovart！这是一个专门为设计师打造的垂直AI Agent，简直是设计界的“救命神器”！我试用了一下，真的好用到哭，设计师们可能要慌了，小白们却要起飞了！😭

先说最震撼的点：你根本不需要啥设计基础，随便提个需求，比如“给我设计个YouTube封面，16:9比例，皮克斯风格，还要加字”，Lovart就能自动规划路径，调用各种模型（Flux、GPT Image啥的），直接给你生成成品！从图片到视频，从配乐到文字排版，一次搞定！我一个程序直男都能做出有点美感的东西，设计师们是不是要瑟瑟发抖了？😱

再说几个绝绝子的功能：
1. **超智能规划**：它会自己推理怎么做最好，调啥模型，咋排版，省心到爆！
2. **多模型组合**：集合了各种牛逼模型，生成效果吊打单一工具，细节控福音！
3. **一键出成品**：不管是海报、封面还是短视频，提需求就完事，效率直接拉满！

老实说，我用完Lovart的第一感觉就是：设计门槛真的被拉低了！以前做个封面要抠图、拼字、调色，费时费力，现在一句话的事儿，5秒出图不是梦！但也有点小遗憾，比如偶尔比例不对，文字会出错，不过瑕不掩瑜，整体效果还是让我破防了！😭

家人们，不管你是设计师还是小白，这个工具都值得一试！Lovart现在需要邀请码才能用，我已经在视频简介里放了3个，先到先得啊！没抢到的也别急，评论区见，咱们一起分享资源！真的不允许有人不知道Lovart，冲去试试吧，绝对会刷新你的认知！🔥

设计师的未来已来？Lovart垂直AI Agent震撼体验，从Midjourney到多模型协作，揭秘AI如何颠覆传统设计流程与商业模式。

设计师的未来是否会被AI改写？本文深入探讨了现象级产品Lovart——一款专为设计师打造的垂直AI Agent。我们将揭示Lovart如何超越Midjourney等单一模型，通过整合GPT、可灵视频生成及多种AI工具，实现从创意构思到多图层编辑、视频生成的一站式智能设计流程。文章同时分析了垂直AI Agent（如Lovart和AI编程的Cursor）相较于泛AI Agent的独特优势、面临的成本挑战，以及中国团队在AI创业浪潮中（如Lab Lab AI的探索）的机遇。这对于理解AI设计趋势和优化SEO内容策略至关重要。]]></description>
										<content:encoded><![CDATA[
<figure class="wp-block-embed is-type-video is-provider-youtube wp-block-embed-youtube wp-embed-aspect-16-9 wp-has-aspect-ratio"><div class="wp-block-embed__wrapper">
<iframe title="设计师的未来已来？Lovart垂直AI Agent震撼体验，从Midjourney到多模型协作，揭秘AI如何颠覆传统设计流程与商业模式。" width="900" height="506" src="https://www.youtube.com/embed/g_0tRfhUEkk?feature=oembed" frameborder="0" allow="accelerometer; autoplay; clipboard-write; encrypted-media; gyroscope; picture-in-picture; web-share" referrerpolicy="strict-origin-when-cross-origin" allowfullscreen></iframe>
</div></figure>



<p>设计师这次是不是真的要失业了？咱们从Lovart这个为设计师专门设计的垂直agent来看看AI agent在垂直品类里的一些玩法儿。</p>



<p>大家好，欢迎收听老范讲故事的YouTube频道。Lovart又一个现象级产品出来了，设计师专用的一个垂直agent。它呢没有Manus当时引起的那么大的动静，但是呢，我用了一下，感觉比Manus这种泛agent还是要好用一些。</p>



<p>什么叫泛agent？就是它啥都能干。Lovart这种能够专门为设计师工作的agent呢，它就是垂类agent，它其它事干不了。你说你给我去写个文章，给我去做个总结，这它干不了。但是你说你给我画个画，做个视频，设计一个PPT，设计个海报，做的可好了。他们设计的产品在x上被马斯克亲自点赞。因为这种设计类产品嘛，一个图片什么的，你要设计的非常好的话，确实会引起大佬点赞。很多的使用者也是惊为天人，我去使了一下，确实是很神奇，能够解决非常多的问题。</p>



<span id="more-2245"></span>



<p>什么叫设计师垂直agent？大家知道AI agent它可以自我规划，可以调用各种工具，然后完成一个完整的工作。最早的这种AI agent就是从生成图片开始的，Midjourney现在的话应该是Google imagine 4 GPT image，stable diffusion Flex这样的直接生图片的模型还是有很多的，最早也是从这开始。但是这个东西有一个很大的问题是什么？就是很难控制。你说我希望有稳定性，我每一次生成的这个人都要长成一样，我希望写字写对。即使是现在写字写的比较好的，比如说像吉梦模型或者是PPT的模型，但也经常还是会写错。所以我们使用这些模型的时候，经常的工作流程是什么样的呢？先画，画完了以后呢抠图，再到一些像Photoshop或者像我用Canva这种可画的平台里边儿再去拼，然后再把这个人把字儿重新拼在一起。既然这个流程已经确定了，找个agent把它整个儿都串起来，不就完事儿了吗？</p>



<p>再往后发展呢，就是一些可以进行串联，或者说进行一些工作流设定的一些产品。比如说像设计圈里的Confy UI这样的一些产品，你可以把这个工作流画好，它就按照这个工作流整个跑一圈下来。文字生成里头呢，用的像Defi code这种其实也是这种工作流设计软件。现在新的时代到来了，就是自我规划的agent。比如说像文档，各种的deep search。</p>



<p>Deep research这样的东西，你给他提出问题，剩下的该去查哪些网站、该怎么总结、该怎么去分析、如何去校对、如何减少幻觉、如何去把结果做得更漂亮，人家一次搞定。现在就是新的Agent的时代已经到来了。</p>



<p>这个为设计师工作的Agent呢，也走到了这一步。从最早的单模型Midjourney，到Confy UI这样的工作流设计的流程，到最后说干脆我一次给你搞定。现在Lovear就是这样的一个产品。</p>



<p>它呢，把一大堆的模型放在里头，比如说Flex、Google Imagine 4、PPT Image、Flex这些都放进去。这个里头没有Midjourney，Midjourney那个东西不是特别好控制。然后把音乐和音效生成搁里头，你说我最后要出视频，那我需要给你配乐都有，包括一些TTS的阅读也都放在里头，就是数字人的这种也都搁在里头。</p>



<p>视频生成模型，他掉的是可灵1.6，是快手做的视频生成模型，效果也还可以。我已经把模型搁这了，下一件事就是提要求就完了。你说我今天想要一个YouTube的封面，或者我想要YouTube里边的一个小的动画，你提要求就完了。</p>



<p>剩下的这个Lovart就自动地规划路径，还去调用一些推理的模型，比如说GPT O3这样的模型。它推理一下说，我到底怎么把这个路径规划得更好呢？再调用刚才我们讲的Flex呀、GPT Image呀、谷歌的Imagine，然后生成音乐，生成视频，配在一起。</p>



<p>最终呢，完成一个相对比较复杂的任务。而且还有很多Photoshop呀，或者Canva一些功能也搁在里头。这什么功能呢？就是图层。你说我现在要求在哪个图层上干哪些活，要求在什么地方写什么字，他就直接给你写就完了。不要让这个大模型再去费劲给你拼字去了，反正他也拼不对，咱们就别费这个劲了。</p>



<p>所以这个就是一个很完整的设计流程，一次搞定。真的是一个中国团队的产品，虽然这个团队在硅谷，但是呢，确确实实是个中国团队。他们最上面的一个公司呢叫Lab Lab AI。</p>



<p>这个Lab Lab AI呢，是中国最活跃的Stable Diffusion的社区。他们干嘛呢？就是把大量的Stable Diffusion上用到的Laura的这种微调的模型，都放在这展示。展示完了以后呢，我们去交换这些训练出来的这种微调模型就可以了。也有一定的商业模式，但是呢，发展的不是特别好吧，虽然很活跃。因为大家最后还是要去看说……</p>



<p>是不是能够形成正向的商业模式？好在是中国在做这个电商，做这个各种网红经济。在这一块，需要的设计师的量非常大，或者说设计师工作非常多。所以呢，他们也还是在运转。前面融资呢，也融了一些。后面呢，是找了一个很著名的创业者，开了美国的分公司。所以呢，Lovart这个产品是lablab.AI美国分公司做的。他们找的这个创业者，就是Lovart的创始人和CEO呢，叫陈冕，官冕的冕。他呢，是摩拜单车的产品总监。离开摩拜单车以后呢，是剪映和Capcat的全球商业化负责人。2024年离开剪映跑来去创业，做了一个叫Lovart的一个产品，做的还是相当不错的。</p>



<p>口说无凭，咱们来看Demo，看看我用这玩意干了些什么。这就是Lovart的首页。这个设计师做的页面确实是好看，比我们这些程序员直男做的东西要好看多了。这个它的页面就是lovart点ai。现在很多都是AI开始的域名。想要玩这个东西，要有一个邀请码，或者是加入等待链接。我是加入waiting list，等了一周左右得到的邀请码。我现在还有3个邀请码。get start就进来。我会把三个邀请码放在视频的简介里。如果大家想要去玩的话就拿三个邀请码去用啊。但是因为是会员先看到，所以可能公布到公众频道的时候，这个邀请码就已经用完了啊。也欢迎大家拿到新的邀请码以后，分享到我的评论区里头。</p>



<p>大家看到我现在已经没钱了，已经把所有的信用点都花光了。一共上来是给了1,000点。他是拿到邀请码给500点，每个月给500点。我要想再画要等下个月了。好，跟大家看一下他的一些干的活。这个就是我用了1,000点得到的这个结果。上来，请设计YouTube 16:9的封面视频。封面频道名是老范讲故事。视频题目是老范读评。这是每周三晚上8点的直播节目，读一周的观众评论。加上以我照片生成的皮克斯3D风格的角色设计。这是我写的提示词，给了一张照片，他就干活去了。说我先想想，我先思考一下这个活要怎么干，分析一下。说我应该是一个什么样的照片。可能呢，调的是GPT O3做的图像推理。推理完了以后再去调用这个知识库。我有哪些知识，是吧？这是一个哪样的一个设计建议啊？要用GPT image，要用这东西来去做皮克斯3D风格的角色，再加上这些文字要求，画到16：9的横纵比。结束了。这个是他做的一个规划。再去说，我这是一个创意了，我要去创意了。</p>



<p>这个皮克斯3D的东西应该怎么做？自己夸夸夸想去了。“老范读屏”这几个字55%高，要写在什么地方？周三，呃，20点直播，要写在一个什么样的字体？写在哪儿？底下，右下角要写“老范讲故事”。背景应该是一个橙金色的渐变色，而且是有一些什么样的要求？他就一个一个的去给你做去了。然后颜色，主颜色是什么？高亮颜色是什么？你做了一堆这样的要求。原型，一个什么样的东西啊？要写中文，要什么sans，应该是宋体，大概是写黑的。自己去研究了半天，就开始创建图片，干活去了，得到了这个图。现在不知道为什么他把这个大的删了，肯定还是成本问题。让我们来看一下图，就给你画成了这样的一个东西。这个还是很可爱的。“这个老范讲故事”这个“事”字写得稍微有些问题啊。“周三20:00直播”是“老范读评”。大家发现这东西有问题了没有？除了这个“故事”的“事”字写错了之外，还有问题。哪有问题？他不是16:9的，他是3:2的。它这个图的分辨率是1,500*1,000，实际上是3:2。为什么会成这样呢？因为它最后的这个背景图是拿GPT生成的，GPT到头就是3:2，再大的横纵比做不出来了。这是GPT的一个bug。也有问题，这个说你生成的是3:2的，不是16:9的。这是GPT 4o的一个bug，只能出3:2。我理解了，这个有个问题，让我再去做16:9。反正做了半天，他又做了个3:2的图出来，稍微改了改，大概是长成这样了。这个反正能使呗，到时候我再把这个脑袋抠下来，再把这字抠下来，回头下个礼拜读屏的时候，咱就用一次啊。反正也是挺好玩的，一个图就做出来了。但是大家看到的是什么？一句话，我真的是写了一句话，他就做了一个基本凑合还能使的东西。这就是这句话。你说设计师是不是要失业？你像我就是个写程序的直男，我就可以做到这样的结果了。设计师就会稍微有一点点痛苦了。他们的设计的一致性，这种反正我觉得还是有点美感的，设计出来还是可以用的。你看这个胖子还是有点点可爱的嘛，笑得多喜庆。好，咱们再看另外一个demo。这个demo是我让他去画，画视频去了，因为这东西是可以直接出视频的。看，我也是给了一张自己的美照，说：“给我一段视频，YouTube求点赞、关注、点击小铃铛的，用我的形象，生成泡泡玛特风格的人物形象，求点赞、求关注、求小铃当，时长5秒，绿色背景，方便抠图，统一用泡泡玛特可爱风格。”他就又想去了。这次他是使用了Flux，用了这个模型去生成的。这个像吗？</p>



<p>反正泡沫马特风格，大头，而且是这个。大家看这个塑料材质，至于像不像我，这个事就无所谓了，这个不重要。画成这样了，我也不好意思说它像我了。</p>



<p>调用可灵的视频生成，生成了5秒视频。你看，这个就是5秒视频，他就生成声音去了。这个声音其实做的很烂：“like subscribe and click the notification bell”。你看这是点赞、呃订阅、点击这个提醒的小铃铛，大概讲了这么一句话。把这俩东西给我拼一块吧：“like subscribe and click the notification bell”。我觉得不是特别满意，我说啊，别说话了，这个说的太难听了。</p>



<p>配音效加上3D的泡泡玛特风格的点赞，大拇哥的订阅小铃铛换成16:9的，人物要戴上眼镜。他又思考干活去了。这回呢，人戴眼镜了，这没毛病。给我生成了个音乐，这个是成出来的，它里头是有音乐生成的，大模型的，生成了一个视频。这次呢，有小铃铛，但是他这个小铃铛画的就很怪，他没法理解什么是点赞。这个看来可灵在这块还是稍微差一点点，5秒钟搞定。</p>



<p>我说这个做订阅的和小铃铛，这个点赞的3D形象太奇怪了，看不出来是做什么的。去网上搜索一下，它是可以搜索的，这个Agent可以搜索。而且也别来音乐了，改音效：鼠标点击声、气泡破裂声和铃音，给我改三个音效出来。他首先出去搜索了一堆，说这个是该干的，但是他并没有把它做得很漂亮。自己想了半天，又给我生成个头像，这样的头像。这次，他给你整了段音乐回来，说我来给你生成。你说他搜索了一大堆，你不知道他怎么想的，说我给你变成这样的点赞和订阅了。有的时候确实比较难以理解，让他自己配了段音乐给我加上了。不对，16:9你也没做出来呀，对吧？</p>



<p>我再接着提要求，我说这个按钮用这套，我干脆在网上搜了一套。其实刚才自己也搜出来了，用这套：订阅、点赞、评论、转发、小铃铛。静音，别给我配音乐了，后边我自己去配声音就完事了。把视频延长到8秒，但这个后来发现失败了，可灵最多也就是5秒，做不出8秒的来。他先分析一下，因为GPT-o3是可以进行图像推理的，他把我给他那张图片整个分析了一下，说没毛病。又生成了个头像，这次这个头发稍微长一点点，还是戴着眼镜的。说来给我生成，不知道他是为什么，整成这样了，就完全乱掉。呃我觉得已经可以用啊，怎么用啊？把这三个位置给它替换了就完，还是在剪映里，已经可以干活了，再生成。</p>



<p>他说：“我再稍微调整了一下，又换了一种。这次是生成四个小格了，这是四个小头像。到时候我到剪映里头，可以把这四个小头像换成点赞、小铃铛和叫做订阅，还有其他的，比如说评论啊，你就可以来做这个事。到时候自己去替换就好。”</p>



<p>他说：“我现在要去给你做8秒了，但是大家看下头，还是5秒，也就如此了。”他又给你稍微的细化了一下，各种生成。到这儿生成完了以后，又生成了一个版本。他说：“我给你做成这样了。”到这个版本生成完了，我就已经把这个给的1,000点就耗光了，就到这里就使完了。说：“你现在该交费了是吧？不交费不让使了。”</p>



<p>那么我们来看一下它的收费标准。这是零点儿，点击upgrade，这里就是收费标准了。我现在是0，它等于是上来给了500个信用点，有500个额外的限时的bonus，我就得到了这样的一个东西。下个月是不是还有啊？这个就不确定了，他反正没有写清楚。这个看吧，反正我现在把它使完了，是10个agent、125个GPT的图像生成、2,000个Flux图像生成、28个可灵的视频生成。我肯定没用到这么多，但是我确实把1,000点使完了。有限的模型使用，就是这个规则。</p>



<p>19美金一个月呢，是2,000点，每个月2,000点，再单独给2,000点。在第一个月单独给2,000点，就是你交了19美金就得到4,000点，下个月补2,000点。他是这样来工作的：40个agent、500幅GPT的生成、8,000幅Flux生成、111个可零的生成，无限的模型使用。这是可以有商业的license。你像我刚才这个就没有商业license，就是我生成的这些内容是不可以做商业使用的。那我交了钱以后，就可以去做商业使用了。当然还有更贵的了，这个收费标准我就不去评价。</p>



<p>Demo看完了，后边我们来讲一讲这种垂类的agent到底是不是一个方向的问题。现在呢，所有的泛agent的这种效果其实都差强人意。虽然我们使用文档、使用COS空间这样的这种泛agent，或者是grok的这种deep search、Deep research或者Deeper research，所有这些东西你都搁一块儿去使，你发现什么呢？就是你让他们去进行信息收集和总结的时候呢，效果还行，但是有的时候幻觉也是很厉害的。因为我被这玩意坑过好多次，生成的结果呢总是不是那么满意。而且像这种东西，你一开始提出任务，后边他就吭哧吭哧干去了嘛，而且干还干很长时间。</p>



<p>经常是干20分钟，你想在中间打断他，想在中间去补充一些信息，想在中间让他去调整个方向的话，没有办法。你必须让他把它干完了以后才能去调整，所以效果并没有那么好。虽然有很多人说：“你看我们给你一个什么筛选简历，给你一个什么样的案例，效果好极了。”但是这可能就是他们一开始设计的几个案例，就比较适合干这个事。大量的这种案例效果并没有那么好。</p>



<p>因为我现在是每天把各种的AI agent都跑起来，让每一家都给我去收集一遍，结果再去做比对，发现也还是挺累的。为什么？因为这东西话痨。就是你让他去收集了一堆信息了以后，啰里八嗦讲一大堆，而且经常里头是错的。你说你给我按照一个比较好看的方式给我展现出来，这个效果呢也就都将就吧，反正能算是有一点点设计，但是还是挺难看的。所以呢，这种泛agent效果真的不怎么样。</p>



<p>而且现在这些泛agent还面临着什么呢？就是这些模型厂商直接自己上各种深度研究、深度搜索的这种功能，直接把它覆盖掉了。你跟这些玩意比，你没什么优势，因为毕竟人家是模型厂商，对于模型更加了解。你在外面去做这种修修补补的事情，效果并没有那么好。你想说我出一个单独的这种视觉效果，或者出一个网页表现什么的，这块也都差强人意。毕竟咱们原来讲的叫模型及应用，谁做了模型谁就有应用。OpenAI、XAI、谷歌都在不断的去侵袭这些泛agent的这种领地，所以他们的日子其实并不好过。</p>



<p>那垂类的agent到底是不是可以逃脱被覆盖的命运呢？原来我们都讲说，ChatGPT更新了升级了，一堆人失业了，一堆创业项目死了。但是呢，垂类的agent会稍微好那么一点点。垂类agent干嘛？第一个就是专属知识库。我把一些特定的知识库专门总结出来，让他可以在里边去做RAG。就是我们通过一些特定知识库在里边去搜索，会得到更准确、更符合这个行业要求的结果，这是一方面。</p>



<p>第二个呢就是专属的提示词库，或者是干脆训练小模型。你可以让agent的规划做得更好。咱们以今天讲的这个Livechat来为例，他就完全可以做一个专门的提示词库。我就告诉大家说，咱们是如果是做哪些事情的话，应该先调用哪个模型，再调用哪个模型，哪个模型的这个提示词应该如何去写。这些东西是一堆设计师在里边去做的，他按照设计师自己的这个工作流程去给你设计这些提示词库。这个效果还是比这种你直接告诉一个ChatGPT，说来去给我设计提示词去吧。</p>



<p>给我设计流程去吧，要比这个效果要好。毕竟是真人有工作经验。在这里有些说，我需要大量的出这种规划，就是这种流程。规划的时候干脆就设计个小模型，你拿这些小模型直接出设计规划，效果会非常好的。</p>



<p>那么多公司的模型配合工作的，也是这种垂类agent的一个特性。因为刚才我们讲的就是大模型公司，想去覆盖这种泛agent的市场，它一定是什么？就只能调自己家的模型。openAI说我想去调谷歌的Gemini，这肯定搞不定，因为openAI它自己也不会干这个活。谷歌说想去调XAI的grok也不行。但是这些agent公司它是可以的，它是中立的。我可以把一大堆的模型串在一起，让各自干各自最擅长的事情。他这块还是有一定优势的。</p>



<p>特别是在做图像生成的时候，现在图像生成这个领域，还不像是比如说代码生成，或者文字生成。那些领域里头大家在你追我赶，而且跑得很快，相互之间也没有说谁会绝对领先，或者在哪一个领域里头特别的领先，其他人无可替代。所以你并不需要说，我把所有的模型都跑通，才得到一个最好的结果。都用openAI的也可以得到很好的结果，都用谷歌的也可以得到很好的结果。</p>



<p>但是图形这块儿不一样，midjourney、GPT、谷歌、Flex、stable diffusion各有各的长处。每一个模型有自己能够干的最好的这个事情。它把这些东西串在一起，能够去形成一个完整的agent流程的话，确实是可以解决很多用单一公司产品解决不了的问题。所以呢，这种垂类的，特别是像画图这样的这种工作，它的这种a站的产品，是有一些护城河的。它的护城河要比刚才我们讲的那种泛agent的要强一些。</p>



<p>其实有一个这种垂类agent的典型案例，到目前为止还是跑得非常快。这个典型案例叫cursor，就是AI编程现在跑得最快的。它真正强的地方不是它里头使用的cloud 3.7、cloud 4这些模型，它真正强的地方是它整个有一整套的符合程序员工作流程的提示词库，自己也训练了一些小的模型去配合各个模型在里边去工作。所以这种垂类agent确实是有机会的。</p>



<p>但是垂类agent的日子也没有那么好过。为什么这么讲？垂类用户，你既然叫垂直了，潜台词是什么？一定少嘛。你说我是泛agent，我什么都能干，那一定是很多的用户都有需求。你说我就是做设计的，那你说我没有设计需求，那肯定不是你的用户。所以它的用户量比较少，成本很高。</p>



<p>因为你调用的模型都是别人家的，像刚才我们讲的Lovart这种。你看看他这个收费标准你就知道了，他的不同的套餐收费标准里头，代表的是不同模型调用的次数。你像我现在已经把我的所有送的点都用光了，所以他的成本是非常非常难控制的，因为所有都在外边，也没法随随便便做补贴。烧钱他也烧不起，因为做这种特别是设计类的、多模态生成类的，这种模型本身对算力要求都非常高，必须要玩付费转化率。不付钱没法整，因为你没有办法说我大量免费，不停的吸引新用户进来转换，你必须要付费。那么它的启动就会比较难，它的收费规则制定也很复杂，因为你调用这么多家的模型，各家都有优惠，有什么其他的一些收费标准。你要把所有这些收费标准融合在一起，然后放到你这个整体的收费标准里头去，这个事也比较麻烦。</p>



<p>而且呢，他们还有一个成本非常高的地方在哪？他的研发成本也很高。你说这帮人都不去做自己的大模型，都调别人的模型，就是一帮写提示词的，他为什么研发成本高？他们需要干一个特别恶心的事情，叫跟模型。原来我们叫跟核，以前我们做，比如说浏览器底下是Chrome的核，我们需要去跟这个核。现在我们跟这么多的大模型一起打交道，这些模型每天在这升级，你就需要跟所有的模型。这两天比如说Flex新出了一个版本，叫K O N T E X T，可以实现一致性提升。而且他那个一致性提升，非常非常多的细节是掌握的更好。你现在想要把它用上，就要赶快派人去做研究，做研发，这个是非常非常累的。</p>



<p>原来我在Borland做Jbuilder的时候，也是这块儿非常累。为什么？因为当时我们需要去应对各种各样的j2ee的中间件，weblogic的、Oracle的、IBM的，还有Borland的自己的VC broker。这些东西他每天都在升级，那你升级了以后，谁升级了你都得跟着升级，要不然的话你没法支持最新的版本。他这个就很累，你等于非常多的研发成本要在里头，而且最后卖钱，你可能还卖不出这么多来。所以对于这种做垂类的agent的人，这一块的研发成本还是非常高的，而且是个辛苦钱。</p>



<p>还有一个比较讨厌的什么？就是烧钱。跟所有大厂比起来，他们都烧不过人家，所以这一块也是很麻烦。最后一点，如果做大了，容易被大厂惦记上。比如说现在编程这一块儿的垂类agent，windsuf已经被OpenAI收了，cursor现在长得很大，那微软说那我收拾收拾你吧。</p>



<p>GitHub Copilot直接集成到VS Code里头，而且GitHub Copilot直接把Agent的功能全加进去。我就要把你挤死，这个对于Cursor来说，也是有很大的这种压力的。而且其他的大厂，比如说像字节跳动出Trae，阿里也出了0码IDE，就是把它原来的编程插件直接集成到IDE里头来。那这一块的话，对于这些做AI Agent的厂商来说的话，也算是个幸福的烦恼。</p>



<p>什么叫幸福的烦恼？你做的小没人理你，做大了才有人去理你。</p>



<p>最后咱总结一下，垂类Agent其实就有点像中国人的移动APP。为什么是中国人的移动APP？移动APP这个市场里头，大量的排在靠前面的都是中国人做的。为什么呢？就是我们喜欢干这种工匠精神的事，叫知其然而不知其所以然。我也不去研究背后为什么，我就在前头去修修补补，去绣花。甭管是跟核也好，还是跟模型也好，做这个辛苦活，这个事是中国人擅长的。所以，干脆咱就拼勤奋，拼细节得了。</p>



<p>你说我吭哧瘪肚0-1去训练大模型，这事我们搞不定，而且现在芯片还不是那么好使。干脆你们都去训练大模型，我来想办法把这些模型凑在一块，解决一些实际问题。这一块确确实实是中国人比较擅长的。太多大厂懒得做，或者无法投入很多资源去做的领域里头，中国人就可以在里边找到机会。在某一些垂类领域里头，就可以做出一些有趣的产品来。</p>



<p>很多方向的机会，做这种垂类Agent的机会，就跟做APP差不多。举几个例子，比如说Keep这样的健身APP。你说我现在直接给你做成垂类Agent行不行？没有任何问题。营养师的健身教程，再加上训练私有的这种小模型，或者说我去做健身相关信息的这种垂类知识库，把这些东西搁在一起，再去做一些健身课程的规划和设计，健身数据的输入，再拿这个东西进行一对一的去指导。</p>



<p>或者是一些教学类的垂类Agent，比如学英语的，或者是学一些其他课程那种垂类Agent，都是可以做得出来的。或者是旅游行程规划。我最近因为有无人机了，老惦记出去玩儿去，那我就得用各种的泛Agent去测规划，发现巨难使。</p>



<p>我说我现在想规划一个从哪哪出发，到什么什么地方去，到那个地方怎么去玩，怎么去停车，怎么去充电，哪个地方是拍照打卡点，哪个地方是无人机的摄影打卡点，那有什么吃的什么玩的，有什么样的历史古迹，有什么故事，你去给我总结一下。每一次都啰里八嗦，给我整一个几万字的小作文。</p>



<p>弄完了，我连看都懒得看。看完了以后，发现也没有任何直接执行的可能性。为啥？因为写的非常多的东西都是错的。</p>



<p>如果这个东西你把它专门规划好了，做成一个agent，那肯定有人愿意用。或者拿机加酒挣钱就完了，就是买机票和酒店去挣钱，这个都是很好的创业方向。</p>



<p>医疗陪诊：我今天想去看个病，那你是不是可以调用各种医疗系统，帮我去挂号，帮我去选大夫，帮我去处理各种各样的检查结果？这个事是不是OK？</p>



<p>包括视频剪辑：Lovart的创始人叫陈冕，原来是剪映的。现在剪映也准备专门出垂类agent，叫百灵鸟还是叫什么，现在可能在安卓平台上在做，等他出呗。你像我们每次剪辑视频也可麻烦了，美颜一下，调个颜色，然后做音频的处理，这些东西直接上agent不就完事了吗？做一个垂类agent，这块可能在今年就可以看到。</p>



<p>而且在这块，剪映也好、快手也好，可能都会往前冲。因为剪映后边有吉梦，快手后边有可灵，他们自己这样的模型就已经做得很好。所以他们很有可能说，我把自己的剪映客户、快手客户，加上自己的这些模型，拼出一些垂类agent来，那这块也是可以期待一下的。</p>



<p>但这个大家就可能做的时候稍微小心一点。你跟剪映这种公司碰上，或者跟字节跳动这种公司碰上，比较痛苦。多选一些其他的品类，大家就可以在这儿去思考说，我这个行业里头，是不是有机会做一些垂类的agent出来，做一些有趣的、有价值的产品出来。虽然用户量不大，但是大家愿意付钱，让整个商业模式可以跑通。</p>



<p>这就是今天我们要讲的故事。感谢大家收听，请帮忙点赞、点小铃铛，参加Disco讨论群。也欢迎有兴趣、有能力的朋友，加入我们的付费频道。再见！</p>
]]></content:encoded>
					
		
		
			</item>
	</channel>
</rss>
