设计师的未来已来?Lovart垂直AI Agent震撼体验,从Midjourney到多模型协作,揭秘AI如何颠覆传统设计流程与商业模式。
6 月 01
AIGC AI Agent, AI 数字人, AIGC, AIGC (AI生成内容), AI产品分析, AI创业, AI动画, AI发展趋势, AI商业模式, AI工具测评, AI教程, AI模型聚合, AI绘画, AI视频生成, AI设计, AI赋能设计, Canva, ComfyUI, Demo演示, Flex, Google Imagine, GPT-4o, LibLib AI, Lovart, MidJourney, Photoshop, stable diffusion, YouTube封面, YouTube封面设计, 产品体验, 剪映, 剪映 (CapCut), 可灵, 可灵 (Keling), 垂类Agent, 多模态AI, 工作流自动化, 提示词工程, 泛Agent, 泡泡玛特风格, 科技评论, 老范讲故事, 设计师, 设计师AI, 设计师失业, 设计师就业, 陈冕 设计师的未来已来?Lovart垂直AI Agent震撼体验,从Midjourney到多模型协作,揭秘AI如何颠覆传统设计流程与商业模式。已关闭评论
设计师这次是不是真的要失业了?咱们从Lovart这个为设计师专门设计的垂直agent来看看AI agent在垂直品类里的一些玩法儿。
大家好,欢迎收听老范讲故事的YouTube频道。Lovart又一个现象级产品出来了,设计师专用的一个垂直agent。它呢没有Manus当时引起的那么大的动静,但是呢,我用了一下,感觉比Manus这种泛agent还是要好用一些。
什么叫泛agent?就是它啥都能干。Lovart这种能够专门为设计师工作的agent呢,它就是垂类agent,它其它事干不了。你说你给我去写个文章,给我去做个总结,这它干不了。但是你说你给我画个画,做个视频,设计一个PPT,设计个海报,做的可好了。他们设计的产品在x上被马斯克亲自点赞。因为这种设计类产品嘛,一个图片什么的,你要设计的非常好的话,确实会引起大佬点赞。很多的使用者也是惊为天人,我去使了一下,确实是很神奇,能够解决非常多的问题。
什么叫设计师垂直agent?大家知道AI agent它可以自我规划,可以调用各种工具,然后完成一个完整的工作。最早的这种AI agent就是从生成图片开始的,Midjourney现在的话应该是Google imagine 4 GPT image,stable diffusion Flex这样的直接生图片的模型还是有很多的,最早也是从这开始。但是这个东西有一个很大的问题是什么?就是很难控制。你说我希望有稳定性,我每一次生成的这个人都要长成一样,我希望写字写对。即使是现在写字写的比较好的,比如说像吉梦模型或者是PPT的模型,但也经常还是会写错。所以我们使用这些模型的时候,经常的工作流程是什么样的呢?先画,画完了以后呢抠图,再到一些像Photoshop或者像我用Canva这种可画的平台里边儿再去拼,然后再把这个人把字儿重新拼在一起。既然这个流程已经确定了,找个agent把它整个儿都串起来,不就完事儿了吗?
再往后发展呢,就是一些可以进行串联,或者说进行一些工作流设定的一些产品。比如说像设计圈里的Confy UI这样的一些产品,你可以把这个工作流画好,它就按照这个工作流整个跑一圈下来。文字生成里头呢,用的像Defi code这种其实也是这种工作流设计软件。现在新的时代到来了,就是自我规划的agent。比如说像文档,各种的deep search。
Deep research这样的东西,你给他提出问题,剩下的该去查哪些网站、该怎么总结、该怎么去分析、如何去校对、如何减少幻觉、如何去把结果做得更漂亮,人家一次搞定。现在就是新的Agent的时代已经到来了。
这个为设计师工作的Agent呢,也走到了这一步。从最早的单模型Midjourney,到Confy UI这样的工作流设计的流程,到最后说干脆我一次给你搞定。现在Lovear就是这样的一个产品。
它呢,把一大堆的模型放在里头,比如说Flex、Google Imagine 4、PPT Image、Flex这些都放进去。这个里头没有Midjourney,Midjourney那个东西不是特别好控制。然后把音乐和音效生成搁里头,你说我最后要出视频,那我需要给你配乐都有,包括一些TTS的阅读也都放在里头,就是数字人的这种也都搁在里头。
视频生成模型,他掉的是可灵1.6,是快手做的视频生成模型,效果也还可以。我已经把模型搁这了,下一件事就是提要求就完了。你说我今天想要一个YouTube的封面,或者我想要YouTube里边的一个小的动画,你提要求就完了。
剩下的这个Lovart就自动地规划路径,还去调用一些推理的模型,比如说GPT O3这样的模型。它推理一下说,我到底怎么把这个路径规划得更好呢?再调用刚才我们讲的Flex呀、GPT Image呀、谷歌的Imagine,然后生成音乐,生成视频,配在一起。
最终呢,完成一个相对比较复杂的任务。而且还有很多Photoshop呀,或者Canva一些功能也搁在里头。这什么功能呢?就是图层。你说我现在要求在哪个图层上干哪些活,要求在什么地方写什么字,他就直接给你写就完了。不要让这个大模型再去费劲给你拼字去了,反正他也拼不对,咱们就别费这个劲了。
所以这个就是一个很完整的设计流程,一次搞定。真的是一个中国团队的产品,虽然这个团队在硅谷,但是呢,确确实实是个中国团队。他们最上面的一个公司呢叫Lab Lab AI。
这个Lab Lab AI呢,是中国最活跃的Stable Diffusion的社区。他们干嘛呢?就是把大量的Stable Diffusion上用到的Laura的这种微调的模型,都放在这展示。展示完了以后呢,我们去交换这些训练出来的这种微调模型就可以了。也有一定的商业模式,但是呢,发展的不是特别好吧,虽然很活跃。因为大家最后还是要去看说……
是不是能够形成正向的商业模式?好在是中国在做这个电商,做这个各种网红经济。在这一块,需要的设计师的量非常大,或者说设计师工作非常多。所以呢,他们也还是在运转。前面融资呢,也融了一些。后面呢,是找了一个很著名的创业者,开了美国的分公司。所以呢,Lovart这个产品是lablab.AI美国分公司做的。他们找的这个创业者,就是Lovart的创始人和CEO呢,叫陈冕,官冕的冕。他呢,是摩拜单车的产品总监。离开摩拜单车以后呢,是剪映和Capcat的全球商业化负责人。2024年离开剪映跑来去创业,做了一个叫Lovart的一个产品,做的还是相当不错的。
口说无凭,咱们来看Demo,看看我用这玩意干了些什么。这就是Lovart的首页。这个设计师做的页面确实是好看,比我们这些程序员直男做的东西要好看多了。这个它的页面就是lovart点ai。现在很多都是AI开始的域名。想要玩这个东西,要有一个邀请码,或者是加入等待链接。我是加入waiting list,等了一周左右得到的邀请码。我现在还有3个邀请码。get start就进来。我会把三个邀请码放在视频的简介里。如果大家想要去玩的话就拿三个邀请码去用啊。但是因为是会员先看到,所以可能公布到公众频道的时候,这个邀请码就已经用完了啊。也欢迎大家拿到新的邀请码以后,分享到我的评论区里头。
大家看到我现在已经没钱了,已经把所有的信用点都花光了。一共上来是给了1,000点。他是拿到邀请码给500点,每个月给500点。我要想再画要等下个月了。好,跟大家看一下他的一些干的活。这个就是我用了1,000点得到的这个结果。上来,请设计YouTube 16:9的封面视频。封面频道名是老范讲故事。视频题目是老范读评。这是每周三晚上8点的直播节目,读一周的观众评论。加上以我照片生成的皮克斯3D风格的角色设计。这是我写的提示词,给了一张照片,他就干活去了。说我先想想,我先思考一下这个活要怎么干,分析一下。说我应该是一个什么样的照片。可能呢,调的是GPT O3做的图像推理。推理完了以后再去调用这个知识库。我有哪些知识,是吧?这是一个哪样的一个设计建议啊?要用GPT image,要用这东西来去做皮克斯3D风格的角色,再加上这些文字要求,画到16:9的横纵比。结束了。这个是他做的一个规划。再去说,我这是一个创意了,我要去创意了。
这个皮克斯3D的东西应该怎么做?自己夸夸夸想去了。“老范读屏”这几个字55%高,要写在什么地方?周三,呃,20点直播,要写在一个什么样的字体?写在哪儿?底下,右下角要写“老范讲故事”。背景应该是一个橙金色的渐变色,而且是有一些什么样的要求?他就一个一个的去给你做去了。然后颜色,主颜色是什么?高亮颜色是什么?你做了一堆这样的要求。原型,一个什么样的东西啊?要写中文,要什么sans,应该是宋体,大概是写黑的。自己去研究了半天,就开始创建图片,干活去了,得到了这个图。现在不知道为什么他把这个大的删了,肯定还是成本问题。让我们来看一下图,就给你画成了这样的一个东西。这个还是很可爱的。“这个老范讲故事”这个“事”字写得稍微有些问题啊。“周三20:00直播”是“老范读评”。大家发现这东西有问题了没有?除了这个“故事”的“事”字写错了之外,还有问题。哪有问题?他不是16:9的,他是3:2的。它这个图的分辨率是1,500*1,000,实际上是3:2。为什么会成这样呢?因为它最后的这个背景图是拿GPT生成的,GPT到头就是3:2,再大的横纵比做不出来了。这是GPT的一个bug。也有问题,这个说你生成的是3:2的,不是16:9的。这是GPT 4o的一个bug,只能出3:2。我理解了,这个有个问题,让我再去做16:9。反正做了半天,他又做了个3:2的图出来,稍微改了改,大概是长成这样了。这个反正能使呗,到时候我再把这个脑袋抠下来,再把这字抠下来,回头下个礼拜读屏的时候,咱就用一次啊。反正也是挺好玩的,一个图就做出来了。但是大家看到的是什么?一句话,我真的是写了一句话,他就做了一个基本凑合还能使的东西。这就是这句话。你说设计师是不是要失业?你像我就是个写程序的直男,我就可以做到这样的结果了。设计师就会稍微有一点点痛苦了。他们的设计的一致性,这种反正我觉得还是有点美感的,设计出来还是可以用的。你看这个胖子还是有点点可爱的嘛,笑得多喜庆。好,咱们再看另外一个demo。这个demo是我让他去画,画视频去了,因为这东西是可以直接出视频的。看,我也是给了一张自己的美照,说:“给我一段视频,YouTube求点赞、关注、点击小铃铛的,用我的形象,生成泡泡玛特风格的人物形象,求点赞、求关注、求小铃当,时长5秒,绿色背景,方便抠图,统一用泡泡玛特可爱风格。”他就又想去了。这次他是使用了Flux,用了这个模型去生成的。这个像吗?
反正泡沫马特风格,大头,而且是这个。大家看这个塑料材质,至于像不像我,这个事就无所谓了,这个不重要。画成这样了,我也不好意思说它像我了。
调用可灵的视频生成,生成了5秒视频。你看,这个就是5秒视频,他就生成声音去了。这个声音其实做的很烂:“like subscribe and click the notification bell”。你看这是点赞、呃订阅、点击这个提醒的小铃铛,大概讲了这么一句话。把这俩东西给我拼一块吧:“like subscribe and click the notification bell”。我觉得不是特别满意,我说啊,别说话了,这个说的太难听了。
配音效加上3D的泡泡玛特风格的点赞,大拇哥的订阅小铃铛换成16:9的,人物要戴上眼镜。他又思考干活去了。这回呢,人戴眼镜了,这没毛病。给我生成了个音乐,这个是成出来的,它里头是有音乐生成的,大模型的,生成了一个视频。这次呢,有小铃铛,但是他这个小铃铛画的就很怪,他没法理解什么是点赞。这个看来可灵在这块还是稍微差一点点,5秒钟搞定。
我说这个做订阅的和小铃铛,这个点赞的3D形象太奇怪了,看不出来是做什么的。去网上搜索一下,它是可以搜索的,这个Agent可以搜索。而且也别来音乐了,改音效:鼠标点击声、气泡破裂声和铃音,给我改三个音效出来。他首先出去搜索了一堆,说这个是该干的,但是他并没有把它做得很漂亮。自己想了半天,又给我生成个头像,这样的头像。这次,他给你整了段音乐回来,说我来给你生成。你说他搜索了一大堆,你不知道他怎么想的,说我给你变成这样的点赞和订阅了。有的时候确实比较难以理解,让他自己配了段音乐给我加上了。不对,16:9你也没做出来呀,对吧?
我再接着提要求,我说这个按钮用这套,我干脆在网上搜了一套。其实刚才自己也搜出来了,用这套:订阅、点赞、评论、转发、小铃铛。静音,别给我配音乐了,后边我自己去配声音就完事了。把视频延长到8秒,但这个后来发现失败了,可灵最多也就是5秒,做不出8秒的来。他先分析一下,因为GPT-o3是可以进行图像推理的,他把我给他那张图片整个分析了一下,说没毛病。又生成了个头像,这次这个头发稍微长一点点,还是戴着眼镜的。说来给我生成,不知道他是为什么,整成这样了,就完全乱掉。呃我觉得已经可以用啊,怎么用啊?把这三个位置给它替换了就完,还是在剪映里,已经可以干活了,再生成。
他说:“我再稍微调整了一下,又换了一种。这次是生成四个小格了,这是四个小头像。到时候我到剪映里头,可以把这四个小头像换成点赞、小铃铛和叫做订阅,还有其他的,比如说评论啊,你就可以来做这个事。到时候自己去替换就好。”
他说:“我现在要去给你做8秒了,但是大家看下头,还是5秒,也就如此了。”他又给你稍微的细化了一下,各种生成。到这儿生成完了以后,又生成了一个版本。他说:“我给你做成这样了。”到这个版本生成完了,我就已经把这个给的1,000点就耗光了,就到这里就使完了。说:“你现在该交费了是吧?不交费不让使了。”
那么我们来看一下它的收费标准。这是零点儿,点击upgrade,这里就是收费标准了。我现在是0,它等于是上来给了500个信用点,有500个额外的限时的bonus,我就得到了这样的一个东西。下个月是不是还有啊?这个就不确定了,他反正没有写清楚。这个看吧,反正我现在把它使完了,是10个agent、125个GPT的图像生成、2,000个Flux图像生成、28个可灵的视频生成。我肯定没用到这么多,但是我确实把1,000点使完了。有限的模型使用,就是这个规则。
19美金一个月呢,是2,000点,每个月2,000点,再单独给2,000点。在第一个月单独给2,000点,就是你交了19美金就得到4,000点,下个月补2,000点。他是这样来工作的:40个agent、500幅GPT的生成、8,000幅Flux生成、111个可零的生成,无限的模型使用。这是可以有商业的license。你像我刚才这个就没有商业license,就是我生成的这些内容是不可以做商业使用的。那我交了钱以后,就可以去做商业使用了。当然还有更贵的了,这个收费标准我就不去评价。
Demo看完了,后边我们来讲一讲这种垂类的agent到底是不是一个方向的问题。现在呢,所有的泛agent的这种效果其实都差强人意。虽然我们使用文档、使用COS空间这样的这种泛agent,或者是grok的这种deep search、Deep research或者Deeper research,所有这些东西你都搁一块儿去使,你发现什么呢?就是你让他们去进行信息收集和总结的时候呢,效果还行,但是有的时候幻觉也是很厉害的。因为我被这玩意坑过好多次,生成的结果呢总是不是那么满意。而且像这种东西,你一开始提出任务,后边他就吭哧吭哧干去了嘛,而且干还干很长时间。
经常是干20分钟,你想在中间打断他,想在中间去补充一些信息,想在中间让他去调整个方向的话,没有办法。你必须让他把它干完了以后才能去调整,所以效果并没有那么好。虽然有很多人说:“你看我们给你一个什么筛选简历,给你一个什么样的案例,效果好极了。”但是这可能就是他们一开始设计的几个案例,就比较适合干这个事。大量的这种案例效果并没有那么好。
因为我现在是每天把各种的AI agent都跑起来,让每一家都给我去收集一遍,结果再去做比对,发现也还是挺累的。为什么?因为这东西话痨。就是你让他去收集了一堆信息了以后,啰里八嗦讲一大堆,而且经常里头是错的。你说你给我按照一个比较好看的方式给我展现出来,这个效果呢也就都将就吧,反正能算是有一点点设计,但是还是挺难看的。所以呢,这种泛agent效果真的不怎么样。
而且现在这些泛agent还面临着什么呢?就是这些模型厂商直接自己上各种深度研究、深度搜索的这种功能,直接把它覆盖掉了。你跟这些玩意比,你没什么优势,因为毕竟人家是模型厂商,对于模型更加了解。你在外面去做这种修修补补的事情,效果并没有那么好。你想说我出一个单独的这种视觉效果,或者出一个网页表现什么的,这块也都差强人意。毕竟咱们原来讲的叫模型及应用,谁做了模型谁就有应用。OpenAI、XAI、谷歌都在不断的去侵袭这些泛agent的这种领地,所以他们的日子其实并不好过。
那垂类的agent到底是不是可以逃脱被覆盖的命运呢?原来我们都讲说,ChatGPT更新了升级了,一堆人失业了,一堆创业项目死了。但是呢,垂类的agent会稍微好那么一点点。垂类agent干嘛?第一个就是专属知识库。我把一些特定的知识库专门总结出来,让他可以在里边去做RAG。就是我们通过一些特定知识库在里边去搜索,会得到更准确、更符合这个行业要求的结果,这是一方面。
第二个呢就是专属的提示词库,或者是干脆训练小模型。你可以让agent的规划做得更好。咱们以今天讲的这个Livechat来为例,他就完全可以做一个专门的提示词库。我就告诉大家说,咱们是如果是做哪些事情的话,应该先调用哪个模型,再调用哪个模型,哪个模型的这个提示词应该如何去写。这些东西是一堆设计师在里边去做的,他按照设计师自己的这个工作流程去给你设计这些提示词库。这个效果还是比这种你直接告诉一个ChatGPT,说来去给我设计提示词去吧。
给我设计流程去吧,要比这个效果要好。毕竟是真人有工作经验。在这里有些说,我需要大量的出这种规划,就是这种流程。规划的时候干脆就设计个小模型,你拿这些小模型直接出设计规划,效果会非常好的。
那么多公司的模型配合工作的,也是这种垂类agent的一个特性。因为刚才我们讲的就是大模型公司,想去覆盖这种泛agent的市场,它一定是什么?就只能调自己家的模型。openAI说我想去调谷歌的Gemini,这肯定搞不定,因为openAI它自己也不会干这个活。谷歌说想去调XAI的grok也不行。但是这些agent公司它是可以的,它是中立的。我可以把一大堆的模型串在一起,让各自干各自最擅长的事情。他这块还是有一定优势的。
特别是在做图像生成的时候,现在图像生成这个领域,还不像是比如说代码生成,或者文字生成。那些领域里头大家在你追我赶,而且跑得很快,相互之间也没有说谁会绝对领先,或者在哪一个领域里头特别的领先,其他人无可替代。所以你并不需要说,我把所有的模型都跑通,才得到一个最好的结果。都用openAI的也可以得到很好的结果,都用谷歌的也可以得到很好的结果。
但是图形这块儿不一样,midjourney、GPT、谷歌、Flex、stable diffusion各有各的长处。每一个模型有自己能够干的最好的这个事情。它把这些东西串在一起,能够去形成一个完整的agent流程的话,确实是可以解决很多用单一公司产品解决不了的问题。所以呢,这种垂类的,特别是像画图这样的这种工作,它的这种a站的产品,是有一些护城河的。它的护城河要比刚才我们讲的那种泛agent的要强一些。
其实有一个这种垂类agent的典型案例,到目前为止还是跑得非常快。这个典型案例叫cursor,就是AI编程现在跑得最快的。它真正强的地方不是它里头使用的cloud 3.7、cloud 4这些模型,它真正强的地方是它整个有一整套的符合程序员工作流程的提示词库,自己也训练了一些小的模型去配合各个模型在里边去工作。所以这种垂类agent确实是有机会的。
但是垂类agent的日子也没有那么好过。为什么这么讲?垂类用户,你既然叫垂直了,潜台词是什么?一定少嘛。你说我是泛agent,我什么都能干,那一定是很多的用户都有需求。你说我就是做设计的,那你说我没有设计需求,那肯定不是你的用户。所以它的用户量比较少,成本很高。
因为你调用的模型都是别人家的,像刚才我们讲的Lovart这种。你看看他这个收费标准你就知道了,他的不同的套餐收费标准里头,代表的是不同模型调用的次数。你像我现在已经把我的所有送的点都用光了,所以他的成本是非常非常难控制的,因为所有都在外边,也没法随随便便做补贴。烧钱他也烧不起,因为做这种特别是设计类的、多模态生成类的,这种模型本身对算力要求都非常高,必须要玩付费转化率。不付钱没法整,因为你没有办法说我大量免费,不停的吸引新用户进来转换,你必须要付费。那么它的启动就会比较难,它的收费规则制定也很复杂,因为你调用这么多家的模型,各家都有优惠,有什么其他的一些收费标准。你要把所有这些收费标准融合在一起,然后放到你这个整体的收费标准里头去,这个事也比较麻烦。
而且呢,他们还有一个成本非常高的地方在哪?他的研发成本也很高。你说这帮人都不去做自己的大模型,都调别人的模型,就是一帮写提示词的,他为什么研发成本高?他们需要干一个特别恶心的事情,叫跟模型。原来我们叫跟核,以前我们做,比如说浏览器底下是Chrome的核,我们需要去跟这个核。现在我们跟这么多的大模型一起打交道,这些模型每天在这升级,你就需要跟所有的模型。这两天比如说Flex新出了一个版本,叫K O N T E X T,可以实现一致性提升。而且他那个一致性提升,非常非常多的细节是掌握的更好。你现在想要把它用上,就要赶快派人去做研究,做研发,这个是非常非常累的。
原来我在Borland做Jbuilder的时候,也是这块儿非常累。为什么?因为当时我们需要去应对各种各样的j2ee的中间件,weblogic的、Oracle的、IBM的,还有Borland的自己的VC broker。这些东西他每天都在升级,那你升级了以后,谁升级了你都得跟着升级,要不然的话你没法支持最新的版本。他这个就很累,你等于非常多的研发成本要在里头,而且最后卖钱,你可能还卖不出这么多来。所以对于这种做垂类的agent的人,这一块的研发成本还是非常高的,而且是个辛苦钱。
还有一个比较讨厌的什么?就是烧钱。跟所有大厂比起来,他们都烧不过人家,所以这一块也是很麻烦。最后一点,如果做大了,容易被大厂惦记上。比如说现在编程这一块儿的垂类agent,windsuf已经被OpenAI收了,cursor现在长得很大,那微软说那我收拾收拾你吧。
GitHub Copilot直接集成到VS Code里头,而且GitHub Copilot直接把Agent的功能全加进去。我就要把你挤死,这个对于Cursor来说,也是有很大的这种压力的。而且其他的大厂,比如说像字节跳动出Trae,阿里也出了0码IDE,就是把它原来的编程插件直接集成到IDE里头来。那这一块的话,对于这些做AI Agent的厂商来说的话,也算是个幸福的烦恼。
什么叫幸福的烦恼?你做的小没人理你,做大了才有人去理你。
最后咱总结一下,垂类Agent其实就有点像中国人的移动APP。为什么是中国人的移动APP?移动APP这个市场里头,大量的排在靠前面的都是中国人做的。为什么呢?就是我们喜欢干这种工匠精神的事,叫知其然而不知其所以然。我也不去研究背后为什么,我就在前头去修修补补,去绣花。甭管是跟核也好,还是跟模型也好,做这个辛苦活,这个事是中国人擅长的。所以,干脆咱就拼勤奋,拼细节得了。
你说我吭哧瘪肚0-1去训练大模型,这事我们搞不定,而且现在芯片还不是那么好使。干脆你们都去训练大模型,我来想办法把这些模型凑在一块,解决一些实际问题。这一块确确实实是中国人比较擅长的。太多大厂懒得做,或者无法投入很多资源去做的领域里头,中国人就可以在里边找到机会。在某一些垂类领域里头,就可以做出一些有趣的产品来。
很多方向的机会,做这种垂类Agent的机会,就跟做APP差不多。举几个例子,比如说Keep这样的健身APP。你说我现在直接给你做成垂类Agent行不行?没有任何问题。营养师的健身教程,再加上训练私有的这种小模型,或者说我去做健身相关信息的这种垂类知识库,把这些东西搁在一起,再去做一些健身课程的规划和设计,健身数据的输入,再拿这个东西进行一对一的去指导。
或者是一些教学类的垂类Agent,比如学英语的,或者是学一些其他课程那种垂类Agent,都是可以做得出来的。或者是旅游行程规划。我最近因为有无人机了,老惦记出去玩儿去,那我就得用各种的泛Agent去测规划,发现巨难使。
我说我现在想规划一个从哪哪出发,到什么什么地方去,到那个地方怎么去玩,怎么去停车,怎么去充电,哪个地方是拍照打卡点,哪个地方是无人机的摄影打卡点,那有什么吃的什么玩的,有什么样的历史古迹,有什么故事,你去给我总结一下。每一次都啰里八嗦,给我整一个几万字的小作文。
弄完了,我连看都懒得看。看完了以后,发现也没有任何直接执行的可能性。为啥?因为写的非常多的东西都是错的。
如果这个东西你把它专门规划好了,做成一个agent,那肯定有人愿意用。或者拿机加酒挣钱就完了,就是买机票和酒店去挣钱,这个都是很好的创业方向。
医疗陪诊:我今天想去看个病,那你是不是可以调用各种医疗系统,帮我去挂号,帮我去选大夫,帮我去处理各种各样的检查结果?这个事是不是OK?
包括视频剪辑:Lovart的创始人叫陈冕,原来是剪映的。现在剪映也准备专门出垂类agent,叫百灵鸟还是叫什么,现在可能在安卓平台上在做,等他出呗。你像我们每次剪辑视频也可麻烦了,美颜一下,调个颜色,然后做音频的处理,这些东西直接上agent不就完事了吗?做一个垂类agent,这块可能在今年就可以看到。
而且在这块,剪映也好、快手也好,可能都会往前冲。因为剪映后边有吉梦,快手后边有可灵,他们自己这样的模型就已经做得很好。所以他们很有可能说,我把自己的剪映客户、快手客户,加上自己的这些模型,拼出一些垂类agent来,那这块也是可以期待一下的。
但这个大家就可能做的时候稍微小心一点。你跟剪映这种公司碰上,或者跟字节跳动这种公司碰上,比较痛苦。多选一些其他的品类,大家就可以在这儿去思考说,我这个行业里头,是不是有机会做一些垂类的agent出来,做一些有趣的、有价值的产品出来。虽然用户量不大,但是大家愿意付钱,让整个商业模式可以跑通。
这就是今天我们要讲的故事。感谢大家收听,请帮忙点赞、点小铃铛,参加Disco讨论群。也欢迎有兴趣、有能力的朋友,加入我们的付费频道。再见!