Manus全解构:国运级AI Agent背后的真相,自动规划工具是否真的不可或缺?
3 月 10
AIGC AI Agent, AIGC娱乐, AI产品方向, AI产品设计, AI创新, AI创新方向, AI协作工具, AI发展, AI发展阶段, AI图表生成, AI工具价格, AI工具演示, AI工具链, AI市场, AI市场潜力, AI幻觉, AI应用, AI总结归纳, AI成本, AI技术发展, AI技术壁垒, AI推理能力, AI搜索工具, AI数据管理, AI文本生成, AI未来趋势, AI模型, AI用户增长, AI社交裂变, AI算力问题, AI行业偏转, AI行业分析, AI表格生成, AI进程, AI逻辑推理, AI领域, ChatGPT, Claude 3.7, Claud模型, Deepsearch, DeepSeek, GPT-4, GPT-4.5, GROK3, Manus, Markdown, Monica.IM, OpenAI, OpenManus, PLG产品, Workflow自动化, 人工智能工具, 人工智能规划, 企业AI应用, 国外AI应用, 国家安全AI, 国运级产品, 大模型, 小型AI团队, 山姆·奥特曼, 推理模型, 智能规划工具, 架构设计, 模型阶段, 用户体验AI, 算力消耗, 自主规划AI, 自动化工作流, 自动规划AI, 自我规划, 规划工具链, 集成工具链 Manus全解构:国运级AI Agent背后的真相,自动规划工具是否真的不可或缺?已关闭评论
大家好,欢迎收听老范讲故事的YouTube频道。今天咱们来讲一讲突然刷屏的Manus。它的来源呢,是个拉丁语单词,是“手”的意思,同时呢还有“权力”和“力量”的意思。现在呢,华为造汽车就全都是《山海经》,做AI产品全是拉丁语单词,好厉害的样子,对不对?
现在这个事情呢,应该是从昨天开始,突然就变得一码难求了。我应该是在昨天看到谁呢?王舒义,天津师范大学的一个老师,他发了一条说:“哎呀,得到那个测试码了,怎么怎么着了。”我当时都没想说这啥玩意儿,没惦记这个事,因为呢他们那个Monica我也没怎么用过。Monica这个产品对于我来说,还是有点太奇怪了一点。待会我们再继续讲。
后来到昨天晚上了,突然就开始传出来说这个东西已经在闲鱼上炒到好几万了。又一个国运级产品出来了,中国人再次震惊了世界,说老美又怎么样了,全世界又如何如何了。今天再一看这个,各种新闻媒体刷屏了。我直到开播之前犹豫再三,说算了,还是去申请一次吧。咱们虽然没用过,但是好歹也算申请过了。本来我是连申请都懒得申请的一个产品。
团队呢,也出来求饶说,有人在攻击和破解他们的网站和服务器。这个很正常嘛,你一旦做的好了以后,大家总要上来看一看。那DeepSeek最近也才是逐渐的,号称要恢复正常。但是我却试了一下,一试还是问三个问题,就停下来那么一个状态。现在团队说玩不下去了。而且呢,说几万块钱在闲鱼上买这个邀请码,这事呢他们也出来澄清说:“我们从来没收过任何钱,您千万小心别上当受骗,上当受骗了也别上我这来找来,我这没收到过钱。”
那么,AI agent是不是真的就要爆发了呢?因为咱们从去年就开始讲,说2025年就是AI agent的一年。突然到3月份,就放出了一个王炸性的产品来。这个事是不是行?首先呢,不要太兴奋,这个东西呢在国内是使不了的,必须到国外去使去。为什么?因为底层是GPT和Claude 3.5、3.7这样的模型,这些模型在中国是没有经过安全审查的。
不能落地。而且人家这些模型上,也是明确的告诉你说:“我不愿意在中国地区为你服务。万一我给你服务了,你拿去维稳了,或者做了点别的事情,我们也担不起这责任。”所以Manus这个产品在中国不能用的。他们家的Monica.im在国内也是不能用的。他们纯纯是一个出海的服务商,而且呢,其实是一个非常非常小的服务商。他们的整个的产品,在海外没有那么多用户。
那么Manus到底是干嘛的,或者你到底能干嘛呢?现在能够出来看到的,绝大部分都是官方放出来的一些视频:晒简历、做房地产的评估、旅游的规划呀,全都是这样的东西。因为拿到邀请码的人不多,就算是拿到邀请码的人,可能也还是要给一些面子。但是也有人说自己上去了,觉得一点都不好使,问的所有问题都翻车了。这个我觉得都是可以理解吧。
Manus最强的地方是什么?就是自己规划任务。因为原来我们都是靠这个,像流程图一样去自己画,说我们先干什么后干什么,每一步怎么怎么做。现在说不用了,他自己来规划。你问他一个问题以后,他自己做计划,说我先查哪些资料,再查哪个网站,然后再怎么把它拼在一起。然后呢,可以自动的执行,自己生成一点Python代码,自己去把它跑出来。然后呢,给出最终的结论呢,实际上像一份大报告似的。而且很多人看到这份报告以后觉得:“哎呀,这个写的实在是太好了,甚至给我画图表、画表格。”
画表格这件事是非常非常容易的,千万不要被这玩意骗了。像我们写Markdown格式,或者在计算机里边,写很多的语言的时候,都是可以画出来的。你让ChatGPT画个表格,它也能画出来。但是你让它给你画图表,肯定是画不了的,还是要去调用一些特殊的语言功能才可以画出来。ChatGPT他没做这事,现在统统都干了。
非常多的人一看了以后说:“哎呀,这个简直是如虎添翼,每一个人都可以成为研究者了。”而且说,这是不是AGI看到曙光了,这个东西就是未来了。所以也有很多人说,这就是下一个国运级产品。
DeepSeek的这个辉煌再次上演了,那么是不是值得这么兴奋呢?又一次国运级的创新诞生了吗?我觉得一个不能在中国使用的服务距离国运就还稍微有一点点遥远。你DeepSeek再怎么说,咱们全国上下都在部署,你一个无法在中国合法落地的产品,中国人在这呼哧呼哧在这炒作,这个是很无聊的一个事情。而且DeepSeek本身在代码生成方面,其实差得也还比较远。Manus这种产品,它是不可能靠DeepSeek大模型就在国内部署起来的,它必须要有Claude,必须要有ChatGPT才可以完整的跑起来。如果DeepSeek就可以带着他自己整个跑起来的话,他就可以在国内上架了,但是他不行。
那为什么我说DeepSeek在代码生成的方面差得非常远呢?因为我昨天花了一整天的时间在尝试用DeepSeek去写程序,那叫费劲,比Claude 3.5、3.7真的差的不是一星半点,是差的太老远了。Manus跟DeepSeek比起来,还是有很大的差距的。DeepSeek让国内所有的大厂都跟着走,Manus,国内大厂呢有可能会超他,但是呢也不一定每家都会去抄一遍,因为现在这个方向呢,大家也还在观望之中。它不像是DeepSeek,彻底把国内所有的这个大厂全给翻了一遍,所有跟云计算相关的所有运营商全都装DeepSeek去了。
DeepSeek已经改变了全球的AI格局,还带崩了英伟达的股票。而这一点上Manus就更加没有比较了。DeepSeek自己服务半停摆的情况下,依然可以搅风搅雨,那Manus呢只能算是一个标记性的时间点。他出来了以后说,哦,我们看到了一个新的产品形态,而且大家还挺喜欢,可以自我规划的AI agent可能就能够用了。那么国内的这些大厂,包括一些小一点的厂,系统经营商呢,应该就可以去冲一波了。而这个就是Manus现在带来的一些变化。Manus现在也说我们要开源。
这件事我觉得还是稍微值得期待一下。现在呢,大家最希望他开源的,是他推理和规划的这个“小模型”。但是人家具体什么时候开,开什么东西,现在还没有确定下来。那么讲这么热闹,这东西到底咋实现呢?是不是一套壳产品呢?只要是中国人做的,大家都要问一下。而人家呢,上来也承认了,说我们就是套壳的,没什么好说的。
什么叫套壳呢?就是你没有自己的大模型,大模型用的就是Anthropic、Claude 3.5、3.7、OpenAI的GPT以及DeepSeek。它是没有自己可以拿出来展示的大模型的,使用的都是公开模型。所以呢,可以算是一个套壳产品。甚至还讲了说,我们把套壳做到极致,就如何如何。但是呢,它这个离极致其实还稍微有一点点远。
那么为什么是现在这个时候,Manus这种产品出来了?这种可以有自我规划能力的GPT,其实早就有。最早有一个产品叫OTO GPT,但是一晃眼儿就不见了。现在呢,是Claude 3.7、ChatGPT,特别是DeepSeek R1,这个模型已经变得很强了。而且像DeepSeek R1这样的产品,如果你自己部署的话,你的成本是可控的。像Claude 3.7这样的产品,其实并没有那么贵,整个让它跑起来还是可以去承担的。
原来OTO GPT的时候,当时大家跑,我忘了是GPT3.5还是GPT4了,奇贵无比,所以一会那钱就哗啦哗啦就不见了,所以没做起来。现在呢,就是有可能能做出来。那么进行自我规划之后,能够可控的输出结果,这个是现在这些大模型已经可以达到的这个能力了。其实现在用一些稍微小一点的模型进行规划和微调的话,还是很方便的。
我今天还试了一个东西,就是阿里新出的QWQ 32B的这个推理模型。据说它这个32B的模型呢,是要比DeepSeek R1 671B的模型效果还好。我上去试了试,确实挺好用的,但是要想达到DeepSeek R1那个,还是要稍微差那么一点点。
虽然在跑分上确实是跑赢了DeepSeek R1,但是个人使用体验跟跑分还是不一样的。讲回来,Manus呢,应该是自己做了一个小的规划模型。它呢,构建一个规则的知识库,就是我要做什么事,大概有几种方法,我做另外一件事大概有几种方法。然后呢,输入指令进行规划。我现在要做一个旅游攻略,我现在要去筛简历,把这些命令输入进来以后,他就给你规划了。规划出来以后呢,给你做了一个叫to do.MD的文件。to do嘛,就是马上要做的事情。MD呢,实际上是Markdown。Markdown是程序员经常使用的一种文本工具,就在文本里边直接写一些符号,就可以代替排版。像我们在word里排版的话,你要先写好文字,然后选中了以后,说我们是用几号字,前头要不要写这个点,或者有没有这个编号。markdown等于完全是在文字里边去写,就程序员都是这么干。
当他做完规划以后呢,得再通过自己的一个解释器,把这个markdown里头一条一条的,一步一步去完成。他是这样去工作的。里头呢,还有一大堆小工具,比如解压。筛简历的时候,就是给了一个压缩包给他,那你把他解开。然后呢有一些文档解析,甭管是PDF文件word文件,你都解析出来。然后还要做网页解析。那为什么网页解析要单独讲一下?咱们打开网站看一看,那上面什么弹窗了广告了一大堆东西,你要把真正有用的东西扒出来,还是有点难度的。所以网页解析是专门的一个项目。然后呢,自己还带浏览器,他可以自动的去浏览网页。其实有点像今年1月份,OpenAI发的那个产品叫operator。但是operator发完了以后,只有200美金以上的用户可以用,像我这种20美金的用户还用不了。还有一些API,你比如说我现在需要重新生成PDF了,还有一些API的,它呢是可以通过Python,再生成一点点简单代码,然后可以通过这些简单代码的执行,把这些刚才我们讲的小工具,整个的通顺的串联起来。
它呢,可以设置一套小工具的调用规范。符合规范的就可以进到工具链里边去。当他拿了这样的一大堆小工具,照着todo.MD去执行了以后,就产生了一大堆的中间结果。然后呢,再对结果进行拼接。大模型的能力其实就在这。它能干嘛呢?就是处理很多这种叫非结构化数据。
什么叫结构化数据?什么叫非结构化数据?就是我现在有一个表格,第一列叫做姓名,第二列叫做年龄,第三列叫性别,第四列叫做简介,第五列叫什么职业。这个东西就叫结构化数据了,一行就是一个人。非结构化数据就是,我拿到这个数据里头是一锅酱,我们也不知道这里头到底写的什么。大模型就是你可以把一大堆的非结构化数据扔给他,然后让他去总结分析。他是有这个能力的。
而且呢,这个其实他调用,甭管是网页也好,还是各种的API,从其他的服务那里获取数据也好,实际上都是结构化数据。但是呢,他就把所有这些结构化数据打包在一起,作为非结构化数据直接扔给大模型,说来我这有一大堆数据,我也不去解释里头到底是什么,我也不去研究这个数据结构了,你去给我去总结归纳一下。他是通过这样的一个方式来干活的。
相当于是什么呢?上面的一大堆小工具,进行这种松耦合的组装。为什么要强调松耦合呢?我们正常写程序,我们会去标记,你这个数据应该是怎么排列的,第几个字节到第几个字节写什么,写错了马上报错。有了这个大模型以后,我就都塞进去,反正这个大模型也不挑你这个里头,哪个多写几行,哪个少写几行,多两个属性、少两个属性,他都无所谓。所以他就可以通过这样的方式,把这些小工具凑载起来。
得到了一些结果之后呢,再输出一个漂亮的报告,包括刚才咱们讲图表,表格呀。其实你用DeepSeek R1,用这个Claude 3.7什么的,都是可以生成这样的报告的。像我们以前写程序的时候,有很大的一块时间是干嘛?就是打报表,各种各样的报表。为什么?要对格子,要去取数据,要去做统计分析。这个事是很麻烦的。
他们这块做的还是不错的。Manus真正强的地方在哪?它实际上就是规划。他可以自己去做计划,说:“哎,我要先干什么后干什么,先调哪个工具后调哪个工具,中间出了问题怎么办?如果没有问题的话,我怎么把这些内容再拼起来?”这个是他真正厉害的地方。
当然,我看今天已经有人说是Manus是不是个骗局了。怎么说呢?就是这个东西没有大家想象的,或者说他放出来掩饰的那么美好,但是你也不至于说他是骗局。就是我们也要看看里边到底有什么创新的地方,他怎么能够实现这种规划。
将常用的流程和子流程写出文档来,直接嵌入到本地知识库里边去,再把工具链上面各种各样的信息也把它embedding到这个本地知识库里去,再将各种服务性网站的信息也把它embedding到这个本地知识库里去。然后在规划的时候,直接根据本地知识库做REG输出就完了。我们告诉他:“我要做一个什么事。”他就跑到这个本地知识库里边去查去了,查完了以后说:“你干这个事,好像这三个工具有用,这几个流程可能是有效果的,这些模型可以干活,那些这个网站里头有你要的数据。”它可以通过进行本地知识库辅助的这种生成,直接给你输出一个刚才我们讲叫todo.MD的这个文件出来,就可以照着干活去了。
产品设计本身还是相当不错的,界面也很清爽,用户交互也非常的顺畅,这个还是很好的。这个Manus的结果靠不靠谱?先跟大家讲一个小故事。据说有人拿这个DeepSeek推荐彩票,买完了彩票还中奖了。还有一帮人说:“哎,我用DeepSeek去做量化吧,我去用DeepSeek炒股吧。”官方量化里边不是炒股的吗?这玩意靠谱吗?肯定不靠谱。所以AI这个东西一定是有幻觉的,千万不要觉得AI是有可能把这个幻觉干掉,这个很难很难的。在数据源不能保证正确的情况下,AI更没有能力说:“我一定会输出正确的内容来。”我哪怕是搜索了一大堆东西,你搜索的东西还有可能是错的呢。AI自己根本就没有判断能力说:“唉。”
我搜索回来的这个网页,哪个是对的,哪个是错的?他唯一能判断的是什么?唉,这个是一个官方主流媒体,那是个个人博客。需要去采信的时候,我要更多地采信官方主流媒体。但是我们其实并不希望AI有判断能力。大家自己想一想,如果AI有是非判断能力了,那是一件多么可怕的事情?还是让他糊涂着就算了。
然后,多个数据源进行总结归纳的时候呢,其实也很容易产生幻觉。就是当我搜到了5个相关网页,对5个相关网页的结果进行总结归纳的时候,幻觉是很厉害。特别是像DeepSeek这种东西,就是幻觉一塌糊涂。Work 3什么换节,也非常非常厉害。Manus底层的模型都不是自己的,全都是别人的。在很多的这种幻觉模型上,自我规划以后,其实它输出的内容一定是不靠谱的。虽然可以进行一点点验证,但是呢,现在距离提高正确率还差得比较远。
那么现在的结果都很惊艳。很多人说筛选简历很棒,筛选的什么房地产信息,也都非常棒。你怎么就在这胡说八道呢?怎么可以说人不行呢?其实原因很简单,他筛选简历的结果,筛选简历的过程,筛选房地产的这个呃过程,筛选履行建议的这个过程,他是给外行看的。你真给内行,他是看不了这东西,看了会乐的。这过程呢就像老中医,念着口诀给人看病似的,金木水火土念半天,你一定很专业。这个大模型也是一样的,一本正经的胡说八道。你不一本正经,他就骗不到人了。所以呢他产生的所有的这些结果,是相当容易让外行感到幸福的。所以千万不要觉得这东西就很厉害。
目前为止Manus给出来的东西,基本上是叫桃园三结义孤独一支。这个什么意思?就是怎么说都行。你说这桃园三结义孤独一支,到底是哥几个?哥一个,这孤独一支吗?哥两个,孤独出去一支,还剩俩。三个,哥仨嘛,团圆三结义嘛,大家站在一个枝头上了。这都可以讲。所以目前Manus给出的演示结果,基本上都是短期内无法进行验证的。你没法确认它到底对不对,但是当你觉得Manus……
给出的结果特别厉害,不明觉厉的时候,一定要小心,距离掉在坑里已经不远了。为什么呢?因为人跟人之间的交流和沟通,是通过不断的确认眼神,确认你的工作能力和工作结果,来建立信任。信任了以后就会比较少的进行检查,这个人就可以合作起来。但是大模型这种东西的话,你让他工作100年,该出多少错他还是出多少错。所以这个地方,还是要稍微小心一点。
下一个问题,Manus这样的产品到底有没有门槛?这个东西如果是国运级的创新的话,它一定是有门槛的。你像DeepSeek,虽然大家都觉得说我们能做的出来,而且各种开源各种开放,perplexity也号称自己训练了一个,或者调了一个类似于R1这样的模型,回来去使用了。但是呢,就并不是很多人都有这个能力,去自己训练DeepSeek这样的模型出来。这个还是有很大门槛的,即使是DeepSeek开源了一大堆的,怎么去优化GPU的这些代码库出来,这些东西想用起来也并没有那么容易。
那么像Manus这样的东西,有没有这个门槛呢?现在很多人就说,现在这个时代是模型及产品的时代,最后都会被大模型厂家干掉的。会不会这样呢?像OpenAI,每次开发布会,一帮的中小企业在这敲丧钟说完了,我这条路被OpenAI给瘫过去了。大家都是在这么看这个问题。Manus现在干的这个活,其实就是GPT5要干的活。可能再过个那么一两个月,我们就可以看到GPT5,因为GPT5也说了,我也是自自动规划,规划完了以后,我自动的去调用各种各样的模型,一次给你实现,而不是现在是这样,ChatGPT上来,我要选模型才能用它。这个方向已经在OpenAI的路径上了。但是呢,从OpenAI的deep search的结果来看,OpenAI的产品落地能力,其实并没有特别好。现在我们去看perplexity,DeepSeek的,豆包的,Grok 3的,这种深度搜索下来以后,你会发现OpenAI的。
Deep search其实是最烂的一个,真的不怎么好使。OpenAI算是技术很强,跟谷歌一样。谷歌的产品能力其实也很烂。他们这种公司呢,底层技术遥遥领先,产品烂一点大家也将就用了。中国人呢,是相对来说,比较擅长于内卷产品这一块的,产品体验、产品迭代,这个是咱们比较擅长的。这个底层技术咱们差一点,OpenAI也好,谷歌也好,都是底层技术好。在这块事上我们也很矛盾,为什么呢?广告时代最后实际上,所有的这些广告商都被收割了,被谁收割了?被这个自有流量的大广告平台给收割了。谷歌、苹果、Facebook、Twitter,现在其实都算是苟延残喘的一个广告商。剩下的,你说谁成为广告商,都是自己要有流量的。你如果自己没有流量的话,你是做不了大广告商的。现在的话,模型时代,是不是你如果没有底层模型的话,你就做不出上面这个东西来?这块呢,大家有一些矛盾。当然也有一些产品,就完全靠产品做起来。有一类产品呢,叫PLG产品,就是叫产品引导增长的。这种东西有两个比较典型,一个是Notion,另外一个叫Slack。这两个产品就是典型的PLG产品,它没有特别底层的技术,我就是产品做得好,体验做得好,让大家使着方便,让大家使着舒服,然后大家就愿意去用。这块呢,看看是不是能够走通这条路吧。在大模型时代,这个逻辑是不是还能走得下去?不知道了。因为如果Manus知继续能够做下去的话,他必须要像Notion或者像Slack这样说,我的产品做的特别好,我就愿意为你服务,让你使着舒服,大家就一直一起用下去。你说在大模型时代里头,自己模型做的不怎么样,产品做的特别好的有没有呢?也有,一个是Cursor,就是自动写代码的IDE,还有一个呢叫Perplexity,就是刚才我们抢这个AI搜索工具。目前呢,还算是有一定门槛的,虽然大家都在做AI IDE,都在做AI插件,都在做AI搜索,但这两个产品目前为止活的还都不错。
至少暂时还都挺受欢迎的吧。未来的事情不好说了。大模型时代,模型厂商的服务边界其实没有那么清晰。它跟原来的互联网、移动互联网时代是不一样的。像移动互联网时代,谷歌跟苹果好多事它是不做的。但是你现在到大模型时代,你看有什么事是OpenAI不做的吗?
那么有没有离了模型就玩不转的案例呢?也有。有一个产品叫Character AI,这个大模型团队被谷歌收编了以后,现在产品直接趴下了。现在他的产品被一个中国公司的产品摁在地上摩擦。那个产品好像叫Toki,是这个Mini Max做的,也算是这个中国AI六小龙中的一个吧。
那么Manus的产品到底怎么样呢?这个需求肯定是存在的。大家还是希望能够快速地获得高质量的信息,不是内容,而是信息,就是经过整理分析以后得出来的结果。这是大家有需要的。在产品设计上呢,至少在演示视频上看,交互还是相当不错的。成本现在肯定是不划算的。这个未来到底怎么去收费,现在还不好说。
因为呢,OTO GPT当年出来了以后,为什么马上就挂掉了?因为这东西算一次,那个时间实在是不划算。你让他开足马力去干活,可能干一次俩小时,你回来一看账单,好几百美金不见了。这是当时的一个状态。现在的肯定是要便宜一些了。Manus,据说每次回答问题,就是每一个任务做完的平均消耗是两美金。不再会出现几百美金的事情了。但是呢,他也没法保证,因为呢,他是自动规划的。你有的时候可能花个几十美分就把东西算出来了,有时候花个两美金把东西算出来,但也有的时候可能俩小时就过去了,你再回来的时候一看,100多美金不见了。而且你没法控制他,因为是自我规划,所以到底每次跑多少TOKEN他也不知道。
在这呢给大家讲一故事吧。这个是原来我看的施瓦斯科普夫的传记。这哥们干嘛的呢?这哥们是美国的一个五星唱将。在打这个海湾战争的时候,他是中央司令部的司令。他呢在越战的时候是个程序员。他虽然是军校毕业了。
到了越南以后,他是个程序员,在那儿写程序。后来,从五角大楼派了一帮专家来说:“我们来分析一下月供游击队出现的规律。”他们搜集了大量的资料,在那算了很长时间,进行了数据建模。他也有幸参与了这个项目。最后得出的结论是什么呢?月黑风高的时候更容易被袭击。所以呢,你用Manus这样的自动规划工具去干活的时候,它有可能也是这样的。算了可能很长时间,最后算完了以后告诉你一个:“月黑风高的时候容易被袭击。”
原来还有一个电影是什么?计算机算到人类都灭亡了以后,最后得出宇宙终极答案是42。这个故事大家应该也听过。所以他的这个成本是比较难控制的。后面的大厂跟进一定是必然的。GPT5还有几个月就出来了。GROK3其实现在就已经是自动规划了。大家去GROK3里边,去点击这个deep research。你去给它一个任务的时候,它也是有一个规划清单,在这个上面在滚动的。他会把这个规划清单都整个执行完。所以现在好多人觉得GROK3出来的结果非常好。如果你实在是说我也等不到Manus了,也不得不舍得花这几万块钱,去买这个测试码了。大家就上GROK3上去用掉了。豆包,腾讯的元宝以及WPS应该都会虎视眈眈的,都会把这东西做起来。而且呢,在这块的还有些别的大厂,微软、谷歌、苹果都有可能来玩一下,因为他们自己是有操作系统的。这个事情一定是他们干是最方便的。
这就是这个项目。到底有没有这个门槛的问题?其实没什么门槛。当然你说我产品做的特别漂亮也行。你像Notion那种产品就是做的特别漂亮。现在免费开源的,类似于Manus这样的东西已经出来了。它这个产品发布了大概三个小时,还是几个小时,就有一个叫open Manus的这种开源项目,就直接扔出来了。你们要用自己上去挂去。当然不是程序员的话,挂起来会稍微麻烦一点点。那你说这种产品为什么突然就疯狂了呢?原因也很简单,二级市场实在是太缺话题了,稍微有点话题。
大家赶快要冲上去炒一把,然后再来算谁是Manus概念股。赶快要去买。至于你买的时候是不是有其他人在外面跑路,或者有其他人去赚钱割韭菜,这就不管了。但是有题材总是要炒的,而且这个团队呢,其实相当擅长于运作。
首先呢,他的视频拍得很好。在大模型时代,在AI时代,如果你这个团队不会讲故事,不会拍视频的话,你是混不下去的。他们很擅长干这个事情,做得非常漂亮。
第二个,这个团队原来是做微信私域运营工具的,就是专门给这个微信公众号,或者说这个企业微信的这些人做运营工具的。所以他们很擅长做这种叫做社交媒体裂变,社交媒体爆发这个事情,这是他们的老本行。
有了DeepSeek的铺垫以后呢,现在中国人的这个热情还没下去呢,突然有消息传出来了,肯定还要再跟着热闹热闹,这个是必然的。但是呢,这种突然爆发的传播呢,对于Manus本身来说未必是一个好事。
刚才我们讲这个PLG产品,就是这个产品引导增长的之类的。这些产品的话它有一个特点,就是你一开始一定要低调,你要这个猥琐发展一段时间。你如果一上来就在显微镜下的话,这个事是没法整的。突然爆火了以后,唯一的结果就是被大厂盯上。而且呢,你一旦进入这个显微镜下,你所有的缺点都会被放大。
2015年的时候曾经有过一个产品叫足迹,应该也是2015年春节的时候出的。他呢能够出这个电影感大片那样的照片,随便拍张照片进去,他就给你做一个像电影大片似的那种,等于裁的这种带这个边的吧,还给你写上一句字幕,大概是这样的一个感觉。上线服务器就崩了,很快就销声匿迹了。
所以像Manus可能会走上这条路。AI圈这种突然爆火,又突然死掉的产品其实还是蛮多的。大模型是别人的,算力成本无法承担,用户突然涌入,预算在燃烧,体验在下降,然后就没有然后了。这个是Manus这样的产品很有可能会遇到的问题。像他们呢其实手里没有多少钱,因为他们以前的公司是被腾讯投资过,但是Manus这一块的话。
你说:“我想趁此再去融一大笔钱,也不是那么容易。算一次两美金,一个任务两美金。当真的有一大堆用户涌进来,开始其他开始跑的时候,就想起这个哪吒一开始那句话了:‘天雷滚滚,我好怕怕,劈得我浑身掉渣渣的感觉。’你一个人进来,两北京不见了;一个人进来,两北京不见了。还不是一个人,是一个问题,进来两美金就不见了。你有多少钱够他烧的?”
当然了,现在这些事呢,对于Manus来说,也算是一个幸福的烦恼。还有一大堆人说:“我做出产品来没人知道。”他至少被人知道了。所以,能不能趁机融一笔钱,或者干脆找人卖掉算了?因为像他创始人上一个公司,就直接找了个公司给卖掉了。现在这个产品如果能把它卖出去,也算是不错的一个结果了。
新的阶段是不是已经准备好了?其实Manus代表了一个新的阶段到来了。AI进程呢,实际上有五个阶段,这个是山姆·奥特曼提出来的。第一个阶段是对话,能够进行自然语言交互的聊天机器人,用于简单对话和信息交流,就是我们现在使用的GPT-4、4O什么的,就是对话。然后第二步呢,是叫做推理,具备在特定领域进行问题求解和逻辑判断的能力,可以进行复杂推理和逻辑分析,就是我们现在用的DeepSeek R1、GPT的O1、O3这样的模型,就属于叫推理模型。现在其实我们在努力的走这一块儿。
推理之后呢,就是规划,是agent,可代表用户执行任务,具备自主运行的这个能力,能够在动态的环境中实施决策,这个是现在第三步。实际上Manus就已经走到了这个第三步上。再往后一步,创新,能够参与发明创造,增强人类的创造力,可在科学研究、技术开发等领域推动突破。其实现在什么医学方面,已经开始突破了。然后最后第五步是什么?叫协作,深度融合组织功能,参与社会管理与复杂决策协作,能够管理复杂的组织任务。这个是山姆·奥特曼给AI整个发展的,类似于L1、L2一直到L5的一个状态。
那么当前的状态是什么呢?GPT-4.5已经展示了,对话这件事情基本到顶了。
你再怎么加这个算力,再怎么去扩大模型,也就这么回事了。而我今天发现我的ChatGPT已经可以用4.5了,虽然是迟了两周,我们还是用上了GPT4.5,还没有空跟他去提问题呢。
推理模型现在还在快速发展的早期阶段,推理模型这个阶段并没有过完,现在都在拼命地冲这一块。有机会大家可以去试一试通义千问的QWQ 32B那个模型,还是不错的。因为这种模型32B嘛,你是可以在电脑上本地跑的,我就在自己电脑上装了一个,效果还可以,确实慢一点。
再往后这个规划呢,其实一直都在尝试,逐步有可用的版本出来。OpenAI一月份出的operator就是这样的一个产品,GROK3的Deepsearch也是这样的一个规划类产品。Manus呢算是把这个规划又往前推了一步,它已经离开了原来的这种环境,不需要在OpenAI的这个环境下用,不需要在grok 3的环境下用,完全用别人的模型,批了这样的一个单纯的产品出来。
当然了,现在这个产品到底有多成熟多不成熟,我觉得下结论还太早,因为我自己并没有真正的去用嘛,邀请码还没收到。缩小范围,专业一些的自我规划AI agent应该还是有机会的,因为现在的Manus号称是我可以泛应用,所有的行业所有的领域我都可以干,你让我干啥都行。最终能够做到的结果,大家就不要有特别大的预期了。
Manus出来以后,行业的方向必然会发生一些偏转,就甭管这个产品做的怎么样吧,告诉大家了一些可能性。现在哪怕是两美元算一次,这个可能性存在了,手工规划工作流的这些产品就要开始转型了。比如说像Dify,像Coze这种自己画流程图的这种,可能就要稍微的调一调方向了。未来呢应该都是会有自动规划工作流,这块会获得更大的这种关注。
那Manus有未来吗?首先跟大家下一个结论,没有,哈哈。为什么呢?不是因为产品做的不好,也不是因为它底层是没有自己的模型的,这个都不是。大家知道互联网时代。
第一个倒下的独角兽是谁吗?叫Evernote,就是现在的印象笔记。第一个从独角兽的10亿美金估值里退出来的公司就是他。那为什么是他呢?好多人说挺好使的,我还花钱买呢,像我也是花钱买的,而且这么多年一直在付费。为什么这样的产品就不行?原因很简单,咱们说一个像绕口令的话:“有用是最没用的事情。”为什么像绕口令一样说这个呢?因为大家被Manus惊艳到的时候,是因为觉得这东西有用,他给我的筛选力的这个过程很棒。你到底有多少HR需要筛选力?有多少HR现在不是在忙着裁员,忙着自己不被裁,而是说我要去招人?有多少人需要这东西?有多少人需要去看那些专业的报告?其实没有的,用户必然是很少的。像它这个Monica.IM,现在号称一共有700万用户,其实是累计安装量,它的活跃用户基本上可以忽略不计的。而且它这个700万用户,还是收购了一个叫GPT for Google的,一个300万用户凑起来的,他自己就有400万。收购了这么多东西,现在号称700万这个数,其实基本上你就认为他没有就可以了。而这几天有可能会爆发一波,但是未来应该很快就消减掉了。而且真正的专业人士是不会看他的报告的,我告诉你,真正专业人士看他的报告更累,你还得再一个一个再去校对,再去核验,再去看里头有没有说错的地方,这个事是一个很痛苦的过程。AI工具主要现在还是能够骗外行,就像我前面AI时代,文科生很重要这个视频讲的一样。像我这些程序员,一看AI写的代码,就在那乐,你们这个连拼屎山都拼不出来。但是我看AI写的小说,AI画的画我很开心。一些设计师一看AI画的画,这叫啥玩意?那些真正产品经理这些文科生,你看AI写的那些文字也是没法看。他是这样的一个状态,这个东西最擅长就是骗外行,就跟那个很多相声演员讲的似的:“我是这个说相声里边最会唱歌的,以及唱歌里边最会说相声那个人。”这就是AI现在最擅长干的事情,而且专业看报告的人。
现在还在不断的被裁员呢,你给他们提效干嘛?海外应用还要等OpenAI、谷歌和微软再去发力,它在国外的用户是起不来的。就算Manus让我看走眼了,真的是用户量做起来了,那各国政府能乐意吗?你这数据是不是去中国了?怎么还有这样的问题呢?一个武汉公司,做了这么样的一个产品,到全世界去收集别人的调研报告、各种数据,这不开玩笑的吗?而且两美元一次的这个成本,如何平衡这个事,对于他们来说也是很难回答的。
在AIGC时代,可能真正有价值的东西还是娱乐,不是真正的有用的东西。虽然一大堆人都在研究怎么让AIGC有用,但是我觉得依然是娱乐有效。为什么呢?因为它出来的东西不严谨。你给个小说,你这东西写对了写错了,他没事,不会因为说这小说写错了几个字就造成多大的损失,而且有新鲜感,我还看着很开心,这不就可以了吗?
但是你想,他这边出一大堆报告,告诉你应该上哪去买房,告诉你应该招谁不招谁,等最后你把人招回来,发现不好使,你把房买了以后,发现这个房子有问题,你找他吧,他也不负这个责任。所以现在千万千万不要去做有用的东西,这是今天咱们去讲的Manus的这个故事。