罗永浩推出贾维斯AI助手,这次是颠覆交互体验还是重做锤子老路?深入剖析老罗新作背后的意义

罗永浩推出贾维斯AI助手,这次是颠覆交互体验还是重做锤子老路?深入剖析老罗新作背后的意义已关闭评论

罗永浩出的贾维斯AI助手,有人会用吗?大家好,欢迎收听老范讲故事的YouTube频道。今天咱们来讲一讲,罗永浩终于发布了他们的软硬件产品。

首先要讲,关心罗永浩的人其实还是不少的。很多媒体都发现了罗永浩公司发布的新产品,赶快要抓紧报道一下,说明罗永浩这个流量还是在的。因为我呢,前几天刚说了一次,罗永浩有可能会去发布新的AI产品。当时的猜测呢,可能是耳机,也有可能是眼镜。从我个人的角度上来说,我可能猜眼镜的概率大那么一点点。

现在它到底发布了一个什么东西呢?1月4号他的网站就正式上线,发布了一堆的视频,也发了一堆的推特。到1月6号呢,被国内各大媒体进行报道,说罗永浩的AI助手叫贾维斯,终于要上线了。

那你说中间怎么隔了一天?1月4号发布的,为什么不是1月5号报道,而是1月6号报道呢?因为所有的这些内容都是在美国发布的,所以呢,1月4号是美国时间,中间倒了半天的时差。等咱们这再睁开眼看到了,再去报道的时候,大概就是1月6号了。

所以中间差一天。网站呢叫Matter.AI,Matter.AI这样的一个网站。它呢自己有X的账号,有YouTube账号。网站呢很简洁,除了一个下载链接之外,就是几个视频。YouTube上呢,其实就是放了这几个视频。大家注意,他拍的所有视频都是short,也就是一分钟之内竖屏的,没有拍这种横屏视频。X账号上呢也就是发布了这几个short,没有什么特别多其他的东西了。

所以呢,就是非常标准的一个网站,一个YouTube账号,一个这个X账号,然后发布的呢,就都是同样的这批东西,其他的没了。公司的名字呢叫Matter Innovation Inc,应该叫物质创新,大概是这么翻译的吧。这个项目跟罗永浩到底有没有关系呢,或者是什么关系呢?新闻报道里都说是有关系,然后我稍微的去查了一下,Matter Innovation Inc这个公司呢,是美国特拉华州多佛士的一个公司。

但是呢,他们在自己的网站上写他在西雅图,这个我不确定是怎么回事,估计应该是注册地在特拉华州,因为美国很多的公司喜欢注册在那边。网站上面写的介绍呢,是多位在高科技行业,具有丰富经验的连续创业者共同创立的公司。核心团队成员曾在微软、Intel、索尼等知名企业担任高级管理职务,也没有写罗永浩怎么回事,也没有写锤子科技或者是细红线,都没写。罗永浩肯定既没在微软,也没在Intel,更没在索尼干过,按照我的理解应该没有过吧。

还有一些记录呢显示,这个公司呢在新加坡还有一个子公司,叫Matter Innovation PTE Ltd,实际上叫私人有限公司,这应该是新加坡的一种比较特殊的公司注册形式。这个呢主要是信息披露上相对灵活,而且呢,股东个人的资产跟这个公司资产之间分隔得比较清晰,不会相互影响的一种公司架构。这个公司呢应该是美国公司的一个子公司。

然后比较有意思的是,在企查查上呢,有一条比较模糊的这个定义,因为我没有在企查查付费,所以企查查上很多中间的信息是隐藏的。但是呢,企查查上写说,新加坡的这个Matter Innovation PTE Ltd这个公司呢是北京细红线100%的控股股东,就是说他出资了100%。但是我估计这个里面是有一些误会的,因为现在公开出来的北京细红线的股东应该是新加坡的叫Always On Tech,就是永远在技术上的这样的一个公司,他后边也是PTE Ltd,也是一个私人有限公司。

这两个公司到底是一个什么样的关系,我现在并没有找到更进一步的消息,可能还是要等着事情发酵一段时间以后,逐渐被其他的那些媒体去挖掘吧。现在呢,就是我们默认贾维斯这个产品跟罗永浩是有关系的,或者说罗永浩就是做了这个产品的人,因为从这个产品的样子和它的交互方式上来说,真的是浓浓的老罗味。但是呢,从股权结构上来说,还需要再挖掘一下。首先呢,咱们说这个软件产品。

就是它分软件跟硬件嘛。软件产品呢,它叫J1 Assistant,就是钩一吧,可以这么讲。因为这两天在吃车厘子,都是几钩几钩的,所以呢,我们就J1 Assistant这样的一个产品。这个产品前面这个J呢,就是叫贾维斯,他呢是钢铁侠的AI助手的名字。不知道直接用这个名字会不会侵权,或者说有没有一些这个IP相关的问题,这个事咱们不是那么了解,咱们把疑问留在这。

那么具体的用法呢,他有一堆的短视频,每个一分钟也都很短,大家可以去看一看。如果你实在懒得看视频呢,我这稍微的描述一下。就是底下有一个麦克风的这种图标,你拿手按着这个麦克风,就可以去说话了。麦克风的这个图标上面呢,像散状的,就是这样这样这样,然后分开了若干个图标在上面。上面这些图标呢,有的是发短信,有的是查谷歌,正中间这个应该是一个贾维斯的一个自己的logo。

你有一些特殊的事项可以让他去做,再往旁边是ChatGPT,然后是记笔记,大概是这样的一排五个图标。你先摁着这个麦克风,对着他说话。说完了以后呢,来决定向哪一个上面的图标去挪动你的手指,是这样的一种交互方式。如果你想去搜索,你就说完了以后,把它挪到搜索引擎谷歌这个图标上;如果你想发短信,你说完了以后,把它挪到发短信的图标上;如果你想去控制手机,做一些什么样的事情,那你就说完了以后,挪到上面这个贾维斯这个图标上去,他可以控制手机去做一些事情。

剩下呢,我想去记个笔记,我想把这个灵感记录下来,你就把他挪到旁边的笔记本的那个图标上去。大概就是这样的一个交互方式。然后呢,也在里边做了一些场景,如果你要是做这样的一个场景该怎么办;如果是做那样的一个场景,你应该往哪个地方去挪这个手指头,大概是给大家做了这么几个演示在里头。

现在呢,是只有谷歌跟三星的手机可以用,国内的设备是完全用不了,因为他需要使用谷歌,需要使用ChatGPT,这种东西弄到国内来,肯定就开玩笑了。

然后,所有的视频都是英文的,就是用英文跟它交互,然后用英文去回复,没有任何跟中文相关的演示在里头。曾经有人上去用锤子手机,尝试使用这些产品,发现被背刺了,使不了。这个操作逻辑呢,还是稍微有些怪异。按道理来说,你跟他沟通的过程中,他应该自己去判断应该往上面哪一个图标上面去放这些内容,或者说他可以用几个图标或几个功能组合起来,完成一个完整的工作。但是现在呢,需要我们先按着说,说完了以后,由人来去确定到底是发短信、查谷歌、手机内部的操作,还是问GPT,还是记笔记。你要自己去在这五个里头去选,这其实没有办法。AI助手的全世界难题,这是为什么呢?你去看OpenAI的ChatGPT,它其实也是这样。你上来以后,你要先去选,我到底要用O1呀,要用搜索呀,要画图还是要用CANVAS,每次只能使一个。这个里头唯一的一个能够同时兼顾的工作,就是可以一边用语音,一边用搜索。为这个功能,OpenAI还专门开了一天发布会说,来,大家看看,我们现在可以把语音跟搜索结合在一起了。其他的都是每次只能选一个,而且呢,是要上来靠人选的,所以J1 assistant也是需要人选。

那你说这个软件会不会火呀?有些人看到视频了,有些人听到我讲的这个描述了,你觉得这个东西会火吗?首先要讲,尝试呢还是可贵的,就是在AI交互这块进行尝试,这个都是值得肯定的。很多人说这个老范很讨厌老罗,只要老罗说什么事都出来骂,千万不要这么想。老罗做的很多的尝试,还是值得尊重的。这个里面呢,有TNT,也就是他原来做的这个语音交互,桌面电脑的这个影子,也有这个闪念胶囊的影子。这个是在锤子手机后边有一个软件,就是当你随时有一些灵感的时候,你随时可以跟他说,说完了以后给你记下来,这叫闪念胶囊。也有一些子弹短信的这个风格,这个是在锤子基本上应该是挂掉以后,保罗做的一个软件,叫子弹短信,就是你按住了以后就说,说完了以后直接发出去。那边呢,可以看到你的文字。

而且这个文字呢,可以跟你的声音一起,像卡拉OK似的,一个字一个字跳过去。说:“哎,现在说到哪了?”他是这样的一种交互方式。这个风格其实很像,为什么大家一看说这就是老罗做的东西,因为跟他过往整个软件的交互的风格和体系是一致的。

但是呢,现在做软件呢,其实有一个很尴尬的地方,什么呢?就是大模型底层的能力非常强,而且呢,差异主要是在大模型底层的能力上。大家拼命卷,就是在去卷我有多少块显卡,我怎么能够把这个大模型训练得更好。在交互方面呢,其实谁都没找到好方法。罗永浩找到了一个方法,从本质上说,也没有在OpenAI的基础上再往前迈任何半步。OpenAI呢,也在这样的一个水平上,只是OpenAI的不同工具,你需要拿鼠标去点了一圈去选。老罗呢,把他变成了拿手摁摁,说:“说完了以后自己去滑。”但是最终这五个里头,你还是要选一个。你第一个人选,第二个不能联合起来一起干活。目前AI的所有的问题都在那儿,但是呢,大家又没有那么重视这件事情。为什么?因为大家都在拼模型实力。你只要模型实力上去了,这些问题可能自然而然就解决掉了。交互方面呢,大家都在摸索,谁也没摸出什么门道来。

这个呢,其实大家在等待一个叫Lotus时间。什么叫Lotus时间呢?很多人都去iPhone时间,移动互联网时代开启,乔布斯重新发明手机。但是今天呢,要跟大家讲一个叫Lotus时间的故事。Lotus这样的软件,这个软件叫LOTUS 123。在它发布之前呢,计算机其实主要是给程序员用的,或者各种计算机专业人员才会去使用这个东西。普通人用不了这东西,不知道拿它干嘛使,不知道拿它怎么办。虽然很多人都觉得,哎呀,计算机这东西好厉害,但直到LOTUS 123这个软件出来,这个软件干嘛使呢?就是跟今天的Excel一样。Excel你认为它是超LOTUS 123,是没毛病的。它可以在很小的存储空间里头进行这种表格运算,这个东西一出来以后。

大家说哎呦,说我们也可以用了。我是财务,做数据分析的人,或者哪怕家里头管理一下日常的开销、日常的活动,都可以用这数字表格。这东西出来以后,整个的计算机就像普通用户就敞开了。如果没有Lotus 123这样的东西,普通用户真的拿它,没什么可下手的地方。

所以现在AI其实也在等待这样的一个时刻。现在呢,大家还是在跟他闲聊,没有真正参与到我们的工作、生活当中去。虽然有很多说:“哎呀,你看我拿他去写了报告了,拿他学英语了。”但是会发现什么呢?就是所有的这些应用都很零碎。在Lotus 123出来之前,也有游戏,也有一些这种小的应用吧,但是呢,他们并没有真正让所有的普通人都可以觉得这个东西有用,能够改变他们的生活。

现在整个的AI软件行业都在等这么样的一个时刻。那么到底出一个什么东西,大家就可以用起来了呢?现在的AI使用起来还是挺麻烦的。你除了在OpenAI上这样的界面去使用之外,如果再想让它的功能往前走一步的话,还是要去学一下编程的。对于普通人来说,就是会觉得稍微痛苦一些了。

既然都已经讲到这了,那老罗罗永浩做出这个东西,是否有可能成为一个像Lotus 123这样的东西,让大家就习惯用这种方式去使用呢?这个里头有两个问题。第一个问题是什么呢?就是他所给出的交互解决方案依然是一种半吊子交互解决方案。刚才我讲了,这个东西需要由AI自动去决定做哪件事情,而且需要让所有的事情可以交互起来,一起协作去做。老罗也解决不了这个问题,OpenAI也解决不了这个问题。所以呢,他只能在当前这个状态下进行妥协。只是呢,他使用的交互方式可以认为在OpenAI的基础上有一些进步吧。

但是随着大模型整个能力的快速提升,可能这种中间过渡方式快速的就会被淘汰掉。另一个问题是什么呢?就是交互方式创新是不受专利保护的。如果真的老罗说:“我做出了一个很棒的交互方式,大家都很喜欢。”很多人用完了以后……

就这么养成了使用习惯的话,那么大模型厂商模仿起来,基本上是没有成本的,可以快速地把这东西抄下来。这个就像现在我们已经不再知道 Lotus 123 跑到哪去了一样。现在新的程序员也好,计算机使用者也好,你们可能大部分人都不知道什么叫 Lotus 123,你们只知道有一个东西叫 Excel。最后有可能就会被大厂直接掩盖掉。

就算是当年老罗做的子弹短信,三天时间就有 200 万用户冲进来,而且是在没有怎么花钱推广的情况下快速爆发。但最终是什么呢?在微信面前也是雨打风吹去。你想去跟微信抢这样的市场,想都不用想,差太老远了。

而现在在做这种 AI 助手的公司,除了前面我们讲的 OpenAI 之外,还有谷歌的 Gemini,苹果自己有 Siri。虽然它底层调用了 OpenAI 的 ChatGPT 4O,但是呢,它也不希望别人在他的手机上去做这种完整功能的 AI 助手。各个手机厂商都是有自己的 AI 助手的,绝不可能说我把这一块儿的权限交给别人。

国内还有豆包,现在所有的 AI 助手里边,用户量最高的应该是 Chat GPT,应该有几亿的活跃。第二呢,就是豆包,加上 CC 可能加一块的,应该也快有上亿的活跃了。现在突然又整出一个叫 J1 assistant,就算是真的很好用,别人抄你这个,交互的过程是非常非常快的。最多也就是老罗以后再去直播带货的时候,再去吐槽一下谁谁谁抄我的了,也就如此了。

所以在这一块上呢,想要靠交互创新打开一片天地,还是很难的。如果你说我有没有机会通过一种什么方式,可以真正咬下一块市场来,然后慢慢把这块市场做大呢?这个可能性不是没有。那是什么样的方式呢?就是你要寻找一个很特殊的场景,然后伴随这个场景一起成长。这种场景可能一开始大厂看不上,只有你可以找到这么一小拨人,去做。做完了以后,最后你把一个小场景变成了一个大场景,这个是有可能能够搞出一片天地来的。其实像 TikTok 就是这样成功的,他去做这个短视频的时候。

所有大厂都看不上这种方式。等做起来了,用户已经积累到一定程度了以后,别人说再想去追就很费劲了。即使是这样,现在 YouTube Short 还有像 Instagram Reels 也还在追它的场景。

还有什么呢?就是我可以摁住一块场景,我就跟这个场景一起做了。虽然我跟这种微信、跟什么其他的这种大的软件打不过,但是我可以在自己这个小场景内稳固一部分用户,可以一起生长下去,这也是可以的。

比如说阿里的这个旺旺,你只要是在淘宝上买东西了,你就必须用这个碗。你说我想在微信里跟你聊天,那淘宝说了:“你在微信里聊天的部分,我就不作为证据。如果是有一些纠纷的话,我就没法给你判定了。你被人骗了跟我没关系。”那你最后还要用阿里旺旺。

包括像钉钉、企业微信,还有像飞书、Slack 这样的软件,都是这个属于特殊场景。这就属于办公场景嘛,他们在各自的场景里边去巩固一批用户,这个也是可以的。

那么就算是这些细分场景,你路径清晰了以后的话,这些软件也会尝试去做一些场景差异化的设置。比如说咱们最后讲的这几个办公软件吧,飞书、钉钉、企业微信,还有在国外比较常见的 Slack,他们其实使用的习惯、使用的场景还是有很大差异化的。你把这个差异化做好了以后,再下一件事,就是花钱砸流量了吧。

现在甭管是飞书、还是企业微信、还是钉钉,都在花钱砸流量。Slack 是单独的跑了很长时间,把流量自己做起来,算自然增长起来的。但是呢,像 J1 Assistant 这样的软件,在做 AI 助手这样的一个红海市场里头,最后只能是真金白银的见真章。不可能说你看中了一个奇怪的市场,大厂等着你慢慢发展,这个事基本上是不存在的。

而现在呢,老罗的这个 J1 Assistant 的这个场景呢,其实挖的不够深,相对来说还是一个 AI 助手的一个比较宽泛的场景。所以呢,我不认为他能够借这个软件就占住一块地盘。

那你说硬件呢?咱们刚才讲了半天软件,还有一个网站呢,叫 Alio 哈哈。

大概就是这样。Alio_AI.com 这个网站上发布了一个硬件产品,叫 Javis 1。这样的一个产品目前没有特别详细的介绍。从他的有限的文字以及图片上来看,大概长得有点像一块充电宝,比充电宝可能就是原来小米做的那种 1 万毫安的充电宝要稍微方方正正一点,因为当时那个 1 万毫安的充电宝旁边是圆弧的,他是方方正正一点,然后要稍微的扁一点,基本上就是这么大的一个方块。

这个方块应该是一个有指纹识别、有电池、有 WiFi、有蓝牙的设备。我并没有仔细看里边是不是有 SIM 卡或者是 eSIM 这种 5G 网络、4G 网络,这个不太确定。理论上说,这个东西就应该是一个没有屏幕的手机,就是它里面应该是有手机的全部功能。它可以靠指纹开机,开机了以后,它有一个 TWS 的耳机,就是这种分体式的耳机。你把这个耳机戴到耳套上以后,通过蓝牙连接到这个黑方块上,就可以跟他聊天,跟他说话了。

大概就是这样的一个设备,后面应该接的是他这个贾维斯的 AI 助手。这就是他的硬件。这个硬件上有可能会根据存储空间的差异再划分出两个版本来,因为这个老罗说了,这玩意不便宜,还要有两个版本,所以我们现在只能做此猜测了。

至于这个东西到底做出来是什么样,不知道,因为并没有更详细的介绍,也没有人去见过这东西。最终的总结一句话,还是期待罗永浩继续给我们带来更多的交互方面的思考吧。我们也不要每次老盼人不好的,虽然这一次他未必能够占住一块地盘,能够真正的做出一个产品来发展壮大下去,但是他做的各种交互方式的尝试还是非常非常有价值的。

好,这一期就跟大家讲到这里。感谢大家收听,请帮忙点赞,点小铃铛,参加 Discord 讨论群,也欢迎有兴趣、有能力的朋友加入我们的付费频道。再见。

Comments are closed.