硕鼠的博客站

范路的博客主站,时而会发些东西。

OpenAI 的 SearchGPT 是不是值得期待呢?

在刚刚过去的一周里头,不停地有消息出来说 OpenAI 要憋大招了啊。欧,有些人猜测是 GPT5,有些人猜测是 SearchGPT。自制 GPT 呢是什么?就是 OpenAI 自己做的智能搜索引擎。如果这种东西能出来的话,大家还是蛮期待的。而且写着说,这是准备啊,把这谷歌让他寿终正寝掉啊,这是要掘谷歌的坟了。

关于 OpenAI 的测试 GPT 在坊间呢一直在传啊,据说是已经在做灰度测试了。灰度测试什么?就是我们选一部分用户来测。为什么在这个里边传这么多,说今天发明天发?好像前面是说啊,5 月 9 号发。一开始说五月七号发,今天是五月十号也没发。现在大家普遍认为是下个礼拜发啊。为什么呢?因为到 2024 年的 5 月 14 号,谷歌 IO 该开了啊。谷歌 IO 就是每年谷歌会开一次开发展大会。大家认为啊,说 OpenAI,你如果真的想发搜索产品的话,你应该赶在谷歌 IO 之前发呀。你哪怕我十三号把它发了啊,我就恶心死你。不能像华为似的,这边苹果发着 iPad,那头他也去发他的 Pad。我到现在都不知道华为 Pad 到底长啥样啊。

后边一段时间,就是 5 月份以后啊,每个月都有开发者大会。5 月份是谷歌 IO 啊,6 月份呢,是 WWC 啊,就是苹果的世界开发者聚会啊,后边应该还有什么微软的呀,Facebook 也都会去开。那每个这大厂都会去给自己开一个开发大会。

AI 搜索到底算不算是杀手机应用呢?因为 AIGC 啊,这个东西出来以后,大为什么?大家都不觉得这东西是杀手机应用。每一个新的技术新的这个设备出来以后,一定要有一个杀手机应用。你如果没有这个杀手机应用的话,这个东西推不起来的。呃,我记得 iPad 刚出来的时候,它的杀手应用是什么呢?叫捕鱼达人。当时大家都喜欢啊,还有一个叫 Fail Runner。还叫什么一个游戏?我们当时很多人买 iPad 一代的时候,都是为了打那个游戏啊,实在是好玩。

现在 AI GC 这么长时间了,你说我跟他聊天算不算杀手机应用?真的不那么算啊。为什么呢?因为你跟他聊天的时候啊,你发现聊一会啊,眼前一亮,很惊艳。但是呢,深入进去以后,又感觉到不太对劲。为什么呢?原因很简单啊,就是 GPT 这个东西啊,能力太宽泛了。哎,啥都可以来一点,具体深入呢,又不行啊。我觉得这点很像我啊,你问我什么事,我都可以给你怼两句,跟我深入一下。你来你给我讲一下,这个算法到底应该怎么调一下,这个数据应该如何去标注,可以让它提升一点点呢,输出的性能。对吧,这事对不起,我还真不知道,那咱就实话实说嘛。

啊,这个其实才是 GPT 到现在为止比较难触杀手机应用的一个核心原因。因为你要深度使用才能有留存嘛。你想一个应用成为杀手机应用的前提是什么?就是大量人使用,大量人使用是什么?就是大量的新人进来,而且还要一直用下去,还要有新增,有口碑传播,还要有留存。

GPT 呢就属于有经验啊,很很漂亮这个东西,然后呢也有口碑传播,大家都在说这事,但是它留存特别差,因为你任何事情,你深入使用下来以后,都觉得不是很顺手,而且很多深入的问题啊,使用者自己其实说不清楚,我也说不太清楚,我到底让你干一个什么,因为你靠语言描述这个事其实是很难的啊。

就是很多人说啊,你看 Soda 怎么样了,可以直接做视频了。我说来你去看电影,看完了以后回来,你用语言把这电影给我描述清楚了。所有人看完了以后就说这怎么可能呢,这谁可以用语言把一部电影描述清楚。我说对啊。我说,你说都说不清楚,凭什么让人给你画明白呢?就是这样的一个情况。那么 AI 搜索,算不算是这个里面的杀手机应用呢?其实已经有一点点苗头了啊。这个杀手机又要出来了啊。大家注意啊,真正的 AICC 干的活是什么?叫内容生成。而内容生成呢,它就可以随便的瞎编啊,它就可以产生幻觉,可以胡说八道。在信息大爆炸的时候,其实你做出那么多内容来是没有人看的。内容获取,才是可能更多人愿意在里边去付钱,愿意去使用的一个功能啊。

现在最好的 AI 搜索工具叫什么?叫 perplexity AI。这个是现在的现象级产品,月活用户已经增长到 1,000 万了啊。这个其实蛮高的了,但是你不要去跟 TikTok 比啊,TikTok 光在美国就有一点几亿的这种月活用户,全球可能有接近 10 亿的月活用户。这个产品呢,现在是有 1,000 万月活用户,但是在所有的 AI 产品里已经算很好了,除了最前面的比如叉的 CPT 它比不了之外啊,剩下的可能就它算是好的了。4 月份日活还增加了 33%,就是它增长还很快,现在有 260 万日活用户,就是他等于 1/4 的月活用户都日活了啊,这个数据很好啊。

1 月份刚完成了 b 轮融资,当时的估值达到了 5.2 亿美元,然后 b 轮呢,融了 7,360 万。4 月24日传出消息,又做了一个 b 加轮,又拿到了 6,300 万美元,估值超过了 10 亿美元,正式跨入独角兽的行列了,就是它融的很快。你想从 2022 年 9 月份成立的,到现在也就是不到两年的时间啊,现在都必加了,等于种子 ABB 加融了四轮了啊,这个融的是非常非常快的,而且今年呢。也开始有收入。收入突破了1,000万美元大关啊。他靠什么玩意收钱呢?一个月交20美元订阅费啊。但是所有靠订阅费收钱的这些公司基本上没有盈利的,肯定是入不敷出。这个是没有任何办法的。

病AI啊是我用的最多的AI产品,也是算智能搜索吧。但是呢,病AI并没有撼动谷歌的市场份额。很多人说啊,病AI出来以后,谷歌你不行了。谷歌的搜索份额势在下降。我看最新的大概4月份的一篇文章写的是,谷歌的搜索份额是从93%下降到90%。病的搜索份额大概是从2点几现在涨到3.6了。所以病AI还是呃,用户量在上升。

所以有了两个前面的案例啊,一个叫呃proplexity啊AI,一个呢叫病AI,然后发现唉,这个东西真的好使。那插着GPT说,那我我也来一遍呗,open AI说我也干。

那么,AI搜索跟传统搜索到底有什么区别?技术上呢,AI搜索其实并不复杂啊。就是基本上还是传统搜索技术啊。它呢是结合基座大模型的AI GNT,它实际上是一种AI GN的典型应用啊。它先干什么呢?首先是让用户提问题,你先说你要问什么事,告诉我完了以后呢,我要去判断你到底要问什么,要有一个意图。判断这个在搜索引擎里其实很难的。当他问了问题以后,我来判断他到底想问什么。再往后呢,是进行传统搜索啊,你要把这搜索引擎调出来,要么调并的啊,或者调一些其他的搜索引擎,你把它搜一下,搜完了以后呢,总结搜索结果,按照要求拿大模型去生成,然后呢进行延伸的搜索引导啊,说你搜索这些问题以后,你再问点什么。就是他是聊天式的。你搜索正常搜索什么,你用一搜索框,搜完了啪一回车啊,出一个结果不满意怎么办?然在这个结果里头,然后再趴一回车,又出一堆结果啊,两边是不挨着的,就是说叫几次搜索之间是没有任何关联的啊。这个话应该说的是比较正确的,但是呢这种AI搜索是通过聊天的啊。你搜完了以后说唉,这是你要找的东西吗啊?好像还差一点啊。哪一部分已经试了,哪一部分还差那么一点点。请给我向哪块稍微调整一下。然后他会不停地去调整啊。这也是AI搜索干得比较有趣的一个地方。当然,AI搜索也有很大缺陷啊。什么缺陷呢?他慢。正常的搜索是非常快的,你这边一回车,那边东西就出来了啊。AI搜索是相对比较慢的,你需要打完回车以后,然后在这慢慢等,等一会然后再嘣嘣嘣,一个字一个字往外蹦啊。

在用户行为上,AI搜索的用户其实要比普通搜索用户更理性一些,提的问题也更有深度。AI搜索的人更喜欢去问一些科技新闻啊、时事新闻啊、科学研究啊、学术文章啊。而在正常的搜索引擎上,问的最多的是什么啊?这个可能会出乎你们想象啊。我们公司曾经招过一个百度的员工,就问人家说:百度里面搜索最频率最高的词是什么呀?”百度”两个字啊!很多人拿到这个浏览器以后,先会写”百度”两个汉字,然后打一回撤,再在百度搜索引擎里头点击最上面那个链接。再进去为什么呢?他搞不清应该怎么进到百度里面去。而百度呢,又花了钱在各个浏览器里面都把自己设置成默认搜索引擎。所以呢,地址栏写”百度”俩字,啪一回车,他就自动地跳到了百度搜索,然后搜了”百度”两字出来了,对吧?他说这个是最多的。然后我说那第二个呢?”天气预报”就是整个的搜索引擎类的前两名,一个是”百度”两个字,第二个是”天气预报”。

在现在,大家去做AI搜索了,就很少有人问这么无聊的事情啊。他们一般是先提问,提完问以后不断地修正。真的是要有一些东西,说我想出一个小文章了,想出一个什么样的提纲了,他才去问AI搜索。否则的话,他们是不会去跟AI搜索去耗这个耐心的啊。在商业模式上,AI搜索跟传统搜索是完全不同的两种商业模式。传统搜索是免费的,即使你使用很长时间,它也不会向你收费,而是通过收取广告费来盈利。如果你想在搜索结果中排前位置,就得付钱;如果想在搜索结果旁边露出广告,同样也需要付费。相比之下,AI搜索则全都是付费的,用户需要支付固定金额,例如一个月花20美元。这种商业模式中,客户需求和付费客户的需求会有所不同。

在社会层面上也存在差异,传统搜索引擎仅仅是信息搬运工,对信息真实性不承担责任,这导致了一些搜索引擎可能传播虚假信息或不负责任的情况。某些搜索引擎以前可能存在售卖假药的情况,但后来也停止售卖真药,这种商业决策有时候显得冷酷无情,缺乏对社会责任的担当。有些搜索引擎创始人或CEO可能也持有技术人员背景,但在选择业务模式和对待正确的医疗知识时,却未必有充足的重视,未必认为这是自己应尽的义务和责任。\n他是为了我的名声啊。真药假药都不卖了啊。搜索引擎真正对于信息负的责任是什么啊?是排序啊。我给你一大堆的这个搜索结果以后,到底谁排前头谁排后头,这是搜索引擎中解决定的。但是人家网页上写的到底是什么?是真是假?是对是错?这个搜索引擎是决定不了的。然后但是智能搜索这块就不一样,因为智能搜索最后是给出一个最终答案了,甭管你搜出来的是什么,拿这个东西给人答案,那这个是很危险的一个过程对吧,因为你最后是要为你给出的唯一答案去负责任的,而且基座大模型还经常产生幻觉对吧。

这是智能搜索引擎啊,需要承担比普通搜索引擎更大的社会责任的地方。AI搜索在这一块呢,大家其实相差并没有那么远啊。刚才咱们讲的那个perplexity病AI,包括国内的,比如文献遗言通1,000问Kimi啊,都算是在做这个综合搜索。当然差在哪呢?第一个差的是内容理解上啊,这会有些差异,因为有的时候你提了一个很长的问题以后,他理解不了。第二个呢,是底层搜索引擎这块,其实都差不太多,因为都不是自己做的,要么钓骨骼的,要么钓病的,或者自觉跳动的,也有一些自己的缩缩引擎,你可以去钓它。内容总结和分析的能力,包括避免产生幻觉的能力呢,基本上看底座大模型的啊,你说我这底座是GPT4啊,我这个底座是这个cloud 3啊,我这个底座是一字节跳动做的云确啊,那他最后出来的东西就完全不一样啊。

最后呢才是叫内容输出和内容可控。哎,我希望他输出一个党建文章啊,我还是希望他给我输出一个小红书的爆款文章,也是要去看一下他最后文章生成的这个能力了,那么设置GPT也就是open AI的能搜索,大家对它期待的是什么?有可能会有什么东西呢?

第一个从意图理解上啊。GPT4一定是最强的,这个没什么好说的。

第二个呢,就是上下文交互这块,他应该做的还是不错的。因为正常情况下,这种智能搜索,他不会给你做太多轮次的上下文交互。为什么呢?因为他那个激素模型都是别人家的,包括perplexity啊,它的几种模型是cloud你say的那个文字太多了。进去以后的话,它太贵,它是要收钱的。那边是按TOKEN找到算钱的啊,所以它不会有非常长的上下文来去沟通起来。

Open AI自己做的话,那么,它是不是就可以把这个上下文的极限稍微突破一点点,可以让更多的轮次去聊天。而且Open AI呢,有可能会采用多搜索引擎结合,不是光用病的,他肯定是要用病吧。

这里就有一个大的痛点,就是智能搜索。虽然我们讲了半天智能,但实际上,干活的还是原来那个搜索引擎,无论是骨骼的也好,还是病的也好。那么会受什么影响?会受到搜索引擎排序过程的影响,就是我们比如说,要求病给我返回10个答案来,而病返回的还是他排好序的时候啊。至于第11个是什么,永远不知道它是这样的,这对于智能搜索是有局极大的局限性的啊。

所以呢,我看AI据说是采用多个搜索引擎,多个搜索引擎一起干活的话,就会有多个排序方法出来。

再往后呢,就是他有可能会有多模态搜索。现在虽然谷歌being,所有的咱们现在常见的搜索引擎,都是有多模态搜索,就是你可以给以图搜图,给他一张图让他理解,给他个视频让他理解,但是呢AI搜索一般没加这一块。为什么呢?因为成本太高啊,这些人现在挣不出这么多钱来啊。那拆了GPT,他有的是钱啊,干吧然后信息的筛选和验证这件事。可能啊,GPT-4也要做的稍微好一点。 什么叫筛选和验证?你想吧,我今天先让病给我了10个结论啊,但是谁是真的,谁是假的?这10个结论之间有可能会有矛盾呢。我到底信任谁,不信任谁啊?那么这件事呢,要靠GPT去搞定啊。 普遍认为,OpenAI在这块还是比较厉害的。Hober啊,持续的磨合啊,逐步的掌握用户习惯这一块呢,也是可以去预期的。 为什么现在GPT-4你去跟他聊天时,他已经说了:“说我现在要跟你干嘛呢?就是要长期收集你的使用习惯了。” 你可以把这个选项关掉啊,你要不关掉的话,他就会长期收集你的使用习惯,未来让这个GPT越来越懂你啊,这个应该也会加入到4.0 GPT里边去。 而且据说呢,它使用多个大模型,包括像GPT-4 Light,包括像GPT-3.5的一些小叶的模型,它可以让整个的内容生成的过程变得飞快,不像原来这些。 你问他点什么事还得想半天啊,这块是大家可以去预期的。 但是呢,要想清楚一个事是什么,用的人多了都快不起来对吧?不可能说因为我算法好就能快啊。有一个东西叫算力强吧,就是你撞到算力强上了,就都都慢慢来吧。 后边呢,就是多语言输出了,多语言输出这件事呢,我相信大家也好理解嘛,就为什么呢?就是现在对于大模型来说,翻译这个啊,肯定都是做的很好的,要比传统的这些谷歌翻译并翻译,其实做的要好一些。 那么既然你让GPT去干这个事,说来你给我搜索一些什么东西,其实我们现在在Perplexity AI里头,你去搜索的各种内容,他经常会去找英文网站啊,找到了以后再翻译成中文,然后再总结出来给我,这个其实现在已经做的很好了。 欧冠AI上来一定会做得更好。 那么色驰GPT呢,对于未来到底会有什么样的影响啊? 会不会干掉谷歌这个事呢? 我觉得想的有点太多了啊,没有那么容易了,至少这个谷歌有可能会死。 但是应该不会死在这次啊。就是不是今天也不是明天啊。这好像是《权力的游戏》里的一句话哈。

谷歌呢,应该也会把自己的AI搜索啊做出来。谷歌的Gemini大模型做的其实还可以啊。我因为我最近也用了不少。他们现在并没有把这Gemini模型放到这个谷歌搜索里去。为什么呢?因为他们的商业模式理不顺。谷歌80%多的收入来自于搜索广告啊。你把这种Gemini大模型放进去了,等于你一下你的成本就上升非常高。因为谷歌的搜索用户量很大嘛。上升了以后你还挣不回响亮了,原来那广告费你收不到了。这个事是有问题的。

色石GPT上来以后,病的使用量还是会上升的啊。为什么?因为色石GPT底层会掉病的这个搜索引擎啊。所以病的这个还会上升一点点。

传统的商业模式呢,并不会彻底被颠覆。为什么呢?因为搜索排序这件事,还是搜索已经干的。比如说我今天向病交钱啊,我要求搜索的时候,我出在前头行不行啊?病可能不会收这个钱啊,因为微软也不靠这玩意挣钱。百度是会收这种钱的。谷歌应该也不会收这个钱,谷歌收的钱是说我可以给你打广告,但是那个广告呢,我是不会给你出现在搜索结果栏里的,而是出现在搜索结果栏的右边啊,或者是搜索结果栏的第一行啊,如果出现在最上面这一行,我估计,应该还是会按照搜索的这个输出给它输出出来啊。那么这个商业模式依然是可以去运作啊,没有彻底崩塌。

后面苹果呢,也还是希望可以收到谷歌搜索引擎绑定的这个费用。谷歌每年会给苹果好大一笔钱,干嘛?就是你默认使用我的搜索引擎啊,你只要默认使了,我就给你钱。对吧,他这个是苹果还是想挣的,未来都是收20美金的。那你说,收了20美金?苹果说,我收30%行不行?争你个苹果税,对吧?那大家肯定不乐意。我这还这个揭不开锅呢啊,好不容易收了20美金,你还收了30%,走6美金啊,那是对吧。这个事受不了啊,不不干所以。苹果的也不一定是希望把他们拎进来去收这6美金,而且我相信这个6美金绝对没有谷歌分给他的钱多啊。谷歌这个钱是怎么分的,他是说啊,苹果用户因为使用了谷歌搜索引擎,点击了广告,然后呢我挣到的广告费,我按照一定的比例分给苹果,他是这样来分的。你想你拿了个手机,你肯定每天经常的看,不停的点,等于你会不停的给苹果制造收益啊。这是GPT出来以后,订阅Open AI的人一定会上升啊,但是这个,即使上升,Open AI也不可能靠这玩意盈利啊。想都不用想。然后,Perplexity这种创业公司估计就要完蛋。Open AI自己做了测试的这个引擎以后,那么大家就,反正你像我,已经每个月交了20美金给这个Open AI了,那我就老老实实接着用不就完了吗,他一定会是变成这样的啊。那么其他那种再想靠这玩意挣钱的,这些小型的创业公司,哪怕他现在到独角兽了啊,后边都日子不好过啊。当然了,国内肯定该用不了还是用不了啊,这是必然的啊。这就是我们可能对于这个40GPT啊,能够有一些什么样的念想就到这了。

好,这是今天的第二个故事啊。希望下周我们能够看到40GPT发布吧。

 

Both comments and pings are currently closed.

Comments are closed.

Close Bitnami banner
Bitnami