揭开ChatGPT搜索的真相:一个万圣节的鬼故事还是AI搜索的未来交响曲?从SearchGPT到ChatGPT Search:OpenAI释出的技术原型引领搜索引擎革命还是用户的虚惊一场?
ChatGPT搜索,OpenAI在万圣节给大家讲的鬼故事。这是一个什么样的情况?大家好,这里是老范讲故事的YouTube频道。今天咱们来讲一讲ChatGPT搜索。我使用一天以后的感受,以及为什么觉得它是一个万圣节的鬼故事。
11月1号,北京时间0:35,我收到了一封邮件。这个邮件上写了,说我们发布了ChatGPT搜索,这是OpenAI的官方邮件。首先感谢,我去注册了SearchGPT原型候补名单。这个里头大家注意有三个词:第一个是SearchGPT,第二个是原型产品,第三个叫waitlist。他首先感谢了这件事情,说我们很荣幸地宣布,这个ChatGPT搜索发布了,而且向您和所有候补名单上的用户开放访问权限。只要原来申请过的,现在还没有被批准的SearchGPT的候补名单里的这些人,通通都可以访问了。
现在,其实你即使不在候补名单里头,Plus用户和Teams用户都是可以使用的。免费用户可能要稍微等一等,但我不确定免费用户是不是可以在SearchGPT的候补名单里。这个事我不确定,如果是在里边,可能也能够使用。邮件是这么写的。
再往后一句话是,ChatGPT搜索将SearchGPT的最佳功能直接引入了ChatGPT。这句话大家要仔细琢磨一下,是可以通过单击设置开关开始使用。那这个意思就告诉你怎么用这个东西。它等于是插入GPT聊天窗口,最底下有一个设置,或者叫搜索的一个开关,一个小图标,长得像个地球似的。你点一下,它就点亮了,然后就可以进入搜索模式。再点一下,把它关掉,就不进入搜索模式了。
就是用GPT搜,给你瞎编了。现在在网页端、桌面端和移动端都是可以使用的。我也都试验过了。在我的MacOS上的这个ChatGPT的APP,在我的iOS、安卓上的这种APP,包括网页,都是有这个小图标了。移动端呢……
稍微好玩一点。就是一开始,这小图标没出来。你需要跟他聊一会,他发现你问的是一个需要去搜索的问题的时候,他就问你:“咱是不是搜索一下?”你这边同意一下,这东西就出来了。原因也很简单,手机屏幕小,寸土寸金。一开始他就先不给大家显示了。
那么后边鬼故事就要开始了。为什么说这是OpenAI讲的鬼故事呢?大家要注意,ChatGPT跟SearchGPT它不是同一个产品。我们加入的是SearchGPT的这个waitlist,我们没有加入过ChatGPT Search的这个waitlist。所以你看它的邮件里头写的是:“ChatGPT Search将SearchGPT的最佳功能直接引入ChatGPT了。”他也承认这是两个不同的产品。而且,它只是引入了SearchGPT的一部分功能,SearchGPT的功能很多的,他只把其中的很少的一点点带回来了。
这是一个很神奇的事情。而且大家注意,在前面,他讲的是这个:“感谢注册SearchGPT原型候补名单。”这里的还有一个词是什么叫原型?大家要知道,很多汽车厂会喜欢干什么事,发布原型车。他们经常在汽车展览会上发布一些原型车。原型车干嘛使?是展示一下他们的最高工艺和各种先进技术,以及对未来汽车的想象力。这种原型车通常是不卖的。有极个别的情况,原型车实在太受欢迎了,他们也会把原型车上线生产。但是在上线生产那个版本,还是会跟展示的原型车有一些区别的,因为直接生产原型车可能会亏死的。因为原型车通常是不计工本的,也不计算你最后的这种维护或者长期使用的一些情况。它就是属于很炫技的一个产品。
所以有两种可能。第一种可能,这就是个原型车似的东西,大家看过了以后,这个东西就没有了,以后永远不会量产。这是可能的。当然还有一种可能,没准再过个俩月的SearchGPT,它又冒出来了,说:“你看,我们现在把完整功能的SearchGPT拿出来了。”大家要注意,现在还有什么产品是这种。
叫原型产品。我们现在使用的 O1 模型也是原型。过一段时间,完整版的 O1 也会出来。所以我们现在使用的很多东西都不是最终的版本。按照 OpenAI 的调性,我觉得 SearchGPT 这个产品应该没死,过一段时间还会出来。
现在的 AI 搜索其实已经走得很远了,绝对不是现在的 ChatGPT Search 能够达到的高度。现在这些,甭管是 Perplexity 还是国内的很多 AI 搜索工具,他们会对不同的信息进行分类排序,然后再进行推理。这什么意思?其实咱们通俗地讲,这种 AI 搜索是很简单的。你给它一个搜索关键词,它跑到搜索引擎里去搜一把。搜完了以后,拿到前 5 个搜索结果或者前 10 个搜索结果,再跟你的搜索提示词一起,再加上一个大的提示词工程,然后说:“现在请根据这么多的搜索结果,找到与前面搜索关键词或者搜索内容相关的信息,给我写一个小作文出来。”再加上这样的一个提示词,就得到结果了。
像这种东西,我们在 AI agent 的这个模型里都是可以非常轻松搭建的。但是这种搭建完了的内容会有问题。这个问题是在哪?它是眉毛胡子一把抓的,根本不管什么样的内容,它都放在一起。而且搜索引擎的排序,它更多的是按热度、按照大家的点击率、按照时效性来去排的,所以它跟整个内容的质量以及正确与否是没关系的。如果你是拿这样的结果直接去做总结输出,最后的质量就会很差。
那你说我怎么提高质量?你要对输入的内容进行分类。进来的东西,这个是严肃新闻媒体,那个是维基百科,这个是学术期刊,哪些是论坛,哪些是一些社交媒体。他要分开去排序。然后你首先要去确认说,你需要一个严肃的答案,还是需要一个相对专业的答案,还是说更多搞笑的答案。如果你说你需要一个严肃的答案,我就应该把严肃新闻媒体以及这种学术期刊、维基百科排前头,把一些社交媒体或者论坛像 Reddit 这样的东西稍微往后排一排。如果你反过来说,我现在就想逗个乐……
这个内容正确与否无所谓的。那咱就把这排序反过来。你也可以在做提示词工程的时候,要求生成最终的小作文的时候,我们是优先使用哪一部分内容,更重视哪一块,这个都是可以去做的啊。那么如果你不做这些事,最后眉毛胡子一把抓,其实效果是会很差的。
做完了所有的这些数据准备之后,现在这些AI搜索还是会生成一篇,这个不能算叫小作文了,基本上算是个小论文的一个搜索结果。他会啰里八嗦给你写一大堆,甚至是有条有理的给你写一堆,让你觉得他非常专业。而且还有一些深度搜索的功能也上来。
怎么叫深度搜索?比如说你问了一个简单的问题,他首先会对问题进行理解,你到底想问什么。理解了以后,把他理解的问题跟你自己提的问题都去搜。搜完了以后得到一大堆的搜索结果,在对这些搜索结果进行总结归纳以后,再在里边找到新关键词,问你说:“我们是不是要进行下一步的搜索?”甚至有一些深度搜索压根就不问你,他在把第二层的搜索结果生成新的关键词以后再去搜索,最后把所有的结果放在一起,给你总结归纳出一个更长、更丰富的一篇论文出来。
他们是这么来干活的。所以现在的AI搜索其实已经稍微有点跑偏了。怎么叫跑偏?越来越阳春白雪了,跟普通用户的这个使用体验其实越差越远了,因为已经到炫技的状态了。
SearchGPT原来也泄露了一些视频出来,因为也确实是有人在waitlist里头,收到邮件了,进去使用了当时的SearchGPT。就像我刚才讲的这个AI搜索工具似的,功能非常完整,做的也还非常不错。而ChatGPT Search这个原来应该是比较简单的一个功能,其实ChatGPT Search在这一次发布之前,它也一直在陪伴着我们,在跟我们一起工作。在我们使用GPT-4o进行搜索的时候,他也会去引用一些网络原文,也会去放一些结果的出处出来,都会去做。只是现在多了一按钮,你一旦把这个开关打开了以后,你编出来的这个内容。
可能还不如原来不开开关的这个效果。为什么?因为原来那东西靠编,他给你的文章会比较长,也相对来说比较有说服力。而现在,基本上是一句对一句的这样的回复,他给你的内容都很简短。而且从现在的结果来看,它的GPT Search给出的结果,它所选用的内容并没有那么丰富。什么深度搜索这些东西,应该并没有特别认真的去做。为什么这么讲?因为这个里边幻觉还是挺厉害的。待会儿咱们再讲讲幻觉的事情,这个很难避免,特别是像这个ChatGPT Search这样工作的工具,实际上比较难避免幻觉。
那么,我现在使了一整天的ChatGPT Search了,体验如何?我昨天做直播的内容,就是用ChatGPT Search去准备的。说实话,不太好用。这个,他总是给出非常简短的答案,而且不时出现幻觉。出现幻觉的原因其实也很简单。我以前也被坑过,被当时是微软的Copilot去坑。我当时问他,我说跟Ofo的创始人一起在美国开咖啡厅的女士,在瑞幸和星巴克有没有任职过?就给我了一个回复,说有的,他原来是星巴克的哪个高管,瑞幸哪个高管。我就开开心心的把这东西做到我的演讲稿里去,后来在讲之前我还幸亏看了一眼,发现被骗了。
他这种幻觉怎么产生的?就等于是他搜索了一堆结果出来,有一个结果说是这位女士跟Ofo共享单车的创始人一起去开咖啡厅了。再去讲说这个事情对星巴克有什么影响,对瑞幸有什么影响,星巴克的高管对此事发表了什么看法,而瑞幸的高管对此事发表了什么看法。它等于是三篇文章,在你给了他一个问题之后,他就把这三篇文章给你揉一块,他就认为这位女士在星巴克也担任过高管,在瑞幸也担任过高管。这个幻觉好多的时候是这么来的。
现在的ChatGPT Search给出的出处相对来说会比较少。你比如你去用这个Copilot,他会给你非常多的处理。你问他一个问题以后,他会扫描很多东西去进行总结。如果一句话在不同的地方出来,他还会告诉你说……
这句话在哪些网站上都引用了。所以这一块上,我觉得还没有Copilot的好用。为什么会是这样的一个产品?它为什么会做成这样的一个样子呢?原因也很简单,其实它的底层Bing提供了这个基本的功能,微软的Bing搜索。但是OpenAI也自行购买了一些新闻源,一些严肃媒体,他去跟人做了内容合作。但总的来说,它的内容还是少了一些,信息分类、过滤和排序的过程应该做得比较粗糙。而且它的很多文章在进行总结的时候,也不是很准确,更多的是依赖搜索结果,而不是自己生成。
它下头不是有个小开关吗?你到底是ChatGPT Search这个开关开还是关?如果你把它关上,它也不是说就不搜索了,它也搜索,只是更多地依赖生成。如果你的开关打开,它就更多地依赖搜索结果,给你生成简单的一个回复。所以你会感觉到什么?你一旦打开搜索的这个开关,ChatGPT Search给出的答案会比原来的GPT-4显得简短和呆板。这个感觉,就像是被一众安卓手机所围攻的iPhone。为什么这么讲?基本盘基本功能还是相当牢靠的,绣花边的事情基本不屑一顾,iPhone基本上就是这样。很多奇奇怪怪的安卓手机上有的功能都没有,但是它的基本底子特别好。
现在ChatGPT的基本底子也很好,大模型现在应该还是第一梯队吧。虽然不断有评分说Claude怎么超越它了,Gemini怎么超越它了,或者其他人怎么接近或者超越它了,但其实大家使用下来以后会发现,ChatGPT还是最好使的。那么搜索的部分,如果是卷这个搜索流程,其实ChatGPT已经卷不过了。Perplexity做了这么长时间了,国内这么多厂商做了很长时间,把这个搜索整个的AI流程做得非常复杂,或者是在对于用户的体验,特别是很多深层的体验理解得非常透彻。所以在这块儿它卷不过。而且其他的产品狠抓搜索流程梳理,其实的原因是什么?他们自己的大模型不够强,所以我们只能是想办法。
把这个任务分解掉,让每一个小环节尽可能的清晰地完成一项任务。再把所有的任务凑在一起,进行这个大模型输出。是他们的模型弱,只能这么干。还有他们对自己的模型可能并没有那么熟悉,比如说这个perplexity,它后台用的也是GPT的模型,但是它对于GPT模型的各种属性一定是没有OpenAI自己熟悉的。那么到底能干哪些事,不能干哪些事,如何进行稳定的控制与输出,它没有那么大的信心,所以只能是在模型外边去绣花。
还有一点是什么,就是这些AI搜索的公司模型,对于他们来说成本比较贵,所以他们会尽可能的少用,或者尽可能的用小模型去处理一些简单任务,最终用大模型去输出一个结果。像我自己写的很多AI内容生成的这种AI Agent也是这样的,一些简单工作都是用7B或者是十几B的模型去做完了,只有在最后生成结果的时候,会挂上GPT-4o这种比较大的模型去折腾一次。
而OpenAI玩的东西,咱们叫“一白遮百丑”,这个也是比较有意思的。什么意思呢?就是底子好,那些涂涂抹抹的事咱就稍微简单一些,不那么重要了。现在道理是很清晰的,但是未必大家欣赏得来。你像我现在就欣赏不来这个ChatGPT Search,现在反对的声音也不少。
第一个反对ChatGPT Search的是什么?就是准确性和可靠性没有那么好。我自己其实使用的过程中也发现了。第二个内容的质量不是很高,他们买的这种严肃版权还是少。如果你问的问题没有被严肃版权内容命中,他可能真的靠一些比如Bing给的内容,然后由Bing来排序,他直接把最热门的内容拿回来,总结一下就完事了。这个效果和质量就没有那么好控制了。
像这里举一个Google的例子,Google原来做这种AI搜索的时候,就犯过这种问题。他买了Reddit的一大堆数据回来,只要这些数据像就是个论坛里头,各种的对的错的,妖魔鬼怪什么都有。在很多人去问问题的时候。
他就把这些问题,这些论坛上的内容,就作为正确答案扔出来了,让大家异常惊诧。比如说,在食物上涂胶水还可以吃,它就直接作为正常答案扔出来了。
那么,现在OpenAI肯定也会面临同样的问题,而且有很多人觉得搜索的质量堪忧。再往后是版权的问题,你只要是做搜索了,你不可能把所有人的版权都买下来。他买了一些版权,但是还有很多版权他应该是没有买的。大家对版权的情况也是感觉担忧,而且对于原始创作者,肯定也是有巨大的影响的。因为这玩意,如果没有买我的版权,然后又生成了相应的内容出来,那这事怎么办?我原来网站上是有广告的,我还能收点钱,现在这个钱就没挣着。你挣一个月20美金,你也不分给我,这个事大家就会感觉比较担忧了。
而且还有一个问题,就是幻觉比较严重,这个我现在发现是有的。但是反正从外边来报道上来说,它的幻觉还是不少的。这样的一个功能做得一般,它的野心并不小。Perplexity根本就没放在眼里,Perplexity实际上是个小众产品,阳春白雪,真正能用得起这玩意的人是比较少数的。
现在OpenAI还瞄准的是谁?瞄准的是Google的搜索引擎入口。我在开始使用ChatGPT Search之后,它就弹了个窗,弹窗说:“你是不是装一个ChatGPT Search的插件?”那我就装呗,这是从善如流一下。把它装上以后,这个再到Chrome的搜索栏里边去,输入任何信息的时候,一打回车,就是直接走到OpenAI的ChatGPT Search了,对吧?就不再去Google Search了。
在这点上,Google还算是比较高风亮节的。怎么讲?他发现了搜索接口被替代了,上来问我:“你知道吗?你的搜索的接口被替代了,你同意这么干吗?”我说同意,干呗。Google就没再说什么,就直接给替换掉了。我的Chrome现在地址栏上写任何信息,一回车的时候就去OpenAI了,对吧?是这样来工作的。我自己大概是使用了半个小时左右。
就把ChatGPT Search查件给删了。我还是回去用Google搜索了。原因其实也很简单,我还是喜欢看着一大堆的结果,自己一目十行的,把搜索结果稍微过滤一下,再决定点哪个、不点哪个,而不需要让OpenAI让我选择完了以后,直接给我一个它总结出来的结果。
但是我也蛮喜欢用Copilot。Copilot它会搜索很多的东西,它的阅读速度比你快。不像OpenAI似的,好像没出几条,它就直接给你总结出了一个东西,让你去用了,这个质量是堪忧的。
所以最终总结一下,这就是一个万圣节的鬼故事。OpenAI现在面临很多问题,GPT-5难产,Sora也就是它原来号称的视频模型,世界模型也难产。SearchGPT其实也难产了。我们今天拿到的ChatGPT Search,并不是SearchGPT,以后这个产品可能还会出,所以它需要一些声音来粉饰太平。
GPT-01以及ChatGPT Search其实都是类似这种顶缸产品。为什么这么讲?很多人说GPT-01那么厉害,你怎么可能一说它顶缸?对啊,后边还写着“Preview”这个词,这也是个原型产品。那未来还是会出正式版的。你现在既然着急忙慌地把预览版拎出来了,那你说它是顶缸,这就没有冤枉它。
现在对于OpenAI来说,它最大的困扰是什么?一方面是大量的东西难产,而且很多的元老员工离职。咱不是说元老离职了以后,这东西就塌了,也不是说新进来的人就没有元老那帮人厉害。而是什么?元老这些人走了以后,以前他们很多干到一半的事情,你让新人接,他接不上。对,你给这些新人说,我给你些新任务,你从新开始干,他没准接着咔嚓给你做出来了。你说你把原来那个人做的项目继续给我做下去,这个事是很难的。
现在既然新方向没法往前走了,那怎么办?抢流量。所以我们今天看到了ChatGPT Search出了个插件,直接开始跟Google贴脸开大。我上了插件以后,Chrome的默认搜索引擎。
就是我们家OpenAI的ChatGPT Search了。就不再是你们家的Google搜索了。从我的角度上来,感觉有点操之过急了。他完完全全可以等他的这个SearchGPT出来以后,再去做相应的替换,而不是现在就着急忙慌地把它换过来。
OpenAI手里头基于GPT-4或者GPT-4o的各种功能性模型,应该还有一堆。就是像我们现在看到的o1,看到的ChatGPT Search,实际上都属于是基于4或者4o的功能性模型。那么,今年剩下的时间,我们就看OpenAI继续给我们表演机器猫的次元袋就行了。他不停地从这个口袋里再掏出点什么东西来,待会又从口袋里掏出点什么东西来,但是都不会有什么大的变化。
也许在明年的什么时间,现在新交进来的人,就可以替换掉以前的这些元老们所做的这些工作,可以把原来吹过的牛慢慢圆上,或者再给我们一些眼前一亮的东西。好,这就是我们今天的解读。OpenAI的ChatGPT Search,就是万圣节的一个鬼故事。感谢大家收听,请帮忙点赞,点小铃铛,参加Discord讨论群。也欢迎有兴趣、有能力的朋友加入我们的付费频道。再见。
Both comments and pings are currently closed.