硕鼠的博客站

范路的博客主站,时而会发些东西。

大家好,欢迎收听《老范讲故事》YouTube频道。今天咱们来讲一讲Goole I/O,又一次如期举办了。为什么使用了这样的一个词呢?因为提前一天,Open AI已经把风头都抢走了。大家要知道,在往年的Goole I/O啊,一直都是被认为是互联网科技圈里的一次技术盛会。我曾经去过一次,2014年,我是到旧金山,到现场去参加过一次啊,那真的是一场科技盛会。所有的技术媒体,在这之前就要整装待发,我们要在这等着,等什么呢?传达好Goole I/O,向全世界互联网技术圈传达的方向。对吧,大家要好好学习。今年指明的方向是什么?每年都要干这样的一个事情。甚至呢,还有很多的小公司,会在Goole I/O的会场外面举办各种小型沙龙。2014年我就去干这个事情,在Goole I/O外面啊,租了一个小的酒吧。但是,你不敢在他正式开会的时候开会啊,那个时候是抢不到人的。我们都会在他开会散了以后,晚上在周围的小酒吧里边开一些小型的沙龙,跟我们坐下来,我们来讲一讲这个——当时在猎豹移动,是猎豹移动啊,在谷歌里头都干了些什么事情。我还记得那一年我们坐在台下,听着皮查伊在上面讲,提了多少次猎豹移动,大概提了4次还是5次。我啊,还有很多猎豹移动的员工,包括各种老板们,都在下面听着热血澎湃。但是今年,热度全都被Open AI释放掉了。你想,大家都在等着,等着,等着,说哎,Open AI还提前一天来,说我们给大家看一个不一样的。我记得以前有一个这样的故事,是滴滴也是跟另外一家公司去抢,那家公司还比滴滴融的钱多,然后每天在北京交通台做广告,说啊,还有10天,我要告诉你们一个重大消息,还有5天,我要告诉你们一个重大消息,反正每天倒计时往前数。然后滴滴呢,大概提前了一天发布,说不用等了。今儿我就告诉你吧,人家等于是花了30天的钱,滴滴只花了一天的钱,还可以截胡了啊。现在Open AI也干了这么个事,Open AI在提前一天发布了GPT-4,这样一个产品。这个产品呢,从外在表现上说,你说它划时代吗?又好像没有那么划时代。它人性化的很强,就是大家觉得那是一个人了。而且从技术上说呢,也确实有一个进步,什么进步?原来都是说语音识别,内容处理,或者是叫文字处理,然后再到语音输出,原来是这样的输出方式。现在是端到端,我这头进去就是语音,出来的也是语音。这个产品让大家眼前一亮,让这些等了很长时间的技术媒体们,一把把热情全都释放掉了。什么划时代呀,什么“Wow”,还有各种各样的溢美之词,就直接都在它身上释放掉了。这也是很神奇的一个事情。

Goole I/O里边发布的第一个产品是什么呢?叫Project Astra,这个产品呢,我觉得算是草草发了一下就完事了啊。因为现在肯定不敢是现场演示,都是给大家看一个视频就完事了。至于说这个产品是不是真的没有准备好,还是说已经准备好了,只是说我们要再等一等,再磨练一下,回炉一下再给大家看,不知道啊。现在对外面说的是,这个产品现在只有原型,还要再打磨一下才可以给大家看。因为这个产品,完完全全是被GPT-4干掉的。这个叫谷歌版贾维斯,他其实干的活跟GPT-4是很像的。这个里头呢,一个是贾维斯,另外一个是Her,虽然前面GPT-4出来的时候,也有人在喊贾维斯,但是呢,更多的人喊的是Her,而且山姆·奥特曼自己喊的也是Her。这个角色有什么差别呢?贾维斯呢…
是钢铁侠带的AI助手,干的是什么呢?你给工程师做的AI助手,它可以给你处理各种工程事务。而Her呢,是一个科幻电影里面的,是情感服务——它要跟他去谈男女朋友,要恋爱的一个东西。所以,谷歌发布的产品跟Open AI发布的产品之间的差异,一个更有用,更能够解决各种工程问题;另外一个是更能够提供情感价值,更像一个人。但甭管是贾维斯还是Her,甭管是Project Astra还是GPT40,其实呢,这两个产品都为我们指明了共同的方向:这个共同的方向就是要高速响应,调用摄像头啊,也就是要有视觉,更像是Siri 2.0的一个产品。原来,甭管我们是Siri也好,还是其他的各种的谷歌助手,或者其他手机AI助手也好,这都是上一代的产品了。现在结合大模型以后,如果能够有高速响应,如果能够有视觉的反馈,这就是未来啊。甭管是GPT40还是Project Astra,指明了这个方向。

当然了,晚了一天,我们就完全无法判断Project Astra到底做成什么样子了。而且,它有可能是按照传统的方式做的,就是先进行语音识别,然后再进行文字处理,最后再语音输出。现在可能叫回炉重造了啊。最后,我们能够看到的是一个什么样的产品,就不好说了啊。我觉得在这一点上来说,Open AI的策略实在是太成功了啊,完完全全是打了谷歌一个措手不及。而且,昨天在Goole I/O大会开始之前,我们在Twitter上开玩笑说,皮彩是不是回去连夜改PPT去了。那么,改PPT这部分,应该就是关于“Project Astra”的部分了。正确的是,谷歌把所有的产品和方向都对标了一遍。先把Gemini升级,Gemini现在是100万上下文,我们把它升级到200万。然后,出了一个新的模型,叫Gemini 1.5 Flash。像我们现在用的很多是Gemini 1.5 Pro。那么,“Flash”什么意思?闪电啊,就是速度要非常非常快,是为Project Astra准备的。这样的后台模型拿出来用了。视频模型,对标Sora的模型也拿出来了。音乐的也有,然后图片生成的,现在叫Imagine 3,原来是Imagine 2。但是这个到底怎么用,我还没太搞明白。因为Imagine 2当时推出后,几天内把所有人都化成了黑人,之后他们又取消了,说几个礼拜后再拿出来给大家看,结果到现在也没再拿出来。所以,后面这个产品到底什么样,不知道了。

其他的,包括TPU也要拿出来说,哎,我们也都升级了。所谓TPU,就是谷歌自己做的算力芯片,特别是服务端的算力芯片。这一次主要发布的是服务端的算力芯片。手机端的算力芯片,他们通常是会跟着他们最新的手机一起发布。那么,谷歌的真正看家本领是什么?其实不是刚才我们讲的这些东西。刚才讲的这些东西都是,别人有什么,我就拿什么东西来应对。就像常说的,如果我出这一招,请问你如何应对?谷歌说,来,我这里也有做的。但是,谷歌真正的看家本领是什么?就是搜索。对吧,它在搜索上加了一个叫“Overview”,就是综述一下,我把前面几个我认为比较准确的、比较重要的搜索结果,写一个综述给大家看一下。这个产品呢,又不像是AI搜索,为什么呢?它是一个折中方案。谷歌主要的收入来自于搜索广告,如果你真的做成AI搜索,就算一个人收20美金,这钱挣不回来。谷歌是把全世界绝大部分的广告费都攥在手里的,所以它没法放弃这块收入。因此,它的“Overview”现在只能在美国使用,可能只能在英语里头用。它离真正的AI搜索产品还是差得比较远的。而且,谷歌是有全家桶的,为了对抗微软,谷歌专门做了全家桶。咱们所谓全家桶,是指你有Office,有照片,有通讯录,有邮箱,有日历等,所有这些东西都包括在内。全世界有全家桶的公司其实并不多,或者说使用比较普遍的这种全家桶公司,实际上就三个:一个是微软,它自己有日历、网盘、邮箱、通讯录、全套的Office,因为人家有Windows,有整套的操作系统,这是完整的,也有搜索;然后是苹果,它有全套的,包括Mac OS、iPhone(iOS系统),还有苹果全套的Office,称为iWorks,以及苹果的网盘、邮箱、通讯录、日历,一整套;谷歌也是一整套,称为Workspace,包括Gmail、谷歌通讯录、谷歌日历,甚至还有谷歌地图、谷歌相册。在这三家里,当与Gemini打通,或者说刚与一个AI的系统打通后,它确实是会迸发出空前的想象力来。比如,我现在可以搜一下机票里头有什么样的信息,问它过去半个月里头有没有人给我发机票信息,或者说给我总结一下最近邮箱里头有哪些特定类型的信息。
他就可以干这件事情了。他不但可以把《机妙》都读完了以后,还可以把里边的附件都读一下,甭管这个附件是PDF还是视频,他都可以读出来然后进行分析。你也可以说,“哎,把我的Google Drive里头,包括我的Google Bookspace里面的,所有的这些文档给我找一找,里头有什么相关的信息,给我找一找。”对吧,这个是可以干的。微软也是要这么干,就是它跟所有的Office捆绑在一起,跟Windows捆绑在一起,说,“给我去找一下这里头有什么东西。”对吧。现在苹果呢,呃,看来是要跟Open AI再去合作。说来,呃,我苹果的整个的全栈统一类,它也需要加这么一套东西。苹果到底是做Ajax,还是说我们先拿Open AI先顶上再说,这个不好说。或者也有可能,以苹果使用搜索引擎的调性来说,他应该是两边都支持,因为你如果只支持一边的话,容易被反垄断案影响,对吧。但是现在传出的是,苹果跟Open AI走的要更近一些。现在呢,谷歌的Gemini,就是“我来,通通都打通了。”啊,我把我的这个相册给你打通了,你可以问,“哎,我这些照片里头,有哪些是跟儿子有关的,或者跟我的车有关的?”你就可以提这样的问题。然后,他会把你所有的照片进行一些总结,归纳了以后说,“哎,你这有多少个阶段啊,每一个时间节点是什么样的,然后在这个时间节点,你发生了一些什么样大的事情,你有照片为证。”他会干这样的事情。这个呢,还是比较让人兴奋的,因为要知道,Open AI自己是没有全家桶的,这些想象空间它都没有,它只能跟微软在一起,在微软的全家桶上去玩。现在有可能,在苹果的全家桶上去玩。另外一头就是谷歌,“哎,我在全家桶里上GYMNA。”谷歌推的另外一个东西呢,是Gemini on Android。其实,在安卓系统里头,要去嵌入Gemini的这种小型的模型。即使在大模型小型化这块,谷歌一直走在世界的前列。原来做TensorFlow的时候,他们有专门一个产品,叫TensorFlow Lite,应该是谷歌中国团队这边很努力地去研发,在做这样的一个产品。所以,他们一直在干这件事,就是希望能够在安卓端直接进行一定程度的这种大模型的操作。Gemini说安卓出来以后,那么以后的安卓系统,可以进行更多的本地智能操作,这就会变得更加强大。但是,这对于国产的移动操作系统来说,就会比较痛苦,比如说MIOS,或者是OPPO、vivo,至少在国内卖的这些产品来说,就比较难搞了。当然,他们到国外卖的产品,应该会搭载Gemini for Android,这个是没有任何问题的,因为所有的这些安卓设备,一定要捆绑谷歌全家桶——你的地图、相册、日历、通讯录、邮箱,还有谷歌Space,要捆绑在一起,它才好使,否则差异很大。

Mini-Android虽然它没有特意强调,但我相信应该是捆绑了GMS,就是Google Mobile Service。要知道,在国内卖的这个安卓手机,哪怕是小米的,里头的GMS都是不完整的。另外,鸿蒙这个,我们只能期待它给我们惊喜,肯定跟安卓,特别是带了大模型以后的安卓,差异会越来越大。那么,小米、OPPO、vivo国内的产品,估计会各自为战,因为小米自己有自己的大模型,OPPO、vivo自己也做了自己的大模型,但是这一块,可能跟这个Gemini就会差得比较远。虽然Gemini可能跟OpenAI比起来,它是有差距的,但是碾压小米和OPPO、vivo自己家的模型,应该还是没有任何问题的。

最后,咱们要讲,对于谷歌来说,现在是不是已经是廉颇老矣,尚能饭否的时代了呢?有点像了。谷歌现在可以在所有的战线上都进行拉扯,每一块都有OpenAI所谓的端到端整合大模型路径,我把所有东西都会整合在一个模型里头去,然后我尽量端到端。这头输入什么,那头就直接有输出啊。做这样的事情,谷歌呢,现在可以干。在每一个侧面,也都好像还有一战之力啊。但是呢,他们整合是很困难,因为这公司实在太大了。每一个小部门说:“我们都很强啊,我们都有能力再去研发一个自己的模型,自己去应用啊。我们一定要去可以替换,不能让任何一个呃模块变得不可替换,变成唯一的这种关键点。”不能干这个事情,那么导致呢,就是各自为战。而且呢,各自呢,会有很多的这种规则啊,这个就会比较难看,相互之间拉扯。最后在基座大模型升级的时候,比如说GPT4升到GPT5的时候,那么,谷歌可能就又会显得比较难看一点。现在的谷歌呢,有点地大物博和老大帝国的影子了。咱们想一想,这些地大物博的老大帝国,都是怎么讲的啊?说:“老子当年富过啊。”谷歌现在也有这样的感受,哎,啥都不缺,地大物博嘛,我啥都有啊,每样事情都有。所以你看谷歌IO发布的这个会上,对吧,所有的方向,只要OpenAI有的方向,我们全都有,每一样我都应对上了。然后各种的制约和规矩众多,一旦跌了跟头就爬不起来,就跟那个Imagine II,当时因为正式正确被人骂了以后,下去就再也没回来过。而OpenAI呢,完完全全是下一个时代的产品。真正干掉老大帝国的,永远不是另外一个老大帝国,就像苹果呀,微软,你说哎,我们把谷歌干掉没有那么容易,对吧?真正要干掉他的,一定是一个他从来没见过的东西。对吧,这就是OpenAI。所以谷歌现在其实是比较危险的,虽然尚能挣扎,没有在任何一个战线上完全被人打得溃不成军啊,但是他的底层逻辑是错的。底层逻辑是:我每一块拎出来都还可以再比划两下,但是啊,你真的跟一些新生事物,你是打不过的啊。这就是谷歌IO啊,给我看完了以后的感受。这期讲到这里,感谢大家收听。请帮忙点赞并点小铃铛,参加Disco讨论群。也欢迎有兴趣、有能力的朋友加入我们的付费频道。再见。

 

Both comments and pings are currently closed.

Comments are closed.

Close Bitnami banner
Bitnami