硕鼠的博客站

范路的博客主站,时而会发些东西。

在上海人工智能大会上,我们目睹了中国AI发展的新高度。今天,我们将引用两位业界大佬的讲话,并附上一些个人见解。首先,李彦宏提到,无需担忧AI会夺走人类的工作,当前的AI技术,如百度的“文心”,更多地扮演着辅助角色,如辅助驾驶,而非完全取代人力。他指出,尽管某些职业可能会消失,但新兴职业,如数据标注师和提示词工程师,将应运而生。这些职业虽然门槛不高,但对逻辑思维有较高要求。然而,值得注意的是,消失的职业数量远不及新创职业,且“门槛不高”往往意味着收入也相对较低。

接着,严弘提出了避免陷入“超级应用陷阱”的观点。他解释道,移动时代的思维定势认为,超级应用是关键,但在AI时代,那些具有强大功能的应用,即便用户量不及10亿日活跃用户(DAU),也可能对产业和应用场景产生更大的价值。严弘的这一观点,或许反映了百度在超级应用领域的局限性,正如俗语所说,“吃不到葡萄说葡萄酸”。李彦宏强调,AI时代的核心仍旧是搜索,这是百度的强项。然而,百度自身从未成功打造出超级应用,这一直是其心中的痛。在AI时代,百度虽有雄心,但若无法突破超级应用的瓶颈,其盈利前景将受到限制。

总的来说,中国AI的发展正迎来新的挑战和机遇,而如何在AI时代找到自己的定位,对于企业来说至关重要。

Open AI虽未打造出超级应用,其盈利模式因此受到挑战。百度近期的讨论聚焦于超级应用的概念,试图解答为何缺少超级应用会影响盈利。百度旗下应用如百度搜索、百度网盘、百度地图及百度贴吧,用户基数庞大,但它们能否称为超级应用仍存疑。同样,Open AI的Chat CPT等应用虽广受欢迎,也未达到超级应用的标准。

超级应用的定义应涵盖以下要素:首先,需拥有庞大的用户群体,例如猎豹移动曾达到1.5亿日活跃用户和6亿月活跃用户,但即便如此,它仍未跻身超级应用之列。原因在于,巨大的用户量仅是必要条件之一,还需考量其他因素。

其次,超级应用应具备长时间的用户使用时长。用户在应用中停留时间越长,应用的吸引力和粘性越大。以百度的应用为例,其用户使用时长与微信、抖音等相比明显不足,这成为其未能成为超级应用的关键因素之一。

此外,完整的生态系统是超级应用的另一重要特征。用户在应用中不仅停留时间长,还能进行多样化的互动和交易,形成闭环生态。例如,微信不仅提供即时通讯服务,还集成了支付、游戏、小程序等多种功能,构建了一个自给自足的生态体系。

综上所述,超级应用的定义不仅限于用户量,更在于用户使用时长和生态系统的完整性。这为Open AI和百度等科技公司提供了新的思考方向,即如何在提升用户量的同时,增加用户粘性和构建生态体系,以实现超级应用的突破。

这个里边要有内容提供者,要有内容消费者。里头可能还有很多其他的,比如说有交易啊,有借贷,有很多的金融生态。你要有完整生态在里头。这是百度的应用,从来没有做到过。百度自己也惦记做电商,还惦记去做这外卖,还惦记去做金融支付,但都没做起来。你要想做超级应用,你就必须有完整的生态,有人靠你平台吃饭,还能吃的不错。这种超级应用呢,基本上是等同于操作系统的。

为什么马斯克那么羡慕微信?马斯克当时收购Twitter的时候,他说微信多好啊,大家可以在里边解决所有的事情啊。可以在里边聊天,可以在里边学习,可以在里边看八卦,可以在里边看视频,可以在里边买东西,可以在里边打车,可以在里边借钱,在里边做各种金融理财,都可以干。这是他喜欢微信的地方。这才叫超级应用呢。

贝特正在向这个方向发展啊,但现在还有一些距离。那我们常见有哪些超级应用呢?第一个呢,就是微信啊。QQ其实也算,但是没有微信那么完整的生态。支付宝其实是一个啊,淘宝的没有那么全,淘宝其实也算吧。然后抖音,快手都是完整生态的超级应用啊。滴滴跟美团呢,算bug。国外呢,Facebook工具群可以算一个,就是Facebook,Instagram,WhatsApp啊,Facebook message,把这几个加一块,你可以算一个。谷歌全家桶啊,Gmail啊,谷歌地图呃,Google Calendar,其他的一些,包括像咱们YouTube这种,全家桶你可以算一个。

安卓啊,你应该把这个东西算上。苹果全家桶,可以算一个。大家有没有发现,中国的这个超新应用都是单根一个,而这美国的这些超新应用呢,都是全家桶啊,或者叫工具群。为什么会这样?就是我记得,我当时去天津那个航母公园参观的时候,人家给我讲过,他说你发现这个航母跟咱们平时看的美国航母有什么区别没有?我说上头有好多炮啊,下头还有导弹,啥都有啊,这玩意怎么啊?他说对,他说美国的航母都干干净净的啊,这个上面的甲板是平的,而苏联的航母呢,上头是啥都有,有炮有导弹,还有各种东西都全啊。原因也很简单啊,美国航母呢,都是集群作战,一出去就是一航母战斗群啊,他不需要这些玩意,剩下有什么,驱逐舰巡航舰给他来提供,还有潜艇。俄罗斯呢,没有那么多海军,所以他出去呢,一条航母就出去了,所以他啥事都得自己管。中国的这些超级APP也是这样啊,我一关门啊,你们都不许上我这来啊,数用户都是我的,交易都在我这做,所以它呢,都是单个的,它就只能做一个超级APP。而到美国呢,你比如说Facebook啊,我有Facebook,有Facebook message,有Instagram,有WhatsApp啊,我各司其职,自己去做自己的事,他就可以做一对啊,他们是这么来做的啊。就是大家的玩法不太一样,就是必须要去做超级APP才有可能在AI时代挣到钱啊。那么百度我觉得又会错过这个事情,这是没有任何办法的。现在在AI时代,这是一个新的挑战和机遇。

国内在超级应用(Super App)领域有所建树的,可能还是以字节跳动为代表,其旗下的豆包等产品,作为超级应用(Super App)的典范,实际上已经初具规模。阿里的王坚,提及阿里云的王坚,他不仅是阿里云的创始人之一,也是阿里云的首席科学家。可以预见,未来一定会有新的大公司涌现,如同Open AI这样,原本默默无闻的小公司,可能会迅速成长为行业巨头。在国内,也必将有新的大公司诞生。

实际上,百度、阿里、腾讯,这些互联网时代的巨头,到了移动互联网时代,谁又是真正的领头羊?滴滴、美团、字节跳动,这些公司已经在移动互联网时代崭露头角。而在即将到来的AI时代,一定还会有新的巨头崛起,具体是哪一家,我们拭目以待。同时,也会有一些大公司经历浴火重生。

在互联网向移动互联网的过渡中,百度显然落了下风,而淘宝和微信则成功把握住了这一波机遇。在AI时代,阿里云似乎已经迎头赶上,阿里云投资了国内几乎所有的AI大模型,国内一半的AI算力都在阿里云上运作。因此,在AI领域,阿里云已经占据了领先位置。

AI对于大企业来说,相对友好,因为这需要大量的资金、算力、数据和计算中心,这些都是小企业难以承担的。然而,大企业拥抱AI也并非易事,因为这可能会打破原有的管理结构,大企业往往存在路径依赖。王坚曾说过一句引人深思的话,他认为在AI和GC时代,核心其实是人,而不是AI技术本身。这句话值得我们细细品味。

而大公司与小公司面对AI,确实持有不同的看法。大公司视AI为工具的革命,而小公司则认为AI是革命的工具,这二者之间存在巨大的差异。大家可以思考一下,话到底是怎么讲的。那么,关于人工智能呢?它拥有一个非常长的过去,但却只有非常短的历史。这是王坚的原话,意思是什么呢?就是我们可能从100年前就开始谈论人工智能,但是我们现在这一波人工智能,是从XGPT发布以后才真正开始的。因此,人工智能的历史实际上是非常短暂的。

接着,王坚提到了三个不等式,这三个不等式很好地概括了中国AI发展的现状。第一个不等式是什么呢?就是与基础模型相比,应用做得还不够好。你可以说中国有没有像GPT这样的模型?没有。中国有没有像Gemini那样的模型?也没有。更没有VLOG。那么,你可能会问,中国为什么就做不出好模型来呢?这确实是一个问题,但是,你的应用是否真的需要这些好模型呢?所以,不要总是抱怨中国的模型不好。实际上,中国的应用做得也不够好,但中国的应用已经算是全世界做得最好的之一了。与美国的AI应用相比,我觉得中国的做得还是要好很多的。但是,所有的AI应用对于大模型的各种能力的发挥,其实都是比较有限的。因此,现在的大模型其实已经够用了。你别看我们赶不上Open AI,但是我们的模型已经够用。

第二个不等式呢,有人在讲,和现有的算力相比,你老说美国幸运,我们没有算力了怎么办?显卡不够了怎么办?基础模型做得还不够好?这个问题与第二个不等式有关。什么意思呢?你说我缺算力,催显卡吧。然而,这并不是问题的全部。我们应当关注的,不仅仅是算力的差距,还有如何更高效、更智能地利用现有的资源。这是中国AI发展需要思考的问题之一。

就是,以咱们现在做的这些模型,咱们现在大部分模型,实际上就是几十亿啊,就是几百亿参数,这种模型,在现在咱们的这些显卡上已经足够了。你再给我更多显卡,我都用不上了。对吧,咱们现在是这样的一个情况,咱不缺显卡,咱们是模型不够好,这个也是大家觉得比较奇怪的地方。所以,中国从来不缺显卡,这是第二个不等式。第三个不等式是什么?以现有的电力相比,算力还不够。原来都说,AIHTC最后是拼的是电对,现在讲了,说咱们电有的是,咱压根就没有那么多显卡,所以也不需要花烧那么多电,要烧电的时候是以后的事了。所以他这三个不等式呢,我觉得是讲的非常到位啊。重复一下,跟基础模型相比,应用做的还不够好;和现有的算力比起来,基础模型做的还不够好;跟现有的电力比起来,算力也还不够啊。它的意思是什么呢?就是现在的能源咱们足够使,十年后的算力和电力,与现在肯定完完全是两个概念。不要用现在的现状,去思考如何解决10年后的问题啊。想的非常好,就是啊,王坚讲的。然后呢,我总结一下啊,中国现在的AI大模型,到底发展到什么状态?第一个呢,是方向是明确的啊,咱们就是需要有人指明方向,老大喜欢指明方向,这个也确实是中国民族性,没有人指明方向呢,咱们就做不出东西来。现在呢,真正救了中国AI的是谁?是梅坦,阿玛一喇嘛2,喇嘛3,这三个大模型的发布,绝对是让中国的大模型彻底走出来了。在喇嘛系列没有发布之前,比如像百度的文心妍是拿什么做的呢?

它是原来的 GBT2,是开源的。拿那个东西,再加上 GPT3.5 生成的各种数据,去训练,淘出来的。但是到拉玛系列出来以后,名义万物啊,通 1,000 分啊,等等,大量的这种模型就出来了。你不需要去抄它的模型,但是呢,啊,它把所有的参数,一些代码都公开了。我们就可以自己去训练。中国聪明人还是很多的,呃,方向只要明确了,我们就可以走通。我们从来都不缺乏跟随者,只要有人知道这条路是通的,就可以往前走。那么下一个问题是什么呢?就是刚才王坚讲的,说我们模型不够好吧,我们的算力也不需要太多算力不够吧,也不需要太多电。那么呢,我们就要想下一个问题,叫 scaling low 到底在这管不管用。什么意思呢?就是这种模型越大效果越好,这样的这种规模法则,在中国到底管用不?因为美国人呢,现在已经开始担心 scaling low 是不是会失效。因为现到目前为止还是你继续堆参数,继续堆机器,你还是可以做出更好的模型来。现在依然是有效的,但是一旦哪天无效了怎么办?因为这个涨上去的过程,是人自己搞不清楚到底怎么涨上去的。这个事是美国人现在最担心的。但是中国的大模型,都是千亿以内的模型,就是我们看到比较大的,比如通 1,000 问 72B 啊,72B 就是 720 亿参数的,这种模型其实足够大家用。这种 72B 的模型,加上 AIGC 的这种 AI gent,就是叫做 AI 智能体的帮助,已经可以解决绝大部分问题了。你就算是到比如说几千亿。不过,这个话题我们今天就先聊到这里,下次有机会再继续探讨。

甚至上万亿参数的这种模型,它的表现能力其实未必比千万三72B好多少。而且,现在的Lama三70币,包括谷歌最新出的GMA227币,微软出的F 34币,效果都很好。为什么需要那么大的模型啊?中国人说我们就实用主义,我们就这么使了。国内也不是没有千亿以上的啊,比如通信千份是出国110亿,也就是1,100亿的参数。还有一些做moe的这种逃课的玩法,逃课什么意思?就是作弊嘛,就是它号称是所有加在一起有1,000多亿,但是呢,它是moe的啊,就是每一次可能只调用其中两个,所以就是这每一次工作的可能,也就是只有二三百亿,三四百亿这样的一个参数水平在工作。所以呢,在中国,压根就轮不到讨论这个scaling low的,这个事情我们等美国摸明白了,接着往前走,一定是这样。

那么,我们在多模态识别图像跟语音识别,中国本身是具有数据优势,因为我们存了大量的图片,存了大量的语音,而且这些东西都已经做过了详细的标注。在这块上我们其实不比他们差。当Lama 3这样的基础模型能力提升的时候,我们现在做的图片识别,语音识别相关的这种大模型呢,能力自然也就上升了。所以我们现在好多的这种模型是什么?图片识别的,这种模型是在Lama 3的基础上进行微调,把这图像识别的部分调进去,这样效果还是可以的。我前面讲了一期视频,说斯坦福大学学生抄咱们清华的一个项目,也就是用拉玛三微调的图像识别,他们抄完以后,号称是自己做的。

现在,这个领域缺乏具体的应用场景,因此,对于多模态识别本身的要求,并没有那么高。在多媒体生成方面,首先,“Stability Fiction”已经表现得相当出色,我们目前在大规模应用上,国内多采用他们家的图像生成技术。在语音生成这一块,实际上,中国在此领域一直表现不俗,在GPT出现之前,国内已经研发出了许多高质量的语音生成模型。至于音乐生成,现在也有人在探索,类似于“Sora”这样的世界模型,经过大半年的积累,国内也开始涌现出相关产品,如快手推出的“快龄”等,效果尚可。

端到端的模型,虽听说一些车厂正在研发,但目前尚未见到实际成果。在政府和企业应用方面,或者说是政府企业对AI的拥抱,从目前的情况看,中国在国际上处于较为领先的地位,因为有大量项目正在推进。自媒体平台上,氛围同样热烈,诸如李易洲这样的人物,被誉为“中国AI第一人”,四处开设课程,因此,自媒体领域使用AI的人数众多,加之中国自媒体市场火爆,AIGC生成的内容,对于从事自媒体工作的人来说,是一个极大的助力。

所有AI功能在中国,最先被应用的场景,就是刷抖音和刷小红书,生成小红书爆款内容,生成抖音文案,这些是国内较为普遍使用的AI功能。中国的AI市场,正处于爆发的边缘,应用创新是我们所擅长的。比如,与Open AI竞争新的模型,我们并不擅长,我们更习惯于等待他们研发出来后,再沿着他们的方向努力,这是我们熟悉的路径。然而,如何让应用更加好用,提升用户体验,是我们需要思考和探索的方向。

中国人还是很厉害的。巴马3,000文2已经把这个基础模型的能力拉上来了。我们现在拿千文2,拿拉玛3这样的模型,去做这种应用的话,效果其实已经非常好了啊。基础模型的能力够了以后呢,就差赚钱了啊。咱不干别的,咱就赚钱就行了。而赚钱这个事呢,中国人是最熟练的啊。我记得以前我们做游戏的时候,人家讲说,你看全世界各国开发的游戏,差别在什么地方?他说欧洲人做的游戏好玩啊,我说这我承认啊。他说美国人的游戏呢,相对均衡啊,我说这个也承认吧,移民国家嘛,哪人都有。而日本人的游戏和韩国人的游戏好看,我说也行,他们呢有这个动漫的底子嘛,所以他们的游戏好看。我说那中国游戏呢啊,他说中国游戏挣钱啊。这就是全世界四大游戏游戏派别啊,中国游戏最挣钱啊。咱们在什么地方设收费点,怎么去让大家上瘾,怎么能够把钱掏出来,这件事中国人是最全的。

现在呢,中国也在努力的把中国的AI应用呢,推到全球去啊,也是要去做,出海全球。为什么呢?就是啊出去了以后,你就可以用叉h p t的这种海外模型了。而且呢到了海外,中国团队就又能够起飞了。这事儿是怎么讲的?因为AI这种东西啊,它有一个很大的问题是什么?就是它在国内面临了巨大的,叫审核成本。国内呢对版权要求不高啊,但是对合规,对审核要求很高。出了国以后正好反过来啊,人家对版权要求很高,对于合规来说要求比较低。说说错了,没什么太大关系啊,处罚有啊,不是特别严重。那么,接下来我们就可以看到,中国AI在海外的市场空间将会非常广阔,因为我们可以更加自由地去创新,去探索,而不用担心过多的合规成本。

以 AI 这种时不常的张嘴胡说八道,这个状态来说的话,这种东西送到国外去,效果一定是最好的啊。因为我们当年投过 music 啊,也是中国团队到国外去做的这种产品,也就是现在 TikTok 啊。现在我知道 music 的团队啊,就是已经离开了,字节跳动离开了,呃 TikTok 他们现在又在开始努力,用这些大模型,准备在海外做项目去了。所以,AIGC 可能真的是最适合出海的,而且在这一块的话,绝对产能过剩。你想,互联网公司离职了多少人啊,有多少 35 岁以上的朋友,毕业了,走向了社会,他们现在如果手里还有点钱的话,就会努力的用 AI 做一些应用去劝国外,这个是真正大家要去干的事情。

然后,内容创作就是未来的方向啊,最大的短视频内容生态就在咱们手里,top 生态抖音快手都在努力工作。现在抖音的很多工具,包括我现在每天在用的剪映,已经涨价了,原来一年大概是 100 多块钱 200 块钱,现在已经涨到一年 500 块钱了。为什么?就是把大量的 AI 功能都塞到剪映里边去了。啊,你们今天早上看的那个视频里头,字幕是有重点突出的啊,普通的字是白字,重点是黄字啊,还变大一点。这个就是剪映的 AI 干的活,干得还可以。现在的点映出字幕,还可以做一个什么事呢?他还可以把呃口语啊,一些哼哼哈哈的词直接给你去掉,对吧,他不出现在字幕里,这不也都是 AI 干的活吗?啊都已经做起来了是吧。

人形机器人这一块呢,啊中国现在发展的也非常快速,在这一次上海的 WAIC 上啊。

在世界AI聚会上,展出了可能几十台人形机器人,各种各样的,包括擎天柱二代都来了。甚至有一些公司,比如说斯碧池还是谁,他们现在已经跟一汽还是上汽签了协议,说我们的机器人已经要去打螺丝了。当然,这个消息公布以后,这个公司的港股马上暴跌了6%,还是暴跌了百分之多少,这也是比较诡异的现象吧,妖孽横生的一个时代,怎么办呢?

但是,做机器人那件事,特别是你想快速迭代开发机器人,那件事情,全世界必须在中国做,没有其他地方可以做。我记得原来在深圳有一个是蛇口一个地区,就是各种各样国家的人,在那个地方做硬件创新,为什么?因为所有的原配件都在那周围,周围全的一塌糊涂。后边呢,搞兼容机器人,因为马斯克搞这个,呃擎天柱就是兼容机器,兼容兼容机器人,什么意思?就是我把标准定好了,中间的零件是可以换的。你一旦兼容机器人了,中国华强北就有的是东西可以提上去,对吧。硬件生产的部分,中国肯定是遥遥领先,没准在机器人时代,我们会再出一家像大疆那样的公司,我觉得完完全全可以期待。

阿梅怎么说呢,中国人从自古以来,就是知其然而不知其所以然,我们从古只有鸡兔同笼,没有方程,只有算术,没有数学,这样的一个民族,遇到了自己都解释不清楚怎么来的LMM,遇到了AIGC的时候,这玩意简直是天生为我们打造的,里边这个原理反正你们也搞不清楚,我们也搞不清楚,那咱就猛着上呗,玩工匠精神这事很适合卷嘛。

一定是最适合咱们的啊。所以呢,最后我们还是讲一下王坚这句话啊:“不是工具的革命,而是革命的工具,这是我们对AI最大的预期。不要让AI这样高能的工具成为政府统治的工具吧。越是大的公司,越是政府,他们只能得到啊——工具的革命,是得不到革命的工具的。而只有个人和小公司,小团队才能得到革命的工具。就像很多国家,他们在工业革命以后,为什么这些贵族,这些政府搞不定这件事情?因为,对于他们来说,枪炮和机器都是工具的革命啊。只有对于这些新兴的阶层来说,这才是革命的工具啊。”所以我说,王坚这句话讲得非常好啊。这就是我们今天要讲的第二个故事,就是中国的AI现在发展的什么状态。

 

Both comments and pings are currently closed.

Comments are closed.

Close Bitnami banner
Bitnami