在上海人工智能大会上百度李彦宏与阿里王坚等专家都针对AI说了些什么?中国AI新机遇与超级应用的挑战
7 月 10
AIGC AIGC, AIGC应用, AI大模型, AI工具, AI技术, AI时代, AI时代盈利, AI革命, CEO, Facebook, Instagram, Open AI, OpenAI模型, QQ, TikTok, WhatsApp, 上海人工智能大会, 严弘, 中国AI市场, 中国市场, 人工智能, 人形机器人, 内容创作, 出海, 合规成本, 商业模式, 图像识别, 基础模型, 大企业, 字节跳动, 安卓, 小企业, 工具革命, 广大用户, 开发者, 微信, 思维定势, 抖音, 持续创新, 提示词工程师, 支付宝, 收入低, 数据标注师, 新兴职业, 新创职业, 智能体, 李彦宏, 海外市场, 淘宝, 熊猫博士, 猎豹移动, 王坚, 生态构建, 生态系统, 用户体验, 用户使用时长, 用户粘性, 用户群体, 电商, 百度, 百度地图, 百度搜索, 百度文心, 百度网盘, 百度贴吧, 盈利模式, 短视频, 移动时代, 算力, 经济前景, 职业变化, 职业消失, 自媒体市场, 苹果, 视频生成, 词语生成, 语音识别, 谷歌全家桶, 超级应用, 超级应用生态, 辅助驾驶, 逻辑思维, 金融支付, 门槛, 阿里, 阿里云, 阿里云王坚 在上海人工智能大会上百度李彦宏与阿里王坚等专家都针对AI说了些什么?中国AI新机遇与超级应用的挑战已关闭评论
在上海人工智能大会上,我们目睹了中国AI发展的新高度。今天,我们将引用两位业界大佬的讲话,并附上一些个人见解。首先,李彦宏提到,无需担忧AI会夺走人类的工作,当前的AI技术,如百度的“文心”,更多地扮演着辅助角色,如辅助驾驶,而非完全取代人力。他指出,尽管某些职业可能会消失,但新兴职业,如数据标注师和提示词工程师,将应运而生。这些职业虽然门槛不高,但对逻辑思维有较高要求。然而,值得注意的是,消失的职业数量远不及新创职业,且“门槛不高”往往意味着收入也相对较低。
接着,严弘提出了避免陷入“超级应用陷阱”的观点。他解释道,移动时代的思维定势认为,超级应用是关键,但在AI时代,那些具有强大功能的应用,即便用户量不及10亿日活跃用户(DAU),也可能对产业和应用场景产生更大的价值。严弘的这一观点,或许反映了百度在超级应用领域的局限性,正如俗语所说,“吃不到葡萄说葡萄酸”。李彦宏强调,AI时代的核心仍旧是搜索,这是百度的强项。然而,百度自身从未成功打造出超级应用,这一直是其心中的痛。在AI时代,百度虽有雄心,但若无法突破超级应用的瓶颈,其盈利前景将受到限制。
总的来说,中国AI的发展正迎来新的挑战和机遇,而如何在AI时代找到自己的定位,对于企业来说至关重要。
Open AI虽未打造出超级应用,其盈利模式因此受到挑战。百度近期的讨论聚焦于超级应用的概念,试图解答为何缺少超级应用会影响盈利。百度旗下应用如百度搜索、百度网盘、百度地图及百度贴吧,用户基数庞大,但它们能否称为超级应用仍存疑。同样,Open AI的Chat CPT等应用虽广受欢迎,也未达到超级应用的标准。
超级应用的定义应涵盖以下要素:首先,需拥有庞大的用户群体,例如猎豹移动曾达到1.5亿日活跃用户和6亿月活跃用户,但即便如此,它仍未跻身超级应用之列。原因在于,巨大的用户量仅是必要条件之一,还需考量其他因素。
其次,超级应用应具备长时间的用户使用时长。用户在应用中停留时间越长,应用的吸引力和粘性越大。以百度的应用为例,其用户使用时长与微信、抖音等相比明显不足,这成为其未能成为超级应用的关键因素之一。
此外,完整的生态系统是超级应用的另一重要特征。用户在应用中不仅停留时间长,还能进行多样化的互动和交易,形成闭环生态。例如,微信不仅提供即时通讯服务,还集成了支付、游戏、小程序等多种功能,构建了一个自给自足的生态体系。
综上所述,超级应用的定义不仅限于用户量,更在于用户使用时长和生态系统的完整性。这为Open AI和百度等科技公司提供了新的思考方向,即如何在提升用户量的同时,增加用户粘性和构建生态体系,以实现超级应用的突破。
这个里边要有内容提供者,要有内容消费者。里头可能还有很多其他的,比如说有交易啊,有借贷,有很多的金融生态。你要有完整生态在里头。这是百度的应用,从来没有做到过。百度自己也惦记做电商,还惦记去做这外卖,还惦记去做金融支付,但都没做起来。你要想做超级应用,你就必须有完整的生态,有人靠你平台吃饭,还能吃的不错。这种超级应用呢,基本上是等同于操作系统的。
为什么马斯克那么羡慕微信?马斯克当时收购Twitter的时候,他说微信多好啊,大家可以在里边解决所有的事情啊。可以在里边聊天,可以在里边学习,可以在里边看八卦,可以在里边看视频,可以在里边买东西,可以在里边打车,可以在里边借钱,在里边做各种金融理财,都可以干。这是他喜欢微信的地方。这才叫超级应用呢。
贝特正在向这个方向发展啊,但现在还有一些距离。那我们常见有哪些超级应用呢?第一个呢,就是微信啊。QQ其实也算,但是没有微信那么完整的生态。支付宝其实是一个啊,淘宝的没有那么全,淘宝其实也算吧。然后抖音,快手都是完整生态的超级应用啊。滴滴跟美团呢,算bug。国外呢,Facebook工具群可以算一个,就是Facebook,Instagram,WhatsApp啊,Facebook message,把这几个加一块,你可以算一个。谷歌全家桶啊,Gmail啊,谷歌地图呃,Google Calendar,其他的一些,包括像咱们YouTube这种,全家桶你可以算一个。
安卓啊,你应该把这个东西算上。苹果全家桶,可以算一个。大家有没有发现,中国的这个超新应用都是单根一个,而这美国的这些超新应用呢,都是全家桶啊,或者叫工具群。为什么会这样?就是我记得,我当时去天津那个航母公园参观的时候,人家给我讲过,他说你发现这个航母跟咱们平时看的美国航母有什么区别没有?我说上头有好多炮啊,下头还有导弹,啥都有啊,这玩意怎么啊?他说对,他说美国的航母都干干净净的啊,这个上面的甲板是平的,而苏联的航母呢,上头是啥都有,有炮有导弹,还有各种东西都全啊。原因也很简单啊,美国航母呢,都是集群作战,一出去就是一航母战斗群啊,他不需要这些玩意,剩下有什么,驱逐舰巡航舰给他来提供,还有潜艇。俄罗斯呢,没有那么多海军,所以他出去呢,一条航母就出去了,所以他啥事都得自己管。中国的这些超级APP也是这样啊,我一关门啊,你们都不许上我这来啊,数用户都是我的,交易都在我这做,所以它呢,都是单个的,它就只能做一个超级APP。而到美国呢,你比如说Facebook啊,我有Facebook,有Facebook message,有Instagram,有WhatsApp啊,我各司其职,自己去做自己的事,他就可以做一对啊,他们是这么来做的啊。就是大家的玩法不太一样,就是必须要去做超级APP才有可能在AI时代挣到钱啊。那么百度我觉得又会错过这个事情,这是没有任何办法的。现在在AI时代,这是一个新的挑战和机遇。
国内在超级应用(Super App)领域有所建树的,可能还是以字节跳动为代表,其旗下的豆包等产品,作为超级应用(Super App)的典范,实际上已经初具规模。阿里的王坚,提及阿里云的王坚,他不仅是阿里云的创始人之一,也是阿里云的首席科学家。可以预见,未来一定会有新的大公司涌现,如同Open AI这样,原本默默无闻的小公司,可能会迅速成长为行业巨头。在国内,也必将有新的大公司诞生。
实际上,百度、阿里、腾讯,这些互联网时代的巨头,到了移动互联网时代,谁又是真正的领头羊?滴滴、美团、字节跳动,这些公司已经在移动互联网时代崭露头角。而在即将到来的AI时代,一定还会有新的巨头崛起,具体是哪一家,我们拭目以待。同时,也会有一些大公司经历浴火重生。
在互联网向移动互联网的过渡中,百度显然落了下风,而淘宝和微信则成功把握住了这一波机遇。在AI时代,阿里云似乎已经迎头赶上,阿里云投资了国内几乎所有的AI大模型,国内一半的AI算力都在阿里云上运作。因此,在AI领域,阿里云已经占据了领先位置。
AI对于大企业来说,相对友好,因为这需要大量的资金、算力、数据和计算中心,这些都是小企业难以承担的。然而,大企业拥抱AI也并非易事,因为这可能会打破原有的管理结构,大企业往往存在路径依赖。王坚曾说过一句引人深思的话,他认为在AI和GC时代,核心其实是人,而不是AI技术本身。这句话值得我们细细品味。
而大公司与小公司面对AI,确实持有不同的看法。大公司视AI为工具的革命,而小公司则认为AI是革命的工具,这二者之间存在巨大的差异。大家可以思考一下,话到底是怎么讲的。那么,关于人工智能呢?它拥有一个非常长的过去,但却只有非常短的历史。这是王坚的原话,意思是什么呢?就是我们可能从100年前就开始谈论人工智能,但是我们现在这一波人工智能,是从XGPT发布以后才真正开始的。因此,人工智能的历史实际上是非常短暂的。
接着,王坚提到了三个不等式,这三个不等式很好地概括了中国AI发展的现状。第一个不等式是什么呢?就是与基础模型相比,应用做得还不够好。你可以说中国有没有像GPT这样的模型?没有。中国有没有像Gemini那样的模型?也没有。更没有VLOG。那么,你可能会问,中国为什么就做不出好模型来呢?这确实是一个问题,但是,你的应用是否真的需要这些好模型呢?所以,不要总是抱怨中国的模型不好。实际上,中国的应用做得也不够好,但中国的应用已经算是全世界做得最好的之一了。与美国的AI应用相比,我觉得中国的做得还是要好很多的。但是,所有的AI应用对于大模型的各种能力的发挥,其实都是比较有限的。因此,现在的大模型其实已经够用了。你别看我们赶不上Open AI,但是我们的模型已经够用。
第二个不等式呢,有人在讲,和现有的算力相比,你老说美国幸运,我们没有算力了怎么办?显卡不够了怎么办?基础模型做得还不够好?这个问题与第二个不等式有关。什么意思呢?你说我缺算力,催显卡吧。然而,这并不是问题的全部。我们应当关注的,不仅仅是算力的差距,还有如何更高效、更智能地利用现有的资源。这是中国AI发展需要思考的问题之一。
就是,以咱们现在做的这些模型,咱们现在大部分模型,实际上就是几十亿啊,就是几百亿参数,这种模型,在现在咱们的这些显卡上已经足够了。你再给我更多显卡,我都用不上了。对吧,咱们现在是这样的一个情况,咱不缺显卡,咱们是模型不够好,这个也是大家觉得比较奇怪的地方。所以,中国从来不缺显卡,这是第二个不等式。第三个不等式是什么?以现有的电力相比,算力还不够。原来都说,AIHTC最后是拼的是电对,现在讲了,说咱们电有的是,咱压根就没有那么多显卡,所以也不需要花烧那么多电,要烧电的时候是以后的事了。所以他这三个不等式呢,我觉得是讲的非常到位啊。重复一下,跟基础模型相比,应用做的还不够好;和现有的算力比起来,基础模型做的还不够好;跟现有的电力比起来,算力也还不够啊。它的意思是什么呢?就是现在的能源咱们足够使,十年后的算力和电力,与现在肯定完完全是两个概念。不要用现在的现状,去思考如何解决10年后的问题啊。想的非常好,就是啊,王坚讲的。然后呢,我总结一下啊,中国现在的AI大模型,到底发展到什么状态?第一个呢,是方向是明确的啊,咱们就是需要有人指明方向,老大喜欢指明方向,这个也确实是中国民族性,没有人指明方向呢,咱们就做不出东西来。现在呢,真正救了中国AI的是谁?是梅坦,阿玛一喇嘛2,喇嘛3,这三个大模型的发布,绝对是让中国的大模型彻底走出来了。在喇嘛系列没有发布之前,比如像百度的文心妍是拿什么做的呢?
它是原来的 GBT2,是开源的。拿那个东西,再加上 GPT3.5 生成的各种数据,去训练,淘出来的。但是到拉玛系列出来以后,名义万物啊,通 1,000 分啊,等等,大量的这种模型就出来了。你不需要去抄它的模型,但是呢,啊,它把所有的参数,一些代码都公开了。我们就可以自己去训练。中国聪明人还是很多的,呃,方向只要明确了,我们就可以走通。我们从来都不缺乏跟随者,只要有人知道这条路是通的,就可以往前走。那么下一个问题是什么呢?就是刚才王坚讲的,说我们模型不够好吧,我们的算力也不需要太多算力不够吧,也不需要太多电。那么呢,我们就要想下一个问题,叫 scaling low 到底在这管不管用。什么意思呢?就是这种模型越大效果越好,这样的这种规模法则,在中国到底管用不?因为美国人呢,现在已经开始担心 scaling low 是不是会失效。因为现到目前为止还是你继续堆参数,继续堆机器,你还是可以做出更好的模型来。现在依然是有效的,但是一旦哪天无效了怎么办?因为这个涨上去的过程,是人自己搞不清楚到底怎么涨上去的。这个事是美国人现在最担心的。但是中国的大模型,都是千亿以内的模型,就是我们看到比较大的,比如通 1,000 问 72B 啊,72B 就是 720 亿参数的,这种模型其实足够大家用。这种 72B 的模型,加上 AIGC 的这种 AI gent,就是叫做 AI 智能体的帮助,已经可以解决绝大部分问题了。你就算是到比如说几千亿。不过,这个话题我们今天就先聊到这里,下次有机会再继续探讨。
甚至上万亿参数的这种模型,它的表现能力其实未必比千万三72B好多少。而且,现在的Lama三70币,包括谷歌最新出的GMA227币,微软出的F 34币,效果都很好。为什么需要那么大的模型啊?中国人说我们就实用主义,我们就这么使了。国内也不是没有千亿以上的啊,比如通信千份是出国110亿,也就是1,100亿的参数。还有一些做moe的这种逃课的玩法,逃课什么意思?就是作弊嘛,就是它号称是所有加在一起有1,000多亿,但是呢,它是moe的啊,就是每一次可能只调用其中两个,所以就是这每一次工作的可能,也就是只有二三百亿,三四百亿这样的一个参数水平在工作。所以呢,在中国,压根就轮不到讨论这个scaling low的,这个事情我们等美国摸明白了,接着往前走,一定是这样。
那么,我们在多模态识别图像跟语音识别,中国本身是具有数据优势,因为我们存了大量的图片,存了大量的语音,而且这些东西都已经做过了详细的标注。在这块上我们其实不比他们差。当Lama 3这样的基础模型能力提升的时候,我们现在做的图片识别,语音识别相关的这种大模型呢,能力自然也就上升了。所以我们现在好多的这种模型是什么?图片识别的,这种模型是在Lama 3的基础上进行微调,把这图像识别的部分调进去,这样效果还是可以的。我前面讲了一期视频,说斯坦福大学学生抄咱们清华的一个项目,也就是用拉玛三微调的图像识别,他们抄完以后,号称是自己做的。
现在,这个领域缺乏具体的应用场景,因此,对于多模态识别本身的要求,并没有那么高。在多媒体生成方面,首先,“Stability Fiction”已经表现得相当出色,我们目前在大规模应用上,国内多采用他们家的图像生成技术。在语音生成这一块,实际上,中国在此领域一直表现不俗,在GPT出现之前,国内已经研发出了许多高质量的语音生成模型。至于音乐生成,现在也有人在探索,类似于“Sora”这样的世界模型,经过大半年的积累,国内也开始涌现出相关产品,如快手推出的“快龄”等,效果尚可。
端到端的模型,虽听说一些车厂正在研发,但目前尚未见到实际成果。在政府和企业应用方面,或者说是政府企业对AI的拥抱,从目前的情况看,中国在国际上处于较为领先的地位,因为有大量项目正在推进。自媒体平台上,氛围同样热烈,诸如李易洲这样的人物,被誉为“中国AI第一人”,四处开设课程,因此,自媒体领域使用AI的人数众多,加之中国自媒体市场火爆,AIGC生成的内容,对于从事自媒体工作的人来说,是一个极大的助力。
所有AI功能在中国,最先被应用的场景,就是刷抖音和刷小红书,生成小红书爆款内容,生成抖音文案,这些是国内较为普遍使用的AI功能。中国的AI市场,正处于爆发的边缘,应用创新是我们所擅长的。比如,与Open AI竞争新的模型,我们并不擅长,我们更习惯于等待他们研发出来后,再沿着他们的方向努力,这是我们熟悉的路径。然而,如何让应用更加好用,提升用户体验,是我们需要思考和探索的方向。
中国人还是很厉害的。巴马3,000文2已经把这个基础模型的能力拉上来了。我们现在拿千文2,拿拉玛3这样的模型,去做这种应用的话,效果其实已经非常好了啊。基础模型的能力够了以后呢,就差赚钱了啊。咱不干别的,咱就赚钱就行了。而赚钱这个事呢,中国人是最熟练的啊。我记得以前我们做游戏的时候,人家讲说,你看全世界各国开发的游戏,差别在什么地方?他说欧洲人做的游戏好玩啊,我说这我承认啊。他说美国人的游戏呢,相对均衡啊,我说这个也承认吧,移民国家嘛,哪人都有。而日本人的游戏和韩国人的游戏好看,我说也行,他们呢有这个动漫的底子嘛,所以他们的游戏好看。我说那中国游戏呢啊,他说中国游戏挣钱啊。这就是全世界四大游戏游戏派别啊,中国游戏最挣钱啊。咱们在什么地方设收费点,怎么去让大家上瘾,怎么能够把钱掏出来,这件事中国人是最全的。
现在呢,中国也在努力的把中国的AI应用呢,推到全球去啊,也是要去做,出海全球。为什么呢?就是啊出去了以后,你就可以用叉h p t的这种海外模型了。而且呢到了海外,中国团队就又能够起飞了。这事儿是怎么讲的?因为AI这种东西啊,它有一个很大的问题是什么?就是它在国内面临了巨大的,叫审核成本。国内呢对版权要求不高啊,但是对合规,对审核要求很高。出了国以后正好反过来啊,人家对版权要求很高,对于合规来说要求比较低。说说错了,没什么太大关系啊,处罚有啊,不是特别严重。那么,接下来我们就可以看到,中国AI在海外的市场空间将会非常广阔,因为我们可以更加自由地去创新,去探索,而不用担心过多的合规成本。
以 AI 这种时不常的张嘴胡说八道,这个状态来说的话,这种东西送到国外去,效果一定是最好的啊。因为我们当年投过 music 啊,也是中国团队到国外去做的这种产品,也就是现在 TikTok 啊。现在我知道 music 的团队啊,就是已经离开了,字节跳动离开了,呃 TikTok 他们现在又在开始努力,用这些大模型,准备在海外做项目去了。所以,AIGC 可能真的是最适合出海的,而且在这一块的话,绝对产能过剩。你想,互联网公司离职了多少人啊,有多少 35 岁以上的朋友,毕业了,走向了社会,他们现在如果手里还有点钱的话,就会努力的用 AI 做一些应用去劝国外,这个是真正大家要去干的事情。
然后,内容创作就是未来的方向啊,最大的短视频内容生态就在咱们手里,top 生态抖音快手都在努力工作。现在抖音的很多工具,包括我现在每天在用的剪映,已经涨价了,原来一年大概是 100 多块钱 200 块钱,现在已经涨到一年 500 块钱了。为什么?就是把大量的 AI 功能都塞到剪映里边去了。啊,你们今天早上看的那个视频里头,字幕是有重点突出的啊,普通的字是白字,重点是黄字啊,还变大一点。这个就是剪映的 AI 干的活,干得还可以。现在的点映出字幕,还可以做一个什么事呢?他还可以把呃口语啊,一些哼哼哈哈的词直接给你去掉,对吧,他不出现在字幕里,这不也都是 AI 干的活吗?啊都已经做起来了是吧。
人形机器人这一块呢,啊中国现在发展的也非常快速,在这一次上海的 WAIC 上啊。
在世界AI聚会上,展出了可能几十台人形机器人,各种各样的,包括擎天柱二代都来了。甚至有一些公司,比如说斯碧池还是谁,他们现在已经跟一汽还是上汽签了协议,说我们的机器人已经要去打螺丝了。当然,这个消息公布以后,这个公司的港股马上暴跌了6%,还是暴跌了百分之多少,这也是比较诡异的现象吧,妖孽横生的一个时代,怎么办呢?
但是,做机器人那件事,特别是你想快速迭代开发机器人,那件事情,全世界必须在中国做,没有其他地方可以做。我记得原来在深圳有一个是蛇口一个地区,就是各种各样国家的人,在那个地方做硬件创新,为什么?因为所有的原配件都在那周围,周围全的一塌糊涂。后边呢,搞兼容机器人,因为马斯克搞这个,呃擎天柱就是兼容机器,兼容兼容机器人,什么意思?就是我把标准定好了,中间的零件是可以换的。你一旦兼容机器人了,中国华强北就有的是东西可以提上去,对吧。硬件生产的部分,中国肯定是遥遥领先,没准在机器人时代,我们会再出一家像大疆那样的公司,我觉得完完全全可以期待。
阿梅怎么说呢,中国人从自古以来,就是知其然而不知其所以然,我们从古只有鸡兔同笼,没有方程,只有算术,没有数学,这样的一个民族,遇到了自己都解释不清楚怎么来的LMM,遇到了AIGC的时候,这玩意简直是天生为我们打造的,里边这个原理反正你们也搞不清楚,我们也搞不清楚,那咱就猛着上呗,玩工匠精神这事很适合卷嘛。
一定是最适合咱们的啊。所以呢,最后我们还是讲一下王坚这句话啊:“不是工具的革命,而是革命的工具,这是我们对AI最大的预期。不要让AI这样高能的工具成为政府统治的工具吧。越是大的公司,越是政府,他们只能得到啊——工具的革命,是得不到革命的工具的。而只有个人和小公司,小团队才能得到革命的工具。就像很多国家,他们在工业革命以后,为什么这些贵族,这些政府搞不定这件事情?因为,对于他们来说,枪炮和机器都是工具的革命啊。只有对于这些新兴的阶层来说,这才是革命的工具啊。”所以我说,王坚这句话讲得非常好啊。这就是我们今天要讲的第二个故事,就是中国的AI现在发展的什么状态。