硕鼠的博客站

范路的博客主站,时而会发些东西。

扎克伯格跟黄仁勋凑一块,除了换皮衣,还讲了点什么呢?他们是在SIGGRAPH大会上进行的访谈。黄仁勋是访谈主持人,而扎克伯格是被邀请的嘉宾。因此,在他们的访谈中,扎克伯格是逗哏的,黄仁勋是捧哏的,这一点首先要搞清楚。

这一次访谈,主要是扎克伯格在输出。SIGGRAPH大会是一个历史非常悠久的大会,叫计算机图形图像特别兴趣小组(Special Interest Group on Computer Graphics),小组成立于1967年,1974年第一次开会。今年是第50届,参会的人中有90%都是博士。当我看到这个消息时,一开始想,黄仁勋应该是个博士吧?扎克伯格是中途退学的。后来查了一下,发现并不是。黄仁勋是硕士,而扎克伯格是2002年入学于哈佛的心理学和计算机科学专业,2004年辍学,实际上上了两年学,之后在2017年被哈佛授予了荣誉法学博士学位。他好像跟某位伟人的学位差不多。

正常来参加这种活动的人,主要是引擎公司,比如Unreal、Unity,图形软件的公司Photoshop、Adobe,以及显卡公司AMD、英伟达。原来Meta也参加过,大概参加了有十几年了,他们以前是作为VR、AR公司来参加的。这一次则是出来抢AI的。

老黄跟扎克伯格算是天作之合,为什么呢?因为只有开源模型,才是英伟达显卡的绝配。

那你说微软不也买了好,OpenAI也在用,对吧?但是呢,大厂的必元模型啊,它是有能力去招聘一帮叫适配工程师或者叫配置工程师。他们可以绕过扩大算法这个事,是可以跑的。增加的这点成本对于他们来说是可以去承担的。只有开源模型的应用者,通常是支付不起这些配置工程师的工资的,所以他们会老老实实地使用英伟达的显卡,是吧?所以他们俩绝对是天作之合。

扎克伯格自己访谈的资格,也是因为买了足够多的H100才换来的。他是号称拥有60万块H100的男人。老黄就问扎克伯格说:“你是怎么来的呀?”而我是作为VIP客户,专门被黄日勋邀请来的,就是显卡买太多啊,被请来了。而且他在恨苹果这件事上来说,俩人绝对有共同语言啊。就是黄仁勋也好,扎克伯格也好,现在所有的CEO里头,所有的这种创业者里头,最恨苹果的两个大概就是他们了,找不出其他人了。

扎克伯格在会上飙脏话啊,直接说了一个f word,甚至说有可能直播都会被掐掉的这种脏话。其实骂的不是OpenAI,骂的其实是苹果。为什么要去骂苹果?OpenAI做了半天,未来有没有可能伤害Meta,伤害扎克伯格,有可能,但是现在其实没有给扎克伯格带来任何的伤害。而苹果当时是差点没把Facebook给玩死。扎克伯格自己也讲,Facebook最早是个网站嘛,我们是完全开放的啊,没人管,我们在里头爱干嘛干嘛。然后移动时代呢,发现要到苹果上面去啊,发布软件。

苹果这也不让你做,那也不让你做。关键是把他们进行精准广告推送所需要的用户信息给他屏蔽了。以广告收入为基本收入的 Facebook 差点没被他弄死。扎克伯格痛定思痛,说:“我一定要去做一个新的平台,绝对不能靠 APP 这种东西,而让苹果把我掐死。”所以他才做元宇宙,才把公司从 Facebook 改名叫 Meta。他做了所有这些事情,实际上都是为了应对苹果。这是扎克伯格为什么恨苹果,为什么恨这种封闭的大平台。

说英伟达为什么恨苹果呢?就是英伟达跟苹果之间是有恩怨的。英伟达给苹果提供过一款显卡,后来这个显卡不是特别稳定,被苹果直接起诉了。一开始苹果要他退钱,老黄不退,后来苹果直接起诉了老黄。苹果是在所有的应用里头都不使用英伟达显卡,而这个梁算截下来了。

而这一次,苹果直接给大家演示了用谷歌的 TPU 去训练大模型。这个消息传出来以后,英伟达的股价直接崩了。当然,英伟达的股价崩掉了,还有很多原因在里头,包括老黄自己在疯狂的套现,以及他到 120 以上的这个价格,大家觉得确实有泡沫了,直接崩掉了。但是英伟达昨天晚上涨了 13%,整个又窜起来了。

为什么苹果可以用 TPU 去干活呢?就是它是自己大厂,我只要招够足够的工程师,我就可以去改底层算法,让这些模型在 TPU 上运作。苹果演示了这件事情以后,谷歌、OpenAI 上都可以往这个方向走。这对于英伟达来说就是非常危险的。

英伟达一定要来找一个更恨苹果的人,找到Meta,找到扎克伯格。说来咱俩聊一下。扎克伯格呢,就是因为被卡过脖子,所以必须开源啊。看到别人作弊源啊,想要成为新的基座平台,就open i想做这个啊。那么想做规则的制定者啊,所以只能气得骂街了啊。这就是两个最恨苹果的人,天作之合,凑在一起。

那么Meta呢,对于大模型的开源是有非常大的贡献的。当然,最大的贡献并不是拉玛。咱们一直都说啊,拉玛1、拉玛2、拉玛3算是奠定了开源大模型的基础,但是Meta做的最大的贡献是另外两个东西。一个东西呢,PyTorch。PyTorch是现在非常主流的一个大模型,本地把它架起来的一个架构框架,这个东西是Meta开源出来的。现在在很多的服务器上,大家开始进行本地部署的时候,都是用的这个东西啊。

PyTorch的基金会里头大佬云集,哎,大型的开源的项目都是有基金会的。他们的大佬里头,Meta自己是啊,他贡献了代码,那么他是大佬。第二个呢,就是芯片厂商都在里头,英伟达、AMD、英特尔都在里头。然后所有云计算厂商都在里头啊,谷歌云、微软云、亚马逊云都在里头啊。再往后,新生的AI社区与工具,Hugging Face、Lighting AI啊,都在里头。

还有两个全能型拳手在里头,一个叫IBM啊,他所有的都做,也做云也做主机,也做芯片,什么他都干,所以他也是基金会的高级会员啊。还有一个高级会员是大家所熟悉的,遥遥领先啊,华为。

就PyTorch基金会里头,唯一的一个中国会员就是华为。在这一点上,我觉得华为做的还是很厉害的。它在各种开源的基金会里头,老老实实地交钱,老老实实地去遵守规章制度。它不像国内很多的公司,比如百度,使用所有的开源东西,但却偷偷使用,使用完了以后直接一闭源,啥也不看了,然后下一个。

Meta对AI做的贡献是什么呢?OCP(Open Computer Project)叫开放计算工程,这是什么呢?就是自己有大量的服务器,而这些服务器应该如何构造、如何去建设、如何去连接,这也是一个开源项目,这是Meta开源出来的。现在英伟达推出的NVIDIA HGX,就是在这个模块上去拓展出来的,已经都用上了。这是对整个开源事业真正做的两大贡献。

第三大贡献,才是刚才我们讲的拉玛模型,拉玛1、拉玛2、拉玛3、拉玛3.1,这才是第三大贡献。而且我觉得他所谓的拉玛模型的贡献,真正改变的其实是中国,彻底追上来了。可以拉着中国的一众小伙伴,把这OpenAI打翻在地,这个我觉得是可以的。

扎克伯格也为未来指明了方向,而且他指的这些方向,我觉得还是非常有价值的。第一个,他讲到了一点是原来我们很多人没有想到的,就是要去修改推荐算法。因为互联网的最底层其实就是推荐算法。推荐算法是什么?就是过滤与排序,你到底应该看这个还是不应该看这个,谁排前头,谁排后头。

这就是整个互联网的底层逻辑。在信息过载之后,我们只能依靠推荐算法来工作。在推荐的时候,它只能是说:“我按照一些大家的喜好,或者做协同过滤,做一些传统的AI的推荐。”现在就不一样了,它可以通过Transformer的模型,通过嵌入来重构整个算法,这是一大创举。而且这个东西真正运转起来以后,可能我们会看到完全不同的信息流。

在推荐的时候,他们也希望直接在信息流里进行总结与归纳。原来我们在Facebook和Instagram里看到的所有信息都是用户生成的,那么以后可能我们看到的一些信息就是归纳的一些信息。比如说,你最近有三个朋友感冒了,你最近有五个朋友感冒了,而这些朋友你可能连名字都想不起来。如果真的给你发一条说这个朋友感冒的信息,在信息流里你也不想看到,但是你又希望知道这朋友里边感冒的人多不多。

会把信息分层处理。什么叫分层处理?就是跟我关系最好的人,你们要把这个信息完整地展现出来。大家讲的就是150个人之内的,我们可以互相叫出名字,可以知道他的喜怒哀乐。这些我们可能希望知道他所有的信息。然后朋友的朋友就是中层圈子,可能只是需要知道一个概况就可以了。再往外层的话,可能有一些大事件发生的时候,我们需要知道一些国际大事,也就可以了。它需要分层处理,那么分层处理就可以对这些内容进行总结归纳,并可以发出来。

而且在这个过程中,推荐算法就会有更大的权利。这是什么意思?原来肯定是看你关注了谁,你跟谁是好友,你可以看到谁的信息更多。不可能,你虽然关注了一个人,但你未必看得到他的信息。如果你们之间很少互动,他就认为这可能就是一个普通的朋友。他的一些大事你知道一下,小事你可能就不需要知道了。他会通过这样的方式来过滤你的信息。

包括我们现在在推特里边也是这样的,可能看到一些大事的时候,我们会看到,那一些小事可能就看不到了。后面的话,Meta准备统一他的推荐系统。原来推荐系统是什么呢?就是各个分支,比如我要先看到朋友的,然后看到这个朋友的朋友的,再看到国际大事的和重要媒体的,所有的这些推荐的东西搁在一起,然后再进行混合。以前是这么工作的,而现在上大模型,我们要让整个的系统用统一的模型进行推荐,一次性给你推出来。

这个也是一个很大的创举,可能以后我们就会看到一个完整的模型推荐出来的图文信息、视频信息都混在一起的,而不像现在似的,Instagram就是Instagram,Threads就是Threads,Book就是分开的。以后,我们可能就在一个统一的信息流里看到所有的一切了。这是真正会改变互联网底层逻辑的事情。Meta、谷歌、Twitter、TikTok基本都是靠这个东西活着的。如果真的能够把大模型应用到推荐算法里边去。

我们可能就真的会看到新的一次AI革命,真正能够产生效益了啊。这是非常重要的啊。 这是讲的第一点啊。第二点是什么呢?就是AI studio啊。他也要上一个AI studio,因为AI studio谁都上啊。微软有AI studio,谷歌有AI studio,Meta也做了一个AI studio。而Meta做的AI studio就干一件事啊:给每一个人做一个自己的AI助手。使用社交媒体的时候啊,直接用Meta自己的内容进行训练,微调一个小模型,再配合RAG或者叫做本地知识库,可以不断地补充新的信息,拿这个小模型去替我们回答问题啊。

像我现在,我每周会去处理一次大家的评论,周三下午一般会处理。处理完了以后跟大家念一遍。如果我有了这样的一个工具,我就可以随时随地地处理大家的评论。我出去玩的时候,AI机器人都可以给大家回复啊。我们的Disco群有这么多的分支,我没有办法在里边去照顾到每一个分支。这样,我就可以让我的AI助手在里边去回复。哪怕说他不回复,我过一段时间总结一下,最近大家都在聊这几个事呢,你是不是要去参与一下啊?或者他可以来征得我的同意,或者在我的授权之下进行回复啊。

这件事我就替你回答了啊。那件事情你准备怎么回答,还是说就不说了。这样的话,我就可以更多地千手千眼、无处不在地参与到各种社区的讨论里头去。这个真的是我很需要的一个东西啊。

每个人呢,其实都需要分饰不同的AI角色,有不同的AI助理模型。你比如说,在Facebook的回答问题里头有一个,在Discord里头有一个,是不是在Twitter里应该再有一个?这个可能才是真正我需要的东西。甚至未来我可能照了照片以后,就直接把这些照片都放在优酷里,让它自己去挑选好的照片,给我发到Instagram上去,这个不也是一个挺有趣的事情吗?这个是非常有用的。

那么在所有的平台里边,就会成一个新的风向,就是大家开始把这种AI机器人用起来。以后是什么呢?就是所有的平台都会变得热闹起来,因为每个平台都有我们的替身在替我们回答问题。所有的平台都会产生信息大爆炸,所有的平台也就都失去壁垒。

我们经常有人说:“哎,你有Telegram没有?你有微信没有?你有这个Twitter没有?”那以后这些东西我都有。你们在任何地方提了问题,我可能都可以去回答。这是多么有趣的一个事情!他们就不可能说再把一个人限制在某一个特定的小平台里头。当这些小平台失去壁垒之后,这些大平台就可以依靠成本和变现能力直接把小平台都挤死,对吧?这也对于Meta来说是有商业利益的吧。

在网络上,每一个人都可以依靠这种小模型的帮助,成为超人。这也是在不久的将来就可以实现的东西。扎克伯格也讲了,未来他的这种AI触手不会是文字,而应该会成为虚拟形象。你们以后可能再去聊天的时候就发现……

长坐着一个长得像老范一样的人,在这跟你回答各种问题了。甚至他可以开出这样的直播,挨着把大家的评论都点出来,挨着跟大家解释。这也是一个很有意思的事。

这是第二点。第三点是什么呢?第三点是开源是未来,不受限制的构建,恢复开放的黄金时代。这是他讲开源的内容,我们就不在这里详细去讲开源到底好在哪,坏在哪。这对于中国的AI行业来说,没有拉玛,就没有中国AI现在的风起云涌。如果没有PyTorch,中国的整个AI体系也是难以发展的。

它开的这个叫Open Compute Project,对整个中国的互联网云建设都是有重大意义的。再往后一个讲的是模型不会一家独大,从小到大的模型都有应用场景。OpenAI就认为你都应该在我这儿用,不要用其他人的。虽然它有GPT-4O Mini这样的模型出来,但它还是说你都要在我这儿用。

现在Meta就讲了说没必要,405B的模型我们就是做这种相对来说比较复杂的任务。当然,405B也给英伟达提供了一个非常大的考验,因为405B这种模型在英伟达的单块显卡上跑不起来。你还是要用NV Link这样的成熟技术,才可以把这些显卡连接起来,把这个405B跑起来。黄仁勋也是乐得嘴都合不上,跑405B就老老实实到英伟达来买显卡来。

势币的基本上处理各种业务是够的,因为我前一段时间也是使用各种大模型,基本上到70B。

绝大部分的问题都可以解决了。8B的在各种的AIPC里就可以用了。微调之后可以成为各种专材,比如说编程的,法律咨询,AI客服,绝对够了。今天谷歌还新发了两币的模型,叫JMAR2,两币,这个叫2B,在AI手机上完全可以跑起来,效果还不错。

这是讲的第二块,就是不同步大小的模型,大家自己去用。而且大家要去用八臂的模型,去训练各自的专用模型。只要这样,才会有不同的模型去完成不同的事情。

然后呢,讲的是叫segment everything two。是这样的,一个大模型又更新了,更新到第二版。这个模型叫做分割一切。这个segment everything呢,在去年是发布过一版,做的事情就是你给他一张照片,不需要标注,不需要训练,他就可以把照片里的所有物体都识别出来,挨着个儿给你列出来。

而everything to呢,它是可以把所有视频里的内容直接都给你分拆出来。说这个是牛,那是马,这个是猪,那是羊,他都给你认得清清楚楚的。扎克伯格还在现场炫富,他说:“你看啊,现在认出了一个视频上面这些牛,叫考艾岛牧场的牛,是扎克伯格自己牧场上的牛。”对吧,把这些牛认出来以后,伯格跟这个黄仁勋准备把这个牛杀掉了,好好吃一顿。

这种可以分割和识别视频内容的大模型,未来是有非常大的应用场景的。而且注意啊。

Segment Everything Two是开源模型,大家现在就可以当下来使用了。扎克伯格在现场举的案例是什么呢?就是监控能力可以极大提升。以前,公司丢东西的时候,我是去看过监控的,那经历实在是太可怕了,对吧?你需要长时间盯着监控去找这个片段,这非常困难,因为视频是线性的。

现在,当你有了这种分割一切模型以后,你就可以直接问模型:“什么时间点你看到有人进来了?”或者“什么时间点这个门动了?”他就可以直接通过语言和文字对视频进行检索。这是非常强大的,很多工业上的东西可以被极大赋能了。

前一段时间,马斯克其实也演示过一个视频,在他的推特账号里,演示了用AI模型观察一个咖啡店。他会算好哪个店员在聊天,哪个店员做了几杯咖啡,哪个店员在休息,对吧?店员和顾客之间是如何沟通的,这看起来有点吓人。

当然,这种模型肯定会被中国的厂商第一个拿来用。用完以后,就可以让这些牛马们老老实实地干活,没有任何私下里的自由空间,这完全可以实现。所以,中国一定会快速应用起来。

再往后,两个老直男讨论了一下时尚问题。为什么讨论时尚呢?因为扎克伯格去做智能眼镜了,眼镜上有摄像头。他说这个东西很漂亮,而且可以不停地换衣服,始终穿一件,但这个眼镜可以换来换去。

这就是两个老直男对于时尚的理解吧。这一次呢,他们两个人还是换了皮夹克。黄仁勋标准款的皮夹克给了扎克伯格,扎克伯格呢,这一次用的是自己那种很厚的半长的皮衣,戴帽子的这种,比较宽松。这就是两个直男对于时尚的所有观点。

最终的总结是什么呢?就是扎克伯格还算是为AI指明了方向。而且扎克伯格指明的这几个方向,都是AI未来有可能挣到钱的地方,有可能能够在这块有正常的商业模式的地方。这个是非常可贵的,它比山姆·奥特曼的那种大空话还是要落实得多。

那么新的时代就要到来了,互联网的底层真的要被AI重构了。原来互联网底层是没有被AI去改变的,还是推荐算法。现在AI要进入互联网底层了。一个人都可以被AI赋能,这也是非常棒的一件事情。所有的场景都可以被AI渗透,对世界的理解也可以进一步给各种系统赋能。当然,也可以给中国这血汗公司赋能,或者给中国政府赋能。

我发现做监控这件事情上,中国如果说是第二,全世界没有任何国家敢说是第一。这块我们还是做得最好的。全世界大概绝大部分的监控摄像头都是中国人造的。最终呢,大家都去买英伟达的显卡,都去用Meta的开源系统。这就是他们两个进行了一晚上的访谈所得出的最终结论。好,这就是我们今天讲的第二个故事。

 

Both comments and pings are currently closed.

Comments are closed.

Close Bitnami banner
Bitnami