扎克伯格和黄仁勋,除了换皮衣,还聊了些什么?探秘扎克伯格和黄仁勋的SIGGRAPH访谈:两位科技大咖如何看待AI革命与苹果的未来冲突
8 月 06
AIGC, Meta的故事 AI信息流整合, AI助手, AI助手平台, AI助手应用, AI助手模型, AI回复, AI客服, AI开源, AI总结信息, AI技术, AI技术应用, AI推荐算法, AI机器人, AI演示, AI社交助手, AI社区, AI社区互动, AI视觉分割, AI触手, AI辅助工具, AI配置工程师, AI革命, AI风向, AR, Hugging Face, IBM, Lightining AI, Meta, Meta的贡献, OCP, Open Compute Project, PyTorch, Segment Everything Two, SIGGRAPH大会, TPU, VR, 互联网底层, 人工智能, 信息分层, 信息流, 信息流混合, 信息爆炸, 信息过载, 分拆视频内容, 华为, 多平台AI, 大模型, 层次化处理, 平台无壁垒, 底层逻辑, 开源技术, 开源模型, 开源生态, 扎克伯格, 推荐算法, 推荐系统, 显卡, 显卡价格, 显卡公司, 显卡适配, 法律AI, 监控提升, 监控摄像头, 社交媒体AI, 科技发展, 科技巨头, 算法创新, 统一推荐系统, 编程AI, 英伟达, 苹果, 虚拟AI助理, 虚拟形象, 视觉识别, 视频分析, 视频搜索, 计算机图像识别, 谷歌TPU, 软件开发, 黄仁勋 扎克伯格和黄仁勋,除了换皮衣,还聊了些什么?探秘扎克伯格和黄仁勋的SIGGRAPH访谈:两位科技大咖如何看待AI革命与苹果的未来冲突已关闭评论
扎克伯格跟黄仁勋凑一块,除了换皮衣,还讲了点什么呢?他们是在SIGGRAPH大会上进行的访谈。黄仁勋是访谈主持人,而扎克伯格是被邀请的嘉宾。因此,在他们的访谈中,扎克伯格是逗哏的,黄仁勋是捧哏的,这一点首先要搞清楚。
这一次访谈,主要是扎克伯格在输出。SIGGRAPH大会是一个历史非常悠久的大会,叫计算机图形图像特别兴趣小组(Special Interest Group on Computer Graphics),小组成立于1967年,1974年第一次开会。今年是第50届,参会的人中有90%都是博士。当我看到这个消息时,一开始想,黄仁勋应该是个博士吧?扎克伯格是中途退学的。后来查了一下,发现并不是。黄仁勋是硕士,而扎克伯格是2002年入学于哈佛的心理学和计算机科学专业,2004年辍学,实际上上了两年学,之后在2017年被哈佛授予了荣誉法学博士学位。他好像跟某位伟人的学位差不多。
正常来参加这种活动的人,主要是引擎公司,比如Unreal、Unity,图形软件的公司Photoshop、Adobe,以及显卡公司AMD、英伟达。原来Meta也参加过,大概参加了有十几年了,他们以前是作为VR、AR公司来参加的。这一次则是出来抢AI的。
老黄跟扎克伯格算是天作之合,为什么呢?因为只有开源模型,才是英伟达显卡的绝配。
那你说微软不也买了好,OpenAI也在用,对吧?但是呢,大厂的必元模型啊,它是有能力去招聘一帮叫适配工程师或者叫配置工程师。他们可以绕过扩大算法这个事,是可以跑的。增加的这点成本对于他们来说是可以去承担的。只有开源模型的应用者,通常是支付不起这些配置工程师的工资的,所以他们会老老实实地使用英伟达的显卡,是吧?所以他们俩绝对是天作之合。
扎克伯格自己访谈的资格,也是因为买了足够多的H100才换来的。他是号称拥有60万块H100的男人。老黄就问扎克伯格说:“你是怎么来的呀?”而我是作为VIP客户,专门被黄日勋邀请来的,就是显卡买太多啊,被请来了。而且他在恨苹果这件事上来说,俩人绝对有共同语言啊。就是黄仁勋也好,扎克伯格也好,现在所有的CEO里头,所有的这种创业者里头,最恨苹果的两个大概就是他们了,找不出其他人了。
扎克伯格在会上飙脏话啊,直接说了一个f word,甚至说有可能直播都会被掐掉的这种脏话。其实骂的不是OpenAI,骂的其实是苹果。为什么要去骂苹果?OpenAI做了半天,未来有没有可能伤害Meta,伤害扎克伯格,有可能,但是现在其实没有给扎克伯格带来任何的伤害。而苹果当时是差点没把Facebook给玩死。扎克伯格自己也讲,Facebook最早是个网站嘛,我们是完全开放的啊,没人管,我们在里头爱干嘛干嘛。然后移动时代呢,发现要到苹果上面去啊,发布软件。
苹果这也不让你做,那也不让你做。关键是把他们进行精准广告推送所需要的用户信息给他屏蔽了。以广告收入为基本收入的 Facebook 差点没被他弄死。扎克伯格痛定思痛,说:“我一定要去做一个新的平台,绝对不能靠 APP 这种东西,而让苹果把我掐死。”所以他才做元宇宙,才把公司从 Facebook 改名叫 Meta。他做了所有这些事情,实际上都是为了应对苹果。这是扎克伯格为什么恨苹果,为什么恨这种封闭的大平台。
说英伟达为什么恨苹果呢?就是英伟达跟苹果之间是有恩怨的。英伟达给苹果提供过一款显卡,后来这个显卡不是特别稳定,被苹果直接起诉了。一开始苹果要他退钱,老黄不退,后来苹果直接起诉了老黄。苹果是在所有的应用里头都不使用英伟达显卡,而这个梁算截下来了。
而这一次,苹果直接给大家演示了用谷歌的 TPU 去训练大模型。这个消息传出来以后,英伟达的股价直接崩了。当然,英伟达的股价崩掉了,还有很多原因在里头,包括老黄自己在疯狂的套现,以及他到 120 以上的这个价格,大家觉得确实有泡沫了,直接崩掉了。但是英伟达昨天晚上涨了 13%,整个又窜起来了。
为什么苹果可以用 TPU 去干活呢?就是它是自己大厂,我只要招够足够的工程师,我就可以去改底层算法,让这些模型在 TPU 上运作。苹果演示了这件事情以后,谷歌、OpenAI 上都可以往这个方向走。这对于英伟达来说就是非常危险的。
英伟达一定要来找一个更恨苹果的人,找到Meta,找到扎克伯格。说来咱俩聊一下。扎克伯格呢,就是因为被卡过脖子,所以必须开源啊。看到别人作弊源啊,想要成为新的基座平台,就open i想做这个啊。那么想做规则的制定者啊,所以只能气得骂街了啊。这就是两个最恨苹果的人,天作之合,凑在一起。
那么Meta呢,对于大模型的开源是有非常大的贡献的。当然,最大的贡献并不是拉玛。咱们一直都说啊,拉玛1、拉玛2、拉玛3算是奠定了开源大模型的基础,但是Meta做的最大的贡献是另外两个东西。一个东西呢,PyTorch。PyTorch是现在非常主流的一个大模型,本地把它架起来的一个架构框架,这个东西是Meta开源出来的。现在在很多的服务器上,大家开始进行本地部署的时候,都是用的这个东西啊。
PyTorch的基金会里头大佬云集,哎,大型的开源的项目都是有基金会的。他们的大佬里头,Meta自己是啊,他贡献了代码,那么他是大佬。第二个呢,就是芯片厂商都在里头,英伟达、AMD、英特尔都在里头。然后所有云计算厂商都在里头啊,谷歌云、微软云、亚马逊云都在里头啊。再往后,新生的AI社区与工具,Hugging Face、Lighting AI啊,都在里头。
还有两个全能型拳手在里头,一个叫IBM啊,他所有的都做,也做云也做主机,也做芯片,什么他都干,所以他也是基金会的高级会员啊。还有一个高级会员是大家所熟悉的,遥遥领先啊,华为。
就PyTorch基金会里头,唯一的一个中国会员就是华为。在这一点上,我觉得华为做的还是很厉害的。它在各种开源的基金会里头,老老实实地交钱,老老实实地去遵守规章制度。它不像国内很多的公司,比如百度,使用所有的开源东西,但却偷偷使用,使用完了以后直接一闭源,啥也不看了,然后下一个。
Meta对AI做的贡献是什么呢?OCP(Open Computer Project)叫开放计算工程,这是什么呢?就是自己有大量的服务器,而这些服务器应该如何构造、如何去建设、如何去连接,这也是一个开源项目,这是Meta开源出来的。现在英伟达推出的NVIDIA HGX,就是在这个模块上去拓展出来的,已经都用上了。这是对整个开源事业真正做的两大贡献。
第三大贡献,才是刚才我们讲的拉玛模型,拉玛1、拉玛2、拉玛3、拉玛3.1,这才是第三大贡献。而且我觉得他所谓的拉玛模型的贡献,真正改变的其实是中国,彻底追上来了。可以拉着中国的一众小伙伴,把这OpenAI打翻在地,这个我觉得是可以的。
扎克伯格也为未来指明了方向,而且他指的这些方向,我觉得还是非常有价值的。第一个,他讲到了一点是原来我们很多人没有想到的,就是要去修改推荐算法。因为互联网的最底层其实就是推荐算法。推荐算法是什么?就是过滤与排序,你到底应该看这个还是不应该看这个,谁排前头,谁排后头。
这就是整个互联网的底层逻辑。在信息过载之后,我们只能依靠推荐算法来工作。在推荐的时候,它只能是说:“我按照一些大家的喜好,或者做协同过滤,做一些传统的AI的推荐。”现在就不一样了,它可以通过Transformer的模型,通过嵌入来重构整个算法,这是一大创举。而且这个东西真正运转起来以后,可能我们会看到完全不同的信息流。
在推荐的时候,他们也希望直接在信息流里进行总结与归纳。原来我们在Facebook和Instagram里看到的所有信息都是用户生成的,那么以后可能我们看到的一些信息就是归纳的一些信息。比如说,你最近有三个朋友感冒了,你最近有五个朋友感冒了,而这些朋友你可能连名字都想不起来。如果真的给你发一条说这个朋友感冒的信息,在信息流里你也不想看到,但是你又希望知道这朋友里边感冒的人多不多。
会把信息分层处理。什么叫分层处理?就是跟我关系最好的人,你们要把这个信息完整地展现出来。大家讲的就是150个人之内的,我们可以互相叫出名字,可以知道他的喜怒哀乐。这些我们可能希望知道他所有的信息。然后朋友的朋友就是中层圈子,可能只是需要知道一个概况就可以了。再往外层的话,可能有一些大事件发生的时候,我们需要知道一些国际大事,也就可以了。它需要分层处理,那么分层处理就可以对这些内容进行总结归纳,并可以发出来。
而且在这个过程中,推荐算法就会有更大的权利。这是什么意思?原来肯定是看你关注了谁,你跟谁是好友,你可以看到谁的信息更多。不可能,你虽然关注了一个人,但你未必看得到他的信息。如果你们之间很少互动,他就认为这可能就是一个普通的朋友。他的一些大事你知道一下,小事你可能就不需要知道了。他会通过这样的方式来过滤你的信息。
包括我们现在在推特里边也是这样的,可能看到一些大事的时候,我们会看到,那一些小事可能就看不到了。后面的话,Meta准备统一他的推荐系统。原来推荐系统是什么呢?就是各个分支,比如我要先看到朋友的,然后看到这个朋友的朋友的,再看到国际大事的和重要媒体的,所有的这些推荐的东西搁在一起,然后再进行混合。以前是这么工作的,而现在上大模型,我们要让整个的系统用统一的模型进行推荐,一次性给你推出来。
这个也是一个很大的创举,可能以后我们就会看到一个完整的模型推荐出来的图文信息、视频信息都混在一起的,而不像现在似的,Instagram就是Instagram,Threads就是Threads,Book就是分开的。以后,我们可能就在一个统一的信息流里看到所有的一切了。这是真正会改变互联网底层逻辑的事情。Meta、谷歌、Twitter、TikTok基本都是靠这个东西活着的。如果真的能够把大模型应用到推荐算法里边去。
我们可能就真的会看到新的一次AI革命,真正能够产生效益了啊。这是非常重要的啊。 这是讲的第一点啊。第二点是什么呢?就是AI studio啊。他也要上一个AI studio,因为AI studio谁都上啊。微软有AI studio,谷歌有AI studio,Meta也做了一个AI studio。而Meta做的AI studio就干一件事啊:给每一个人做一个自己的AI助手。使用社交媒体的时候啊,直接用Meta自己的内容进行训练,微调一个小模型,再配合RAG或者叫做本地知识库,可以不断地补充新的信息,拿这个小模型去替我们回答问题啊。
像我现在,我每周会去处理一次大家的评论,周三下午一般会处理。处理完了以后跟大家念一遍。如果我有了这样的一个工具,我就可以随时随地地处理大家的评论。我出去玩的时候,AI机器人都可以给大家回复啊。我们的Disco群有这么多的分支,我没有办法在里边去照顾到每一个分支。这样,我就可以让我的AI助手在里边去回复。哪怕说他不回复,我过一段时间总结一下,最近大家都在聊这几个事呢,你是不是要去参与一下啊?或者他可以来征得我的同意,或者在我的授权之下进行回复啊。
这件事我就替你回答了啊。那件事情你准备怎么回答,还是说就不说了。这样的话,我就可以更多地千手千眼、无处不在地参与到各种社区的讨论里头去。这个真的是我很需要的一个东西啊。
每个人呢,其实都需要分饰不同的AI角色,有不同的AI助理模型。你比如说,在Facebook的回答问题里头有一个,在Discord里头有一个,是不是在Twitter里应该再有一个?这个可能才是真正我需要的东西。甚至未来我可能照了照片以后,就直接把这些照片都放在优酷里,让它自己去挑选好的照片,给我发到Instagram上去,这个不也是一个挺有趣的事情吗?这个是非常有用的。
那么在所有的平台里边,就会成一个新的风向,就是大家开始把这种AI机器人用起来。以后是什么呢?就是所有的平台都会变得热闹起来,因为每个平台都有我们的替身在替我们回答问题。所有的平台都会产生信息大爆炸,所有的平台也就都失去壁垒。
我们经常有人说:“哎,你有Telegram没有?你有微信没有?你有这个Twitter没有?”那以后这些东西我都有。你们在任何地方提了问题,我可能都可以去回答。这是多么有趣的一个事情!他们就不可能说再把一个人限制在某一个特定的小平台里头。当这些小平台失去壁垒之后,这些大平台就可以依靠成本和变现能力直接把小平台都挤死,对吧?这也对于Meta来说是有商业利益的吧。
在网络上,每一个人都可以依靠这种小模型的帮助,成为超人。这也是在不久的将来就可以实现的东西。扎克伯格也讲了,未来他的这种AI触手不会是文字,而应该会成为虚拟形象。你们以后可能再去聊天的时候就发现……
长坐着一个长得像老范一样的人,在这跟你回答各种问题了。甚至他可以开出这样的直播,挨着把大家的评论都点出来,挨着跟大家解释。这也是一个很有意思的事。
这是第二点。第三点是什么呢?第三点是开源是未来,不受限制的构建,恢复开放的黄金时代。这是他讲开源的内容,我们就不在这里详细去讲开源到底好在哪,坏在哪。这对于中国的AI行业来说,没有拉玛,就没有中国AI现在的风起云涌。如果没有PyTorch,中国的整个AI体系也是难以发展的。
它开的这个叫Open Compute Project,对整个中国的互联网云建设都是有重大意义的。再往后一个讲的是模型不会一家独大,从小到大的模型都有应用场景。OpenAI就认为你都应该在我这儿用,不要用其他人的。虽然它有GPT-4O Mini这样的模型出来,但它还是说你都要在我这儿用。
现在Meta就讲了说没必要,405B的模型我们就是做这种相对来说比较复杂的任务。当然,405B也给英伟达提供了一个非常大的考验,因为405B这种模型在英伟达的单块显卡上跑不起来。你还是要用NV Link这样的成熟技术,才可以把这些显卡连接起来,把这个405B跑起来。黄仁勋也是乐得嘴都合不上,跑405B就老老实实到英伟达来买显卡来。
势币的基本上处理各种业务是够的,因为我前一段时间也是使用各种大模型,基本上到70B。
绝大部分的问题都可以解决了。8B的在各种的AIPC里就可以用了。微调之后可以成为各种专材,比如说编程的,法律咨询,AI客服,绝对够了。今天谷歌还新发了两币的模型,叫JMAR2,两币,这个叫2B,在AI手机上完全可以跑起来,效果还不错。
这是讲的第二块,就是不同步大小的模型,大家自己去用。而且大家要去用八臂的模型,去训练各自的专用模型。只要这样,才会有不同的模型去完成不同的事情。
然后呢,讲的是叫segment everything two。是这样的,一个大模型又更新了,更新到第二版。这个模型叫做分割一切。这个segment everything呢,在去年是发布过一版,做的事情就是你给他一张照片,不需要标注,不需要训练,他就可以把照片里的所有物体都识别出来,挨着个儿给你列出来。
而everything to呢,它是可以把所有视频里的内容直接都给你分拆出来。说这个是牛,那是马,这个是猪,那是羊,他都给你认得清清楚楚的。扎克伯格还在现场炫富,他说:“你看啊,现在认出了一个视频上面这些牛,叫考艾岛牧场的牛,是扎克伯格自己牧场上的牛。”对吧,把这些牛认出来以后,伯格跟这个黄仁勋准备把这个牛杀掉了,好好吃一顿。
这种可以分割和识别视频内容的大模型,未来是有非常大的应用场景的。而且注意啊。
Segment Everything Two是开源模型,大家现在就可以当下来使用了。扎克伯格在现场举的案例是什么呢?就是监控能力可以极大提升。以前,公司丢东西的时候,我是去看过监控的,那经历实在是太可怕了,对吧?你需要长时间盯着监控去找这个片段,这非常困难,因为视频是线性的。
现在,当你有了这种分割一切模型以后,你就可以直接问模型:“什么时间点你看到有人进来了?”或者“什么时间点这个门动了?”他就可以直接通过语言和文字对视频进行检索。这是非常强大的,很多工业上的东西可以被极大赋能了。
前一段时间,马斯克其实也演示过一个视频,在他的推特账号里,演示了用AI模型观察一个咖啡店。他会算好哪个店员在聊天,哪个店员做了几杯咖啡,哪个店员在休息,对吧?店员和顾客之间是如何沟通的,这看起来有点吓人。
当然,这种模型肯定会被中国的厂商第一个拿来用。用完以后,就可以让这些牛马们老老实实地干活,没有任何私下里的自由空间,这完全可以实现。所以,中国一定会快速应用起来。
再往后,两个老直男讨论了一下时尚问题。为什么讨论时尚呢?因为扎克伯格去做智能眼镜了,眼镜上有摄像头。他说这个东西很漂亮,而且可以不停地换衣服,始终穿一件,但这个眼镜可以换来换去。
这就是两个老直男对于时尚的理解吧。这一次呢,他们两个人还是换了皮夹克。黄仁勋标准款的皮夹克给了扎克伯格,扎克伯格呢,这一次用的是自己那种很厚的半长的皮衣,戴帽子的这种,比较宽松。这就是两个直男对于时尚的所有观点。
最终的总结是什么呢?就是扎克伯格还算是为AI指明了方向。而且扎克伯格指明的这几个方向,都是AI未来有可能挣到钱的地方,有可能能够在这块有正常的商业模式的地方。这个是非常可贵的,它比山姆·奥特曼的那种大空话还是要落实得多。
那么新的时代就要到来了,互联网的底层真的要被AI重构了。原来互联网底层是没有被AI去改变的,还是推荐算法。现在AI要进入互联网底层了。一个人都可以被AI赋能,这也是非常棒的一件事情。所有的场景都可以被AI渗透,对世界的理解也可以进一步给各种系统赋能。当然,也可以给中国这血汗公司赋能,或者给中国政府赋能。
我发现做监控这件事情上,中国如果说是第二,全世界没有任何国家敢说是第一。这块我们还是做得最好的。全世界大概绝大部分的监控摄像头都是中国人造的。最终呢,大家都去买英伟达的显卡,都去用Meta的开源系统。这就是他们两个进行了一晚上的访谈所得出的最终结论。好,这就是我们今天讲的第二个故事。