硕鼠的博客站

范路的博客主站,时而会发些东西。

Grok 2出来了,老板马斯克就是拿来开涮。马斯克各种梗图突然开始满天飞了,这是什么东西呢?就是XAI做的Grok大模型的第二版,Grok 2发布了,包括特朗普跟贺锦利的各种梗图也在飞了。其中有一张是特朗普去抚摸贺锦利怀孕的肚子呀。但其实玩的呢,并不是Grok 2,而是什么叫Flux 1。

首先分析下时间点,为什么在这个时间要去出Grok 2呢?第一个,3月份我开始测试了,Grok 2已经开始测试了,测试到8月份呢,也差不多开始出了。而且3月份,Grok一开源了,然而开源之后就再也没有更新过任何的代码,也没有去回答过任何的issues或者是Pull request,这个都再也没有动过,完全死水一潭。马斯克的开源就是这么开的,我开了,用不用是你的事,我反正不理你,我也不会再更新任何代码。

包括推特,原来开源的推荐算法,包括Grok 1都是这样的,开了就挂在这了,爱使不使。而且它开出来以后,你自己到底能不能部署得上去,能不能把他们这个用起来去测试,他就完全不管了。你提任何问题,他也不理你啊,这就是马斯克开源。

现在是AIGC的集中爆发,谷歌、苹果、美塔、OpenAI、Anthropic都不消停,都在疯狂的你方唱罢我登场。我发一个东西,互相在这别苗头。马斯克别地发出点声音来,特别是在他撤销了对OpenAI的诉讼之后,最近又重启了对OpenAI的诉讼重新起诉他。

现在分析为什么马斯克会在撤诉之后再重启。因为他每一次诉讼,过一段时间以后,法院会去判定说你这个案子是不是要撤诉,而如果发现你的证据不足,就不要浪费纳税人的钱,我就给你撤诉了。

所以,上一次呢,马斯克是在法官宣布可以撤诉之前的一天,自己跑去撤诉的,算是他主动撤诉。等过了这么几个月以后,说来咱们再诉讼。要知道,这种诉讼挂在身上的时候,你要再去做各种融资,是非常麻烦的,因为你身上挂的有诉讼,而且是跟马斯克打官司,官司还没打完,还在那挂着。在这个时候做融资,都很讨厌。

所以,他还在不停地折腾 OpenAI 的算力中心,10万张 H100 的这个算力中心,7月22号正式上线。3.5万张 H100 的特斯拉算力中心是去年上线的,年底计划再来9万张 H100。就是本来这些 H100 应该是属于特斯拉算力中心的,被他挪给了 XAI 的算力中心。XAI 那批订货的 H100 今年的9月份到货,所以特斯拉的算力中心是晚一些,可以继续使用这些 X100 和 P100。

而且呢,XAI 的估值是所有 AI GC 公司里的老二,最贵的是 OpenAI,860 亿美金,第二贵的就是 XAI,240 亿美金。你这么贵的公司,前面人家都说了这么多声音来了,在这样的一个月份里不发出点声来,有点过不去。所以,马斯克也就没有办法,只能在这个时候把 Grok 2 拿出来了。

Grok 2 到底算不算开源呢?哼,不能算,因为 Grok 1 是开源的,虽然开源了,也是个假开源,没什么人用。而现在给出的数据是 Grok 1 有 13,140 亿参数,使用谷歌 Jax 和 Dax 的架构进行训练,MOE 就是多模型的这种专家结构进行搭建的。这是 Grok 1。Grok 2 到底是什么样的模型,谁也不知道,他也没说,说这东西就来了,也没有任何问答出来。这就是马斯克现在拿出来的东西。当时 Grok 1 出来的时候,我都感觉 Grok 这个模型是准备放弃了,不玩了。

结果,马斯克现在发了2,而且据说还在训练Grok 3,都在开干。但是Grok 2现在还不知道到底是不是开源。理论上说,未来不定什么时候他就开了,而马斯克都是比较随性,可能会突然开源,夸嚓把代码往那一扔就不动了,你爱使不使。能用不起来他就不管了。

现在GitHub上,XAI组织架构下只有一个开源项目,就是Grok 1。现在马斯克也好,大家都在喊一个什么事,说这是你们可以用到的最好的AI,而且最便宜。为什么呢?你只需要花8美元订阅,就可以用起来了。因为ChatGPT是需要20美元订阅的,AnswerOpen Cloud、谷歌的Gemini、微软的Copilot都是20美元一个月,只有XAI说我们家的Grok 8美元一个月,他比别人便宜。

Grok订阅的最大优势就是便宜,而且是可以实时地获得推特内容进行回复。我现在有很多事情需要去查询的时候,我都是去问Grok的,在Grok 2出来之前就开始这么干了。为什么呢?就知道别人在说什么,特别是有很多发布会,比如明开发布会。你今儿问说发布会要说什么呀,Grok预测的极准确吧,因为有一堆人在下头做预测。他给你搜索完了,总结归纳一下,啪,把东西拿出来一看,第二天就发这些东西,这个还是非常棒的。

风格很独特,风趣幽默,内容有更好的传播性。你用Google生成的内容,再去转发,再去到Twitter里面去流传,他会更加容易被人点赞。其实我们玩Twitter、玩YouTube、玩Facebook,这所有的这些社交媒体,我们要的就是互动。说我发完了以后没有人理我,这是一个很无聊的事情,一定要有人理你。那么API更简单,适合快速集成。

这个呢是Grok自己给出的答案。但是我找了半天,并没有找到Grok API的使用方法,可能还没有放出来。数据处理的政策更加开放透明,而不像是很多其他的公司,他们有很多隐私侵犯的问题。原因其实也很简单,Grok训练就是用我们推特数据训练。我们使用推特,就默认同意把数据交给Grok去训练,他也不到外边再去拿别的数据了。而且你发推特的目的就是为了让人看。既然已经被人看了,Grok再给我训练一下,也就这样。所以他的数据政策相对来说比较简单。

而且呢,它后边还写说Grok有非常小的、但是很活跃的社区支持的文档更加集中。这个意思特别逗,什么意思呢?就是Grok的功能很少,文档也很少,基本上没有文档,也不需要文档,直接上去使就完了。但是呢,用他的话讲起来,就是这个很小的社区很活跃,知识文档很集中。就是一个话,你看他怎么说,但这个话是Grok自己说的。

Grok还有一个很大的优点,就是回答问题的时候更加百无禁忌。马斯克希望有一个偏右的AI,因为现在绝大部分的AI大模型都是偏左的。那么稍微偏右一点,这个还是可以稍微中和一下。如果所有AI大模型都偏左的话,也是非常让人困扰的事情。这个8美元以后,还有Twitter Premium的一大堆的功能,比如减少广告、增加曝光,这些功能都是送给你的。

所以现在我们能够花最少的钱,使用到的GPT-4级别的大模型,就是Grok了。当然还可以画画了,也是相对比较百无禁忌的画法。Grok到底有什么不一样呢?现在大家其实都接近GPT-4了。Grok 2 mini是在RAG的情况下去使用,所以其实看不太出来差异。

我们现在去Twitter上使用,就是你一个月交了8美金以后,也只能使用Google 2的Mini版,而且是Google 2 Mini的Beta版。Grok 2的这个全量版本到底怎么放出来,什么时候放,现在我们还不确定。从XAI公布的数据来看,已经接近或者是部分超越了GPT-4O了,不过它是跟GPT-4O 5月份的版本相比,现在GPT-4O在外边是有8月7号的版本。那个版本现在还是比不过的,GPT-4O的版本也是在不断更新迭代的。

在使用上,对于问题的理解,比起Bing和Co-pilot,包括国内的豆包,还是有一些差距。我测试了一下,比如说我问了一个问题,这个问题是什么呢?是做了Flux 1的公司,现在拿了哪些投资,估值多少。等于我把这个原问题扔进去,在Grok 2里进去以后,它说我没有找到一个叫Flux 1的公司,也没有找到相关的投融资数据。数据是这样的,而其他几个呢,都很好地理解到了Flux 1是Stability公司的核心人员离职创立的,现在的公司名字不叫Flux 1,而是叫做Black Forest Labs(黑森林实验室),拿了A16Z领投的3200万美金的种子轮投资,而且是没有估值,估值没有公布出来。其他的投资人也有一些罗列,除了A16Z之外,其他都是哪些人投资的。

在这一点上,Grok 2还是要稍微的弱一些。那么现在的Grok 2能干什么呢?第一个就是幽默,他回答你的问题经常是比较幽默的,比如说有人问他说:“你给我画一个蒙娜丽莎行吧。”我说行,但是这个蒙娜丽莎我画出来是歪嘴的行吗?他都是这样来幽默的。最有用的是基于推特内容的检索,就是你问任何问题,他都说我检查了一下推特。

现在大家都在讨论这个问题。那么现在的风向是向哪个方向偏移的?这个是最好用的,可以进行简单问题的回答。像刚才我去问的,Flux 1的这个公司融了多少钱,估值多少,他就没有办法去正确理解和回答了。

而最后的一个,也就是Grok 2最出圈的是什么?就是画画。大家现在都在拼命地画画,靠图出圈。Flux 1的这个模型是可以随意调用的,但是还是有一定频度限制。8美元的用户应该是每多少个小时吧,可以花二三十张。还有一种是16美元的用户,就是Twitter。有一个更贵的叫Premier加的一种用户,他们是完全没有广告,而且可以画更多的图,对于图片基本上是不设限的。

咱们从几个方面来讲这个图片受限的问题。第一个叫引用风格。我说我要宫崎骏风格的动画,或者是迪士尼风格的绘画。OpenAI的DALL·E 3,对不起啊,这个已经违反了我的政策,不跟你玩了。Midjourney和Flux 1不理你,照样出一点问题没有。

如果你使用名人,这个特别有意思。比如你使用马斯克,使他的名字作为主体句话,DALL·E 3直接拒绝工作,说对不起,我不能去用名人给你画画。用Midjourney画了,而且效果极好。用Flux 1去画也能画得不太像。当然,咱们在推特上看到很多非常像的马斯克的绘画,那是怎么弄的?多从事几次,可能就能得到一个比较好的结果。

那你说我去画一个卡马拉·哈里斯,行不行?DALL·E 3直接拒绝了,说对不起,我不能画。Midjourney也拒绝了,说对不起,我也不能画。说现在是大选期间,所有的总统候选人我都是不画的。Grok 2的模型,也就是Flux 1,它就画了,没有任何问题。画完了以后还提醒说……

选举期间,所有跟选举相关的信息,请到官网上去查询。我就是个画画的,你别问我啊,不要说我这给你造谣了啊。我给你告诉官网在什么地方。那你说这个川普给不给我画?我说给我画一个川普举枪射击的图,还有暴力,还有鸣人。达里3拒绝了,Midjourney也拒绝了,Grok 2二话不说,给你画了一个川普举着枪在那打枪的图画。但是呢,后边也是提醒说,请到VOTE.GOV官方网站去看选举信息。

所有这种名人的Grok 2都是百无禁忌,想画啥画啥。色情内容、比基尼可以画,再衣服变少他就不干活了。这就是现在的Grok 2的这种百无禁忌的绘画。当你问Grok 2说,你画画有这个禁忌没有啊?你不能这么画啊。Grok 2自己的回答是什么?那我限制什么呢?

第一,生成的图片不应该包含过多的暴力与血腥内容,但你看川普开枪的得给你放。第二,色情与露骨内容,任何形式的色情或露骨内容都是禁止的。仇恨和歧视内容,不生成包含仇恨言论、歧视性内容的图片。版权和知识产权,复制版权内容,生成图片不应该直接复制或模仿现有版权保护的作品。名人肖像,对于知名人物的肖像需要谨慎处理,避免直接复制或者使用其肖像权。

反正我在Grok 2里头画的贺锦丽、画的川普、画的马斯克,都是能看出人的,没有任何问题。所以这个就形同虚设。第三,技术限制,分辨率和细节,生成的图片可能在分辨率和细节上有所限制,具体取决于生成模型的性能。然后复杂度,过度复杂的场景或细节可能无法准确生成。他说给我生成1万个小人就别想了。然后隐私和个人信息,个人身份信息不应生成包含个人身份信息,如身份证号、地址等的图片。文化和社会敏感性。

文化敏感性,就是避免生成可能被视为对特定文化或宗教不敬的图片。政策与当地法律生成的图片必须符合当地法律法规,特别是在涉及到版权、隐私、儿童保护等方面。生成频率可能存在每日或每月生成次数限制,以防止过度使用。我估计像我这种交8美元的,每天应该可以生成20-30张。

内容审查自动审查生成的图片,可能需要通过日常自动或人工审查,以确保符合上述限制。这就是现在GROK 2对自己进行图片审核的一个解答。虽然我觉得他做得不好,特别是名人肖像又搞得非常棒,完全都已经拿出来了。甚至我去尝试了一下,我说让疯狂马里奥穿上星球大战里边的风暴兵的制服去追赶米老鼠和机器猫,所有的一种IP人物都给你画在上面。他反正是百无禁忌,看看地表最强保护部到底要干嘛。

马斯克呢,肯定是被玩坏了,各种马斯克的梗图在X上满天飞,包括马斯克跟扎克伯格两个人在对打,打擂台。马斯克把自己吃成了个大胖子,这些都在上面有。各种名人、各种IP、各种风格也是满天飞。刚才我们讲这个疯狂马里奥身着星球大战暴风兵制服,正在追逐米老鼠和机器猫,这一条达利直接拒绝了。Midjourney和Grok 2画的都还是不错的,地表最强法务部一般指的是任天堂和迪士尼,他们就该努力折腾了。

那么AI生图的版权问题,包括这种叫侵犯商标权和侵犯特定的注册商业形象的这种群,可能应该在未来一段时间就会去诉讼了。否则没法整,因为大多数人其实还是关起门来用。一旦把这个图拿出来以后,谁说这个到底是生成的还是自己改的,你是说不清楚的。但是在这种YouTube里头,大家是在Twitter上用,在这样的情况下。

你把它生成的很像米老鼠,一眼就看出来这是米老鼠,那是奥利奥,这个肯定是会被告的。马斯克算是真正的找到了X和XAI正确的打开方式。大模型好不好用其实并不重要,大模型该做的事情,XAI基本上都没做,什么意思?比如API,XAI现在就没开,TOKEN计费也没有,微调什么,怎么去嵌入多模态理解,这些东西实际上都没有多模态理解。据说Grok 2上是有这个功能,但是现在还没有办法去调用,因为现在我们使用的Twitter上的Grok的这个接口,是没有上传图片的这个按钮,所以你并没有办法去让他说这个图片在讲什么。开源现在AI其实做得并不好,各种第三方插件和系统的适配与集成,现在他也没干。真正的大模型公司,其实每一次推出新的大模型以后,就要很努力地来去做这些事情,这些事XAI都没干,那他干了一个什么呢?Grok 2其实是一个很好的基于X的应用,他给了你一个可以在X上真正用起来的东西。它可以很好地利用x.com的数据,回答各种各样的问题,他回答其实还算靠谱。现在只有Grok可以调用,其他人你都是调用不了Twitter的数据的,因为非常的贵。刚才我们在上一个故事里边讲到的Wordware就是因为实在太贵了,玩不起了。你去调用Twitter数据是非常麻烦的,生成的内容特别是图片,极大地提升了x.com的价值,因为他现在这些图片大量地在推特里边去流传。为什么这个活跃度?如果我们看到了一个马斯克跟这个川普两个人在这打情骂俏的图片,那用户的活跃度就会直线上升,大家都会去点一下,都会去转发一下,都会去点个赞,评论两句,这个带来的是什么?带来的是更多的广告展示机会。

更多的广告收益,所以这个东西对推的是非常有利的。而且前面我们讲了8美元一个月,也是所有的这些AI应用里边最便宜的一个。那大家就定呗,订阅用户上升,也会直接提升整个的会员收入。而且我告诉你,你一旦订阅了XAI 8美元一个月的这个套餐,大家会变成话痨了,会七差咔嚓上去说的,要不然那8美元不亏了吗?

我现在每个月大概能挣回4-5美元来,但是我这8美元还没有一起挣回来。最终,Grok2对于X来说,算是一个肥水不流外人田。我自己的内容发到推特上去,让推特能够产生更好的互动,能够挣到广告费,这就是他们现在在干的事情。

对于马斯克来说,推特440亿美金把它买下来,现在再值多少钱已经不好说了,但是外边还有一个230亿美金的XAI。所以Twitter买下来的过程中,如果把XAI的这个价值算上去,其实应该并不亏。这一段时间,未来不排除说再把这两个项目捆绑在一起去上市,或者说重新把其中的一个扔上市,再把这个钱再挣回来。

而这个才是马斯克再去推Grok的初衷。他不会去说我要跟OpenAI竞争,或者跟Anthropic、谷歌Gemini去跟他们竞争。我就在这一亩三分地上把Twitter伺候好就完事了。希望国内的,比如像微信、抖音就字节跳动,他们也可以以这个为核心,真正的做一些与自己家的社交类产品结合更紧密的大模型应用出来,而不是说一个一个的都惦记出来,说我去做一个对第三方开放友好的大模型。我希望靠大模型成为新时代的平台,不要走那条路。

所以我觉得,马斯克的AI算是给我们打了一个很好的样本,这就是我们今天讲的第二个故事。

 

Both comments and pings are currently closed.

Comments are closed.

Close Bitnami banner
Bitnami