Llama 4悄然发布震撼不足?对比DeepSeek与千问,Meta的MOE架构和千万级上下文能否挽回开源领导地位,避免被超级APP浪潮抛弃?

Llama 4悄然发布震撼不足?对比DeepSeek与千问,Meta的MOE架构和千万级上下文能否挽回开源领导地位,避免被超级APP浪潮抛弃?已关闭评论

Llama4发布了。这里的黎明静悄悄,没有什么响动。这是怎么回事?

大家好,欢迎收听老范讲故事的YouTube频道。一觉醒来,Llama4就发布了。扎克伯格亲自在Facebook的REELS(也就是Facebook的短视频里面)发了一条视频,说Llama4发布了,今天是Llama4日。

Llama4呢,一共是有三个版本:
第一个叫Scout(侦察兵版本),总参数1,090亿(也就是109B),活跃参数是170亿,包含16个专家模块。对的,Llama终于也放弃抵抗了,从Llama4开始变成Moe了。在Llama4之前的版本都是单一体的模型,Llama3.3还给了一个400多B的单一模型,到Llama4彻底放弃抵抗了。

现在呢,支持1,000万TOKEN这种上下文,这个是Llama4最大的一个特点。DeepSeek是64K(也就是64,000个TOKEN上下文),现在上下文比较大的Gemini大概是能到2兆(200万),Llama4直接给了一个10兆(1,000万TOKEN),这是它做的一个很创新的点。

More

马斯克Grok-2登场,可订阅才8美元,真的划算吗?推翻AI市场的游戏规则,Elon Musk的肖像被拿来玩儿梗图!

马斯克Grok-2登场,可订阅才8美元,真的划算吗?推翻AI市场的游戏规则,Elon Musk的肖像被拿来玩儿梗图!已关闭评论

Grok 2出来了,老板马斯克就是拿来开涮。马斯克各种梗图突然开始满天飞了,这是什么东西呢?就是XAI做的Grok大模型的第二版,Grok 2发布了,包括特朗普跟贺锦利的各种梗图也在飞了。其中有一张是特朗普去抚摸贺锦利怀孕的肚子呀。但其实玩的呢,并不是Grok 2,而是什么叫Flux 1。

首先分析下时间点,为什么在这个时间要去出Grok 2呢?第一个,3月份我开始测试了,Grok 2已经开始测试了,测试到8月份呢,也差不多开始出了。而且3月份,Grok一开源了,然而开源之后就再也没有更新过任何的代码,也没有去回答过任何的issues或者是Pull request,这个都再也没有动过,完全死水一潭。马斯克的开源就是这么开的,我开了,用不用是你的事,我反正不理你,我也不会再更新任何代码。

包括推特,原来开源的推荐算法,包括Grok 1都是这样的,开了就挂在这了,爱使不使。而且它开出来以后,你自己到底能不能部署得上去,能不能把他们这个用起来去测试,他就完全不管了。你提任何问题,他也不理你啊,这就是马斯克开源。

More