华为盘古大模型陷入通义千问抄袭风波,为何遵守了开源协议却依然被骂?当“遥遥领先”的民族自豪感遭遇“瓜田李下”的尴尬现实。

华为盘古大模型陷入通义千问抄袭风波,为何遵守了开源协议却依然被骂?当“遥遥领先”的民族自豪感遭遇“瓜田李下”的尴尬现实。已关闭评论

华为开源了盘古大模型,被指抄袭。华为到底冤不冤呢?

大家好,欢迎收听老范讲故事的YouTube频道。华为开源了他的盘古大模型,它的模型呢,反正依然是山海经风格的起名。原来呢,没有开源,都是说我们内部开发内部使用,或者说我们专门供政府和大企业来使用。但是现在发现开源这条路不错,那我也开源吧。结果开源了以后就出事了。

它是6月30号在GitHub上就直接开源了,号称呢是在升腾芯片上训练出来的大模型。以前呢,我们的大模型大多是在英伟达芯片上训练,但是呢可以在升腾的芯片上去做推理。现在说,我直接在升腾芯片上做训练,也算是一种小的突破吧。

他呢,其实发了两个模型:一个是72B的MOE的模型,就是混合专家模型;然后呢,有一个70B的稠密模型。做呢做完了,但是准备开源还需要准备一段时间。开源这件事,不是说你做完了,把它扔出来就完了,还是有很大的工作量需要干的。比如说你要去写开源手册、许可证,这个还不是那么容易,还在做。

More

德国全境禁用DeepSeek只是冰山一角?昔日我们建墙防外,今日欧美反向修墙防内,AI时代的数据主权争夺战已然打响。

德国全境禁用DeepSeek只是冰山一角?昔日我们建墙防外,今日欧美反向修墙防内,AI时代的数据主权争夺战已然打响。已关闭评论

德国全境禁用DeepSeek,以后这墙要反着修了吗?

大家好,欢迎收听老范讲故事的YouTube频道。2025年6月27日,德国数据保护专员梅克坎普宣布,已经要求苹果和谷歌从德国应用商店下架DeepSeek应用程序了。德国不是第一个,估计应该也不是最后一个。第一个是谁?意大利。意大利在每一次反对AI这件事情上,都是占第一个。原来他还反过OpenAI的ChatGPT。2025年初,也就是R1刚出来的时候,就直接给封了。

欧盟的其他国家现在是一个什么状态呢?他们比较纠结。荷兰是禁止政府手机安装DeepSeek的APP;比利时是建议公务员的手机不要安装,但是不强制;西班牙是有消费者权益组织在呼吁,政府到目前为止没有采取任何的措施;英国表示说他们在持续的监测,目前还没有做出反应。

其他的一些国家对DeepSeek是什么样的一个态度呢?加拿大所有的政府设备禁止使用DeepSeek;丹麦政府设备禁止使用,但是丹麦有5个大区里头,只有3个在执行,剩下两个还在看。

More

Meta为何砸下百亿重金投资而非直接收购AI数据标注巨头Scale AI?揭秘扎克伯格剑指AI生态霸权,欲借华人天才少年之力挽救Llama开源模型困局的深层战略与考量。

Meta为何砸下百亿重金投资而非直接收购AI数据标注巨头Scale AI?揭秘扎克伯格剑指AI生态霸权,欲借华人天才少年之力挽救Llama开源模型困局的深层战略与考量。已关闭评论

Scale AI得到了Meta超过百亿美金的投资,AI圈又热闹起来了。大家好,欢迎收听老范讲故事的YouTube频道。

Scale AI这个名字怎么好像在哪听说过呢?好像有点耳熟,对吧?他呢,有一位特别传奇的CEO,或者叫创始人吧,叫华人天才少年CEO亚历山大王。当时呢,跳出来指责DeepSeek用H100的就是他。

DeepSeek R1到底是怎么训练的?引起了广泛的关注。DeepSeek自己讲呢,我使用了2,000多块的H800就完成了训练。但是亚历山大王呢,在一次接受采访的时候就出来说了,中国实验室里边拥有的H100的数量远超大家的想象,DeepSeek自己至少有5万块H100。但是这个话呢,没有实际证据,讲完了也就完了。DeepSeek跟亚历山大王之间呢,并没有就这个事情进行认真的探讨,所以这个我们把它当成一种谣传吧。

3月份呢,DeepSeek自己再次发了声明,说他们训练的都是使用的合规的GPU,也就是允许向中国出口的这些GPU。因为如果不说这个的话,美国就有可能要求说禁止使用这玩意儿。DeepSeek就讲了说,甭管是R1也好,V3也好,训练呢都是使用的H800,或者是后面的H20这些GPU训练的。

More

OpenAI豪掷千亿美金打造星际之门,山姆·奥特曼的“民主AI”能否抗衡中国“霸权AI”并重塑全球AI格局引发深思。谁能赢得最后的胜利?

OpenAI豪掷千亿美金打造星际之门,山姆·奥特曼的“民主AI”能否抗衡中国“霸权AI”并重塑全球AI格局引发深思。谁能赢得最后的胜利?已关闭评论

OpenAI的星际之门和民主AI,到底要对抗谁呢?

大家好,欢迎收听老范讲故事的YouTube频道。山姆·奥特曼亲临德州星际之门工地,现场指导工作去了。他在德州阿比林市星际之门工地现场做了一些现场指示,这就是他们星际之门的第一期工程。项目花费呢,首期投入是1,000亿美金,未来四年共计消耗5,000亿美金。但后边的事大家就别太当真了,因为后面还有很多钱可能需要各国政府去掏,待会我们再去讲。

第一期建设呢,主要是软银掏钱。Oracle负责设计、施工和建造,所以现场拍到的照片,大家穿的小背心、安全帽上面都是写的Oracle的字样。计划部署6.4万台英伟达GB 200 GPU,首期的1.6万台英伟达GB 200 GPU应该是在今年夏天就可以完成安装,就可以投入使用了。

More

开源巨头Meta深陷Llama 4作弊风波:高分低能引爆质疑,测试数据竟混入训练集,AI圈还能信任谁?

开源巨头Meta深陷Llama 4作弊风波:高分低能引爆质疑,测试数据竟混入训练集,AI圈还能信任谁?已关闭评论

Meta的Llama4发布之后,深陷作弊风潮。大家好,欢迎收听老范讲故事的YouTube频道。今天咱们来讲一讲Meta的Llama4被人怀疑作弊,他到底是不是真的作弊了。

前面我们做过一期视频,说Llama4发布的时候没有太大的响动,因为它出来以后发现,虽然评测还不错,但是使用起来并没有感觉比现在主流的模型强到哪去。现在不行了,负面消息传出来了,说你大模型出来的时候跑分的成绩很高,但是我们使起来不是这么回事,有点名不副实的样子,特别是编程的效果极差。

为什么大家去比较编程呢?两个原因:
第一个,去玩这些开源大模型的,一般都是程序员。
第二个,编程是一个相对来说标准比较统一的评测。你编得出来编不出来,编完了效果怎么样,这个一眼就能看出来,没法作假。你说我写个诗或者写个小说,这个玩意还有仁者见仁、智者见智的时候。这编程这个东西,对就是对,不对就是不对,或者你做完了以后它的效果有问题,一眼就能看出来。所以现在被人质疑了。

More