华为盘古大模型陷入通义千问抄袭风波,为何遵守了开源协议却依然被骂?当“遥遥领先”的民族自豪感遭遇“瓜田李下”的尴尬现实。

华为盘古大模型陷入通义千问抄袭风波,为何遵守了开源协议却依然被骂?当“遥遥领先”的民族自豪感遭遇“瓜田李下”的尴尬现实。已关闭评论

华为开源了盘古大模型,被指抄袭。华为到底冤不冤呢?

大家好,欢迎收听老范讲故事的YouTube频道。华为开源了他的盘古大模型,它的模型呢,反正依然是山海经风格的起名。原来呢,没有开源,都是说我们内部开发内部使用,或者说我们专门供政府和大企业来使用。但是现在发现开源这条路不错,那我也开源吧。结果开源了以后就出事了。

它是6月30号在GitHub上就直接开源了,号称呢是在升腾芯片上训练出来的大模型。以前呢,我们的大模型大多是在英伟达芯片上训练,但是呢可以在升腾的芯片上去做推理。现在说,我直接在升腾芯片上做训练,也算是一种小的突破吧。

他呢,其实发了两个模型:一个是72B的MOE的模型,就是混合专家模型;然后呢,有一个70B的稠密模型。做呢做完了,但是准备开源还需要准备一段时间。开源这件事,不是说你做完了,把它扔出来就完了,还是有很大的工作量需要干的。比如说你要去写开源手册、许可证,这个还不是那么容易,还在做。

More

德国全境禁用DeepSeek只是冰山一角?昔日我们建墙防外,今日欧美反向修墙防内,AI时代的数据主权争夺战已然打响。

德国全境禁用DeepSeek只是冰山一角?昔日我们建墙防外,今日欧美反向修墙防内,AI时代的数据主权争夺战已然打响。已关闭评论

德国全境禁用DeepSeek,以后这墙要反着修了吗?

大家好,欢迎收听老范讲故事的YouTube频道。2025年6月27日,德国数据保护专员梅克坎普宣布,已经要求苹果和谷歌从德国应用商店下架DeepSeek应用程序了。德国不是第一个,估计应该也不是最后一个。第一个是谁?意大利。意大利在每一次反对AI这件事情上,都是占第一个。原来他还反过OpenAI的ChatGPT。2025年初,也就是R1刚出来的时候,就直接给封了。

欧盟的其他国家现在是一个什么状态呢?他们比较纠结。荷兰是禁止政府手机安装DeepSeek的APP;比利时是建议公务员的手机不要安装,但是不强制;西班牙是有消费者权益组织在呼吁,政府到目前为止没有采取任何的措施;英国表示说他们在持续的监测,目前还没有做出反应。

其他的一些国家对DeepSeek是什么样的一个态度呢?加拿大所有的政府设备禁止使用DeepSeek;丹麦政府设备禁止使用,但是丹麦有5个大区里头,只有3个在执行,剩下两个还在看。

More

从乔布斯“灵魂伴侣”到山姆奥特曼的座上宾,强尼艾夫的IO团队以65亿美金估值并入OpenAI,是AI iPhone的黎明将至,还是又一个AI硬件泡沫的开始?

从乔布斯“灵魂伴侣”到山姆奥特曼的座上宾,强尼艾夫的IO团队以65亿美金估值并入OpenAI,是AI iPhone的黎明将至,还是又一个AI硬件泡沫的开始?已关闭评论

OpenAI以65亿美金收购了强尼艾夫爵士的IO团队,要做AI iPhone了吗?大家好,欢迎收听老范讲故事的YouTube频道。

OpenAI最大的硬件收购来了。没办法,他自己3,000亿美金的估值了,现在收购任何的团队都是比较贵的,所以又变成了有史以来最大的AI硬件团队收购。这一次呢,是以50亿美金的纯股票交易收购强尼艾夫创建的IO团队手里边77%的股票。

这个团队呢,2023年底其实已经被OpenAI投资过了。当时投资了以后占股了是23%。这一次呢,等于是交50亿美金,或者叫以50亿美金的对价收购了剩余的77%的股票。这个65亿美金怎么算出来的?很简单,50亿除0.77就等于65了。所以它的总价值呢,是按照50亿美金收购77%股票的方式反推出来的。

More

深度剖析谷歌A2A:AI智能体协作的标准化未来看似诱人,但“看起来很美,就不要想得太美了”,我们能从历史复杂系统的失败中吸取哪些宝贵教训以指导当前选择?

深度剖析谷歌A2A:AI智能体协作的标准化未来看似诱人,但“看起来很美,就不要想得太美了”,我们能从历史复杂系统的失败中吸取哪些宝贵教训以指导当前选择?已关闭评论

谷歌的A2A看起来很美,就不要想得太美了。

大家好,欢迎收听老范讲故事的YouTube频道。

“看起来很美,就不要想得太美了。”这句话哪来的呢?来自于猫腻的小说《将夜》。这个里面有一句话叫:“你长得很美,所以就不要想得太美了。”事情是在哪呢?是在隆庆皇子看到桑桑酒量很好,就想收其为侍女。桑桑呢,是里面的一位女主,而隆庆皇子呢,长得很漂亮,而且身份地位非常高,手持大义的一个人。他提出了这样的一个要求,当时的主人公宁缺就进行了反击,说:“你长得很美,就不要想得太美了。”意思是什么呢?就是保持对现实的清醒认知,你要知道自己是谁,几斤几两。而且呢,也要敢于对强权逻辑进行挑战。

那么,这个事儿跟今天咱们要讲的谷歌A2A有什么样的关系呢?首先先讲一下,谷歌A2A到底是个什么东西。

More

Manus独领风骚成过往?字节扣子空间与百度心想APP强势入局,深度评测揭示AI Agent新格局下谁能主导复杂任务自动化与MCP生态。

Manus独领风骚成过往?字节扣子空间与百度心想APP强势入局,深度评测揭示AI Agent新格局下谁能主导复杂任务自动化与MCP生态。已关闭评论

Manus的后劲来了。百度、字节都有了自己的agent产品上线。

大家好,欢迎收听老范讲故事的音乐节目频道。字节上线了扣子空间,百度上线了心想APP。Manus的光环不再。Manus本身就属于意外爆火,当时它突然火了以后,咱们还做了直播,说这个东西没有什么技术门槛,只是产品设计的很有意思。

Manus跑去跟阿里合作了之后,那字节、百度说这不行,咱们也得有自己的产品上线。又不是有多难做的东西,那就做呗。我呢,搞了一个字节扣子空间的邀请码,咱们呢试一试,看看这个产品到底怎么个用法儿。

Manus呢,到现在我也没用上。原因也很简单,我去申请测试,等了很久,到现在都已经开始收费了,也没有收到说你可以来玩一下的这个邀请。所以也就别费劲了。我自己呢也没有特别着急,我要特别着急想用的话,随便找两个人去要一些邀请码,也还是可以搞得定的。既然没有那么热心的话,也就没有上心去找嘛。

More

震撼发布!GPT-4.1,牛马的新工具来了,专为程序员打造百万Token上下文API利器,超低价与高指令遵从度能否颠覆Gemini与Claude主导的工程市场格局?

震撼发布!GPT-4.1,牛马的新工具来了,专为程序员打造百万Token上下文API利器,超低价与高指令遵从度能否颠覆Gemini与Claude主导的工程市场格局?已关闭评论

GPT4.1发布了!牛马们的好工具终于上线了。大家好,欢迎收听老范讲故事的YouTube频道。

GPT4.1突然发布,这是程序员们的工具。普通的用户你是用不上的。你用网页版,你用APP,甭管是手机端的还是电脑端的,你是付费用户还是免费用户,你都用不到GPT4.1。只有程序员可以通过API调用GPT4.1。

但是这个事儿对于非程序员来说,也是有很大改变,很大帮助的。那么我们今天来讲一讲,GPT4.1到底是一个什么样的东西。

首先,它有100万TOKEN的上下文,这个是非常吓人。100万单词吧,基本上你可以直接塞到GPT4.1里头去,它统一给你处理。而且大海捞针做的也很不错。

More

开源巨头Meta深陷Llama 4作弊风波:高分低能引爆质疑,测试数据竟混入训练集,AI圈还能信任谁?

开源巨头Meta深陷Llama 4作弊风波:高分低能引爆质疑,测试数据竟混入训练集,AI圈还能信任谁?已关闭评论

Meta的Llama4发布之后,深陷作弊风潮。大家好,欢迎收听老范讲故事的YouTube频道。今天咱们来讲一讲Meta的Llama4被人怀疑作弊,他到底是不是真的作弊了。

前面我们做过一期视频,说Llama4发布的时候没有太大的响动,因为它出来以后发现,虽然评测还不错,但是使用起来并没有感觉比现在主流的模型强到哪去。现在不行了,负面消息传出来了,说你大模型出来的时候跑分的成绩很高,但是我们使起来不是这么回事,有点名不副实的样子,特别是编程的效果极差。

为什么大家去比较编程呢?两个原因:
第一个,去玩这些开源大模型的,一般都是程序员。
第二个,编程是一个相对来说标准比较统一的评测。你编得出来编不出来,编完了效果怎么样,这个一眼就能看出来,没法作假。你说我写个诗或者写个小说,这个玩意还有仁者见仁、智者见智的时候。这编程这个东西,对就是对,不对就是不对,或者你做完了以后它的效果有问题,一眼就能看出来。所以现在被人质疑了。

More

Llama 4悄然发布震撼不足?对比DeepSeek与千问,Meta的MOE架构和千万级上下文能否挽回开源领导地位,避免被超级APP浪潮抛弃?

Llama 4悄然发布震撼不足?对比DeepSeek与千问,Meta的MOE架构和千万级上下文能否挽回开源领导地位,避免被超级APP浪潮抛弃?已关闭评论

Llama4发布了。这里的黎明静悄悄,没有什么响动。这是怎么回事?

大家好,欢迎收听老范讲故事的YouTube频道。一觉醒来,Llama4就发布了。扎克伯格亲自在Facebook的REELS(也就是Facebook的短视频里面)发了一条视频,说Llama4发布了,今天是Llama4日。

Llama4呢,一共是有三个版本:
第一个叫Scout(侦察兵版本),总参数1,090亿(也就是109B),活跃参数是170亿,包含16个专家模块。对的,Llama终于也放弃抵抗了,从Llama4开始变成Moe了。在Llama4之前的版本都是单一体的模型,Llama3.3还给了一个400多B的单一模型,到Llama4彻底放弃抵抗了。

现在呢,支持1,000万TOKEN这种上下文,这个是Llama4最大的一个特点。DeepSeek是64K(也就是64,000个TOKEN上下文),现在上下文比较大的Gemini大概是能到2兆(200万),Llama4直接给了一个10兆(1,000万TOKEN),这是它做的一个很创新的点。

More

华为大模型演示翻车现场:time.sleep(6)真的值得大惊小怪吗?老程序员深度解析代码背后的真相!睡6秒不是什么大问题,不过图像RAG,到底是个什么坑?

华为大模型演示翻车现场:time.sleep(6)真的值得大惊小怪吗?老程序员深度解析代码背后的真相!睡6秒不是什么大问题,不过图像RAG,到底是个什么坑?已关闭评论

大家好,

欢迎收听老范讲故事的YouTube频道。今天咱们来讲一讲华为大模型演示翻车现场。

近期呢,非常多的AI相关的项目都在进行演示和发布,特别是国内。为什么它?因为时间到了。通常每年在这个时候也会有很多发布,因为每年在这个时候会开谷歌IO,大家喜欢在谷歌IO的前后进行信息的发布啊。因为谷歌IO算是全世界程序员或者开发者的一个盛会吧。那这个前后进行信息发布的话,如果它被安卓采用了,或者再跟谷歌搭上一点关系的这种技术会有更好的发展空间。

那今年呢,还有另外一个事情,就是拉玛3发布。前面其实国产很多大模型都是跟拉玛2有千丝万缕的联系。其实当时就已经预言过,我说拉玛3出来看多长时间之后,国内的大模型会争先恐后的再更新换代一波。现在呢,这个时间点就到了。前面阿里的通1,000问2.5发布,这两天还有几个,一个是零一万物的啊,叫e latch大模型发布,然后字节跳动的豆包大模型前两天也发布了啊。这豆包大模型主打的一个便宜,对别人的价格都便宜非常多,因为大模型的价格一般是按TOKEN算的啊,一般一个汉字是一个TOKEN,大概四个字母,还是几个字母的英文单词,是一个TOKEN啊,它这个算法比较奇怪。

More