8 月 27
Luke Fan AIGC , Musk传奇 , OpenSource 5090D) , AI Agent , AI大模型 , DeepSeek , Grok-2 , H20 , JAX , Kimi , LLaMA , Meta , MIT协议 , MOE架构 , NVlink , OpenAI , SGLANG , UC伯克利 , XAI , YouTube频道 , 上海交通大学 , 中美科技 , 人工智能 , 全球协作 , 华为 (盘古大模型) , 商业许可 , 尹良生 , 巨硬 (Gigabrain) , 开源 , 开源生态 , 开源许可 (License) , 微软 (Microsoft) , 技术借鉴 , 技术科普 , 抄袭争议 , 显卡要求 (H800 , 智谱 , 深度解析 , 百度 , 科技评论 , 算力 , 老范讲故事 , 自主研发 , 苹果 (Apple) , 行业内幕 , 谷歌 (Google) , 郑连敏 , 部署难度 , 阿帕奇2.0 , 马斯克 , 高性能计算
VIDEO
马斯克终于开源了他的Grok-2。虽迟但到,这背后隐藏着哪些不为人知的秘密呢?
大家好,欢迎收听老范讲故事的YouTube频道 。
马斯克最终还是开源了他的Grok-2。原来我们还嘲笑过他,Grok-1开源完了,往那一扔就再也不管它了,有任何人提问题,你也不说什么。Grok 4都出来了,现在Grok 2都没开源出来。马斯克说:“那我们下周开源。”当时是这么讲的。然而下周完了以后,好像还是又等了那么一段时间,稍微晚了这么几天吧,Grok 2最终还是开源出来了。而且承诺呢,6个月之内,或者说在年底之前吧,有可能会去开源Grok 3。但是马斯克的话嘛,大家相信,就是他说了的事会做,但是未必按时间做。
马斯克的开源呢,只能算是符合非常广义的开源。这话什么意思呢?开源也是分原教旨主义者的,他们是肯定不会认可马斯克在开源的。第一个,马斯克不是当时发布产品马上开源,而是要过一段时间,甚至是过了一年多才去开源。而且现在他开源出来的这个版本,远远落后于当前主流模型。当然Grok 2呢也不算特别落后,它在当时刚推出的时候,应该是跟GPT-4不相上下的一个水平,但是跟后边4O,以及后边O1、O2这些东西就没法比了。跟当前的主流模型,像什么GPT-5、Grok-4、Claude 4或者是Gemini 2.5这些,它是比不过的。
More
6 月 17
Luke Fan AIGC , 华为很厉害 , 英伟达,NVIDIA,黄教主,GPU AI芯片 , AI芯片之争 , CUDA , EDA软件 , NVlink , 专利壁垒 , 中美关系 , 中美科技战 , 乙烷 , 人工智能 (AI) , 任正非 , 伦敦贸易会谈 , 供应链安全 , 光刻机 , 出口管制 , 华为 , 国产替代 , 国际关系 , 平台效应 , 开发者生态 , 技术制裁 , 技术革命 , 新能源汽车 , 日内瓦协议 , 时事解读 , 昇腾芯片 , 法制化市场化 , 生态与标准之争 , 电力优势 , 石墨 , 科技分析 , 稀土 , 统一大市场 , 老范讲故事 , 芯片封锁 , 英伟达 (Nvidia) , 观点输出 , 财经评论 , 贸易战 , 逆向工程 , 高性能计算 , 黄仁勋
VIDEO
黄仁勋与任正非的隔空对话:AI芯片之争。中美伦敦贸易会谈——谁都没说,但谁都真正关心的话题。
大家好,欢迎收听老范讲故事的YouTube频道。今天咱们来讲一讲任正非的人民日报文章,以及黄仁勋给他的回复。6月10号头版头条占了1/3的版面,叫《国家越开放,会促使我们更加进步——对话任正非》。这样的一篇文章登上了人民日报的头版。这个排版的艺术要注意,人民日报呢,一般头版上最多是给你个标题,或者写一小段,后边就跳转到多少版面去了。直接占1/3版面写这样的一篇文章的话,这个是要表明一个态度。而且很重要的是时间点,6月10号这篇文章刷出来的。这是个什么时间点呢?中美伦敦会谈是6月9号到6月13号,这是中美伦敦会谈的第二天。把这样的一篇文章给刷到人民日报头版上去了,所以这个也是我们表明的一个态度:就是你卡我吧,我告诉你卡了我以后会怎么样。
那任正非说了些什么呢?第一个,没有想过,想也没有用。不去想困难,干就完了,一步一步往前走。这是一个大的重点。我记得原来有一本小说叫《绝代双骄》,有人问他说,都遇到这样的难事了,你咋不发愁呢?当时那个主角应该叫江小鱼,他的经典回复是:如果发愁能够有用的话,我早就发愁去了。所以任正非呢,现在也是讲的干就完了,你想这玩意也白想。
More
2 月 26
Luke Fan AIGC , DeepSeek大模型 , OpenSource BF16精度 , Blackwell架构 , CPU超频对比 , CUDA-LESS , CUDA优化 , CUDA优化应用 , DeepSeek , Flash Attention 2 , Flash Attention 3 , Flash MLA , Flash MLA核心功能 , FP16 , FP32 , GB200芯片 , GPU优化技术 , GPU内存带宽优化 , GPU内存架构 , GPU带宽提升 , GPU性能优化 , GPU技术分析 , GPU架构设计 , GPU禁运 , GPU超频 , H100芯片 , H800芯片 , HBM内存 , Hopper系列芯片 , Huggingface优化 , H系列GPU性能 , Llama CPP优化 , MIT协议 , MIT开源协议介绍 , Transformers架构 , 中国GPU限制 , 中国芯片制造 , 分块调度 , 分页式间值缓存 , 大模型推理 , 大模型推理优化 , 并行计算 , 开源创新 , 开源解决方案 , 开源项目 , 显卡市场格局 , 显卡性能提速 , 显存碎片管理 , 美国出口限制 , 英伟达 , 英伟达GPU市场 , 英伟达H100提速 , 英伟达H800带宽 , 英伟达Hopper架构 , 英伟达商业策略 , 英伟达市场竞争 , 英伟达新架构 , 高性能计算 , 高效多层注意力解码内核
VIDEO
DeepSeek开源周第一炮打响,这次英伟达可真的有的愁了。大家好,欢迎收听老范讲故事的YouTube频道。DeepSeek号称要做开源周,也就是在这一周里边,连续5天发布5个开源项目。那么第一炮打的是什么呢?这个产品叫Flash MLA,这是一个MIT协议的开源项目。待会我们再去讲什么是MIT协议。一天上来就直接获得了几千个星星,就是你把项目发布到GitHub上以后,如果有人喜欢的话会打一个星星。打了星星以后的话,这个项目未来有各种的更新和迭代,我们是会收到通知的。所以很多的开源项目,是用星星的数字来衡量自己项目的受欢迎程度的。
这个项目呢,其实对于绝大多数的使用者来说,短期之内是不会有影响的。什么叫短期?可能就是几个月的时间之内,不会有特别大的变化。但是,可能过了这几个月,这个变化就会逐渐的显现出来。英伟达这次到底能不能挺得住,是会变得好还是会变得坏?这就是我们今天要讲的故事。
英伟达面对Flash MLA这样的一个项目呢,应该有点哭笑不得。为什么呢?这个是必须在英伟达Hopper系列芯片上使用的一个技术,也就是离开英伟达芯片你跑不了。所以这玩意是给英伟达芯片再去做优化。但是呢,这里有个问题,英伟达的H100是被美国禁运的,中国是不可以购买的。中国只可以购买H800,也就是英伟达经过精准的刀法裁切以后的这个版本。它在H800的这个基础上呢进行了提速,这就是这一次的Flash MLA真正给出来的东西。
More
12 月 11
范, 路 英伟达,NVIDIA,黄教主,GPU AI产业 , AI算力 , AI芯片 , AI行业 , Coreweave , CPTPP , GPU , HBM缓存 , 一卡难求 , 中国市场 , 中国芯片产业 , 中美关系 , 中美贸易 , 云计算 , 交换机 , 产业升级 , 产业政策 , 产业转移 , 产业链 , 产品质量 , 代工厂 , 企业合规 , 供应链 , 供应链重构 , 全家桶策略 , 全家桶销售 , 全球产业链 , 全球化 , 全球贸易 , 制裁清单 , 半导体 , 华为 , 华为云 , 反垄断 , 反垄断法 , 反垄断调查 , 发展机遇 , 台积电 , 合并审查 , 商业道德 , 国际博弈 , 国际贸易 , 地平线 , 垄断审查 , 增长策略 , 处罚条例 , 市场份额 , 市场垄断 , 市场监管 , 市场竞争 , 市场竞争状态 , 开源承诺 , 技术垄断 , 技术壁垒 , 技术监管 , 捆绑销售 , 摩尔线程 , 数字经济 , 数据中心 , 数据传输 , 数据处理 , 数据安全 , 数据通信 , 智能计算 , 服务器 , 欧盟法律 , 环境影响 , 用户选择 , 监管政策 , 硬件整合 , 硬件销售 , 科技创新 , 科技制裁 , 科技巨头 , 科技投资 , 科技独立 , 科技竞争 , 竞争法 , 算力中心 , 算力卡 , 网络互联 , 网络设备 , 美国制裁 , 美国商务部 , 自主替代 , 芯片产业 , 芯片代工 , 芯片制造 , 英伟达 , 越南 , 越南布局 , 越南建厂 , 跨国并购 , 软件能力 , 高性能网络 , 高性能计算 , 高速网卡 , 麦洛斯 , 麦洛斯收购案 , 黄仁勋
VIDEO
英伟达突然被中国进行了反垄断审查,这事他冤吗?大家好,欢迎收听老范讲故事的YouTube频道。今天咱们来讲一讲,这家AI时代最赚钱的公司,在中国突然遇到审查了,究竟是怎么回事?
首先呢,英伟达不光是在中国受到审查,欧盟和美国也在对他进行反垄断审查。法国呢,主要是在今年7月份,对他去投资一个叫Coreweave的公司进行审查。Coreweave干嘛的?他是买了很多的英伟达的显卡,去做算力中心出租的。你说OpenAI,我用微软的就行了,或者谷歌用自己的,亚马逊也用自己的,但总还有一些小一点的公司说,我们想要零散的去租一些英伟达的算力,去进行模型的训练、微调或者推理。Coreweave就专门干这个的,而且他应该是在这一块做了最大的一家,英伟达在里边进行了大量的投资。法国政府说,我调查一下你里头有没有一些其他的问题。
12月7号呢,欧盟也展开了对英伟达的反垄断审查。审查的是什么?叫捆绑销售,就是你买了英伟达的算力卡,你必须要再买我其他的哪些东西。这个其实跟这一次中国对英伟达展开的反垄断调查基本是一个原因。美国商务部呢,对英伟达是提出了质询,但是呢并没有正式立案。原来呢讲说美国商务部对英伟达立案进行反垄断审查了,英伟达呢出来辟谣了,说他们质询了,我们愿意配合调查,我们有信心,完全都是开放的。大家选择我们的产品,是因为我们的产品质量好,因为我们的产品性能好,而不是因为我们进行了捆绑销售。
More
7 月 28
Luke Fan AIGC Aceropic Cloud 3.5 Sonnet , API销售 , ChatGPT , GPT-4 Mini , GPT-5发布 , GPT5 , GT5推出 , iPhone 16发布会 , Microsoft OpenAI合作 , OpenAI , OpenAI Plus , OpenAI估值 , OpenAI压力 , OpenAI发展策略 , Redit , Steal the home , 上市计划 , 云服务成本 , 云计算 , 亚马逊因素 , 人员成本 , 估值 , 商业模式创新 , 大模型之争 , 小模型调试 , 市场份额 , 市场机制 , 市场竞争分析. , 市场策略 , 市场验证 , 开放AI生态系统 , 开源模型 , 微调与RAG , 微调免费 , 微软 , 微软销售策略 , 投资风险 , 拉玛3.1405B , 数据处理 , 新兴竞争者 , 新技术应用 , 未来科技趋势 , 核心竞争力 , 梅塔 , 模型训练 , 特斯拉案例 , 研发经费 , 竞争力提升 , 竞争激烈 , 端到端语言训练模型 , 苹果 , 融资需求 , 行业前景 , 行业开拓 , 行业新趋势 , 行业规范 , 行业震荡 , 计算成本 , 谷歌 , 谷歌I/O , 高性能计算 , 高质量训练数据
VIDEO
GPT5如果再不出的话,可能就没有机会了。大家好,这里是老范讲故事的YOUT5频道。今天咱们来讲一讲OpenAI现在身上的压力到底有多大。再不出GPT5,可能真的要出事儿了,因为前面吹过的牛实在太多了,特别是Sola这样的模型,号称可以直接生成长的视频出来,到现在已经半年了,还没有真正拿出来,只是每个月放出几个视频而已。而其他各个公司,按照Sora方向做的产品,已经都开始在公众测试了,这对他们来说一定是巨大的压力。
前一段时间发布的Anthropic Claude 3.5 Sonnet,也把压力给到了OpenAI,因为这个模型的效果已经非常好,而且极其便宜。更不要说昨天刚刚发布的Llama3.1405B这样的一个开源模型。前面咱们讲的Anthropic的模型还是闭源的,而Llama可是个开源模型。405B的话,在各个层次上,都赶超了OpenAI的Chat GPT-4。老大的位置有可能会丧失。
More