2 月 26
Luke Fan AIGC , DeepSeek大模型 , OpenSource BF16精度 , Blackwell架构 , CPU超频对比 , CUDA-LESS , CUDA优化 , CUDA优化应用 , DeepSeek , Flash Attention 2 , Flash Attention 3 , Flash MLA , Flash MLA核心功能 , FP16 , FP32 , GB200芯片 , GPU优化技术 , GPU内存带宽优化 , GPU内存架构 , GPU带宽提升 , GPU性能优化 , GPU技术分析 , GPU架构设计 , GPU禁运 , GPU超频 , H100芯片 , H800芯片 , HBM内存 , Hopper系列芯片 , Huggingface优化 , H系列GPU性能 , Llama CPP优化 , MIT协议 , MIT开源协议介绍 , Transformers架构 , 中国GPU限制 , 中国芯片制造 , 分块调度 , 分页式间值缓存 , 大模型推理 , 大模型推理优化 , 并行计算 , 开源创新 , 开源解决方案 , 开源项目 , 显卡市场格局 , 显卡性能提速 , 显存碎片管理 , 美国出口限制 , 英伟达 , 英伟达GPU市场 , 英伟达H100提速 , 英伟达H800带宽 , 英伟达Hopper架构 , 英伟达商业策略 , 英伟达市场竞争 , 英伟达新架构 , 高性能计算 , 高效多层注意力解码内核
DeepSeek开源周第一炮打响,这次英伟达可真的有的愁了。大家好,欢迎收听老范讲故事的YouTube频道。DeepSeek号称要做开源周,也就是在这一周里边,连续5天发布5个开源项目。那么第一炮打的是什么呢?这个产品叫Flash MLA,这是一个MIT协议的开源项目。待会我们再去讲什么是MIT协议。一天上来就直接获得了几千个星星,就是你把项目发布到GitHub上以后,如果有人喜欢的话会打一个星星。打了星星以后的话,这个项目未来有各种的更新和迭代,我们是会收到通知的。所以很多的开源项目,是用星星的数字来衡量自己项目的受欢迎程度的。
这个项目呢,其实对于绝大多数的使用者来说,短期之内是不会有影响的。什么叫短期?可能就是几个月的时间之内,不会有特别大的变化。但是,可能过了这几个月,这个变化就会逐渐的显现出来。英伟达这次到底能不能挺得住,是会变得好还是会变得坏?这就是我们今天要讲的故事。
英伟达面对Flash MLA这样的一个项目呢,应该有点哭笑不得。为什么呢?这个是必须在英伟达Hopper系列芯片上使用的一个技术,也就是离开英伟达芯片你跑不了。所以这玩意是给英伟达芯片再去做优化。但是呢,这里有个问题,英伟达的H100是被美国禁运的,中国是不可以购买的。中国只可以购买H800,也就是英伟达经过精准的刀法裁切以后的这个版本。它在H800的这个基础上呢进行了提速,这就是这一次的Flash MLA真正给出来的东西。
More
12 月 11
范, 路 英伟达,NVIDIA,黄教主,GPU AI产业 , AI算力 , AI芯片 , AI行业 , Coreweave , CPTPP , GPU , HBM缓存 , 一卡难求 , 中国市场 , 中国芯片产业 , 中美关系 , 中美贸易 , 云计算 , 交换机 , 产业升级 , 产业政策 , 产业转移 , 产业链 , 产品质量 , 代工厂 , 企业合规 , 供应链 , 供应链重构 , 全家桶策略 , 全家桶销售 , 全球产业链 , 全球化 , 全球贸易 , 制裁清单 , 半导体 , 华为 , 华为云 , 反垄断 , 反垄断法 , 反垄断调查 , 发展机遇 , 台积电 , 合并审查 , 商业道德 , 国际博弈 , 国际贸易 , 地平线 , 垄断审查 , 增长策略 , 处罚条例 , 市场份额 , 市场垄断 , 市场监管 , 市场竞争 , 市场竞争状态 , 开源承诺 , 技术垄断 , 技术壁垒 , 技术监管 , 捆绑销售 , 摩尔线程 , 数字经济 , 数据中心 , 数据传输 , 数据处理 , 数据安全 , 数据通信 , 智能计算 , 服务器 , 欧盟法律 , 环境影响 , 用户选择 , 监管政策 , 硬件整合 , 硬件销售 , 科技创新 , 科技制裁 , 科技巨头 , 科技投资 , 科技独立 , 科技竞争 , 竞争法 , 算力中心 , 算力卡 , 网络互联 , 网络设备 , 美国制裁 , 美国商务部 , 自主替代 , 芯片产业 , 芯片代工 , 芯片制造 , 英伟达 , 越南 , 越南布局 , 越南建厂 , 跨国并购 , 软件能力 , 高性能网络 , 高性能计算 , 高速网卡 , 麦洛斯 , 麦洛斯收购案 , 黄仁勋
英伟达突然被中国进行了反垄断审查,这事他冤吗?大家好,欢迎收听老范讲故事的YouTube频道。今天咱们来讲一讲,这家AI时代最赚钱的公司,在中国突然遇到审查了,究竟是怎么回事?
首先呢,英伟达不光是在中国受到审查,欧盟和美国也在对他进行反垄断审查。法国呢,主要是在今年7月份,对他去投资一个叫Coreweave的公司进行审查。Coreweave干嘛的?他是买了很多的英伟达的显卡,去做算力中心出租的。你说OpenAI,我用微软的就行了,或者谷歌用自己的,亚马逊也用自己的,但总还有一些小一点的公司说,我们想要零散的去租一些英伟达的算力,去进行模型的训练、微调或者推理。Coreweave就专门干这个的,而且他应该是在这一块做了最大的一家,英伟达在里边进行了大量的投资。法国政府说,我调查一下你里头有没有一些其他的问题。
12月7号呢,欧盟也展开了对英伟达的反垄断审查。审查的是什么?叫捆绑销售,就是你买了英伟达的算力卡,你必须要再买我其他的哪些东西。这个其实跟这一次中国对英伟达展开的反垄断调查基本是一个原因。美国商务部呢,对英伟达是提出了质询,但是呢并没有正式立案。原来呢讲说美国商务部对英伟达立案进行反垄断审查了,英伟达呢出来辟谣了,说他们质询了,我们愿意配合调查,我们有信心,完全都是开放的。大家选择我们的产品,是因为我们的产品质量好,因为我们的产品性能好,而不是因为我们进行了捆绑销售。
More
7 月 28
Luke Fan AIGC Aceropic Cloud 3.5 Sonnet , API销售 , ChatGPT , GPT-4 Mini , GPT-5发布 , GPT5 , GT5推出 , iPhone 16发布会 , Microsoft OpenAI合作 , OpenAI , OpenAI Plus , OpenAI估值 , OpenAI压力 , OpenAI发展策略 , Redit , Steal the home , 上市计划 , 云服务成本 , 云计算 , 亚马逊因素 , 人员成本 , 估值 , 商业模式创新 , 大模型之争 , 小模型调试 , 市场份额 , 市场机制 , 市场竞争分析. , 市场策略 , 市场验证 , 开放AI生态系统 , 开源模型 , 微调与RAG , 微调免费 , 微软 , 微软销售策略 , 投资风险 , 拉玛3.1405B , 数据处理 , 新兴竞争者 , 新技术应用 , 未来科技趋势 , 核心竞争力 , 梅塔 , 模型训练 , 特斯拉案例 , 研发经费 , 竞争力提升 , 竞争激烈 , 端到端语言训练模型 , 苹果 , 融资需求 , 行业前景 , 行业开拓 , 行业新趋势 , 行业规范 , 行业震荡 , 计算成本 , 谷歌 , 谷歌I/O , 高性能计算 , 高质量训练数据
GPT5如果再不出的话,可能就没有机会了。大家好,这里是老范讲故事的YOUT5频道。今天咱们来讲一讲OpenAI现在身上的压力到底有多大。再不出GPT5,可能真的要出事儿了,因为前面吹过的牛实在太多了,特别是Sola这样的模型,号称可以直接生成长的视频出来,到现在已经半年了,还没有真正拿出来,只是每个月放出几个视频而已。而其他各个公司,按照Sora方向做的产品,已经都开始在公众测试了,这对他们来说一定是巨大的压力。
前一段时间发布的Anthropic Claude 3.5 Sonnet,也把压力给到了OpenAI,因为这个模型的效果已经非常好,而且极其便宜。更不要说昨天刚刚发布的Llama3.1405B这样的一个开源模型。前面咱们讲的Anthropic的模型还是闭源的,而Llama可是个开源模型。405B的话,在各个层次上,都赶超了OpenAI的Chat GPT-4。老大的位置有可能会丧失。
More