3 月 25
Luke Fan英伟达,NVIDIA,黄教主,GPU AI Agent革命, AI推理成本, AI泡沫预警, AI算力租赁, AI算力需求, AI编译器优化, AI芯片国产替代, AI芯片迭代, AI训练成本, ARM架构生态, Blackwell架构, CoreWeave上市, DeepSeek模型, GB200 NVL 72, Grace CPU, H20芯片, HBM3e显存, MoE模型架构, NVLink技术, Scaling Law失效, TOKEN经济, Token计费模式, 中美AI博弈, 云计算价格战, 光通信技术, 内存墙突破, 分布式计算架构, 半导体供应链, 半导体设备折旧, 半导体设备禁运, 参数规模竞赛, 大模型盈利困局, 大模型蒸馏技术, 存算一体芯片, 异构计算架构, 推理效率提升, 摩尔定律终结, 散热技术革命, 数据中心基建, 数据中心能耗, 数据并行策略, 显存带宽优化, 服务器机柜标准, 服务器集群部署, 机器人操作系统, 模型并行技术, 液冷服务器, 深度学习框架, 硬件投资回报率, 算力云服务, 算力军备竞赛, 绿色数据中心, 编译器技术突破, 芯片制程工艺, 芯片命名玄学, 芯片封装技术, 芯片散热材料, 英伟达GTC大会, 超算中心建设, 边缘计算需求, 量子计算布局, 黄仁勋战略
大家好,欢迎收听老范讲故事的YouTube频道。今天咱们来讲一讲,黄仁勋的大饼不香了吗?GTC之后,英伟达的股价怎么跌了?
每年会开一次GTC,叫GPU Technology Community,就是GPU技术的一个社区的会。但是呢,现在再去开GTC,一般已经没有GPU在上面了。咱们现在管这种像什么H100、B200、B100这样的东西叫算力卡。真正的GPU应该是4090、5090这种东西。现在4090、5090在什么地方发布呢?是在AES,AES叫消费电子展。一般黄仁勋都会在消费电子展上卖这种叫个人游戏显卡,然后在GTC上卖他的算力卡。所以呢,我们要分清楚,虽然还叫GTC,但是里头已经没有GPU了。
现在各个公司都在努力的做自己的技术研讨会或者是开发者大会。原来比较著名的一个,现在已经没落了呢,叫IDF,英特尔的开发者论坛,现在已经没有那么热了。现在还比较热热闹闹在开的呢,一个是谷歌IO,一个是Microsoft Build,微软的这个构建大会,然后是苹果的WWDC,叫全世界开发者大会。这个名字取得好,因为他先开始了,所以他就可以取这样投机取巧的名字。英伟达的GTC现在都还是比较热的。OpenAI的开发者日呢,目前还在努力的追赶之中。Meta,也就是原来的Facebook,现在呢有两个开发者日,一个叫Meta Connect,像他的各种AR、VR这种设备,包括很多的广告系统都是在这里开。其实以前Meta Connect大会,大家主要是去听他的广告平台的一些运作方式,因为广告平台挣钱嘛,其他东西都不怎么挣钱。另外一个呢,从今年要开始开,叫Llama Conference,是专门给它的这个大模型开的一个开发者大会。所以Meta今年会有两个。
More
2 月 26
Luke FanAIGC, DeepSeek大模型, OpenSource BF16精度, Blackwell架构, CPU超频对比, CUDA-LESS, CUDA优化, CUDA优化应用, DeepSeek, Flash Attention 2, Flash Attention 3, Flash MLA, Flash MLA核心功能, FP16, FP32, GB200芯片, GPU优化技术, GPU内存带宽优化, GPU内存架构, GPU带宽提升, GPU性能优化, GPU技术分析, GPU架构设计, GPU禁运, GPU超频, H100芯片, H800芯片, HBM内存, Hopper系列芯片, Huggingface优化, H系列GPU性能, Llama CPP优化, MIT协议, MIT开源协议介绍, Transformers架构, 中国GPU限制, 中国芯片制造, 分块调度, 分页式间值缓存, 大模型推理, 大模型推理优化, 并行计算, 开源创新, 开源解决方案, 开源项目, 显卡市场格局, 显卡性能提速, 显存碎片管理, 美国出口限制, 英伟达, 英伟达GPU市场, 英伟达H100提速, 英伟达H800带宽, 英伟达Hopper架构, 英伟达商业策略, 英伟达市场竞争, 英伟达新架构, 高性能计算, 高效多层注意力解码内核
DeepSeek开源周第一炮打响,这次英伟达可真的有的愁了。大家好,欢迎收听老范讲故事的YouTube频道。DeepSeek号称要做开源周,也就是在这一周里边,连续5天发布5个开源项目。那么第一炮打的是什么呢?这个产品叫Flash MLA,这是一个MIT协议的开源项目。待会我们再去讲什么是MIT协议。一天上来就直接获得了几千个星星,就是你把项目发布到GitHub上以后,如果有人喜欢的话会打一个星星。打了星星以后的话,这个项目未来有各种的更新和迭代,我们是会收到通知的。所以很多的开源项目,是用星星的数字来衡量自己项目的受欢迎程度的。
这个项目呢,其实对于绝大多数的使用者来说,短期之内是不会有影响的。什么叫短期?可能就是几个月的时间之内,不会有特别大的变化。但是,可能过了这几个月,这个变化就会逐渐的显现出来。英伟达这次到底能不能挺得住,是会变得好还是会变得坏?这就是我们今天要讲的故事。
英伟达面对Flash MLA这样的一个项目呢,应该有点哭笑不得。为什么呢?这个是必须在英伟达Hopper系列芯片上使用的一个技术,也就是离开英伟达芯片你跑不了。所以这玩意是给英伟达芯片再去做优化。但是呢,这里有个问题,英伟达的H100是被美国禁运的,中国是不可以购买的。中国只可以购买H800,也就是英伟达经过精准的刀法裁切以后的这个版本。它在H800的这个基础上呢进行了提速,这就是这一次的Flash MLA真正给出来的东西。
More
1 月 09
Luke FanAIGC, 英伟达,NVIDIA,黄教主,GPU, 英伟达,黄仁勋的故事 30系显卡, 40系显卡, 5070显卡, 5080显卡, 5090D显卡, 5090显卡, 50系列性能, 50系列显卡, AI主机, AI硬件选择, ARM CPU, Blackwell架构, CES发布, CUDA, GBNV Link 72, GPU, Llama3 405B, Mac mini M4, MacBook, Project DigITs, stable diffusion, 云主机显卡, 云计算, 光鲜亮丽, 大力水手4, 大模型训练, 工程师, 数据分析, 数据科学家, 显卡与大模型, 显卡与游戏, 显卡价格, 显卡兼容性问题, 显卡创新, 显卡功耗, 显卡升级, 显卡对比分析, 显卡市场, 显卡市场动态, 显卡性能, 显卡推荐, 显卡散热, 显卡构建, 显卡架构, 显卡游戏需求, 显卡的使用, 显卡的未来, 显卡科技产品, 显卡租赁, 显卡设置, 显卡购买建议, 显卡适配, 显卡金融属性, 显卡降价, 显卡需求分析, 服务器部署, 本地渲染, 机器学习, 模型训练, 游戏显卡, 游戏玩家, 硬件发展趋势, 硬件性能对比, 硬件推荐, 硬件推荐指南, 硬件用户体验, 硬件评论, 科技发展, 统一内存, 英伟达, 英伟达发布会, 高端显卡, 高级硬件, 鳄鱼皮印花夹克, 黄仁勋
黄教主已经在CES上吹响了号角,准备好钱包了没有?大家好,欢迎收听老范讲故事的YouTube频道。今天咱们来讲一讲CES上,全村最靓的仔黄仁勋。黄教主都发布了一些什么东西?我们是不是要准备好钱包去买东西了,还是说咱们稍微冷静一下?
现在AI嘛,市值最高的公司英伟达,作为英伟达的老板,黄仁勋在整个的CES大会上一定是最靓的仔。其他做AI的人,可能还没有他这么风光亮丽。为什么呢?因为CES呢叫做消费电子展,那些做云计算的人,你们靠后站。黄教主是要来发布游戏显卡的,他是来玩消费的,这个还是有很大差别的。而且整个的AIGC玩了两年多,唯一挣着钱的就只有黄教主自己了,其他人都在这赔本赚吆喝呢。所以呢,人家一定要风光亮丽的跟大家做一个演讲。
咱们先看一下皮衣教主,因为他走到哪穿个皮衣嘛。他这个皮衣呢,这一次是一件新皮衣,不是以前穿过的这些旧皮衣。这个叫Tom Ford设计的一个皮衣,这个皮衣呢叫鳄鱼皮印花皮夹克。就是我们可以看到这个皮夹克上有很多非常大的花纹,这个东西呢叫鳄鱼皮印花。就是你如果买了什么鳄鱼皮钱包或者是鳄鱼皮的皮鞋,上面就是这种大花。我还真没见过鳄鱼皮夹克,他这个皮夹克呢应该不是鳄鱼皮的,应该是牛皮的,只是呢把这个大花纹给你印上了而已。
More