3 月 25
Luke Fan英伟达,NVIDIA,黄教主,GPU AI Agent革命, AI推理成本, AI泡沫预警, AI算力租赁, AI算力需求, AI编译器优化, AI芯片国产替代, AI芯片迭代, AI训练成本, ARM架构生态, Blackwell架构, CoreWeave上市, DeepSeek模型, GB200 NVL 72, Grace CPU, H20芯片, HBM3e显存, MoE模型架构, NVLink技术, Scaling Law失效, TOKEN经济, Token计费模式, 中美AI博弈, 云计算价格战, 光通信技术, 内存墙突破, 分布式计算架构, 半导体供应链, 半导体设备折旧, 半导体设备禁运, 参数规模竞赛, 大模型盈利困局, 大模型蒸馏技术, 存算一体芯片, 异构计算架构, 推理效率提升, 摩尔定律终结, 散热技术革命, 数据中心基建, 数据中心能耗, 数据并行策略, 显存带宽优化, 服务器机柜标准, 服务器集群部署, 机器人操作系统, 模型并行技术, 液冷服务器, 深度学习框架, 硬件投资回报率, 算力云服务, 算力军备竞赛, 绿色数据中心, 编译器技术突破, 芯片制程工艺, 芯片命名玄学, 芯片封装技术, 芯片散热材料, 英伟达GTC大会, 超算中心建设, 边缘计算需求, 量子计算布局, 黄仁勋战略
大家好,欢迎收听老范讲故事的YouTube频道。今天咱们来讲一讲,黄仁勋的大饼不香了吗?GTC之后,英伟达的股价怎么跌了?
每年会开一次GTC,叫GPU Technology Community,就是GPU技术的一个社区的会。但是呢,现在再去开GTC,一般已经没有GPU在上面了。咱们现在管这种像什么H100、B200、B100这样的东西叫算力卡。真正的GPU应该是4090、5090这种东西。现在4090、5090在什么地方发布呢?是在AES,AES叫消费电子展。一般黄仁勋都会在消费电子展上卖这种叫个人游戏显卡,然后在GTC上卖他的算力卡。所以呢,我们要分清楚,虽然还叫GTC,但是里头已经没有GPU了。
现在各个公司都在努力的做自己的技术研讨会或者是开发者大会。原来比较著名的一个,现在已经没落了呢,叫IDF,英特尔的开发者论坛,现在已经没有那么热了。现在还比较热热闹闹在开的呢,一个是谷歌IO,一个是Microsoft Build,微软的这个构建大会,然后是苹果的WWDC,叫全世界开发者大会。这个名字取得好,因为他先开始了,所以他就可以取这样投机取巧的名字。英伟达的GTC现在都还是比较热的。OpenAI的开发者日呢,目前还在努力的追赶之中。Meta,也就是原来的Facebook,现在呢有两个开发者日,一个叫Meta Connect,像他的各种AR、VR这种设备,包括很多的广告系统都是在这里开。其实以前Meta Connect大会,大家主要是去听他的广告平台的一些运作方式,因为广告平台挣钱嘛,其他东西都不怎么挣钱。另外一个呢,从今年要开始开,叫Llama Conference,是专门给它的这个大模型开的一个开发者大会。所以Meta今年会有两个。
More
12 月 25
Luke FanAIGC AGI, AI API调用, AIGC未来, AI与机器人, AI互动演示, AI人工智能发展, AI创业, AI创新应用, AI发展方向, AI工具进化, AI开发, AI慎重对齐, AI技术, AI技术突破, AI推理模型, AI数学能力, AI用户体验, AI用户覆盖, AI硬件控制, AI编程比赛, AI行业分析, AI行业标准, AI训练成本, AI高端功能, API增强, API降价, ARC AGI测试, CANVAS项目, ChatGPT, ChatGPT API, ChatGPT Mac版, ChatGPT实时语音, GPT-5, Notion AI, O3 API特性, O3mini, O3性能, O3模型, OpenAI, OpenAI AGI, OpenAI O1升级, OpenAI 视觉输入, OpenAI与开发者, OpenAI使用技巧, OpenAI具身智能, OpenAI功能整合, OpenAI发布会, OpenAI安全机制, OpenAI高成本运算, Sora, WebRTC, 人工智能动态, 具身智能, 函数调用, 大模型, 实时语音, 搜索与语音集成, 结构化输出, 视觉实时语音, 高端推理模型, 高级语音功能
OpenAI连续12天的发布会到底为世界指明了什么样的方向?大家好,欢迎收听老范讲故事的YouTube频道。
OpenAI的12天发布会已经结束了。首先,从我个人的感受上来说,稍微有一点点失望。没有带来新一代的Dalle,也就是绘图模型;也没有GPT-5,哪怕是GPT-4.5的升级都没有。Sora虽然发布了,但是他所发布出来的产品跟大家的预期是严重不符的。
那么,这12天到底都发了些什么呢?前面7天其实已经录了一期节目进行总结了,咱们这里就不再重复。后边5天,第八天是搜索和实时语音进行了合并。我在前面7天总结最后的时候,讲了一下我说,现在OpenAI发布了大量的工具,是隔离的。语音是语音,搜索是搜索,canvas这种画板,还有其他的很多工具,是相互隔离的。就是你要选择其中一个功能,其他的功能就不能选了。未来的话,一定会逐渐把他们再合并起来。
More
7 月 25
Luke FanAIGC, Meta的故事, OpenSource 405B版本, AI上下文窗口, AI事实标准, AI产业方向, AI产业链, AI偷跑事件, AI公司发展, AI创新挑战, AI创新推广, AI功率需求, AI协议限制, AI商业机会, AI商业模式, AI多模态, AI多语言支持, AI宏大模型, AI市场分析, AI应用前景, AI开源协议, AI性能测试, AI性能超越, AI技术合作, AI技术商业化, AI技术应用, AI技术投资, AI技术支持, AI技术突破, AI技术革新, AI显卡需求, AI未来趋势, AI标准化, AI模型优化, AI模型开放, AI模型电费, AI法律框架, AI生态价值, AI生态系统, AI生态系统发展, AI硬件需求, AI磁力链, AI空调耗电, AI能耗问题, AI行业分析, AI行业动态, AI行业趋势, AI计算能力, AI训练成本, AI训练数据, AI训练时间, AI语言支持, GPT-4对比, GPT-4跑分, HIKING face数据集, LLaMA, Llama 3.1, Llama 3.1 405b, Together AI, 中国AI厂商, 中国AI厂商冲锋, 中美科技博弈, 多模态支持, 开源与闭源, 拉玛模型争议, 梅塔与中国, 梅塔公司, 模型微调
Llama3.1 405b突然开放,指标上全面超越GPT-4。中国厂商们是不是又可以充了呢?大家好,这里是老范讲故事的YouTube频道。今天咱们来讲一讲Llama3.1 405b 开放的事情。
Llama的开放,每一次都比较有戏剧性,都会有偷跑。什么叫偷跑?就不是由官方开了发布会,说我今天发布了一个什么产品,而是一般都是在Reddit这样的论坛里,突然就有人放出磁力链来,大家可以去BT下载Llama3.1 405B,包括Llama3.1 405B相关的各种测试数据,都是这么被发现的。头一天偷跑了以后,第二天梅塔说那算了,我开了吧。当时好像Llama2也是这么开出来的,现在Llama3.1 也是这么偷跑,完了以后就正式开放了。
他在跑分上已经全面地超越了GPT-4,基本上在各个指标上都超越了。这是非常非常难的,因为以前大家推出的各种模型里头,都是在个别指标里面超越GPT-4O或者超越GPT-4。那么在各项指标上全都超越的,这应该是第一次。当然了,它也是分很多版本的,分为8B、70B以及405B这三个版本。405B已经完全超越了,下面小一点的8B,应该比原来的Llama370B的效果还要再好一些。它的70B基本上针对前两天发布的GBT4OMINI,属于碾压状态。
More