Tag: 性能评测

遥遥领先的华为升腾384超节点VS英伟达NVL72：FP16算力压H100却逊GB200，三倍功耗换自主可控值不值？

7 月 29

Luke FanAIGC, 华为很厉害 99米长的枪, AI推理, AI芯片, AMD MI300, CUDA, GB200, H100, Hugging Face, MindSpore, NPU, NVL72, PyTorch, TensorFlow, 中美科技战, 人工智能 (AI), 优缺点分析, 信创产业, 光模块, 兼容性, 升腾384超节点, 升腾910C, 华为, 国产替代, 国产芯片, 大模型训练, 工程实现, 性能评测, 成本与电费, 技术封锁, 数据中心, 服务器集群, 水冷散热, 科技评论, 稳定性, 突破封锁, 算力, 老范讲故事, 自主可控, 芯片禁运, 英伟达 (Nvidia), 谷歌TPU, 软件生态, 达芬奇架构, 高功耗, 鲲鹏920 遥遥领先的华为升腾384超节点VS英伟达NVL72：FP16算力压H100却逊GB200，三倍功耗换自主可控值不值？已关闭评论

遥遥领先的华为升腾384超节点，是不是又立功了？

大家好，欢迎收听老范讲故事的YouTube频道。

上海人工智能大会上，有一个镇场之宝，就是华为升腾384超节点。叫这个名字很怪，其实就是华为做的算力超级节点，华为云矩阵。384超节点这个东西，从外边看上去呢，像一堵墙一样，反正摆在厂子里头也确实比较唬人，而且也很昂贵。

很多人就兴奋了，说我们是不是又打破了西方的垄断呢？西方人对我们禁运，不给我们卖英伟达最好的芯片，我们自己造出来了。这个事到底达没达到呢？可以说部分达到了。在集群总的FP16算力上，为什么一定要强调这个？就是它在不同精度上的算力是不一样的。在FP16算力上呢，华为升腾384超节点，是介于H100和GB200组成的NVL72之间的一个算力。而这个话怎么解释呢？

现在我们去想算力，它是分三个层次的。第一个就是卡，卡这件事呢，咱肯定比不过人家，甭管你是比H100还是GB200，你根本比不过人家。第二个呢，就是叫整机，我是一台服务器。你像AMD呢，就是卖这种东西，就是我一台服务器里头有8个，他们叫MI300这样的服务器。第三种维度呢，就是说我给你卖一整个柜子，像NVL72呢，就属于整个柜子，我把72个H100或者72个GB200这样的东西，装在一个柜子里头，当成一台机器一把卖给你。

阿里Qwen3重磅发布：是超越Llama 4的划时代的胜利，还是性能未达预期、被过度炒作的技术翻车现场深度剖析？

5 月 04

Luke FanAIGC Agent能力, AI agent开发, DeepSeek R1 对比, Gemini 2.5 Pro 对比, GitHub 开源, GPT-4o 对比, Grok 对比, Llama 4 对比, MCP协议支持, MOE模型 (混合专家模型), Ollama, Open Router, PC端应用, Qwen3, XAI 对比, 上下文窗口 (128K/256K), 专业数据, 云部署, 人工智能 (AI), 代码生成, 优缺点, 全系列模型 (0.6B-235B), 划时代的胜利 vs 翻车, 千问3, 原生数据, 参数效率, 合成数据, 后训练, 商业应用, 多场景适配, 多语言支持 (119种), 大语言模型 (LLM), 工具调用, 幻觉问题, 开源模型, 强化学习 (RLHF), 微调 (Fine-tuning), 性能分析, 性能评测, 技术创新, 指令遵循, 数学推理, 数据来源, 本地部署, 模型使用, 模型发布, 模型对齐, 混合推理架构, 用户体验, 田忌赛马策略, 真实感受, 硅基流动, 移动端应用, 稠密模型, 评测数据, 逻辑推理, 长思维链, 阿里云百炼, 阿里大模型, 预训练 (36T数据) 阿里Qwen3重磅发布：是超越Llama 4的划时代的胜利，还是性能未达预期、被过度炒作的技术翻车现场深度剖析？已关闭评论

Qwen3发布了。这到底是划时代的胜利，还是翻车了呢？

大家好，欢迎收听老范讲故事的YouTube频道。Qwen3真的是千呼万唤始出来。前面好几周就已经不断有传言说Qwen3要发布，要多么多么强大。突然发布之后，当然也肯定是伴随着一大堆的评测数据了。官方评测数据呢，永远是我超越了谁、超越了谁。但是很多评测的人呢，觉得好像差那么一点点意思，没有达到预期。所以今天我们来讨论一下，这到底是又一次划时代的胜利，还是翻车。

Qwen3呢是凌晨发布的，4月29日凌晨上线，在Github上全面开放。我呢已经开始用上了。使用的方法有几种：

第一种是本地部署。我是MacBook Pro，M2 Max的芯片，32G内存。其他的不重要，你到底有多少硬盘，这个事没有那么重要。本地使用OlAmA部署，我使用了8B、32B和30B-A3B。最后这个是什么意思？最后是一个MOE的模型，它是30B-A3B，就是说它每一次干活的时候激活3B，也就是30亿参数。它是这样的一个标注。就这三个版本的模型，在我本机都可以跑，速度呢都是还可以接受。

老范讲故事的博客站

遥遥领先的华为升腾384超节点VS英伟达NVL72：FP16算力压H100却逊GB200，三倍功耗换自主可控值不值？

阿里Qwen3重磅发布：是超越Llama 4的划时代的胜利，还是性能未达预期、被过度炒作的技术翻车现场深度剖析？

近期文章

归档

分类

其他操作