从557万美金训练成本到545%利润,DeepSeek如何用惊悚的数字,震撼AI行业的?这些数字,靠谱吗?

从557万美金训练成本到545%利润,DeepSeek如何用惊悚的数字,震撼AI行业的?这些数字,靠谱吗?已关闭评论

DeepSeek也玩“one more thing”,突然公布了它的推理利润达到545%,就像当初557.6万美金的训练成本那样,再次震惊了行业。大家好,欢迎收听老范讲故事的YouTube频道。今天咱们来讲一讲,DeepSeek结束了连续5天的开园周之后,到礼拜六玩了一次“one more thing”。这个“one more thing”呢,应该是当年乔布斯的梗。他每一次开发布会到最后的时候呢,都要说“还有一件事,等一等”,而且这一件事呢,往往是特别重要、特别颠覆性的事情。那么这一次又来了,DeepSeek公布了它的V1和R3推理系统相关内容,及大规模部署的成本和收益数据。就是说我部署了这东西以后,到底是挣了多少钱?非常非常让人震惊,因为所有人做这个东西都说我不挣钱,我亏钱,结果等到他这好,545%的利润,所有人都傻了,说你到底咋干的?

具体的实现方法呢,就不再跟大家详细分析了。简单来说,第一个负载均衡,你想他有这么多的GPU,这么多的核心,在他这种MOE的架构下,他把每一层的模型里边每一个专家,分配到不同的设备上面去进行运算。这个呢,就是一个负载均衡,尽量让所有的芯片都动起来,不要说有的芯片闲着呢,有的芯片在那排队。第二个,并行计算。并行处理是什么呢?所有的芯片一起来干活,这个速度肯定会变快。另外呢,一边干活的时候,另外一边呢,再同时进行数据的读写。你不能说我这需要数据了,你给我读,然后处理完了以后你再去写,这样就变慢了嘛。所以基本上在做这样的事情,负载均衡和并行处理。

另外还有一个什么样的事情在做呢?就是有一点点叫“驴粪蛋表面光”。这个也算是老北京的一个俏皮话,什么意思呢?就是这个驴粪球外边是很光滑的,但是里边呢,就是一堆的没有消化好的碎草。DeepSeek也是如此,他把很多的计算精度呢进行了调整,他尽可能的能够达到大家的要求,但是很多细节上的这些你看不到的环节呢,就给你忽略掉了。

More

百度为什么不做Sora?探索百度的独特AI发展路径与未来方向,背后原因是吃不到葡萄说葡萄酸吗?

百度为什么不做Sora?探索百度的独特AI发展路径与未来方向,背后原因是吃不到葡萄说葡萄酸吗?已关闭评论

百度为什么不做Sora?是不是吃不到葡萄就说葡萄是酸的呢?大家好,这里是老范讲故事的YouTube频道。

11月12号,百度世界大会上就透露出来说,百度从来就没有想去过做Sora这样的世界模型,或者叫视频模型,从来没想过。百度呢,是一直希望走自己的多模态道路,不希望去跟OpenAI这样的公司卷入世界模型的竞争。虽然到现在为止,Sora也没出来,但是跟在后面跑的人还是很多的,特别是抖音、快手,都推出了各自的视频模型,还有很多国际上的厂商也在视频模型上争先恐后地往前跑。

但百度说,我不干这个事,我有更重要的事情在做。这是百度李彦宏亲口说的。那么,百度努力的方向到底是什么呢?百度努力的方向是消除幻觉。大模型都是有幻觉的,百度呢说,我们作为一个中国公司,你可以不说话,但是说错了是很麻烦的,所以我们不能产生幻觉,保证我们说的都是对的。而且这个是在各种角度上,所有的评判标准来看,都得是对的,不能有任何问题。因为有的时候,你说的你觉得对了,但别人觉得不开心,这也是不行的。

More

在中国,到底是谁在爆买英伟达显卡?揭秘中国企业疯狂购买英伟达显卡的背后真相:中国移动领衔—国内GPU市场大揭秘。

在中国,到底是谁在爆买英伟达显卡?揭秘中国企业疯狂购买英伟达显卡的背后真相:中国移动领衔—国内GPU市场大揭秘。已关闭评论

到底有哪些企业在购买英伟达的显卡?这个跟大家想象的可能不太一样。中国只有这些显卡吗?跟大家想的可能也不太一样。另一方面,中美之间的AI差距到底在什么地方?

大家好,这里是老范讲故事的YouTube频道。最近网上流传了一张图,直接把大家给看懵了。这张图写的是什么呢?就是到底哪些数据中心买家在买英伟达的显卡。我们不算是大家打游戏去买4090,或者是普通的一些小公司买了一堆4090去干活,这不算。我们算的是数据中心的,这到底是什么人在买?

在这个图上显示,在2023年Q2、Q3到Q4,实际上每一个季度,中国人从英伟达买的显卡数量都是快速上升的。到2024年呢,有所下降。2024年Q1的话,大概比2023年的Q2还要再少一些,但是到Q2继续在上升,应该是达到2023年Q2的一个同等水平了。

More

揭秘Google与Wiz的230亿美金收购案:以色列安全团队的坚决拒绝。Wiz的价值,体现在中国为什么封禁Docker hub上。与Windows蓝屏无关

揭秘Google与Wiz的230亿美金收购案:以色列安全团队的坚决拒绝。Wiz的价值,体现在中国为什么封禁Docker hub上。与Windows蓝屏无关已关闭评论

GPT5如果再不出的话,可能就没有机会了。大家好,这里是老范讲故事的YOUT5频道。今天咱们来讲一讲OpenAI现在身上的压力到底有多大。再不出GPT5,可能真的要出事儿了,因为前面吹过的牛实在太多了,特别是Sola这样的模型,号称可以直接生成长的视频出来,到现在已经半年了,还没有真正拿出来,只是每个月放出几个视频而已。而其他各个公司,按照Sora方向做的产品,已经都开始在公众测试了,这对他们来说一定是巨大的压力。

前一段时间发布的Aceropic Claude 3.5 Sonnet,也把压力给到了OpenAI,因为这个模型的效果已经非常好,而且极其便宜。更不要说昨天刚刚发布的LlamaB这样的一个开源模型。前面咱们讲的Aceropic的模型还是闭源的,而Llama可是个开源模型。405B的话,在各个层次上,都赶超了OpenAI的Chat GPT-4。老大的位置有可能会丧失。

More

退出移动版