从557万美金训练成本到545%利润,DeepSeek如何用惊悚的数字,震撼AI行业的?这些数字,靠谱吗?

从557万美金训练成本到545%利润,DeepSeek如何用惊悚的数字,震撼AI行业的?这些数字,靠谱吗?已关闭评论

DeepSeek也玩“one more thing”,突然公布了它的推理利润达到545%,就像当初557.6万美金的训练成本那样,再次震惊了行业。大家好,欢迎收听老范讲故事的YouTube频道。今天咱们来讲一讲,DeepSeek结束了连续5天的开园周之后,到礼拜六玩了一次“one more thing”。这个“one more thing”呢,应该是当年乔布斯的梗。他每一次开发布会到最后的时候呢,都要说“还有一件事,等一等”,而且这一件事呢,往往是特别重要、特别颠覆性的事情。那么这一次又来了,DeepSeek公布了它的V1和R3推理系统相关内容,及大规模部署的成本和收益数据。就是说我部署了这东西以后,到底是挣了多少钱?非常非常让人震惊,因为所有人做这个东西都说我不挣钱,我亏钱,结果等到他这好,545%的利润,所有人都傻了,说你到底咋干的?

具体的实现方法呢,就不再跟大家详细分析了。简单来说,第一个负载均衡,你想他有这么多的GPU,这么多的核心,在他这种MOE的架构下,他把每一层的模型里边每一个专家,分配到不同的设备上面去进行运算。这个呢,就是一个负载均衡,尽量让所有的芯片都动起来,不要说有的芯片闲着呢,有的芯片在那排队。第二个,并行计算。并行处理是什么呢?所有的芯片一起来干活,这个速度肯定会变快。另外呢,一边干活的时候,另外一边呢,再同时进行数据的读写。你不能说我这需要数据了,你给我读,然后处理完了以后你再去写,这样就变慢了嘛。所以基本上在做这样的事情,负载均衡和并行处理。

另外还有一个什么样的事情在做呢?就是有一点点叫“驴粪蛋表面光”。这个也算是老北京的一个俏皮话,什么意思呢?就是这个驴粪球外边是很光滑的,但是里边呢,就是一堆的没有消化好的碎草。DeepSeek也是如此,他把很多的计算精度呢进行了调整,他尽可能的能够达到大家的要求,但是很多细节上的这些你看不到的环节呢,就给你忽略掉了。

More

ARM状告高通,阻击AI PC,为了不让高通的X Elite一家独大,哪怕拖慢AI PC的进程,也要阻击高通

ARM状告高通,阻击AI PC,为了不让高通的X Elite一家独大,哪怕拖慢AI PC的进程,也要阻击高通已关闭评论

大家好,欢迎收听老范讲故事YouTube频道。今天我们来讲一讲AM作妖,让苹果的M系列芯片可以继续在AIPC领域里头独霸天下的很长一段时间的故事。刚刚结束的WWDC,大家还看到了Apple Intelligence。有些人觉得在挤牙膏,有些人觉得很震惊,但是有一点是确认的,就是苹果演示了大量可以在本地顺畅运行的模型,以及这些模型可以跟操作系统结合在一起,极大地改进用户体验。这件事情大家还是觉得非常棒的。

那大家有没有想过,所谓的Apple Intelligence,这些可以在本地运行的模型,它的底层到底是什么啊?它的底层就是苹果的M系列芯片。所谓的苹果M系列芯片,是苹果专门为了应对PC工作,在AM的许可标准下,自己定制的一款芯片。现在我们有M1、M2、M3、M4啊,最新的是M4系列芯片。这个芯片呢,跟传统的手机芯片不一样,它的算力会更强,但是跟X86芯片也是不一样的。X86芯片的话,它的耗电啊,它的发热都是很厉害的,而M系列的芯片啊,它的耗电,它的发热都是有极大的改善。因为这种芯片本身是为移动设备开始设计的,所以很省电。在没有非常大的算力要求的时候,它可以关闭大量的核心,非常非常省电。那么省了电它就肯定不发热了嘛,你也不需要再去散热。

More

退出移动版