从557万美金训练成本到545%利润,DeepSeek如何用惊悚的数字,震撼AI行业的?这些数字,靠谱吗?

从557万美金训练成本到545%利润,DeepSeek如何用惊悚的数字,震撼AI行业的?这些数字,靠谱吗?已关闭评论

DeepSeek也玩“one more thing”,突然公布了它的推理利润达到545%,就像当初557.6万美金的训练成本那样,再次震惊了行业。大家好,欢迎收听老范讲故事的YouTube频道。今天咱们来讲一讲,DeepSeek结束了连续5天的开园周之后,到礼拜六玩了一次“one more thing”。这个“one more thing”呢,应该是当年乔布斯的梗。他每一次开发布会到最后的时候呢,都要说“还有一件事,等一等”,而且这一件事呢,往往是特别重要、特别颠覆性的事情。那么这一次又来了,DeepSeek公布了它的V1和R3推理系统相关内容,及大规模部署的成本和收益数据。就是说我部署了这东西以后,到底是挣了多少钱?非常非常让人震惊,因为所有人做这个东西都说我不挣钱,我亏钱,结果等到他这好,545%的利润,所有人都傻了,说你到底咋干的?

具体的实现方法呢,就不再跟大家详细分析了。简单来说,第一个负载均衡,你想他有这么多的GPU,这么多的核心,在他这种MOE的架构下,他把每一层的模型里边每一个专家,分配到不同的设备上面去进行运算。这个呢,就是一个负载均衡,尽量让所有的芯片都动起来,不要说有的芯片闲着呢,有的芯片在那排队。第二个,并行计算。并行处理是什么呢?所有的芯片一起来干活,这个速度肯定会变快。另外呢,一边干活的时候,另外一边呢,再同时进行数据的读写。你不能说我这需要数据了,你给我读,然后处理完了以后你再去写,这样就变慢了嘛。所以基本上在做这样的事情,负载均衡和并行处理。

另外还有一个什么样的事情在做呢?就是有一点点叫“驴粪蛋表面光”。这个也算是老北京的一个俏皮话,什么意思呢?就是这个驴粪球外边是很光滑的,但是里边呢,就是一堆的没有消化好的碎草。DeepSeek也是如此,他把很多的计算精度呢进行了调整,他尽可能的能够达到大家的要求,但是很多细节上的这些你看不到的环节呢,就给你忽略掉了。

More

OpenAI连续12天发布会回顾:科技领军者的12大跨越式创新,Sora、Canvas与GPT-4O带来哪些启示?

OpenAI连续12天发布会回顾:科技领军者的12大跨越式创新,Sora、Canvas与GPT-4O带来哪些启示?已关闭评论

OpenAI的连续12天发布会现在已经过半,发布了些什么东西呢?咱们来总结一下。

大家好,欢迎收听老范讲故事的YouTube频道。12天开12场发布会,算是前无古人了。人家以前的发布会都是在集中一两天的时间里,聚集尽可能多的人把它开掉。但是,OpenAI就是要不走寻常路,选择连续发布12天,每天发布一点新东西出来。而且他们的发布会是在网上开了个直播间,有时候山姆·奥特曼在,有时候他不在,大家就一起来讲讲这段时间又做了点什么新东西。这还是非常有趣的一种发布方式,算是把年底这一段时间所有人的注意力又都拉回了OpenAI以及AIGC这个赛道上。

那么到年底了,大家都得卷,大伙有没有?有。但是,肯定没有12个。如果真的说年底有12个重磅级产品发布的话,他们也不会用这种方式。应该还是会有很多零七八碎的小功能在这12天发布出来,但也会有一些比较激动人心的东西。而且要卷,大家一起卷嘛。OpenAI作为AIGC行业的领军人物,既然开始卷了,其他人必然会跟进。

More

被OpenAI的GPT-4o截胡的 Google I/O:与  indigo11  一起聊聊,AI技术变革与未来趋势,庞大的官僚机构Google,面对新生事物OpenAI,还行吗?

被OpenAI的GPT-4o截胡的 Google I/O:与  indigo11  一起聊聊,AI技术变革与未来趋势,庞大的官僚机构Google,面对新生事物OpenAI,还行吗?已关闭评论

大家好,欢迎收听老范讲故事的YouTube频道。今天我们又请到了老朋友尹迪狗,给我们介绍一下刚刚召开完的谷歌艾欧。这一次到底发布了什么。而在谷歌艾欧之前的一天,OpenAI我觉得算是故意捣乱截胡,发了个GP4欧出来。我们就正好趁这个时机呢,把这两个发布会或者两两个产品吧,一起来总结一下。首先呢,我想先问一下,GBT4O到底算不算是划时代的产品。嗯,至少模型啊,分成两部分,它发的是PPT是o是模型混合模态嘛,他把语音视频和文字一块训练的嘛,可以同时输入和输出嘛。这个相当于是,嗯,也不叫划时代吧,就是他之前所有的工程技术的沉淀。嗯然后呢,做了一个特别好的一个交互形式,就是语音交互。而且那个语音交互的很大一个特点,发完之后不是马上就有人升级吗,一搜我的这个APP上面的模型以及GPT,搜了然后大家都想打开。那那个耳机,点上去之后呢,可以跟他聊聊天。实际上,那个聊天并不是他发布会上的那种APP,那个还是回合制的,用那个rest接口聊天。我,发出去然后回来,这个回合制的,但是呢,他在发布会上演示的是完全stream的,就是像就像我们现在一样,我们录节目,我们用的是Web RTC协议嘛,streaming,就是你的Server端,它的那个TOKEN,它就不停的接收是吧,做实时处理。这个特别耗流量,耗TOKEN,耗算力的。嗯现在还没用到这个模型,所以大家感受不到,所以我记得第二天还第三天的时候m奥特曼还是他们官方账号,发了一个说明嘛,说哎你们大家用的现在还不是,发布会上也是这个,哈哈哈,一堆人说说这一直完完全不对,这么慢的响应,我觉得借手报了一下,就是他是非常natural,非常自然。可能就是大家第一次用起来 GPT 的感觉,一样哎。哇哦,是他没这样回答问题。就是他确实是有那个时候的一个感觉。

More

退出移动版