深度解析DeepSeek:股权结构揭秘,真的有一盘大棋吗?0.1%里面隐藏的巨大陷阱。

深度解析DeepSeek:股权结构揭秘,真的有一盘大棋吗?0.1%里面隐藏的巨大陷阱。已关闭评论

DeepSeek的股权结构真的是一盘大棋吗?大家好,欢迎收听老范讲故事的YouTube频道。DeepSeek最近实在是火出圈来了,大家都在很努力地去解读DeepSeek各种各样的问题,特别是很多金融圈的人也冲进来了。为什么?让股市动荡了吗?但是这些金融圈的人呢,又说不太清楚这个大模型到底是怎么回事。但是股权结构他们是能解释得清楚的,这里面就有各种各样的阴谋论了。

一切呢都是从这张图开始的。首先要尊重一下知识产权,这个是由杰克船长宏观策略提供的。这个朋友呢,应该是雪球上面的一位自媒体博主吧,解读各种各样的宏观策略的。更多的人是在这个上面进行解读。但是我要讲的是什么?就这张图呢,应该仅仅是冰山一角。为什么呢?因为后边是幻方量化,一个做量化的公司,它上面的实体数可能几百个是正常的。千万不要觉得DeepSeek只有这么简单的一个图像,甚至有很多可能平时对于公司结构不是那么熟悉的朋友,一看到说,哇这么多方块,这么多颜色花花绿绿的,这个结构好复杂,这是一盘大棋,设计得好厉害,真的不是这样的。

More

DeepSeek现象引发中文圈狂热:开源的胜利还是遥遥领先的争议?

DeepSeek现象引发中文圈狂热:开源的胜利还是遥遥领先的争议?已关闭评论

DeepSeek突然出圈,引发了中文圈的争吵。大家好,欢迎收听老范讲故事的YouTube频道。

DeepSeek在前面,我们已经出了一期视频,去讲它到底是怎么回事了。那么,DeepSeek最近肯定是更加的出圈。首先,DeepSeek V3,据说训练成本只有557万美金,震惊了扎克伯格,震惊了Meta。Meta说:“我们有好多的老大,他们的年薪都超过557万美金了。人家训练了个模型才用了557万美金,那我花了这么多钱去组建AI团队,花了这么多钱去囤显卡,是不是亏了?”现在就有这样的声音出来。

而且,最新的DeepSeek R1,也就是它的推理模型,推理能力已经接近o1了。蒸馏微调出来的这些小模型,已经在很多领域里头超越了o1 Mini。在这儿多补充一句,什么叫蒸馏微调的小模型?像我的电脑上,也是跑了一个DeepSeek R1-32B的模型。这个模型是怎么来的?它实际上是由DeepSeek R1去输出数据,然后拿输出的数据再去调通义千问2.5-32B的这个模型,最后得到的结果。这就是DeepSeek R1-32B,他在我的电脑上做各种推理,效果相当不错。

More

Newer Entries