软银OpenAI日本公司背后的资本阳谋——5,000亿星际之门是如何影响全球AI格局的?

软银OpenAI日本公司背后的资本阳谋——5,000亿星际之门是如何影响全球AI格局的?已关闭评论

SB OpenAI日本公司宣布成立,这怎么听怎么像是在骂人呢?大家好,欢迎收听老范讲故事的YouTube频道。今天咱们来讲一讲SB OpenAI日本公司到底是一个什么样的情况。

孙正义上台宣布Softbank OpenAI Japan这个公司成立了,所以这个SB不是骂人,它是软银Softbank的意思。今年我们发现OpenAI的声音连续不断,这是为什么呢?原因也很简单,老大的位置不是很稳固了。你要想在这一个行业里面当老大,要么你技术特别好大家都服气,比如像谷歌这样的,各个行业里头,只要跟计算机技术有关的,大家都知道谷歌的技术最好;要不然你垄断,比如像苹果这样,或者像Meta这样的,在社交媒体里我直接垄断了,大家知道你是老大。

如果技术也被人质疑了,花了好多钱训练出一堆模型来,别人也都可以达到了Claude 3.5、Sonnet、Gemini 2.0、Flash这样的模型,其实现在已经跟GPT-4相差仿佛了。你新发布了一大堆乱七八糟的模型呢,都是很小众的高端产品,对于大众来说无感。在这种情况下,你的技术就会被人质疑。

More

DeepSeek现象引发中文圈狂热:开源的胜利还是遥遥领先的争议?

DeepSeek现象引发中文圈狂热:开源的胜利还是遥遥领先的争议?已关闭评论

DeepSeek突然出圈,引发了中文圈的争吵。大家好,欢迎收听老范讲故事的YouTube频道。

DeepSeek在前面,我们已经出了一期视频,去讲它到底是怎么回事了。那么,DeepSeek最近肯定是更加的出圈。首先,DeepSeek V3,据说训练成本只有557万美金,震惊了扎克伯格,震惊了Meta。Meta说:“我们有好多的老大,他们的年薪都超过557万美金了。人家训练了个模型才用了557万美金,那我花了这么多钱去组建AI团队,花了这么多钱去囤显卡,是不是亏了?”现在就有这样的声音出来。

而且,最新的DeepSeek R1,也就是它的推理模型,推理能力已经接近o1了。蒸馏微调出来的这些小模型,已经在很多领域里头超越了o1 Mini。在这儿多补充一句,什么叫蒸馏微调的小模型?像我的电脑上,也是跑了一个DeepSeek R1-32B的模型。这个模型是怎么来的?它实际上是由DeepSeek R1去输出数据,然后拿输出的数据再去调通义千问2.5-32B的这个模型,最后得到的结果。这就是DeepSeek R1-32B,他在我的电脑上做各种推理,效果相当不错。

More