ChatGPT O3 mini发布深层解析:山姆奥特曼首次坦言“历史错误”与开源迷局

ChatGPT O3 mini发布深层解析:山姆奥特曼首次坦言“历史错误”与开源迷局已关闭评论

ChatGPT O3mini正式发布的时候,山姆奥特曼到底算不算是认错了呢?大家好,欢迎收听老范讲故事的YouTube频道。今天咱们来讲一讲O3mini的发布,以及奥特曼到底在说些什么。

过年的时候,基本上是被DeepSeek刷屏了。全世界各地跟AI相关的,或者不相关的人,都在尝试去理解和阐述DeepSeek到底干了点什么,到底对于他们有什么样的影响。风口浪尖上的这些闭源大模型公司,特别是OpenAI,肯定也是坐不住的,把它的王炸级产品ChatGPT O3 mini给炸出来了。发布了以后,马上还去做了一个访谈,回答了很多相关的问题。在其中,承认了说在开源领域里头好像站错队了。

那么先说一下O3 mini到底是一个什么样的情况。O3 mini的速度还是非常快的,跟O1 mini的速度相近。它的性能应该是接近原来的O1性能。大家看到很多很多的评测,这个分高点,那个分低一点,也有很多人在那扑克脸,念这些评测的结果。但其实这些评测到底哪一个是什么意思,差异在什么地方,绝大部分人很难理解。我也不在这费劲跟大家讲到底是什么情况了。我只能说O3 mini也好,O1也好,包括DeepSeek R1也好,这些模型它们的能力差异其实已经脱离了普通人的认知范围,总之都很强就可以了。

More

DeepSeek现象引发中文圈狂热:开源的胜利还是遥遥领先的争议?

DeepSeek现象引发中文圈狂热:开源的胜利还是遥遥领先的争议?已关闭评论

DeepSeek突然出圈,引发了中文圈的争吵。大家好,欢迎收听老范讲故事的YouTube频道。

DeepSeek在前面,我们已经出了一期视频,去讲它到底是怎么回事了。那么,DeepSeek最近肯定是更加的出圈。首先,DeepSeek V3,据说训练成本只有557万美金,震惊了扎克伯格,震惊了Meta。Meta说:“我们有好多的老大,他们的年薪都超过557万美金了。人家训练了个模型才用了557万美金,那我花了这么多钱去组建AI团队,花了这么多钱去囤显卡,是不是亏了?”现在就有这样的声音出来。

而且,最新的DeepSeek R1,也就是它的推理模型,推理能力已经接近o1了。蒸馏微调出来的这些小模型,已经在很多领域里头超越了o1 Mini。在这儿多补充一句,什么叫蒸馏微调的小模型?像我的电脑上,也是跑了一个DeepSeek R1-32B的模型。这个模型是怎么来的?它实际上是由DeepSeek R1去输出数据,然后拿输出的数据再去调通义千问2.5-32B的这个模型,最后得到的结果。这就是DeepSeek R1-32B,他在我的电脑上做各种推理,效果相当不错。

More