AI模型蒸馏 - 老范讲故事｜AI、大模型与商业世界的故事

大家好！欢迎收听老范讲故事YouTube频道。今天咱们来讲一讲李飞飞的S1K模型。50美金成本超越DeepSeek R1和ChatGPT O1。

首先呢，DeepSeek到底是怎么震惊全球的？就是因为训练成本低。他的训练成本是OpenAI的3%，所以震惊了全球。

那么现在李飞飞的S1K模型，16张H100的显卡，跑了26分钟跑完了，拿到了一个32B的模型。多项测试超越了DeepSeek R1和GPTO1。

大家要注意，评测大模型呢，它有很多很多测试项。一般我们说基本上达到什么什么水平，就属于叫互有伯仲。有些你强点，有些他强点。原来大家都超不过GPT 4O，是因为只能接近它，距离它的全项指标都有差距。现在的话，大家就已经基本上可以达到GPT 4o的水平了。

ChatGPT O3mini正式发布的时候，山姆奥特曼到底算不算是认错了呢？大家好，欢迎收听老范讲故事的YouTube频道。今天咱们来讲一讲O3mini的发布，以及奥特曼到底在说些什么。

过年的时候，基本上是被DeepSeek刷屏了。全世界各地跟AI相关的，或者不相关的人，都在尝试去理解和阐述DeepSeek到底干了点什么，到底对于他们有什么样的影响。风口浪尖上的这些闭源大模型公司，特别是OpenAI，肯定也是坐不住的，把它的王炸级产品ChatGPT O3 mini给炸出来了。发布了以后，马上还去做了一个访谈，回答了很多相关的问题。在其中，承认了说在开源领域里头好像站错队了。

那么先说一下O3 mini到底是一个什么样的情况。O3 mini的速度还是非常快的，跟O1 mini的速度相近。它的性能应该是接近原来的O1性能。大家看到很多很多的评测，这个分高点，那个分低一点，也有很多人在那扑克脸，念这些评测的结果。但其实这些评测到底哪一个是什么意思，差异在什么地方，绝大部分人很难理解。我也不在这费劲跟大家讲到底是什么情况了。我只能说O3 mini也好，O1也好，包括DeepSeek R1也好，这些模型它们的能力差异其实已经脱离了普通人的认知范围，总之都很强就可以了。

李飞飞S1K模型引爆AI界：仅50美金成本完胜DeepSeek R1与ChatGPT o1！

ChatGPT O3 mini发布深层解析：山姆奥特曼首次坦言“历史错误”与开源迷局