ChatGPT O3 mini发布深层解析:山姆奥特曼首次坦言“历史错误”与开源迷局

ChatGPT O3 mini发布深层解析:山姆奥特曼首次坦言“历史错误”与开源迷局已关闭评论

ChatGPT O3mini正式发布的时候,山姆奥特曼到底算不算是认错了呢?大家好,欢迎收听老范讲故事的YouTube频道。今天咱们来讲一讲O3mini的发布,以及奥特曼到底在说些什么。

过年的时候,基本上是被DeepSeek刷屏了。全世界各地跟AI相关的,或者不相关的人,都在尝试去理解和阐述DeepSeek到底干了点什么,到底对于他们有什么样的影响。风口浪尖上的这些闭源大模型公司,特别是OpenAI,肯定也是坐不住的,把它的王炸级产品ChatGPT O3 mini给炸出来了。发布了以后,马上还去做了一个访谈,回答了很多相关的问题。在其中,承认了说在开源领域里头好像站错队了。

那么先说一下O3 mini到底是一个什么样的情况。O3 mini的速度还是非常快的,跟O1 mini的速度相近。它的性能应该是接近原来的O1性能。大家看到很多很多的评测,这个分高点,那个分低一点,也有很多人在那扑克脸,念这些评测的结果。但其实这些评测到底哪一个是什么意思,差异在什么地方,绝大部分人很难理解。我也不在这费劲跟大家讲到底是什么情况了。我只能说O3 mini也好,O1也好,包括DeepSeek R1也好,这些模型它们的能力差异其实已经脱离了普通人的认知范围,总之都很强就可以了。

现在推理模型的发展应该已经向着未来简史的作者尤瓦尔·赫拉利所设想的方向前进了。他设想的是什么呢?就是未来的社会有少数精英控制,绝大多数人会沦落成无用阶级。无用阶级就是他们既不创造价值,也没有任何的用处,可能未来的社会会变成这样。现在,OpenAI就在往这块走,DeepSeek R1也在向这个方向走。所以未来可能是少数精英使用这些博士级的AI模型去与解决各种人类的世界性难题,剩下的人,我们就是无用阶级,大家开心就好。

价格方面,O3 mini比DeepSeek R1中国部署的版本……

还是要贵的,就是比DeepSeek自己的这个API还是要贵。比DeepSeek在中国,比如说腾讯云或者是硅基流动上部署的也都贵。但是呢,它比在美国部署的DeepSeek 21要便宜。这个特别有意思,就是在together上,在美国的亚马逊、微软云,在这些云计算平台上,都已经部署了DeepSeek R1了。ChatGPT O3 mini比它便宜,也就可以了。

所以呢,在价格上也算是有了一定的进步吧。然后O3 mini呢是第一次向免费用户开放,原来O1、O1 mini都是免费用户不能用的,现在O3 mini免费用户也可以用了。Plus用户,就是一个月20美金的用户,每天呢可以使用150次。其实呢,O1和O1 mini这个用量,我从来没有达到过。那个我每天是可以使用50次的,每天150次的这样O3 mini的用量,我估计我也用不到。

像我面前站个博士,你说我看着他每天跟他说啥呢?我站在他面前就光剩自惭形秽了。这个也算是继续向公众开放的一种努力吧,与搜索相结合,这个是O3 mini做的比较大的进步。但是呢,他进一步退一步,退了是哪一步呢?他不支持上传文件,不支持图片的理解了。像O1的话是支持图片解析的,但是呢,不支持搜索。O1还支持canvas,就是它们的这种叫做画板。O3 mini支持搜索,但是不支持画板,不支持图片理解,它是这样的一个取舍吧。

但是这个呢不像是黄教主这种叫刀法精准,这个可能真的是想把这些功能都打开,还是有挺大难度的一个事情。当然,现在我们在ChatGPT里头已经看不到O1 mini的模型了,现在进去就是O1和O3 mini,以及O3 mini的一个高级版本。就是说你每次让O3 mini干活的时候,可以选择是使用普通思考版本还是深度思考版本。深度思考版本会更慢一些,然后输出的内容的话会更好一些。

O3 mini发布了以后,山姆奥特曼以及他们的一些高管……

就跑到Reddit上面去做了一个AMA的环节。所谓AMA呢,就是”Ask Me Anything”,就是问我任何事情,我就现场给你回答。和马斯克不和,所以呢,山姆·奥特曼是不会跑到Twitter上去做类似的活动的,也不会去谷歌或者是Meta上面去做类似的活动。但是,TikTok对于山姆·奥特曼这种政客来说,就太刺激了,也不会去。

当然,在这些平台上的OpenAI都是有账号的,只是呢,这种问答是放在Reddit上了。这个就显示出来OpenAI跟Reddit之间还是要更亲密一些,这个东西叫亲疏有别。OpenAI跟Reddit是有很多的合作关系的,比如说OpenAI向Reddit采购了内容进行训练,OpenAI是Reddit的广告合作伙伴,OpenAI为Reddit提供了AI驱动功能,这个是最重要的。

还有一个不那么重要的就是,山姆·奥特曼本人是Reddit的重要股东之一,这是他自己家的企业,因为Reddit是YC的孵化企业,它在孵化的时候,山姆·奥特曼应该是YC的CEO吧,大概是这样。

那么在整个的这个环节上面,AMA环节上面,山姆·奥特曼呢也承认了DeepSeek是一个让人印象深刻的创新产品了。然后O3的完整版本的模型,未来的几周或者几个月还是会公布的,因为现在公布的是O3的mini版本。新的图像模型正在研发之中,可能未来几个月还是会公布,因为去年的连续12天发布会的时候,大家本来猜测应该会有Dalle3的进一步的版本,可能会有Dalle4,但是呢没有出来,这个还在研发之中。

而且呢,也即将更新高级语音模块,这个是现在我最喜欢的功能,就是ChatGPT的高级语音。至于GPT-5呢,遥遥无期,这个还早呢。在整个的这个回答过程中,我们已经看到DeepSeek的事情呢,对于美国或者对于全球来说,应该已经算是尘埃落定了。怎么样尘埃落定了呢?第一个,这个事有没有创新?有,他们也承认。

这是一个令人印象深刻的产品,但是呢,也没什么大不了的。山姆奥特曼也说了,我们会拿出更好的模型出来的。你这个成本降低也就是这样,我们现在成本也降得很低。你在美国部署的这个产品,我比你的价格还要低一些,这个也就如此。

各大云厂商呢也都部署,英伟达、微软、亚马逊,together,很多的这些云计算厂商都部署了Deepseek。在这样的情况下,再进一步进行维权,去起诉或者什么限制,这个已经没有什么意义了。大家都已经跑起来了,而且英伟达还去玩了一个什么梗呢,就是说英伟达上部署的DeepSeek是速度最快的。在单台的HGX H200系统上,DeepSeek R1模型每秒能够处理3,872个TOKEN,这是一个多么恐怖的数字。原来我们都觉得这种推理模型很慢,你想它一秒钟可能几千字就哗就出来了,这个已经足够快了。

HGX H200系统是一个什么样的系统呢?8个H200的GPU,每个上面有141G的现存,就完全属于怪兽级的机器。那么OpenAI呢,应该也就算是承认了现实,就是Deepseak加入到了竞争过程中来,也就这样了。我们也不惦记再把你踢出去了。至于说你到底有没有抄袭,有没有违规使用,这个事我给你记着,但是呢,大家都用起来了,也就用吧。

未来呢,全世界应该都会去使用DeepSeek,因为现在英国也好,印度也好,包括日韩,都准备自己去部署DeepSeek,自己去玩耍去了。未来的话应该是各用各的,就是各国用户自己部署,自己定价,自己使用就完事了。至于中国的DeepSeek到底有多便宜呢,跟他们也没关系,他们也不会把他们的数据送到中国的DeepSeek服务器上来去用。

所以呢,DeepSeek对于整个的AI圈来说,到这里算是画上了一个暂时的句号吧。大家接着往前跑就可以了。那么到底有没有承认错误呢?这是我们今天要讨论的。首先呢,他讲到说,我们要把整个O3 mini的思维过程都完整输出出来。

原来在O1的时候,他并没有输出完整的思维过程。因为这种推理模型有一个思维过程:我先怎么讲,后来怎么讲,然后说什么东西。为什么原来没输出呢?因为怕被拿去蒸馏。如果把整个思维过程都拿出来了,人家拿回去,就直接训练自己的新模型去了。他们认为,DeepSeek还是很恰巧地获得了其中部分的工作原理,这些工作原理跟ChatGPT O1是一致的。至于到底是怎么获得的,比如说你是蒸馏了,还是怎么去猜测其中的这个结果或过程,反正你是已经达到了跟我一样的工作方法了。而且他原来并没有完全把他的推理过程都拿出来。

DeepSeek R1呢,是完全公开思维过程的。你问他什么问题,他要想很长。像我们经常问DeepSeek R1一些问题的时候,他光想的部分可能想5000字,输出的部分只有一个,比如说几百字的结果。现在他们决定了GPT O3 mini也去进行完整的思维过程输出。你们愿意去蒸馏,你们去吧,反正这个事已经没什么可藏着掖着了,后边已经冲上来了。

我试了一下O3 mini,它有的时候输出的这个思维过程是英文的。但是我今天还碰到了一次,输出了阿拉伯语的思维过程。我用中文问了个问题,然后这个中间的思维过程,哗,阿拉伯语就出来了,看的我是满天都是星星。这个思维结束了以后,最后给出的结果是中文的,因为我是用中文问的。怎么说呢,这种对于人很不友好。但是对于大模型来说,输出阿拉伯语的思维过程、输出日语的思维过程、输出英语的思维过程,这个其实是没有什么区别的,因为他们都可以拿回去蒸馏,只是降低了人的使用体验。

DeepSeek R1的思维过程呢,有的时候是中文的,有的时候是英文的。我还没有遇到过阿拉伯语这样奇怪的情况。反正思维过程大家都是进行完整输出了。山姆奥特曼也讲了,既然DeepSeek已经这么干了,那我们就干吧。

你要蒸馏?不行,你蒸馏他的去,或者你蒸馏我的都行,没什么大区别。我们也准备把所有思维过程都发出去。至于开源这一块呢,山姆奥特曼的原文大概是这样的:就是我个人认为,我们在这里站在了历史错误的一边,需要找出不同的开源策略。但并非OpenAI的每个人都同意这种观点,这也不是我们目前的首要任务。

这个是别人在问他,说你是不是要去开源的时候,他在上面给出的回复。很多人呢,看到了这一点,认为我个人认为我们站在了历史错误的一边,而认为这句话就代表着关于开源策略这件事情上,山姆奥特曼已经认错了。但是你说我是不是就可以认为未来他们马上就可以开源了?当然,大模型开源并不是把所有原代码都拿出来,而是什么呢?是开放一些权重出来,比如说像DeepSeek,像Llama,都是开放权重,就是我们拿回来以后可以再去进行部署使用,是这样的一个东西。在这件事情上呢,他说未来有可能会开放一些权重出来,但是现在这个并不是最重要的事情。而且在这里他也讲了,说有人不同意,就是并非OpenAI的每个人都同意这种观点,肯定还是有人希望继续闭源下去。

但是你说这个闭源的人到底是不是山伯奥特曼,这个不好说,因为至少他出来还是要站在一个比较高的道德制高点上说,我认为这事还是该开源的。我认为我们站在了历史错误的一边,但是有别人不同意。到底谁不同意,咱们接着往下讲。

OpenAI目前最重要的事情到底是什么?人家也讲了,说这不是我们目前的首要任务。OpenAI目前最重要的事情是融资。去年应该是第三季度吧,刚融了一轮,当时已经拿到1,000多亿美金了,现在又跑出来融资了,这个钱又造干净了。这一次的话,准备以3,000亿美金的估值再去融400亿美金左右的这个钱。而且在这一次的话,要摆脱微软的桎梏,原来都是微软出钱出的最多,微软已经出了130亿美金了,这一次的话是软银领投,孙正义领投150-200亿美金软银出。

剩下的其他人出,而软银呢将取代微软成为最大的投资方。这个是现在OpenAI最重要的事情:摆脱微软桎梏。因为谁不让他开源呢?里头有一个很重要的因素就是微软。微软呢是有OpenAI很多的独家合作权的,比如说它的Azure云上,有Azure平台的独家转售权。它可以通过微软云去销售OpenAI的API。

就是你现在想用OpenAI的API去进行开发的时候,官方有两个渠道,一个是在OpenAI的官网上,你可以直接买;还有一个就是在微软云上可以买,其他的都不行。你比如说我现在想在谷歌云上、亚马逊云上、Oracle云上去买的东西,不允许,没这事。这是第一个独家权利。

第二个呢,叫产品中的知识产权、使用权,比如说Bing,现在应该叫Copilot了,或者是GitHub Copilot,这些产品里头直接使用ChatGPT的大模型,微软是有权直接用的。第三个是什么呢?叫OpenAI API的独家托管权,这个东西只能托管在我这,不能托管到其他地方去,这是微软的独家权利。

那么开放权重的这些模型发放出去这件事,肯定是跟刚才我们讲的微软这些权力是相抵触的。微软也不能站出来说:“那我就放开吧。”作为微软这种大公司里头,任何一个下边具体办事的人都不敢去写这种协议。像我以前在公司里边做投资的时候,我们也绝不敢写这样的协议出去,什么都没有。我就直接写个协议,把原来已经拥有的独家权利直接放弃掉,这不行的。

但是在什么时候可以放弃这些权利呢?就是有新的投资人进来了。新的投资人进来以后,说他占股了,我们放弃一些权利,因为跟这个新的交易相互冲突了。在这个时候呢,可以进行一定的利益交换。所以呢,他可以趁着这一轮软银孙正义的投资,把微软这种独家权利争取回来,然后呢,再开放一些权重的模型出去。这是有可能的。

但是微软呢,这一次大概率不会去退出。就是孙正义给钱了以后,微软拿着钱跑了,应该不至于。微软呢,应该还会追加跟投。

应该在几十亿美金到100亿美金之间。他还会去投进去,按道理说呢,应该不会特别多。这但这个数字相对来说就比较敏感了。因为像投资里头呢,一般会有一种权利,就是新的投资进来以后,我们会再去给一些钱,保持原来的股份比例不降低。

但是呢,现在OpenAI内部的这些股份比例,肯定要重新调整。调什么呢?就是从非盈利机构,整个这个框架摆脱出来,要变成一家可以上市的盈利机构。这个过程的话,大家的股份肯定要重新去进行一些调整和分配。这就是现在OpenAI最重要的事儿,也就是星际之门已经正式开启了。这几百亿美金,也许在一季度就可以看到落地了。那这个是真金白银要给钱的,OpenAI要把这个钱收到手里面。

至于说这个钱,到底有多少是微软的代金券,这个一定是有很多是微软云的代金券,有多少是现金,到了OpenAI手里面,可能未来一段时间我们还可以继续吃这个瓜吃下去。

好,这就是今天我们讲的ChatGPT O3 mini发布,以及山姆奥特曼出来认错的故事。好,这期就讲到这里,感谢大家收听,请帮忙点赞,点小铃铛,参加Discord讨论群。也欢迎有兴趣、有能力的朋友加入我们的付费频道,再见。

Comments are closed.