OpenAI或将ChatGPT涨价至2000美元/月,未来发展何去何从?
9 月 09
AIGC 2000美元每月, AIGC, AI发展, AI算法, Anthropic, API, ChatGPT, Gemini, Information, iPhone良品率, OpenAI, OpenAI团队, Orin猎户座模型, Q星算法, Scaling law, TOKEN费用, 上市, 主权大模型, 云计算, 人工智能, 人才招聘, 价格上涨, 传闻, 信息传播, 印度制造, 合成数据, 合成数据训练, 商业合作, 商业模式, 国有化, 大模型, 大模型训练, 安全成本, 富士康, 幻觉, 微软, 拉玛模型, 数据处理, 数据枯竭, 数据清理, 数据生成, 显卡, 显卡销售, 未来展望, 未来方向, 模型成本, 盈亏平衡, 盈利模式, 科技创新, 科技媒体, 科技新闻, 科技趋势, 算力中心, 算力成本, 英伟达, 草莓算法, 融资, 行业分析, 行业领导者, 谷歌, 连年亏损, 高智商犯罪, 黄仁勋 OpenAI或将ChatGPT涨价至2000美元/月,未来发展何去何从?已关闭评论
2,000美元一个月的ChatGPT还会有人用吗?
大家好,这里是老范讲故事的YouTube频道。
今天咱们来讲一讲OpenAI有可能给ChatGPT涨价的事情。消息哪来的?国外著名科技媒体Information上报道,OpenAI因为连年的亏损,而且新的模型成本快速上涨,所以有可能给ChatGPT涨价。涨多少呢?他们也是搜集了很多的信息以后,判定有可能会涨到100倍,也就是2,000美元一个月。这是不是幻觉呢?大概率是。
那你说Information上面怎么会有幻觉呢?需要注意,Information上面也是说,我们根据各种信息总结出来以后,有一种声音提到有可能会涨100倍。具体是哪个涨100倍并没有说。到底是每个月这个20美金的订阅费用涨100倍,还是说TOKEN的费用,或者其他的一些商业合作的费用,涨到100倍都没有说。而到底是涨100倍,还是说按照这样的一个级别去涨,现在也没有讲清楚。所以只是说,我们根据传言得到了这样的一个消息,这就算是一个幻觉。
咱们再讲一个幻觉的故事。前面有人提到,印度产的iPhone良品率只有50%。后来被富士康的人出来辟谣,说没有那么差。如果良品率只有50%,苹果也受不了。其实印度产的iPhone良品率比中国的低10%。郑州富士康的iPhone良品率大概是96%,印度大概是85%或者86%这样的一个水平,其实依然是可以接受的。
那么前面讲的这个iPhone在印度产,良品率只有50%这件事,完完全全是造谣吗?也不是。有人报道说,印度的某一个零部件工厂,生产的iPhone外壳送到富士康检测之后,发现两个里面只有一个能用,这就是50%。也就是iPhone的某些工厂生产的某些配件,一些批次里面,它的良品率是50%。但是这样的消息拿到国内来以后,大家就传了,印度产的iPhone良品率就是50%。它会变成一个幻觉。
这种幻觉,我们一般认为它不叫完完全全的谣言,它是有出处的。只是大家把不同出处的信息进行总结归纳以后,就会变成一个假消息。以前有人在苏格兰坐火车的时候,看到有一头牛是紫色的,说苏格兰的牛都是紫色的。这个时候旁边人说,你不能这么讲啊,你应该说你在苏格兰看到了一头紫色的牛,而不能说苏格兰的牛都是紫的。另一个人又上来说,你这个说的依然不准确,那应该怎么说呢?说你在苏格兰看到一头牛,一头牛有一面是紫色的,另外一面你没看着。你不知道,但是如果有人出去传,苏格兰的牛都是紫色的,你说他算造谣吗?咱们稍微扯得远一点,讲一下这种幻觉是怎么产生的。其实,人也会产生幻觉。苏格兰的牛都是紫色的,印度产的iPhone只有50%的良品率,这就是人类自己产生的幻觉。
所以我们不要光去嘲笑大模型。好,我们继续往下讲,OpenAI现在到底在干什么?其实很多人也很关心这件事情。这一段时间来,传出了很多的新名词,但这些新名词都代表什么意思?
比如说,去年山姆·奥特曼突然被干掉,失去CEO职位,失去董事会职位的时候,就传出来的Q星算法,这玩意到底干嘛使的?今年前几个月,山伯特曼突然放了一张草莓的照片,那么草莓算法到底干嘛用的?以及山姆·奥特曼号称马上要发布的Orin猎户座模型到底是什么,或者说非常强大的Orin猎户座模型到底是什么?
前面号称OpenAI要涨价100倍的这篇《Information》文章里面也进行了一定的解释,它把这三个算法串起来了。Q星算法是主要做科学和数学计算的。大家知道,大语言模型通过语言进行推导,它就比较容易犯9.1比9.9大的这种错误。它从语言上看,11一定比9大,但如果有一个数学相关的模型直接算,就可以避免这种错误。这就是Q星算法。
而草莓算法,其实是以Q星为基础做出来的,也就是以数学和科学比较强劲能力的算法为基础的。它主要的特性是有极强的推理能力,它可以直接拆解我们所需要的任务,而得到一个完整的结果回来。这就是草莓算法。据说这种强劲推理能力的草莓算法,今年秋天就会面世,应该没几个月了。
而下一代的大模型,非常强劲的大模型Orin,也就是猎户座模型,是使用草莓提供的合成数据进行训练的。它把所有这些东西综合在一起。
现在其实大家遇到了一个问题,是什么呢?就是scaling law快卷不动了。Scaling law就是缩放法则,所有的AI公司老板都信誓旦旦地拍着胸脯跟大家讲,我们依然相信scaling law是成立的。英伟达的股票涨成现在这样的一个状态,也是大家相信scaling law依然成立。
Scaling law是什么?我不断地往里加数据,加更多的数据,加更大的算力,也就是显卡,算更长的时间,得到更大的模型,一定效果更好。这就是scaling law,也就是我们以前讲的大力出奇迹,只要你不停地往里堆,总有一个更好的结果出来。虽然所有人都在喊这件事情。但其实,过去的一年里,这个 scaling low 基本上并没有被突破,没有更大的模型出来。虽然我们看到了拉玛 3.1405B 的推出,但因为前面有不公开参数的 GPT-4、GPT-4O 以及 Gemini 1.5 Pro 这样的版本,所以我们并不能确定拉玛 3.1405B 是否在 scaling low 上继续往前走。
Anthropic 的 Cloud,它们最强的模型叫 Opus,虽然也没有公布参数量,但大家普遍认为它应该是跟 OpenAI 的 GPT-4 或者 GPT-4O 的参数量级在一个水平上的。结果,Anthropic 推了一个 Cloud 3.5,大家觉得实在是太香了。现在可能使用 Cloud 3 Office 的人已经越来越少了,而 Cloud 3.5 的 Office 版本这么长时间也一直没推出来。
大家已经在这种大模型的基础上进行蒸馏之后,往回退了一步,并没有继续往前走去实现更大的模型。而现在,各种 70 币上下规模的模型,它们的能力已经接近 GPT-4O 了。无论是使用拉玛 3.1 的 70 币,还是使用通义千问的 72 币,或者其他一些公司训练出来的开源、闭源 100 币以内的模型,它们不能说完全超越或全面碾压 GPT-4O,但在某些特定场景下,已经接近或超越 GPT-4O 的能力了。
小模型结合各种场景之后,甚至比这些 70 币的模型表现还要更强一些。也就是这种 7 币或者十几币的模型,如果进行一定的微调,再结合特定使用场景的话,效果也很好。这导致什么呢?对于更大模型的需求在变弱,大家觉得现在这些模型挺好的。在这样的基础上,不断把这个模型变得更小,让它更加贴合具体的应用,效果也非常好。
还有一个原因是什么呢?就是 GPT-4 和 GPT-4O 指明方向以后,大家已经追赶了一年了。追赶到现在一个位置后,大家说我们已经基本上达到和超越 GPT-4O 的水平,再往前走没有方向了,没人指明道路。现在大家都在等待行业的老大,或者叫排头兵的 OpenAI,来告诉我们下一个方向在哪里。
现在 OpenAI 告诉大家,下一个方向有可能是 Orin。而 Orin 跟现在的 GPT-4O 比起来,它的差异是什么地方呢?就是推理能力更强,逻辑能力更强,幻觉更少。这是现在新的追求方向。但是 Orin 出不来,大家也不知道应该怎么做,还是要等它做出来。
阻碍 scaling low 继续发展的还有一大原因,就是数据枯竭了。训练现有的模型已经可以把当前能够找到的数据基本上都使完了。更多的数据进行清理和处理的话,成本非常高。我们直接找到过往的书籍和互联网上的信息,对这些数据进行清理,人工的这种加工成本是非常高的,因为数据量实在太大了。很多的低质量数据,拿去训练以后,可能幻觉会变得更厉害。
所以现在大家普遍使用的方法是什么?就是使用合成数据。所谓的合成数据,就是由大模型生成的数据,再去训练新的大模型。而这些数据又不是靠大模型直接生编的,而是什么呢?让大模型去取代做数据清理的人工。我们拿到大量的网络数据以后,把这些数据交给一个大模型,让它去做清理,清理完了以后重新生成一遍。
这些合成数据也不算是无根之木,它也是从现实来的,只是经过大模型的过滤和清理。拿这样的数据再去训练新模型,发现效果会更好。拉玛3其实就是这么训练出来的,这拉玛3里边的数据是用拉玛2进行清理出来的,也算是合成数据,训练大模型的一个典范。
而现在OpenAI的Orin大模型,就是准备使用它的草莓算法生成合成数据,然后再去进行训练。OpenAI自己玩的就是一个心跳。现在新一轮融资还没有关闭,新一轮融资就是已经有领投方了。据说有一家公司说,我们愿意出10亿美金,然后再等其他人跟投,希望可以凑个几十亿美金让OpenAI再活半年。
OpenAI这个几十亿美金,大概也就是活半年。他一年应该妥妥的会烧掉上百亿美金,而且这个数字可能还会快速上涨。因为去年呢,他亏了大概50亿美金,今年应该亏到上百亿美金是没什么问题的,等到明年可能就是几百亿美金的亏损。
现在大家预估OpenAI一年的收益是35亿美金,也就是这个里面大概20亿美金来自于一个月20美金的订阅,剩下的可能是做TOKEN,我们使用API买TOKEN的钱,以及其他的一些服务费。这个是OpenAI的收益预估,因为它毕竟不是上市公司,没有财报出来,所以大家只能去猜测。
而亏损,每年OpenAI大家预估的亏损额是50亿美金,这是一个非常恐怖的数字。OpenAI手里边的现金,你想微软给了100亿,再加上其他一些人给的钱,所以现在基本上是烧完了,再不融到这一轮就没得玩了。你融到这一轮以后,可能也就是再烧半年的。
那你说钱这么多都烧哪去了?第一个就是烧算力。你得上微软爸爸那里去交钱,买微软云上的算力,继续去训练大模型。第二个,你现在是1,500人团队了。而且,OpenAI现在团队规模还在不断扩张。那你人多了以后,肯定有很多的内部是是非非。有一个故事说,这个活原来一个人能干,现在不行啊,干着太累了。招两个人来,一共三个人来做这个事情。原来这个人变成领导了,后来发现比以前还累。说为什么?说我现在需要给他们做计划,让他们也做计划,回来我要审核他们的计划,看看这个数据应该怎么去分配,任务分下去。我还要调解他们之间的矛盾,还要去做考核计划。说这个比以前我一个人把活干了还累啊。
所以,这个人增加了以后,绝不是说我增加了一倍的人,生产的效率就提高一倍。经常是提高到一定程度以后,你的生产效率就不会再提高了,而开始下降。这个就算是一个边缘。所以,OpenAI内部现在是是非非,肯定是非常多的。作为当前最红的行业AIGC的领头兵,也就是当红炸子鸡,OpenAI自己招聘人才,以及他要留住自己的人,成本肯定会直线上升。投资基金、各种猎头公司,每天都趴在他外边等挖他的人。
那么,你要想让这些人留下来,一定要多给钱。新的模型,训练成本肯定也是几何级数上升的。你想让scaling low再次起作用,就一定是要投入更多的数据、更多的算力,这个事没有办法。而且,越大的模型,你的安全成本就越高。以前我们就都在讲,什么叫知识越多越反动?你这个模型变聪明了以后,他有可能给大家带来的伤害会变得更加惨重。我们想让一个更聪明的大模型成为安全的模型,所需要支付的成本也一定会更高一些。如果这玩意再出错了,那就是高智商犯罪了。
OpenAI现在真正的困境是什么呢?就是不赚钱。开始其实有一些路就走错了。聊天模式20美元的订阅以及TOKEN收费,不光是他自己走错了,还把整个的行业都带沟里去了。他有他强的地方,就是你通过聊天方式,一开始就震惊了全世界,让所有人,不管适不适合去用AI的,大家都冲上来用,成为了全世界关注的焦点。这是他使用聊天模式取得的成就。
但是,聊天模式是一个双刃剑。一面是说大家都关注了,每一个人都可以用;另外一面是什么?你要想从聊天模式再继续往前走一步,可以让大家能够更好地体验到AI的能力,这一步其实是非常难以越过的。另一方面,20美金订阅,那他出了这样的一个数据之后,导致整个行业只能跟他对标。微软的Copilot也是20美金,谷歌的Gemini你只能在20美金往下做,其他的一些cloud等等。
都是在20美金这个范围上下去波动。至于一开始,那个人到底为什么定他20美金,这个大家只能想破脑袋去想了。前人一定是有他的道理。就跟原来有一个笑话说,有一个大的印象派画家,他有一副名画,很多人搞不清是画什么的。一堆人在那去做研究,甚至有些专家专门去研究这幅画,还发表了很多论文,成为了学术态度。
第一个研究这幅画具体画什么的学术泰斗离开人世去了天堂以后,正好碰到这个画家,就去问他说:“您那画到底画什么呢?你看我研究了一辈子,都成为学术泰斗了,我也没研究明白,还跟很多个派系吵来吵去的。”那个画家说:“你到底说的哪幅画,我想不起来了。”最后他太太在旁边提醒了一下:“你说的不会是擦手布吧?你每次画完画,然后拿那个布擦手,形成了一副印象派的名画,让后人研究了很长时间。”
所以20美金有可能就是这么来的。而20美金跟token付费这种事情,其实会极大限制使用AI的人数,因为它会限制流量的上升,也会限制新的商业模式的爆发,这个其实是有毒的。现在OpenAI其实面临着当时谷歌的困扰。谷歌的困扰是什么?是分叉。当时谷歌把安卓做出来以后,所有人一看,这个东西实在太厉害了,我们拿它去分叉,就有安卓的各种智能家电的操作系统、安卓的手表操作系统、安卓的各种嵌入式操作系统、安卓的各种定制操作系统。谷歌说不行,你们不能分叉,我一定要把安卓的版本一直升上去,让你们所有分叉人都死掉。
OpenAI其实现在面临的困难是一样的,它指明了方向,大家各自去发展,长出了Anthropic、拉玛、Gemini,现在的标准已经不统一了。想要继续站在排头上,继续引领风潮,必须不断放出新消息,不断去指明方向。但是,手里边的钱又不够多,攻城能力也不够强,也没有盈利能力,只能是不停地放空话。你像从2024年年初到现在,OpenAI已经吹了多少牛,到现在都没有实现。
那么OpenAI的解决方法有哪些呢?第一个就是涨价,像刚才我们前头讲的,把这个费用涨100倍,涨到2,000美金一个月。这就是第一个处理方法,涨上去以后就可以达到盈亏平衡了。第二种方式就是不停的融资。山姆·奥特曼在斯坦福大学演讲的时候也讲过,说你们不要去研究挣钱的事情,我就不停的去找钱,反正我有这个能力。找完了以后呢,就把它烧掉,再去找。现在新的一轮钱找到了,这条路还是在往前走,而OpenAI准备去上市。上市的时候,你又可以圈一大笔钱吧。但是上市了以后,你未来还是要去盈利的啊。所以甭管是找钱也好,还是上市也好,算是饮鸩止渴,或者是寅吃卯粮,我们把未来的一些可能性把它消耗掉,那继续在亏损和越亏越大的这个道路上狂奔向前,这不是一个长久的解决之道。
还有一条路是什么?就是重新发明定义,走通一些新的商业模式。这可能是山伯特曼或者整个OpenAI,包括整个硅谷和行业,都在期盼的一个事情,就是说我们不再去依赖传统的这种流量商业模式了,而是做一个新的商业模式,像收税一样,把这个税收上来,让大家像一个基础设施那样去使用这些AI大模型。但是这种模式呢,到目前为止还没有走通。未来到底能不能走通这件事情,还是一个问号。
那你说,如果这个商业模式走不通,盈利呢?其实从短期来看,还是很难的。还有没有其他的方式?OpenAI难道就要倒在这里了吗?还有一个方式就是国有化,直接交给国家,让国家通过税收、通过印钱直接去使用这些大模型。现在Scaling Low继续往前走的话,可能迟早会走到国有化这条路上。
那么就看到底是大家能够先去找到合适的商业模式,让整个AIGC产业健康发展,还是最终让AIGC都沦为主权大模型。到底是走哪条路?因为主权大模型这件事情,是黄仁勋提出来的,是说我们以后每一个国家都去买自己的显卡,建自己的算力中心,每一个国家都拥有自己的主权模型。这是他提的这条路,不知道是光明还是黑暗,但也在我们的前方等待着我们。
好,这就是我们今天讲的故事。一OpenAI准备涨价100倍,为开始探讨一下OpenAI未来的一些发展方向。好,今天的故事就讲到这里,感谢大家收听。请帮忙点赞,点小铃铛,参加Discord讨论群,也欢迎有兴趣、有能力的朋友加入我们的付费频道,再见。