硕鼠的博客站

范路的博客主站,时而会发些东西。

Posts Tagged ‘算力’


大家好,欢迎收听老范讲故事YouTube频道。今天,咱们来讲一讲黄仁勋在COMPUTEX上的狂欢。COMPUTEX是一年一度在台湾举行的计算机大会。黄仁勋,作为现在真正AI时代的当红炸子机,可能是唯一靠AI赚了大钱的人。虽然微软也在赚钱,但是微软整个靠AI挣的钱并没有那么多。真正靠AI赚了大钱的公司只有他一家——英伟达。刚才我看了一下,英伟达现在市值2.7万亿美金。大家知道,再往前就是微软的3.2万亿,第二名是苹果,2.9万亿,还差那么一点点。可能稍微一哆嗦,英伟达就有可能成为世界第二市值的公司了。那么,黄仁勋上面都讲了什么呢?作为网红,肯定还要先暴露一下行业秘密,别人都不知道他知道的事情。上来先说一下他现在讲的是什么——就是GPT-4到底有多少参数。GPT-3.5大家知道是1,700多亿参数,就是一个170多亿级别的模型。但是到GPT-4的时候,OpenAI就再也没有出来说它到底有多少参数。很多人说你是不是超过万亿了,对OpenAI来说,这个数据不是很准确。我来辟谣了,但是具体有多少,从来没有讲过。黄仁勋在前面的GTC,就是GPU技术大会上,每年一次的英伟达自己的开发者大会上,上面也讲了……

说起来1.8T,这个1.8T指的是什么呢?其实就是1.8万亿参数,而且它是一个Moe模型。当时OpenAI并没有对此多说什么,但这一次,在《Computer Text》上,他们又反复强调了这个事情,明确指出GPT-4的训练参数达到了1.8T。这让人们意识到,想要达到GPT-4的水平,还有很长的路要走。尽管现在大家都在努力研发号称能达到或接近GPT-4水平的模型,比如几百亿参数的模型,比如梅塔的拉马3可能会有一个400亿参数的模型,国内也出现了很多一两百亿参数的模型。但事实是,即使提到的1.8T参数,如果考虑到是Moe模型,分成八份来看,那么单个模型可能也就相当于200多亿参数的水平。

Read More…

大家好。欢迎收听老范讲故事YouTube频道。今天咱们来讲一讲XAI。刚刚得到的60亿美金融资,是多呀还是少啊?这XAI呢,是马斯克的公司啊。这个马斯克是特别喜欢x,所以他现在把推特也改成x了啊。

XAI呢,我们首先要稍微梳理一下。它不属于特斯拉,也不属于推特,是一个独立的公司。就是马斯克下面各个公司都是独立的,他都是老大机。接口特斯拉space x Twitter SOLO city,就是做太阳能板的那个,再加上XAI啊,这都是独立的公司。

XAI呢,其实前面只提供了group,而且group呢是在呃x .com,就是原来的Twitter里边再去工作的。group现在从它的能力来说,并不比现有的这些强。在现有的各个大的模型里头,应该算是不太突出的一个。虽然它开源了,但是也没有引起任何的响动,因为它开源那个模型实在太大,绝大部分人搭不起来,也没法用。

那么在这样的一个情况下,他突然拿了60亿美金的融资,到手现金60亿美金哦,很大的一笔钱。估值一下达到了240亿美金。这个钱真的是很多呀。大家要知道,他一下就成为了全世界所有AI公司里的第二名。第一名是open AI,860亿美金。第二名呢是anceropic,是150亿美金,就是做cloud这家公司。第三名呢,是法国的Mistra,那也是微软投的啊,那是60亿美金,原来是这样的。结果现在好突然,多出一个240亿美金的公司来,他排第二,了直接排到anseropic前面去了。

Read More…

大家好,

欢迎收听老范讲故事YouTube频道。今天咱们来讲一讲国内大模型厂商,突然就变脸了,开始打价格战,而且是价格生死战。这个战争是从哪开始的?首先是有一个大模型叫deep sick,他先开始干的。原来我们使用100万TOKEN,大概也得十几二十块钱,甚至贵的也能有五六十块钱。国外的大模型经常是要到十几美金。他呢,直接来了一个啊,100万TOKEN一块钱人民币。DPC大家可能不是那么熟悉,因为他后边不是一个互联网巨头,也不是原来从互联网大厂出来的人,他后边是一个私募巨头,换方量化直接不讲武德啊,100万TOKEN一块钱人民币。

那紧随其后的呢,是豆包啊,这是字节跳动下边的大模型,直接降价到100万TOKEN 0.8元人民币。你不是一块吗,我8毛啊。然后通1,000问说那你们都降,我也来呗。我后边反正是阿里云,谁怕谁啊,最多的显卡都在我手里头,那降价啊,把通1,000问最新的千问Max千问浪什么,全都降到了一个白菜价。当然同1,000问降价的时候呢,还是用了一些小花招的啊,他把输入TOKEN跟输出TOKEN的价格分开了。什么意思?就是当你往里梳的时候,你也是算TOKEN的,当它往外吐的时候,也是算TOKEN的。就是它把往里梳的这个TOKEN的价格,降低了更多啊,往外吐的这个TOKEN呢,也在降,但是降的并没有那么多。大家能够理解,就是你往里输的内容,比如说现在有很多的大模型号称是可以输入100万字,200万字,但是他每一次输出,可能也就输出个1,000字,2,000字,他不会输出那么多的。你说一大模型坐在那,吭哧吭哧给你吐100万字出来,有人看没有?一个人坐在那阅读,读100万字也得会功夫吧。所以呢,从大模型输出的这个TOKEN稍微贵些啊。然后百度特别逗啊,百度先强调了一下,说不要关注价格,要看这个大模型的特性,以及大模型的性质,是不是适合你的场景。讲完了以后呢,左右一看说哎,你们都跑了,等等我等等我,对吧?直接把手里头两个最常用的模型,一个叫快速模型,一个是轻量级模型免费,对吧你们还要收钱吗?咱不要钱了。

Read More…

大家好,欢迎收听老范讲故事YouTube频道。今天咱们来讲一讲伊利尔彻底离开超级队,其团队解散,而OpenAI彻底失去束缚,可以一骑绝尘的事情。

从去年11月,山姆奥特曼突然被董事会开除,又经过了三四天戏剧般的反转,反转再反转之后,山姆奥特曼终于干掉了董事会,王者归来。从那以后,作为董事会里边唯一留任的伊利尔就再也没有出现在公众视野之中。很多人都在猜说这个人到底干嘛去了。

当时这个事情发生的时候,所有人就在猜测,说伊利尔是不是要离职,伊利尔什么时候离职啊。但是呢山姆奥特曼一直都是体现出政治家的这种手腕,一直在称呼伊利尔来为啊我最亲密的朋友。但是伊利尔呢一直没有发声。最近一次发生是在跟埃隆马斯克的诉讼过程中,由伊利尔的账号在里边说了一句话啊,但是也就仅此而已了。

伊利尔在这一段时间里他就彻底不见了,现在呢终于知道说啊他离职了啊,正式离职。而且呢根据已经从OpenAI里边离职的一些其他跟安全相关团队的啊,这些人去讲说伊雷尔从去年11月份到现在半年的时间就再也没有回到过OpenAI的办公室,一直是在进行远程工作,远程协调。对吧这个人等于就消失了,现在半年了啊终于离开了。

Read More…

大家好,欢迎收听老范讲故事的YouTube频道。今天我们又请到了老朋友尹迪狗,给我们介绍一下刚刚召开完的谷歌艾欧。这一次到底发布了什么。而在谷歌艾欧之前的一天,OpenAI我觉得算是故意捣乱截胡,发了个GP4欧出来。我们就正好趁这个时机呢,把这两个发布会或者两两个产品吧,一起来总结一下。首先呢,我想先问一下,GBT4O到底算不算是划时代的产品。嗯,至少模型啊,分成两部分,它发的是PPT是o是模型混合模态嘛,他把语音视频和文字一块训练的嘛,可以同时输入和输出嘛。这个相当于是,嗯,也不叫划时代吧,就是他之前所有的工程技术的沉淀。嗯然后呢,做了一个特别好的一个交互形式,就是语音交互。而且那个语音交互的很大一个特点,发完之后不是马上就有人升级吗,一搜我的这个APP上面的模型以及GPT,搜了然后大家都想打开。那那个耳机,点上去之后呢,可以跟他聊聊天。实际上,那个聊天并不是他发布会上的那种APP,那个还是回合制的,用那个rest接口聊天。我,发出去然后回来,这个回合制的,但是呢,他在发布会上演示的是完全stream的,就是像就像我们现在一样,我们录节目,我们用的是Web RTC协议嘛,streaming,就是你的Server端,它的那个TOKEN,它就不停的接收是吧,做实时处理。这个特别耗流量,耗TOKEN,耗算力的。嗯现在还没用到这个模型,所以大家感受不到,所以我记得第二天还第三天的时候m奥特曼还是他们官方账号,发了一个说明嘛,说哎你们大家用的现在还不是,发布会上也是这个,哈哈哈,一堆人说说这一直完完全不对,这么慢的响应,我觉得借手报了一下,就是他是非常natural,非常自然。可能就是大家第一次用起来 GPT 的感觉,一样哎。哇哦,是他没这样回答问题。就是他确实是有那个时候的一个感觉。

Read More…
Close Bitnami banner
Bitnami