硕鼠的博客站

范路的博客主站,时而会发些东西。

Posts Tagged ‘GPT4’


大家好,欢迎收听老范讲故事YouTube频道。今天,咱们来讲一讲黄仁勋在COMPUTEX上的狂欢。COMPUTEX是一年一度在台湾举行的计算机大会。黄仁勋,作为现在真正AI时代的当红炸子机,可能是唯一靠AI赚了大钱的人。虽然微软也在赚钱,但是微软整个靠AI挣的钱并没有那么多。真正靠AI赚了大钱的公司只有他一家——英伟达。刚才我看了一下,英伟达现在市值2.7万亿美金。大家知道,再往前就是微软的3.2万亿,第二名是苹果,2.9万亿,还差那么一点点。可能稍微一哆嗦,英伟达就有可能成为世界第二市值的公司了。那么,黄仁勋上面都讲了什么呢?作为网红,肯定还要先暴露一下行业秘密,别人都不知道他知道的事情。上来先说一下他现在讲的是什么——就是GPT-4到底有多少参数。GPT-3.5大家知道是1,700多亿参数,就是一个170多亿级别的模型。但是到GPT-4的时候,OpenAI就再也没有出来说它到底有多少参数。很多人说你是不是超过万亿了,对OpenAI来说,这个数据不是很准确。我来辟谣了,但是具体有多少,从来没有讲过。黄仁勋在前面的GTC,就是GPU技术大会上,每年一次的英伟达自己的开发者大会上,上面也讲了……

说起来1.8T,这个1.8T指的是什么呢?其实就是1.8万亿参数,而且它是一个Moe模型。当时OpenAI并没有对此多说什么,但这一次,在《Computer Text》上,他们又反复强调了这个事情,明确指出GPT-4的训练参数达到了1.8T。这让人们意识到,想要达到GPT-4的水平,还有很长的路要走。尽管现在大家都在努力研发号称能达到或接近GPT-4水平的模型,比如几百亿参数的模型,比如梅塔的拉马3可能会有一个400亿参数的模型,国内也出现了很多一两百亿参数的模型。但事实是,即使提到的1.8T参数,如果考虑到是Moe模型,分成八份来看,那么单个模型可能也就相当于200多亿参数的水平。

Read More…

大家好,欢迎收听老范讲故事YouTube频道。今天咱们来讲第一个故事。Open AI进一步开放了GPT-4欧的免费功能和范围,留给苹果的时间真的不多了。所以,这一个话题里我们会讲两件事。

第一个是Open AI进一步开放了很多免费用户可以使用GPT-4,主要是4欧了。另外呢,就是苹果现在的日子并不好过。虽然我们前面反复在想说,大家万众瞩目,万众期待WWDC,6月5号吧,大家都在等这一天。但是,呃,越是大家期待的事情,可能最后啊,越让大家失望。

最近Open AI呢,肯定是消息不断。为什么呢?山伯特曼本人是一个呃,政客或者说他政治手腕非常的强大。前面闹出了很多的负面,比如说伊利尔走人,超级队旗团队的负责人走人,而且这两天呢,超级队旗那个负责人已经去了anceropic,还在跟瓦解,也就是斯嘉丽约翰逊才在这打着官司。各种的负面都很多,所以呢,一定会放出很多消息来,去纠正这些负面信息啊。

Read More…

GPT-4oo大家好,欢迎收听老范讲故事的YouTube频道。今天咱们来讲一讲Open AI最新发布的GPT-4,到底是一个什么样的东西。专门赶在谷歌I/O之前的一天开,这就是司马昭之心,路人皆知了。对,指的是谁,大家心里都明白。当然,选择这一天开发布会的还有其他人,比如李开复也在这一天发布了他“灵异万物”新的大模型。以后找机会学习再跟大家分享。通义千问呢,是早几天,5月9号发了他们自己新的大模型。

我呢,自己肯定是懒得去在凌晨2点看直播了,所以到今天,看看录屏,然后看看其他人都在说什么,再跟大家介绍一下GPT-4到底是一个什么样的东西。在这之前,大家一直知道,说他要在这个时间点开发布会,甚至在他没有公布发布会时间的时候,大家也都在猜,说是不是上周要发布,是不是这周要发布,然后猜了很多有可能会发布的产品。有些人猜GPT-5,有些人猜测试GPT。

战猫奥特曼说了,不是GPT-5,也不是测试GPT。我呢,在礼拜天,也就是在发布会前的一天,还在推特上在问,说这个新发布的东西会不会是GPT Siri或者是Siri GPT,对吧,因为已经传出消息了,苹果要跟Open AI签约嘛,那么出来的东西应该是这样的一个东西吧。甚至呢,我也猜过,说是不是GPT-5出来了以后,GPT-4就免费了啊,万一GPT-4免费了呢,现在惦记收费的这些版本该咋办呢,还活不活得下去,这事没法混了。所以呢,当时拆解了这么多种可能性,从我个人角度上说,我猜了GPT-40,免费的GPT-4,GPT Siri,拆了三个方向。现在看呢,我觉得我也没猜错。对吧,现在的GPT-40啊,基本上是这样,这四个方向的事其实都干了。都发布了什么呢?第一个是GPT-40,它可以进行语音识别与翻译,支持50多种语言,可以进行实时搜索。但是,它并没有进行搜索之后的很完善的内容组织,不像Perplexity那样,可以进行很好的搜索结果组织。GPT-40免费对公众开放了,这也是一个逐步开放GPT-4的过程,虽然开放的是40版本。

Read More…

大家好!欢迎收听老范讲故事的YouTube频道。今天咱们来讲一讲,前几天Sam Altman在斯坦福大学里说了些什么。

大家注意啊,这是一个闭门会议,我们现在所能够看到的信息,都是网上流传的、各种只言片语。有照片,但是呢,并没有看到全文,什么视频啊,我反而是没看到。以及根据这些只言片语做的各种总结。4月25号上午,应该是黄教主考去送礼去了,送的是DGX H200。Sam Altman,黄仁勋以及Greg,他们三个人合了一张影。下午呢,就应该跑到斯坦福去做活动去了,参加了斯坦福大学创业思想领袖讲坛,这样的一个活动。Sam Altman号称自己是这样的一个领袖,应该没有任何毛病。上千人参加,而且呢,还有给他的生日祝贺,说祝Sam Altman生日快乐。那你说,上午老黄是不是也去送生日礼物了呢?呃,严格来说不算,但是稍微宽泛一点来说,问题不大。Sam Altman是1985年4月22号生的,到4月25号,差个两三天,给你补份生日礼物,补一份生日祝福,应该也算是应有之意吧。

山毛特曼算是一个非常根红苗正的硅谷创业者。为什么这么讲呢?他是在大二的时候,从斯坦福大学辍学的。比尔盖茨辍学了,扎克伯格我印象里好像也是辍学了,很多的创业者都辍学过。斯莱姆奥特曼,斯坦福辍学,你辍学呢,就是声明你能考得上斯坦福,否则你怎么有机会从斯坦福辍学呢?热情熊熊燃烧,不能再念下去,我要去创业。我原来也碰到过一位辍学创业的朋友,就是编程猫的创始人,他呢,是当时在法国一个学校里面念硕士,也就是创新创业专业的一个硕士。到最后,来参加我们的这个创业比赛的时候,他说:“哎呀,再不创业就要毕业了啊。再不辍学就毕业了。”当时讲了这么一句名言,我们记到现在。所以,山伯奥特曼是一个根红苗正的斯坦福辍学创业者。那么他讲了几件事呢?

Read More…

大家好,欢迎收听老范讲故事YouTube频道。今天咱们来讲第一个故事。

Llama3发布了,李彦宏是不是被打脸了呢?Llama3突然发布,又是一个遥遥领先。它呢,发布了8B和70B的两个版本。8B就是80亿参数,70B呢就是700亿参数。8B的,我其实已经试过了,就在本地已经装上了。这个某些方面,接近了原来,或者超过了原来的Llama2的70B。包括一些咱们在本地跑的这种30多B的,这种就是300多亿参数的模型,它已经都超过了。而且速度还飞快。

啊,70B呢,据说已经超越了cloud 3的中量级模型。Note 3是有三个模型的:一个是特别微小的,就是可以在手机上跑;一个是中等量级的,是可以在PC本地跑的;然后还有一个是那种特别大的,特别大的,是可以对标GPT4的。70B的基本上已经超过这个中等量级了,也超越了GMINI 1.5 Pro。现在大家想去试GMINI 1.5 Pro的,可以到AI studio.google.com上去试,那个是可以免费用的。也超越了现在70B发布出来的版本。普遍他们自己讲的是超越了GPT3.5,但是呢,还达不到GPT4。这在所有测试数据上都是这样。我相信梅塔应该不会像咱们似的,专门做一些调优以后去跑分,不像咱们这么无聊。

Read More…
Close Bitnami banner
Bitnami