硕鼠的博客站

范路的博客主站,时而会发些东西。

Posts Tagged ‘大模型’

大家好,欢迎收听“老范讲故事”YouTube频道。今天,咱们来讲一讲AI时代,现在学计算机还来得及吗?啊,首先要跟大家讲说,这个内容是怎么来的。呃,儿子要成人礼了,也是马上要高考了,太太给了我一个任务,让我给儿子写一封信。所以呢,我就前面录了一个视频,是给儿子的一封信。这个里面呢,有一部分就是讲AI时代,学计算机应该怎么学的。现在呢,我把这一部分摘出来,单独跟大家聊一下。

首先呢,要讲一下我的父母跟我太太的父母,在我们两个人选择大学专业的时候,跟我们说的话。我父母两个呢,都是学机械的——机械制造、机械设计、机械原理。我太太的父母呢,应该都是学电子工程的。啊,当我去高考的时候呢,我的父母跟我讲说:“不要去学机械啊,去学计算机吧。”为什么呢?说学机械这事儿啊,太辛苦太累,需要去工厂,需要跟这些设备打交道,太累了。他说学计算机这事儿啊,虽然也挺累的,但是你好歹是在空调的机房里呆着呀,你跟这个在工厂里的人比起来,你要好很多了。当然,我自己也比较喜欢,这是大前提。

我太太的父母呢,在他高考的时候说:“学电子太累了啊,你要不停地学新东西,电子元器件啊,电子的各种设备啊,不停地更新换代,这事儿实在太累了。”

Read More…


大家好,欢迎收听老范讲故事YouTube频道。今天,咱们来讲一讲黄仁勋在COMPUTEX上的狂欢。COMPUTEX是一年一度在台湾举行的计算机大会。黄仁勋,作为现在真正AI时代的当红炸子机,可能是唯一靠AI赚了大钱的人。虽然微软也在赚钱,但是微软整个靠AI挣的钱并没有那么多。真正靠AI赚了大钱的公司只有他一家——英伟达。刚才我看了一下,英伟达现在市值2.7万亿美金。大家知道,再往前就是微软的3.2万亿,第二名是苹果,2.9万亿,还差那么一点点。可能稍微一哆嗦,英伟达就有可能成为世界第二市值的公司了。那么,黄仁勋上面都讲了什么呢?作为网红,肯定还要先暴露一下行业秘密,别人都不知道他知道的事情。上来先说一下他现在讲的是什么——就是GPT-4到底有多少参数。GPT-3.5大家知道是1,700多亿参数,就是一个170多亿级别的模型。但是到GPT-4的时候,OpenAI就再也没有出来说它到底有多少参数。很多人说你是不是超过万亿了,对OpenAI来说,这个数据不是很准确。我来辟谣了,但是具体有多少,从来没有讲过。黄仁勋在前面的GTC,就是GPU技术大会上,每年一次的英伟达自己的开发者大会上,上面也讲了……

说起来1.8T,这个1.8T指的是什么呢?其实就是1.8万亿参数,而且它是一个Moe模型。当时OpenAI并没有对此多说什么,但这一次,在《Computer Text》上,他们又反复强调了这个事情,明确指出GPT-4的训练参数达到了1.8T。这让人们意识到,想要达到GPT-4的水平,还有很长的路要走。尽管现在大家都在努力研发号称能达到或接近GPT-4水平的模型,比如几百亿参数的模型,比如梅塔的拉马3可能会有一个400亿参数的模型,国内也出现了很多一两百亿参数的模型。但事实是,即使提到的1.8T参数,如果考虑到是Moe模型,分成八份来看,那么单个模型可能也就相当于200多亿参数的水平。

Read More…

大家好,欢迎收听老范讲故事YouTube频道。今天咱们来讲第一个故事。Open AI进一步开放了GPT-4欧的免费功能和范围,留给苹果的时间真的不多了。所以,这一个话题里我们会讲两件事。

第一个是Open AI进一步开放了很多免费用户可以使用GPT-4,主要是4欧了。另外呢,就是苹果现在的日子并不好过。虽然我们前面反复在想说,大家万众瞩目,万众期待WWDC,6月5号吧,大家都在等这一天。但是,呃,越是大家期待的事情,可能最后啊,越让大家失望。

最近Open AI呢,肯定是消息不断。为什么呢?山伯特曼本人是一个呃,政客或者说他政治手腕非常的强大。前面闹出了很多的负面,比如说伊利尔走人,超级队旗团队的负责人走人,而且这两天呢,超级队旗那个负责人已经去了anceropic,还在跟瓦解,也就是斯嘉丽约翰逊才在这打着官司。各种的负面都很多,所以呢,一定会放出很多消息来,去纠正这些负面信息啊。

Read More…

大家好,

欢迎收听老范讲故事YouTube频道。今天咱们来讲一讲国内大模型厂商,突然就变脸了,开始打价格战,而且是价格生死战。这个战争是从哪开始的?首先是有一个大模型叫deep sick,他先开始干的。原来我们使用100万TOKEN,大概也得十几二十块钱,甚至贵的也能有五六十块钱。国外的大模型经常是要到十几美金。他呢,直接来了一个啊,100万TOKEN一块钱人民币。DPC大家可能不是那么熟悉,因为他后边不是一个互联网巨头,也不是原来从互联网大厂出来的人,他后边是一个私募巨头,换方量化直接不讲武德啊,100万TOKEN一块钱人民币。

那紧随其后的呢,是豆包啊,这是字节跳动下边的大模型,直接降价到100万TOKEN 0.8元人民币。你不是一块吗,我8毛啊。然后通1,000问说那你们都降,我也来呗。我后边反正是阿里云,谁怕谁啊,最多的显卡都在我手里头,那降价啊,把通1,000问最新的千问Max千问浪什么,全都降到了一个白菜价。当然同1,000问降价的时候呢,还是用了一些小花招的啊,他把输入TOKEN跟输出TOKEN的价格分开了。什么意思?就是当你往里梳的时候,你也是算TOKEN的,当它往外吐的时候,也是算TOKEN的。就是它把往里梳的这个TOKEN的价格,降低了更多啊,往外吐的这个TOKEN呢,也在降,但是降的并没有那么多。大家能够理解,就是你往里输的内容,比如说现在有很多的大模型号称是可以输入100万字,200万字,但是他每一次输出,可能也就输出个1,000字,2,000字,他不会输出那么多的。你说一大模型坐在那,吭哧吭哧给你吐100万字出来,有人看没有?一个人坐在那阅读,读100万字也得会功夫吧。所以呢,从大模型输出的这个TOKEN稍微贵些啊。然后百度特别逗啊,百度先强调了一下,说不要关注价格,要看这个大模型的特性,以及大模型的性质,是不是适合你的场景。讲完了以后呢,左右一看说哎,你们都跑了,等等我等等我,对吧?直接把手里头两个最常用的模型,一个叫快速模型,一个是轻量级模型免费,对吧你们还要收钱吗?咱不要钱了。

Read More…

大家好,欢迎收听老范讲故事的YouTube频道。今天我们又请到了老朋友尹迪狗,给我们介绍一下刚刚召开完的谷歌艾欧。这一次到底发布了什么。而在谷歌艾欧之前的一天,OpenAI我觉得算是故意捣乱截胡,发了个GP4欧出来。我们就正好趁这个时机呢,把这两个发布会或者两两个产品吧,一起来总结一下。首先呢,我想先问一下,GBT4O到底算不算是划时代的产品。嗯,至少模型啊,分成两部分,它发的是PPT是o是模型混合模态嘛,他把语音视频和文字一块训练的嘛,可以同时输入和输出嘛。这个相当于是,嗯,也不叫划时代吧,就是他之前所有的工程技术的沉淀。嗯然后呢,做了一个特别好的一个交互形式,就是语音交互。而且那个语音交互的很大一个特点,发完之后不是马上就有人升级吗,一搜我的这个APP上面的模型以及GPT,搜了然后大家都想打开。那那个耳机,点上去之后呢,可以跟他聊聊天。实际上,那个聊天并不是他发布会上的那种APP,那个还是回合制的,用那个rest接口聊天。我,发出去然后回来,这个回合制的,但是呢,他在发布会上演示的是完全stream的,就是像就像我们现在一样,我们录节目,我们用的是Web RTC协议嘛,streaming,就是你的Server端,它的那个TOKEN,它就不停的接收是吧,做实时处理。这个特别耗流量,耗TOKEN,耗算力的。嗯现在还没用到这个模型,所以大家感受不到,所以我记得第二天还第三天的时候m奥特曼还是他们官方账号,发了一个说明嘛,说哎你们大家用的现在还不是,发布会上也是这个,哈哈哈,一堆人说说这一直完完全不对,这么慢的响应,我觉得借手报了一下,就是他是非常natural,非常自然。可能就是大家第一次用起来 GPT 的感觉,一样哎。哇哦,是他没这样回答问题。就是他确实是有那个时候的一个感觉。

Read More…

大家好,

欢迎收听老范讲故事的YouTube频道。今天咱们来讲一讲华为大模型演示翻车现场。

近期呢,非常多的AI相关的项目都在进行演示和发布,特别是国内。为什么它?因为时间到了。通常每年在这个时候也会有很多发布,因为每年在这个时候会开谷歌IO,大家喜欢在谷歌IO的前后进行信息的发布啊。因为谷歌IO算是全世界程序员或者开发者的一个盛会吧。那这个前后进行信息发布的话,如果它被安卓采用了,或者再跟谷歌搭上一点关系的这种技术会有更好的发展空间。

那今年呢,还有另外一个事情,就是拉玛3发布。前面其实国产很多大模型都是跟拉玛2有千丝万缕的联系。其实当时就已经预言过,我说拉玛3出来看多长时间之后,国内的大模型会争先恐后的再更新换代一波。现在呢,这个时间点就到了。前面阿里的通1,000问2.5发布,这两天还有几个,一个是零一万物的啊,叫e latch大模型发布,然后字节跳动的豆包大模型前两天也发布了啊。这豆包大模型主打的一个便宜,对别人的价格都便宜非常多,因为大模型的价格一般是按TOKEN算的啊,一般一个汉字是一个TOKEN,大概四个字母,还是几个字母的英文单词,是一个TOKEN啊,它这个算法比较奇怪。

Read More…

大家好,欢迎收听《老范讲故事》YouTube频道。今天咱们来讲一讲Goole I/O,又一次如期举办了。为什么使用了这样的一个词呢?因为提前一天,Open AI已经把风头都抢走了。大家要知道,在往年的Goole I/O啊,一直都是被认为是互联网科技圈里的一次技术盛会。我曾经去过一次,2014年,我是到旧金山,到现场去参加过一次啊,那真的是一场科技盛会。所有的技术媒体,在这之前就要整装待发,我们要在这等着,等什么呢?传达好Goole I/O,向全世界互联网技术圈传达的方向。对吧,大家要好好学习。今年指明的方向是什么?每年都要干这样的一个事情。甚至呢,还有很多的小公司,会在Goole I/O的会场外面举办各种小型沙龙。2014年我就去干这个事情,在Goole I/O外面啊,租了一个小的酒吧。但是,你不敢在他正式开会的时候开会啊,那个时候是抢不到人的。我们都会在他开会散了以后,晚上在周围的小酒吧里边开一些小型的沙龙,跟我们坐下来,我们来讲一讲这个——当时在猎豹移动,是猎豹移动啊,在谷歌里头都干了些什么事情。我还记得那一年我们坐在台下,听着皮查伊在上面讲,提了多少次猎豹移动,大概提了4次还是5次。我啊,还有很多猎豹移动的员工,包括各种老板们,都在下面听着热血澎湃。但是今年,热度全都被Open AI释放掉了。你想,大家都在等着,等着,等着,说哎,Open AI还提前一天来,说我们给大家看一个不一样的。我记得以前有一个这样的故事,是滴滴也是跟另外一家公司去抢,那家公司还比滴滴融的钱多,然后每天在北京交通台做广告,说啊,还有10天,我要告诉你们一个重大消息,还有5天,我要告诉你们一个重大消息,反正每天倒计时往前数。然后滴滴呢,大概提前了一天发布,说不用等了。今儿我就告诉你吧,人家等于是花了30天的钱,滴滴只花了一天的钱,还可以截胡了啊。现在Open AI也干了这么个事,Open AI在提前一天发布了GPT-4,这样一个产品。这个产品呢,从外在表现上说,你说它划时代吗?又好像没有那么划时代。它人性化的很强,就是大家觉得那是一个人了。而且从技术上说呢,也确实有一个进步,什么进步?原来都是说语音识别,内容处理,或者是叫文字处理,然后再到语音输出,原来是这样的输出方式。现在是端到端,我这头进去就是语音,出来的也是语音。这个产品让大家眼前一亮,让这些等了很长时间的技术媒体们,一把把热情全都释放掉了。什么划时代呀,什么“Wow”,还有各种各样的溢美之词,就直接都在它身上释放掉了。这也是很神奇的一个事情。

Read More…

GPT-4oo大家好,欢迎收听老范讲故事的YouTube频道。今天咱们来讲一讲Open AI最新发布的GPT-4,到底是一个什么样的东西。专门赶在谷歌I/O之前的一天开,这就是司马昭之心,路人皆知了。对,指的是谁,大家心里都明白。当然,选择这一天开发布会的还有其他人,比如李开复也在这一天发布了他“灵异万物”新的大模型。以后找机会学习再跟大家分享。通义千问呢,是早几天,5月9号发了他们自己新的大模型。

我呢,自己肯定是懒得去在凌晨2点看直播了,所以到今天,看看录屏,然后看看其他人都在说什么,再跟大家介绍一下GPT-4到底是一个什么样的东西。在这之前,大家一直知道,说他要在这个时间点开发布会,甚至在他没有公布发布会时间的时候,大家也都在猜,说是不是上周要发布,是不是这周要发布,然后猜了很多有可能会发布的产品。有些人猜GPT-5,有些人猜测试GPT。

战猫奥特曼说了,不是GPT-5,也不是测试GPT。我呢,在礼拜天,也就是在发布会前的一天,还在推特上在问,说这个新发布的东西会不会是GPT Siri或者是Siri GPT,对吧,因为已经传出消息了,苹果要跟Open AI签约嘛,那么出来的东西应该是这样的一个东西吧。甚至呢,我也猜过,说是不是GPT-5出来了以后,GPT-4就免费了啊,万一GPT-4免费了呢,现在惦记收费的这些版本该咋办呢,还活不活得下去,这事没法混了。所以呢,当时拆解了这么多种可能性,从我个人角度上说,我猜了GPT-40,免费的GPT-4,GPT Siri,拆了三个方向。现在看呢,我觉得我也没猜错。对吧,现在的GPT-40啊,基本上是这样,这四个方向的事其实都干了。都发布了什么呢?第一个是GPT-40,它可以进行语音识别与翻译,支持50多种语言,可以进行实时搜索。但是,它并没有进行搜索之后的很完善的内容组织,不像Perplexity那样,可以进行很好的搜索结果组织。GPT-40免费对公众开放了,这也是一个逐步开放GPT-4的过程,虽然开放的是40版本。

Read More…
Close Bitnami banner
Bitnami