华为盘古大模型陷入通义千问抄袭风波,为何遵守了开源协议却依然被骂?当“遥遥领先”的民族自豪感遭遇“瓜田李下”的尴尬现实。

华为盘古大模型陷入通义千问抄袭风波,为何遵守了开源协议却依然被骂?当“遥遥领先”的民族自豪感遭遇“瓜田李下”的尴尬现实。已关闭评论

华为开源了盘古大模型,被指抄袭。华为到底冤不冤呢?

大家好,欢迎收听老范讲故事的YouTube频道。华为开源了他的盘古大模型,它的模型呢,反正依然是山海经风格的起名。原来呢,没有开源,都是说我们内部开发内部使用,或者说我们专门供政府和大企业来使用。但是现在发现开源这条路不错,那我也开源吧。结果开源了以后就出事了。

它是6月30号在GitHub上就直接开源了,号称呢是在升腾芯片上训练出来的大模型。以前呢,我们的大模型大多是在英伟达芯片上训练,但是呢可以在升腾的芯片上去做推理。现在说,我直接在升腾芯片上做训练,也算是一种小的突破吧。

他呢,其实发了两个模型:一个是72B的MOE的模型,就是混合专家模型;然后呢,有一个70B的稠密模型。做呢做完了,但是准备开源还需要准备一段时间。开源这件事,不是说你做完了,把它扔出来就完了,还是有很大的工作量需要干的。比如说你要去写开源手册、许可证,这个还不是那么容易,还在做。

More

联想技术世界大会揭幕:全球科技巨头聚首,共话X86生态命运及AI PC演变前景。Intel与AMD握手言和,英伟达、微软、Meta、高通也都参与,很多恩怨纠结在一起

联想技术世界大会揭幕:全球科技巨头聚首,共话X86生态命运及AI PC演变前景。Intel与AMD握手言和,英伟达、微软、Meta、高通也都参与,很多恩怨纠结在一起已关闭评论

联想技术世界大会上看江湖恩怨情仇。大家好,这里是老范讲故事的YouTube频道。今天咱们来讲一讲10月15号刚刚在西雅图召开的联想技术世界大会,它叫Tech World 2024。

在这场会上,上台演讲的人呢,第一个是杨元庆,联想的老大;然后是英特尔的CEO基辛格博士;再往后是AMD的CEO苏兹风博士;再往后是英伟达的老大黄仁勋,他不是博士啊。这些人是在现场演讲的,还有一些嘉宾呢,就显得亲疏有别了,他们并没有到现场来演讲,而是发送了视频演讲,就是在现场播放了他们演讲的视频。第一个是微软的萨提亚·纳德拉,微软CEO;然后是高通的CEO克里斯蒂亚诺·安盟;最后是Meta的小扎,也在里边发表了演讲。这个是一开始没太想到的,因为Meta的小扎跟前面咱们讲的所有这些人其实没啥关系。

那么在整个的大会上呢,发表了哪些东西呢?第一个是联想自己的AI PC,以及联想自己的AI Now。AI Now是一个什么东西呢?就是联想自己的一个基于PC的AI助手。这种东西呢,其实有点像,比如说三星应用市场啊,或者是索尼应用市场,有点像类似这种东西。为什么要提到这两个产品呢?因为你想,他们三星也好,索尼也好,出的都是安卓手机,你安卓手机在海外的话,按道理说你用Google Play就完事了。但是不行,我们一定要做一个自己的应用市场,在上边去。到底有没有人用我不管了,反正我得做。

More

Meta Llama3.1——405b大模型震撼发布——性能全面超越GPT-4o,中国AI厂商是否迎来春天?新的时代到来了,历史的车轮滚滚向前。

Meta Llama3.1——405b大模型震撼发布——性能全面超越GPT-4o,中国AI厂商是否迎来春天?新的时代到来了,历史的车轮滚滚向前。已关闭评论

Llama3.1 405b突然开放,指标上全面超越GPT-4。中国厂商们是不是又可以充了呢?大家好,这里是老范讲故事的YouTube频道。今天咱们来讲一讲Llama3.1 405b 开放的事情。

Llama的开放,每一次都比较有戏剧性,都会有偷跑。什么叫偷跑?就不是由官方开了发布会,说我今天发布了一个什么产品,而是一般都是在Reddit这样的论坛里,突然就有人放出磁力链来,大家可以去BT下载Llama3.1 405B,包括Llama3.1 405B相关的各种测试数据,都是这么被发现的。头一天偷跑了以后,第二天梅塔说那算了,我开了吧。当时好像Llama2也是这么开出来的,现在Llama3.1 也是这么偷跑,完了以后就正式开放了。

他在跑分上已经全面地超越了GPT-4,基本上在各个指标上都超越了。这是非常非常难的,因为以前大家推出的各种模型里头,都是在个别指标里面超越GPT-4O或者超越GPT-4。那么在各项指标上全都超越的,这应该是第一次。当然了,它也是分很多版本的,分为8B、70B以及405B这三个版本。405B已经完全超越了,下面小一点的8B,应该比原来的Llama370B的效果还要再好一些。它的70B基本上针对前两天发布的GBT4OMINI,属于碾压状态。

More