华为盘古大模型陷入通义千问抄袭风波,为何遵守了开源协议却依然被骂?当“遥遥领先”的民族自豪感遭遇“瓜田李下”的尴尬现实。

华为盘古大模型陷入通义千问抄袭风波,为何遵守了开源协议却依然被骂?当“遥遥领先”的民族自豪感遭遇“瓜田李下”的尴尬现实。已关闭评论

华为开源了盘古大模型,被指抄袭。华为到底冤不冤呢?

大家好,欢迎收听老范讲故事的YouTube频道。华为开源了他的盘古大模型,它的模型呢,反正依然是山海经风格的起名。原来呢,没有开源,都是说我们内部开发内部使用,或者说我们专门供政府和大企业来使用。但是现在发现开源这条路不错,那我也开源吧。结果开源了以后就出事了。

它是6月30号在GitHub上就直接开源了,号称呢是在升腾芯片上训练出来的大模型。以前呢,我们的大模型大多是在英伟达芯片上训练,但是呢可以在升腾的芯片上去做推理。现在说,我直接在升腾芯片上做训练,也算是一种小的突破吧。

他呢,其实发了两个模型:一个是72B的MOE的模型,就是混合专家模型;然后呢,有一个70B的稠密模型。做呢做完了,但是准备开源还需要准备一段时间。开源这件事,不是说你做完了,把它扔出来就完了,还是有很大的工作量需要干的。比如说你要去写开源手册、许可证,这个还不是那么容易,还在做。

More