7 月 07
Luke FanAIGC, 华为很厉害 AI伦理, AI大模型, AI抄袭, Apache 2.0, GitHub事件, honest AGI, Hugging Face, Llama 3.1, LLaMA-fingerprint, LLM, Meta, OpenAI, POWERED by盘古, PyTorch, 人工智能, 企业公关危机, 华为, 品牌形象, 增量训练, 大模型套壳, 大模型抄袭, 大模型指纹算法, 大语言模型, 字节跳动, 开源, 开源争议, 开源协议, 开源文化, 归属声明, 抄袭指控, 昇腾芯片, 模型相似度, 欧盟禁用条款, 民族主义情绪, 注意力机制, 混合专家模型(MOE), 版权声明, 瓜田李下, 盘古大模型, 盘古开源协议, 科技伦理, 科技公司纠纷, 科技评论, 老范讲故事, 自主研发, 舆论战, 英伟达芯片, 观点分析, 许可证, 豆包, 辟谣, 通义千问, 遥遥领先, 闭源, 阿里巴巴
华为开源了盘古大模型,被指抄袭。华为到底冤不冤呢?
大家好,欢迎收听老范讲故事的YouTube频道。华为开源了他的盘古大模型,它的模型呢,反正依然是山海经风格的起名。原来呢,没有开源,都是说我们内部开发内部使用,或者说我们专门供政府和大企业来使用。但是现在发现开源这条路不错,那我也开源吧。结果开源了以后就出事了。
它是6月30号在GitHub上就直接开源了,号称呢是在升腾芯片上训练出来的大模型。以前呢,我们的大模型大多是在英伟达芯片上训练,但是呢可以在升腾的芯片上去做推理。现在说,我直接在升腾芯片上做训练,也算是一种小的突破吧。
他呢,其实发了两个模型:一个是72B的MOE的模型,就是混合专家模型;然后呢,有一个70B的稠密模型。做呢做完了,但是准备开源还需要准备一段时间。开源这件事,不是说你做完了,把它扔出来就完了,还是有很大的工作量需要干的。比如说你要去写开源手册、许可证,这个还不是那么容易,还在做。
More
10 月 20
Luke FanAIGC, 芯片的故事 AI Now, AI PC, AIPC, AI与PC结合, AI接口封闭, AMD, ARM芯片, Copilot, Cyrix芯片, Linux内核, Llama 3.1, Meta, Oracle, PC产业标准, PC市场, Tech World 2024, Windows for ARM, Wintel战略, X86生态系统, 中国产替代, 云AI接口, 兆芯, 克里斯蒂亚诺·安盟, 全球PC市场, 全球化竞争, 全球市场, 创新技术, 博通, 合规, 响应时代需求, 地缘政治, 基辛格博士, 威胜电子, 小扎, 市场变革, 市场开拓, 市场竞争, 微软, 惠普, 战略布局, 戴尔, 技术世界大会, 技术创新, 技术生态布局, 招投标, 指令集, 服务设计, 未来科技发展, 杨元庆, 汇宇科技, 百度文心一言, 硬件兼容, 离线版本, 科技前沿, 科技协作, 科技发展趋势, 科技行业动态, 红帽子, 联想, 联想发展策略, 联想市场份额, 自主创新, 自主知识产权, 苏妈, 苏姿丰, 英伟达, 英特尔, 苹果M系列, 萨提亚·纳德拉, 行业挑战, 行业整合, 行业领导者, 谷歌, 软件开发, 通义千问, 高通, 黄仁勋, 黄教主, 龙芯
联想技术世界大会上看江湖恩怨情仇。大家好,这里是老范讲故事的YouTube频道。今天咱们来讲一讲10月15号刚刚在西雅图召开的联想技术世界大会,它叫Tech World 2024。
在这场会上,上台演讲的人呢,第一个是杨元庆,联想的老大;然后是英特尔的CEO基辛格博士;再往后是AMD的CEO苏兹风博士;再往后是英伟达的老大黄仁勋,他不是博士啊。这些人是在现场演讲的,还有一些嘉宾呢,就显得亲疏有别了,他们并没有到现场来演讲,而是发送了视频演讲,就是在现场播放了他们演讲的视频。第一个是微软的萨提亚·纳德拉,微软CEO;然后是高通的CEO克里斯蒂亚诺·安盟;最后是Meta的小扎,也在里边发表了演讲。这个是一开始没太想到的,因为Meta的小扎跟前面咱们讲的所有这些人其实没啥关系。
那么在整个的大会上呢,发表了哪些东西呢?第一个是联想自己的AI PC,以及联想自己的AI Now。AI Now是一个什么东西呢?就是联想自己的一个基于PC的AI助手。这种东西呢,其实有点像,比如说三星应用市场啊,或者是索尼应用市场,有点像类似这种东西。为什么要提到这两个产品呢?因为你想,他们三星也好,索尼也好,出的都是安卓手机,你安卓手机在海外的话,按道理说你用Google Play就完事了。但是不行,我们一定要做一个自己的应用市场,在上边去。到底有没有人用我不管了,反正我得做。
More
7 月 25
Luke FanAIGC, Meta的故事, OpenSource 405B版本, AI上下文窗口, AI事实标准, AI产业方向, AI产业链, AI偷跑事件, AI公司发展, AI创新挑战, AI创新推广, AI功率需求, AI协议限制, AI商业机会, AI商业模式, AI多模态, AI多语言支持, AI宏大模型, AI市场分析, AI应用前景, AI开源协议, AI性能测试, AI性能超越, AI技术合作, AI技术商业化, AI技术应用, AI技术投资, AI技术支持, AI技术突破, AI技术革新, AI显卡需求, AI未来趋势, AI标准化, AI模型优化, AI模型开放, AI模型电费, AI法律框架, AI生态价值, AI生态系统, AI生态系统发展, AI硬件需求, AI磁力链, AI空调耗电, AI能耗问题, AI行业分析, AI行业动态, AI行业趋势, AI计算能力, AI训练成本, AI训练数据, AI训练时间, AI语言支持, GPT-4对比, GPT-4跑分, HIKING face数据集, LLaMA, Llama 3.1, Llama 3.1 405b, Together AI, 中国AI厂商, 中国AI厂商冲锋, 中美科技博弈, 多模态支持, 开源与闭源, 拉玛模型争议, 梅塔与中国, 梅塔公司, 模型微调
Llama3.1 405b突然开放,指标上全面超越GPT-4。中国厂商们是不是又可以充了呢?大家好,这里是老范讲故事的YouTube频道。今天咱们来讲一讲Llama3.1 405b 开放的事情。
Llama的开放,每一次都比较有戏剧性,都会有偷跑。什么叫偷跑?就不是由官方开了发布会,说我今天发布了一个什么产品,而是一般都是在Reddit这样的论坛里,突然就有人放出磁力链来,大家可以去BT下载Llama3.1 405B,包括Llama3.1 405B相关的各种测试数据,都是这么被发现的。头一天偷跑了以后,第二天梅塔说那算了,我开了吧。当时好像Llama2也是这么开出来的,现在Llama3.1 也是这么偷跑,完了以后就正式开放了。
他在跑分上已经全面地超越了GPT-4,基本上在各个指标上都超越了。这是非常非常难的,因为以前大家推出的各种模型里头,都是在个别指标里面超越GPT-4O或者超越GPT-4。那么在各项指标上全都超越的,这应该是第一次。当然了,它也是分很多版本的,分为8B、70B以及405B这三个版本。405B已经完全超越了,下面小一点的8B,应该比原来的Llama370B的效果还要再好一些。它的70B基本上针对前两天发布的GBT4OMINI,属于碾压状态。
More