DeepSeek R2难产真相!金融时报爆料:华为昇腾芯片训练失败,揭秘国产AI算力的“卡脖子”困境。

DeepSeek R2难产真相!金融时报爆料:华为昇腾芯片训练失败,揭秘国产AI算力的“卡脖子”困境。已关闭评论

DeepSeek R2难产真相!金融时报爆料:华为昇腾芯片训练失败,揭秘国产AI算力的“卡脖子”困境。

8月14号,英国金融时报发了一篇报道,说Deepseek R2模型之所以难产,是因为在使用华为升腾芯片训练的时候,持续遇到了技术问题,最后被迫改用了英伟达芯片。甚至透露华为曾经派出一支救火队,常驻在Deepseek,手把手帮忙调教升腾服务器,但仍然无法完成训练。无奈之下,Deepseek只能退回老路训练,重新切换回性能更加可靠的Nvidia的GPU,升腾芯片仅退居辅助,用于模型推理环节。

虽然没有华为和Deepseek官方的回应,也没有他们的辟谣,但是呢,据说是援引了三位知情人士的一些说法,也进行了很多交叉验证,所以这个事情呢,大概率是真的。

国运跟国运相碰撞的时候,升腾也号称是国运级产品,Deepseek肯定是国运级产品,为什么是升腾不灵呢?升腾芯片是可以替代的,也还有一堆竞争对手,所以出现问题以后,他的竞争对手会帮他去宣传。而Deepseek虽然在国内也有模型在追赶,但是地位是不一样的。升腾和国内的其他算力芯片,以及其他那些大模型,从来没有像Deepseek那样震动过世界。所以呢发生碰撞的时候,必须是升腾不行了,不可能是Deepseek不行了。

More

遥遥领先的华为升腾384超节点VS英伟达NVL72:FP16算力压H100却逊GB200,三倍功耗换自主可控值不值?

遥遥领先的华为升腾384超节点VS英伟达NVL72:FP16算力压H100却逊GB200,三倍功耗换自主可控值不值?已关闭评论

遥遥领先的华为升腾384超节点VS英伟达NVL72:FP16算力压H100却逊GB200,三倍功耗换自主可控值不值?

遥遥领先的华为升腾384超节点,是不是又立功了?

大家好,欢迎收听老范讲故事的YouTube频道

上海人工智能大会上,有一个镇场之宝,就是华为升腾384超节点。叫这个名字很怪,其实就是华为做的算力超级节点,华为云矩阵。384超节点这个东西,从外边看上去呢,像一堵墙一样,反正摆在厂子里头也确实比较唬人,而且也很昂贵。

很多人就兴奋了,说我们是不是又打破了西方的垄断呢?西方人对我们禁运,不给我们卖英伟达最好的芯片,我们自己造出来了。这个事到底达没达到呢?可以说部分达到了。在集群总的FP16算力上,为什么一定要强调这个?就是它在不同精度上的算力是不一样的。在FP16算力上呢,华为升腾384超节点,是介于H100和GB200组成的NVL72之间的一个算力。而这个话怎么解释呢?

现在我们去想算力,它是分三个层次的。第一个就是卡,卡这件事呢,咱肯定比不过人家,甭管你是比H100还是GB200,你根本比不过人家。第二个呢,就是叫整机,我是一台服务器。你像AMD呢,就是卖这种东西,就是我一台服务器里头有8个,他们叫MI300这样的服务器。第三种维度呢,就是说我给你卖一整个柜子,像NVL72呢,就属于整个柜子,我把72个H100或者72个GB200这样的东西,装在一个柜子里头,当成一台机器一把卖给你。

More

从557万美金训练成本到545%利润,DeepSeek如何用惊悚的数字,震撼AI行业的?这些数字,靠谱吗?

从557万美金训练成本到545%利润,DeepSeek如何用惊悚的数字,震撼AI行业的?这些数字,靠谱吗?已关闭评论

从557万美金训练成本到545%利润,DeepSeek如何用惊悚的数字,震撼AI行业的?这些数字,靠谱吗?

DeepSeek也玩“one more thing”,突然公布了它的推理利润达到545%,就像当初557.6万美金的训练成本那样,再次震惊了行业。大家好,欢迎收听老范讲故事的YouTube频道。今天咱们来讲一讲,DeepSeek结束了连续5天的开园周之后,到礼拜六玩了一次“one more thing”。这个“one more thing”呢,应该是当年乔布斯的梗。他每一次开发布会到最后的时候呢,都要说“还有一件事,等一等”,而且这一件事呢,往往是特别重要、特别颠覆性的事情。那么这一次又来了,DeepSeek公布了它的V1和R3推理系统相关内容,及大规模部署的成本和收益数据。就是说我部署了这东西以后,到底是挣了多少钱?非常非常让人震惊,因为所有人做这个东西都说我不挣钱,我亏钱,结果等到他这好,545%的利润,所有人都傻了,说你到底咋干的?

具体的实现方法呢,就不再跟大家详细分析了。简单来说,第一个负载均衡,你想他有这么多的GPU,这么多的核心,在他这种MOE的架构下,他把每一层的模型里边每一个专家,分配到不同的设备上面去进行运算。这个呢,就是一个负载均衡,尽量让所有的芯片都动起来,不要说有的芯片闲着呢,有的芯片在那排队。第二个,并行计算。并行处理是什么呢?所有的芯片一起来干活,这个速度肯定会变快。另外呢,一边干活的时候,另外一边呢,再同时进行数据的读写。你不能说我这需要数据了,你给我读,然后处理完了以后你再去写,这样就变慢了嘛。所以基本上在做这样的事情,负载均衡和并行处理。

另外还有一个什么样的事情在做呢?就是有一点点叫“驴粪蛋表面光”。这个也算是老北京的一个俏皮话,什么意思呢?就是这个驴粪球外边是很光滑的,但是里边呢,就是一堆的没有消化好的碎草。DeepSeek也是如此,他把很多的计算精度呢进行了调整,他尽可能的能够达到大家的要求,但是很多细节上的这些你看不到的环节呢,就给你忽略掉了。

More

OpenAI重启机器人项目!揭秘从数据收集到大模型训练的人形机器人未来规划!

OpenAI重启机器人项目!揭秘从数据收集到大模型训练的人形机器人未来规划!已关闭评论

2025年了,我们距离人形机器人的普及到底还有多远呢?大家好,欢迎收听老范讲故事的YouTube频道。

现在,人形机器人好像距离我们已经不远了。特斯拉的擎天柱已经可以在特斯拉工厂里边打螺丝了,Figure 01也在宝马的工厂里边打螺丝呢。刚刚过去的CES大展上,黄仁勋背后站了一整排的人形机器人,包括前两天我们看到上山入海的这个宇数科技,也站在黄仁勋背后,因为他们也是使用的英伟达的解决方案。

那是不是人形机器人就已经快要到达我们面前了呢?甚至这两天还有传闻说OpenAI又重启了机器人项目,重新开始为机器人项目做了招聘。这个公司到底在干什么?宣布什么不重要,你看他贴出来的招聘广告,LinkedIn上是有招聘信息的。你可以看到有很多机器人相关的岗位,在OpenAI公司下边已经列出来了。

More

英伟达黄仁勋CES霸气登场!鳄鱼皮夹克发售5090显卡,钱包快捂住还是准备剁手?

英伟达黄仁勋CES霸气登场!鳄鱼皮夹克发售5090显卡,钱包快捂住还是准备剁手?已关闭评论

黄教主已经在CES上吹响了号角,准备好钱包了没有?大家好,欢迎收听老范讲故事的YouTube频道。今天咱们来讲一讲CES上,全村最靓的仔黄仁勋。黄教主都发布了一些什么东西?我们是不是要准备好钱包去买东西了,还是说咱们稍微冷静一下?

现在AI嘛,市值最高的公司英伟达,作为英伟达的老板,黄仁勋在整个的CES大会上一定是最靓的仔。其他做AI的人,可能还没有他这么风光亮丽。为什么呢?因为CES呢叫做消费电子展,那些做云计算的人,你们靠后站。黄教主是要来发布游戏显卡的,他是来玩消费的,这个还是有很大差别的。而且整个的AIGC玩了两年多,唯一挣着钱的就只有黄教主自己了,其他人都在这赔本赚吆喝呢。所以呢,人家一定要风光亮丽的跟大家做一个演讲。

咱们先看一下皮衣教主,因为他走到哪穿个皮衣嘛。他这个皮衣呢,这一次是一件新皮衣,不是以前穿过的这些旧皮衣。这个叫Tom Ford设计的一个皮衣,这个皮衣呢叫鳄鱼皮印花皮夹克。就是我们可以看到这个皮夹克上有很多非常大的花纹,这个东西呢叫鳄鱼皮印花。就是你如果买了什么鳄鱼皮钱包或者是鳄鱼皮的皮鞋,上面就是这种大花。我还真没见过鳄鱼皮夹克,他这个皮夹克呢应该不是鳄鱼皮的,应该是牛皮的,只是呢把这个大花纹给你印上了而已。

More

细红线转向All in AI!罗永浩春节将发布新产品,行业冥灯再临!

细红线转向All in AI!罗永浩春节将发布新产品,行业冥灯再临!已关闭评论

老罗,罗永浩这个行业冥灯又转向了,这一次号称要 All in AI,那么他能够为我们带来一些什么呢?

大家好,欢迎收听老范讲故事的 YouTube 频道。罗永浩的细红线呢,其实已经有很长一段时间没有什么声音出来了吧?他又跑回去参加什么婚丧嫁娶,去给人直播带货去了。那么最近呢,传出消息,终于要有产品跟大家见面了。 据说呢是在 2025 年春节前后,准备发布新产品。2025 年的春节的话应该是 1 月 29 号,所以呢,他有可能会在 2 月初拿出产品出来。这一次呢,就是一个 AI 产品,不再是 AR 产品了。他这个公司叫细红线,当时创建的时候号称是要去做 AR 产品和 AR 操作系统的,现在转向了。

那么这个产品的价格呢,现在不太确定, 只是说不太便宜。2024 年 4 月份,在交个朋友四周年专场直播中呢,罗永浩提到过,让粉丝们准备 199 美金跟 299 美金,这两个价格。所以呢,有可能是两款产品,一个 199 美金,一个 299 美金。 当然也有可能这一次发布的新产品跟当时他拍脑的这个价格就已经没有关系了,但是他依然表示,这一次要发布的产品呢,并不便宜。

More

阿斯麦崩盘引发市场动荡:AI大模型是否会经历郁金香时刻的泡沫危机?

阿斯麦崩盘引发市场动荡:AI大模型是否会经历郁金香时刻的泡沫危机?已关闭评论

大家好,这里是老范讲故事的YouTube频道。我们现在开始讲第一个故事:阿斯麦崩盘。

是不是AI大模型要迎来郁金香时刻?什么是郁金香时刻?就是我们认为有一个大的崩盘即将到来的时候,我们管它叫郁金香时刻。因为当年荷兰人去卖郁金香的时候,就遇到了郁金香崩盘这样的事情。后面每一次大的这种泡沫破裂的时候,你可以认为它是一个郁金香时刻。

那么阿斯麦是怎么崩盘的呢?算是意料之外,情理之中。为什么叫意料之外呢?因为由于某个技术原因或者某一个技术故障,导致了应该是晚一天发布的财报提前一天泄露了。但是呢,这个泄露出来的财报并不是说虚假的或者说有错误的,就是正确的财报,只是他看到的时间稍微早了一点,或者是大家意料之外的这个时间看到了。早看到一天、晚看到一天,里面的数据都不会发生任何变化。

More

OpenAI或将ChatGPT涨价至2000美元/月,未来发展何去何从?

OpenAI或将ChatGPT涨价至2000美元/月,未来发展何去何从?已关闭评论

2,000美元一个月的ChatGPT还会有人用吗?

大家好,这里是老范讲故事的YouTube频道

今天咱们来讲一讲OpenAI有可能给ChatGPT涨价的事情。消息哪来的?国外著名科技媒体Information上报道,OpenAI因为连年的亏损,而且新的模型成本快速上涨,所以有可能给ChatGPT涨价。涨多少呢?他们也是搜集了很多的信息以后,判定有可能会涨到100倍,也就是2,000美元一个月。这是不是幻觉呢?大概率是。

那你说Information上面怎么会有幻觉呢?需要注意,Information上面也是说,我们根据各种信息总结出来以后,有一种声音提到有可能会涨100倍。具体是哪个涨100倍并没有说。到底是每个月这个20美金的订阅费用涨100倍,还是说TOKEN的费用,或者其他的一些商业合作的费用,涨到100倍都没有说。而到底是涨100倍,还是说按照这样的一个级别去涨,现在也没有讲清楚。所以只是说,我们根据传言得到了这样的一个消息,这就算是一个幻觉。

咱们再讲一个幻觉的故事。前面有人提到,印度产的iPhone良品率只有50%。后来被富士康的人出来辟谣,说没有那么差。如果良品率只有50%,苹果也受不了。其实印度产的iPhone良品率比中国的低10%。郑州富士康的iPhone良品率大概是96%,印度大概是85%或者86%这样的一个水平,其实依然是可以接受的。

More

番茄小说AI附加条款引发网文作者激烈反击,停更、转场、抗议。小说写手,直面AIGC的第一仗,谁能赢?

番茄小说AI附加条款引发网文作者激烈反击,停更、转场、抗议。小说写手,直面AIGC的第一仗,谁能赢?已关闭评论

网文作者向AIGC发起了反击。中国最大的网文平台番茄小说,因为在协议里要求网文作者授权他们使用作品进行大模型训练,导致这些作家纷纷退网,纷纷停更,向他们正式发起了反击。

大家好,这里是老范讲故事的YouTube频道。今天咱们来讲一讲番茄小说的AI附加条款到底是怎么回事。上面写了,任何作者到任何的小说平台上去写小说,都是要跟人家签协议的。说我在你这里写小说,遵守你的规则,你给我分钱。

番茄小说的协议里头呢,就突然多了一个条款,这个条款呢叫做AI附加条款。条款怎么写的?甲方可将签约作品的全部部分内容以及相关信息,包括作品名称、简介、大纲、章节、人物、作者个人信息、封面等数据语料、文本素材等,用于标注合成数据数据库建设、AI人工智能研发、机器学习模型训练、深度合成算法研发等目前已知或未来开发的新技术研发应用领域,包括但不限于:一、用于智能对话、智能文本、图像、视听语音等作品成品的编辑生成转换、深度合成、虚拟现实技术等再研发和应用;二、用于任何技术下的AI人工智能模型训练,或用于生成提供给模型训练的合成数据数据库;三、其他任何新技术研发或应用场景。

More

揭秘Safe Superintelligence:伊利尔如何打造安全超级智能

揭秘Safe Superintelligence:伊利尔如何打造安全超级智能已关闭评论

伊利尔在创业,他的公司叫做Safe Superintelligence(安全超级智能)。这个公司的主要业务是什么呢?目前,公司由三个人组成,分别是伊利尔、Daniel Goose和Daniel Levy。伊利尔是一位以色列裔加拿大人,他精通俄语、希伯来语和英语。Daniel Goose是一位以色列企业家和投资人,而Daniel Levy是伊利尔的旧部。

在人才和算力方面,Safe Superintelligence也非常强大。Daniel Gross和Knight Fragman联合创立了算力云,他们拥有3000块H100。有趣的是,他们还可以使用五吨重的H100,因为每块H100的重量超过一公斤,所以3000块H100大约有五吨重。另外,文章中还提到了一个有趣的名字,叫做Knight Fragman,他是之前的Get Have公司的CEO。去年11月,董事会将山姆奥特曼解雇后,他接任了CEO一职。


说我们要请一个临时CEO来,就是这个叫Matt Fredman。他请来了以后说:“啊,我诚惶诚恐啊,你们想怎么干啊,咱们接着干。”等山姆奥特曼回归了以后,他就走了。他是跟Daniel Grusse联合创立了算力允啊,现在Daniel Grusse是投资和参与了伊利尔新的公司SSI,大概是这样的一个关系。那你说,现在已经有算例了啊,有人才了,那数据哪来呢?现在的数据其实比以前要好获得的多。为什么呢?因为现在可以直接让大模型生成数据,这样的话质量更高,可控性更强。像拉玛3的训练,实际上就是用大量的拉玛2来直接进行数据处理,数据预处理以及数据生成啊。那么,他就可以训练出这么厉害的拉玛3来。现在伊利尔估计也会走这条路,人有了算了,也有了啊,数据呢也有了。那么到底什么是安全啊?说他跟山姆奥特曼吵架的原因是因为他觉得山姆奥特曼做的东西不安全,而且不安全是非常危险的,会对人类造成损害。说不,我要出去,我要做一个安全的,而且叫安全超级智能,对吧?怎么叫安全呢?实际上,现在的安全需要重新去定义了。我们所说的安全啊,是像核安全那样的安全,而不是信任核安全那样的安全。这个是伊利尔讲的原话。那我们来想想,什么样的东西是像核安全一样管理?核安全到底是怎么管理的?第一个,我们来对所有的数据进行记录。


一共有多少颗核弹都得记上,哪颗核弹在什么地方,全世界的人都得知道。哎,不能说哪多出一颗核弹来,这是不允许的,至少大的是不允许的。然后呢,还要有这种叫核不扩散的协议,而且还要有各种承诺,说哎,我们啊承诺不优先使用核武器,而且知道核武器这个东西一旦使用了以后,对整个的人类,对整个未来的环境和很长一个时间都是有巨大伤害的。这个是核安全,而这种信任核安全呢就是说,我相信你不会干坏事啊,至于你以后万一干了次坏事呢,我还可以再原谅你几次。这个是信任和安全。所以伊利尔呢是准备把AI安全作为核安全的方式来去管理的。那大家想一想,他会怎么来管这个事情,如何做到安全呢?伊利尔讲了,说我们只有一个目标和产品,就是做这安全超级AI,不会去做APP也不会做什么这些东西啊,而且呢没有时间和财务上的压力。现在呢他讲把OpenAI搞成这样,为什么呢?啊是因为有财务压力,你需要烧更多的钱,你必须要不停的再去融资,像我们以前也讲,你只要开始拿投资人的钱了,开始融资了,就相当于是在脖子上套了一条枷锁,对吧,投资人会催着你往前跑的,他会有时间和财务上的压力。伊丽尔说我没有啊,我就耐心做这个产品,而且呢他是希望通过工程突破,而不是各种临时技术措施,来去保证安全啊。大家注意啊。


伊利尔本身既是一位科学家,也是一位工程大师。他致力于将安全和能力视为技术问题,并通过革命性的工程和科学突破来解决这些问题。他希望能够直接解决安全问题,而不是仅仅通过打补丁等临时性技术措施来解决。他的工程能力使他能够实现量变达到质变,从而成为一个工程大师的典范。他的大模型是一个工程学方面的案例,通过堆积更多的参数和数据,他能够获得不同的结果。伊利尔提出的规模法则,即”scaring low”,指出只要扩大模型,就会获得不同的效果。他的发明和创造力使他成为一个大力出奇迹的发明人。

More

Older Entries

退出移动版