8 月 18
Luke Fan AIGC , 华为很厉害 , 英伟达,NVIDIA,黄教主,GPU AI Agent , AI芯片 , AI训练 , AMD , Anthropic , B100 , Claude 4 , CUDA , DeepSeek , Deepseek R2 , Function Call , Gemini , Google , GPT-5 , Grok 4 , H100 , H20 , H800 , Kimi , Llama 4 , Meta , NVIDIA , OpenAI , TPU , XAI , 中美科技战 , 人工智能 , 传闻 , 千问 , 升腾910C , 华为 , 华为升腾 , 国产替代 , 国产芯片 , 大模型 , 大模型训练 , 字节跳动 , 开源 , 技术瓶颈 , 推理 , 散热问题 , 浸没式液冷 , 液冷 , 深度求索 , 百度 , 算力 , 腾讯 , 芯片战争 , 英伟达 , 辟谣 , 金融时报报道 , 难产
VIDEO
8月14号,英国金融时报发了一篇报道,说Deepseek R2模型之所以难产,是因为在使用华为升腾芯片训练的时候,持续遇到了技术问题,最后被迫改用了英伟达芯片。甚至透露华为曾经派出一支救火队,常驻在Deepseek,手把手帮忙调教升腾服务器,但仍然无法完成训练。无奈之下,Deepseek只能退回老路训练,重新切换回性能更加可靠的Nvidia的GPU,升腾芯片仅退居辅助,用于模型推理环节。
虽然没有华为和Deepseek官方的回应,也没有他们的辟谣,但是呢,据说是援引了三位知情人士的一些说法,也进行了很多交叉验证,所以这个事情呢,大概率是真的。
国运跟国运相碰撞的时候,升腾也号称是国运级产品,Deepseek肯定是国运级产品,为什么是升腾不灵呢?升腾芯片是可以替代的,也还有一堆竞争对手,所以出现问题以后,他的竞争对手会帮他去宣传。而Deepseek虽然在国内也有模型在追赶,但是地位是不一样的。升腾和国内的其他算力芯片,以及其他那些大模型,从来没有像Deepseek那样震动过世界。所以呢发生碰撞的时候,必须是升腾不行了,不可能是Deepseek不行了。
More
7 月 29
Luke Fan AIGC , 华为很厉害 99米长的枪 , AI推理 , AI芯片 , AMD MI300 , CUDA , GB200 , H100 , Hugging Face , MindSpore , NPU , NVL72 , PyTorch , TensorFlow , 中美科技战 , 人工智能 (AI) , 优缺点分析 , 信创产业 , 光模块 , 兼容性 , 升腾384超节点 , 升腾910C , 华为 , 国产替代 , 国产芯片 , 大模型训练 , 工程实现 , 性能评测 , 成本与电费 , 技术封锁 , 数据中心 , 服务器集群 , 水冷散热 , 科技评论 , 稳定性 , 突破封锁 , 算力 , 老范讲故事 , 自主可控 , 芯片禁运 , 英伟达 (Nvidia) , 谷歌TPU , 软件生态 , 达芬奇架构 , 高功耗 , 鲲鹏920
VIDEO
遥遥领先的华为升腾384超节点,是不是又立功了?
大家好,欢迎收听老范讲故事的YouTube频道 。
上海人工智能大会上,有一个镇场之宝,就是华为升腾384超节点。叫这个名字很怪,其实就是华为做的算力超级节点,华为云矩阵。384超节点这个东西,从外边看上去呢,像一堵墙一样,反正摆在厂子里头也确实比较唬人,而且也很昂贵。
很多人就兴奋了,说我们是不是又打破了西方的垄断呢?西方人对我们禁运,不给我们卖英伟达最好的芯片,我们自己造出来了。这个事到底达没达到呢?可以说部分达到了。在集群总的FP16算力上,为什么一定要强调这个?就是它在不同精度上的算力是不一样的。在FP16算力上呢,华为升腾384超节点,是介于H100和GB200组成的NVL72之间的一个算力。而这个话怎么解释呢?
现在我们去想算力,它是分三个层次的。第一个就是卡,卡这件事呢,咱肯定比不过人家,甭管你是比H100还是GB200,你根本比不过人家。第二个呢,就是叫整机,我是一台服务器。你像AMD呢,就是卖这种东西,就是我一台服务器里头有8个,他们叫MI300这样的服务器。第三种维度呢,就是说我给你卖一整个柜子,像NVL72呢,就属于整个柜子,我把72个H100或者72个GB200这样的东西,装在一个柜子里头,当成一台机器一把卖给你。
More
3 月 04
Luke Fan AIGC , DeepSeek大模型 545%利润 , 557.6万美金 , AI优化 , AI优化技术 , AI公关策略 , AI公司争斗 , AI利润计算 , AI商业模式 , AI商战 , AI基准价格 , AI市场格局 , AI开源项目 , AI成本分析 , AI投资策略 , AI推理市场 , AI推理未来 , AI数据中心 , AI服务器管理 , AI生态小厂 , AI硬件 , AI自由市场 , AI行业内幕 , AI行业梗 , AI行业盈利 , AI话题营销 , AI资源分配 , AI量化交易 , AI量化模型 , AI高峰时段 , API定价 , CUDA , DeepSeek , Deepseek V3 , DeepSeek开源库 , DeepSeek计算精度 , GPU全天运营 , GPU租赁成本 , GPU负载均衡 , H100芯片 , H800 , MAAS厂商 , MAAS盈利模式 , MAAS竞争 , R1价格 , 中国AI企业 , 中美AI价格差 , 中美AI市场对比 , 云服务厂商 , 云计算 , 华为云 , 商业逻辑 , 大模型服务 , 大模型训练 , 字节跳动DeepSeek , 并行计算 , 开源协议 , 推理利润 , 推理效率 , 推理系统 , 数据参考价值 , 数据水分 , 数据逻辑 , 模型优化策略 , 模型即服务 , 深度学习 , 硅基流动 , 腾讯DeepSeek , 腾讯IMA , 芯片性能 , 训练成本 , 路深科技 , 达芬奇架构 , 阿里云投资
DeepSeek也玩“one more thing”,突然公布了它的推理利润达到545%,就像当初557.6万美金的训练成本那样,再次震惊了行业。大家好,欢迎收听老范讲故事的YouTube频道。今天咱们来讲一讲,DeepSeek结束了连续5天的开园周之后,到礼拜六玩了一次“one more thing”。这个“one more thing”呢,应该是当年乔布斯的梗。他每一次开发布会到最后的时候呢,都要说“还有一件事,等一等”,而且这一件事呢,往往是特别重要、特别颠覆性的事情。那么这一次又来了,DeepSeek公布了它的V1和R3推理系统相关内容,及大规模部署的成本和收益数据。就是说我部署了这东西以后,到底是挣了多少钱?非常非常让人震惊,因为所有人做这个东西都说我不挣钱,我亏钱,结果等到他这好,545%的利润,所有人都傻了,说你到底咋干的?
具体的实现方法呢,就不再跟大家详细分析了。简单来说,第一个负载均衡,你想他有这么多的GPU,这么多的核心,在他这种MOE的架构下,他把每一层的模型里边每一个专家,分配到不同的设备上面去进行运算。这个呢,就是一个负载均衡,尽量让所有的芯片都动起来,不要说有的芯片闲着呢,有的芯片在那排队。第二个,并行计算。并行处理是什么呢?所有的芯片一起来干活,这个速度肯定会变快。另外呢,一边干活的时候,另外一边呢,再同时进行数据的读写。你不能说我这需要数据了,你给我读,然后处理完了以后你再去写,这样就变慢了嘛。所以基本上在做这样的事情,负载均衡和并行处理。
另外还有一个什么样的事情在做呢?就是有一点点叫“驴粪蛋表面光”。这个也算是老北京的一个俏皮话,什么意思呢?就是这个驴粪球外边是很光滑的,但是里边呢,就是一堆的没有消化好的碎草。DeepSeek也是如此,他把很多的计算精度呢进行了调整,他尽可能的能够达到大家的要求,但是很多细节上的这些你看不到的环节呢,就给你忽略掉了。
More
1 月 14
Luke Fan 机器人与具身智能 2030年机器人普及 , AI大模型研发 , AI机器人趋势 , AI硬件生态 , ChatGPT模型训练 , Figure 01 , GitHub数据沉淀 , Huggingface机器人 , OpenAI招聘工程师 , OpenAI机器人项目 , X1 Technology , 人工智能机器人应用 , 人工智能训练数据 , 人形机器人 , 仿真皮肤技术 , 优化智能机器人 , 传感器技术 , 动态捕捉技术 , 大模型训练 , 家用机器人普及 , 开放平台数据利用 , 开放性机器人研发 , 开源平台数据 , 开源数据平台 , 开源生态建设 , 数据收集平台 , 智能机器人制造商 , 智能机器人的发展 , 未来人机交互 , 未来家用科技 , 机器人产业科技趋势 , 机器人具身智能 , 机器人制造成本 , 机器人大脑设计 , 机器人工程样机 , 机器人抓取技术 , 机器人操作系统 , 机器人智能感知 , 机器人机械设计 , 机器人研发挑战 , 机器人硬件厂商 , 机器人行业未来 , 机器人触感传感器 , 松耦合生态链 , 灵巧机械手 , 特斯拉擎天柱 , 特斯拉机器人优势 , 独立品牌机器人 , 自动驾驶芯片 , 英伟达开发平台 , 英伟达开发板 , 英伟达技术开发 , 英伟达机器人解决方案 , 谷歌安卓生态 , 谷歌安卓路径 , 谷歌手机市场模式 , 飞速发展的机器人科技 , 高精度感知技术
2025年了,我们距离人形机器人的普及到底还有多远呢?大家好,欢迎收听老范讲故事的YouTube频道。
现在,人形机器人好像距离我们已经不远了。特斯拉的擎天柱已经可以在特斯拉工厂里边打螺丝了,Figure 01也在宝马的工厂里边打螺丝呢。刚刚过去的CES大展上,黄仁勋背后站了一整排的人形机器人,包括前两天我们看到上山入海的这个宇数科技,也站在黄仁勋背后,因为他们也是使用的英伟达的解决方案。
那是不是人形机器人就已经快要到达我们面前了呢?甚至这两天还有传闻说OpenAI又重启了机器人项目,重新开始为机器人项目做了招聘。这个公司到底在干什么?宣布什么不重要,你看他贴出来的招聘广告,LinkedIn上是有招聘信息的。你可以看到有很多机器人相关的岗位,在OpenAI公司下边已经列出来了。
More
1 月 09
Luke Fan AIGC , 英伟达,NVIDIA,黄教主,GPU , 英伟达,黄仁勋的故事 30系显卡 , 40系显卡 , 5070显卡 , 5080显卡 , 5090D显卡 , 5090显卡 , 50系列性能 , 50系列显卡 , AI主机 , AI硬件选择 , ARM CPU , Blackwell架构 , CES发布 , CUDA , GBNV Link 72 , GPU , Llama3 405B , Mac mini M4 , MacBook , Project DigITs , stable diffusion , 云主机显卡 , 云计算 , 光鲜亮丽 , 大力水手4 , 大模型训练 , 工程师 , 数据分析 , 数据科学家 , 显卡与大模型 , 显卡与游戏 , 显卡价格 , 显卡兼容性问题 , 显卡创新 , 显卡功耗 , 显卡升级 , 显卡对比分析 , 显卡市场 , 显卡市场动态 , 显卡性能 , 显卡推荐 , 显卡散热 , 显卡构建 , 显卡架构 , 显卡游戏需求 , 显卡的使用 , 显卡的未来 , 显卡科技产品 , 显卡租赁 , 显卡设置 , 显卡购买建议 , 显卡适配 , 显卡金融属性 , 显卡降价 , 显卡需求分析 , 服务器部署 , 本地渲染 , 机器学习 , 模型训练 , 游戏显卡 , 游戏玩家 , 硬件发展趋势 , 硬件性能对比 , 硬件推荐 , 硬件推荐指南 , 硬件用户体验 , 硬件评论 , 科技发展 , 统一内存 , 英伟达 , 英伟达发布会 , 高端显卡 , 高级硬件 , 鳄鱼皮印花夹克 , 黄仁勋
黄教主已经在CES上吹响了号角,准备好钱包了没有?大家好,欢迎收听老范讲故事的YouTube频道。今天咱们来讲一讲CES上,全村最靓的仔黄仁勋。黄教主都发布了一些什么东西?我们是不是要准备好钱包去买东西了,还是说咱们稍微冷静一下?
现在AI嘛,市值最高的公司英伟达,作为英伟达的老板,黄仁勋在整个的CES大会上一定是最靓的仔。其他做AI的人,可能还没有他这么风光亮丽。为什么呢?因为CES呢叫做消费电子展,那些做云计算的人,你们靠后站。黄教主是要来发布游戏显卡的,他是来玩消费的,这个还是有很大差别的。而且整个的AIGC玩了两年多,唯一挣着钱的就只有黄教主自己了,其他人都在这赔本赚吆喝呢。所以呢,人家一定要风光亮丽的跟大家做一个演讲。
咱们先看一下皮衣教主,因为他走到哪穿个皮衣嘛。他这个皮衣呢,这一次是一件新皮衣,不是以前穿过的这些旧皮衣。这个叫Tom Ford设计的一个皮衣,这个皮衣呢叫鳄鱼皮印花皮夹克。就是我们可以看到这个皮夹克上有很多非常大的花纹,这个东西呢叫鳄鱼皮印花。就是你如果买了什么鳄鱼皮钱包或者是鳄鱼皮的皮鞋,上面就是这种大花。我还真没见过鳄鱼皮夹克,他这个皮夹克呢应该不是鳄鱼皮的,应该是牛皮的,只是呢把这个大花纹给你印上了而已。
More
12 月 30
Luke Fan 罗永浩的创业故事 2025AI产品趋势 , 2025新品 , 2025春节 , 2025科技趋势 , AI交互 , AI交互硬件 , AI产品 , AI产品前景 , AI产品经理 , AI作品发布 , AI场景应用 , AI多模态技术 , AI工程师招聘 , AI应用开发 , AI新技术 , AI眼镜 , AI硬件价格 , AI硬件探索 , AI耳机 , AI音箱 , AI音箱选购 , All in AI , AR眼镜 , AR转AI , ChatGPT , Gemini , 中小企业产品 , 中文分词 , 交个朋友 , 创业失败案例 , 创业融资 , 多模态 , 大模型微调 , 大模型研发 , 大模型训练 , 宠物摄像头 , 小米超级小爱 , 技术团队 , 智能可穿戴硬件 , 智能家居控制 , 智能玩偶 , 智能玩具市场 , 智能眼镜 , 智能硬件 , 智能穿戴设备 , 智能语音助手 , 智能语音识别 , 暴力裁员 , 未来科技产品 , 用户交互设计 , 用户需求分析 , 科技创业 , 科技创新 , 科技媒体分析 , 细红线公司 , 细红线创业历程 , 细红线动态 , 罗永浩 , 罗永浩AI , 罗永浩直播 , 老罗新动态 , 老罗美国动态 , 耳机和音箱 , 耳机新品 , 聊天工具 , 脑机接口 , 行业冥灯 , 行业尾声 , 行业竞争 , 行业赛道选择 , 语音API , 语音识别优势 , 豆包耳机 , 轻量级AI产品 , 通义千问 , 锤子手机 , 高估值初创 , 高级用户体验 , 高级语音功能
老罗,罗永浩这个行业冥灯又转向了,这一次号称要 All in AI,那么他能够为我们带来一些什么呢?
大家好,欢迎收听老范讲故事的 YouTube 频道。罗永浩的细红线呢,其实已经有很长一段时间没有什么声音出来了吧?他又跑回去参加什么婚丧嫁娶,去给人直播带货去了。那么最近呢,传出消息,终于要有产品跟大家见面了。 据说呢是在 2025 年春节前后,准备发布新产品。2025 年的春节的话应该是 1 月 29 号,所以呢,他有可能会在 2 月初拿出产品出来。这一次呢,就是一个 AI 产品,不再是 AR 产品了。他这个公司叫细红线,当时创建的时候号称是要去做 AR 产品和 AR 操作系统的,现在转向了。
那么这个产品的价格呢,现在不太确定, 只是说不太便宜。2024 年 4 月份,在交个朋友四周年专场直播中呢,罗永浩提到过,让粉丝们准备 199 美金跟 299 美金,这两个价格。所以呢,有可能是两款产品,一个 199 美金,一个 299 美金。 当然也有可能这一次发布的新产品跟当时他拍脑的这个价格就已经没有关系了,但是他依然表示,这一次要发布的产品呢,并不便宜。
More
10 月 21
Luke Fan AIGC , 芯片的故事 AIGC行业 , AI企业战略 , AI企业生存 , AI企业竞争 , AI发展趋势 , AI商业价值 , AI商业化 , AI大模型 , AI工具 , AI市场分析 , AI市场前景 , AI市场变化 , AI市场策略 , AI市场需求 , AI应用 , AI应用方向 , AI技术创新 , AI技术趋势 , AI投资 , AI未来发展 , AI桌面应用 , AI泡沫 , AI芯片 , AI行业分析 , AI行业动态 , AI行业崩盘 , AI行业挑战 , AI行业未来 , AI行业机遇 , AI行业洗牌 , AI行业洞察 , AI行业现状 , AI行业痛点 , AI行业观察 , AI行业转型 , AI裁员 , Anthropic , GPU租赁 , H100租金 , Kimi , OpenAI , ToB , ToC , 个人用户 , 云计算 , 光刻机 , 创投 , 台积电 , 商业模式 , 商业模式创新 , 商业用户 , 大企业裁员 , 大模型同质化 , 大模型训练 , 字节跳动 , 存储市场 , 市场洗牌 , 市场预期 , 开源模型 , 手机需求 , 投资 , 投资者心理 , 泡沫破裂 , 电脑需求 , 盈利 , 算力卡 , 算力需求 , 股市震荡 , 自由职业 , 自由职业者 , 芯片市场 , 英伟达 , 行业迷茫 , 行业重组 , 行业预测 , 订单减少 , 谷歌 , 财报泄露 , 郁金香时刻 , 阿斯麦 , 阿里
大家好,这里是老范讲故事的YouTube频道。我们现在开始讲第一个故事:阿斯麦崩盘。
是不是AI大模型要迎来郁金香时刻?什么是郁金香时刻?就是我们认为有一个大的崩盘即将到来的时候,我们管它叫郁金香时刻。因为当年荷兰人去卖郁金香的时候,就遇到了郁金香崩盘这样的事情。后面每一次大的这种泡沫破裂的时候,你可以认为它是一个郁金香时刻。
那么阿斯麦是怎么崩盘的呢?算是意料之外,情理之中。为什么叫意料之外呢?因为由于某个技术原因或者某一个技术故障,导致了应该是晚一天发布的财报提前一天泄露了。但是呢,这个泄露出来的财报并不是说虚假的或者说有错误的,就是正确的财报,只是他看到的时间稍微早了一点,或者是大家意料之外的这个时间看到了。早看到一天、晚看到一天,里面的数据都不会发生任何变化。
More
9 月 09
Luke Fan AIGC 2000美元每月 , AIGC , AI发展 , AI算法 , Anthropic , API , ChatGPT , Gemini , Information , iPhone良品率 , OpenAI , OpenAI团队 , Orin猎户座模型 , Q星算法 , Scaling law , TOKEN费用 , 上市 , 主权大模型 , 云计算 , 人工智能 , 人才招聘 , 价格上涨 , 传闻 , 信息传播 , 印度制造 , 合成数据 , 合成数据训练 , 商业合作 , 商业模式 , 国有化 , 大模型 , 大模型训练 , 安全成本 , 富士康 , 幻觉 , 微软 , 拉玛模型 , 数据处理 , 数据枯竭 , 数据清理 , 数据生成 , 显卡 , 显卡销售 , 未来展望 , 未来方向 , 模型成本 , 盈亏平衡 , 盈利模式 , 科技创新 , 科技媒体 , 科技新闻 , 科技趋势 , 算力中心 , 算力成本 , 英伟达 , 草莓算法 , 融资 , 行业分析 , 行业领导者 , 谷歌 , 连年亏损 , 高智商犯罪 , 黄仁勋
2,000美元一个月的ChatGPT还会有人用吗?
大家好,这里是老范讲故事的YouTube频道 。
今天咱们来讲一讲OpenAI有可能给ChatGPT涨价的事情。消息哪来的?国外著名科技媒体Information上报道,OpenAI因为连年的亏损,而且新的模型成本快速上涨,所以有可能给ChatGPT涨价。涨多少呢?他们也是搜集了很多的信息以后,判定有可能会涨到100倍,也就是2,000美元一个月。这是不是幻觉呢?大概率是。
那你说Information上面怎么会有幻觉呢?需要注意,Information上面也是说,我们根据各种信息总结出来以后,有一种声音提到有可能会涨100倍。具体是哪个涨100倍并没有说。到底是每个月这个20美金的订阅费用涨100倍,还是说TOKEN的费用,或者其他的一些商业合作的费用,涨到100倍都没有说。而到底是涨100倍,还是说按照这样的一个级别去涨,现在也没有讲清楚。所以只是说,我们根据传言得到了这样的一个消息,这就算是一个幻觉。
咱们再讲一个幻觉的故事。前面有人提到,印度产的iPhone良品率只有50%。后来被富士康的人出来辟谣,说没有那么差。如果良品率只有50%,苹果也受不了。其实印度产的iPhone良品率比中国的低10%。郑州富士康的iPhone良品率大概是96%,印度大概是85%或者86%这样的一个水平,其实依然是可以接受的。
More
7 月 30
Luke Fan AIGC AI与作家合作 , AI作品合成 , AI使用争议 , AI使用条款 , AI写作 , AI创作工具 , AI发展趋势 , AI大模型 , AI工具箱 , AI技术 , AI训练 , AI辅助写作 , AI附加条款 , 互动小说 , 作品合成 , 作品授权 , 作品授权调整 , 作品数据 , 作品训练 , 作家愤怒 , 作家流失 , 作家版权 , 作家离开 , 作家论坛 , 作家退网 , 作者保护 , 作者抗议 , 作者权利 , 停更 , 公平书写 , 凤凰网 , 创作效率 , 协议 , 反击 , 合同条款 , 图像生成 , 大模型弊端 , 大模型训练 , 字节跳动 , 小说停更 , 小说内容生成 , 小说发酵 , 小说平台 , 小说版权 , 小说生成 , 平台争议 , 平台调整 , 搜索增强技术 , 数字版权 , 数据合成 , 数据库信息 , 数据库建设 , 数据总结 , 数据文本素材 , 数据标注 , 数据泄露 , 新技术研发 , 显著权利 , 智能对话 , 智能文本 , 未来展望 , 未来技术 , 机器学习 , 格式合同 , 格式合同案例 , 检测工具 , 沟通对抗 , 法律协议 , 法律纠纷 , 洗稿 , 深度合成 , 版权保护 , 独立作家 , 电子书历史 , 番茄小说 , 番茄小说协议 , 番茄小说背后 , 知识产权 , 纸质合同 , 维权方式 , 网文作者 , 网文写作 , 网文创作 , 网文市场 , 网文抗议 , 网文生态 , 网文连载 , 自动识别 , 虚拟现实 , 跨平台纠纷 , 转场 , 连载小说 , 阅读市场 , 验证方法
网文作者向AIGC发起了反击。中国最大的网文平台番茄小说,因为在协议里要求网文作者授权他们使用作品进行大模型训练,导致这些作家纷纷退网,纷纷停更,向他们正式发起了反击。
大家好,这里是老范讲故事的YouTube频道。今天咱们来讲一讲番茄小说的AI附加条款到底是怎么回事。上面写了,任何作者到任何的小说平台上去写小说,都是要跟人家签协议的。说我在你这里写小说,遵守你的规则,你给我分钱。
番茄小说的协议里头呢,就突然多了一个条款,这个条款呢叫做AI附加条款。条款怎么写的?甲方可将签约作品的全部部分内容以及相关信息,包括作品名称、简介、大纲、章节、人物、作者个人信息、封面等数据语料、文本素材等,用于标注合成数据数据库建设、AI人工智能研发、机器学习模型训练、深度合成算法研发等目前已知或未来开发的新技术研发应用领域,包括但不限于:一、用于智能对话、智能文本、图像、视听语音等作品成品的编辑生成转换、深度合成、虚拟现实技术等再研发和应用;二、用于任何技术下的AI人工智能模型训练,或用于生成提供给模型训练的合成数据数据库;三、其他任何新技术研发或应用场景。
More
6 月 25
Luke Fan AIGC AI安全 , AI拼凑内容 , AI生成内容 , AI生成内容监管 , AI生成垃圾内容 , AI越狱 , AI造假 , Daniel Goose , Daniel Levy , H100 GPU , Safe Superintelligence , SEO优化 , SEO骗流量 , 上市 , 中立性 , 临时技术措施 , 二维码溯源 , 以色列裔加拿大人 , 伊利尔 , 优先使用 , 信息孤岛 , 信息溯源 , 信息真实性 , 内容甄别 , 内容过滤 , 可信媒体 , 可控性 , 商业压力 , 多模态识别 , 大企业赋能 , 大模型 , 大模型安全问题 , 大模型训练 , 安全公司 , 安全协议 , 安全定义 , 安全实验室 , 安全检测 , 安全检测模型 , 安全防护 , 安全防护功能 , 实验室 , 工程突破 , 工程能力 , 平台处罚 , 幻觉生成 , 开源大模型 , 开源模型检测 , 执行者 , 承诺 , 技术问题 , 拉玛2数据 , 拉玛3训练 , 攻击防护 , 政府赋能 , 数据处理 , 数据生成 , 数据训练 , 数据质量 , 数据预处理 , 未来环境 , 标准制定者 , 核不扩散 , 核不扩散协议 , 核安全 , 核武器 , 核武器使用 , 模型尺寸 , 模型领域 , 流量变现 , 焦虑营销 , 环境安全 , 科学突破 , 算力资源 , 组织架构 , 股民服务 , 视频验证 , 资本压制 , 超级智能 , 输入检测 , 输出检测 , 量变质变 , 非盈利组织 , 骗流量 , 骗补贴
伊利尔在创业,他的公司叫做Safe Superintelligence(安全超级智能)。这个公司的主要业务是什么呢?目前,公司由三个人组成,分别是伊利尔、Daniel Goose和Daniel Levy。伊利尔是一位以色列裔加拿大人,他精通俄语、希伯来语和英语。Daniel Goose是一位以色列企业家和投资人,而Daniel Levy是伊利尔的旧部。
在人才和算力方面,Safe Superintelligence也非常强大。Daniel Gross和Knight Fragman联合创立了算力云,他们拥有3000块H100。有趣的是,他们还可以使用五吨重的H100,因为每块H100的重量超过一公斤,所以3000块H100大约有五吨重。另外,文章中还提到了一个有趣的名字,叫做Knight Fragman,他是之前的Get Have公司的CEO。去年11月,董事会将山姆奥特曼解雇后,他接任了CEO一职。
说我们要请一个临时CEO来,就是这个叫Matt Fredman。他请来了以后说:“啊,我诚惶诚恐啊,你们想怎么干啊,咱们接着干。”等山姆奥特曼回归了以后,他就走了。他是跟Daniel Grusse联合创立了算力允啊,现在Daniel Grusse是投资和参与了伊利尔新的公司SSI,大概是这样的一个关系。那你说,现在已经有算例了啊,有人才了,那数据哪来呢?现在的数据其实比以前要好获得的多。为什么呢?因为现在可以直接让大模型生成数据,这样的话质量更高,可控性更强。像拉玛3的训练,实际上就是用大量的拉玛2来直接进行数据处理,数据预处理以及数据生成啊。那么,他就可以训练出这么厉害的拉玛3来。现在伊利尔估计也会走这条路,人有了算了,也有了啊,数据呢也有了。那么到底什么是安全啊?说他跟山姆奥特曼吵架的原因是因为他觉得山姆奥特曼做的东西不安全,而且不安全是非常危险的,会对人类造成损害。说不,我要出去,我要做一个安全的,而且叫安全超级智能,对吧?怎么叫安全呢?实际上,现在的安全需要重新去定义了。我们所说的安全啊,是像核安全那样的安全,而不是信任核安全那样的安全。这个是伊利尔讲的原话。那我们来想想,什么样的东西是像核安全一样管理?核安全到底是怎么管理的?第一个,我们来对所有的数据进行记录。
一共有多少颗核弹都得记上,哪颗核弹在什么地方,全世界的人都得知道。哎,不能说哪多出一颗核弹来,这是不允许的,至少大的是不允许的。然后呢,还要有这种叫核不扩散的协议,而且还要有各种承诺,说哎,我们啊承诺不优先使用核武器,而且知道核武器这个东西一旦使用了以后,对整个的人类,对整个未来的环境和很长一个时间都是有巨大伤害的。这个是核安全,而这种信任核安全呢就是说,我相信你不会干坏事啊,至于你以后万一干了次坏事呢,我还可以再原谅你几次。这个是信任和安全。所以伊利尔呢是准备把AI安全作为核安全的方式来去管理的。那大家想一想,他会怎么来管这个事情,如何做到安全呢?伊利尔讲了,说我们只有一个目标和产品,就是做这安全超级AI,不会去做APP也不会做什么这些东西啊,而且呢没有时间和财务上的压力。现在呢他讲把OpenAI搞成这样,为什么呢?啊是因为有财务压力,你需要烧更多的钱,你必须要不停的再去融资,像我们以前也讲,你只要开始拿投资人的钱了,开始融资了,就相当于是在脖子上套了一条枷锁,对吧,投资人会催着你往前跑的,他会有时间和财务上的压力。伊丽尔说我没有啊,我就耐心做这个产品,而且呢他是希望通过工程突破,而不是各种临时技术措施,来去保证安全啊。大家注意啊。
伊利尔本身既是一位科学家,也是一位工程大师。他致力于将安全和能力视为技术问题,并通过革命性的工程和科学突破来解决这些问题。他希望能够直接解决安全问题,而不是仅仅通过打补丁等临时性技术措施来解决。他的工程能力使他能够实现量变达到质变,从而成为一个工程大师的典范。他的大模型是一个工程学方面的案例,通过堆积更多的参数和数据,他能够获得不同的结果。伊利尔提出的规模法则,即”scaring low”,指出只要扩大模型,就会获得不同的效果。他的发明和创造力使他成为一个大力出奇迹的发明人。
More
Older Entries