8 月 27
Luke FanAIGC, Musk传奇, OpenSource 5090D), AI Agent, AI大模型, DeepSeek, Grok-2, H20, JAX, Kimi, LLaMA, Meta, MIT协议, MOE架构, NVlink, OpenAI, SGLANG, UC伯克利, XAI, YouTube频道, 上海交通大学, 中美科技, 人工智能, 全球协作, 华为 (盘古大模型), 商业许可, 尹良生, 巨硬 (Gigabrain), 开源, 开源生态, 开源许可 (License), 微软 (Microsoft), 技术借鉴, 技术科普, 抄袭争议, 显卡要求 (H800, 智谱, 深度解析, 百度, 科技评论, 算力, 老范讲故事, 自主研发, 苹果 (Apple), 行业内幕, 谷歌 (Google), 郑连敏, 部署难度, 阿帕奇2.0, 马斯克, 高性能计算
马斯克终于开源了他的Grok-2。虽迟但到,这背后隐藏着哪些不为人知的秘密呢?
大家好,欢迎收听老范讲故事的YouTube频道。
马斯克最终还是开源了他的Grok-2。原来我们还嘲笑过他,Grok-1开源完了,往那一扔就再也不管它了,有任何人提问题,你也不说什么。Grok 4都出来了,现在Grok 2都没开源出来。马斯克说:“那我们下周开源。”当时是这么讲的。然而下周完了以后,好像还是又等了那么一段时间,稍微晚了这么几天吧,Grok 2最终还是开源出来了。而且承诺呢,6个月之内,或者说在年底之前吧,有可能会去开源Grok 3。但是马斯克的话嘛,大家相信,就是他说了的事会做,但是未必按时间做。
马斯克的开源呢,只能算是符合非常广义的开源。这话什么意思呢?开源也是分原教旨主义者的,他们是肯定不会认可马斯克在开源的。第一个,马斯克不是当时发布产品马上开源,而是要过一段时间,甚至是过了一年多才去开源。而且现在他开源出来的这个版本,远远落后于当前主流模型。当然Grok 2呢也不算特别落后,它在当时刚推出的时候,应该是跟GPT-4不相上下的一个水平,但是跟后边4O,以及后边O1、O2这些东西就没法比了。跟当前的主流模型,像什么GPT-5、Grok-4、Claude 4或者是Gemini 2.5这些,它是比不过的。
More
8 月 18
Luke FanAIGC, 华为很厉害, 英伟达,NVIDIA,黄教主,GPU AI Agent, AI芯片, AI训练, AMD, Anthropic, B100, Claude 4, CUDA, DeepSeek, Deepseek R2, Function Call, Gemini, Google, GPT-5, Grok 4, H100, H20, H800, Kimi, Llama 4, Meta, NVIDIA, OpenAI, TPU, XAI, 中美科技战, 人工智能, 传闻, 千问, 升腾910C, 华为, 华为升腾, 国产替代, 国产芯片, 大模型, 大模型训练, 字节跳动, 开源, 技术瓶颈, 推理, 散热问题, 浸没式液冷, 液冷, 深度求索, 百度, 算力, 腾讯, 芯片战争, 英伟达, 辟谣, 金融时报报道, 难产
8月14号,英国金融时报发了一篇报道,说Deepseek R2模型之所以难产,是因为在使用华为升腾芯片训练的时候,持续遇到了技术问题,最后被迫改用了英伟达芯片。甚至透露华为曾经派出一支救火队,常驻在Deepseek,手把手帮忙调教升腾服务器,但仍然无法完成训练。无奈之下,Deepseek只能退回老路训练,重新切换回性能更加可靠的Nvidia的GPU,升腾芯片仅退居辅助,用于模型推理环节。
虽然没有华为和Deepseek官方的回应,也没有他们的辟谣,但是呢,据说是援引了三位知情人士的一些说法,也进行了很多交叉验证,所以这个事情呢,大概率是真的。
国运跟国运相碰撞的时候,升腾也号称是国运级产品,Deepseek肯定是国运级产品,为什么是升腾不灵呢?升腾芯片是可以替代的,也还有一堆竞争对手,所以出现问题以后,他的竞争对手会帮他去宣传。而Deepseek虽然在国内也有模型在追赶,但是地位是不一样的。升腾和国内的其他算力芯片,以及其他那些大模型,从来没有像Deepseek那样震动过世界。所以呢发生碰撞的时候,必须是升腾不行了,不可能是Deepseek不行了。
More
8 月 08
Luke FanAIGC, OpenSource 128K上下文, AI伦理, AI开源策略, AI监管与合规, COT思维链, DeepSeek(深度求索), Gemma, GLM, GPT-OSS, Grok(xAI), Kimi, LLaMA, MacBook, Meta, Minimax, MOE混合专家模型, MXFP4量化技术, Ollama, OpenAI, Phi-4, YouTube, 中美AI竞争, 中美科技博弈, 人工智能(AI), 千问(Qwen), 原生训练, 商业模式, 大语言模型(LLM), 应开全开, 开小闭大, 开源, 微调(Fine-tuning), 微软(Microsoft), 推理模型, 数据安全, 本地部署, 模型性能, 模型评测, 田忌赛马, 科技自媒体, 科技评论, 老范讲故事, 谷歌(Google), 马斯克
OpenAI再次开源,中美AI竞争加剧,这一次体现在了不同的开源策略上。
大家好,欢迎收听老范讲故事的YouTube频道。
OpenAI再次开源,这一次发布的版本叫GPT-OSS (Open Source System),8月5号突然上线了。这一次又不是GPT-5,我们从7月份就开始等GPT-5,现在已经等得大家开始胡思乱想了。很多人猜,说为什么出不来。现在最新的说法是48小时之内出来,等等看吧。
这一次呢,开出来的是GPT-OSS,是一个开源模型,20B和120B两种参数。它呢,是一个MOE模型,就是混合专家模型。其实在GPT-4的时候呢,大家就已经猜测它开始使用混合专家模型了,只是呢它不开源,大家只能猜。现在开出来了MOE推理模型,是有COT的思维链,是直接给大家展示出来的。而且呢,是一个文本模型,没有多模态的东西。上下文比较长,128K的上下文,要比国内的一些开源模型还要再长一些。因为现在没办法,你要使用工具、使用MCP,没有足够长的上下文,你是跑不起来的。所以呢,这一次的GPT-OSS说,我们很擅长使用工具,有的时候有点太擅长了。因为我测试的时候,有的时候工具调用次数非常多,直接就把自己的上下文填满了,这种情况也是不少的。
More
7 月 11
Luke FanAIGC AI Agent, AI内卷, AI创业公司, AI应用落地, AI监管政策, Anthropic, Benchmark投资, ChatGPT, Claude, Figure AI, HEYGEN, Kimi, Manus, Manus跑路, OpenAI, Token消耗, 中国AI产业, 中美科技战, 产品体验, 人工智能, 付费转化率, 免费模式, 创业故事, 周鸿祎, 商业模式探讨, 团队裁员, 地缘政治, 大厂竞争, 大语言模型 (LLM), 字节跳动Coze, 技术壁垒, 收费策略, 新加坡总部, 智谱AI, 泛AI Agent, 用户增长, 百度, 科技公司出海, 科技新闻, 科技评论, 稚晖君, 算力, 美元资本, 美国投资限制, 老范讲故事, 融资, 行业观察, 资本运作, 通义千问, 马斯克
曾经一码难求的Manus宣布跑路新加坡了。
大家好,欢迎收听老范讲故事的YouTube频道。中国AI产业在7月9号呢,应该经历了资本侵袭之日。为什么这么讲?第一个,稚晖君创建的智源科技跑去买壳上市去了,机器人还没造出来呢,先去收购了一个上市公司60%多的股份。这个要干什么,大家心里都明白。
另外一个就是Manus,算是在Deepseek之后,又炒起了中国AI热潮的一个品牌。他们当时是做泛AI agent,就是说可以解决各种各样问题的AI agent,突然宣布在国内裁员,直接关闭,然后搬迁到新加坡。事情没做多少,这个资本的吃相有点太难看了。
Manus到底怎么个跑法呢?原来团队也不大,120人的团队,留下三四十个核心技术人员迁往新加坡,剩下的原地解散了。给2N或者是n加3,估计有些人来的时间实在是太短给n加3,来的时间稍微长一点的可以给2N。反正手里有钱嘛,刚拿了7,500万美金的融资,也不在乎这一点,直接遣散了就完事了。
More
7 月 02
Luke FanAIGC, Meta的故事 1亿美金签字费, AI Agent, AIGC, AI人才战争, AI团队重组, Anthropic, DeepSeek, Facebook, Kimi, Llama 4失败, Meta, Meta与OpenAI, MiniMax * 其他公司: 谷歌 (Google), OpenAI, XAI, 人力资源 (HR), 人工智能 (AI), 企业文化, 元宇宙 (Metaverse), 创新工厂 (Innovation Works), 华为 (Huawei), 员工挽留, 商业故事, 团队管理, 大语言模型 (LLM), 山姆·奥特曼 (Sam Altman) AI模型: Llama 4, 开源模型, 战略方向, 扎克伯格 (Mark Zuckerberg), 扎克伯格亲自下场, 招聘策略, 推理能力, 文心一言, 模型刷榜, 盛大 (Shanda), 盛大故事, 硅谷文化, 科技巨头挖人, 科技评论, 算力竞争, 职场八卦, 股票期权, 腾讯 (Tencent), 腾讯挖华为HR, 薪酬体系, 行业内幕, 行业分析, 谷歌Gemini, 金山 (Kingsoft), 金山喝酒留人, 闭源模型, 阿里千问 (Qwen)
Meta急了,扎克伯格亲自下场疯狂挖人,重新组建AI团队。
大家好,欢迎收听老范讲故事的YouTube频道。Meta的1亿美金签字费最近成为了一个新梗。签字费什么意思?就是说我去挖人,你只要过来签个字,说我同意上班来了,1亿美金到手。这个又算是创造历史了吧。
现在AI呢,确实是资本最密集,和整个行业都在关注的一个点。所以Meta这样的一家美股七姐妹的公司,突然发现自己落后了,那就一定要赶快出来补救。而补救的方式的话,一亿美金签字费。
Meta呢,在Llama4上栽了一个大跟头,而且摔得非常非常惨。这个产品呢本来是寄以厚望的,因为Llama1、Llama2、Llama3,大家都是觉得非常成功。而且呢,Meta算是建立了一个自己的品牌。甭管是谷歌呀,Anthropic呀,OpenAI,你都是闭源,只有我是开源,而且我是开源圈的领军人物。其他的人只要是愿意用开源模型,必须以Llama为基础去干活去。至少在Llama2的这个阶段呢,它这个目标是实现了。就像当年的iOS跟安卓一样,iOS是闭源的,安卓是我开源,你只要惦记自己做手机,想要一操作系统,你就使我的。
More
10 月 21
Luke FanAIGC, 芯片的故事 AIGC行业, AI企业战略, AI企业生存, AI企业竞争, AI发展趋势, AI商业价值, AI商业化, AI大模型, AI工具, AI市场分析, AI市场前景, AI市场变化, AI市场策略, AI市场需求, AI应用, AI应用方向, AI技术创新, AI技术趋势, AI投资, AI未来发展, AI桌面应用, AI泡沫, AI芯片, AI行业分析, AI行业动态, AI行业崩盘, AI行业挑战, AI行业未来, AI行业机遇, AI行业洗牌, AI行业洞察, AI行业现状, AI行业痛点, AI行业观察, AI行业转型, AI裁员, Anthropic, GPU租赁, H100租金, Kimi, OpenAI, ToB, ToC, 个人用户, 云计算, 光刻机, 创投, 台积电, 商业模式, 商业模式创新, 商业用户, 大企业裁员, 大模型同质化, 大模型训练, 字节跳动, 存储市场, 市场洗牌, 市场预期, 开源模型, 手机需求, 投资, 投资者心理, 泡沫破裂, 电脑需求, 盈利, 算力卡, 算力需求, 股市震荡, 自由职业, 自由职业者, 芯片市场, 英伟达, 行业迷茫, 行业重组, 行业预测, 订单减少, 谷歌, 财报泄露, 郁金香时刻, 阿斯麦, 阿里
大家好,这里是老范讲故事的YouTube频道。我们现在开始讲第一个故事:阿斯麦崩盘。
是不是AI大模型要迎来郁金香时刻?什么是郁金香时刻?就是我们认为有一个大的崩盘即将到来的时候,我们管它叫郁金香时刻。因为当年荷兰人去卖郁金香的时候,就遇到了郁金香崩盘这样的事情。后面每一次大的这种泡沫破裂的时候,你可以认为它是一个郁金香时刻。
那么阿斯麦是怎么崩盘的呢?算是意料之外,情理之中。为什么叫意料之外呢?因为由于某个技术原因或者某一个技术故障,导致了应该是晚一天发布的财报提前一天泄露了。但是呢,这个泄露出来的财报并不是说虚假的或者说有错误的,就是正确的财报,只是他看到的时间稍微早了一点,或者是大家意料之外的这个时间看到了。早看到一天、晚看到一天,里面的数据都不会发生任何变化。
More
5 月 15
Luke FanAIGC 4O功能, 4O模型, 5月9号, AIGC, AIGC产品, AIPC, AI助手, AI发展, AI运算, API价格, APP重要性, Deepseak, Devon, Google Gemini, Google I/O, Google压力, GPT Siri, GPT-4, GPT-4o, GPT4, GPT4与GPT5, GPT4与收费, Group, IPAD, Kimi, M4芯片, OpenAI, OpenAI官网, OpenAI活跃度, OpenAI签约, Perplexity, PPT修改, Sam Altman, Siri GPT, Siri替代, XAI, 上海取景, 中文标签, 付费用户, 免费API, 免费GPT4, 免费使用, 发布会, 响应速度, 国内大模型, 多模态识别, 大模型, 实时翻译, 手机发热, 摄像头功能, 文心一言, 新功能, 未来AI, 未来风格电影, 本地识别, 本地运行, 李开复, 浏览器与APP, 浏览器使用, 灵异万物, 现实演示, 网络负担, 股价波动, 自动编程, 自动编程机器人, 芯片, 英文标签, 苹果, 视频剪辑, 视频识别, 语气语调, 语音识别, 谷歌演示, 跨语言沟通, 通一千问, 长城防火墙, 预处理, 马斯克
GPT-4oo大家好,欢迎收听老范讲故事的YouTube频道。今天咱们来讲一讲Open AI最新发布的GPT-4,到底是一个什么样的东西。专门赶在谷歌I/O之前的一天开,这就是司马昭之心,路人皆知了。对,指的是谁,大家心里都明白。当然,选择这一天开发布会的还有其他人,比如李开复也在这一天发布了他“灵异万物”新的大模型。以后找机会学习再跟大家分享。通义千问呢,是早几天,5月9号发了他们自己新的大模型。
我呢,自己肯定是懒得去在凌晨2点看直播了,所以到今天,看看录屏,然后看看其他人都在说什么,再跟大家介绍一下GPT-4到底是一个什么样的东西。在这之前,大家一直知道,说他要在这个时间点开发布会,甚至在他没有公布发布会时间的时候,大家也都在猜,说是不是上周要发布,是不是这周要发布,然后猜了很多有可能会发布的产品。有些人猜GPT-5,有些人猜测试GPT。
战猫奥特曼说了,不是GPT-5,也不是测试GPT。我呢,在礼拜天,也就是在发布会前的一天,还在推特上在问,说这个新发布的东西会不会是GPT Siri或者是Siri GPT,对吧,因为已经传出消息了,苹果要跟Open AI签约嘛,那么出来的东西应该是这样的一个东西吧。甚至呢,我也猜过,说是不是GPT-5出来了以后,GPT-4就免费了啊,万一GPT-4免费了呢,现在惦记收费的这些版本该咋办呢,还活不活得下去,这事没法混了。所以呢,当时拆解了这么多种可能性,从我个人角度上说,我猜了GPT-40,免费的GPT-4,GPT Siri,拆了三个方向。现在看呢,我觉得我也没猜错。对吧,现在的GPT-40啊,基本上是这样,这四个方向的事其实都干了。都发布了什么呢?第一个是GPT-40,它可以进行语音识别与翻译,支持50多种语言,可以进行实时搜索。但是,它并没有进行搜索之后的很完善的内容组织,不像Perplexity那样,可以进行很好的搜索结果组织。GPT-40免费对公众开放了,这也是一个逐步开放GPT-4的过程,虽然开放的是40版本。
More
4 月 25
Luke FanAIGC AI applications, AI big model, AI大模型, AI应用, Dark side of the Moon, Founder cash-out, Hot topics, In-depth analysis, Investor identity, Jinsha River Ventures, Kimi, Kimi CHAT, Option repurchase, Social media, Tech Innovation, Technology frontier, User discussion, Venture capital dynamics, Video optimization, Yang Zhilin, YouTube SEO, 创始人套现, 创投动态, 技术创新, 投资人身份, 月之暗面, 期权回购, 杨植麟, 深度分析, 热门话题, 用户讨论, 社交媒体, 科技前沿, 视频优化, 金沙江创投
大家好!欢迎收听老范讲故事YouTube频道。今天咱们来讲一讲Kimi又摊上事了。传闻Kimi的创始人杨植林套现了4,000万美金,还有一位女性投资人加入了公司。这位女性投资人应该是金沙江创投的一位前管理合伙人。大家注意,投资机构里边最上层的就是合伙人,但它也分很多,有创始合伙人、管理合伙人,有时候我们叫大合伙人、小合伙人。不过这个具体的职位,我并不是那么了解,到底是一个什么职位,投了什么案子,这些事情就不跟大家讲了。
那么现在,Kimi也出来辟谣,说套现的消息并不真实,投资人也并没有入职。公司还补充做了一下说明,设置了期权回购制度,会让所有的员工一起分享公司发展的果实。
现在Kimi也算是是非比较多,因为它真的是第一个在国内真正能干活、真正有用的大模型。像文心一言,还有包括其他的很多推出的大模型,并没有办法真正给大家直接带来收益。但Kimi现在已经可以做到这一点,普通人也能用起来。每个人拿着Kimi都能干点什么,而且有很强的传播性。每个人都在去分享,说Kimi又出了什么官方提示词,Kimi可以一秒钟变什么什么,Kimi跟谁谁谁结合在一起,就可以变成各种分析大师、各种数据可视化、各种对机要的整理。所以,包括阅读笔记、小红书爆款文章,就有大量的这样的信息。笔记视频开始传播啊,通常是从小红书开始传,然后再向今日头条,再向抖音、B站这个地方去辐射。是这样去传播起来。而且呢,现在非常多的人去尝试用Kimi做各种各样的事情。当然了,小红书传播也可以理解,因为小红书是其上的股东。Kimi呢,是杨芝琳的英文名,他们对外提供的聊天工具叫Kimi CHAT,他的公司叫Moshot,叫月之暗面,它的大模型也叫月之暗面。但是我们一般喜欢讲Kimi,因为毕竟是个人的名字,讲起来会稍微感觉亲切一点点。
More