LLaMA - 老范讲故事｜AI、大模型与商业世界的故事

疯狂抢人 vs 闪电离职：Meta AI团队为何刚组建就内乱不断？两个月上演的收购神话与破灭 — Meta AI 战略、AI 模型、Scale AI、扎克伯格、Llama

2025-09-03 作者 Luke Fan

Meta的抢人大战，难道要一地鸡毛了吗？

到底发生了什么呢？跟着亚历山大·王一块入职的ScaleAI的高管，突然因为个人原因离职了。有些人呢，刚被挖过来，屁股还没坐热呢，又离职回去了。ScaleAI被曝出数据质量太差，Meta在采购ScaleAI的数据同时，还去采购了竞争对手的高质量数据。因为大家知道，ScaleAI是做数据标注的，你要想去训练新模型，你就要去采购数据。我这边投了这么多钱了，发现不能使，还得买别人的。

还有什么呢？ScaleAI失去了谷歌和OpenAI这些大客户以后，被爆出来进行了大力的裁员。Meta现在正在使用竞争对手的产品，比如跑去使用ChatGPT、使用Gemini、使用Anthropic的Claude，去使用这玩意儿去了。以及爆出Meta内部的管理非常混乱。

深度揭秘Grok-2开源：马斯克藏不住的“中国芯”？SGLANG与Deepseek的秘密关系。

2025-08-27 作者 Luke Fan

马斯克终于开源了他的Grok-2。虽迟但到，这背后隐藏着哪些不为人知的秘密呢？

大家好，欢迎收听老范讲故事的YouTube频道。

马斯克最终还是开源了他的Grok-2。原来我们还嘲笑过他，Grok-1开源完了，往那一扔就再也不管它了，有任何人提问题，你也不说什么。Grok 4都出来了，现在Grok 2都没开源出来。马斯克说：“那我们下周开源。”当时是这么讲的。然而下周完了以后，好像还是又等了那么一段时间，稍微晚了这么几天吧，Grok 2最终还是开源出来了。而且承诺呢，6个月之内，或者说在年底之前吧，有可能会去开源Grok 3。但是马斯克的话嘛，大家相信，就是他说了的事会做，但是未必按时间做。

马斯克的开源呢，只能算是符合非常广义的开源。这话什么意思呢？开源也是分原教旨主义者的，他们是肯定不会认可马斯克在开源的。第一个，马斯克不是当时发布产品马上开源，而是要过一段时间，甚至是过了一年多才去开源。而且现在他开源出来的这个版本，远远落后于当前主流模型。当然Grok 2呢也不算特别落后，它在当时刚推出的时候，应该是跟GPT-4不相上下的一个水平，但是跟后边4O，以及后边O1、O2这些东西就没法比了。跟当前的主流模型，像什么GPT-5、Grok-4、Claude 4或者是Gemini 2.5这些，它是比不过的。

OpenAI 突然开源！GPT-OSS 深度评测，中美 AI 竞争升级，谁能笑到最后？AI 界的“田忌赛马”！详解中国“全家桶”式开源，如何对决 OpenAI 的精准出牌？

2025-08-08 作者 Luke Fan

OpenAI再次开源，中美AI竞争加剧，这一次体现在了不同的开源策略上。

大家好，欢迎收听老范讲故事的YouTube频道。

OpenAI再次开源，这一次发布的版本叫GPT-OSS (Open Source System)，8月5号突然上线了。这一次又不是GPT-5，我们从7月份就开始等GPT-5，现在已经等得大家开始胡思乱想了。很多人猜，说为什么出不来。现在最新的说法是48小时之内出来，等等看吧。

这一次呢，开出来的是GPT-OSS，是一个开源模型，20B和120B两种参数。它呢，是一个MOE模型，就是混合专家模型。其实在GPT-4的时候呢，大家就已经猜测它开始使用混合专家模型了，只是呢它不开源，大家只能猜。现在开出来了MOE推理模型，是有COT的思维链，是直接给大家展示出来的。而且呢，是一个文本模型，没有多模态的东西。上下文比较长，128K的上下文，要比国内的一些开源模型还要再长一些。因为现在没办法，你要使用工具、使用MCP，没有足够长的上下文，你是跑不起来的。所以呢，这一次的GPT-OSS说，我们很擅长使用工具，有的时候有点太擅长了。因为我测试的时候，有的时候工具调用次数非常多，直接就把自己的上下文填满了，这种情况也是不少的。

马斯克重磅发布GROK4：史上最聪明AI大模型横空出世，强化学习碾压GPT-4与Claude，20万张H100显卡大力出奇迹，中美科技差距再度拉大，谁将主导AI未来？

2025-07-15 作者 Luke Fan

史上最聪明的AI大模型GROK4诞生了。马斯克亲自坐镇开发布会。视频发布会呢，并不是特别的顺畅。第一个呢，是他晚了一个小时，也没说为什么。反正马斯克的直播经常会晚。然后呢，太多的东西需要集中发布，上下衔接的呢比较仓促一点。

最早期很多的互联网公司开发布会也是这样的，两三个小时七差咔嚓发一大堆东西。后来OpenAI这些公司习惯了在网上开直播以后呢，就慢慢把这风格改了。改成什么呢？就是每次发一个功能，发个十分钟二十分钟就完事了。然后呢，不停的发，每个月发每个月发。Xai呢，现在还没有彻底学会这件事情，还是一股脑给大家扔了一大堆东西出来。

我们以前在面对创业者的时候，每次都会苦口婆心的去做一种劝告。大家可能不知道会劝什么。作为投资人来说，我们每次看到任何一个创业者，都会上去劝一件事，叫不要憋大招。你一次要惦记着做一个大的东西，就很容易失败。你应该是做一些小的东西，一点一点放出来。OXAI现在还是憋了一个大招。当然了，XAI后面呢，也会每个月发布一个新的工具出来，它也慢慢的向这样的一个方向去前进。

上下文工程（Context Engineering）爆火，是AI圈又一次造词狂欢还是真革命？拆解其核心理念，对比GPT、Gemini、豆包等主流模型在该框架下的表现与优劣，帮你选择最强工具。

2025-07-08 作者 Luke Fan

上下文工程又有新词了。AIGC不怎么赚钱，造词的速度还是非常非常快的。大家好，欢迎收听老范讲故事的YouTube频道。

提示词工程已经稍微有点过时了，现在的新词叫上下文工程。提示词工程长什么样，大家还记得吗？就是上来先说你是谁，谁先给大模型定一个位置。比如说你是一个资深翻译，你是个语文老师。然后呢，说我现在想要干一点什么事情了，给我出个题，给我做个翻译，再给他一个简单的例子，说你照这样给我把东西做出来。

光有提示词呢，肯定是不够的。除了刚才我们讲的完整的、结构化的提示词之外，你还是需要很多相关的上下文，才能够让大模型稳定的输出结果。那你说我们继续把提示词写长不就行了吗？我还见过那种直接写出几百字或者是上千字小作文的提示词。这个是不是可以继续往前走呢？不行了。因为你如果继续叫提示词工程呢，会容易引起误解。大家觉得只要不断的把提示词写长，就可以把这事解决掉。但其实除了提示词之外，还有非常非常多的上下文数据需要一起写进去，才能够让大模型稳定的输出我们所预期的、有价值的结果出来。

所以呢，就不能继续叫提示词工程了，一定要起个新词。而且呢，AI时代呢，起新词是非常重要的，因为可以吸引眼球。只有足够吸引眼球的东西，才有发展的前景。所以在这个时候，上下文工程就来了，一个新词诞生了。

Meta为何砸下百亿重金投资而非直接收购AI数据标注巨头Scale AI？揭秘扎克伯格剑指AI生态霸权，欲借华人天才少年之力挽救Llama开源模型困局的深层战略与考量。

2025-06-11 作者 Luke Fan

Scale AI得到了Meta超过百亿美金的投资，AI圈又热闹起来了。大家好，欢迎收听老范讲故事的YouTube频道。

Scale AI这个名字怎么好像在哪听说过呢？好像有点耳熟，对吧？他呢，有一位特别传奇的CEO，或者叫创始人吧，叫华人天才少年CEO亚历山大王。当时呢，跳出来指责DeepSeek用H100的就是他。

DeepSeek R1到底是怎么训练的？引起了广泛的关注。DeepSeek自己讲呢，我使用了2,000多块的H800就完成了训练。但是亚历山大王呢，在一次接受采访的时候就出来说了，中国实验室里边拥有的H100的数量远超大家的想象，DeepSeek自己至少有5万块H100。但是这个话呢，没有实际证据，讲完了也就完了。DeepSeek跟亚历山大王之间呢，并没有就这个事情进行认真的探讨，所以这个我们把它当成一种谣传吧。

3月份呢，DeepSeek自己再次发了声明，说他们训练的都是使用的合规的GPU，也就是允许向中国出口的这些GPU。因为如果不说这个的话，美国就有可能要求说禁止使用这玩意儿。DeepSeek就讲了说，甭管是R1也好，V3也好，训练呢都是使用的H800，或者是后面的H20这些GPU训练的。

AI大模型竞赛白热化：Meta于LLAMA CON belatedly 推出官方API与APP，对比OpenAI、谷歌Gemini、XAI及腾讯元宝的策略，其元宇宙捆绑和缓慢步伐是否已彻底错失良机？

2025-05-05 作者 Luke Fan

Meta召开LLAMA Con开发者大会。他原来丢的这些课程，现在补还来得及吗？

大家好，欢迎收听老范讲故事的YouTube频道。4月29号，Meta召开了首届的LLAMA CON开发者大会。Meta原来是开open大会，他反正每年都会开一到两次的这种开发者大会，这是开了第二次开发者大会了。这一次呢，主要就是对LLAMA进行了一些发布。前面LLAMA4已经发布过了，而且发完了以后还翻车了。现在呢，Meta说我也要去补课了。

补什么课呢？第一个是我要出一个独立的APP智能助手，叫MetaAI APP，对标ChatGPT。另外呢，我要开始面向开发者直接提供官方的LLAMA API服务了。这块呢，还准备去跟Groq这些芯片厂商去合作去，我帮他们去部署。现在呢，LLAMA的这些服务都是免费给大家使用的，LLAMA API未来有可能会收费。

你说人家OpenAI一出ChatGPT就开始给大家提供服务，APP也出了这么长时间了。这Meta真的是起了个大早赶了个晚集，到今天才想起来说我的这些API也要为大家服务了，我的APP也要为大家服务了，还来得及来不及？

中国AI力量崛起：DeepSeek如何成为国运级创新的代表，搅动全球AI格局？

2025-02-11 作者 Luke Fan

第二个故事：DeepSeek到底是不是国运级的创新呢？国运级创新这个事呢，是游戏科学的创始人兼CEO冯骥他去讲的。DeepSeek是一个国运级的创新。游戏科学，就是黑神话悟空的这个开发商。DeepSeek呢，也确实让美股市值蒸发了很多很多钱。而且还有一位美国的参议员说：“我们要下最严格的法令来禁止DeepSeek。谁敢下载DeepSeek判20年，哪个企业敢去用DeepSeek罚1亿美金。”

这个是个共和党参议员叫Josh Holy，写了一个法案，叫2025年美国人工智能能力与中国脱钩法案。禁止技术交流与使用，禁止美国公民、企业与中国开展任何AI技术合作，包括研发、投资、数据共享等。非美国公民若涉及技术转移，可以驱逐出境。然后切断资本与人才流动，禁止美国资本对中国AI企业投资，并限制美籍科研人员参与中国AI项目。任何与中国高效实验室合作的美国机构将面临重罚。违反本法案的个人将被视为严重犯罪分子，可能影响其移民身份、绿卡申请和入籍资格。美国公司不能直接或间接向中国企业提供AI技术支持或者服务。但是这个法案呢，因为太过极端已经被搁置了。

先讲一下使用DeepSeek的方式到底是什么样的。如果你在美国使用DeepSeek，那千万千万不要去DeepSeek网去挂，那是根本得不到服务的。最好是什么呢？就是去在美国的云主机上去使用。现在DeepSeek自己的网站基本上是半瘫痪状态，聊两句就趴菜。我基本上是第一句能聊，第二句能聊，第三句你再怎么跟他聊都趴。他是这样的一个状态。你可能明天再跟他聊，还可以聊两句。API调用的话非常非常慢。而且呢，现在禁止充值了。整个春节期间，API调用的这个页面就打不开了，把整个API后台给你封掉了。现在的话是后台重新有了，但是不允许充值。现在呢，国内是各种云上都有，国内的是阿里云、腾讯云、华为云。华为云的DeepSeek呢。

Meta Llama3.1——405b大模型震撼发布——性能全面超越GPT-4o，中国AI厂商是否迎来春天？新的时代到来了，历史的车轮滚滚向前。

2024-07-25 作者 Luke Fan

Llama3.1 405b突然开放，指标上全面超越GPT-4。中国厂商们是不是又可以充了呢？大家好，这里是老范讲故事的YouTube频道。今天咱们来讲一讲Llama3.1 405b 开放的事情。

Llama的开放，每一次都比较有戏剧性，都会有偷跑。什么叫偷跑？就不是由官方开了发布会，说我今天发布了一个什么产品，而是一般都是在Reddit这样的论坛里，突然就有人放出磁力链来，大家可以去BT下载Llama3.1 405B，包括Llama3.1 405B相关的各种测试数据，都是这么被发现的。头一天偷跑了以后，第二天梅塔说那算了，我开了吧。当时好像Llama2也是这么开出来的，现在Llama3.1 也是这么偷跑，完了以后就正式开放了。

他在跑分上已经全面地超越了GPT-4，基本上在各个指标上都超越了。这是非常非常难的，因为以前大家推出的各种模型里头，都是在个别指标里面超越GPT-4O或者超越GPT-4。那么在各项指标上全都超越的，这应该是第一次。当然了，它也是分很多版本的，分为8B、70B以及405B这三个版本。405B已经完全超越了，下面小一点的8B，应该比原来的Llama370B的效果还要再好一些。它的70B基本上针对前两天发布的GBT4OMINI，属于碾压状态。

弱智吧，人类最后的防线，中文AI大模型训练的神奇语料库，简短幽默蕴含哲理的网络金句聚集地已经被用于训练大模型

2024-05-06 作者 Luke Fan

大家好！欢迎收听老范讲故事YouTube频道。今天咱们来讲一讲“弱智吧”。

“弱智吧”是什么呢？它实际上是一个百度贴吧，里面有很多独特、简短的文字，带有哲学、脑筋急转弯、幽默感，甚至很优美的内容。大家会说：“我们是弱智，我们要到弱智吧里面去，贴一些弱智的内容，贴一些弱智的问题和答案。”但随着时间的积累，人们发现，这正是“大智如愚”的体现。弱智吧的很多内容也被大家筛选出来，贴到小红书、抖音等各个平台上，惊艳了一大片人。

这真是非常神奇的事情。有人感慨：“我们很聪明的人没有惊艳到别人，而是一帮‘弱智’惊艳到其他人了。”弱智吧里有些什么样的经典语录呢？比如“吃什么补什么”，告诉我们“吃苦成不了人上人，只有吃人才行”。这样的内容看似无厘头，但仔细思考，你会发现吃人才是成为人上人的唯一原因，因为“吃什么补什么”。它巧妙地结合了中国传统文化的内容。

还有其他有趣的例子：“工人罢工之后就成了人”，“原来你是工人”；“四川人至死不渝，重庆人乐不思蜀”，这两个相邻的省份和直辖市，四川人似乎到死都不愿去重庆，而重庆人却乐在其中。