<?xml version="1.0" encoding="UTF-8"?><rss version="2.0"
	xmlns:content="http://purl.org/rss/1.0/modules/content/"
	xmlns:wfw="http://wellformedweb.org/CommentAPI/"
	xmlns:dc="http://purl.org/dc/elements/1.1/"
	xmlns:atom="http://www.w3.org/2005/Atom"
	xmlns:sy="http://purl.org/rss/1.0/modules/syndication/"
	xmlns:slash="http://purl.org/rss/1.0/modules/slash/"
	>

<channel>
	<title>大语言模型 (LLM) &#8211; 老范讲故事｜AI、大模型与商业世界的故事</title>
	<atom:link href="https://lukefan.com/tag/%e5%a4%a7%e8%af%ad%e8%a8%80%e6%a8%a1%e5%9e%8b-llm/feed/" rel="self" type="application/rss+xml" />
	<link>https://lukefan.com</link>
	<description>这里是老范讲故事的主站，持续更新 AIGC、大模型、互联网平台、商业冲突与资本市场观察，帮你看清热点背后的底层逻辑。</description>
	<lastBuildDate>Fri, 11 Jul 2025 00:43:10 +0000</lastBuildDate>
	<language>zh-Hans</language>
	<sy:updatePeriod>
	hourly	</sy:updatePeriod>
	<sy:updateFrequency>
	1	</sy:updateFrequency>
	<generator>https://wordpress.org/?v=6.9.4</generator>

<image>
	<url>https://lukefan.com/wp-content/uploads/2026/03/cropped-jimeng-2026-02-28-5245-用图一的人物形象，替换图二中的人物，使用图二的风格。文字替换：老范讲故事，Yo-32x32.jpeg</url>
	<title>大语言模型 (LLM) &#8211; 老范讲故事｜AI、大模型与商业世界的故事</title>
	<link>https://lukefan.com</link>
	<width>32</width>
	<height>32</height>
</image> 
	<item>
		<title>Manus不是第一个，也不会是最后一个！从爆火到出走新加坡，看泛AI Agent赛道如何被国内大厂免费模式玩坏，中国AI创业公司在资本与地缘政治夹缝中求生的辛酸启示。</title>
		<link>https://lukefan.com/2025/07/11/manus%e4%b8%8d%e6%98%af%e7%ac%ac%e4%b8%80%e4%b8%aa%ef%bc%8c%e4%b9%9f%e4%b8%8d%e4%bc%9a%e6%98%af%e6%9c%80%e5%90%8e%e4%b8%80%e4%b8%aa%ef%bc%81%e4%bb%8e%e7%88%86%e7%81%ab%e5%88%b0%e5%87%ba%e8%b5%b0/</link>
		
		<dc:creator><![CDATA[Luke Fan]]></dc:creator>
		<pubDate>Fri, 11 Jul 2025 00:43:09 +0000</pubDate>
				<category><![CDATA[AIGC]]></category>
		<category><![CDATA[AI Agent]]></category>
		<category><![CDATA[AI内卷]]></category>
		<category><![CDATA[AI创业公司]]></category>
		<category><![CDATA[AI应用落地]]></category>
		<category><![CDATA[AI监管政策]]></category>
		<category><![CDATA[Anthropic]]></category>
		<category><![CDATA[Benchmark投资]]></category>
		<category><![CDATA[ChatGPT]]></category>
		<category><![CDATA[Claude]]></category>
		<category><![CDATA[Figure AI]]></category>
		<category><![CDATA[HEYGEN]]></category>
		<category><![CDATA[Kimi]]></category>
		<category><![CDATA[Manus]]></category>
		<category><![CDATA[Manus跑路]]></category>
		<category><![CDATA[OpenAI]]></category>
		<category><![CDATA[Token消耗]]></category>
		<category><![CDATA[中国AI产业]]></category>
		<category><![CDATA[中美科技战]]></category>
		<category><![CDATA[产品体验]]></category>
		<category><![CDATA[人工智能]]></category>
		<category><![CDATA[付费转化率]]></category>
		<category><![CDATA[免费模式]]></category>
		<category><![CDATA[创业故事]]></category>
		<category><![CDATA[周鸿祎]]></category>
		<category><![CDATA[商业模式探讨]]></category>
		<category><![CDATA[团队裁员]]></category>
		<category><![CDATA[地缘政治]]></category>
		<category><![CDATA[大厂竞争]]></category>
		<category><![CDATA[大语言模型 (LLM)]]></category>
		<category><![CDATA[字节跳动Coze]]></category>
		<category><![CDATA[技术壁垒]]></category>
		<category><![CDATA[收费策略]]></category>
		<category><![CDATA[新加坡总部]]></category>
		<category><![CDATA[智谱AI]]></category>
		<category><![CDATA[泛AI Agent]]></category>
		<category><![CDATA[用户增长]]></category>
		<category><![CDATA[百度]]></category>
		<category><![CDATA[科技公司出海]]></category>
		<category><![CDATA[科技新闻]]></category>
		<category><![CDATA[科技评论]]></category>
		<category><![CDATA[稚晖君]]></category>
		<category><![CDATA[算力]]></category>
		<category><![CDATA[美元资本]]></category>
		<category><![CDATA[美国投资限制]]></category>
		<category><![CDATA[老范讲故事]]></category>
		<category><![CDATA[融资]]></category>
		<category><![CDATA[行业观察]]></category>
		<category><![CDATA[资本运作]]></category>
		<category><![CDATA[通义千问]]></category>
		<category><![CDATA[马斯克]]></category>
		<guid isPermaLink="false">https://lukefan.com/?p=2374</guid>

					<description><![CDATA[【🔥爆雷预警！】资本吃相太难看！Manus卷钱跑路新加坡真相！

啊啊啊啊家人们谁懂啊！！！🤯曾经吹爆的AI顶流Manus居然连夜跑路新加坡！这波操作直接看呆我！！！

1️⃣【惊天大瓜🍉】 刚拿7500万美金就关停国内业务！120人团队原地解散留3成核心跑路！救命这哪是创业啊？？妥妥的资本游戏收割机！！！韭菜们哭晕在厕所！！！

2️⃣【真相暴击💔】 美国金主爸爸逼宫！不搬家就不给钱！！！新加坡总部月薪8k刀起跳（人民币5w+）💰💰💰但技术全靠Claude缝合！！！自己连个大模型都没有就敢称神？？？

3️⃣【国内围剿实锤👊】 阿里/字节/百度全员下场搞免费平替！周鸿祎更是放狠话要裁市场部搞AI！！！救命国内大厂卷起来真的不给活路啊！！！！

⚠️重点来了： 泛AI代理全是泡沫！！视频拍得越炫酷实际用起来越拉胯！！抽卡式出结果还要收30刀？？这钱直接打水漂啊宝子们！！！

现在跑去新加坡搞研发？笑死！月薪5w招的工程师怕是天天金沙酒店下午茶！🍸真正写代码的还得找国内外包！！！（懂的都懂😏

AI创业圈大地震！！！地缘政治割韭菜实锤！！所以说...科创公司拿美资=定时炸弹？？？💣


Manus不是第一个，也不会是最后一个！从爆火到出走新加坡，看泛AI Agent赛道如何被国内大厂免费模式玩坏，中国AI创业公司在资本与地缘政治夹缝中求生的辛酸启示。

曾经一码难求的中国AI明星项目Manus，在获得Benchmark领投的巨额融资后，突然宣布“跑路”新加坡，引发行业震动。这一戏剧性转变，不仅揭示了美元资本在地缘政治新规下的无奈选择，也暴露了Manus作为一个依赖OpenAI及Claude等海外模型的泛AI Agent，在国内市场面临的合规困境与技术难题。更重要的是，在阿里、字节等巨头免费策略的大厂围殴下，中国AI创业生态的残酷内卷让其生存空间被极致压缩。Manus的出走，是资本、技术与市场夹击下的必然，也为中国AI公司的未来发展敲响了警钟。]]></description>
										<content:encoded><![CDATA[
<figure class="wp-block-embed is-type-video is-provider-youtube wp-block-embed-youtube wp-embed-aspect-16-9 wp-has-aspect-ratio"><div class="wp-block-embed__wrapper">
<iframe title="Manus不是第一个，也不会是最后一个！从爆火到出走新加坡，看泛AI Agent赛道如何被国内大厂免费模式玩坏，中国AI创业公司在资本与地缘政治夹缝中求生的辛酸启示。" width="900" height="506" src="https://www.youtube.com/embed/eiTydgiSp6s?feature=oembed" frameborder="0" allow="accelerometer; autoplay; clipboard-write; encrypted-media; gyroscope; picture-in-picture; web-share" referrerpolicy="strict-origin-when-cross-origin" allowfullscreen></iframe>
</div></figure>



<p>曾经一码难求的Manus宣布跑路新加坡了。</p>



<p>大家好，欢迎收听<a href="https://youtube.com/@StoryTellerFan" target="_blank" rel="noopener">老范讲故事的YouTube频道</a>。中国AI产业在7月9号呢，应该经历了资本侵袭之日。为什么这么讲？第一个，稚晖君创建的智源科技跑去买壳上市去了，机器人还没造出来呢，先去收购了一个上市公司60%多的股份。这个要干什么，大家心里都明白。</p>



<p>另外一个就是Manus，算是在Deepseek之后，又炒起了中国AI热潮的一个品牌。他们当时是做泛AI agent，就是说可以解决各种各样问题的AI agent，突然宣布在国内裁员，直接关闭，然后搬迁到新加坡。事情没做多少，这个资本的吃相有点太难看了。</p>



<p>Manus到底怎么个跑法呢？原来团队也不大，120人的团队，留下三四十个核心技术人员迁往新加坡，剩下的原地解散了。给2N或者是n加3，估计有些人来的时间实在是太短给n加3，来的时间稍微长一点的可以给2N。反正手里有钱嘛，刚拿了7,500万美金的融资，也不在乎这一点，直接遣散了就完事了。</p>



<span id="more-2374"></span>



<p>然后准备在新加坡设立新总部，在新加坡要设立研发中心，招聘AI工程师、数据科学家等职位，月薪高达8,000-16,000美金。不是人民币，是美金，因为这也没办法。你在新加坡没有这个薪水的话，你活不下去，那个地方生活成本很高的。然后准备在新加坡、东京、硅谷重新设立总部，重新开始。</p>



<p>Manus的爆火到底算不算是个意外呢？当时Manus突然火起来的时候，很多人就觉得这玩意有啥？你这个模型也不是自己家的，里头用的各种技术也不是最新的，你咋就火了呢？这是不是一个德不配位的项目呢？</p>



<p>Manus呢，是第一个能够完成各种炫酷工作的泛AI人工智能。原来呢，也有一些AI agent可以完成一部分工作，但是呢，能够完成各种工作的呢，Manus算头一个，而且它完成的很炫酷。注意，炫酷这两个字是非常重要的。</p>



<p>以前有很多开源项目说，你看我也能干，但是呢，他们做的方式相对来说比较工程师一点吧，或者比较实验室一点。你需要在字符界面，在一大堆代码在里头敲了半天，写了半天以后，给你出一个半半拉拉的结果。</p>



<p>Manus呢，第一次把它封装在一个界面和交互相当不错的产品里头，还录好了视频。这个说明什么呢？就是技术其实在AI时代不是第一生产力。在AI时代里头，最重要的第一生产力是什么？是拍视频跟讲故事的能力。我们现在看看OpenAI，那绝对是拍视频跟讲故事的大师。</p>



<p>Figure AI机器人。</p>



<p>这个也属于是拍视频跟讲故事的一把好手。咱再看看马斯克，那玩意儿全世界第一大网红，他这拍视频讲故事的能力也是没有边了。所以在AI时代，还是要好好的拍视频讲故事。</p>



<p>真正说我视频拍的一般，故事讲的不怎么样，产品做的特别好的，Anthropic算是一个。这个Manus属于是视频拍的很好，故事讲得很圆的一个项目。技术呢，你说真的有多先进？还真没有多先进。他用的是Anthropic的Claude大模型，连当时正在快速发展的MCP都没用上，自己就是把一些需求捆在一起。但是他的整个交互做的挺好，视频绝对很酷，产品设计和体验也还做的不错。算是呢，解决了一些问题，而且呢，给大家带来了新的思路。</p>



<p>这样的情况下，他突然就爆火了。但是爆火之后后边的发展呢，其实并不尽如人意。OpenAI这样的爆火了以后，不断的往前发展，不断的引领潮流，开创了新渠道嘛，然后一直站在这个渠道，带着大家一起往前走，一起探索新方向。大家都是有这样预期给它的。</p>



<p>但是Manus后边并没有那么好用。第一个呢，尝试在国内落地失败了。它本来是用的Anthropic的Claude大模型，你要想在国内落地，这事肯定不行嘛。因为这个规定了，你是不可以在国内使用了。包括像OpenAI的ChatGPT，谷歌的JGemini，这些都是不允许在国内使用的。所以呢，他们挑来挑去，挑中了通义千问的这个模型，说我们试一下，用千问模型能不能在国内落地。然后就没有然后了，估计效果很不好。</p>



<p>因为千问模型我们试过，就是它的指令依存度是比较差的。特别是当时的千问2.5，千问3呢还要更好一些。因为像你要做这么复杂的AI agent，你就需要是很多个AI大模型的运作过程前后相衔接。这个里头你到底说成什么样，说我才华横溢还是磕磕绊绊，这不重要。重要的是什么？就是你指令的依存度。我前面要求你向东，你就不能向西；我要求你撵狗，你就不能打鸡。但是在这块，千问其实做的不好。</p>



<p>Manus如果继续想向前发展的话，他必须要解决Claude、ChatGPT这些美国大模型的合法使用问题。这个问题对于他来说是无解的，因为模型不是他自己的。很多其他的厂商，你像Mini Max也开始做AI agent，那模型是他自己的，他就可以分好说，这个是国际版，那个是国内版，我们自己拆开来用就完事了。但是，Manus他没有这个能力。</p>



<p>而且呢，Manus在国内被一群的大厂去围殴。这种东西你在美国呢……</p>



<p>人家还没有这么多的工程师，这么多的研发力量聚集起来说：“有方向了，我们要出来围殴你一下。”还不会干这个事。</p>



<p>而且，就算你在美国，真的有人把类似的产品做出来，人家还得收费。你在收费的情况下，大家还可以拼一下：谁愿意亏更多的钱？谁愿意给更多的补贴和优惠的问题。但是国内大厂不跟你讲这个，我都免费，产品都差不太多。</p>



<p>国内阿里自己就做了类似这样的产品，也投资了类似这样的产品。字节跳动自己做了Coze空间，而且现在的豆包也支持深度研究了。百度也出了类似这样的产品，这都是大厂吧？直接上来围殴你，都是免费的。</p>



<p>Minimax、Kimi、智谱也都出了这种泛AI Agent，也在进行相应的尝试，而且都是不要钱的。那你怎么跟他打？包括像360的周鸿祎都开始表演了，说：“我们也开始做这种泛AI Agent，各种问题都可以解决掉。”而且为了开演示会，还说：“我要把市场部都裁掉，我让AI Agent把整个市场部的工作都替代掉，我自己一人搞定。”后来也就没有什么后来了，估计裁撤市场部这件事情，没有那么容易。</p>



<p>再往后，Manus开放注册和开始收费之后的话，数据就不再公布了。什么意思呢？因为前面在排队的时候，号称有260万人进去排队，后边说：“我们不需要排队了，大家来玩吧，我们开始收费了。”这个用户增长估计是废掉了。</p>



<p>如果用户增长依然非常迅猛的话，他会出来说：“我们又有多少人开始排队了，我们又有多少人等着去付费了。”如果他真的收到钱，他也会说：“你看我收了这么这么多钱，我盈利了。”但是后边的数据就没有了。</p>



<p>曾经有一个数据，号称是说他们的付费转化率有60%。但是这种数数呢，就是你看着一下就行了。ChatGPT自己也做不到付费转化率60%这样的事情。这个就属于是骗一些不是特别有经验的人吧？这是不可能的。任何行业付费转化率都不可能这么高。</p>



<p>因为这种泛AI Agent的收费模式其实是很难平衡的。为啥？因为它消耗的TOKEN特别多。每一次他提出要求以后，你就要消耗大量的TOKEN去干活。你还别说是这种泛AI Agent，我曾经把自己的一些AI大模型的账号挂到过编程的AI Agent里头去，这还是一个相对来说比较固定的垂类的AI Agent。那一会你问问几个问题，几美金就不见了，这个非常非常贵的。</p>



<p>而且，AI Agent产生的结果呢，是不可预估的。你最后不能说要抽卡吧？抽卡的意思就是你出多次的结果，然后挑一个可以用的。</p>



<p>这个是在AI绘图里边常用的一个新的名词。但是，AI agent出来的这些结果，可用的绝对不会超过一半。绝大部分的这个AI agent的结果都是不可用的。在这样的情况下，你让人去付费，甭管是十几美金、二十几美金，还是三十几美金。一方面，消耗的TOKEN这个钱数根本就cover不住；另外一方面，人家付了钱了，出来的结果基本上不可用，那就属于里外不是人的一个状态了。</p>



<p>这些大模型厂商自己搞AI agent，它还可以干嘛？左手倒右手，我只要在里边做这个账就完了。但是你像Manus这种第三方，你收了这些订阅费以后，你就老老实实的去给人按TOKEN付钱去。这个基本上是无解的。免费很香的东西，收费了以后立马就不香了。</p>



<p>现在关于Manus在国内的很多风评，其实没有那么好。一堆人说，怎么这么贵？当然，只要收费，就一定会有人嫌贵。吃不到葡萄说葡萄是酸的嘛。你像我收199，说大家来做个线下活动，一帮人说，老范你怎么可以割韭菜？永远有这样的声音，这个是没有办法。另外一方面，就是付了钱以后没有得到想要的结果。因为泛AI助理呢，本身你想获得想要的结果，就非常非常难。</p>



<p>拍视频没毛病，拍个视频给大家演示一下，这个事你是可以做的非常非常好的。因为都是摆拍嘛，你这一次没拍好再拍一次嘛。这些数据进去了以后效果不好，再来一批嘛。但是你真的实际使用的时候，所有的挫折和失败，就需要用户自己承担了。那这些人会去骂街的。人家希望付了钱以后一次搞定，你付了钱以后让我反复在这试，那这个肯定是不行的嘛。</p>



<p>为什么说资本是丑恶的呢？资本的丑恶嘴脸在哪呢？这个Manus拿了钱了，拿了谁的钱？叫benchmark给了7,500万美金，估值5亿美金。还没有到独角兽，10亿美金才独角兽呢，距离独角兽还差一半。7,500万美金拿到了，就是他搬离中国大陆去新加坡的一个核心原因。为什么呢？这个是拿钱的一个前提条件。benchmark这个7,500万美金的领投，是美国财政部进行了严格的审查。不搬离中国，搬到新加坡去，你这个投资就不允许落地。</p>



<p>这是为什么呢？美国在2024年10月份签署了行政命令，规定了美国资本对中国AI半导体领域的投资，需要报备和受限。这个命令是在2025年1月生效的。只要是美国资金投了中国项目，就需要去审核。他这个案子就审核了，最后通过的方式就是：这不是一家中国公司，我把中国公司的部分整个关掉，我搬到新加坡去。</p>



<p>而且呢，投资者就明确的要求 Manus 必须迁到新加坡，否则的话你这个审核通不过。而且呢，Manus 搬到新加坡以后，你也可以合规的去使用 OpenAI、Anthropic 这些美国的 AI 大模型了。</p>



<p>Manus 出走的原因，现在已经看得很明白了。不要想什么算力的问题，什么芯片的问题，他自己连大模型都没有，他要那玩意干嘛使？它也不是部署在开源大模型上的，它是部署在人家的 Anthropic 或者是 ChatGPT 这些闭源模型上的。所以它只需要往 Anthropic 或者是 OpenAI 这边去买 TOKEN 就完了，跟算力没啥关系。</p>



<p>Manus 出走的原因第二个，你要合法的使用 Claude 和 ChatGPT。第三个，要合法合规的为海外客户提供定制服务。因为未来的话，你继续去做这种泛 AI 人工智能，其实是有问题的。现在泛 AI agent 的所有服务，其实服务效果都不是特别好。在这样的情况下，只能去给人做定制的垂类的 AI agent。</p>



<p>最重要的一个呢还不是这些，最重要的一个，是避免跟国内这帮卷王继续内耗下去。国内的一众的 AI 真的都是免费的，就算你拿了 7,500 万美金的投资，一个这样的小公司，一百来人的小公司，你想去跟字节卷，还是想去跟百度卷？你卷不过人家的。别看百度现在市值还没有腾讯音乐高呢，但是依然是一个庞然大物。</p>



<p>现在国内的这些 AI agent，它的效果呢也都大差不差的。基本上呢，把国内的 AI agent 或者叫泛 AI agent 这条路给封死了。所以国内谁在说我要去做这个东西，别费劲，没有你任何机会。</p>



<p>那泛 AI 认证的这条路径到底对不对呢？大家都往里冲。前面我们讲了，泛 AI 认的这条路径，到目前为止还是有问题的。他算是一个美好的愿景，大家都希望把它做成，但是目前其实达成的效果都差强人意。</p>



<p>那么泛 AI 的既然解决不了大家实际应用的问题，为什么这么多大厂都进去卷，都免费的给大家提供大量的 TOKEN，让大家去使用呢？原因很简单，泛 AI agent 呢是可以吸引用户的。吸引了用户以后呢，你就可以进行垂直和定制的 AI agent 或者是 AI 应用的开发与销售了，这个是非常重要的。</p>



<p>而且呢，大模型只靠订阅和 TOKEN 是很难实现收支平衡的，必须要提供服务附加值。大模型厂商都在卷泛 AI agent，意思就是说，我再给你提供点别的服务，你再给我多交点钱回来。现在准备在这条路上一直卷到死的，也就是 OpenAI，收 200 美金一个月。</p>



<p>收2,000美金一个月。收2万美金一个月。我把这个东西给你做的非常漂亮。其他人其实也不太敢往这条路上生卷，都是吸引了用户以后，先说我包治百病。你包治百病完了以后，到医院门口的分诊台一看，你这个看个内科吧，你那个看个外科吧。他最后应该是这么来去，把整个的用户需求给消化掉。</p>



<p>那么最后呢，Manus的未来会怎么样呢？在新加坡招人组建团队呢，基本上是个伪命题。当一个人的薪资达到1万多美金的时候，在新加坡这样的一个城市，你想让他踏踏实实的做研发，难度其实是很大的。我有不少的朋友在那边做公司，你真的想让他在当地把研发整个跑起来的话，可能性很小。如果能够在新加坡、日本获得客户的话，估计还是要在大陆重新召集团团队，召集工程师，将项目完成掉。</p>



<p>现在呢，大张旗鼓的把它都裁掉。我现在是新加坡公司了。以后呢，再偷偷摸摸的招募，或者说招完了以后变成外包。这个也方便进行隔离。你到目前为止，字节跳动也没说我把这个研发团队都弄到新加坡去。他整个的研发还是要靠中国大陆。新加坡那边可能做一些运营，管理什么就可以了，或者说摆一些人，稍微给大家演示演示就行了。</p>



<p>要想继续引领潮流，开创新赛道，去新加坡呢，基本上就宣告了他已经放弃了这条路。如果他惦记着说继续引领潮流，说我要继续在泛AI agent这条路上接着跑下去，他就不会去新加坡，他会去美国。去了新加坡就肯定说，我怎么安安稳稳的把拿到手的投资把它消化掉，怎么把这些名声转换成我的客户，怎么变成我的利润和未来的一个发展。他一定是要做成这样的东西。</p>



<p>新加坡呢，当然还可以玩一些歪门邪道的东西。什么东西呢？比如说运营算力中心。我整一个算力中心，在这边做一些运营。比如说让国内的一些团队去使用他的算力，或者说是不是在偷偷的倒腾一点算力卡。这个都是可以在新加坡比较方便做的事情。日本东南亚呢，这种垂直的，定制化的AI agent的需求，其实是可以养活Manus。最后呢，在新加坡上个市，稳定的发展下去，应该也算是一个不错的未来了吧。</p>



<p>总结一下，地缘政治呢，正在割裂AI行业的发展。Manus跑路了。loveart，前面咱们介绍过的这个产品，还有一个叫Jinsmark，一开始就设立在美国。虽然都是中国公司，但是，都是跑到美国去开分公司。最早跑路的其实不是Medos，最早跑路的叫HEYGEN。大家还有没有印象前几年，郭德纲讲英文相声的这种视频，就是这个HEYGEN做的。</p>



<p>他呢，也是拿的benchmark的这个钱，拿了6,000万美金，然后就跑去美国去了。</p>



<p>美元资本呢，现在确实是有尴尬的地方。以前很多项目拿了美元投资以后，可以到美国去上市，滴滴什么这些。你在中国运营，拿了美元资本到美国上市。但是呢，也是滴滴，最后把这条路封死了。</p>



<p>再往后，拿了美元资本的人，就只能到香港去上市，或者说到新加坡、到美国去。这个是没有什么办法的。全世界一多半的AI，各个层级的开发者，其实都是华人，或者都是大陆人，大陆人居多。</p>



<p>美国非要在中间画一条线，那么未来这种神奇的故事就会一次又一次的上演。Manus呢，只是众多跑路的AI项目中的一个，不是第一个，也不会是最后一个。</p>



<p>好，这个故事就跟大家讲到这里。感谢大家收听，请帮忙点赞，点小铃铛，参加<a href="https://discord.gg/ppKsNkttTv" target="_blank" rel="noopener">DISCORD讨论群</a>。也欢迎有兴趣、有能力的朋友加入我们的<a href="https://www.youtube.com/channel/UCUGLhcs3-3y_yhZZsgRzrzw/join" target="_blank" rel="noopener">付费频道</a>。再见。</p>



<p></p>
]]></content:encoded>
					
		
		
			</item>
		<item>
		<title>上下文工程（Context Engineering）爆火，是AI圈又一次造词狂欢还是真革命？拆解其核心理念，对比GPT、Gemini、豆包等主流模型在该框架下的表现与优劣，帮你选择最强工具。</title>
		<link>https://lukefan.com/2025/07/08/%e4%b8%8a%e4%b8%8b%e6%96%87%e5%b7%a5%e7%a8%8b%ef%bc%88context-engineering%ef%bc%89%e7%88%86%e7%81%ab%ef%bc%8c%e6%98%afai%e5%9c%88%e5%8f%88%e4%b8%80%e6%ac%a1%e9%80%a0%e8%af%8d%e7%8b%82%e6%ac%a2/</link>
		
		<dc:creator><![CDATA[Luke Fan]]></dc:creator>
		<pubDate>Tue, 08 Jul 2025 00:58:36 +0000</pubDate>
				<category><![CDATA[AIGC]]></category>
		<category><![CDATA[AI Agent]]></category>
		<category><![CDATA[AI产业]]></category>
		<category><![CDATA[AI幻觉]]></category>
		<category><![CDATA[AI应用开发]]></category>
		<category><![CDATA[AI趋势]]></category>
		<category><![CDATA[Claude 3]]></category>
		<category><![CDATA[DeepSeek]]></category>
		<category><![CDATA[Few-shot (少样例提示)]]></category>
		<category><![CDATA[Gemini 2.5 Pro]]></category>
		<category><![CDATA[GPT-4o]]></category>
		<category><![CDATA[Grok]]></category>
		<category><![CDATA[JSON输出]]></category>
		<category><![CDATA[LangChain]]></category>
		<category><![CDATA[LLaMA]]></category>
		<category><![CDATA[LLMOS (大模型操作系统)]]></category>
		<category><![CDATA[MISTRAL]]></category>
		<category><![CDATA[OpenAI]]></category>
		<category><![CDATA[RAG (检索增强生成)]]></category>
		<category><![CDATA[Shopify]]></category>
		<category><![CDATA[Simon Wilkinson]]></category>
		<category><![CDATA[上下文工程 (Context Engineering)]]></category>
		<category><![CDATA[上下文窗口 (Context Window)]]></category>
		<category><![CDATA[上下文隔离]]></category>
		<category><![CDATA[信息压缩]]></category>
		<category><![CDATA[函数调用 (Function Calling)]]></category>
		<category><![CDATA[大语言模型 (LLM)]]></category>
		<category><![CDATA[安德烈·卡帕西 (Andrej Karpathy)]]></category>
		<category><![CDATA[工具调用 (Tool Calling)]]></category>
		<category><![CDATA[技术解读]]></category>
		<category><![CDATA[提示词工程 (Prompt Engineering)]]></category>
		<category><![CDATA[模型稳定性]]></category>
		<category><![CDATA[特斯拉]]></category>
		<category><![CDATA[程序员]]></category>
		<category><![CDATA[系统提示词]]></category>
		<category><![CDATA[英伟达 (Nvidia)]]></category>
		<category><![CDATA[豆包大模型]]></category>
		<category><![CDATA[软件2.0 (Software 2.0)]]></category>
		<category><![CDATA[通义千问]]></category>
		<category><![CDATA[长期记忆]]></category>
		<guid isPermaLink="false">https://lukefan.com/?p=2365</guid>

					<description><![CDATA[炸裂！！AI圈又出王炸新宠了家人们！上下文工程直接掀翻提示词工程老套路💥

刚被硅谷大佬集体点名的新风口到底多强？？
👉特斯拉前科学家卡帕西疯狂打call
👉OpenAI官方偷偷在用
👉Shopify创始人亲自下场认证

重点来了‼️
传统提示词工程早凉了❌
真正的搞钱密码是这6大模块组成的必杀技：
1️⃣系统角色+超强栗子库
2️⃣用户精准需求拿捏
3️⃣聊天记录追踪器
4️⃣长期记忆强化剂
5️⃣全网知识雷达
6️⃣格式输出稳定器

程序员亲测真实体验👇
用对工具直接起飞🛫
✔️GPT4o怒降50%成本！！！
✔️Gemini2.5告别幻觉输出
✔️Claude3推理速度×3倍
（但是！华为盘古直接拉黑名单❌）

现在入局就赚到💵
手慢真的会拍大腿！！
⚠️小白必看红黑榜：
红榜✅：GPT4o＞Deepseek＞豆包1.6
黑榜🚫：Llama4＞文心一言＞盘古

讲真，这波红利可能就三个月窗口期‼️
搞技术的不学上下文工程
分分钟被00后实习生卷死😭


上下文工程（Context Engineering）爆火，是AI圈又一次造词狂欢还是真革命？拆解其核心理念，对比GPT、Gemini、豆包等主流模型在该框架下的表现与优劣，帮你选择最强工具。

“提示词工程”的热度正在消退，取而代之的是由AI大神安德烈·卡帕西（Andrej Karpathy）点赞推崇的全新范式——“上下文工程”。这不仅是简单的概念炒作，而是解决当前AI应用输出不稳定、AI幻觉频发问题的关键钥匙。它通过指令层、RAG检索、工具约束等六大模块的精密协作，以及写、选、压、隔四步工作流，系统性地管理大语言模型的输入与输出。成功的上下文工程要求大语言模型具备长上下文、原生工具调用和稳定的JSON输出能力，最终目标是打造出结果可预测、真正有商业价值的AI应用，告别过去“垃圾进垃圾出”的困境。]]></description>
										<content:encoded><![CDATA[
<figure class="wp-block-embed is-type-video is-provider-youtube wp-block-embed-youtube wp-embed-aspect-16-9 wp-has-aspect-ratio"><div class="wp-block-embed__wrapper">
<iframe title="上下文工程（Context Engineering）爆火，是AI圈又一次造词狂欢还是真革命？拆解其核心理念，对比GPT、Gemini、豆包等主流模型在该框架下的表现与优劣，帮你选择最强工具。" width="900" height="506" src="https://www.youtube.com/embed/dLuhRk1LLhE?feature=oembed" frameborder="0" allow="accelerometer; autoplay; clipboard-write; encrypted-media; gyroscope; picture-in-picture; web-share" referrerpolicy="strict-origin-when-cross-origin" allowfullscreen></iframe>
</div></figure>



<p>上下文工程又有新词了。AIGC不怎么赚钱，造词的速度还是非常非常快的。大家好，欢迎收听<a href="https://youtube.com/@StoryTellerFan" target="_blank" rel="noopener">老范讲故事的YouTube频道</a>。</p>



<p>提示词工程已经稍微有点过时了，现在的新词叫上下文工程。提示词工程长什么样，大家还记得吗？就是上来先说你是谁，谁先给大模型定一个位置。比如说你是一个资深翻译，你是个语文老师。然后呢，说我现在想要干一点什么事情了，给我出个题，给我做个翻译，再给他一个简单的例子，说你照这样给我把东西做出来。</p>



<p>光有提示词呢，肯定是不够的。除了刚才我们讲的完整的、结构化的提示词之外，你还是需要很多相关的上下文，才能够让大模型稳定的输出结果。那你说我们继续把提示词写长不就行了吗？我还见过那种直接写出几百字或者是上千字小作文的提示词。这个是不是可以继续往前走呢？不行了。因为你如果继续叫提示词工程呢，会容易引起误解。大家觉得只要不断的把提示词写长，就可以把这事解决掉。但其实除了提示词之外，还有非常非常多的上下文数据需要一起写进去，才能够让大模型稳定的输出我们所预期的、有价值的结果出来。</p>



<p>所以呢，就不能继续叫提示词工程了，一定要起个新词。而且呢，AI时代呢，起新词是非常重要的，因为可以吸引眼球。只有足够吸引眼球的东西，才有发展的前景。所以在这个时候，上下文工程就来了，一个新词诞生了。</p>



<span id="more-2365"></span>



<p>这个造词的大师现在是谁呢？叫安德烈·卡帕西。这是一位造词专家，他呢是特斯拉跟OpenAI的AI科学家，已经离职了。现在呢主要的工作是投资人和顾问，他自己投一些项目，也帮助一些项目做顾问做孵化。这哥们呢在不停的造新词。2017年呢，他造的新词叫软件2.0。什么是软件2.0呢？把神经网络视作用数据而非代码编程的新规范。程序等于网络结构加训练数据加优化器，源代码缩到几百行，真正的逻辑写在权重里面。这是2017年提出来的，现在我们的大模型基本上就是长得这个模样。</p>



<p>到2023年呢，提出来叫LLMOS，大模型操作系统。把大语言模型比作新的CPU加操作系统，人类用自然语言编程，大语言模型负责调度、记忆和推理。2025年，氛围编程，也是他编发明的一个新词。彻底投降给AI，对着IDE聊天，粘贴报错，让模型自动改，人只管感受对不对。</p>



<p>现在上下文工程又来了。上下文工程呢叫context engineering，这个呢并不是卡帕西自己提出的。最早呢是2025年6月27号，一位开源作者叫Simon Wilkinson。</p>



<p>写了一个文章，提到了&#8221;Context Engineering&#8221;这个概念。在7月份呢，一帮人就出来说，这个实在是太棒了，要向这个方向发展，包括Longchain的一些博客。Longchain应该也算是AI Agent的一个开山项目吧，比较早期的一个项目。Shopify（加拿大最大的电商平台）的创始人也出来点赞，说一定要使用Context Engineer才可以让大模型稳定的输出结果。</p>



<p>在这个时候呢，卡帕西上去点了个赞。卡帕西说：&#8221;加一，我也赞同这件事情。&#8221;所以现在再去讲这个上下文工程的时候呢，都是说这是卡帕西点赞过的，或者说是卡帕西推崇的新的概念。因为他最有名，他最喜欢造词，所以现在都是把这个上下文工程这个事情跟卡帕西挂在一起。</p>



<p>AI时代，讲故事能力、吸引眼球的能力是非常非常重要的。所以我们看到一帮做机器人的公司，或者像OpenAI这样的公司，不停的给大家录视频，让普通的民众能够感受到这个东西好厉害。其实他也没搞明白这个大模型或者这些机器人到底能干嘛，只是觉得好炫酷。但这就够了。当大家都觉得这个东西很炫酷的时候，你就可以拿到融资，可以往前走。所以造新词还是很重要的。</p>



<p>那么上下文工程都包含什么东西呢？讲了半天在提示词工程基础上加什么了呢？上下文工程呢一共是6个模块：</p>



<p>第一个叫指令层（系统角色+少样例提示）。这个什么意思呢？原来我们写在系统提示词里的东西。我们跟大模型聊天的时候，是有两个提示词：一个叫系统提示词，一个叫用户提示词。系统提示词就是先规定大模型你是干嘛的，你是什么什么角色，现在要具体做什么什么事情。少样例是什么呢？叫Few-shot，就是你要给他提几个例子。你说我直接告诉你你是干嘛的，我不给你举例子行不行？这个事是不好的。最好呢是给他两个到八个之间的这种少量的样本。那你说我给他100个例子行不行？那个你基本上去微调模型去了。所以呢，叫少量样本。这个是写系统提示词的一个要求。所以呢，他的第一块（6个模块里的第一块）就是系统提示词。</p>



<p>第二块呢叫及时用户请求，也就是原来我们使用的用户提示词。</p>



<p>第三块是什么呢？叫对话历史和短期记忆。我们在聊天的时候，你不能说我每句都是新的吧，你还是要有一个对话历史的。</p>



<p>第四块叫长期记忆。长期记忆呢就是说，我们通过每一次聊天，把一些关键信息把它提取出来。因为现在甭管是OpenAI、Gemini，都在向长期记忆这一块发展。</p>



<p>我们说，你记得我是干嘛的吗？你记得这个原来我跟你说过什么事吗？他能想的起来要把用户偏好和先前的一些摘要放到这个上下文里边去。</p>



<p>第五个呢，是RAG检索到的文档、数据库条目以及实时API的一些结果，再加一些本地知识库，再加一些搜索结果呀，再加一些数据库里的信息。</p>



<p>第六块呢，叫工具与格式约束。什么意思呢？就是你要告诉他说：“我现在可以调哪些工具？”比如说我这有高德地图、有百度地图、有天气，或者一些其他的工具，你可以调用。调用的方式是什么样的？以及呢，输出什么样的一个结果？通常这种信息都不是按照正常的文本格式输出的。这种上下文工程要求的输出格式都是JSON格式，有哈西结构的一些文档。</p>



<p>整个的上下文工程包括这六个组成部分。它的工作方式是什么样的？我怎么能够让它用起来呢？分四步：</p>



<p>第一步呢，是写。写的时候呢，要把随时会用到但是当前窗口装不下，或者不该暴露给大语言模型的内容呢，持久化到窗口之外去，可读可写的一些外部存储上。有一些信息我认为你可能有用，但是呢现在我又不是马上就要给你，我要把它先存起来。</p>



<p>第二件事呢，叫选。选是什么呢？就是在庞杂的信息文档和工具描述里头，准确定义相关性，把最有用的多少条信息放到窗口里边去。在大模型里头，有一个东西叫上下文窗口。要把一时用不着的写在外面，随时可以调用；要把有用的选到窗口里头来。</p>



<p>第三步呢，叫压缩。在不丢关键信息的情况下，把即将写回窗口的内容做摘要和裁剪，满足TOKEN预算。什么意思呢？比如说做了RAG的选择了，或者做了搜索的结果返回了，这些信息是相对比较啰嗦的比较多。那怎么办呢？在这个时候你要先去做一次总结，然后把总结过的东西再扔给大模型。所以呢，在这要做压缩。</p>



<p>最后呢，第四步叫隔离。把彼此可能串味的信息拆分进独立的上下文窗口或者沙盒，减少干扰，并行提速。</p>



<p>我原来在这块翻过车，稍微给大家讲一嘴。我有一次呢，想去问大模型，说这个人跟谁谁一块创业去开咖啡馆了，他有什么其他的在咖啡馆里边管理或者创业的经验没有？大模型呢，就把一大堆的搜索结果拿进去去总结归纳去了。结果呢，他就说这个人在瑞幸干过高管，在星巴克干过高管。我一看，这挺好，赶快就去写演讲稿去了吗？但是最后去校验的时候发现不对。那是怎么回事呢？就是他在搜索了以后，把一大堆说星巴克跟这种咖啡馆之间是如何去比对的，瑞幸跟这些咖啡馆之间是如何差异，他们对瑞幸做了什么评价，瑞星对他们做了什么评价。</p>



<p>然后呢，再把我提问的这个人混到几个结果里边去了，就把一些信息上下文给混一块了。在这个里头就不要干这个事情。如果是说星巴克跟瑞幸对这个新的咖啡馆的形态有什么样的评价和比较，你单独的去让他干活。然后呢，你单独专门问，说这个人具体是做什么事情的，过去的履历是什么样的。这样的话，他等于是把上下文就分到不同的窗口里去了，他就不会说我给你搁一块，让你混成一锅粥以后再去给我输出了。这个也是很重要的。而且你分开了以后就可以并行处理嘛，可以快一点。这就是上下文工程6个部分和分四步走。</p>



<p>那么如何判定我们上下文工程是不是成功的呢？一旦有工程这俩字，就是你一定是可以去调优的，一定可以判断成不成功的。上下文工程的成功标准是同样的一个任务，用更低的成本、更少的幻觉、更快的响应速度把它完成掉，这就是成功的。你要不断的去调优，按这个方向调。失败是什么呢？叫垃圾进垃圾出。你把一大堆不应该给他的信息都扔进去了，然后一大堆垃圾的结果给你吐出来，这个就是失败了。</p>



<p>但是要注意，不是所有的大模型都能顶得住上下文工程的。你写了这么长的上下文扔进去，让他去干活，不是谁都行。那么什么样的大模型可以顶得住上下文工程的这种工作方式呢？它有三个要求：</p>



<p>第一个要求是你要长上下文。刚才咱们啰里八嗦说有6个部分，分几步去写，但是你把那6个部分写进去，这个总的TOKEN量是不会少的。所以呢，要求你至少是有128K的输入，你才可以去干活。所以像早期的Deepseek版本是64K输入的，干不了这事，放不下。</p>



<p>第二个是什么呢？就是原生工具调用的知识。有一些早期的模型是不支持原生工具调用的，包括比较新的像LLAMA4什么的，对原生工具调用的支持都不是很好。因为你要想让他把所有的事情做完，你就要让他可以去调用工具，调用搜索引擎、调用浏览器、调用刚才我们讲的比如天气预报、高德地图。你可以去调用这些东西，他才可以去干活。所以，你要支持原生工具调用。</p>



<p>第三个呢，就是要能够做稳定的Json结构输出。你不能说我要求你输出了以后，最后你输出的格式不完整、不正确，这个事也是没有办法做上下文工程的。因为呢，你这边做完上下文工程了以后，他可能不是最后一步，你下一步你还要再去用这些内容，需要去解析这个东西，才可以去说下一步再如何去使用。</p>



<p>现在我们所流行的这些大模型里头，谁行谁不行呢？咱们讲了三条标准。第一个，美国的御三家都是很好用的。</p>



<p>御三家就是GPT、Gemini、Claude。其他的一些呢，就稍微差一点。比如说像法国的Mistral，它的一些大的模型呢是可以使用的，但是完整格式输出的准确率不高。</p>



<p>咱们刚才讲的Gemini、Claude、GPT，完整Json格式输出的时候，也不能保证100%正确，但是呢可以保证到百分之九十几正确。Mistral呢，就是最后这一步的格式输出，有时候比如少个大括号，或者是多个引号什么这种事，他就有时候会出。或者说我少几项，比如说我应该要求是4个，结果他最后给你输出了3个，或者多输出了两个，有重复的。它的这块会稍微差一些。</p>



<p>马斯克的GROK3，推理模式下呢基本上可用。但是呢，有的时候会把推理的过程写到json文件里边去，所以并不是完全可用。或者说，还是有待提升吧。马斯克说这几天出GROK4，希望他能够把这个问题解决掉。</p>



<p>咱们自己的，比如Deepseek R1呢，早期的版本，就是1月份的那个版本呢，64K，这是没法跑，而且它对于工具的支持也不是很好。但是呢，到Deepseek R10528的时候呢，到128K了，够用吧，也不是特别够用。最好是256K或者是一兆以上的上下文，才会更好用一些。所以呢，它在这块呢稍微有些欠缺。然后到0528这个版本呢，它已经开始支持工具了，这块基本上可用。它的最大的问题还是上下文稍微不太够长。但是呢，DeepSeek R1输出的内容还是非常好的，输出的内容质量很高。它的Json的格式也是相对来说比较正确和完整的，就正确率很高。</p>



<p>千问3呢基本上是可以用的。千问3唯一的问题是什么？就是它输出的结果上，这是文字的东西呢，比Deepseek要单薄一些。另外一个现在国内比较好用的模型呢，是豆包1.6。推理过程比较长的时候，容易跑偏前头。比如推理五六步了以后，直接出结果，他有时候就直接出英文结果，这个就是稍微跑偏了一点点。</p>



<p>那你说我们现在有这么多模型：GPT4O、GPT4O Mini、Gemini 2.5 Pro、Gemini 2.5 Flash。这些版本之间，你去让它跑这个上下文工程，到底有什么区别呢？所有的这种大模型Pro版，或者是GPT4O这种完整版本，一定是效果最好的。但是呢，Flash版呢，它的速度会快一些，价格便宜一些。只是呢，你要给它复杂的上下文，或者要求它输出非常复杂上下文的时候呢，它有时候会丢东西，输出也不是很完整。</p>



<p>或者，你给他一个复杂上下文进来的时候，他也会有一部分就不考虑了。这个是会时有发生的。</p>



<p>如果你的工作相对来说比较简单，你输入的信息和输出的信息都没有那么复杂的话，可以尝试去使用 GPT-4o Mini 或者是 Gemini 2.5 Flash 这样的版本。</p>



<p>那么，上下文工程产出的结果到底是什么呢？其实很简单，就是 AI 应用可以稳定的输出能够解决特定问题的、有价值的 AI 应用。这就是上下文工程能干的活。</p>



<p>原来为什么很多 AI 应用下去不好使？因为每一次的输出非常不稳定，有时候灵，有时候不灵。那你在这种情况下就很麻烦，你不知道它哪次灵，哪次不灵。你输出的结果，你还得各种的校验，比如说容错呀什么的，这些东西都要去做。</p>



<p>再往下一步，比如其他的模型里去送的时候呢，你要在上一个结果输出的内容里头，再去挑选你真正需要的东西。这块就很麻烦。</p>



<p>现在的话，有了上下文工程之后，你可能没法要求说我输出的内容才华横溢，但是呢，基本上我是稳定的。我每一次都稳定的输出这样的一个东西。</p>



<p>那你说上下文工程是不是未来方向？是不是这个万能解药呢？赶快出个教材出去圈一圈钱去，或者说赶快去报个班我学一下。这个怎么说呢？下一批新名词还在路上。</p>



<p>在 AI 这个领域里头，日新月异，不停的有新名词出来。而且呢，模型及应用这件事呢，依然有效。</p>



<p>AI 应用当前的定位呢，还是比较尴尬。虽然有了上下文工程之后，很多的 AI 应用就可以去干活了，它真正有价值了，有稳定的输出了。但是上下文工程，只要带“工程”俩字，那就不是给普通人使了。</p>



<p>普通人就说我们看一看就行了。真的让你去写这种上下文工程，没有程序员的能力，基本上是搞不定的。</p>



<p>大模型最终呢，会通过自己的升级，让普通人可以通过闲聊的方式，实现上下文工程的稳定输出。这个最后是可以实现的。不是说你没有上下文工程的能力，你最后就解决不了。</p>



<p>但是现在的大模型还达不到这个能力。但是可能再过个一两年吧，这块应该是可以做到的。但是在这一两年里头，像我们这些程序员，就可以使用上下文工程做出一大堆的 AI 应用，把第一桶金挣回来。这就是上下文工程能够真正起的作用。</p>



<p>那么，上下文工程对于当前的行业有什么样的影响呢？落后的大模型服务商要抓紧升级了，方向已经确定了。</p>



<p>比如说扎克伯格，挖了这么多 OpenAI 的人，赶快干活，让你的 LLAMA 4 或者 LLAMA 4.5 吧，能够很好的在上下文工程里头干活。</p>



<p>比如说华为的盘古大模型，别光抄千问 2.5 了，把千问 3 抄一抄吧。</p>



<p>得把上下文工程跑通，否则的话，小粉红拿着你的这些模型也搭不出AI应用来。</p>



<p>还有就是像Deepseek，可能要进一步的拉长这个上下文。现在Gemini 2.5已经可以达到100万TOKEN，或者到200万TOKEN。LLAMA4其实TOKEN也很长，LLAMA4大概是可以到1,000万TOKEN，但是它对于原生的工具支持的确实要稍微差一些。这可能是未来一些大模型要去努力的方向。</p>



<p>第二个大批量的AI应用就会涌现出来了。一旦大家确定下来，上下文工程是未来做AI应用里的必经之路，这一块的话一定就会快速前进。而且这一次的AI应用做出来以后，它是真的能用的。原来很多人说：“我为什么做了半天最后不能用？”因为没有上下文工程，你的AI应用整个的输出过程是不可控的。或者你为了让它变得可控，让这整个的系统跑得非常慢、非常傻。</p>



<p>最终的结果是什么呢？就是英伟达的显卡又不够用了。为啥呢？新模型的训练需要英伟达，大量有用的AI应用的涌现需要英伟达，很多日常任务向AI应用的迁移需要英伟达，长上下文的吞吐还是需要英伟达。这可能就是现在上下文工程可以给我们带来的变化。</p>



<p>对于每一位听众来说，你说：“我是个程序员，我现在想去学点应用，赶快学起来，不学就落后了。”那你说：“我就是个普通人，你通过我今天讲这个故事，你也知道一下AI应用里头到底是咋干活的。如果产生的结果不对了，不是你所预期的结果了，可能是上面的6个部分和4步哪一步走错了。你稍微有一些逻辑，对于你去使用AI应用也会有很大帮助的。”</p>



<p>好，这个故事今天就讲到这里。感谢大家收听，请帮忙点赞、点小铃铛，参加<a href="https://discord.gg/ppKsNkttTv" target="_blank" rel="noopener">DISCORD讨论群</a>。也欢迎有兴趣、有能力的朋友加入我们的<a href="https://www.youtube.com/channel/UCUGLhcs3-3y_yhZZsgRzrzw/join" target="_blank" rel="noopener">付费频道</a>，再见！</p>



<p></p>
]]></content:encoded>
					
		
		
			</item>
		<item>
		<title>硅谷上演AI抢人大战！扎克伯格WhatsApp私信突袭，豪掷天价签字费疯狂从OpenAI挖人以求自保？Meta AI的背水一战，能行吗？</title>
		<link>https://lukefan.com/2025/07/02/%e7%a1%85%e8%b0%b7%e4%b8%8a%e6%bc%94ai%e6%8a%a2%e4%ba%ba%e5%a4%a7%e6%88%98%ef%bc%81%e6%89%8e%e5%85%8b%e4%bc%af%e6%a0%bcwhatsapp%e7%a7%81%e4%bf%a1%e7%aa%81%e8%a2%ad%ef%bc%8c%e8%b1%aa%e6%8e%b7%e5%a4%a9/</link>
		
		<dc:creator><![CDATA[Luke Fan]]></dc:creator>
		<pubDate>Wed, 02 Jul 2025 00:46:08 +0000</pubDate>
				<category><![CDATA[AIGC]]></category>
		<category><![CDATA[Meta的故事]]></category>
		<category><![CDATA[1亿美金签字费]]></category>
		<category><![CDATA[AI Agent]]></category>
		<category><![CDATA[AI人才战争]]></category>
		<category><![CDATA[AI团队重组]]></category>
		<category><![CDATA[Anthropic]]></category>
		<category><![CDATA[DeepSeek]]></category>
		<category><![CDATA[Facebook]]></category>
		<category><![CDATA[Kimi]]></category>
		<category><![CDATA[Llama 4失败]]></category>
		<category><![CDATA[Meta]]></category>
		<category><![CDATA[Meta与OpenAI]]></category>
		<category><![CDATA[MiniMax * 其他公司: 谷歌 (Google)]]></category>
		<category><![CDATA[OpenAI]]></category>
		<category><![CDATA[XAI]]></category>
		<category><![CDATA[人力资源 (HR)]]></category>
		<category><![CDATA[人工智能 (AI)]]></category>
		<category><![CDATA[企业文化]]></category>
		<category><![CDATA[元宇宙 (Metaverse)]]></category>
		<category><![CDATA[创新工厂 (Innovation Works)]]></category>
		<category><![CDATA[华为 (Huawei)]]></category>
		<category><![CDATA[员工挽留]]></category>
		<category><![CDATA[商业故事]]></category>
		<category><![CDATA[团队管理]]></category>
		<category><![CDATA[大语言模型 (LLM)]]></category>
		<category><![CDATA[山姆·奥特曼 (Sam Altman) AI模型: Llama 4]]></category>
		<category><![CDATA[开源模型]]></category>
		<category><![CDATA[战略方向]]></category>
		<category><![CDATA[扎克伯格 (Mark Zuckerberg)]]></category>
		<category><![CDATA[扎克伯格亲自下场]]></category>
		<category><![CDATA[招聘策略]]></category>
		<category><![CDATA[推理能力]]></category>
		<category><![CDATA[文心一言]]></category>
		<category><![CDATA[模型刷榜]]></category>
		<category><![CDATA[盛大 (Shanda)]]></category>
		<category><![CDATA[盛大故事]]></category>
		<category><![CDATA[硅谷文化]]></category>
		<category><![CDATA[科技巨头挖人]]></category>
		<category><![CDATA[科技评论]]></category>
		<category><![CDATA[算力竞争]]></category>
		<category><![CDATA[职场八卦]]></category>
		<category><![CDATA[股票期权]]></category>
		<category><![CDATA[腾讯 (Tencent)]]></category>
		<category><![CDATA[腾讯挖华为HR]]></category>
		<category><![CDATA[薪酬体系]]></category>
		<category><![CDATA[行业内幕]]></category>
		<category><![CDATA[行业分析]]></category>
		<category><![CDATA[谷歌Gemini]]></category>
		<category><![CDATA[金山 (Kingsoft)]]></category>
		<category><![CDATA[金山喝酒留人]]></category>
		<category><![CDATA[闭源模型]]></category>
		<category><![CDATA[阿里千问 (Qwen)]]></category>
		<guid isPermaLink="false">https://lukefan.com/?p=2351</guid>

					<description><![CDATA[啊啊啊啊啊！Meta这次真的杀疯了！1亿美金签字费直接砸下去，AI圈直接炸开锅！我一个普通打工人看到这个新闻，人都傻了！扎克伯格亲自下场，WhatsApp上直接联系OpenAI的大牛，开口就是“你好，我是扎克伯格，来聊聊跳槽吧”，这操作也太硬核了吧！谁能拒绝1亿美金啊？！OpenAI这次是真的被偷家了，山姆·奥特曼都出来喊疼了！

说真的，Meta这是急了！Llama4翻车翻得太惨，性能拉胯还被爆刷榜造假，AI开源大旗都被Deepseek和千问抢走了！曾经的开源之王，现在只能花重金挖人重建团队，143亿美金收购Scale AI股份，还要拉拢OpenAI的前CTO，这波操作我只能说：扎克伯格，你是真狠！

不过家人们，AI圈这场挖人大战可没那么简单！Meta挖人容易，整合难啊！挖回来一堆大牛，谁听谁的？方向不明确，元宇宙和AI还抢算力，这要是再内讧，怕不是一地鸡毛！而OpenAI也不是吃素的，赶紧加薪、配股票、放假，全力挽留人才，山姆·奥特曼还嘴硬说“挖走的不值1亿”，哈哈哈，这波嘴炮我给满分！

最后划重点：AI圈的资本大战，太刺激了！1亿美金签字费只是开始，未来还会有更多大招！家人们，你们觉得Meta能靠挖人翻身吗？还是OpenAI会笑到最后？快来评论区聊聊吧！顺便求大数据把我推给更多AI爱好者，我要和你们一起嗨！啊啊啊啊啊！

硅谷上演AI抢人大战！扎克伯格WhatsApp私信突袭，豪掷天价签字费疯狂从OpenAI挖人以求自保？Meta AI的背水一战，能行吗？

Meta正面临一场前所未有的AI危机，核心在于其寄予厚望的Llama 4彻底失败，不仅性能拉胯，更使其在开源大模型领域的领导地位岌岌可危。面对Deepseek与千问等新贵的强势崛起，扎克伯格亲自下场，掀起了一场席卷硅谷的AI人才抢人大战。他绕过原有AI团队，直接向OpenAI的核心员工开出天价签字费，试图通过疯狂挖人来快速重组队伍。这场风波不仅让曾被奉为大神的杨丽坤边缘化，更迫使OpenAI的山姆·奥特曼公开回应，全力安抚军心。这不仅仅是Meta与OpenAI的对决，更是继谷歌之后，整个行业对顶尖AI人才的激烈争夺，而扎克伯格此举，正是为了在AI的未来棋局中，为Meta夺回一线生机。]]></description>
										<content:encoded><![CDATA[
<figure class="wp-block-embed is-type-video is-provider-youtube wp-block-embed-youtube wp-embed-aspect-16-9 wp-has-aspect-ratio"><div class="wp-block-embed__wrapper">
<iframe title="硅谷上演AI抢人大战！扎克伯格WhatsApp私信突袭，豪掷天价签字费疯狂从OpenAI挖人以求自保？Meta AI的背水一战，能行吗？" width="900" height="506" src="https://www.youtube.com/embed/lLP7_OTtruY?feature=oembed" frameborder="0" allow="accelerometer; autoplay; clipboard-write; encrypted-media; gyroscope; picture-in-picture; web-share" referrerpolicy="strict-origin-when-cross-origin" allowfullscreen></iframe>
</div></figure>



<p>Meta急了，扎克伯格亲自下场疯狂挖人，重新组建AI团队。</p>



<p>大家好，欢迎收听<a href="https://youtube.com/@StoryTellerFan" target="_blank" rel="noopener">老范讲故事的YouTube频道</a>。Meta的1亿美金签字费最近成为了一个新梗。签字费什么意思？就是说我去挖人，你只要过来签个字，说我同意上班来了，1亿美金到手。这个又算是创造历史了吧。</p>



<p>现在AI呢，确实是资本最密集，和整个行业都在关注的一个点。所以Meta这样的一家美股七姐妹的公司，突然发现自己落后了，那就一定要赶快出来补救。而补救的方式的话，一亿美金签字费。</p>



<p>Meta呢，在Llama4上栽了一个大跟头，而且摔得非常非常惨。这个产品呢本来是寄以厚望的，因为Llama1、Llama2、Llama3，大家都是觉得非常成功。而且呢，Meta算是建立了一个自己的品牌。甭管是谷歌呀，Anthropic呀，OpenAI，你都是闭源，只有我是开源，而且我是开源圈的领军人物。其他的人只要是愿意用开源模型，必须以Llama为基础去干活去。至少在Llama2的这个阶段呢，它这个目标是实现了。就像当年的iOS跟安卓一样，iOS是闭源的，安卓是我开源，你只要惦记自己做手机，想要一操作系统，你就使我的。</p>



<span id="more-2351"></span>



<p>但是Llama4呢，就在这上摔了个大跟头。第一个是产品形态很落后，没有什么推理，也没有AI agent呀，这些东西都没有做出来。而且呢，他还把所有的小模型都放弃了。原来Llama1、Llama2、Llama3的时候，都是小模型、中模型、大模型，一系列的一起发出来，大家根据各自的需要去取用。拿着Llama模型回来，再去微调再去训练。到Llama4，给了个中型和大型，没有那种特别小的模型。那你说我现在需要在手机上、需要在电脑上去做相应的服务，做不了了。我想把这个Llama拿回来使不了了。</p>



<p>然后产品的性能也很拉胯。大家去测试Llama模型发现一般，还达不到现在普通的文字模型的水平，更不要说去跟这些推理模型去竞争了，根本竞争不过。而且Llama为了最后能够有一个好看的数据，还跑去刷榜造假。你说你事情做的不太好就算了吧，你还把人品毁了。</p>



<p>Meta这边立的这尊大神杨丽坤呢，每天都在研究一些很高深的东西，跟实际应用之间太遥远，上下完全脱节。Llama在最后的训练阶段，还在跟元宇宙部门抢算力。内部的方向呢也没有确定，所以他遇到了很多这样的问题。</p>



<p>Deepseek和千问呢，现在基本上算是在开源圈里头碾压Llama了。甭管是千问3的最新的模型……</p>



<p>还是说Deepseek R1的0528比这个Llama4肯定还是要强很多的。实际上，你都不需要这么新的模型，你就是Deepseek R1一月份的那个版本，应该是0120那个版本，就比Llama4要强。再加上推理模型都上来了，从小到大，从0.6B就开始做，一点几B、6B、30B、32B、七十几B全都做上来了。你需要各种各样的模型拿出来，去做微调、去做裁剪，都是可以去使用的。</p>



<p>Llama底下这些客户全放弃了以后，AI开源这面大旗Meta要扛不住了。现在旗子已经被Deepseek跟千问给挖走了。而且Deepseek跟千问出来以后，中国的各大团队现在都开始转向开源。Mini Max最新出的开源推理模型很强，Kimi现在也开始转向开源。曾经怒批开源没什么用的李彦宏，都把文心一言4.5最新的模型给开源了。而且下个月OpenAI还要推开源大模型，那在这样的情况下的话，Meta要危险。</p>



<p>遇到了这样的问题，就需要有人出来背锅。老大永远正确，因为老大一旦不正确的话，这个方向就错了嘛，这事肯定是不行的。所以第一个杨立坤，你就要边缘化了。原来你是一尊大神，我们把你供在这儿，结果呢发现你对于实际开发、实际应用来说，差的有点太远了。大神呢，也不会把他轰走，就是留在这儿。具体的事情，杨立坤你就别说话，别动了。</p>



<p>Meta AI的人呢，要为上一次Llama4的失败负责任。这些人就开始大面积离职。做Llama训练的时候还去关注元宇宙，还让元宇宙去抢算力，这事扎克伯格就不讲了。老大呢，亲自就要下场重新组建团队。因为一旦说老大下去了，说我要开始越过原来的AI团队去招募人了，那原来AI团队的整个的体系就全都废掉了。</p>



<p>在这个过程中，143亿美金收购了独角兽Scale AI 49%的无投票权股票，让Alexandra Wang进来，帮他一起去组建新的AI团队。而且在这个过程中呢，还尝试收购伊利尔的SSI，最后失败了，谈了半天人家没进来。还尝试去投资OpenAI原来那个美女CTO米拉，要去投资他的公司，后来也失败了，人家没要他的钱。</p>



<p>扎克伯格挖人，据说是直接通过WhatsApp就去联系去了。WhatsApp反正是Meta他们家的。一些OpenAI的高级研发人员据说是直接接到了扎克伯格的WhatsApp联系。大家注意，WhatsApp跟微信不太一样，微信你是必须要先加好友才能联系到的。</p>



<p>WhatsApp是可以直接冲上去联系的。你不需要加好友，这个东西更像是短信。只是说我不认识你，我冲上来跟你联系了，你可以举报说这个人是骚扰，或者是垃圾的短信，他会把这个号封了。但是你们不用担心，扎克伯格的号会不会被封？自己家的产品，所以他可以开开心心地出去给人发说：“哎，你好，我是扎克伯格，来咱们聊一聊换工作的事情吧。”</p>



<p>人才之间呢，其实是有关联的，经常是一挖一大串。像扎克伯格这样的人下去挖人呢，不会去下场挖程序员的。老大挖的人呢，通常是要求有能力自己组建团队的。他为什么想去收购伊利尔的项目呢？伊利尔原来是OpenAI的创始团队，如果是把伊利尔的项目收回来，你不用干任何事，上OpenAI挖人去就完了。他为什么惦记去把Mira的这个团队弄回来呢？Mira原来是OpenAI的CTO，他如果过来了，OpenAI里头到底哪个人能干，哪个人不能干，这都很熟悉。就这两个人吧，在OpenAI里头都是很有号召力的，那他只要进来，就基本上可以抄底了。</p>



<p>在这里呢，跟大家稍微补充一个小故事吧。就是腾讯早年发家的时候呢，他们也是出去挖人嘛，挖什么人呢？是不是挖了哪个大神回来，就把这个人家整个团队都端回来了？不是这样的。腾讯的这个操作要更骚一点，他们呢，去把华为的HR给挖回来了。你说一个公司里头，谁最了解上上下下，谁能干谁不能干，谁在里边具体干什么？肯定是HR要比各种leader更了解。所以腾讯在早期发家的时候，就挖回来了华为的HR。现在腾讯里边还有很多早期的高管，都是从华为过来的。扎克伯格没去挖HR，还算是稍微有一点点节操的。</p>



<p>盛大呢，早期其实也干过类似这种事情。我们那个时候是挖谁的人呢？挖创新工厂的人。当时呢，是创新工厂刚搬完家，李开复在这点呢，还是不太有经验。他呢，搬完了新的办公室以后，就把原来那个办公室给留那了，各种的东西收拾的也不是很干净。盛大的HR就直接冲上去，把所有的工牌、你座位上的剩的名片全都给收走了。收回来以后呢，就在创新工厂的楼下挨着个给人打电话。当时我记得他们楼下是一咖啡馆，我们大概是派了4个各个部门的负责人，加上HR一起，跟他们开始聊。聊得好的，HR在后面去谈工资待遇；聊得不好的就拉倒。因为创新工厂当时呢，都是学生兵，很多是没有毕业的研究生，他们的薪资是很低的。所以盛大当时挖完人，都是上来说：“我给你两倍三倍的薪水。”那个效果非常非常好。而且盛大挖完了以后呢，还在圈子里四处宣传。</p>



<p>说创新工厂的人实在好，干劲十足，能力非常非常强，性价比非常高。盛大宣传了以后呢，后来还有很多的其他互联网公司也跑去挖人，当时给创新工厂还是造成了一点点小的困扰的。</p>



<p>这一次呢，Meta挖人，OpenAI就成为了首要的目标。OpenAI作为行业的领军人物，挖人肯定是上他那去挖。而且OpenAI呢，这么长时间来，其实一直都是各个基金拉人去创业，或者其他大公司需要挖人回来做AI，他这一直都是众矢之的。只是这一次，为什么OpenAI出来喊疼来了？因为这个1亿美金的签字费，确实是非常狠，大家都没见过。</p>



<p>OpenAI呢，人足够多，也足够好。像其他的比如像Anthropic，还有XAI，人不多，都在老板眼皮底下，少任何一个老板马上就看见了。特别是你要挖马斯克的人，马斯克会跟你急的。所以，这两个公司目前并没有成为这一次Meta挖人的主要的受害人。至于谷歌的话，人太多，走几个根本看不出来。所以这次真正出来喊疼的人，就是OpenAI。</p>



<p>OpenAI自己呢，其实也挖别人的人。他原来主要挖谷歌的人。OpenAI出去挖人的时候呢，主要靠的是高估值和高股票。直接挖什么意思呢？OpenAI自己估值很高，3,000亿美金。那你说给薪水，他肯定给不了那么多。但是你说我给你配股票，我公司的估值很高，我就可以给你配一个很高的股票出来。他通过这样的方式就可以挖谷歌的人，挖一些其他的互联网大厂的人。原来包括像马斯克都出来抱怨，说OpenAI你就趁着你估值高，拿一些现在没法变现的东西，就出去挖人去，这个太过分了。</p>



<p>现在呢，就赶上OpenAI被挖了。那你说为什么Meta挖他的人就这么痛快呢？OpenAI再怎么着，你估值也就是3,000亿美金吧。Meta是一个市值1.2万亿美金的公司，是OpenAI的4倍。而且呢，Meta是上市公司，它那个股票是可以上市流通的。而OpenAI的股票虽然价值很高，但是OpenAI这样的一个公司，到现在上头还有一个非营利组织呢。你最后到底能不能上市，谁也不知道。所以Meta挖OpenAI的人，真的是叫以其人之道还治其人之身，而且真的是要比OpenAI要狠得多。</p>



<p>OpenAI这次的应对呢，也非常有意思。原来大家不停的挖他的人，他其实也没说什么。他肯定自己也觉得很不爽。我记得曾经听过一个朋友去讲什么呢？就是山姆·奥特曼曾经想过说，把OpenAI整个公司搬到印尼巴厘岛去。说为什么呢？</p>



<p>一方面呢，是当时山姆·奥特曼访问印尼时，大家出来说了一些场面话：“你们这风景真好，生活很舒适，我们想把OpenAI整个搬过来。”</p>



<p>另外一个原因是什么呢？这儿不挨着硅谷的公司，也不会有那么多人来挖人。这应该是山姆·奥特曼在印尼参加一些会议时亲口说的话，所以他一直也有这样的顾虑。</p>



<p>这一次，Meta以1亿美金签字费开始挖人时，山姆·奥特曼先出来说了什么呢？他说：“这个事情我们知道了，但到目前为止，我们最好的人都没有被挖走。”这话就属于比较诛心，什么意思？就是你挖走的人不值这钱。那你说，留下来的人怎么想？去了的人怎么想？</p>



<p>比如像扎克伯格说：“我花了1亿美金把人挖回来了。”然后山姆·奥特曼说：“正好我不要的你弄走了。”那你说扎克伯格是不是像吃了苍蝇一样不舒服？</p>



<p>但是，挖了几天之后，确实有一帮人走了，下面的人就开始受不了了，感觉被偷家了，于是他们决定要做一些事情：<br>1. 重新评估薪资，多给钱，多配股票。<br>2. 增加休假时间，因为OpenAI也很卷。</p>



<p>这么多产品要发布，而且要求每个月都要有新的重量级产品发出来。去年12月份的连续12天产品发布会，最后被人嘲笑说不够重量，1月份直接被Deepseek刷下去了。Deepseek发布以后，OpenAI现在每个月再开出来的发布会，东西就多多了，再也没有挤牙膏的感觉了。</p>



<p>你想，他每个月都要发东西出来，那对于下面的研发人员来说，是多么辛苦的一个事情。现在OpenAI说：“我们稍微缓一缓，不能被这个产品节奏带着走，我们还是该休假休假，然后好好去做AGI，而不是在每一个产品线路上都要去胜利。”</p>



<p>大家要仔细思考一下这件事情，而且呢，OpenAI还说：“你们谁接到了扎克伯格的WhatsApp连接，就赶快跟我们聊聊，我们一对一谈，全力挽留。”</p>



<p>最后再跟大家补充一个小故事吧：以前金山集团每年春节之后会有一个喝酒局。为什么呢？金山其实在整个中国软件界很有名，就是他的软件人才能力很强，而且工资不高。所以每年都有很多想要向软件方向发展的公司跑到金山去挖人，而挖人通常会集中在春节之后。</p>



<p>春节之前去挖，这些人还没有拿到年终奖呢，你到底是给他补年终奖，还是说一些拿不到年终奖的人带回来？肯定是要等春节之后，这些人拿到年终奖以后再去挖人。</p>



<p>所以呢，当时这个金山就有这样的一个传统，就是喝酒留人。每次到春节之后了，有些人就要提离职，说我要离职了，我要去做其他事情了。然后金山的人就去喝酒，他们也没有别的办法，因为这么大的公司呢，也没法给你涨薪水。那么就是喝酒，一直喝的你五迷三道了，还要不要走？说这个还要走？没说没喝好，接着喝。再喝一会说，你现在还想走吗？还想走？还没喝好，再接着喝。再喝一会说，你还想走吗？不走了，不走了。行了，你已经喝好了，咱们就这样了。这个是原来这个传统。</p>



<p>但是在OpenAI发的内部信里头，有一条我觉得非常有意思，强调公平。什么意思呢？不是说有人挖谁了，你就可以在竞争中胜过别人。你比如两个人在竞争一个职位，有一个人有可能胜出，另外一个人呢就肯定要走嘛。你不能说，我要跟你谈一谈，你要不给我晋升的话，不让我得到这个新的职位的话，我就跳槽。你不能拿这玩意要挟他们，专门写了这样一条出来，我觉得非常有意思。</p>



<p>在资本密集的方向呢，挖人大战本身是挺正常的。在硅谷里头，每过几年就会干一次这样的事情。一旦有什么资本密集的方向，大家就冲上去挖，包括Meta自己其实也被人挖过。当然原来最主要的一个被人挖的是谁呢？是谷歌。这次OpenAI是终于站在谷歌前面了。实际上这一次谷歌也在被人挖，只是人比较多，所以看不太出来。</p>



<p>人挖回来以后呢，也不是说我把人挖回来就可以干活了。刚才我讲了，扎克伯格挖的人，都要自己能够组建团队。那你说挖了一堆人回来，组建一堆团队，谁听谁的呀？所以挖回来的人还要进行磨合和整合，否则的话可能只会剩一地鸡毛。我们见过很多这种，特别着急冲出去挖人，挖完了以后，发现最后不是那么匹配，搞不定这个事情的是大有人在的。</p>



<p>而且Meta现在这个状态呢，其实最着急的，并不是说挖一大堆人回来，组建一大堆团队。他现在最关键要做的事情，是赶快确认方向。那你说Meta不就是要做AI吗？还要确认什么方向？你元宇宙还玩不玩了？还会不会出现这个需要训练大模型的时候，跟元宇宙抢算力这种事情？因为你不但是要抢算力，你还要抢人，抢各种各样的资源。而且你只要做元宇宙，那你说我到底是做基础模型，是做推理还是先去研究，我怎么再把大模型运用在你的元宇宙里头？所以这个里头，他们第一个是要去确认的。</p>



<p>下边呢，是开源。你还做不做？是不是继续在开源这条路上往前走？因为在开源这个领域里头，他已经不是老大了。你要再想把这个老大的牌子抢回来，没有那么容易了。</p>



<p>再往后，AI的独立产品、AI API的这些服务到底怎么个去做法？现在一直没有一个特别明确的方向出来。AI agent怎么落地？这一块煤台已经完全落后了。AI跟现有的产品线到底怎么整合？这个也需要思考。</p>



<p>其实你们看谷歌，谷歌一开始也是说，我们做一大堆的AI的模型，而且是各个部门分开做。后来说不必一定要把它拧在一起，最后形成一个叫Gemini的产品。Gemini出来的时候，一开始说是不是大家都去接呀？最后说算了，咱也别都接了，咱们就是Gemini是Gemini。等Gemini彻底做到，比如到2.0、2.5以后，再去跟各个产品去集成去。否则一堆人下来去提需求，说我们希望你这么接，我希望你那么接，他又实现不了，还影响人家训练大模型的进度。所以现在Gemini在开始向Workspace、Gmail所有的这个领域里头渗透了。</p>



<p>OpenAI站在这个位置上，被人挖是挺正常的。如何平衡内部的机制，确保产品的节奏和方向不出问题？这就是OpenAI应该去做的事情。这就是当前资本最密集的AIGC领域里头，正在发生的抢人大战的故事。</p>



<p>好，这个故事今天就跟大家讲到这里。感谢大家收听，请帮忙点赞、点小铃铛，参加<a href="https://discord.gg/ppKsNkttTv" target="_blank" rel="noopener">DISCORD讨论群</a>。也欢迎有兴趣、有能力的朋友加入我们的<a href="https://www.youtube.com/channel/UCUGLhcs3-3y_yhZZsgRzrzw/join" target="_blank" rel="noopener">付费频道</a>。再见。</p>



<p></p>
]]></content:encoded>
					
		
		
			</item>
		<item>
		<title>“美国严选”再添新丁？阿里苹果AI联姻触动华盛顿敏感神经，高调合作反成众矢之的，iPhone在华Apple Intelligence之路是否已提前梦碎？</title>
		<link>https://lukefan.com/2025/05/21/%e7%be%8e%e5%9b%bd%e4%b8%a5%e9%80%89%e5%86%8d%e6%b7%bb%e6%96%b0%e4%b8%81%ef%bc%9f%e9%98%bf%e9%87%8c%e8%8b%b9%e6%9e%9cai%e8%81%94%e5%a7%bb%e8%a7%a6%e5%8a%a8%e5%8d%8e%e7%9b%9b%e9%a1%bf/</link>
		
		<dc:creator><![CDATA[Luke Fan]]></dc:creator>
		<pubDate>Wed, 21 May 2025 00:47:47 +0000</pubDate>
				<category><![CDATA[AIGC]]></category>
		<category><![CDATA[Apple的故事]]></category>
		<category><![CDATA[阿里巴巴的故事]]></category>
		<category><![CDATA[马云和阿里的故事]]></category>
		<category><![CDATA[AI合作]]></category>
		<category><![CDATA[Apple Intelligence]]></category>
		<category><![CDATA[DeepSeek]]></category>
		<category><![CDATA[Gemini]]></category>
		<category><![CDATA[iPhone]]></category>
		<category><![CDATA[Meta (LLAMA3)]]></category>
		<category><![CDATA[Momenta]]></category>
		<category><![CDATA[OpenAI]]></category>
		<category><![CDATA[YouTube频道]]></category>
		<category><![CDATA[中国市场]]></category>
		<category><![CDATA[中美关系]]></category>
		<category><![CDATA[中美科技战]]></category>
		<category><![CDATA[云计算]]></category>
		<category><![CDATA[人工智能 (AI)]]></category>
		<category><![CDATA[众议院中国事务特别委员会]]></category>
		<category><![CDATA[供应链风险]]></category>
		<category><![CDATA[内容审查]]></category>
		<category><![CDATA[军民融合]]></category>
		<category><![CDATA[出口管制]]></category>
		<category><![CDATA[千问 (阿里AI)]]></category>
		<category><![CDATA[华为]]></category>
		<category><![CDATA[国家安全]]></category>
		<category><![CDATA[地缘政治]]></category>
		<category><![CDATA[大语言模型 (LLM)]]></category>
		<category><![CDATA[实体名单]]></category>
		<category><![CDATA[微软 (Microsoft)]]></category>
		<category><![CDATA[情报委员会]]></category>
		<category><![CDATA[技术转让]]></category>
		<category><![CDATA[数字主权]]></category>
		<category><![CDATA[数据安全]]></category>
		<category><![CDATA[时事评论]]></category>
		<category><![CDATA[滴滴自动驾驶]]></category>
		<category><![CDATA[白宫]]></category>
		<category><![CDATA[百度AI]]></category>
		<category><![CDATA[科技分析]]></category>
		<category><![CDATA[科技脱钩]]></category>
		<category><![CDATA[美国严选]]></category>
		<category><![CDATA[美国制裁]]></category>
		<category><![CDATA[美国国会]]></category>
		<category><![CDATA[美国审查]]></category>
		<category><![CDATA[老范讲故事]]></category>
		<category><![CDATA[聊天机器人]]></category>
		<category><![CDATA[英伟达 (Nvidia)]]></category>
		<category><![CDATA[苹果]]></category>
		<category><![CDATA[苹果AI中国落地]]></category>
		<category><![CDATA[谷歌 (Google)]]></category>
		<category><![CDATA[财经观察]]></category>
		<category><![CDATA[贸易管制]]></category>
		<category><![CDATA[阿里巴巴]]></category>
		<guid isPermaLink="false">https://lukefan.com/?p=2214</guid>

					<description><![CDATA[家人们，救命啊！我今天刷到一条新闻，差点没把我气炸！苹果跟阿里的AI合作，原本说要让咱们中国的iPhone用户用上Apple Intelligence，结果呢？被美国政府卡脖子了！审查来审查去，到现在都没通过，iPhone新功能眼看着要黄了，我真的要哭了啊啊啊啊！😭

这事儿咋回事呢？简单来说，美国那边担心阿里会“偷”苹果的数据，还怕阿里用这些数据训练AI大模型，增强中国AI实力，甚至扯到什么“国家安全”问题。拜托，苹果的数据不早就在中国存储了吗？云上贵州了解一下？现在又双标说担心数据安全，真的绝了！

再说了，OpenAI、谷歌不也在用用户数据训练模型吗？咋没见你们审查他们？阿里跟苹果合作就成了“不当优势”，这逻辑我真是服了！还有人担心阿里AI有内容审查，影响“言论自由”，但哪个国家的AI工具没点限制啊？美国自己的AI不也有限制吗？双标得太明显了吧！

最惨的还是咱们中国用户！iPhone销量在中国已经下滑了，大家都在等Apple Intelligence这个新功能救场，结果现在卡在这儿，苹果也是望眼欲穿，咱们更是心急如焚！如果阿里真被美国列入什么“实体清单”，合作直接终止，那iPhone在中国还咋卖啊？！

家人们，你们说这事儿咋办？苹果会不会找别的中国AI公司合作？还是说咱们就这么干等着？评论区聊聊吧，我真的要被急死了！顺便提醒一句，苹果用户们，赶紧关注这事儿，别到时候新功能没了还不知道！都给我冲，点赞收藏，咱们一起吃瓜看后续！💥

“美国严选”再添新丁？阿里苹果AI联姻触动华盛顿敏感神经，高调合作反成众矢之的，iPhone在华Apple Intelligence之路是否已提前梦碎？

美国政府正严密审查苹果与阿里巴巴的AI合作计划，核心担忧围绕用户数据安全、关键AI技术转让（担心阿里借此提升AI大模型能力）、内容审查机制以及潜在的国家安全与军民融合风险，甚至考虑将阿里列入实体名单，此举或将导致苹果Apple Intelligence在华落地严重受阻，进一步冲击iPhone在华销量。这场审查风波不仅是中美AI竞争加剧的体现，也让高调宣布合作的阿里意外成为“美国严选”的焦点，与其形成对比的是，此前传闻与苹果合作的百度则相对低调未受同等关注。尽管如此，DeepSeek、千问等中国AI技术及百度阿波罗、滴滴自动驾驶等应用已不同程度在美国市场渗透，显示了中国AI的竞争力。若合作受阻，苹果在华AI战略将面临重大挑战。
]]></description>
										<content:encoded><![CDATA[
<figure class="wp-block-embed is-type-video is-provider-youtube wp-block-embed-youtube wp-embed-aspect-16-9 wp-has-aspect-ratio"><div class="wp-block-embed__wrapper">
<iframe loading="lazy" title="“美国严选”再添新丁？阿里苹果AI联姻触动华盛顿敏感神经，高调合作反成众矢之的，iPhone在华Apple Intelligence之路是否已提前梦碎？" width="900" height="506" src="https://www.youtube.com/embed/2u784etRbFo?feature=oembed" frameborder="0" allow="accelerometer; autoplay; clipboard-write; encrypted-media; gyroscope; picture-in-picture; web-share" referrerpolicy="strict-origin-when-cross-origin" allowfullscreen></iframe>
</div></figure>



<p>美国还在审核阿里跟苹果之间的AI合作，准备将阿里放入实体名单。这到底是怎么回事？</p>



<p>大家好，欢迎收听老范讲故事的YouTube频道。今天咱们来讲一讲，媒体爆料苹果跟阿里的合作一直都在接受审查，到现在也没过关。阿里传出跟苹果进行AI方面的合作之后，算是正式转换赛道，从电商转到了AI和云计算。股价呢，也有所体现。国内呢，也一直在等待可以在国内使用Apple Intelligence的那个版本，结果发现这事儿想简单了。</p>



<p>5月17号，《纽约时报》就出来报道了。到5月19号，彭博社再次确认，美国政府一直在审查苹果跟阿里之间的合作，认为可能是有问题的。那么到底是谁在审查呢？这个事实际上美国政府真的是从头就操碎了心。</p>



<p>2月份宣布的阿里巴巴宣布跟苹果进行AI合作以后，美国白宫和国会多个机构就在持续关注此事。因为美国国会甭管是参院还是众院呢，它里边是一大堆的委员会。有好几个委员会说，这事我们要关注一下，尤其是众议院中国事务特别委员会。在2025年3月的会议上，直接询问苹果的高管：“你们到底咋合作的呀？你跟我讲一讲，别被黄毛骗了呀。”国防部和情报官员呢，也对合作涉及的技术风险展开了审查。</p>



<span id="more-2214"></span>



<p>特朗普政府讨论将阿里巴巴列入贸易管制黑名单，禁止其与美国公司合作。白宫官员和美国众议院对华事务专属委员会成员在2025年5月对苹果计划与阿里巴巴合作将其AI技术引入中国一事进行调查。美国国会众议员拉贾·克里希纳莫西，他呢是美国众议院情报常设委员会民主党首席议员，更直接发声。他说啥呢？说阿里巴巴是中国军民融合战略的典型代表，对于苹果不透明的合作协议表示极度不安，说阿里巴巴是做军民融合的。这个帽子就扣的比较大了。</p>



<p>那美国人到底怕什么呢？苹果自己的AI能力到底怎么样，苹果自己也清楚。可能美国这些政府官员和参议员不知道吧。即使在中国这么多AI企业里头，苹果的AI能力应该也排不到前边去，别说跟阿里比了，跟DeepSeek、跟字节，甚至我估计跟百度，他都未必能比得过。这样的一个合作，你还担心中国人偷你的技术吗？</p>



<p>他们大概率也不是担心阿里偷苹果的技术。他们担心几件事：第一个呢是用户数据安全和监管合规的问题。美国官员质疑苹果与阿里巴巴的合作是否会导致中国方面接触到苹果的用户数据，有多少用户数据将共享给阿里巴巴？苹果是否向中国监管机构做出了任何承诺？苹果是否会因合作而受制于中国的数据法规？</p>



<p>将用户数据存储在中国，并与中国政府共享。我觉得这个事想多了吧？苹果在中国的数据本来就存在中国的呀，应该是存在云上贵州吧。在一些大的岩洞里边建立服务器，我们的国内的iCloud账号里边的信息都是存在那的，这个一直都是这样的呀。</p>



<p>至于中国政府到底能够读到哪些，这个就没有向外公开过了。反正大家也不说，中国政府也不去显摆这个，苹果呢也不会出来说说。我们这个东西到底是明码存的，还是什么样存的？中国政府找我要的时候到底给不给他？这件事呢属于大家就不讨论就完了。</p>



<p>但是你在中国卖苹果手机，你肯定还是要符合中国法规的。所以现在美国这些众议员们又以此为借口把这事摁下来了。还担心什么呢？就是技术转让与中方AI能力提升。他们呢，倒不是说苹果有什么技术可以转移给阿里巴巴，而是担心阿里巴巴会利用中国苹果用户的数据进行训练，使自己的千万大模型能力提升。这样呢会让中国公司借助苹果拓展AI技术，从而在中美AI竞争中获胜。</p>



<p>我觉得这种担忧还是可以有一点点的，但是别想太多了。你像苹果跟OpenAI合作，安卓手机里边天生装的就是Gemini，也都在训练。Gemini你也不让我使，OpenAI你也不让我使，那中国用户的数据我们也得找地儿去训练去，我们也要提升AI能力，阿里巴巴就要来干这件事情。</p>



<p>美国政府说，我还担心。国会情报委议员克里希纳莫西指出，合作可能帮助阿里收集更多的数据来优化其模型，使中国的AI企业获得不当优势。这个怎么就不当了呢？我一直没想明白。OpenAI拿苹果的数据去训练，谷歌拿安卓的数据去训练，就没有不当了。他跟阿里签了协议，跟阿里合作，阿里拿了苹果的数据去训练，这个事就叫不当了？这个是美国人的一些比较奇怪的双标思路吧。</p>



<p>然后还担心内容审查和言论控制。阿里巴巴的聊天机器人和大模型都带有审查限制，苹果将阿里的AI引入iPhone会扩大中国受审查的AI服务的影响范围，内置中国的内容过滤规则，影响言论自由，影响信息自由的流动。</p>



<p>在任何一个国家，你去上这种AI聊天工具的话，当地都是有法律规定的。至于哪个国家的法律要求的更严格一些，有些要求的松一些，这个是各个国家不一样。美国的这些聊天工具他也不能胡说八道，也是有限制的。OpenAI在这一块的限制一点都不比阿里巴巴的松，只是大家限制的东西不一样而已。你比如到OpenAI上，你说你给我画一个美国总统，他也不给你画。你到阿里巴巴这……</p>



<p>你说你给我画一个美国总统，我们就给你画。在这块时候，我们还比你松一点。但是另外一块，你说我们画一个中国的什么领导人，阿里这事他就不干了。那这个我觉得没有什么可讲的嘛。苹果在全世界卖，遵守全世界各个国家的法律法规就好了。</p>



<p>最后呢，他还担心苹果受中国法律约束的一个程度，会不会发生变化，是不是会加深苹果暴露在中国法律，包括审查和数据分享要求下的这种程度。苹果为了在华部署AI，不得不严格遵守中国关于内容监管和数据存储的法规。难道说苹果原来就违法吗？这帽子不能乱扣。苹果说我一直都是守法公民，中国政府要求什么，全世界各国政府要求什么，我一直都遵纪守法，这个我们不打折扣的。这块也是美国政府提出的一个担忧吧。</p>



<p>最后呢，就是国家安全和军民融合了。跟中国政府的关系极为紧密，担心这种合作会增长中国军民两用技术的发展。这件事情呢，OpenAI不跟美军合作吗？谷歌不跟美军合作吗？哪个AI公司不惦记去签点军方大单回来？这个阿里可能想去签都未必签得上，因为后边还有华为，还有一堆人比阿里更加的又红又专，未必轮得上他。反正美国人就会喜欢去讲这些事情吧。</p>



<p>美国担心中国企业在获取先进AI技术后，可能服务于中国军方或者情报部门。我觉得这个不需要你去担心了。我们在当时见过一些军方使用的或者情报部门使用的AI大模型，它底层的不是阿里的，底层的是Meta的，是LLAMA3。当时是用LLAMA3的模型进行的微调，就可以为这些情报部门使用了。所以我觉得你们先回去查自己吧，不用着急去查千问。</p>



<p>那美国人准备怎么解决这个问题呢？第一个是信息审查和质询。美国官员已经直接与苹果公司接触，要求其说明合作细节，来跟我讲讲你到底咋合作的，有关数据分享和监管承诺的问题。如果苹果无法令政府信服，美方可能会提升审查力度。现在就是审查力度还没有特别高，只是我还没给你审过，大概这样一个状态。</p>



<p>再往后就是纳入出口管制实体名单。美国官员正在考虑将包括阿里巴巴在内的中国AI企业列入限制清单，禁止美国公司与其合作。一旦阿里巴巴被列入，该合作可能被迫终止，或者需要美国政府特批许可。现在的话，美国只是在质询这件事，并没有说直接就叫停这个事。</p>



<p>如果这个事情被叫停了，真正倒霉的是谁？真正倒霉的应该是苹果自己。为啥？没有Apple Intelligence，iPhone在中国不好卖。iPhone现在在中国的销量在快速的下滑，大家都在等他说。</p>



<p>到底哪一个版本能用？18.4、18.5、18.6，到底哪个版本我们能用上中国版的Apple Intelligence呢？而且在这一段时间里头，千问3还推出了千问，各种的聊天工具的性能、各种的功能在快速的提升。我们已经很期待了，说赶快把这东西弄到苹果手机里，让我用起来，结果卡这了。这个苹果也是望眼欲穿。</p>



<p>有人说了，那百度为啥没事？原来不是号称要跟百度合作吗？百度咋就没受到审查呢？怎么阿里就受到审查了呢？这个玩意呢，最近在国内有一个很特殊的名词，叫“美国严选”，就跟东方甄选或者是网易严选跟这个名字一样，叫美国严选。还分美国国防部严选、白宫严选、参众两院各个委员会的严选。什么意思呢？就是你到底被美国哪个机构列入进到这个严选清单里去了，他去审查你了。一旦发现哪个产品被美国列入严选了，这一定是好产品。就跟以前中国把什么样的服务封掉了，一定是个好服务一样的。现在反过来了，美国封咱们什么什么就好。</p>



<p>这一次呢，阿里被针对，其实还有一个挺主要的原因是什么？就是太高调了。百度前面传出跟苹果进行合作的时候，百度啥也没说，直接就被负面淹没了，说百度做的烂东西你们也用。现在百度也没有进到美国严选里去，大家一看，这百度的东西确实不行，不愿意理你。阿里进去了，阿里是好样的。而且呢，阿里在跟苹果进行合作的时候，阿里高层进公开去确认去了，而且高调四处宣传，引起了美方的关注。属于事还没干成呢，他就四处出去宣传去了，股价就开始涨了，美国人就看到了。这个是这一次主要被关注的一个原因。不知道是不是有哪位议员做空阿里，被套牢了或者被平仓了，所以满怀的怒火，就一定要把你好好审查一下。</p>



<p>百度在这一次的合作里头呢依然在，就是跟苹果合作Apple Intelligence在中国的落地，百度还在，并不是彻底出局了。但是百度呢，主要的合作范围应该是图片相关领域。而阿里呢则是需要负责帮助苹果解决AI入华的审核和牌照申请问题。所以阿里去宣传了，然后被人盯上了。美国官员就听说阿里，没听说过百度，这种可能性也是存在的。因为百度呢，最主要的工作都是在中国境内，它是中国最大的搜索引擎，号称是中国第一的AI大模型，反正至少李彦宏是这么认为的。但是阿里肯定是给美国这些议员们留下了比较深刻的印象，因为有电商嘛，大量的阿里Express，就是速卖通，把很多很多的商品输送到美国去，美国人一定会听说过它，然后出现了苹果跟阿里合作。</p>



<p>这样的高调新闻之后，就被拎出来审查一下。阿里就有幸进入了白宫严选、国防部严选、众议院中国委员会严选、情报委员会严选，都进去了。那么，到底有哪些中国的AI产品被美国公司使用了呢？阿里肯定不是头一个，一定还有很多其他的中国公司的AI产品在被美国使用。</p>



<p>用的比较广泛的呢，应该是DeepSeek。DeepSeek R1推出了以后，美国各大AI厂商或者AI服务商、云服务商，都把这东西部署到自己的服务器上了，包括微软也在微软云上部署了DeepSeek。基本上，这种开放云服务商都部署了DeepSeek。还有很多人，在DeepSeek的基础上进行了微调，比如Perplexity，专门在DeepSeek的基础上重新进行了微调，来供他自己使用。英伟达也在他们美国的服务器上专门部署了DeepSeek来对外服务。</p>



<p>千问更是很多人在去使用了，因为美国也有非常多的大模型是在千问开源模型的基础上微调出来的。这两家肯定是用的比较多的。另外用的比较多的是什么呢？就是自动驾驶方面的AI，在美国还是有落地的。</p>



<p>第一个是百度，百度阿波罗。百度自2017年起就在美国加州开展了自动驾驶测试，他们的阿波罗2.0系统曾经在Sunnyvale进行了开放道路测试。2021年，百度获得了加州DMV颁发的无人驾驶测试许可，允许在San Clara进行全天候测试。但是目前呢，尚没有推出公众的服务，就是现在还在测试。</p>



<p>滴滴自动驾驶也是在2017年在硅谷成立，2018年获得了加州路测许可。Momenta是一个专门做自动驾驶的公司，Momenta与Uber合作，2026年就要推出在欧洲可以工作的Robotaxi服务。这个其实有点像前面阿里跟苹果的这种合作，苹果说我在全世界都用OpenAI，到中国我们去使用阿里千问。Uber说我以后要到欧洲去使用Momenta。</p>



<p>美国市场呢，倒是没有听说Momenta要去落地。但是呢，通用汽车、丰田汽车这些车企里边使用的自动驾驶系统，都是使用的Momenta的。而且Momenta好像是丰田投资的一个项目，这里头有一个很重要的股东就是丰田。所以这些项目都是在美国有合作、有落地的。</p>



<p>那么，不要太高调。太高调了以后，就会被这些原来不太理这些科技事宜的议员们盯上。最后总结一下，美国政府针对苹果使用阿里AI落地中国这件事情目前还在审计，什么时候能够通过依然不知道。</p>



<p>他们呢，主要担心的是阿里利用苹果数据提升AI能力，有可能会将阿里放入某个实体清单。不是像华为那样的实体清单，它可能就是一些AI实体清单。就是说，你以后不可以跟美国公司进行AI方面的合作，有可能会进行这样的处罚。</p>



<p>但是呢，在阿里跟苹果合作的前后吧，其实有很多的中国AI项目都在跟美国公司进行合作。只是阿里稍微有些高调，而且呢确实做的也不错，所以这一次进入了美国严选。</p>



<p>这一次真正要倒霉的是谁？是苹果。苹果现在真是多事之秋，原来好好的在中国生产，在全世界卖。然后就开始吭哧瘪肚的把生产线往越南、往印度去搬。搬了一半了，川大爷出来说了：“苹果，我讨厌你！你怎么可以把生产线搬到印度去呢？你应该搬回国来。”</p>



<p>苹果现在也是不知道该咋办呢，说我到底是接着往印度搬，还是说就这样了呀？美国人也不希望使用印度生产的iPhone，他们也说还是想使中国生产的iPhone，质量要稍微的靠谱那么一点点。</p>



<p>苹果现在在中国地区想要继续好好的卖手机，你就需要有Apple Intelligence，就需要有一个能够在中国合规落地的AI大模型。阿里本来说：“我帮你去申请合规落地，我来去给你提供相应的服务。”结果到现在为止，这个事过不去了。</p>



<p>所以后边苹果要怎么办？还有很多瓜可以继续吃下去。</p>



<p>好，这个故事今天就跟大家讲到这里。感谢大家收听，请帮忙点赞、点小铃铛，参加DISCORD讨论群，也欢迎有兴趣有能力的朋友加入我们的付费频道。再见！</p>
]]></content:encoded>
					
		
		
			</item>
		<item>
		<title>AI大模型竞赛白热化：Meta于LLAMA CON belatedly 推出官方API与APP，对比OpenAI、谷歌Gemini、XAI及腾讯元宝的策略，其元宇宙捆绑和缓慢步伐是否已彻底错失良机？</title>
		<link>https://lukefan.com/2025/05/05/ai%e5%a4%a7%e6%a8%a1%e5%9e%8b%e7%ab%9e%e8%b5%9b%e7%99%bd%e7%83%ad%e5%8c%96%ef%bc%9ameta%e4%ba%8ellama-con-belatedly-%e6%8e%a8%e5%87%ba%e5%ae%98%e6%96%b9api%e4%b8%8eapp%ef%bc%8c%e5%af%b9%e6%af%94openai/</link>
		
		<dc:creator><![CDATA[Luke Fan]]></dc:creator>
		<pubDate>Mon, 05 May 2025 00:36:54 +0000</pubDate>
				<category><![CDATA[AIGC]]></category>
		<category><![CDATA[Meta的故事]]></category>
		<category><![CDATA[2023年]]></category>
		<category><![CDATA[2024年]]></category>
		<category><![CDATA[2025年预测]]></category>
		<category><![CDATA[AI Agent]]></category>
		<category><![CDATA[AIGC (AI Generated Content)]]></category>
		<category><![CDATA[AI发展]]></category>
		<category><![CDATA[AI战略]]></category>
		<category><![CDATA[Anthropic]]></category>
		<category><![CDATA[API服务]]></category>
		<category><![CDATA[ChatGPT]]></category>
		<category><![CDATA[DeepSeek]]></category>
		<category><![CDATA[Facebook]]></category>
		<category><![CDATA[Gemini]]></category>
		<category><![CDATA[Google]]></category>
		<category><![CDATA[GPT-4o]]></category>
		<category><![CDATA[Grok]]></category>
		<category><![CDATA[Groq]]></category>
		<category><![CDATA[LLaMA]]></category>
		<category><![CDATA[LLAMA API]]></category>
		<category><![CDATA[LLAMA Con]]></category>
		<category><![CDATA[LLAMA发布历史]]></category>
		<category><![CDATA[Meta]]></category>
		<category><![CDATA[Meta AI APP]]></category>
		<category><![CDATA[OpenAI]]></category>
		<category><![CDATA[Qwen (通义千问)]]></category>
		<category><![CDATA[XAI (马斯克)]]></category>
		<category><![CDATA[云计算]]></category>
		<category><![CDATA[亚马逊云]]></category>
		<category><![CDATA[产品体验]]></category>
		<category><![CDATA[人工智能]]></category>
		<category><![CDATA[元宇宙战略影响]]></category>
		<category><![CDATA[免费策略]]></category>
		<category><![CDATA[商业模式]]></category>
		<category><![CDATA[大语言模型 (LLM)]]></category>
		<category><![CDATA[字节]]></category>
		<category><![CDATA[应用程序 (APP)]]></category>
		<category><![CDATA[开发者大会]]></category>
		<category><![CDATA[开源模型]]></category>
		<category><![CDATA[微软云]]></category>
		<category><![CDATA[战略失误]]></category>
		<category><![CDATA[战略惯性]]></category>
		<category><![CDATA[扎克伯格]]></category>
		<category><![CDATA[扎克伯格 (Mark Zuckerberg)]]></category>
		<category><![CDATA[技术社区]]></category>
		<category><![CDATA[播客内容]]></category>
		<category><![CDATA[智能眼镜]]></category>
		<category><![CDATA[杨乐坤 (Yann LeCun)]]></category>
		<category><![CDATA[杨乐坤观点]]></category>
		<category><![CDATA[模型对比]]></category>
		<category><![CDATA[流量入口争夺]]></category>
		<category><![CDATA[深度学习]]></category>
		<category><![CDATA[百度]]></category>
		<category><![CDATA[社交优势]]></category>
		<category><![CDATA[科技评论]]></category>
		<category><![CDATA[竞品分析]]></category>
		<category><![CDATA[老范讲故事]]></category>
		<category><![CDATA[腾讯]]></category>
		<category><![CDATA[腾讯元宝]]></category>
		<category><![CDATA[行业分析]]></category>
		<category><![CDATA[起了个大早赶了个晚集]]></category>
		<category><![CDATA[追赶者]]></category>
		<category><![CDATA[阿里]]></category>
		<category><![CDATA[马斯克 (Elon Musk)]]></category>
		<guid isPermaLink="false">https://lukefan.com/?p=2160</guid>

					<description><![CDATA[**啊啊啊Meta你醒醒啊！！不买眼镜不让用AI是什么迷惑操作？！**

家人们谁懂啊！！最近被Meta气到摔手机！！🤯

事情是这样的⬇️
听说Meta终于出了官方AI助手APP，本科技宅连夜翻墙下载！结果刚打开就弹窗：「请连接Meta智能眼镜」？？？😱
我：？？？现在用AI还得先买雷朋眼镜？？（查价格中）打扰了告辞！！💸

**这波操作有多窒息：**
1️⃣ 全球用户：想用Meta AI？先交1500刀眼镜税！
2️⃣ 竞品狂喜：OpenAI/谷歌APP随便下啊喂！
3️⃣ 元宇宙PTSD：小扎你清醒点！现在2025年了！！

**对比隔壁学霸操作：**
✅ OpenAI：网页/APP/插件全平台打通
✅ 谷歌Gemini：更新慢但至少不卖眼镜！
✅ 腾讯元宝：撒钱送会员求着用户用！

**Meta三大致命伤：**
🔥 战略精分：左手元宇宙右手AI 结果两手空空
🔥 捆绑销售：眼镜滞销救救我们？
🔥 科学家拆台：自家CTO天天说大模型要完！

现在才想起来抄OpenAI作业？别人API都赚两年钱了！！💸
要我说赶紧做三件事：
1. 立刻解除眼镜捆绑！！
2. 学腾讯砸钱换用户！！
3. 把说风凉话的CTO嘴堵上！！！

所以问题来了👉 你会为Meta AI买雷朋眼镜吗？
（反正我不买🙅♀️ 评论区蹲个勇士实测！）

#AI #科技八卦 #Meta翻车 #信息差 #数码吐槽大会
（配图建议：Meta眼镜价格截图+卸载APP动图+扎克伯格元宇宙表情包）

AI大模型竞赛白热化：Meta于LLAMA CON belatedly 推出官方API与APP，对比OpenAI、谷歌Gemini、XAI及腾讯元宝的策略，其元宇宙捆绑和缓慢步伐是否已彻底错失良机？

Meta在其首届**LLAMA CON 开发者大会**上宣布推出对标**ChatGPT**的**Meta AI APP 智能助手**及官方**LLAMA API**服务，试图弥补其在大模型应用部署上“**起了个大早赶了个晚集**”的尴尬局面。然而，这款新**APP**竟要求用户必须连接**Meta**与**雷朋**合作的**智能眼镜**才能使用，形成了强制**捆绑**，而官方**API 服务**的推出也远落后于**OpenAI**、**Anthropic**等竞争对手，后者早已通过完善的**API**和多平台**客户端**积极抢占**流量入口**。与此同时，**谷歌Gemini**已调整策略迎头赶上，**马斯克**的**XAI/Grok**路径飘忽但紧随其后，国内如**腾讯元宝**更是专注于流量争夺。Meta的滞后被认为源于**扎克伯格**对**元宇宙**的持续**战略惯性**，以及其**首席科学家**、**图灵奖**得主**杨乐坤**对当前大模型技术路线的公开质疑。尽管**LLAMA**系列**开源大模型**曾有重要贡献，但其领导地位已被如阿里**Qwen**等超越，且Meta尚未与**Groq**等芯片厂商深入合作部署。分析指出，Meta仅靠模仿竞争对手补课已难以**追赶**，未来必须整合**AI Agent**能力，彻底放弃**眼镜捆绑**策略，并充分利用其庞大的用户基础和**社交场景**进行**变现**创新，才能避免在AI竞赛中彻底掉队。]]></description>
										<content:encoded><![CDATA[
<figure class="wp-block-embed is-type-video is-provider-youtube wp-block-embed-youtube wp-embed-aspect-16-9 wp-has-aspect-ratio"><div class="wp-block-embed__wrapper">
<iframe loading="lazy" title="AI大模型竞赛白热化：Meta于LLAMA CON belatedly 推出官方API与APP，对比OpenAI、谷歌Gemini、XAI及腾讯元宝的策略，其元宇宙捆绑和缓慢步伐是否已彻底错失良机？" width="900" height="506" src="https://www.youtube.com/embed/0Oza4_J8cOU?feature=oembed" frameborder="0" allow="accelerometer; autoplay; clipboard-write; encrypted-media; gyroscope; picture-in-picture; web-share" referrerpolicy="strict-origin-when-cross-origin" allowfullscreen></iframe>
</div></figure>



<p>Meta召开LLAMA Con开发者大会。他原来丢的这些课程，现在补还来得及吗？</p>



<p>大家好，欢迎收听老范讲故事的YouTube频道。4月29号，Meta召开了首届的LLAMA CON开发者大会。Meta原来是开open大会，他反正每年都会开一到两次的这种开发者大会，这是开了第二次开发者大会了。这一次呢，主要就是对LLAMA进行了一些发布。前面LLAMA4已经发布过了，而且发完了以后还翻车了。现在呢，Meta说我也要去补课了。</p>



<p>补什么课呢？第一个是我要出一个独立的APP智能助手，叫MetaAI APP，对标ChatGPT。另外呢，我要开始面向开发者直接提供官方的LLAMA API服务了。这块呢，还准备去跟Groq这些芯片厂商去合作去，我帮他们去部署。现在呢，LLAMA的这些服务都是免费给大家使用的，LLAMA API未来有可能会收费。</p>



<p>你说人家OpenAI一出ChatGPT就开始给大家提供服务，APP也出了这么长时间了。这Meta真的是起了个大早赶了个晚集，到今天才想起来说我的这些API也要为大家服务了，我的APP也要为大家服务了，还来得及来不及？</p>



<span id="more-2160"></span>



<p>首先跟大家说一下使用的情况。MetaAI APP呢，我去下载了一个。下载完了以后呢，一开始说对不起，在你这个区域不服务，这个也很正常嘛。后来我又使用了一些手段，终于让他跑起来了。跑起来以后第一件事说，请把你的眼镜拿出来。什么眼镜呢？就是Meta的这个智能眼镜，跟雷朋做的这智能眼镜。说我必须要连智能眼镜，我在那跟他折腾了十几二十分钟。我说能不能跳过去，我说咱能不连这东西吗？不能，你只要启动这个软件就必须连这个智能眼镜，连不上它就不往前走了。我只能把它卸载了。</p>



<p>至于说LLAMA API呢，因为原来我们也在云端使用各种LLAMA的模型，LLAMA2、LLAMA3都用过。但是呢，都是由第三方云厂商来提供的，从来没有官方提供的。而第三方厂商提供的这些LLAMA API的话，就都要收费嘛，而且比较贵。现在Meta说我现在要官方提供了，你直接在Meta云上就可以用了，不用再到各个的平台上去找去了。而且你到各个平台上找了，他这个版本也不一致，有大的，有小的，还有各种微调过的版本，服务的水平也不是很一致。这块，你们统一都到官方来。而且你到了官方以后呢，还可以把这种微调的版本存在官方的云上。反正我有这么多GPU，咱跑呗。</p>



<p>现在用的人也少，咱们就免费。像Grok他们家的这个XAI的API，现在其实也是免费的。我现在每个月还是用的蛮多的，但是作为个人吧，应该是没有达到使用的上限。所以你基本上做各种测试、开发都是不要钱的。这后来者必须要靠免费，这是生生的迟到了两年。但是呢，依然做的非常的不彻底。</p>



<p>你想LLAMA1是Meta公司2023年2月24号发布的，当时发布出来这些事就应该干。现在都2025年5月份了，才开始搞这些事情，才开始补这个坑，真的是起了个大早赶了晚集。为什么整成这样呢？就是他一直在纠结元宇宙，直到现在为止还是没有放弃。你现在想要在手机上，甭管安卓手机、苹果手机，你想要用MetaAI APP，对不起，您还得去买他们家的眼镜去。也不知道他到底卖了多少眼镜了，你没有眼镜不让用，这个很神奇。</p>



<p>那么各大厂商都是怎么做的呢？看看人家先进同学、好同学，别人家的孩子怎么干的。OpenAI跟Anthropic肯定是标杆，这两家怎么干，其他人照着抄。每次发布新的模型、新的版本，一定是有官方的API出来。而且这些官方API通常是在它发布之后，有的时候可能就是当天就用了，有的时候会过个几周。比如说前两天发布的GPT4O image，就是画图的这个功能，应该是发布了以后过了两周还是三周，这个API就出来了，大家就可以上去用。而且在很努力的去争夺流量入口，甭管是OpenAI的客户端，安卓、iOS、Windows、Mac，我不知道有没有Linux版本，反正就全都有，包括各种网页都可以用。Anthropic也是如此，安卓、Mac、iOS、Windows都是有的，都在很努力的去抢占各种客户端，抢占流量入口。</p>



<p>还要去做什么？Chrome插件，就是你的浏览器上还要做插件。大家有没有试过在Chrome浏览器上安装OpenAI的插件？装上了以后呢，Chrome就警告，你说它想改这个默认搜索引擎行吗？你一说同意，你再往后在Chrome的地址栏里输入什么东西一打回车，就直接上OpenAI搜索去了，没有任何其他的功能，也要把这个流量入口抢回来。人家都是这么干的。</p>



<p>国内的厂商呢，通常都是站这一队，照这样学，包括是阿里、字节呀、百度。字节学的是最快的，百度跟阿里呢，还是要稍微的慢一点点。国内呢，是分两个阵营，大厂的其实通常都是云计算厂商，包括字节后边都是有云计算服务的。新势力呢基本上就是。</p>



<p>照着OpenAI和Anthropic这条路走，就没毛病了。因为OpenAI跟Anthropic都不是云计算厂商，他们两家的服务器都是部署在其他人的云上的。OpenAI是部署在微软云上的，Anthropic是在亚马逊云上。这个跟国内的云厂商还不太一样，国内蔚小理这些人基本上是一模一样在照抄他们的作业，也是在抢占流量入口。</p>



<p>谷歌的Gemini呢，原来也是有点晕头转向的。虽然事儿干了，Gemini的客户端也出来了，API在官方也提供了，但是呢非常难用。每一次有新模型出来以后，都是在AI studio，就是给程序员用的API接口这块，在这先出来。可能很长很长时间以后，才会去Google Gemini客户端。所以它这个版本更新的都非常奇怪，很多人说新版本出来了，我怎么用不上？你们一帮人在这说好，一帮程序员你们在这自嗨。我说对了，谷歌就是程序员的公司，它就是专门为程序员自嗨设计的。</p>



<p>但是现在好很多了，最新的版本Gemini 2.5 Pro已经在Gemini的客户端上直接可以使用了，而且可以免费使用。这就完完全全在抄OpenAI的作业，现在Google算是醒过味来了，而且这个作业呢基本上算抄对了。Gemini 2.5 Pro是我现在用过的各种模型里效果是非常非常好的一个，特别是对程序员很友好。所以我现在大量的工作都是使用Google Gemini来工作。</p>



<p>马斯克的XAI呢，它的路径比较飘忽。因为公司非常小，它的融资规模很大，但是人很少。他的路径呢经常是看谁家好，就赶快往里边飘一点，那边好就往这边飘一点。要开源，我也开源去了；要提供API，我也去提供API；需要APP吗，我也来了。现在Grok APP是单独的，是在x之外专门有一个APP叫Grok。你说我需要做什么deep research，需要做什么AI agent，这那我也上。一帮人更新了以后，我这个Xai的GROK3好像不是最新了，不是最好用的这个了。更新更新，5月5号这周，马斯克承诺要更新Grok 3.5出来。他就还比较飘忽。</p>



<p>腾讯呢，算是逼不得已自成一派。为什么？他前头走的比较慢，自己做的各种模型压根就没怎么做出来。等到DeepSeek上来以后说算了，我全线拥抱DeepSeek吧，就开始直接抢流量去了。就是底层模型它就不更新了，或者更新了，大家也不太惦记了。所以现在腾讯在用元宝跟大家抢流量。</p>



<p>Meta呢，到目前为止，其实依然没太想明白后边到底要怎么玩。虽然它开发了独立APP，虽然他现在开始提供官方API了，但是未来怎么办，他其实还没想明白，更不要说怎么能够赶上了。那你说Meta到底是，怎么整成这样的一个样子呢？起了个大早，赶了个晚集。</p>



<p>第一个大原因是战略上的惯性。扎克伯格呢，一直惦记搞元宇宙。这个原因也很简单，并不是说扎克伯格看到了元宇宙未来发展的方向，他只是被苹果恶心到了。作为一个这么大公司的老板，这么大的平台，全世界有这么多用户，被苹果狠狠地恶心了一把。因为他的软件必须要在苹果和安卓的设备上才可以去挣钱，才可以去放广告。苹果说我要管你，你的这个权限不能有，那个权限不能有，这个数据不能用，那个数据不能用，差点没被苹果弄死。然后扎克伯格说，我一定要革苹果的命。原来Facebook是个APP嘛，你要上人家的APP store才可以去工作，你上了人家的APP store，人家就要立规矩，你要去遵守。现在说APP是最差的，我坚决不要这东西。但其实呢，他所谓的元宇宙是他自己要坐苹果那个位置。在这个位置上，我要让其他的人都在我这下面做APP。他就惦记说我要去整平台，这就是他整元宇宙这个事的最初始目的。</p>



<p>后来发现搞不定，因为VR、AR都卖的不是很好。搞不定，那怎么办呢？转向这个大语言模型，因为别人都在做这件事，他不转这个向他搞不定。但是呢，内部的各种层级条块之间都不太愿意去放弃元宇宙这个事情。原因很简单，扎克伯格自己没放弃。现在他去开各种的什么财报会、年会、季会什么，还在那讲的，说我元宇宙这事没放弃，我还接着干呢。VR头像其实也还在做。但是呢，现在主要想去做跟雷朋设计的这个眼镜，我也没买过。甚至还出来说，我现在要进入时尚界，这个眼镜是最时尚的事情，在开始搞这样的一个，就是没有梗硬吃的这么一个事情。</p>



<p>现在在这样的一个平台下呢，特别是老大没有放弃的情况下，那只能大家说，什么事都得带上点。你如果不戴上的话，好像就是忠诚的不绝对，就是绝对的不忠诚。我记得原来有首诗词：“宰相巍巍坐庙堂，说着精量便要精量。那个幕僚上一章，头说精良尾说精良。轻狂太守在五洲，闻说精良星夜精良。山东河北久抛荒，好去精良胡不精良。”这个是南宋时期一个词人写的词。什么意思？就是这个宰相在庙堂上坐着，说我要把这个土地丈量一下。他说完了以后呢，拍脑袋说一出是一出。下边这些幕僚官署呢。</p>



<p>一看到这事，这赶快得说呀！我也得上一个章附和一下。从头说丈量，尾巴上也说丈量。有一个很轻狂的太守，听说要丈量土地了，星夜丈量，就是晚上就开始干，不要等明天了。说这个河南、山东、河北这么多地方都被金人侵占了，现在金人走了，这一块都抛荒了，你这怎么不去丈量？讲了这么一首词，其实就很像是Meta现在的一个状态。</p>



<p>做了个APP，还惦记把那个眼镜挂上，不挂眼镜不让你用。这个呢，算是在特定语境下的黑暗森林。黑暗森林法则是什么？就是猜疑链嘛！不知道你是不是好人，我也不知道怎么告诉你我是好人，我也不知道我告诉你是我是好人之后，你会怎么对待我。这个产业链无限延长以后，就没有办法沟通交流了。其实很多大公司都是这样的，现在对于Meta来说就是这样。我不知道你是不是元宇宙这一派的，我也不能告诉你我不是元宇宙这一派的，我是大模型这派的。我不能跟你说，我也不知道我告诉你了，我不是元宇宙这派的，你会怎么反馈。他会有这样的事情。</p>



<p>但我只知道呢，在这个公司里从上到下，你是不能批评元宇宙这个事的。你不能说元宇宙不好，这个事也不容置疑。这个事是变成这样。其实在任何一个语境里头，当某件事情不容置喙的时候，就会形成一个黑洞，就会变成一片黑暗森林。这个是Meta掉队的一个很重要的原因，因为他战略方向一直没有确定下来，还惦记玩元宇宙呢。</p>



<p>另外一个原因是什么呢？就是他的科学领头人太科学、太超前了。他科学领头人是谁？叫杨乐坤，是个法国人，后来跑到美国去。他呢是Meta的副总裁兼首席人工智能科学家，基本上就是他领头的。这光环满满，深度学习三巨头，这个项目是2018年获得图灵奖，所以也叫图灵奖三巨头。因为获图灵奖人多去了，但深度学习这块三个老大。然后呢，还有一个title叫卷积神经网络之父。这样的一个人在这带头，这么有钱的公司，这么多用户，老板也说我要去做大模型了，还有这样的科学带头人在这顶着，那咋就不行呢？</p>



<p>这个老哥每天出去演讲，都在讲什么？大语言模型不行了，靠预测TOKEN这种方式是搞不定的，这条路走不通。作为大学教授、科学家，你愿意讲什么讲什么没问题。他呢只是太超前了。未来一段时间，肯定还是会有新的方法、新的算法来去替代Transformer，来去替代这种TOKEN预测这个方式。你现在作为一个公司的副总裁和首席科学家，你讲这个话真的不合适。你讲这个，你让下边人怎么干活？怎么向你汇报工作？上杨乐坤这汇报工作来了。</p>



<p>我们把LLAMA4再怎么推进了一下，然后他给你讲了半天说这事不行，这条路走不通的。你说你咋办？所以Meta是一个什么样的现状？CEO还惦记搞元宇宙呢，首席科学家总在那说方向错了。那你让下边人怎么干活？好难。</p>



<p>他发了这四个版本的LLAMA，真的是为中国奠定了大模型的基础。没有他们，就绝对没有中国今天的大语言模型。什么人工智能、AIGC，整个都没有，都是从这开始的。所以还是要感谢他们。</p>



<p>但是呢，在自己的产品跟服务之中，只进行了非常有限的改进和融合，并没有完完全全把这些LLAMA用起来。新的流量完全放弃，因为他自己有的是流量。OpenAI、Anthropic、谷歌现在在抢占的这个流量，原来就压根没动过，到今天才开始想起来：“我也得得着这流量，不能让你们都拿走了。”</p>



<p>弄完了以后还眼镜捆绑上去，没有眼镜我不让你玩。我很高傲，玩了这么一套东西。新的技术社区完全任其自生自灭：“我把LLAMA做出来了，做完了以后呢，你不能在我的社区讨论，你也不要到我这儿来。去使用官方API？没有的，你们谁愿意用谁用。反正我头一个我把东西拿出来了，大家都跟着使，就这样就完事了。”</p>



<p>新的技术方向已经基本上失去领导地位了。开源大模型这一块，基本上是被阿里的Qwen站在前面，真正领旗的位置上了。那你说现在还来得及吗？咱们最后来回答这个问题。</p>



<p>结论：再照抄别人的作业，肯定是来不及了。因为人家已经提前跑了两年了，你现在大模型也不比别人先进，甚至还是测评翻车的一个状态。现在想把人家的这个官方API和独立APP这个作业抄上，就想去追赶，这是不可能的。</p>



<p>现在就还需要补更多的课。第一个是什么？就要把AI agent加上，现在他这一块呢还是短板，别人都已经走到这一步了，还得把这个课补上。第二个呢，别再捆绑眼镜了行不行？你想，Meta那么多用户，有多少用眼镜了？你现在是要把所有的Meta用户转换过来来做Meta AI，而不是说眼镜那几个用户。甚至这个眼镜用户，可能还要把这个吃灰的眼镜再拿出来，再去转换Meta AI。所以不要再去捆绑眼镜了。</p>



<p>如果不捆绑的话，过两天我再去试一试。如果真走通了要干嘛？像腾讯现在推元宝这样撒狠钱进去推。但是Meta好像在这块一直都比较佛系，因为流量对于他来说比较富裕嘛。他老觉得这些流量就在这待着，我只要是给了功能，大家就会去使。真砸钱去推这一块的话，Meta好像并不是特别激进。腾讯现在就是砸死了钱往里推。</p>



<p>一个月花多少亿人民币往里砸，现在在干这样的一个事情。Meta真正该干的活是什么呢？就是要放大自己的优势：场景、社交。要跟腾讯学，还有各种变现。Meta的变现就是在Meta上打广告，然后做各种的社交、内部的信息传播。这块是非常强大，有一堆人在围绕这一块去思考，再去写程序，再去创业。</p>



<p>Meta的LLAMA一定要在这一块要往前再走一步。如果这块不走的话，他一点优势都没有。这就是今天咱们讲的故事。Meta现在补作业还来得及来不及？</p>



<p>这个故事今天就讲到这里。感谢大家收听，请帮忙点赞，点小铃铛，参加DISCORD讨论群。也欢迎有兴趣、有能力的朋友加入我们的付费频道。再见！</p>



<p></p>
]]></content:encoded>
					
		
		
			</item>
		<item>
		<title>阿里Qwen3重磅发布：是超越Llama 4的划时代的胜利，还是性能未达预期、被过度炒作的技术翻车现场深度剖析？</title>
		<link>https://lukefan.com/2025/05/04/%e9%98%bf%e9%87%8cqwen3%e9%87%8d%e7%a3%85%e5%8f%91%e5%b8%83%ef%bc%9a%e6%98%af%e8%b6%85%e8%b6%8allama-4%e7%9a%84%e5%88%92%e6%97%b6%e4%bb%a3%e7%9a%84%e8%83%9c%e5%88%a9%ef%bc%8c%e8%bf%98%e6%98%af/</link>
		
		<dc:creator><![CDATA[Luke Fan]]></dc:creator>
		<pubDate>Sun, 04 May 2025 00:47:42 +0000</pubDate>
				<category><![CDATA[AIGC]]></category>
		<category><![CDATA[Agent能力]]></category>
		<category><![CDATA[AI agent开发]]></category>
		<category><![CDATA[DeepSeek R1 对比]]></category>
		<category><![CDATA[Gemini 2.5 Pro 对比]]></category>
		<category><![CDATA[GitHub 开源]]></category>
		<category><![CDATA[GPT-4o 对比]]></category>
		<category><![CDATA[Grok 对比]]></category>
		<category><![CDATA[Llama 4 对比]]></category>
		<category><![CDATA[MCP协议支持]]></category>
		<category><![CDATA[MOE模型 (混合专家模型)]]></category>
		<category><![CDATA[Ollama]]></category>
		<category><![CDATA[Open Router]]></category>
		<category><![CDATA[PC端应用]]></category>
		<category><![CDATA[Qwen3]]></category>
		<category><![CDATA[XAI 对比]]></category>
		<category><![CDATA[上下文窗口 (128K/256K)]]></category>
		<category><![CDATA[专业数据]]></category>
		<category><![CDATA[云部署]]></category>
		<category><![CDATA[人工智能 (AI)]]></category>
		<category><![CDATA[代码生成]]></category>
		<category><![CDATA[优缺点]]></category>
		<category><![CDATA[全系列模型 (0.6B-235B)]]></category>
		<category><![CDATA[划时代的胜利 vs 翻车]]></category>
		<category><![CDATA[千问3]]></category>
		<category><![CDATA[原生数据]]></category>
		<category><![CDATA[参数效率]]></category>
		<category><![CDATA[合成数据]]></category>
		<category><![CDATA[后训练]]></category>
		<category><![CDATA[商业应用]]></category>
		<category><![CDATA[多场景适配]]></category>
		<category><![CDATA[多语言支持 (119种)]]></category>
		<category><![CDATA[大语言模型 (LLM)]]></category>
		<category><![CDATA[工具调用]]></category>
		<category><![CDATA[幻觉问题]]></category>
		<category><![CDATA[开源模型]]></category>
		<category><![CDATA[强化学习 (RLHF)]]></category>
		<category><![CDATA[微调 (Fine-tuning)]]></category>
		<category><![CDATA[性能分析]]></category>
		<category><![CDATA[性能评测]]></category>
		<category><![CDATA[技术创新]]></category>
		<category><![CDATA[指令遵循]]></category>
		<category><![CDATA[数学推理]]></category>
		<category><![CDATA[数据来源]]></category>
		<category><![CDATA[本地部署]]></category>
		<category><![CDATA[模型使用]]></category>
		<category><![CDATA[模型发布]]></category>
		<category><![CDATA[模型对齐]]></category>
		<category><![CDATA[混合推理架构]]></category>
		<category><![CDATA[用户体验]]></category>
		<category><![CDATA[田忌赛马策略]]></category>
		<category><![CDATA[真实感受]]></category>
		<category><![CDATA[硅基流动]]></category>
		<category><![CDATA[移动端应用]]></category>
		<category><![CDATA[稠密模型]]></category>
		<category><![CDATA[评测数据]]></category>
		<category><![CDATA[逻辑推理]]></category>
		<category><![CDATA[长思维链]]></category>
		<category><![CDATA[阿里云百炼]]></category>
		<category><![CDATA[阿里大模型]]></category>
		<category><![CDATA[预训练 (36T数据)]]></category>
		<guid isPermaLink="false">https://lukefan.com/?p=2156</guid>

					<description><![CDATA[啊啊啊啊啊啊不允许还有人不知道这个AI圈大地震！！！连夜实测Qwen3模型全家桶，这波阿里真的赢麻了！！（疯狂拍桌.gif）

🔥🔥全尺寸覆盖的AI大杀器
从0.6B到235B全系通杀！
手机跑AI不是梦！！！
（掏出手机狂戳.jpg）
0.6B模型在iPhone15上丝滑运行
写文案/改代码/做翻译三秒出结果
学生党上课摸鱼神器实锤了！！

💥推理黑科技原地封神
发现惊天隐藏开关！！
长按对话框输入「/推理模式on」
瞬间开启学霸解题模式
（数学题解题过程疯狂滚屏.gif）
考研党/码农/科研狗集体起立鼓掌！！！

🌍119语种支持实测
（掏出祖传方言测试）
东北话十级选手狂喜！！
「整两斤猪肉炖粉条子」
秒出菜谱+热量计算+采购清单
（但斯瓦西里语有待调教）

🚀Agent模式原地起飞
接入高德API实测：
「从三里屯到798的文艺路线」
自动规划咖啡馆+美术馆打卡点
打工人摸鱼旅行一键生成！！

（敲黑板！！重点来了）
⚠️避坑指南：
1️⃣ 8B模型跑复杂任务会卡壳
2️⃣ 小语种生成建议切中英模式
3️⃣ 伦理安全锁记得开最高档

（疯狂安利环节）
学生党闭眼冲4B版！！
打工人直接上32B云端！！
极客大佬235B本地部署走起！！
（附部署教程指路评论区）

现在立刻马上！！
去阿里云百炼薅羊毛！！！
新用户免费额度够玩三天三夜
（别等被卷王们挤爆服务器！！）

（结尾暴言）
Qwen3这波操作我直接跪了！！
AI全民化时代真的来了！！！

阿里Qwen3重磅发布：是超越Llama 4的划时代的胜利，还是性能未达预期、被过度炒作的技术翻车现场深度剖析？

阿里最新开源大模型Qwen3震撼发布，引发业界对其究竟是“划时代的胜利”还是“翻车”的热烈讨论。本文深度解析Qwen3的全配置特性，覆盖从0.6B到235B MOE多种参数量模型，支持Ollama等方式进行本地部署及云端便捷使用，具备高达128K上下文窗口和119种多语言处理能力。评测显示Qwen3性能优越，部分场景接近Gemini 2.5 Pro，在Agent能力上通过原生支持MCP协议实现突破，显著提升工具调用效率，优于DeepSeek R1。尽管在复杂推理和指令遵从上仍有提升空间，但相较于Llama 4在开放性、模型尺寸及MCP支持上的不足，Qwen3凭借其完全开源、尺寸灵活、易于微调的优势，被视为AI和LLM领域的一次重要成功，有望在Agent时代引领微调生态发展，挑战现有格局。]]></description>
										<content:encoded><![CDATA[
<figure class="wp-block-embed is-type-video is-provider-youtube wp-block-embed-youtube wp-embed-aspect-16-9 wp-has-aspect-ratio"><div class="wp-block-embed__wrapper">
<iframe loading="lazy" title="阿里Qwen3重磅发布：是超越Llama 4的划时代的胜利，还是性能未达预期、被过度炒作的技术翻车现场深度剖析？" width="900" height="506" src="https://www.youtube.com/embed/POB_gaK1Anc?feature=oembed" frameborder="0" allow="accelerometer; autoplay; clipboard-write; encrypted-media; gyroscope; picture-in-picture; web-share" referrerpolicy="strict-origin-when-cross-origin" allowfullscreen></iframe>
</div></figure>



<p>Qwen3发布了。这到底是划时代的胜利，还是翻车了呢？</p>



<p>大家好，欢迎收听老范讲故事的YouTube频道。Qwen3真的是千呼万唤始出来。前面好几周就已经不断有传言说Qwen3要发布，要多么多么强大。突然发布之后，当然也肯定是伴随着一大堆的评测数据了。官方评测数据呢，永远是我超越了谁、超越了谁。但是很多评测的人呢，觉得好像差那么一点点意思，没有达到预期。所以今天我们来讨论一下，这到底是又一次划时代的胜利，还是翻车。</p>



<p>Qwen3呢是凌晨发布的，4月29日凌晨上线，在Github上全面开放。我呢已经开始用上了。使用的方法有几种：</p>



<p>第一种是本地部署。我是MacBook Pro，M2 Max的芯片，32G内存。其他的不重要，你到底有多少硬盘，这个事没有那么重要。本地使用OlAmA部署，我使用了8B、32B和30B-A3B。最后这个是什么意思？最后是一个MOE的模型，它是30B-A3B，就是说它每一次干活的时候激活3B，也就是30亿参数。它是这样的一个标注。就这三个版本的模型，在我本机都可以跑，速度呢都是还可以接受。</p>



<span id="more-2156"></span>



<p>云端，第一个你肯定上阿里他们自己家玩去。阿里云百炼平台，使用支付宝或者淘宝账号刷一下，就可以进去使用了。价格还是很便宜的，特别是一些很大的模型，还是要在这个上面才能去跑起来。然后open Router永远是最快的。4月29号凌晨发布的，4月29号白天就可以在这个平台上用上了。硅基流动稍微晚一点，大概到5月1号可以去使用了。</p>



<p>那么Qwen3有什么样的特性呢？第一个是全配置，这个非常非常重要。什么叫全配置？就是它从很小的模型到很大的模型，所有的配置都是完整的。首先它提供了稠密模型，不是MOE，就是单个的这种稠密模型，从0.6B、1.7B、4B、8B、14B、32B，这些都提供了。MOE模型提供了30B-A3B和235B-A22B。235B-A22B这种模型什么意思？就是说一共是2,350亿参数，每一次激活220亿个参数。它是这样的两个MOE模型。</p>



<p>全场景。你在移动端0.6B到4B这样的模型，在移动端没有任何问题都可以跑。说我在终端推理，或者是在PC端跑一跑，做一些商业应用，8B、14B、32B都是可以跑的。你说我有一些复杂任务，或者做一些AI agent开发，30B或者是235B的两个MOE模型非常好用。而且呢是全语种，它支持119种语言。不过这块有人在吐槽。</p>



<p>这119种语言，好像除了中文、英文和常见的几种语言之外，其他什么斯瓦西里语这种奇奇怪怪的语言，支持的并没有那么好。</p>



<p>训练的过程呢，稍微的跟大家展开讲一讲。预训练用了36T的数据。LLAMA4的预训练数据的话是30T，Qwen3的话，比LLAMA4的训练数据集还要再大一些。</p>



<p>它的第一阶段呢，是使用了30T的数据，训练了一个基础语言模型出来。第二阶段用5T的数据呢，去强化STEM，也就是这种科学相关的能力，以及编程相关的能力。到第三阶段呢，就是扩大上下文。一开始这个上下文是比较小的，经过第三阶段的扩大以后：</p>



<p>&#8211; 4B以下的模型，也就是刚才我们说的0.6B、1.7B、4B这三个模型，它们的上下文呢达到了32K。<br>&#8211; 大于4B的模型，也就是8B、14B、32B，以及MOE的两个模型30B和235B这几个模型，他们的上下文呢都已经达到了128K。<br>&#8211; 在一些特殊情况下，可以达到256K的上下文。</p>



<p>这块呢，有待继续提升吧，因为LLAMA4的上下文是10兆，要比它大很多。</p>



<p>数据来源，就是拿什么数据来训练的这个东西：<br>&#8211; 60%的数据呢，是互联网原生数据。<br>&#8211; 25%呢，是专业领域的数据，包括GitHub上面的代码、数学公式、科学数据。<br>&#8211; 还有15%呢，是合成增强数据，就是拿其他的大模型去生成的一些数据，用的是Qwen2.5的一些模型生成了一些数据。这块呢，主要是做一些推理链的训练，而且也可以做多语言的对齐。</p>



<p>这就是它的数据来源。这块呢，跟LLAMA4就有很大的区别。LLAMA4大量的使用的都是合成数据，而这个Qwen3的话，使用的大量是原生数据。</p>



<p>在预训练之后，还会进行后训练。后训练的话，实际上是对模型做微调了。他呢，在分四步对Qwen3进行微调：<br>1. 第一步是长思维链冷启动的训练，注入数学、代码等领域的常推理数据。<br>2. 第二步呢，是强化学习探索强化学习，就是你给我生成结果，我们来打分，然后你根据我的打分来决定说这个结果对不对。它是基于规则奖励，提升复杂推理能力的一个训练。<br>3. 第三步呢，是模式融合。这个东西特别好玩，它是一个融合模式的推理模型。什么意思呢？因为我们使用推理模型的时候，有一个特别讨厌的东西，就是有些特别简单的东西呢，给你推理半天，甚至推理的TOKEN还消耗了很多。对于Qwen3来说呢，它里头有一个参数，就是你是不是要打开推理。同一个模型呢，你可以在这设说你不要打开推理，他就快速的给你出一结果。你说你给我做推理。</p>



<p>就给你啰里八嗦的去想去了，这个也算是个创新吧。原来都是推理模型，就是必须要推理。他是做了这样的一个训练，然后第四步呢是进行通用校准，特别是覆盖20多个领域的强化学习，修正一些不良行为。他等于做了预训练之后，还做了大量的微调后训练。</p>



<p>那么，Qwen3的技术创新到底有哪些呢？</p>



<p>第一个就是它这个混合推理架构。就是你到底想不想让它推理，你告诉他就完了。他给你去推去，或者是直接给你一个答案。</p>



<p>第二个技术创新呢，就是它的MOE的参数效率极大提升了。它的235B的模型里头，每一次激活只激活22B的参数。它要比DeepSeek R1激活的参数要少很多，只有DeepSeek R1 1/3的参数。它整个的模型尺寸也只有DeepSeek R1的1/3。所以呢它的部署成本要比DPC卡R1要低很多，推理的效率也要高非常多。</p>



<p>第三个呢就是多语言和多模态的支持。第一次支持了119种语言，2025年内将推出Qwen3-Vl多模态版本。现在的Qwen3还不支持多模态，你给他张图片他还是认不出来的。这块还是比LLAMA4要差一点。LLAMA4是你给他个视频，他都可以给你进行推理。</p>



<p>最后，Agent能力增强。它呢是直接支持MCP，原生支持MCP协议，工具调用准确率提升40%，API代码量减少70%。这个是Qwen3在这一个时代里头，必须要去实现的功能。这也是它比LLAMA4强的地方。</p>



<p>对Qwen3的期待、评分以及使用感受方面，还是有一些落差的。各项评分一定是高的吓人。因为你现在说，我今天推出一个新模型出来，你一定会自己做一大堆评测，然后跟模型一起推出。如果你说我自己做的评测就比谁都差，那这事你还推它干嘛？一定是说我现在评测了，比大家都强了，我才可以推出来。所以评分一定都比大家强。这块呢，就不跟大家详细去列举说那个评分是多少了，没有什么意义。</p>



<p>但是呢，这个里头比较好玩的是什么？就是它是一个田忌赛马的故事。大家知道什么叫田忌赛马吗？用我们的比较差的马，跟人家那个最好的马比，我输掉了。然后呢我用我的最好的马去跟人家的中马比，我赢了。用我的中马去跟他的最差的马去比，我又赢了。等于三局两胜，我赢两盘。他是很多做这样的这种比较。</p>



<p>为什么Qwen3有田忌赛马的这个能力呢？你比如说，8B的模型可以达到人家的32B的效果。我现在是32B的模型，我可以达到原来72B的效果。他等于做了很多这种错位的比较，我用更小的模型。</p>



<p>达到了以前必须用更大规模模型才可以达到的效果。当然，田忌赛马呢，也未必都是好事。为什么？因为很多人会对这种小参数模型抱有不切实际的期望。一堆人拿来说：“我拿这个8B的模型跑一跑试试，看看我去做一些很复杂的任务，到底效果怎么样？”肯定效果不好。千万不要认为你用8B的模型就可以跑出非常非常好的效果来，这个肯定还是有一些差距的。它可能会在某些特定的领域，或者经过一些微调和训练之后，可以达到32B的效果。</p>



<p>绝大部分人对大模型的认知都是停留在什么GPT-4O这个水平的。你要想拿8B的模型去跟这样的模型去比的话，没有任何可比性。那你说我使用这些32B的模型呢？就属于在大部分情况下可以接近GPT-4O这样的一个水平。咱不研究多模态那些东西，就是正常的内容生成，算是接近。至于说它的235B呢，现在距离Gemini 2.5 Pro还是有一些差距的。但是呢，相对于其他的模型来说，基本上算是跑在同一个基准线上了，不比别人差了。</p>



<p>Qwen3 235B-A22B的这个最大模型在数学、代码、Agent等方面都是全面超越了DeepSeek R1。部分场景呢，接近Gemini 2.5 Pro。这什么意思？就是全部的场景肯定离Gemini 2.5 Pro还是有一定的差距的，但是有一部分场景接近了。但在复杂语义理解，就特别复杂的情况下，还是有一些差距的。特别是一些复杂的逻辑分析，它是有问题的。真实使用的感受呢，算是能用。比起DeepSeek R1强吗？其实感觉不太出来，基本上可以达到DeepSeek R1的水平。</p>



<p>指令依存方面呢，肯定还有一点点欠缺。让他做一个很复杂的动作，他有的时候还是会丢三落四一些。这块我自己试过的，网上也有很多吐槽的人。第一个，复杂推理中的逻辑断层和幻觉生成的问题。所有推理模型身上都有这样的问题，Qwen3即使是最大的模型235B，在这块呢，也不比别人好多少。第二个呢，就是过度思考跟效率问题。有些人发现说：“我给他一个很复杂的问题，他自己开始进行推理了，推理来推理去，直接死在里头了，彻底推不出来了。”这种情况现在也还是存在的。</p>



<p>但是呢，也不用太着急。他既然可以进行后训练，可以进行微调，那我相信大家有各种问题去提就完了。Qwen应该会快速的微调出不同的版本出来的。多语言支持的不均衡，你说119种语言，那些小语种支持的肯定没有那么好，因为语料也没那么多嘛。但这一块你想让它提高支持的话。</p>



<p>也很简单，拿足够多的语料去微调就完了。他也是可以去支持的。然后还有一些伦理跟隐私方面的风险，因为它可以有非常非常小的模型。所以你可以把这种模型，比如部署在你们家洗衣机里，或者部署到一些很奇奇怪怪的这种角落里面。他的能力还很强。而且这种全开源的模型，还有一些人微调了以后，是可以把他的一些安全限制去掉的。这个就会比较吓人，所以大家对这块呢也有一些担心。</p>



<p>还有呢，就是模型对齐和偏好上面的一些问题。比如说吧，生成内容有时候会偏离用户的意图。它对一些指令的依从，还是会稍微差一些的。那么给出一个简单的结论吧，这到底是一次划时代的成功呢，还是翻车呢？我个人的感受呢，这又是一次划时代的胜利。</p>



<p>Qwen3真正在跟谁竞争？大家要想清楚：LLAMA 4、DeepSeek R1、Claude 3.7、Gemini 2.5、GROK3、GPT O3 O4这样的模型，到底在跟谁竞争？实际上真正去跟Qwen3竞争的只有一个，就是LLAMA4。其他的都不在同一个起跑线上。</p>



<p>LLAMA4呢，是翻车了。它怎么翻车的？第一个是数据造假，或者叫过拟合。拿直接去跑分的题目进行训练，这样跑分效果特别好，但是实际使用的效果差异巨大。这是LLAMA4翻车的一个最根源的原因。</p>



<p>咱们从另外一个角度上来讲，LLAMA4自己其实是有一些问题的。第一个是什么？就是它公开的模型太大，占资源很多，放弃了绝大多数的场景。他就开源了一个104B，一个400B的模型。普通人你拿他没办法，像我的电脑根本跑不起来。你就算部署到云端的话，它占资源也是占的非常多的。就对于这个经济性来说，一点优化都没做。你说我想在手机上跑，想在嵌入式设备上跑，没做这个准备，他就不惦记。甚至还有一个两T的模型，压根都没有发布出来。他就发布了一个109B，一个400B，其他都没有了。</p>



<p>而且这么大的模型，你想去微调那太痛苦了。就是你想微调一个模型，模型越小越好调。你模型越大的话，你调起来甭管是你的数据还是算力，都是非常巨大的成本。现在看的LLAMA，应该是准备走XAI这条路。</p>



<p>XAI是什么路？假开源。为什么马斯克的XAI叫假开源呢？就是我确实把东西开出来了。他承诺的是什么呢？就是我发布新版本，我就把旧版本开源。而且呢，开出来的东西，你要想调用的话，你也调不了。为什么？我只把那最大的模型出来，哐昌往那一扔就完了。各种的文档，各种东西都很少，你部署上去也不划算。</p>



<p>所以呢，我开源了吗？开了，东西也放这了。能用吗？没法使。你提任何问题、提任何要求，说哪给我改一东西，也没人理你。这就是XAi的玩法。</p>



<p>你要想调用这些东西怎么办？到我服务器上来调用XAI的API，这个是没问题的。我现在也在Grok的服务器上去调用它的API，效果也还可以。但是你说有没有第三方去部署Grok模型，然后让大家去调用呢？没有。因为你现在开源出来的版本低，它的效果没有那么好。你要想使用最新的，你只能在他的服务器上使。以后呢，Meta估计也要走这条路。</p>



<p>那你说为什么没有人骂XAi呢？原因很简单，因为XAi一直就这样。从x开放出来的这个推荐算法，开放出来以后，就再也没有更新过任何代码。你提的所有问题，连回复都没有人回复。XAi更新出来的Grok开源模型也是如此，开源出来啪往那一扔，彻底没人理你了。所以它一直这样。</p>



<p>而LLAMA呢，原来是比较开放的。现在大量的模型都是在LLAMA基础上做出来的，包括Qwen早期的模型，都是在LLAMA基础上做出来的。那现在呢，有点越来越回去了，所以有点怒其不争。大家要骂一骂他，看看能不能把他骂回来。</p>



<p>然后另外一个，LLAMA4被人骂的原因是什么？他不支持MCP。现在是一个做Agent的时代，你不支持MCP，你模型能力再强，你也搞不定各种场景。现在即使是你使用GBT 4O或者GBTO 3这样的模型，你没有一些外接的组件，你根本就跑不出结果来。所以你不支持MCP，这事肯定不行。</p>



<p>还有呢，就是LLAMA对用户是有限制的。LLAMA虽然是开源模型，但是呢，不能进行商业使用。你只能拿去做研究。你说我拿这东西做商业使用了，对不起，你会收到律师函的。而且如果你是一个大公司，月活用户数超过7亿的公司，你如果想使用LLAMA4或者LLAMA早期版本，你需要向Meta做单独的申请。申请通过了以后你才可以去使用，否则不让用，就做了很多限制。</p>



<p>这个反面典型讲完了，咱们讲一讲Qwen3跟LLAMA4比较起来是怎么样的。Qwen3完全开源，你爱干嘛干嘛去，想怎么调怎么调。第二个，体积小，参数少，规格全，性能高。从0.6B就开始，所有的都给你发一遍，爱用哪个版本用哪个版本。这些小体积的模型，经过微调之后应该会一统江湖。</p>



<p>什么意思？就是现在在hugging face上，绝大部分的模型都是拿Qwen2.5、Qwen2这些各个尺寸的模型调出来的。</p>



<p>早期的LLAMA还是各个尺寸都有的。现在到LLAMA4，前面那些小的模型就不出了。Qwen3又把所有的模型都出了一遍，那大家就拿来微调呗。你说哪块不满意，我就专门把它调一调，训练一下上去使不就完事了吗？所以一定会一统江湖的。</p>



<p>而且，Qwen3是原生支持MCP的。我在本地部署了OLAMA 8B的模型，使用Cherry studio测试了一下，支持没有任何问题。但是呢，支持的并不是那么顺畅。30B和32B的模型我在本地也装了，完美支持MCP，没有任何问题。</p>



<p>那你说什么叫支持的不顺畅？什么叫支持的顺畅呢？在这跟大家讲一讲使用MCP的过程。其实很简单，MCP也是描述一下工具，说我这有一工具，这工具叫什么什么名字，输入的参数是什么，输出的参数是什么，能干什么。大概是有这样的一个描述文件，你把这描述文件给到大模型以后呢，大模型会根据你提出的要求，来生成一个调用这个工具接口的代码。</p>



<p>这个8B的模型呢，有时候生成的代码会有点小错误，导致呢调用失败。那调用失败了以后呢，他会换一个方式，再调另外一个接口，然后会得出一个需要的结果出来。你使用32B模型，或者30B的Qwen3模型的话，你把一大堆的描述扔给他以后，他就会正确的找到需要使用的接口，需要使用的工具，然后生成调用代码直接调。调完了以后得到结果，需要再调用的话，还可以在一次推理里头多次调用，然后得到结果。</p>



<p>因为我是放的高德地图的MCP进去，说来给我规划一个旅游路线，这个效果好极了。完完全全在本地，当然高德地图那个服务器不在本地。其他的，他的Qwen3，OLAMA，Cherry studio都是在本地跑起来了，所以这块效果好极了。</p>



<p>现在呢是大模型密集发布的一个周期。前面我们看到了Gemini 2.5 Pro，Gemini 2.5 Flash，GPT也在快速的连续发布。后边还会很快看到一些新东西，包括马斯克下周要发布的Grok 3.5。Qwen3出来以后，如果有哪些方面超越了它，那它是肯定是要更新的嘛。GPT5应该也快了，这就是这样的一个风起云涌的大时代。</p>



<p>好，总结一下吧。Agent时代一定要有一个对Agent友好的模型发布出来，才会被大家叫好，才算是一次成功的发布。体积小，参数少，规格全，性能高，只要可用性不退步，方便微调，这些特性都具备的话，再加上前面的MCP的功能，Qwen3绝对是一次划时代的成功。好，这就是今天讲的故事。</p>



<p>大家赶快去玩耍起来！好，感谢大家收听。请帮忙点赞，点小铃铛。参加DISCORD讨论群。也欢迎有兴趣、有能力的朋友加入我们的付费频道。再见！</p>
]]></content:encoded>
					
		
		
			</item>
		<item>
		<title>ChatGPT记忆功能并非小打小闹：揭秘山姆·奥特曼兴奋失眠背后，OpenAI从流量到用户的战略野心与AI助理的个性化革命</title>
		<link>https://lukefan.com/2025/04/13/chatgpt%e8%ae%b0%e5%bf%86%e5%8a%9f%e8%83%bd%e5%b9%b6%e9%9d%9e%e5%b0%8f%e6%89%93%e5%b0%8f%e9%97%b9%ef%bc%9a%e6%8f%ad%e7%a7%98%e5%b1%b1%e5%a7%86%c2%b7%e5%a5%a5%e7%89%b9%e6%9b%bc%e5%85%b4%e5%a5%8b/</link>
		
		<dc:creator><![CDATA[Luke Fan]]></dc:creator>
		<pubDate>Sun, 13 Apr 2025 00:41:40 +0000</pubDate>
				<category><![CDATA[AIGC]]></category>
		<category><![CDATA[A2A]]></category>
		<category><![CDATA[AGI (通用人工智能)]]></category>
		<category><![CDATA[AI Agent (智能代理)]]></category>
		<category><![CDATA[AI助理]]></category>
		<category><![CDATA[AI行业发展]]></category>
		<category><![CDATA[Anthropic]]></category>
		<category><![CDATA[API]]></category>
		<category><![CDATA[ChatGPT]]></category>
		<category><![CDATA[Google (Gmail)]]></category>
		<category><![CDATA[MCP (模型调用协议/工具调用)]]></category>
		<category><![CDATA[Meta]]></category>
		<category><![CDATA[OpenAI]]></category>
		<category><![CDATA[RAG (搜索辅助生成)]]></category>
		<category><![CDATA[Sam Altman]]></category>
		<category><![CDATA[Sam Altman (山姆·奥特曼)]]></category>
		<category><![CDATA[Token限制]]></category>
		<category><![CDATA[XAI (Grok)]]></category>
		<category><![CDATA[个性化体验]]></category>
		<category><![CDATA[个性化设置]]></category>
		<category><![CDATA[临时聊天]]></category>
		<category><![CDATA[人工智能 (AI)]]></category>
		<category><![CDATA[共享账号限制]]></category>
		<category><![CDATA[关键一步]]></category>
		<category><![CDATA[大语言模型 (LLM)]]></category>
		<category><![CDATA[字节跳动 (ByteDance)]]></category>
		<category><![CDATA[小模型]]></category>
		<category><![CDATA[平台战略]]></category>
		<category><![CDATA[微调 (Fine-tuning)]]></category>
		<category><![CDATA[微软 (Microsoft)]]></category>
		<category><![CDATA[携程 (Ctrip)]]></category>
		<category><![CDATA[数据安全]]></category>
		<category><![CDATA[无状态服务]]></category>
		<category><![CDATA[有状态服务]]></category>
		<category><![CDATA[本地知识库]]></category>
		<category><![CDATA[流量转化]]></category>
		<category><![CDATA[消费互联网公司]]></category>
		<category><![CDATA[生态系统]]></category>
		<category><![CDATA[用户画像]]></category>
		<category><![CDATA[用户留存]]></category>
		<category><![CDATA[用户粘性]]></category>
		<category><![CDATA[用户记忆]]></category>
		<category><![CDATA[百度 (Baidu)]]></category>
		<category><![CDATA[缓存Token]]></category>
		<category><![CDATA[美团 (Meituan)]]></category>
		<category><![CDATA[聊天记录引用]]></category>
		<category><![CDATA[腾讯 (Tencent)]]></category>
		<category><![CDATA[苹果 (Apple)]]></category>
		<category><![CDATA[记忆功能]]></category>
		<category><![CDATA[账号登录体系]]></category>
		<category><![CDATA[长期记忆]]></category>
		<category><![CDATA[阿里 (Alibaba)]]></category>
		<category><![CDATA[隐私保护]]></category>
		<category><![CDATA[高德地图]]></category>
		<guid isPermaLink="false">https://lukefan.com/?p=2091</guid>

					<description><![CDATA[**啊啊啊啊啊！ChatGPT记忆功能杀疯了！打工人狂喜啊啊啊！**

姐妹们！！重大消息！！！
OpenAI这次更新直接让ChatGPT成精了啊！！！
以前每次开新话题都要重新自我介绍的日子终于结束了！！
现在它居然会偷偷记住你的口味/习惯/黑历史！！！

👉🏻**打工人真实落泪场景**：
- 早上让它写周报👉🏻秒懂你老板的变态要求
- 中午找餐厅👉🏻自动过滤你过敏的香菜！！
- 晚上查游戏攻略👉🏻连你卡关的关卡都记得！！！

**最绝的是‼️**
它现在能模仿你的文风写邮件了啊啊啊！！
再也不用被同事说「一看就是AI写的」了！！
（本社恐终于敢用GPT回老板消息了呜呜）

⚠️但要注意！！
- 记忆容量只有1400字！重点信息要手动「加星标」🌟
- 临时聊天记得开「隐身模式」！否则黑历史全存档！！
- 共享账号党快逃！！现在能看到别人的饮食偏好了！！

**山姆·奥特曼都嗨到失眠的真相👇**
这哪是更新啊！根本是给AI装了个「灵魂U盘」！！
以后用ChatGPT越久👉🏻它就越懂你👉🏻根本离不开！！
（其他AI瞬间不香了！OpenAI这波在大气层！！）

**冷知识💡**
记忆功能其实是「用户绑架计划」！！
等你存够100条偏好...
迁移成本高到直接锁死！！（细思极恐但真香！）

都给我冲！！这波更新打工人直接弯道超车！！
（不会用的宝子评论区扣1，连夜出教程！！）

ChatGPT记忆功能并非小打小闹：揭秘山姆·奥特曼兴奋失眠背后，OpenAI从流量到用户的战略野心与AI助理的个性化革命

ChatGPT最新推出的记忆功能引发广泛关注，这不仅是一项技术更新，更是OpenAI战略布局的关键一步，让CEO山姆·奥特曼也为之兴奋。该功能允许ChatGPT记住用户的聊天历史和偏好，无需用户重复介绍自己，还能根据个人风格调整回应，使AI助手体验更加个性化和贴心，用户亦可随时管理或关闭记忆、使用临时聊天以顾及隐私。然而，其深层意义在于推动OpenAI从提供无状态大模型流量转向构建具有高用户粘性的平台，旨在将用户转化为忠实客户，实现成为十亿人使用的服务平台的目标。这项记忆功能未来可能演变为更强大的AI Agent基础，通过OpenAI账户统一登录，为其他应用提供深度个性化信息（如饮食偏好、观看历史），远超现有社交或邮箱登录所能提供的范畴。尽管目前存在字符数限制（约1200-1400字），但这可能出于技术成本和用户接受度的考量，预示着未来向本地知识库（RAG）和微调模型发展的可能。此举对整个AI行业影响深远，不仅巩固了OpenAI的领先地位，也促使谷歌、Grok等竞争者加速布局个性化功能，并预示着AI在电商、服务等领域的商业化应用将迎来新浪潮，推动人工智能助手向更智能、更实用的方向发展。]]></description>
										<content:encoded><![CDATA[
<figure class="wp-block-embed is-type-video is-provider-youtube wp-block-embed-youtube wp-embed-aspect-16-9 wp-has-aspect-ratio"><div class="wp-block-embed__wrapper">
<iframe loading="lazy" title="ChatGPT记忆功能并非小打小闹：揭秘山姆·奥特曼兴奋失眠背后，OpenAI从流量到用户的战略野心与AI助理的个性化革命" width="900" height="506" src="https://www.youtube.com/embed/LdbZHzV0670?feature=oembed" frameborder="0" allow="accelerometer; autoplay; clipboard-write; encrypted-media; gyroscope; picture-in-picture; web-share" referrerpolicy="strict-origin-when-cross-origin" allowfullscreen></iframe>
</div></figure>



<p>ChatGPT推出了记忆功能，这是整个行业迈出的非常重要的一步。大家好，欢迎收听老范讲故事的YouTube频道。这是让山姆·奥特曼都兴奋得睡不着觉的一个功能，也就是给ChatGPT加GE。很多人都在讲说这个好像并没有多难，使用起来也没有觉得有多大的差异。这样的一个功能，怎么到老范这就变成了整个行业迈出了关键一步？到了山姆·奥特曼那里，就变成了兴奋的睡不着觉了呢？这到底是一个什么样奇葩的功能？有什么是大家没有理解到的？今天咱们来讲一讲。</p>



<p>在2025年4月10号，山姆·奥特曼发了一条推，说：“有那么几次，我会因为太兴奋而早早醒来，再也睡不着。今天就是这样的一天。”今天我们就来讲一讲这个GPT的记忆功能，为什么这么强大、这么好，能够让山姆·奥特曼都兴奋的睡不着，能够让老范来说这是整个行业迈出的关键一步。那么，ChatGPT的记忆功能其实以前也有，并不是没有，不是说到4月10号才推出的，而是4月10号做了一个相对比较关键的更新。那么更新了哪些东西呢？</p>



<p>第一个就是它直接可以引用我们的聊天记录了。它可以根据我们跟ChatGPT聊天的过程来去提取各种需要具体记下来的信息，而不需要像原来那样很显示的告诉他说：“请记住这个，请记住那个。”这个都不需要，现在他是完全可以自己记下来的。而且在后面我们跟ChatGPT聊天的过程中，可以非常灵活的来利用这些记忆，让ChatGPT变成一个越来越懂我们的助手。</p>



<span id="more-2091"></span>



<p>那么，ChatGPT记忆功能到底有什么样的好处？首先咱们先看官方给出的信息。这个信息是由ChatGPT自己提供给我的，说第一个无需重复介绍自己了。原来我们每一次跟ChatGPT聊天的时候都需要重复的去介绍，哪怕是同一个人。我今天也要告诉他说：“今天是要去查一个什么资料，我要去做YouTube，你要去给我写提纲。”待会我要开一个新话题，开了新话题，他又不认识我了，那我要再重新介绍：“我今天要出去吃饭，喜欢吃什么，你去找相应的饭馆。”待会我再开一个新话题，他又不认识我了，我再跟他说：“我是一个游戏玩家，我最近在玩什么什么游戏，请帮我去查个攻略。”大家注意了没有？我是开了三个话题，做了三次不同的自我介绍。那么这就是一个很关键的信息，这叫有状态与无状态。其实我们每一个人都有非常多的层面，那么你每一次去跟他沟通的时候，如果ChatGPT不知道你到底要干什么，不知道你今天到底是以一个Youtuber的身份……</p>



<p>或者是一个要去吃饭的老饕，还是说一个游戏玩家的身份去跟他沟通，他没法去给你做回答。那么现在，你不需要反复地去介绍这件事了。你只需要跟他说：“哎，我吃饭去了，我在这边有什么好吃的？”GPT就可以很好地根据你以前聊天的信息说：“原来这个人喜欢吃日料，我要去给他推荐日本料理。”</p>



<p>这是一方面。另外一方面，很多人觉得这些人工智能像人工智障，是因为什么？是因为经常说：“我刚跟你讲过，你怎么就不记得了？”大家都会有这样的感受。但是你想，你只要每一次点击“开始新话题”的时候，他就是要把原来东西忘干净的。要不然，他再去给你提供各种信息也会混乱的。</p>



<p>我举一个例子，比如说我先跟他聊了半天说吃饭，我要去吃日料怎么怎么回事。待会我接着跟他说：“我现在想打一个游戏，这个游戏是怎么怎么回事的时候。”他会接着跟你讲日料的事情，他没有办法快速的进行切换。大模型在这块上还是要稍微的差一些。我们还是如此不停地去开新话题，每次开新话题它就刷新一些信息。但是有了记忆功能以后的GPT，虽然它把话题刷新了，但是我们的一些基础信息它是知道的。你不需要重复介绍了，你可以告诉他说：“我现在要去吃饭。”这是一个刷新新话题，但是它能记着你爱吃什么，这个还是很重要的。</p>



<p>除了这个优点之外，还有一个很重要的是什么？它可以根据个人的写作风格、兴趣和使用习惯，自动调整回答方式。很多人都说这个东西AI味那么浓，一写出来东西就是AI写的。那么以后就不会有这种问题，我们可以把ChatGPT生成的东西去进行修改、调整之后说：“我喜欢这样的一个风格。”那么以后这就是一个你个人的风格了，没有办法再说这一看就是ChatGPT的味了。他不会再干这种事情了。那么ChatGPT就会变成一个真正懂你、贴近，比以往更像一个专业助理的AI助理了。</p>



<p>甚至很多的大老板的助理，替大老板回邮件，替大老板去发微博，他们都看不出来这到底是谁发的。我记得我以前有一个同事，他就是给李开复管理微博账号的。那么以后ChatGPT就可以来替我们做这些事情了。它是可以用我们的口气，用我们的习惯去发各种社交媒体了。</p>



<p>这些记忆你说你都记住了，万一记错了怎么办？这个不用太担心，可以自己设置。在ChatGPT的界面里头，有一个叫“个性化”的菜单，打开了以后可以去设置关闭记忆功能或者打开记忆功能。你可以自己去设，你也可以管理和删除特定的记忆，说：“我把这个东西删掉，这条你给我忘掉，不允许记住。”因为总有社死的时候。</p>



<p>你也可以直接明确地跟他讲：“这事你给我记着，下一个事忘掉，这个事不要记住。”</p>



<p>你可以聊天的时候直接跟ChatGPT说，它可以自动修改这个记忆库。当然，你也可以开临时聊天。打开临时聊天，那么这一部分的内容就不会被记下来。</p>



<p>所谓不会被记下来，我们这里要提醒大家：OpenAI服务器上还是记着的，只是不会被用来生成下一次内容。这个是要注意的，千万不要以为开了临时聊天，你聊的内容他们就都忘掉了。不，不是这样的。</p>



<p>实际上，很多人都会讲一个笑话：拿出手机输入法来，打哪几个字母，看看排在第一个的是什么。比如输出了一个什么样的词，就说明你是个穷屌丝；如果你打了几个字母出来是一个别的词，你可能就是一个有钱人。</p>



<p>为什么？我们的拼音输入法把我们的一些输入习惯记下来了。在这里要稍微先进一些，你可以要求它记录，或者要求它不记录，可以更好地来控制，不会很容易被人发现我们的屌丝本质。</p>



<p>现在是Plus跟Pro的用户已经可以用了，未来免费用户也会可以用。至于其他的Teams用户，或者说一些企业用户和学生用户是不是可以用，还不好说。因为对于他们来说，隐私保护会更加敏感一些。</p>



<p>这些记忆是有容量限制的，不是无穷无尽的，可以一直记下去的。它的记忆限制很怪：1,200-1,400字。这个数字非常奇怪，而且无法扩容。我去问ChatGPT，我说：“我希望这数大一点，我给钱行不？”他说：“不行。”没有任何的途径可以让记忆空间变大。</p>



<p>那么这个容量的标记方式很奇怪：<br>1. 它居然是个字节数，不是说我记了多少条，或者是记了多少聊天记录，都不是。它是1,200字到1,400字。<br>2. 它不是一个确定的数字。像我们程序员一般会说：“你这就是1,000字，或者1,024个字，或者是2,000字，都是OK的。”它应该是个死数。现在OpenAI给出的是一个范围：1,200到1,400，这个我就不知道怎么回事了。</p>



<p>还有一点是什么？这个数不大，就是1,000多字。按道理来说，我们都认为它应该记很多东西在里头，但是并没有，只有1,000多字被记录进去了。</p>



<p>如果你把它记满了，你可以进去删，说：“这些不要了，我删掉，剩下的你再接着给我继续。”这个是允许的。你可以自己去整理记忆，就像是《哈利波特》里邓布利多的记忆盆——他可以把一些不太用的东西直接抽出来，需要的东西再塞回去。他可以干这样的一个事情。</p>



<p>那么，这背后应该也是隐藏着一些秘密的。</p>



<p>待会我们再去分析秘密。这是官方提到的一些信息。刚才讲的所有这些信息，都是ChatGPT直接给我生成的。下边咱们来讲一讲官方没有提到的好处。</p>



<p>光看前面这些好处好像是挺厉害，但是绝对达不到说整个行业迈出重要一步，或者山姆奥特曼都可以兴奋到晚上睡不着觉的一个状态。那么，只有没说的这部分才可以达到这样的效果。那到底是什么？</p>



<p>第一个，共享账号这件事没法搞了。你看这里头有记忆了，那我下一次我去跟人共享的时候，我就可以看到别人的记忆，或者别人可以看到我的记忆。这事肯定不行。那大家一定要好好的去买账号。这个肯定是可以让山姆奥特曼稍稍的小开心一下了，但是还达不到让他兴奋的睡不着觉。</p>



<p>很重要的一步是什么？这是真正的从流量向用户转换的关键一步。什么叫流量？什么叫用户流量？我们知道有人来了，但是我不知道他是谁。他也没有办法下一次回来以后继续去做原来的事情。这个东西就叫流量。像很多的互联网公司里面，他们的用户实际上都是流量。谷歌原来它的用户也是流量。比如说我们到谷歌这来搜索，搜索完了点击了搜索结果，实际上我们都是流量。我们并不是它的用户，我们也没有归属感，说下次我还要用谷歌的账号去做什么事情，有什么样的好处，并没有这些东西。</p>



<p>那谷歌是怎么完成从流量到用户的转换呢？它推出了一个非常重要的产品叫Gmail。我们把自己的邮箱存在谷歌了，里头存了我所有的收发邮件，存了我的日历，存了我的通讯录。那么我们对于谷歌来说，就正式从流量变成用户了。流量是没有粘性的，我这次来了，下次我就不来了。但是用户是有粘性的，我的Gmail在谷歌里边，我下次是还要来用的。我不可能说把这个东西进行迁移，非常麻烦。</p>



<p>现在OpenAI也迈出了这一步，从流量变成了用户。原来这么多大模型，在这里你方唱罢我登场。我们不停的去试谁家的模型，稍微好用了一点点，马上就转型。现在不行了，因为OpenAI ChatGPT把我的各种聊天信息都记在里头了。我希望有一个更懂我的助理为我服务，那我就要去使用ChatGPT，我就不能去使用Gemini，我就不能去使用其他的这些大模型了。这个是非常重要的一步。</p>



<p>那么，山姆奥特曼就会为这件事睡不着觉吗？山姆奥特曼前几天接受了一次采访。有人问他说，你的目标到底是什么？到底是不是要去做AGI，要让整个人类进步什么的？后来山姆奥特曼说，我其实已经没有那么天真幼稚了，我现在已经转变想法了。</p>



<p>最早开始做OpenAI的时候，我们确实是这么想的，但是现在已经变了。变成什么了？这是一家互联网消费公司。我们要做的是一个巨大的服务平台，我们的目标是10亿人使用的服务平台。</p>



<p>什么是10亿人使用的服务平台？微信、抖音、Facebook、谷歌、苹果，这些是10亿人使用的。X都达不到，那真的没有10亿用户。全世界能够达到这样标准的平台，没有几个。这才是OpenAI真正的目标。现在等于是在向这个目标迈出了非常关键的一步，可以让山姆·奥特曼睡不着觉，早晨一醒来以后就没法再去入睡了，非常兴奋。所以这很关键。</p>



<p>当时在采访的时候，山姆·奥特曼说了这样的一句话，说大家以后都要用OpenAI的账户来登录，就像是现在大家用谷歌的账户，或者苹果、Meta的账户登录一样。为什么这么干？因为登录以后，OpenAI可以提供专属的微调模型和各种的私有信息，来协助其他平台更好的为你服务。</p>



<p>这话什么意思？其他账户登录，比如说我们用谷歌账户登录了。现在很多的应用都是用谷歌账户登录的，那么登录了以后，谷歌会提供基本信息，包括什么姓名、邮箱、头像、联系人，还有日历，包括我们的Google Drive上的一些文件。你进行授权以后，使用谷歌账号登录的这些应用的话，都是可以去访问的。并不光是说证明了一下你是谁就完事了，这些都可以去访问。</p>



<p>如果我们用Facebook的账户登录了，它不但是可以知道我们的姓名、头像、性别，还可以得到我们的朋友列表和点赞页面。如果是用Twitter账号登录了，他可以得到关注消息、推文、用户资料、点赞和私信的这些权利。如果是用微软账号登录了，可以得到我们的基本资料、用户名、日历、邮箱、One Drive、团队信息。我们用微软账号去登录了其他的一些应用，比如说现在有一个应用叫做画图。我用微软账号登录了以后，最后他就来问你说，我是不是可以有权利把我画好的图存到你的微软的云盘上去？你只要确认一下，它就直接存上去了。但是微软也要去得到你确认的过程，你不确认它，这是没有权限的。所以它有很多的权限是需要后申请的。</p>



<p>如果我们用微信登录了，它也可以得到我们的昵称、性别，以及我们所在的省市、国家和头像，这个都是可以得到的。那么这些对于OpenAI来说都弱爆了。为什么呢？当我们平时聊天的信息都存入到ChatGPT里边以后，我们的专属助理就生成了。那我们这些专属助理可以干嘛呢？当我用OpenAI的账户去登录一个，比如说订餐网站的时候。</p>



<p>这个订餐网站就知道我吃什么，知道我吃什么过敏，知道我不爱吃什么。他也知道说在这个季节里头，有哪些新鲜的食材是我一定要去吃的。对于餐厅为我提供更好的服务，是非常重要的信息。</p>



<p>当我想去找一部美剧来解决剧荒问题的时候，这个助理是知道我看过哪些美剧，而且知道我看到第几季第几集了。还知道我喜欢什么类型的美剧，以及喜欢哪些小说和明星。他可以非常好的来为我推荐。</p>



<p>山姆他们向着他的目标，迈出了非常重要的一步。这就是山姆他们为什么兴奋的睡不着觉。那么从容量限制，我们看到了这个里面到底有什么秘密。我们可以猜测一下，以及ChatGPT记忆功能未来发展的方向，都可以从这里去稍微的猜测一下。</p>



<p>刚才我们讲到，它这个数字很怪：1,240-1,440。为什么是这样的一个数？应该是每次聊天的时候，都可以直接将这个1,000多个字符扔到提示词里边去。它占的TOKEN量并不是很大。而且要注意，OpenAI的API对于TOKEN输入的时候，它是有两个不同的价格的：一个是缓存内的TOKEN，一个是缓存外的TOKEN。那所有的记忆信息都属于叫缓存内的TOKEN，就本来就存在它服务器上，成本就更低了。所以它完全可以在我们每一次聊天的时候，都直接把这1,000多字塞进去。</p>



<p>这个字多了肯定是塞不下的。那么存储更多的信息对于OpenAI来说，本身成本其实并不高，相当于开个网盘呗。你想一个网盘能有多贵？而且现在网盘都是一开就是多少个g的空间，这1,000多字算啥？所以存并不费劲。但是你存太多了以后，用户也会担心什么：你ChatGPT会不会变成熟悉的陌生人？我有很多信息，我并不希望你知道。或者说，当我们发现ChatGPT了解我们很多信息的时候，你会感觉吓人的。所以他这个数一定要控制的稍微小一些。</p>



<p>如果这些信息变多了，比如说不再是1,000字到2,000字，而是100万字200万字了会怎么样？它处理起来还是要稍微麻烦一些。你不可能说我每一次产生结果的时候，去做问答的时候，都把一两百万字塞进去，这个事不太现实了。所以到那个时候，它可能需要额外的去做本地知识库，类似于RAG这样的东西，叫搜索辅助生成，要去做这个。还有的干脆是去微调小模型。原来苹果要去推出apple intelligence的时候，当时他们也讲到说，我们就想去给大家微调小模型，让你们在苹果电脑上就有一个根据你们的信息微调出来的小模型，非常懂你。</p>



<p>但是目前为止，他也没做出来。这个还是挺难做的，微调小模型也好，做这种本地知识库也好。这是山姆他们未来的设想，因为他前面接受采访的时候已经说了：“你们以后只要用OpenAI的账号，登录我给你的这些知识库，给你的这些微调的小模型，就可以直接使用了。”</p>



<p>一旦真的走到了Azure GPT帮我们存储本地知识库，和微调一堆小模型的时候，迁移成本就会无限放大，等于就彻底捆死我们了。我们再想从OpenAI的平台上离开，就基本不可能了。那么未来会变成什么样？未来更多的信息会被记录下来，这个一定是这样的。到那个时候，可能会花钱去购买更多的存储空间，这个是个玩笑了，不重要。</p>



<p>未来真正的变化是，大模型都会变成agent。现在大家玩的是模型，以后就都变成代理。那么现在谷歌刚刚发布了叫a to a的一个开源接口，这东西干嘛使的？就是让大模型之间聊天的。再加上MCP，谷歌、OpenAI、Azure现在都支持MCP了，它可以去调用各种的外部工具。比如说像刚才我讲的，去给我订餐、订酒店，帮我去订各种行程，帮我去查询各种知识，现在都可以通过MCP把这东西接进来了。</p>



<p>当这些东西都普及了之后，以后的大模型会变成一个统一入口。这个山姆他们也讲过了，说这就是GPT5给大家的形式。什么意思？以后我们再去跟ChatGPT聊天，再去跟各种的AI助手聊天的时候，你不需要去选了。你不用上来选我今天要跟GPT4聊天，还是GPT4O聊天，还是跟O1聊天、O3聊天还是跟谁聊天，你不需要选这玩意。你都是在跟GPT5聊天，GPT5会根据说你的要求，我来决定调哪些东西，我来决定走哪一个agent的路径来去帮你服务。这个是未来的一个方向。</p>



<p>到那个时候，他会自行来判断到底要去引用哪些记忆。我们来想一想，我们跟人打交道的时候，或者说真的跟一些助理打交道的时候，也是如此的。你不会站在那先去跟他讲，说你今要给我处理什么事了，他会自动的来去判断你今天到底要用哪一部分的知识来去完成相关的任务。</p>



<p>到那个时候，ChatGPT也好，或者其他的AI助手也好，就会为每个用户建立一个分类知识库和私人助理。他们会根据我们的上下文聊天，自动的去调用相应的知识库，形成相应的助理。到那个时候，会由AI来掌控更复杂的权限。什么意思？就是当我们要是授权这些助理去给别人干活的时候，比如说我今天把一个我爱吃什么饭的助理授权给了一个饭馆，那么它就不能去调出来我的其他信息。</p>



<p>我的收入、我的工作，这些东西你是不能调出来的。但是，它可以调出一些我爱吃什么，或者说我对餐厅有一些什么其他的要求。他可以把这些信息调出来。那么，这一部分以后都是要由AI来掌控的，不会由人来掌控。</p>



<p>说我今天先设好了，说这个助理可以访问哪些信息，那个助理可以访问哪些信息，哪个助理可以给谁授权。这个以后肯定都是由AI来处理，要人处理是处理不过来的。</p>



<p>而且，再往后发展是什么？我们今天讲的都是自己的记忆，因为ChatGPT有记忆了，所以我们不能去做共享账号了。但是，以后我们还需要去处理其他人的记忆和其他人的助理。这是什么意思？</p>



<p>假设吧，当我们需要为其他人服务的时候，就直接可以跟他们的助理沟通了。或者说，我们可以将他们的助理再介绍出去，直接去干活了。举一个例子，比如说今天我是个导游，我带了一帮朋友出来玩来了。到时候我需要去安排餐厅，那安排餐厅怎么办？我就先让这些游客把他们的助理都授权给我，我再把这些处理授权给了一个餐厅。</p>



<p>这个餐厅就可以根据每一个人的口味，去帮他们安排饮食，就可以来做这些个性化服务了。这个在以前是没法实现的，现在都可以实现了。比如说我今天做了一个导游的APP，谁让我去导游了，你们就用你们的OpenAI账号来登录我的导游APP。我们加入到一个游览的群里边去，等我再去餐厅订餐的时候，我就把游览群里边的每一个人的OpenAI账号授权给餐厅。</p>



<p>然后，餐厅就可以跟你们的助理去聊天了，去了要吃什么呀？最近在减肥，就吃一些清淡的；最近口重，想吃点咸的；最近怀孕了，酸男辣女，什么样的？大家要去稍微调整一下口味，这都没问题。以后都可以让每一个人都像带着一个助理出门一样，咱们之间就有更好的服务。这可能是大家可以憧憬的一个美好未来。</p>



<p>再讲一下，为什么在这个时候可以去宣布这件事？其实绝大部分的AI助手都是无状态的。刚才咱们讲过什么是无状态，这里不重复了。第一个是要解决隐私的顾虑，因为大家都觉得我们把很多的隐私交给AI，是一件很危险的事情，很恐怖的事情。所以原来咱们不说这个事。</p>



<p>降低运营成本也是很重要的，因为AI是按TOKEN收钱的。每一次回答问题之前，我先去看一下你是谁，还是挺贵的。还有一个重要原因，是要降低用户的心理预期。每一次当这个AI说胡话的时候，你就告诉用户说：“反正我是无状态服务，我也不知道你是谁，我就说成这样了，你也不要对我有太高的要求。”</p>



<p>给AI助手添加记忆这件事，在技术上其实并不困难。</p>



<p>只是舆论跟社会压力太大。</p>



<p>ChatGPT其实一直都有聊天记忆的功能，原来就有，只是原来并没有大张旗鼓的宣传。到4月10号，终于可以宣传一下了。那么，这个时间点为什么这么重要？</p>



<p>原来，ChatGPT是唯一一个有记忆功能的AI助手。但是，Grok来了，就是XAI的Grok。它可以根据我们的推文，给我们一个个人描述。你去检查一下，说你的AI助手到底有没有记忆功能，实际上很简单。你上来就问他一个问题：“你认为我是一个什么样的人？”或者说：“根据你对我的了解，给我一个描述。”你就给他这样的一个提示词。</p>



<p>在4月10号之前，ChatGPT也会给你一个很好的描述，而且那个时候，那个描述还写得特别的肉麻。什么时候心情不好了，你去问他，你看完了以后，你觉得我好像混的还可以。他是这样的一个状态。</p>



<p>Grok也开始提供这种功能了，所以OpenAI说：“那既然你也来了，我就不藏着掖着了。”我就开始打明牌了，直接公开。而且，山姆·奥特曼前面也透露了他的真实目的。原来还在这装清高，说：“我要为人类怎么样，我要为社会怎么样，我要去搞AGI。”前面去接受采访的时候，已经说的很清楚了：“在OpenAI开始融资之后，我们就已经清晰的认识到，这就是一家消费互联网公司。我就是老老实实来挣钱的，没有那么多虚头巴脑的东西。”</p>



<p>成为新的平台公司和流量入口，就是山姆·奥特曼的一个最终目标。我就是来挣钱的。现在，山姆·奥特曼又一次为整个的行业指明了方向：“大家上！”</p>



<p>在这个过程中，谷歌肯定有能力，没有任何问题。但是，内部的桎梏太多。因为前面也是做了好多年的圣母，现在在这一块上技术不难，但是他的舆论，包括伦理社会压力很大。这个弯子到底怎么转过来？估计谷歌还要稍微的转一段时间。</p>



<p>XAI的Grok这没什么问题。马斯克是信第一性原理的，所以应该会快速跟进。而且手里头还有我们发的推文，走这一步是顺理成章的。</p>



<p>Anthropic呢，要稍微麻烦一点。为什么？因为它主要是ToB的。现在即使在ChatGPT里头，记忆功能也没有向Teams用户去开放。因为在这块还是要更敏感一些。我办公室用的各种记忆，跟我家庭的各种记忆，他还是不是那么容易分清楚的。</p>



<p>至于Meta，现在连应用都没怎么做好，还是要继续努力。Meta属于只有模型没有应用。原来我们讲叫“模型及应用”，但是只有模型没应用，这条路也是走不通的。</p>



<p>至于国内，阿里跟字节必然会在这条路上狂奔，没什么好说的。卖东西，甭管阿里还是字节，后边实际上都是电商平台。</p>



<p>一旦说可以形成客户信任的助理了，那么他就可以直接帮客户下单、买东西了。这也可以很好地解决整个AI行业不挣钱的一个问题。所以，为什么我说这是整个行业的巨大一步，被今天迈出去了。</p>



<p>至于腾讯呢，它有点像谷歌，后面包袱也很重。为什么？因为它是一个很重很重的社交平台，我们所有的社交关系都在上面。他在这个里面去做助理，他一定是要非常小心谨慎。一旦踏错半步，会出很多问题的。所以，腾讯在这块可能会比较费劲。</p>



<p>至于百度，继续为大家提供欢乐就可以了，其他就不重要了。更多的AI agent的应用应该正在路上。可能有一些公司说：“我没有大模型，但是我可以通过GE的方式，给大家打造更多的应用。”这块应该也在往前走。</p>



<p>而且，很多的服务平台，比如美团、携程这些服务平台，他们也需要开始去处理相关的问题了。我们如何去跟这些助理打交道？我们如何提供我自己的MCP的接口？现在像高德地图很多的这样的平台，都已经开始官方提供MCP接口出来了，可以让AI大模型、可以让agent直接跟他们去沟通。这一块就是未来的一个很重要的方向，大家应该是在快速前进。</p>



<p>我觉得又可以开始招人了。很多的互联网公司，应该可以开始考虑招聘的问题了。</p>



<p>最终的总结：这是AI的一小步，但绝对是整个人类社会形态发展的一大步。不知道你们是不是同意我的观点？好，这就是今天讲的故事。感谢大家收听，请帮忙点赞、点小铃铛。参加DISCORD讨论群也欢迎。有兴趣、有能力的朋友，加入我们的付费频道。再见！</p>
]]></content:encoded>
					
		
		
			</item>
	</channel>
</rss>
