<?xml version="1.0" encoding="UTF-8"?><rss version="2.0"
	xmlns:content="http://purl.org/rss/1.0/modules/content/"
	xmlns:wfw="http://wellformedweb.org/CommentAPI/"
	xmlns:dc="http://purl.org/dc/elements/1.1/"
	xmlns:atom="http://www.w3.org/2005/Atom"
	xmlns:sy="http://purl.org/rss/1.0/modules/syndication/"
	xmlns:slash="http://purl.org/rss/1.0/modules/slash/"
	>

<channel>
	<title>亚马逊AI &#8211; 老范讲故事｜AI、大模型与商业世界的故事</title>
	<atom:link href="https://lukefan.com/tag/%E4%BA%9A%E9%A9%AC%E9%80%8Aai/feed/" rel="self" type="application/rss+xml" />
	<link>https://lukefan.com</link>
	<description>这里是老范讲故事的主站，持续更新 AIGC、大模型、互联网平台、商业冲突与资本市场观察，帮你看清热点背后的底层逻辑。</description>
	<lastBuildDate>Wed, 01 Oct 2025 00:45:16 +0000</lastBuildDate>
	<language>zh-Hans</language>
	<sy:updatePeriod>
	hourly	</sy:updatePeriod>
	<sy:updateFrequency>
	1	</sy:updateFrequency>
	<generator>https://wordpress.org/?v=6.9.4</generator>

<image>
	<url>https://lukefan.com/wp-content/uploads/2026/03/cropped-jimeng-2026-02-28-5245-用图一的人物形象，替换图二中的人物，使用图二的风格。文字替换：老范讲故事，Yo-32x32.jpeg</url>
	<title>亚马逊AI &#8211; 老范讲故事｜AI、大模型与商业世界的故事</title>
	<link>https://lukefan.com</link>
	<width>32</width>
	<height>32</height>
</image> 
	<item>
		<title>别只盯着股价了，阿里真正的翻盘点在这里：全栈布局+开源大旗，它正在复制英伟达“左手倒右手”的高明玩法｜阿里巴巴 AI 大模型 阿里云 战略 通义千问 云计算</title>
		<link>https://lukefan.com/2025/10/01/alibaba-ai-strategy-cloud-open-source-models/</link>
		
		<dc:creator><![CDATA[Luke Fan]]></dc:creator>
		<pubDate>Wed, 01 Oct 2025 00:45:14 +0000</pubDate>
				<category><![CDATA[AIGC]]></category>
		<category><![CDATA[马云和阿里的故事]]></category>
		<category><![CDATA[AGI]]></category>
		<category><![CDATA[AI]]></category>
		<category><![CDATA[AI Agent]]></category>
		<category><![CDATA[AI商业化]]></category>
		<category><![CDATA[AI生态]]></category>
		<category><![CDATA[AI编程]]></category>
		<category><![CDATA[ASI]]></category>
		<category><![CDATA[Cathie Wood]]></category>
		<category><![CDATA[DeepSeek]]></category>
		<category><![CDATA[Qwen-Max]]></category>
		<category><![CDATA[中美AI竞争]]></category>
		<category><![CDATA[云溪大会]]></category>
		<category><![CDATA[云计算]]></category>
		<category><![CDATA[亚马逊AI]]></category>
		<category><![CDATA[全栈AI]]></category>
		<category><![CDATA[基础模型]]></category>
		<category><![CDATA[多模态]]></category>
		<category><![CDATA[大模型]]></category>
		<category><![CDATA[开源]]></category>
		<category><![CDATA[开源大模型]]></category>
		<category><![CDATA[微软AI]]></category>
		<category><![CDATA[战略]]></category>
		<category><![CDATA[投资逻辑]]></category>
		<category><![CDATA[木头姐]]></category>
		<category><![CDATA[模型推理]]></category>
		<category><![CDATA[生成式AI]]></category>
		<category><![CDATA[算力]]></category>
		<category><![CDATA[视频生成]]></category>
		<category><![CDATA[谷歌AI]]></category>
		<category><![CDATA[通义万象]]></category>
		<category><![CDATA[通义千问]]></category>
		<category><![CDATA[阿里云]]></category>
		<category><![CDATA[阿里云大模型]]></category>
		<category><![CDATA[阿里巴巴]]></category>
		<category><![CDATA[阿里巴巴AI]]></category>
		<category><![CDATA[阿里股票]]></category>
		<guid isPermaLink="false">https://lukefan.com/?p=2566</guid>

					<description><![CDATA[🔥阿里AI大会看完我人傻了！兄弟们，这哪是AI？是**ASI——直接超越人类**啊！！🤯美国还在AGI（别超人类），阿里冷笑：人在哪？没看着！我们冲！💥 百无禁忌操作爽到裂开，政治正确？不存在！让我生成毛线绣的刺猬logo都行！🧵✨

开源王者实锤📢！全球几万个模型全靠阿里千问打底，连字节都偷偷用但死活不开源——格局小了家人们！新出的**千问OMNI**绝了：拍视频秒翻译+实时聊天，手残党秒变外交官；Image Edit连中文艺术字都能P，Midjourney哭晕在厕所！😭 而木头姐豪掷1630万美金杀回A股，美股港股双飙10%…韭菜？我选择上车！💸

国内唯一真·AI全栈王！大模型+机器人+快递查询MCP一条龙，拼多多京东外卖拼到自闭。字节？模型闭源像穿西装跑马拉松——**阿里：百无禁忌才是YYDS！** 🌍

这波不冲阿里，2024真白活了！👇
速评“我要毛线绣头像”，揪3个兄弟实测通义万象2.5！#AI封神 #阿里YYDS #百无禁忌爽翻天

港股涨9%美股涨7%！木头姐为何在2024年紧急加仓1630万美金？阿里被低估的真相就藏在这3个估值模型里｜阿里巴巴 AI 大模型 阿里云 开源 通义千问

阿里真是中国的AI之光吗？随着云栖大会多款重磅大模型发布，其与美国截然不同的“ASI”发展战略浮出水面。本文将深入剖析阿里巴巴如何凭借通义千问的开源生态与强大的阿里云计算能力，在重获资本青睐的同时，试图在这场全球AI竞赛中弯道超车。]]></description>
										<content:encoded><![CDATA[
<figure class="wp-block-embed is-type-video is-provider-youtube wp-block-embed-youtube wp-embed-aspect-16-9 wp-has-aspect-ratio"><div class="wp-block-embed__wrapper">
<iframe title="别只盯着股价了，阿里真正的翻盘点在这里：全栈布局+开源大旗，它正在复制英伟达“左手倒右手”的高明玩法｜阿里巴巴 AI 大模型 阿里云 战略 通义千问 云计算" width="900" height="506" src="https://www.youtube.com/embed/V4g4826piOw?feature=oembed" frameborder="0" allow="accelerometer; autoplay; clipboard-write; encrypted-media; gyroscope; picture-in-picture; web-share" referrerpolicy="strict-origin-when-cross-origin" allowfullscreen></iframe>
</div></figure>



<p>大家好，欢迎收听<a href="https://youtube.com/@StoryTellerFan" target="_blank" rel="noopener">老范讲故事的YouTube频道</a>。今天咱们来讲一讲，阿里到底是不是中国的AI之光所在呢？</p>



<p>这几天正在开阿里的云溪大会，9月24号到9月26号开。这一次的口号呢，叫“云智一体，碳硅共生”，提的口号很神奇。当然，最神奇的还不在这，咱们待会往后看神奇在什么地方。4万平米的展厅，500多家企业参与，6万多人到现场，这个是一个非常大规模的会。</p>



<p>那么还宣布了什么呢？与英伟达合作做物理AI。现在呢，谁也不敢宣布说与英伟达合作，买人家的这个RTX6000，现在只能说我们做一个别的合作吧。什么是物理AI呢？就是做机器人相关的AI，做机器人的仿真训练、量化强化学习和仿真测试，做这玩意的。英伟达在这块也确实是很强。阿里呢，也会去投资很多的这种机器人公司，所以这个宣布了以后也是一个重大利好。</p>



<p>而且呢，阿里现在绝对是全世界开源AI领域的扛把子。原来最早的扛把子是Meta，出了Llama，出了这么多模型以后，现在阿里接过了这一面大旗。阿里开源的模型，在Hugging Face上基本上是站到最前面的一批了。以阿里开源模型为基础再微调出来的其他的各种模型有几万个，现在基本上属于事实标准的一个状态。所以只要说开源的大模型，大概率是拿阿里通义千问的这个模型去调出来的。那这点呢，其实也很符合阿里的调性，就阿里的这些模型都属于他没有那种很强的这种个性，或者很强的这种能力，但是指令依存度、逻辑推理能力这块都是达标的，这个还是一个很好的底座。</p>



<span id="more-2566"></span>



<p>这一次呢，提了一个新词儿叫ASI。从这个词儿呢，我们就可以看出来中美两国AI发展的完全不同路径。原来美国都在玩AGI，就叫通用人工智能，这个东西发展一段时间以后就可以达到跟人差不多的能力了，人能干的事它都能干。那阿里玩的ASI是什么呢？叫超越人工智能。就不用通用了，我们要超过人类。而且呢，是要可以自己去找知识学习，自己迭代自己升级，要快速超越人类。</p>



<p>那你说这里头跟中美两国的AI战略到底有什么不一样的地方呢？很多人一讲到中国AI战略呢，都会想到一个问题，说中国的有知识管控或者内容管控。但是我跟大家讲，这事呢正好跟大家想的是反的。不是说中国什么都不管，而且管的比美国严，但是呢，在做各种实验上，在做各种测试上，在做科技的发展上，中国人是百无禁忌的。什么对不对齐，是不是AI作恶，对社会、对环境、对人类有什么危害，我们先赢了再说，其他的不管了。这个是咱们中国玩的最奇葩的地方。而美国人呢，你可以认为他们是一帮左派，都在这想我的社会责任是什么样的，我要对人类怎么样，我要去开发宪法AI。所以呢，他们是一帮捆住手脚的人。而中国呢，其实我们是一帮现实主义者，只要能赢就行，其他的都不介意，等我赢了以后，我们再说后边治理的事情。所以美国人玩AGI，你别超过人类，你也不要给人类造成什么伤害。中国人就玩ASI，人在哪呢？没看着。我们冲！</p>



<p>这个是中美两国最大的差别。以中国现在这套ASI的玩法呢，我觉得可能会更有市场。做AI这个事情，都是要在大厂大公司里边控制去做的。而大厂大公司的这些人呢，包括国家的这些领导人，或者说这些既得利益者，所有的社会规则对于他们来说都是无效的。他为什么要去考虑社会规则？为什么要去考虑是不是有人受到伤害？他才不管这玩意呢。所以对于他们来说，拿到中国这种百无禁忌的模型再去处理，才是他们真正需要干的事情。至于说管理、过滤，那么我要用一个完全没人管的模型去管这些有人管的模型，这个是很多权力很大的政府他们所思考的问题。就像咱们禁摩一样，警察都骑着摩托车呢。为啥？摩托车方便。但是呢，我不允许普通人骑摩托车。所以呢，我们把警察的摩托车做的很大，开的飞快，但是普通人你们压根不许骑。就通过这一个词上面的一个字母，大家就知道两国的路径有多么大的区别。</p>



<p>前两天不还传嘛，说美国一个飞行员拒绝向以色列运军火，直接给抓起来了。那你说军队真正要的什么？军队要的就是执行命令。我不需要你有善良，我不需要你有人性，我就需要你执行命令。AI也是这样，政府都是希望AI甭管我说什么，你都去干去，不要自己去判断这事对不对。所以在这儿，中国也许会胜出。</p>



<p>讲远了。阿里云溪大会开的时候，股市是买单的。别人认不认咱不管，看看股市的情况：港股涨了9%，美股涨了7%。因为它是在港股跟美股同时上市的公司。而且木头姐直接出来喊大家上车了。木头姐是方舟基金的管理人，但是注意，方舟基金这样的机构呢，是不能上来说你们都买，然后再再去搞其他的。他一定是真金白银自己先买了，也不能说我买了以后喊大家来上车，这事是违法的。他是什么情况呢？他首先他买了，买了多少呢？两只基金一共买了1630万美金的股票，算是方舟基金的一个比较中等规模的操作。而且美国是有规定，这种基金重大操作必须要公开。所以呢，木头姐就趁此公示了，还要跟大家讲一讲说我为什么买，我为什么觉得这事行，他也得去募资嘛。所以这个过程，按照美国的这个法律规定，它是一个正常的披露。</p>



<p>木头姐呢是2021年把阿里整个清仓掉了，现在重新上车。跟大家解释说，我觉得是重新上车的时候了。它到底有什么样的不同的价值模型呢？它首先讲的是PE，PE呢就是你的市值跟你的利润之间的比数。阿里现在是多少？20倍。那20倍这是高还是低呢？你光告诉你一个数，这事是没法比较的。在电商里头算高的，电商里不能看亚马逊，待会咱们再讲为什么。京东的这个PE大概是10倍上下，经常就是个位数，所以京东的PE是非常低的。京东的什么人效比也是极差的，好几十万人你咋人效比。拼多多的这个PE是13倍。所以在这里看呢，阿里20倍其实是挺高的了。</p>



<p>在云计算里头，阿里算低的。谷歌也就是Alphabet，26倍；亚马逊，32倍。你看亚马逊其实跟阿里很像，一边是有电商业务，另外一边的话是有巨大的云计算业务。微软呢，37倍；Oracle呢，是67倍。现在TikTok的案子落地了以后，那还得涨。所以呢，阿里的整个的PE在电商里边算是偏高的，在云计算跟AI里边，它的估值是偏低的。所以木头姐说，我觉得这个位置很好，我要冲上来去搞一下。</p>



<p>AI资本支出，这个是大家都在玩的事情。华人勋跟OpenAI山姆·奥特曼在这玩的很开心。阿里也在讲，我3800亿人民币，500多亿美金的样子吧，要追加资本支出，AI基础设施建设，这个是符合主旋律的。还有什么呢？就是阿里真正比其他人都强的地方是哪儿？就是它的AI的产品线特别全，它真的叫全栈AI云平台，就跟咱们讲全栈工程师似的。大模型自己有，而且很强。投资了大量的AI初创企业，AI agent，AI编程什么全都有。更强的是在哪儿？它还有自己的用户场景，它有电商，还有自己的巨大的用户群和日常的交易数据在这儿。OpenAI其实它是没有用户场景和初用户的，这些玩意都是它后攒的。</p>



<p>木头姐曾经讲过，<a rel="noreferrer noopener" href="https://xn--x-br6asb34apdt75egz2co78a.ai/" target="_blank">说他为什么看好X.ai</a>，原因很简单，<a rel="noreferrer noopener" href="https://x.ai/" target="_blank">X.ai</a>有X上面的特有的数据，<a rel="noreferrer noopener" href="https://xn--x-4o6ax21n.ai/" target="_blank">而且X.ai</a>还有可能会获得特斯拉的数据和脑机接口的数据，以及SpaceX的数据。所以呢，它有独特的数据，这就是它的逻辑。我们经常会去分析一个人的投资逻辑到底是什么样的。我觉得到目前为止呢，木头姐讲的这些阿里相关的这种投资逻辑，还是在我的逻辑认知范围之内的吧，就基本上是认可的。当然了，跟英伟达合作这个事，就是你怎么都要上去蹭一下嘛。</p>



<p>刚才咱们讲的这些呢，都属于金融行业的人他们去算的估值模型的账。深层次的，咱们要去讲一些像我们这种早期投资人去看的东西，就是他的业务逻辑是对不对的。比较一下阿里的竞争对手吧，没上市的公司呢，OpenAI、Anthropic、<a rel="noreferrer noopener" href="https://x.ai/" target="_blank">X.ai</a>、字节跳动，这些呢咱就不去跟这种上市公司比较了，咱们就去比这些上市公司。</p>



<p>微软我们比较一下。它呢，投资了OpenAI，云计算算力投入这一块呢，它第一，花的钱最多。微软实际自己也有模型，但是实在是不好使，所以微软全面在使用OpenAI的模型。微软的用户场景丰富，用户量巨大，它有Windows，有Office，有IE，有Bing，虽然差一点但还算是有吧。阿里呢，投资了一大堆的这个AI企业，只要是国内的AI的大模型公司，基本上他全投了。投完了以后，通通都上他那去使用他的算力去。这个是不是跟微软就很像？云计算方面，在国内的阿里云算是最大的，所以跟微软能够对标上，没毛病。但是有一点它要比微软强，就是微软的模型像屎一样，阿里的模型真的是还可以用，不算最好用的，但真的是可以用。特别是千问32B、35B的这几个模型，还是非常非常好用的。用户场景也很丰富，虽然它没有Windows，没有Office，但是它有淘宝和天猫，有这个新浪微博、优酷这种内容项的，再加上出海的东西，所以它用户场景很丰富，用户量也非常非常的巨大。所以在这点上呢，它基本上完全可以对标微软，只是因为从中国起家的，所以规模上要比微软稍微小那么一点点。</p>



<p>下一个跟谁比？跟谷歌比。谷歌呢，是自己的模型很强大，Gemini非常非常强，据说10月份我们能看到Gemini 3了，说这个模型强的一塌糊涂，完全强到没朋友了，很期待。然后投资了Anthropic，谷歌也投了好多这样的AI公司。在云计算方面算力投入巨大，谷歌是一直在那投，但是现在它已经不行了。零几年的时候，谷歌的服务器是占全球服务器的6%还是7%，现在应该轮不上了。谷歌呢，自己的用户场景也很丰富，它有谷歌的搜索，有谷歌的Workspace，就类似于Office这样的东西，还有Gmail，再加上安卓手机，包括我们现在在YouTube上聊天。在这一点上呢，我觉得阿里跟它也是有得一比。谷歌呢，有一点没有阿里强是什么？谷歌的模型大部分是闭源的，它开源的模型其实是没什么影响力的。它的开源模型叫Gemma，Gemma在这块呢，比千问的这个模型差的非常非常远。而且呢，Gemma模型是只有小模型，没有大模型，就是为了让你在PC上，让你在手机上用的。而像千问的模型，是从大到小，从235B一直到0.6B，各个层级都有，你有多大硬件，咱就给你跑多大模型，都可以跑起来。所以谷歌就从技术的完整度上吧，还是稍微有一点点小欠缺。</p>



<p>再往后一个是亚马逊。亚马逊呢，真的跟阿里很像。他呢，也是投资了Anthropic，自己的模型那真的是乏善可陈。云计算绝对的王者，全球的王者就是亚马逊了。AI算力投入呢，也有，但并不是那么突出。电商的用户场景和用户量都非常非常好，这块跟阿里很像。</p>



<p>Oracle呢，数据库是老炮了，自己没有模型，现在呢跟OpenAI眉来眼去的，算力投入巨大。但是我觉得Oracle未来的故事，真正能看的应该是TikTok。</p>



<p>阿里到底是什么情况？你不要老想着说阿里买不到英伟达最新的芯片吧，他可以不在中国买，他在中东，在什么迪拜那地方都建的有算力中心，你在那买不就完事了吗？所以他是不缺这些东西的。所以呢，阿里的情况跟上面的谁最像？跟亚马逊最像，但是比亚马逊还要强一点，因为还有自己的大模型，这个而且模型很强。</p>



<p>这一次云溪大会都发布点什么？首先，发大模型，一堆的大模型，就像下饺子一样扔出来。第一个叫千问三Max，这个是一个不开源的模型。除了这个之外，剩下的模型都是开源的。为什么它不开源？1万亿参数，你开了源谁也布不了这东西。比如说235B，2350亿的参数的模型，还是可以去布一布的。Deepseek是671B，6710亿的这种参数的模型还是可以用。上万亿的模型一般就没法去开源了。这个模型呢，我这两天也试了一下，依存度很高，你给它各种指令，它会老老实实给你做完，生成的质量呢，就属于真的是能用的状态。它对于AI agent，对于各种的工具调用这块非常非常强，因为它的指令依存度高嘛，它就可以规划一个很好的路径，把所有的指令都调用回来，这个是做的很好的一个模型。</p>



<p>下一个开源的是什么呢？叫千问三OMNI，全模态预模型。支持视频，支持音频，输出也是直接可以文字输出，可以语音输出。有点像GPT-4o，或者说那种叫real time的这种模型。我直接可以拿这个手机打电话，然后拿着手机一边拍视频，一边跟人聊天，一边跟大模型聊天，这个东西就干这个事了。而且呢，超多语种的支持，支持十几二十种语言，都是可以这边实时的跟他聊，那边实时的出。所以拿这个东西出去找人去聊天，当翻译都是没有任何问题。而且可以拍着视频说，你看我这个视频里这个风景应该怎么描述一下，它都会马上给你去进行推理。而且端到端推理，不是说我先把视频识别出来，然后再去走这个大语言模型，直接端到端就开干了。这个模型呢也不大，30B MOE的模型，300亿参数。这种模型呢在电脑上都是可以跑的，还专门为苹果做了优化，就是在Mac上可以跑，但是30B模型在手机上是跑不起来的，这个是稍微有点费劲的。其实我们甭管用豆包也好，还是用ChatGPT也好，实时对话模型都是用云端的东西，没有在本地计算。千问三的这个OMNI就是干这样的一个事情的，还是很有惊喜的一个产品。</p>



<p>再往后呢，是千问三Image Edit 2509。其实原来就有这个模型，但是呢，它又重新升级了一遍。因为原来它的千问三Image Edit呢，只能上一张图片，你给它一张图片，要求它做各种修改是OK的。现在的话，Nano Banana出来了以后说，原来还可以这么玩。我可以上三四张图片，把它拼在一起。实际上就是拿三四张图片去进行视频推理，或者叫视觉推理，再把它们挨个抠出来了以后往一块拼。所以这就是阿里家的Nano Banana。这两天我在玩即梦4.0，豆包家的Nano Banana，那个也是玩的很开心。大家现在看到我的各种的封面，基本上都是拿这玩意做出来的。你看我那个这一期视频的封面，文字是用毛线绣上去的。这个是国内模型能干的活，就是写中文，而且用各种各样的创意字体写中文，用各种的素材去写中文。Nano banana干不了这事，Midjourney更干不了这事。中国的一个是即梦，一个是刚才我们讲的千问三Image Editor，都是可以去写中文的，效果好极了。</p>



<p>再往后一个呢，是千问三TTS Flash，就是专门做文字转语音的，还出了一个轻量级的模型。但是这种轻呢，也没有办法在手机上跑，都是在电脑上跑的。以及呢，出了叫千问三VL。VL是什么？叫视觉推理模型。但是这个呢，就跟前面咱们讲的这个OMNI不一样了，它是做了很重型的这种视觉推理。你像上面那就是个30B的模型嘛，它这种东西做推理的话，肯定的能力还是要差一点的。所以还是要上这个千问三VL。还有一个呢，叫千问三Next，80B MOE模型，每次激活3B。它是干啥使的呢？就是比千问三更便宜，在同等推理的能力下，用更低的成本可以完成任务。最后一个呢，叫WAN 2.5，叫通义万象2.5，这个呢是做视频生成的。原生音画同质，就是他直接做出来就可以配好口型，配好音乐，更高的画质，更长的时长，1080P、24帧、10秒钟。为什么说这玩意强呢？因为我们看到的其他视觉模型，比如说谷歌的VEO 3，OpenAI的Sora，即梦这些视频模型的话，都是闭源的。通义万象WAN 2.5它是个开源的，大家可以把它下载到本地，然后在自己的显卡上去干活。那你说我把它放在自己显卡上干活有什么好处呢？百无禁忌就是好处。中国人做的东西都是百无禁忌的，其他的这些视觉模型都是很政治正确的，而且耻感都很高。你现在有一个这么强的，基本上可以达到谷歌VEO 3这样的一个水平的视频生成模型，还是开源的，还可以下载到本地去部署去执行，想想都觉得实在是太美了。而且呢，这个模型呢是这多模态，全创造全覆盖，文生视频、图生视频、文生图、图像编辑全都有。</p>



<p>这是这一次发布的各种的新模型。你说云计算嘛，超节点总要有嘛。华为也在做超节点，英伟达在做，阿里肯定也少不了。阿里的超节点叫“盘久”，盘古的盘，永久的久。盘久128超节点，就是每次呢，把128个算力卡放在一起去做这种超节点运算。这个里头并没有去讲说我这个超节点到底用的是谁的，其实大概率用的是英伟达的芯片，也可以用他自己的平头哥的芯片，或者用一些其他人的芯片。所有的超节点真正考验的其实不是那个芯片，考验的是什么？就是他的连接协议和交换机。就是你不能走以太网，你必须要单独走一个光通道的网络。所以他呢，做了一个叫UA Link，就类似于英伟达的这个NVLink这种东西，自己有自己的这个模块，自己有自己的协议，自己有自己的交换机，可以把128个算力芯片串在一起去干活去。</p>



<p>阿里真正强的在哪？就是它全栈，什么都有。因为做云计算的嘛，他肯定有海量数据库，然后AI agent、工作流、MCP这块也是强大一塌糊涂。前面我们讲过Dify这样的东西做工作流的，现在你们可以直接把Dify的DSL文件，就是你看在Dify上做好的工作流，导出一个DSL文件来，导完了以后直接到阿里云上去导入，他就可以照着DSL的这个工作流节点就给你跑去了。原因很简单，Dify也是拿了阿里的钱了，那他作为一个股东可以提出这样的要求来。所以这块呢，真的是非常非常强。</p>



<p>MCP这一块现在非常非常全面了。我今儿还专门上去看了一下，现在有哪些MCP可以在上头跑了。刚才我们讲的什么画画的，什么做视频都可以包MCP，当然这不重要，重要的什么？支付宝。你现在可以在上面做支付宝的支付，支付宝的订阅，都可以直接挂MCP到你的自己的应用里头去。这样的话，我们再做的新的产品就直接里头可以支付了。各种跟电商相关的，跟这个业务相关的，因为它场景丰富嘛，自己家的东西都可以开出来，这一块全都已经包装成MCP了，可以在阿里云里头用，也可以在阿里云里头把这个MCP的接口暴露出来，在外边来用。比如说它里头有一个MCP是什么？查快递。你只要去申请一个快递100的TOKEN往里一挂，就可以直接上阿里云的MCP服务器上去把它的接口导出来，导到自己的AI agent也好，或者是工作流也好，就可以帮着用户去查快递了。你的快递走到哪了，什么时候该拿了。能够查快递，对于销售的转化是非常非常有帮助的，因为你一旦知道说我这个快递是可以查到的，这个东西走到哪我都知道，大家就觉得一个事情从不确定变成确定了，他就可以花钱去更多的下单买东西。这一块是很多很多的，现在能想到的，在国内能用得上的这些东西，都已经包装成MCP了，都可以在阿里云里边直接集成去使用。</p>



<p>编程这一块，他自己专门做了一个模型叫千问三Code，480B，一个开源的模型。这一次呢，阿里还发布了一个叫千问三Code Plus，一个闭源模型。就这个模型实在太大了，你们也别费劲了，搁我服务器上你们跑吧。我自己没有去测试，所以就不跟大家吹说东西好不好使了。</p>



<p>阿里真正做的全栈，从头到脚全做了。而且呢，英伟达的把戏在中国只有阿里能玩。什么意思？阿里做芯片吗？要准备卖芯片？不是这样。中国人谁也做不出英伟达这样一统天下的芯片来。所以呢，他干嘛？他去做云去。说我这有云，我拿云去投资，别人投资完了以后，我再把这个钱再挣回来。就是一个钱从左口袋揣右口袋，然后再揣回左口袋，GDP算三倍，这就是英伟达的把戏嘛。这个现在阿里云也可以干。</p>



<p>做云计算跟云计算因为AI获得很多收益，其实两回事。就阿里云的这几年的收益，特别是AI相关的收益，都是三位数增长，绝不是几百分之几十，就翻着跟头往上涨。所以在这一块上呢，还是有挺大差别的。微软云上跑的是谁的？跑的是OpenAI。亚马逊云上跑的是Anthropic。Oracle云现在是Cohere，以后应该会跑OpenAI。谷歌云上是Gemini和Anthropic。那么阿里云上跑的是谁？第一个，阿里全栈的大模型都可以在上头跑。Kimi也就是Moonshot，这个模型在上头跑。MiniMax他投资了，在上头跑，没毛病。百川、智谱、零一都可以在上头跑，都没毛病。Deepseek云本来是开源的，虽然阿里没有投资Deepseek，但是肯定阿里云上也是有Deepseek的模型的。全国大概有一多半的模型都是在阿里云上跑的，阿里每一次出来吹牛就吹这个。另外一圈比较大的是火山云，是这个字节跳动的。他讲的是什么？就是公有云对外销售的TOKEN，有一半是由火山云消耗掉的。那你说不对，怎么阿里云上那么多模型，火山云消耗的TOKEN这么多呢？这个里头就有一个问题是什么？就是火山云上大量的人是直接在上面挂这个模型去干活的。而阿里云的话，很多是由单位直接上去，连服务器带所有东西一起买下来的，它是没有办法单算你卖了多少TOKEN的。所以呢，算TOKEN，字节跳动的火山云占一半。你如果算大模型，阿里云占一多半。</p>



<p>黄仁勋的玩法又来了。怎么讲呢？阿里出钱投资，拿了阿里的钱呢，你就来阿里买算力。运营的不好怎么办？阿里就把核心团队收了。这点他比黄仁勋还狠。黄仁勋投了一堆项目以后运营不好，他也没办法，他也不能说：“你们上英伟达来上班吧。”阿里是这么干的，因为零一前一段时间就玩不转嘛，那零一的核心团队就直接上阿里上班去了。这就是投资协议上写的一个条款，你如果玩不转，你就把你的核心团队交出来。因为咱们都知道，做大模型需要什么东西？算力、数据和人，或者叫人才吧。那么阿里说了，我投资了，你买了我的算力，数据你自己找去我不管了，玩不好你把人才交出来，怎么着都不亏。如果这个项目运营的特别好，估值上升，那阿里肯定也是赚了。所以这是阿里真正的如意算盘。</p>



<p>那么，阿里是不是重新站起来了呢？阿里前头最惨的时候，市值被拼多多超越，马云必须要出来露面了，去说几句话才能稳住军心。而且阿里这几年呢，特别是吴妈上来了以后，真的是改变了很多策略。原来呢叫“1+6+n”，就是彻底要分散，自己玩自己的。现在说不分了，不需要的直接干掉，剩下的人咱们集中力量干大事。零售方面，现在在跟美团、京东拼外卖，而且在拼即时零售。AI方面，在和字节、Deepseek战斗。但是呢，在这一点上，阿里的优势是非常非常强的。字节跳动是不开源的，字节跳动有一些开源模型，但是呢大的模型都是闭源的。所以在这一点上，阿里要比字节强很多，它会形成事实标准，这个字节就没有办法。虽然豆包1.6模型真的是很强很强，现在我比较下来，千问三Max是没有字节的豆包1.6好使了，但是即使如此，你没有开源这面大旗。所以在这点上字节打不过阿里。而且因为竞争，字节的火山云上敢去部署这个Deepseek，但是呢，他就不愿意在上面部署千问模型，这个也是字节眼界稍微差一点的地方，或者说目光不够开阔的地方。字节呢，前面把整个战略投资部都裁了以后，其实也没有什么特别大的动作。这方面，美团、拼多多、京东就更不行了。所以阿里在国内的竞争优势真的是独一无二，就没什么人跟他竞争。</p>



<p>总结一下吧。阿里呢，肯定是未来可期，只要是他们抱着现在这个状态接着往前走，收紧拳头，大家自己配合往前走。其实阿里还有很多很神奇的东西在做，只是现在并没有开放出全量给大家来用。来等他们稍微开放一点点，咱们再去一个一个的来去解读。而且阿里在这块有可能真的会走出一条不同的路来。什么意思？就是到目前为止，这些传统的有场景、有用户的公司，比如谷歌、微软、亚马逊、字节跳动，都没有开发出新场景，都是在原来的场景上进行AI的改造。而在这点上呢，阿里呢有大量的AI agent准备去上线，他们是准备去创造新的商业模式了，准备去创造新的应用场景的。这个才是真正值得期待的。一旦他们在新的应用模式和场景上有了创新，而且站住脚跟了以后，应该又可以席卷全球一次。我觉得应该是值得期待的。</p>



<p>但是呢，在国内一切皆有可能，一切也皆有不可能。所以呢，我们继续吃瓜，继续往前看。我自己呢，现在有一部分的应用是跑在阿里云上，跑在阿里的大模型上，但是呢，大部分的AI人工智能的应用其实是在OpenAI、Gemini和豆包上。我准备未来一段时间更多的使用阿里云吧，希望能够发现他们一些有趣的点，特别是他的通义万象2.5，看看到底能给我做出一点什么东西来。但是跑这种东西呢，可能需要更新电脑，我现在的电脑跑通义万象2.5是跑不起来的。或者看看谁家是托管的通义万象2.5，是相对来说比较自由的，我准备去好好的玩耍一下。</p>



<p>最后注意，咱们不做任何具体的投资意见和建议。你说我上车了，亏了，那是你的事。你说我没上车，亏了，也是你的事。你赚了，也都是你自己的事。不要怪老范。好，这就是咱们今天的第一个故事。</p>
]]></content:encoded>
					
		
		
			</item>
		<item>
		<title>DeepSeek现象引发中文圈狂热：开源的胜利还是遥遥领先的争议?</title>
		<link>https://lukefan.com/2025/01/28/deepseek%e7%8e%b0%e8%b1%a1%e5%bc%95%e5%8f%91%e4%b8%ad%e6%96%87%e5%9c%88%e7%8b%82%e7%83%ad%ef%bc%9a%e5%bc%80%e6%ba%90%e7%9a%84%e8%83%9c%e5%88%a9%e8%bf%98%e6%98%af%e9%81%a5%e9%81%a5%e9%a2%86%e5%85%88/</link>
		
		<dc:creator><![CDATA[老范 讲故事]]></dc:creator>
		<pubDate>Tue, 28 Jan 2025 00:36:14 +0000</pubDate>
				<category><![CDATA[AIGC]]></category>
		<category><![CDATA[DeepSeek大模型]]></category>
		<category><![CDATA[AI Agent公司]]></category>
		<category><![CDATA[AI Agent生态]]></category>
		<category><![CDATA[AIGC领域]]></category>
		<category><![CDATA[AI云计算]]></category>
		<category><![CDATA[AI产业标准]]></category>
		<category><![CDATA[AI协作方式]]></category>
		<category><![CDATA[AI大模型]]></category>
		<category><![CDATA[AI开源]]></category>
		<category><![CDATA[AI开源项目]]></category>
		<category><![CDATA[AI推理能力]]></category>
		<category><![CDATA[AI数据偏见]]></category>
		<category><![CDATA[AI显卡优化]]></category>
		<category><![CDATA[AI显卡禁令]]></category>
		<category><![CDATA[AI研发成本]]></category>
		<category><![CDATA[AI蒸馏微调]]></category>
		<category><![CDATA[AI闭源模型]]></category>
		<category><![CDATA[AMD MI 300]]></category>
		<category><![CDATA[AMD显卡兼容]]></category>
		<category><![CDATA[Anthropic压力]]></category>
		<category><![CDATA[Claude模型]]></category>
		<category><![CDATA[DeepSeek]]></category>
		<category><![CDATA[DeepSeek R1]]></category>
		<category><![CDATA[Deepseek V3]]></category>
		<category><![CDATA[DeepSeek代码]]></category>
		<category><![CDATA[DeepSeek原创性]]></category>
		<category><![CDATA[DeepSeek影响]]></category>
		<category><![CDATA[DeepSeek成果]]></category>
		<category><![CDATA[DeepSeek数据来源]]></category>
		<category><![CDATA[DeepSeek美国市场]]></category>
		<category><![CDATA[DeepSeek英文论文]]></category>
		<category><![CDATA[Deepseek训练成本]]></category>
		<category><![CDATA[DeepSeek论文]]></category>
		<category><![CDATA[Huggingface]]></category>
		<category><![CDATA[Kimi 1.5]]></category>
		<category><![CDATA[Meta AI发展计划]]></category>
		<category><![CDATA[Meta震惊]]></category>
		<category><![CDATA[Minimax 01]]></category>
		<category><![CDATA[OpenAI竞争]]></category>
		<category><![CDATA[Oracle云计算]]></category>
		<category><![CDATA[PyTorch开源工具]]></category>
		<category><![CDATA[中文社交媒体]]></category>
		<category><![CDATA[中美AI竞争]]></category>
		<category><![CDATA[中美科技博弈]]></category>
		<category><![CDATA[亚马逊AI]]></category>
		<category><![CDATA[人工智能创新]]></category>
		<category><![CDATA[华为AI标准]]></category>
		<category><![CDATA[大模型训练路径]]></category>
		<category><![CDATA[字节跳动AI]]></category>
		<category><![CDATA[开源模式]]></category>
		<category><![CDATA[开源胜利]]></category>
		<category><![CDATA[微软AI]]></category>
		<category><![CDATA[英伟达显卡]]></category>
		<category><![CDATA[谷歌AI]]></category>
		<category><![CDATA[谷歌AI研究]]></category>
		<category><![CDATA[豆包1.5]]></category>
		<category><![CDATA[通义千问]]></category>
		<category><![CDATA[闭源与开源]]></category>
		<guid isPermaLink="false">https://lukefan.com/?p=1877</guid>

					<description><![CDATA[DeepSeek突然出圈，引发了中文圈的争吵。大家好，欢迎收听老范讲故事的YouTube频道。 DeepSee ... <a title="DeepSeek现象引发中文圈狂热：开源的胜利还是遥遥领先的争议?" class="read-more" href="https://lukefan.com/2025/01/28/deepseek%e7%8e%b0%e8%b1%a1%e5%bc%95%e5%8f%91%e4%b8%ad%e6%96%87%e5%9c%88%e7%8b%82%e7%83%ad%ef%bc%9a%e5%bc%80%e6%ba%90%e7%9a%84%e8%83%9c%e5%88%a9%e8%bf%98%e6%98%af%e9%81%a5%e9%81%a5%e9%a2%86%e5%85%88/" aria-label="阅读 DeepSeek现象引发中文圈狂热：开源的胜利还是遥遥领先的争议?">阅读更多</a>]]></description>
										<content:encoded><![CDATA[
<figure class="wp-block-embed is-type-video is-provider-youtube wp-block-embed-youtube wp-embed-aspect-16-9 wp-has-aspect-ratio"><div class="wp-block-embed__wrapper">
<iframe title="DeepSeek现象引发中文圈狂热：开源的胜利还是遥遥领先的争议?" width="900" height="506" src="https://www.youtube.com/embed/MSJuK3Q8TeE?feature=oembed" frameborder="0" allow="accelerometer; autoplay; clipboard-write; encrypted-media; gyroscope; picture-in-picture; web-share" referrerpolicy="strict-origin-when-cross-origin" allowfullscreen></iframe>
</div></figure>



<p>DeepSeek突然出圈，引发了中文圈的争吵。大家好，欢迎收听老范讲故事的YouTube频道。</p>



<p>DeepSeek在前面，我们已经出了一期视频，去讲它到底是怎么回事了。那么，DeepSeek最近肯定是更加的出圈。首先，DeepSeek V3，据说训练成本只有557万美金，震惊了扎克伯格，震惊了Meta。Meta说：“我们有好多的老大，他们的年薪都超过557万美金了。人家训练了个模型才用了557万美金，那我花了这么多钱去组建AI团队，花了这么多钱去囤显卡，是不是亏了？”现在就有这样的声音出来。</p>



<p>而且，最新的DeepSeek R1，也就是它的推理模型，推理能力已经接近o1了。蒸馏微调出来的这些小模型，已经在很多领域里头超越了o1 Mini。在这儿多补充一句，什么叫蒸馏微调的小模型？像我的电脑上，也是跑了一个DeepSeek R1-32B的模型。这个模型是怎么来的？它实际上是由DeepSeek R1去输出数据，然后拿输出的数据再去调通义千问2.5-32B的这个模型，最后得到的结果。这就是DeepSeek R1-32B，他在我的电脑上做各种推理，效果相当不错。</p>



<span id="more-1877"></span>



<p>那么，据说受到DeepSeek R1的影响，山姆奥特曼已经做出了改变。原来，它的o3模型，包括o3 mini模型，免费用户是用不了的。就是o3 mini，可能能够给plus用户稍微用一用。现在他说：“不，这个o3 mini模型，我们要直接向免费用户开放。”而plus用户，也就像我这样的，每个月只要20美金的用户，每天可以用到上百次。其实这种o系列的模型，甭管是o1也好，o3也好，你一天真的想不出100个问题来，问他100次足够用了。</p>



<p>至于说完整的o3模型，以后是不是依然要在200美金一个月，甚至是更贵的这个版本里面才可以去用到，他现在应该正在抓耳挠腮地想这个问题。美国的媒体也做了一些报道。</p>



<p>而且，这些媒体肯定是看热闹不嫌事大的，就去说：“你看，我们封禁了半天，人家做出这样的一个东西来，震惊我们了。”这些话好多是他们讲出来的，各路大佬也都出来说话了。比如说，谷歌的前CEO原来就讲过：“我们遥遥领先，在这块比中国领先好多年，他们不可能追上。”再问他：“你说我们还是领先吗？”当时我觉得我们还领先一到两年，但是他们正在快速的追赶。</p>



<p>像这个杨立昆，Meta他们家AI领袖人物，他也上来说：“这个是开源的胜利。”都在去讲这个事情，包括很多在美国相对比较有影响力的这些AI圈的创始人，现在也都在纷纷接受采访，再去谈论DeepSeek的事情。所以，这确确实实是出圈了。</p>



<p>那你说，这样出圈的一个事，怎么在中文圈，或者叫中文社交媒体圈里头，大家就吵起来了？这个原因也很简单，因为中文的，特别是简体中文的社交媒体圈，一直都是非常割裂的。一群的二极管在里边去吵来吵去的。什么叫二极管？只有一边是通的，另外一边是不通的。</p>



<p>那么正面的声音是什么？第一个，厉害了我的国。你看，我们好厉害，你封禁了我半天，我小米加步枪也能够打赢胜仗。原来就是说，美国人有飞机大炮，日本人有坦克、飞机、大炮，但是我们小米加步枪，我就把仗打赢了。这个是我们一直津津乐道的一个事情。第二个，就是大量的震惊体。这个就是“谁谁震惊了，谁谁大吃一惊。”这个我们也使用了大量的震惊体来去描述境外势力看到DeepSeek以后的那种反应。</p>



<p>还有什么上来说，这个超英赶美那套东西，英伟达完了，Meta完了，OpenAI完了，他们都完了，以后AI这个圈子就全都是中国人的事了。这样也还有人在想，说美帝的封锁就是个笑话，封了半天，最后做出最好的东西的人还是在我们中国。这是正方的观点，或者我们叫粉红观点。</p>



<p>当然，还有反面观点，永远在讲说中国人还是不会从0到1的。DeepSeek其实是有更多的显卡的，并不是像他们说的只有1万张显卡，而是有5万张H100，也就是美国封禁的这种显卡。</p>



<p>这个也有人在去讲，还有些人说什么，说DeepSeek，这帮人就是一个小聪明，没有大智慧，都是在投机取巧而已。当然，也有些人上来说，这根本不是什么民营公司，后边一定是国家的一盘大企业，这都后边收归国有了，不用讲这事，这个都属于是知黑们，或者反贼们的一些惯常的话术。</p>



<p>继续来了，当然还有一些人再去讲，说这个数据是不是从其他大模型里头出来的，因为中国很多的大模型，训练数据都是从OpenAI来的。所以你每次问他说你是哪个大模型，上来都是说我是OpenAI家的ChatGPT，这个大家都会去做的。我记得DeepSeek V3当时好像也干过这样的丢人事，甚至还有人去怀疑，说DeepSeek这个数据是不是有侵犯版权，是不是有些其他的问题也都在询问。</p>



<p>甚至还有一些人上来说，美国是不是应该把这个封锁，搞得再严格一下，让他彻底做不出来不就完事了吗？这个没有办法，这些人他就是恨国党，只要是中国人做的稍微好一点点，他们就完全看不下去那个状态。这就是正反两面，现在正在中文的社交媒体圈里头撕来撕去。</p>



<p>当然还有一些困扰的声音，既不是正面也不是反面，或者说稍微偏正面一点的声音，他们说什么，这么好的东西干嘛开源给外国人看，咱自己留着偷偷藏起来，这个可能也是一部分粉红会有这样的声音吧。那么到底谁对谁错呢？我觉得我们没有必要去讨论谁对谁错的事情。</p>



<p>DeepSeek到底是不是遥遥领先，这件事其实是一个伪命题。我们一旦想出来遥遥领先了，这个其实是有问题的，因为遥遥领先这件事了，说我们不讲道理了，我就在你前面，你也不可能超过我。你只要超过我，他等于政治就不正确了，这个玩意才叫遥遥领先。</p>



<p>我们在某些领域里头得出了一些领先的结果，其他领域还在追赶。我们领先的这些领域里头，别人也在追赶，然后你追我赶的，把整个的AIGC事业往前推荐，这个才是真正大家应该去思考的问题。所以在所有的这些大佬的讲话里边，真正有价值的是谁讲的。</p>



<p>就是杨立昆，这个Meta的AI首席科学家，他讲的是什么？他说这根本就不是中美两国谁胜谁负的问题，这跟这事没关系。他讲的是什么？这是开源战胜了闭源，这是开源的胜利。这个是为整个DeepSeek事件定性的最好的一句话，请大家记住，这里头跟中国和美国没有什么特别大的关系。这些人在美国也能做出同样的东西来，也许他们的方向不一样，会做的跟现在的结果有差异，但也依然是可以做出震惊世界的东西出来的。而真正胜利的是开源，开源是一种最新的、最先进的软件开发的协作方式，是这样的一种协作方式战胜了原来这种闭源的传统方式。</p>



<p>那么这个项目到底是不是原创呢？DeepSeek你们是从0到1原创的，还是说在人家的基础上耍了个小聪明，没有真实的原创性创新？这个有很多人就上来说，中国人就不可能有原创性创新，我觉得这样讲是很不负责任的。第一个，在没有GPT-2，没有Llama，整个这些开源的大模型的情况下，就不会有中国的大模型产业，整个产业都不会存在，这个大家还是要去承认的。</p>



<p>我觉得与其去讨论是不是原创，我们更应该想的是什么，如何加入到创新大潮中去贡献力量，这才是真正应该想的。每一个创新都是可贵的，我只要是遇到问题，把问题解决掉了，它就是创新。至于说这个创新到底有多大价值，是不是可以积少成多、聚沙成塔，变成了一个很伟大的工程项目，我觉得我们只要慢慢地去堆砌，慢慢地去积累，总会有这样的一个量变，实现质变的时间点。</p>



<p>就算是美国人用的很多的，这些现在我们看到的很新的技术，其实也是有很多过去几十年，甚至上百年研究出来的。这些基础都是在上面逐渐地去改进，逐渐地去解决问题，逐渐积累起来的。我们不要老去上来就说，这个事你耍了个小聪明，那个事你搞了一个从1到100，没有从0到1，别想这个事，没有那么重要。那么DeepSeek是不是确实触动了美国大模型的产业圈呢？从DeepSeek开放出来的论文和原代码，大家都在努力地下载。</p>



<p>去尝试，去复现，去部署，去使用这块来看，确实是这样。这个DeepSeek确实触动了美国整个的大模型产业圈。而且DeepSeek的方法将会深刻地影响美国项目未来的方向，或者说将会深刻影响全世界AI项目未来的方向。那么是不是应该收紧制裁呢？</p>



<p>如果前面没有制裁，没有这么多拜登说我要去怎么制裁，哪个学生不能来，什么国防七子怎么回事，没有搞这些事，DeepSeek团队中的可能一大部分人现在应该都在美国。这就是制裁的结果。如果没有前面的显卡禁令，那么国内可能会更早地贡献出来比DeepSeek更加有趣的模型。这就是制裁的结果。</p>



<p>千万不要想着可以靠制裁去得到什么样的后果，唯一的后果就是本来应该在美国的很多创新的人才，他们留在了中国，在中国做出了DeepSeek。本来让全世界、全人类可以在大模型的方向上跑得更快的很多的发明创造，因为限制没有做出来，这就是制裁的后果。</p>



<p>那么“厉害了我的国”这件事到底对不对，其实完全没有必要。咱们举个例子，相当于什么？四个人在这打麻将，咱们四个劈了啪啦，打麻将打得很开心，打了一晚上了也得胡个多少圈牌了。突然有一个人开了个杠出来，开完杠出来以后，他身后有一堆的亲友团，直接就爆发了：“你好厉害，你居然开杠了！”导致这个麻将没法打下去了，这到此结束了。这个其实是没有必要的，开杠就开杠呗，这一圈你要领先了一次，那咱后边还打不打了？</p>



<p>整个的大模型产业创新，实际上就像是大家在这打麻将。你不能说你取得了任何成绩，大家停下来等我先庆祝个两年，咱们再接着往下打，这没有任何意义。麻将还要接着打下去，这才是真正看待“厉害了我的国”的方法。</p>



<p>你像中国人，当然有的时候会有一些怪癖。你比如说，国人看到了一个会讲中文的老外，哇，那叫激动：“你的中文讲得实在太好了！”觉得特别有面子。但是如果老外看到了一个会讲英文的中国人，完全没有反应：“讲英文呗。”这些讲英文的人，有黑人，有白人。</p>



<p>有华人，有各种面孔的人，还有印度人。有的讲得好，有的讲得不好，都没有任何问题。就算讲得再字正腔圆，他也没觉得这事有多稀奇。但是你像中国人，你要看到一个老外讲中文讲得再荒腔走板，你都要冲上去，哎呀，你实在讲得太好了，我觉得太有面子了。这个算是中国人的一个民族性。</p>



<p>对于被DeepSeek所震惊的这些美国人来说，他们真正看到的是什么？他们真正看到的是，有人做出了新的科技创新，仅此而已。而且还发表的是英文论文，内容放在Huggingface上没有什么障碍，大家就可以直接用了。你并没有说我把这东西写成中文论文，只放在国内的，比如说某一个开源平台上。你要想用，我还要爬进来去使用，还要找人去看这些中文文件，没有。你上来，你也是发表的英文论文，大家全世界的人都是这么干的呀。你法国的这个团队，你去发表论文，你也是发表英文的；以色列团队，你去发表论文，你也是发表英文的；中国团队，你也发表了英文论文；美国团队也是发表英文论文。这有什么差异吗？没有什么差异，大家一起推着这个事情往前走就好了。而且他们自己的团队里边也有一大堆的亚洲脸，这事不是很正常吗？你们在瞎激动什么呀？</p>



<p>这个就是“厉害了，我的国”。这个事其实是不可取的。再往后咱们来讲一讲，哪个老外要完蛋了没有？咱们前头不是想Meta是不是要完蛋了，英伟达是不是要完蛋了，OpenAI是不是要完蛋了？咱们看一看，首先对于Meta来说，有些事情是有些过分了，比如说557万美金完成的训练，这个里头是仅仅计算了用了这么多显卡，应该是2048块显卡，训练了多少个小时，只是算了这个数。他是557万美金，你的数据是什么样的成本，你的人工是什么样的成本？而且训练这个东西，它不是训练一次就行了的，特别是像MoE这样复杂的架构，它可能中间会失败非常多次，然后进行架构的调整和重新设计，重新训练。那么最后你用一次训练的，而且仅仅是训练成本。</p>



<p>来去替代Deepseak V3的开发成本，这件事本身是不对的。所以不要想着说，这边557万美金就训练了一个大模型出来，Meta就天塌了，没有这事。Meta现在也表态了，我们要继续加大力度买显卡。原来有60万块显卡，今年准备买到130万块，充分的去买显卡。买完显卡以后，还要再继续努力的去训练新的模型。</p>



<p>现在等于又多了一条训练的路径。原来Meta说我这有训练的路径，怎么去从LLama1、LLama2、LLama3、LLama3.1、3.2、3.3怎么训练上来。现在DeepSeek又给我提供了很多新思路，那我在做新的训练任务的时候，可以有很多的新的训练方案去尝试。最后可能再训练出来的LLama4，就会比原来的LLama3要强，非常大的一块，这个还是不一样的。</p>



<p>所以对于Meta来说，那咱们就上呗。原来可能我一共有5条路可以尝试，现在又多了两条路。那么排列组合一下，怎么能够把这些路径都设计好，去训练出新的LLama3来，这个是大家可以看的。XAI其实没说什么，但是Grok 3的训练，估计也会增加很多新的训练方法，可以进行尝试。</p>



<p>对于英伟达来说，千万别建议英伟达废了。当然英伟达确确实实最近的股价又在开始波动，现在都不敢讲是英伟达股票涨了还是跌了，因为总有人过了半个月回来说，你现在不是说跌了吗？你看涨回来了。这个英伟达作为这么高市值的公司来说，他的股价来回发生波动是很正常的。那么对于英伟达来说，这应该是一个巨大的利好。为什么？因为有人能够把这样的模型用起来了，能够这么便宜、这么好用的模型开源出来，那么大家就会疯狂的去买显卡回来，把自己原来的模型增加上这些新的方法，重新去做训练，重新去做微调或者去做蒸馏，这是大家要去干的事情。</p>



<p>所以这个事对英伟达是有好处的。另外很多的AI agent公司，也会自己去部署自己的算力中心，然后去部署这个开源的DeepSeek模型，就可以跑起来。</p>



<p>这个对于英伟达来说也是利好。大模型应用的成本更低，效果更好，各大公司都会疯狂地买显卡的。至于闭源模型来说，他们确实是要压力山大了。刚才我们讲的这些，不管是Meta，还是XAI，还是最基础的英伟达，实际上我们都是在讲开源路径。那么闭源路径，比如说OpenAI，他们就要想一想怎么办。它的领袖地位在发生动摇，Anthropic肯定也要承受一定的压力，因为它的价值肯定会下降的。</p>



<p>至于谷歌到底发生什么事了，这么大的公司还没反应过来。云计算厂商应该是久旱逢甘霖，不管是微软、亚马逊，还是谷歌、Oracle，都是说我是云计算厂商，你是开源的模型，我给你部署上来。那么以后使用我们云计算机房里边这些客户，你就可以在我这直接使用同一个机房里面部署的DeepSeek大模型了。这个对于他们来说肯定是好事，他们也还会再去买一些显卡回来。当然了，这块就有可能会去买AMD的显卡了，因为AMD的MI 300据说已经把DeepSeek V3跑起来了。</p>



<p>这个其实也很简单，因为AMD是Pytorch基金会的一个核心贡献者，给钱的人。你要去跑这样的模型，肯定还是要去使用类似于Pytorch这样的工具。只要能够让这个工具可以跟AMD的显卡进行很好的兼容，可以进行推理，那么AMD现在号称说我内置了DeepSeek V3，这个话就是稍微有一点点歧义。但是大家可以认为说，我只要是买AMD的显卡，就可以把DeepSeek V3跑起来，这个没毛病。</p>



<p>那么其他的这些AI Agent厂商，这个也是救命稻草来了，比如说Perplexity，还有Cursor这样的AI Agent公司。他们原来必须要去调用OpenAI，要去调用Claude，这个东西很贵，而且你掌握在别人的手里面，你所有的用户数据别人都可以看到，这个肯定是非常不爽的。现在这两家公司已经都在产品内部集成了DeepSeek V3。</p>



<p>甚至可能正在集成 DeepSeek R1 这样的推理模型。那么未来可能越来越多的 AI Agent 的公司会走这条路。2025 年就是 AI Agent 年，而他们可能很多的这种应用，都将在 DeepSeek V3 或者是 DeepSeek R1 这样的模型上继续往前快速奔跑。</p>



<p>至于国内的公司，肯定也在努力。这两天，第一个是豆包 1.5 Pro 版本出来了，也是 Moe 模型。而且豆包喊的是什么？“我所有的数据都不是来自于蒸馏，都不是来自于其他模型，所有数据都是我自己的。”这个确实在这点上要比 DeepSeek 要好一点。为什么？因为使用了别人的数据后，可能会把一些偏见带到自己的模型里，而这往往比较难以发现。就经常你去问他说：“你是谁？”上来说：“我是 OpenAI 的 ChatGPT。”</p>



<p>那么豆包为什么有这样的底气？后边是字节跳动，有今日头条，有抖音，这样的平台在后头顶着。他有的是数据，而且他的数据都可能经历了几万人的筛选、过滤和标注的。所以在这块上，它确实是有一定的优势。我这两天也试了一下豆包 1.5 Pro，除了这个政治正确太严重之外，没什么大毛病。它这个豆包 1.5 还更便宜，它比 DeepSeek 还便宜。原因也很简单，DeepSeek 再怎么便宜，是人家成本低，而豆包的话，我可以赔钱，我可以发补贴，这个事你是比不了的。</p>



<p>另外，Minimax 也出了一个 01 的模型，叫 Minimax 01。它原来没有开源，从 Minimax 01 这个版本开始去开源了，刷分刷各种排行榜，也刷得很高，但没有什么响动，大家也没有觉得 Minimax 怎么样。原因也很简单，开源这个事并不是一蹴而就的。我今儿开源了，大家就必须要马上冲下来三拜九叩，没有这事。开源是要长期的开源，开源很长时间了以后，才会有人慢慢地去看你的代码、看你的论文、看你这些信息。</p>



<p>因为我们要去使用一个开源系统，一开始这个成本是很高的，你需要招聘这些会使用开源的人。</p>



<p>这些人的本身的薪资，就要比那些不会使用开源的人要高。高好大一快的，而且这么大的模型，这么大的系统，我们要把整个的系统都进行阅读、进行理解，这个成本是要支付的。如果你今天突然说我开源了，那么大家也要看一看，日久见人心，明天你万一不开了呢？这个还是要逐渐积累。而且这个Minimax的开源，应该开的也没有DeepSeek那么彻底、那么完整。DeepSeek就属于彻底，所有东西都拿出来，你们就看着，照着东西可以重现。这个迷你Max还惦记着说我是不是开点源，吸引点用户回来，我是不是又可以找他们收钱去了。他在想这样的事情，那这个就一看，就不是一个真心开源的项目。</p>



<p>在这种基础上，他现在依然没有什么响动。Kimi 1.5也出来了，刷了分。咱们中国大模型出来，甭管豆包、Minimax和Kimi，都是先去刷分，刷排行榜。排行榜刷完了以后，好像也就没有什么响动了。一个闭源模型，那在这样的情况下，我有开源的，我干嘛要用你？闭源一定是如此的一个情况了。而且Kimi 1.5的政治正确，要比这个豆包还严重，所以也就到这了。</p>



<p>最后总结一下，这是开源对闭源的胜利，这点非常重要。而且真开源是很难的，也是会被认可的。那些假开源，你要看看是不是愿意坚持下去，把自己的假开源慢慢的做成真开源。而且大力出奇迹这件事情依然存在，现在只是说在大力出奇迹的时候，我可以多换几个姿势，多换几个角度了，但是大力依然出奇迹。</p>



<p>不要老想着中国到底能不能创新，是不是遥遥领先，这件事根本就不重要。重要的是什么？重要的是在开源的模式下，快速的奔跑，参与到标准的制定者中间去，这个才是重要的。否则可能折腾了半天，你压根就不在这个标准制定者里面。因为现在大家都在开业，大家都是说我们向标准里边贡献东西。那么你不能说在前面贡献的时候，我们没有上去，我们都敝帚自珍，把门关起来自己偷偷的在这研究，等人家把这个标准拿出来以后，冲上来说不行。</p>



<p>我们要改一下这标准。我不认你这个标准，谁理你？所以在这个时候，大家就要疯狂地冲上去，参与到标准制定里边去。其实在这里再补充一句，原来在国内各个企业里边，在全世界标准组织里边，贡献最多的公司，在开源项目里边贡献最多的公司是谁？是华为。如果没有制裁，可能华为已经在这条路上走得很远了。但是因为制裁的原因，现在只能自己把门关起来，喊“遥遥领先了”。这个也是制裁造成的一个非常惨重的结果。</p>



<p>好，这就是今天跟大家稍微总结一下，DeepSeek出圈了以后，中文圈到底在吵什么，以及我的一些观点。好，这期就讲到这里，感谢大家收听，请帮忙点赞，点小铃铛，参加Discord讨论群。也欢迎有兴趣、有能力的朋友加入我们的付费频道。再见。</p>
]]></content:encoded>
					
		
		
			</item>
	</channel>
</rss>
