<?xml version="1.0" encoding="UTF-8"?><rss version="2.0"
	xmlns:content="http://purl.org/rss/1.0/modules/content/"
	xmlns:wfw="http://wellformedweb.org/CommentAPI/"
	xmlns:dc="http://purl.org/dc/elements/1.1/"
	xmlns:atom="http://www.w3.org/2005/Atom"
	xmlns:sy="http://purl.org/rss/1.0/modules/syndication/"
	xmlns:slash="http://purl.org/rss/1.0/modules/slash/"
	>

<channel>
	<title>AI量化交易 &#8211; 老范讲故事｜AI、大模型与商业世界的故事</title>
	<atom:link href="https://lukefan.com/tag/ai%e9%87%8f%e5%8c%96%e4%ba%a4%e6%98%93/feed/" rel="self" type="application/rss+xml" />
	<link>https://lukefan.com</link>
	<description>这里是老范讲故事的主站，持续更新 AIGC、大模型、互联网平台、商业冲突与资本市场观察，帮你看清热点背后的底层逻辑。</description>
	<lastBuildDate>Wed, 26 Nov 2025 00:57:53 +0000</lastBuildDate>
	<language>zh-Hans</language>
	<sy:updatePeriod>
	hourly	</sy:updatePeriod>
	<sy:updateFrequency>
	1	</sy:updateFrequency>
	<generator>https://wordpress.org/?v=6.9.4</generator>

<image>
	<url>https://lukefan.com/wp-content/uploads/2026/03/cropped-jimeng-2026-02-28-5245-用图一的人物形象，替换图二中的人物，使用图二的风格。文字替换：老范讲故事，Yo-32x32.jpeg</url>
	<title>AI量化交易 &#8211; 老范讲故事｜AI、大模型与商业世界的故事</title>
	<link>https://lukefan.com</link>
	<width>32</width>
	<height>32</height>
</image> 
	<item>
		<title>10个月血赚近9000万，最后被罚1.77亿！DeepSeek背后程序员如何利用“老鼠仓”掏空公司？监管漏洞全解析｜DeepSeek US China fine prison</title>
		<link>https://lukefan.com/2025/11/26/deepseek-front-running-penalty-china/</link>
		
		<dc:creator><![CDATA[Luke Fan]]></dc:creator>
		<pubDate>Wed, 26 Nov 2025 00:57:51 +0000</pubDate>
				<category><![CDATA[DeepSeek大模型]]></category>
		<category><![CDATA[AI量化交易]]></category>
		<category><![CDATA[China stock market]]></category>
		<category><![CDATA[DeepSeek AI]]></category>
		<category><![CDATA[Deepseek老鼠仓]]></category>
		<category><![CDATA[financial regulation]]></category>
		<category><![CDATA[中国股市]]></category>
		<category><![CDATA[交易策略]]></category>
		<category><![CDATA[内幕交易]]></category>
		<category><![CDATA[刑事责任]]></category>
		<category><![CDATA[利用未公开信息交易罪]]></category>
		<category><![CDATA[同频交易]]></category>
		<category><![CDATA[巨额罚款]]></category>
		<category><![CDATA[幻方量化]]></category>
		<category><![CDATA[林艺平]]></category>
		<category><![CDATA[程序员炒股]]></category>
		<category><![CDATA[老鼠仓]]></category>
		<category><![CDATA[职业操守]]></category>
		<category><![CDATA[证券市场禁入]]></category>
		<category><![CDATA[证券监管]]></category>
		<category><![CDATA[证监会处罚]]></category>
		<category><![CDATA[量化交易]]></category>
		<category><![CDATA[金融犯罪]]></category>
		<category><![CDATA[金融科技]]></category>
		<category><![CDATA[非法所得]]></category>
		<category><![CDATA[风险控制]]></category>
		<guid isPermaLink="false">https://lukefan.com/?p=3019</guid>

					<description><![CDATA[Deepseek背后的老鼠仓，被罚了1.77亿人民币，这到底是个什么神奇的故事？ 大家好，欢迎收听老范讲故事的 ... <a title="10个月血赚近9000万，最后被罚1.77亿！DeepSeek背后程序员如何利用“老鼠仓”掏空公司？监管漏洞全解析｜DeepSeek US China fine prison" class="read-more" href="https://lukefan.com/2025/11/26/deepseek-front-running-penalty-china/" aria-label="阅读 10个月血赚近9000万，最后被罚1.77亿！DeepSeek背后程序员如何利用“老鼠仓”掏空公司？监管漏洞全解析｜DeepSeek US China fine prison">阅读更多</a>]]></description>
										<content:encoded><![CDATA[
<figure class="wp-block-embed is-type-video is-provider-youtube wp-block-embed-youtube wp-embed-aspect-16-9 wp-has-aspect-ratio"><div class="wp-block-embed__wrapper">
<iframe title="看起来是收割散户，其实在掏空东家！DeepSeek母公司程序员利用未公开数据，10个月赚走近9000万，谁是真韭菜？｜DeepSeek China fine AI prison users data" width="900" height="506" src="https://www.youtube.com/embed/6li95OzVe2s?feature=oembed" frameborder="0" allow="accelerometer; autoplay; clipboard-write; encrypted-media; gyroscope; picture-in-picture; web-share" referrerpolicy="strict-origin-when-cross-origin" allowfullscreen></iframe>
</div></figure>



<figure class="wp-block-image size-large"><img decoding="async" src="https://pictures.lukefan.com/deepseek-front-running-penalty-china/blog-1.JPEG" alt=""/></figure>



<h1 class="wp-block-heading">Deepseek背后的老鼠仓，被罚了1.77亿人民币，这到底是个什么神奇的故事？</h1>



<p>大家好，欢迎收听<a href="https://youtube.com/@StoryTellerFan" target="_blank" rel="noopener">老范讲故事的YouTube频道</a>。</p>



<h2 class="wp-block-heading">天价罚单：1.77亿的老鼠仓</h2>



<figure class="wp-block-image size-large"><img decoding="async" src="https://pictures.lukefan.com/deepseek-front-running-penalty-china/blog-2.JPEG" alt=""/></figure>



<p>2025年11月11日发了一个公告，这是浙江证监局行政处罚决定书，处罚一个叫林艺平的人，艺术的艺，平衡的平。这个人呢，是在幻方量化里边做老鼠仓。罚多少钱呢？没一罚一，就是把他的非法所得没收掉，再罚以同样的钱。非法所得8,857.69万元，这哥们还是很能挣钱的。你把这个8,000多万要交出来，再罚8,000多万，加一块1.77亿人民币。</p>



<h2 class="wp-block-heading">处罚算重还是算轻？</h2>



<p>是不是付钱了？没有进一步的消息。付不出来就强制执行呗，上你们家卖房卖车去。如果转移资产，就是要判刑。如果实在付不了的话，估计是会挂失信人员的。然后还处以了5年证券市场禁入，这五年里头不能给人当CFO了。你说一程序员是给谁当CFO去？但是他也不能到股市里边去开户。</p>



<p>那你说这对于他来说，处罚是不是太轻了一点？大概率呢，还会移交公安机关起诉判刑，但是这个呢，并没有在这一次的信息里头披露出来。</p>



<p>其实这还不是中国最大的老鼠仓，但基本上已经算是第一梯队了，绝对是战绩彪炳。最大的呢，应该是华宝基金原基金经理蒋宁的一个案子，用了9个亲友账号，盈利1.14亿，最后呢是有期徒刑5年。所以林艺平大概率最后还是要去坐牢的，只是目前呢，是浙江证监局行政处罚决定书公布出来了，应该是后边还有法院再去判决，所以当前并不确定后续的处理方式。</p>



<h2 class="wp-block-heading">主角登场：幻方量化与“外包程序员”林艺平</h2>



<figure class="wp-block-image size-large"><img decoding="async" src="https://pictures.lukefan.com/deepseek-front-running-penalty-china/blog-3.JPEG" alt=""/></figure>



<p>Deepseek背后就是幻方量化。那你说他们家确实炒股是有两把刷子。犯事的这段时间呢，是2022年11月16日至2023年9月6号。如果大家有记忆的话，当时应该是中国股市震荡下行期。但是即使在这样的一个阶段里头，幻方量化还是挣到钱了，就是他们通过量化的交易方式挣钱了。</p>



<span id="more-3019"></span>



<h3 class="wp-block-heading">林艺平到底是谁？</h3>



<p>那你说林艺平到底是干嘛的呢？这哥们是个外包，是技术服务外包。对于技术服务外包来说呢，监管是比较松的。你一个量化基金里头这帮做策略的人，他们是需要去考基金从业资格证书的，要去受到基金从业资格的这种法律约束，或者叫道德约束。像我是考过基金从业资格证书的，我们考证书的时候一共是三门考试，第一门呢就是职业道德，第二门呢是一些跟交易相关的东西，第三门呢是私募股权基金。其实第三门是相对来说比较容易的，第一门就是背各种各样的东西，说什么能干，什么不能干。真正去做量化的人，你肯定是要去背这些东西的。但是呢，做技术支持的人是不需要的。</p>



<p>林艺平他的职位跟职责是什么呢？他的职位呢，叫做交易策略前端开发。你说前端开发不是写网页的吗？不太一样。他的职责是产品风控、部分产品交易测试、决策下单和监控，他做这些工作。</p>



<h3 class="wp-block-heading">量化交易中的“前端”是什么？</h3>



<figure class="wp-block-image size-large"><img decoding="async" src="https://pictures.lukefan.com/deepseek-front-running-penalty-china/blog-4.JPEG" alt=""/></figure>



<p>那他到底干嘛的呢？量化交易里头的前端跟后端，跟我们一般写程序不一样。我们写程序，后边做具体操作的叫后端，前面做界面这帮人，叫前端，甭管你是写网页的，还是在APP上写界面的，写交互画按钮的，这帮人他们叫前端。在量化交易里头呢，这个后端是定策略的：我今天要买茅台，茅台上去了以后，我什么时候把它卖掉，多少钱以内我去买。这帮人叫后端，具体执行呢就是前端的。</p>



<p>但是前端都是程序员。你说这个量化不应该自动执行吗？这个真不是。你这边决定了我明天要买，比如说5,000万手的茅台，你如果真的前面这个机器自动就上去挂单去了，你肯定买不着，而且等你把这5,000万手收齐了的时候，这价格都涨飞了呀。所以呢，他们需要干嘛呢？需要把这单子拆了。</p>



<p>你说我现在需要5,000万手茅台了，后端把这个策略制定好了。而且呢，他不是说买5,000万手茅台，他是有一整套的策略：哪天到哪天之间买5,000万手茅台，这些茅台应该是在一个什么样的价格区间之内，如果这个价格超过了，我们就放弃购买，然后撤单或者是做什么。这样的东西，它是有一个完整的策略，发到这个林艺平手里了。林艺平要干的活就是把它拆开，几百手几千手，把它拆成一大堆小碎单子，然后拿这些单子扔到市场上慢慢去买去。这些单子呢，就会快速的去成交，而且成交的过程中呢，对于整个股价的影响呢，没有那么大。他就负责干这个的。他也会有一个比较缓慢的交易过程，这几单交易成功了，那几单交易成功了。而且这5,000万手，你也不能说我按照一个统一的价格，“啪”一把都扔出去了。他可能也是按照一个梯度的价格往上扔，他是这样来去操作的。这就是他们这个前端跟后端之间的差异。</p>



<h3 class="wp-block-heading">犯罪行为的定性</h3>



<p>这次的处罚通知上呢，有一句很关键的话，就是什么呢？叫<strong>“实质上实施了私募基金从业人员的履职行为”</strong>，算是犯罪行为的一个定性。你按道理来说呢，后端这帮做策略的人，你要干类似这样的活的话，那你肯定是老鼠仓。而且这些人呢，是经过了基金从业资格考试的，有相应资格的，他学过这个道德规范和职业操守的，属于叫知法犯法，这肯定是行的。</p>



<p>林艺平这种程序员呢，他按道理说是没有接受相应的培训的。国内的量化基金呢，也比较喜欢用这种方式，就是把技术这块外包到外边去。为什么？因为他们就不需要受到这些约束的，这种管理也相对来说比较灵活，你也可以给他们发比较高的薪水。现在还有一个叫限薪令的东西，你不能给从业人员发太高的薪水。你说每天手里头拨拉拨拉手指头，就上亿上亿的跑，自己的月薪可能是几万块，这些人心里会不平衡的。但是这些程序员，你是可以给他发比较高的薪水的，不受的这个控制。但是呢，林艺平“实质上实施了私募基金从业人员的履职行为”，所以你要受这个约束。</p>



<h2 class="wp-block-heading">犯罪手法揭秘：他是如何赚钱与如何被抓的？</h2>



<figure class="wp-block-image size-large"><img decoding="async" src="https://pictures.lukefan.com/deepseek-front-running-penalty-china/blog-5.JPEG" alt=""/></figure>



<p>具体林艺平是怎么挣钱的呢？他又是怎么被发现的呢？这个我估计大家会比较好奇。</p>



<h3 class="wp-block-heading">什么是“老鼠仓”？</h3>



<p>首先咱们讲，他这个犯罪行为呢叫老鼠仓。那么老鼠仓叫什么呢？老鼠仓的一个学名叫什么呢？叫<strong>“利用未公开信息交易罪”</strong>。有一些未公开信息，比如说幻方量化在后边制定了一个交易规则，这个是对普通大众来说是不知道的。你利用这样的一个规则去交易的话，这个呢就叫做老鼠仓了。那你说我不自己交易，我偷偷告诉别人行不行？这玩意不就不叫老鼠仓了吗？这叫<strong>“泄露内幕信息罪”</strong>，这个东西呢叫内幕交易。所以呢，他有另外一个罪名。你自己交易了就叫老鼠仓，没有自己交易，我告诉别人了，叫内幕交易。</p>



<h3 class="wp-block-heading">10个月赚近9000万，需要多少本金？</h3>



<p>那么赚钱的过程呢，这哥们是10个月赚了接近9,000万，一天赚25万，这个还是速度很快的。他的本金到底有多少？很多人很关心这件事。我到底拿多少钱，10个月里就能挣出这么多钱来？是不是我手里也得有好几亿的资本？这一定是谁家有钱的少爷吧？不是这么回事，这个不需要多少钱。</p>



<p>为什么呢？你想他头一天，发现要下单茅台了，咱们接着说这5,000万手茅台的故事。头一天发现了，然后呢就进去埋伏了。他可以先下单，我先去买个几百手。然后呢，我这边开始执行5,000万手的这个过程。执行完了以后，到第二天，T+1嘛，这个股价呢还是会有一点点波动，比如有个2%、3%的波动，甚至呢有一些其他的消息爆发出来了，你可能有个5%、6%的波动。这个时候，你再把手里这个筹码卖掉，T+1，你等于5%就到手了，有可能是这样的。然后呢，到T+2的时候，你又变出现金来了，你又可以去买了。它是这样的一个过程。而且呢，它还可以去融资融券，就是它效率可以更高一些。它呢，挣钱不靠本钱多，它靠滚得快，它是这样的一个盈利方式。</p>



<h3 class="wp-block-heading">具体操作：利用“拆单”的时间差</h3>



<figure class="wp-block-image size-large"><img decoding="async" src="https://pictures.lukefan.com/deepseek-front-running-penalty-china/blog-6.JPEG" alt=""/></figure>



<p>它的核心就是拆单。刚才咱们讲前端干这个活，大家就已经明白了。我就可以在拆单的过程中，自己先去下。我这边拆单的这个策略是10块钱多少手，10块零5毛多少手，10块1、11块多少手，他是这样的一个拆法。在这边拆的过程中，我那边下一个指令就直接9块9，我先整个几百手出来再说。等这边做完了以后，后边我再去套现离场。他是这样的一个挣钱过程。</p>



<p>它整个的操作呢，并不需要特别复杂的一个技术，因为这个东西呢叫做量化交易，并不是高频交易，他的交易的频率没那么快。一个策略下来了以后，他拆完单然后呢审核，审完了以后，是不是拆单都符合要求，然后要去开始执行。执行完了以后他要干嘛？监控。拆完了单以后，到底有没有成功的把我需要的这个筹码买下来？或者说现在这个价格是不是已经异常波动了？波动了以后，我是不是要去调整这个拆单？比如说我原来是从10块买到12块，要把这个5000手都买进来，我这可能只买了2,000万手，就已经涨到12了。那得看后边该怎么去处理，这个呢都是这个林艺平要去干的事情。所以呢，整个的执行过程很慢，他就完完全全可以同时摸出手机来，或者再找一台电脑，给他自己的账户下个单子，这个事是完全来得及的。</p>



<p>而且这个过程呢，也不能保证你铁赚钱。有的时候中国股市也说不好，你没准今天我去买了，按道理说明天应该涨，但是可能隔夜美股大跌，你第二天就直接赔在里头。幻方自己也不能保证每一笔单子都赚钱，林艺平呢也不能保证都赚。但是呢，他算了完10个月以后，盈亏都抵了以后，还赚了接近9,000万。他挣钱的速度，肯定是比幻方量化快无数倍的，因为他的这个效率会更高一些。</p>



<h3 class="wp-block-heading">他赚的到底是谁的钱？</h3>



<p>那你说这玩意到底赚的是谁的钱呢？好多买卖股票的人说，是不是赚的我的钱？赚的其实是幻方量化的钱。按道理来说呢，幻方量化把这个策略偷偷地执行下去的时候，市场上应该没有任何的响动，我偷偷地进去吸收筹码，或者偷偷地出去卖，应该是这样的一个过程。但是呢，他提前进去埋伏好了，我可以在幻方量化买的时候呢，把自己手里的筹码卖给他。甚至呢，他可以等着幻方量化整个把这个价格拉起来以后，在幻方量化要出场之前，他先跑。他是可以来做这样的事情的。所以他挣的钱是幻方量化的钱。</p>



<h3 class="wp-block-heading">天网恢恢：老鼠仓是如何被发现的？</h3>



<figure class="wp-block-image size-large"><img decoding="async" src="https://pictures.lukefan.com/deepseek-front-running-penalty-china/blog-7.JPEG" alt=""/></figure>



<p>时间线，刚才咱们也讲了，2022年11月16号到2023年9月6号，也就是十个月左右的时间。2023年9月6号就离职了。那为什么到2025年11月11号才发公告呢？整个这个事情核实起来也还是需要一段时间的。应该是2023年9月6号这个事就已经东窗事发了。到底是幻方量化内部监控把他逮着了，还是证监会把他逮着了，这个事呢现在没有公开出来。但是一定当时就已经把他抓住了，这两年就是在做案情核实和资金账户的这些确认，现在就可以尘埃落定，把他宣布出来。</p>



<p>那你说这玩意咋逮着的呢？他偷偷在里边干这个活，怎么逮着他？还记得刚才咱们讲那个最大的案子吗？就是1.14亿那个案子，9个亲属账号。所以这种东西逮着他的核心原因，就是账号的原因。这个林艺平呢，他使用了4个账号。</p>



<ul class="wp-block-list">
<li>第一个呢叫林某志，也姓林吧，有可能是他父亲的账号，或者是他的一些亲属的账号吧。林某志在国金证券开了一个账号，在东莞证券开了一个账号，这是两个。</li>



<li>还有一个呢叫何某龙，在东莞证券开了一个账号，在中信证券开了一个账号。</li>



<li>一共就这4个账号。</li>
</ul>



<p>那你说有这4个账号他交易他的呗，怎么就能被发现呢？发现这种老鼠仓的核心关键点在于什么？他挣钱之所以能够挣到这么多的原因，是因为他频率高。今天买明天卖，后天再买，然后再卖，他是这样的一个快速的交易过程。那么呢，就会发生一个问题，叫<strong>“同频交易”</strong>。就是你发现这4个账号跟幻方量化的这种几百亿的大账号总是同频交易。幻方量化买的时候，他总能提前买；幻方量化卖的时候，他能提前卖；或者是幻方量化买完了以后他就卖；等到幻方量化要卖的时候呢，他没准还跑去融资融券去又跟着折腾一把，对吧？每一次操作的规律都差不太多，这个叫同频交易。</p>



<p>因为中国是很严格的证券交易实名制的，所以每个人手里不可能掌握太多的账号。特别在这几年，各种的断卡行动了以后，就会变得越来越难，所以大家手里账号都是有限的。这些人都是很贪婪的，一定是有几个账号跟这种大账号之间会发生同频，这就会容易被抓住。</p>



<p>另外一个抓住它的方法是什么呢？就是<strong>IP地址跟Mac地址</strong>。Mac地址就是我们的硬件，比如手机，你的每一个手机上是有Mac地址的。我们的每一个路由器、每一台电脑的网卡上，都是有Mac地址的，全世界唯一的。IP地址，你比如说像林艺平这样的，他上哪下单去？他只能是坐在幻方量化的办公室里头下单。所以他下单的这个IP地址，也是在幻方量化的办公室里头，跟他执行交易策略的这个IP地址是一样的。这个也是很容易被抓住的。应该就是通过这两个方式，就是同频交易和IP地址、Mac地址的方式，直接把他逮着了。</p>



<h2 class="wp-block-heading">普遍现象与监管红线</h2>



<figure class="wp-block-image size-large"><img decoding="async" src="https://pictures.lukefan.com/deepseek-front-running-penalty-china/blog-8.JPEG" alt=""/></figure>



<p>中国股市在这块，确实要比美国股市要严格。因为美国股市并不要求绝对穿透，或者穿透到头这样的方式。中国股市是要求绝对穿透，无限穿透，一层一层一直穿透下去，穿透到最后每一个人的身份证号码上。所以你想去靠账号去玩这个事不那么容易。</p>



<p>那你说这是不是一个普遍现象呢？是不是所有这些做量化交易的人，最后执行的这些前端人员，都会干这个活呢？首先说这个事确实不少见，国内外都有，美国也有，中国也有，全世界哪个国家都会出现类似这种情况。反正出现了就抓呗，这也没什么办法。</p>



<p>真正的红线呢，其实是<strong>“对打”</strong>。刚才我们讲了，量化基金它会把一个大单拆成好多小单，自己去慢慢执行去，这件事情呢它是允许的。前提是什么？你是到市场上对着公共池子去交易，这个事就没问题。但一旦是说我操纵了好几个账号，自己跟自己去交易了，这个事就不行了。你像林艺平这个其实也是这样，他操作了一边是幻方量化的账号，一边是他自己的林某志和何某龙的账号，自己跟自己交易了，这个事是不允许的。在任何一个国家的证券市场里头，这件事都是违法的。</p>



<p>为什么这个是违法呢？因为股市这个东西，特别是股票的价格呢，它是怎么来的？这个东西叫“价格发现”。就是我这没卖出去，交易没有成功；我这要买了没买到，这个交易没有成功，它对于股价是没有影响的。那边正好有人要卖，我们交易成功了，那么股票的价格就会发生变化，我发现了新价格。那如果是一些小盘股，自己买自己卖，突然就做出了一笔交易来，这个股票的价格就会发生异常波动。小盘股嘛，他一般交易也没有那么多，或者交易的没有那么频繁，他就会发生这种异常波动，就有可能会吸引别的人进来买，等别人吸引进来了以后，他自己就跑路了。这个其实是很多游资干的活。最近呢，也爆出一些国内游资玩不下去了，他们就跑到美国去。因为刚才咱们讲了，国内搞断卡行动以后，游资手里边的账号也没那么多了，他们就去美国炒。但是到美国以后呢，做过分了以后会被SEC处罚。这种案件最近也是不断地被爆出来。</p>



<p>全球的股市呢都有监控功能，发现这种同频交易就会触发监控。国内呢，实名制还要更严格一点；美国呢，是诉讼门槛更低一些。什么意思呢？就是国内呢，因为是实名制，所以呢你只要干类似的这种事情都会被发现。但是呢，是不是会起诉，会不会真的把你抓出来，还得看您上头是不是有人。这个玩意就跟西游记似的，孙悟空从头到尾打了半天，最后没打死几个人，真正的罪大恶极的，实际上都是什么神仙的坐骑、菩萨的坐骑，都是这玩意。所以您最后是不是会被抓住，跟你做什么没关系，看你上头有没有人才有关系。而美国呢，它没有实名制，发现要稍微难一点。但是呢，他们起诉是很容易的，你只要是这个股价异常波动了以后，下边人都是可以起诉的。如果起诉你，你这受到处罚的几率会更大一些。大概就是差在这。</p>



<p>真正老鼠仓的重灾区，其实并不是股市，而是什么呢？而是币市，就是区块链这帮人，他们是真正的重灾区。为什么？因为他们没有监管。他们的这些交易都是去中心化的，虽然现在有中心化交易所，但是这个交易所也不是说所有的人都在我这执行这一套东西。咱们一帮的中心化交易所，也是在去中心化的链上去执行的。所以在他们这里头呢，是没有总体监管的。像美国有SEC监管，中国有证监会监管，你说我在链上交易，币安能监管吗？监管不了。他只能监管说我自己内部的人，你不要干这个事。因为这个事呢，对于名声的损害是很厉害的，一旦你内部的人干这件事的话，大家就不敢把钱存在你这了。</p>



<h2 class="wp-block-heading">故事的启示</h2>



<figure class="wp-block-image size-large"><img decoding="async" src="https://pictures.lukefan.com/deepseek-front-running-penalty-china/blog-9.JPEG" alt=""/></figure>



<p>最后总结一下吧。这个故事告诉我们了几个道理。</p>



<ul class="wp-block-list">
<li><strong>第一个道理：信息就是钱。</strong>这个林艺平他偷的是什么？偷的是幻方量化的信息，偷的钱其实也是幻方量化的钱。信息就是钱。</li>



<li><strong>第二个道理：不是自己的钱不要伸手。</strong>但是你说我玩币圈的，你自己看着办，这事跟我们没关系。但你说我在证券市场上，在股票市场玩这个事，只要是达到一定的频率阈值以上，就一定会被抓。那你说到底是到多少阈值以上会被抓？没有人会告诉你这个具体的数字的，这个大家自己小心就完了。</li>



<li><strong>最后呢：市场有风险，投资需谨慎。</strong>我们这各种这消息、那消息满天飞，我今儿买点这个，明天卖点那个，有的是人在里头去赚一些奇奇怪怪的钱。</li>
</ul>



<p>今天这个故事就讲到这里，感谢大家收听。请帮忙点赞、点小铃铛、参加<a href="https://discord.gg/ppKsNkttTv" target="_blank" rel="noopener">DISCORD讨论群</a>，也欢迎有兴趣有能力的朋友加入我们的<a href="https://www.youtube.com/channel/UCUGLhcs3-3y_yhZZsgRzrzw/join" target="_blank" rel="noopener">付费频道</a>。再见。</p>
]]></content:encoded>
					
		
		
			</item>
		<item>
		<title>从557万美金训练成本到545%利润，DeepSeek如何用惊悚的数字，震撼AI行业的？这些数字，靠谱吗？</title>
		<link>https://lukefan.com/2025/03/04/%e4%bb%8e557%e4%b8%87%e7%be%8e%e9%87%91%e8%ae%ad%e7%bb%83%e6%88%90%e6%9c%ac%e5%88%b0545%e5%88%a9%e6%b6%a6%ef%bc%8cdeepseek%e5%a6%82%e4%bd%95%e7%94%a8%e6%83%8a%e6%82%9a%e7%9a%84%e6%95%b0%e5%ad%97/</link>
		
		<dc:creator><![CDATA[Luke Fan]]></dc:creator>
		<pubDate>Tue, 04 Mar 2025 00:40:05 +0000</pubDate>
				<category><![CDATA[AIGC]]></category>
		<category><![CDATA[DeepSeek大模型]]></category>
		<category><![CDATA[545%利润]]></category>
		<category><![CDATA[557.6万美金]]></category>
		<category><![CDATA[AI优化]]></category>
		<category><![CDATA[AI优化技术]]></category>
		<category><![CDATA[AI公关策略]]></category>
		<category><![CDATA[AI公司争斗]]></category>
		<category><![CDATA[AI利润计算]]></category>
		<category><![CDATA[AI商业模式]]></category>
		<category><![CDATA[AI商战]]></category>
		<category><![CDATA[AI基准价格]]></category>
		<category><![CDATA[AI市场格局]]></category>
		<category><![CDATA[AI开源项目]]></category>
		<category><![CDATA[AI成本分析]]></category>
		<category><![CDATA[AI投资策略]]></category>
		<category><![CDATA[AI推理市场]]></category>
		<category><![CDATA[AI推理未来]]></category>
		<category><![CDATA[AI数据中心]]></category>
		<category><![CDATA[AI服务器管理]]></category>
		<category><![CDATA[AI生态小厂]]></category>
		<category><![CDATA[AI硬件]]></category>
		<category><![CDATA[AI自由市场]]></category>
		<category><![CDATA[AI行业内幕]]></category>
		<category><![CDATA[AI行业梗]]></category>
		<category><![CDATA[AI行业盈利]]></category>
		<category><![CDATA[AI话题营销]]></category>
		<category><![CDATA[AI资源分配]]></category>
		<category><![CDATA[AI量化交易]]></category>
		<category><![CDATA[AI量化模型]]></category>
		<category><![CDATA[AI高峰时段]]></category>
		<category><![CDATA[API定价]]></category>
		<category><![CDATA[CUDA]]></category>
		<category><![CDATA[DeepSeek]]></category>
		<category><![CDATA[Deepseek V3]]></category>
		<category><![CDATA[DeepSeek开源库]]></category>
		<category><![CDATA[DeepSeek计算精度]]></category>
		<category><![CDATA[GPU全天运营]]></category>
		<category><![CDATA[GPU租赁成本]]></category>
		<category><![CDATA[GPU负载均衡]]></category>
		<category><![CDATA[H100芯片]]></category>
		<category><![CDATA[H800]]></category>
		<category><![CDATA[MAAS厂商]]></category>
		<category><![CDATA[MAAS盈利模式]]></category>
		<category><![CDATA[MAAS竞争]]></category>
		<category><![CDATA[R1价格]]></category>
		<category><![CDATA[中国AI企业]]></category>
		<category><![CDATA[中美AI价格差]]></category>
		<category><![CDATA[中美AI市场对比]]></category>
		<category><![CDATA[云服务厂商]]></category>
		<category><![CDATA[云计算]]></category>
		<category><![CDATA[华为云]]></category>
		<category><![CDATA[商业逻辑]]></category>
		<category><![CDATA[大模型服务]]></category>
		<category><![CDATA[大模型训练]]></category>
		<category><![CDATA[字节跳动DeepSeek]]></category>
		<category><![CDATA[并行计算]]></category>
		<category><![CDATA[开源协议]]></category>
		<category><![CDATA[推理利润]]></category>
		<category><![CDATA[推理效率]]></category>
		<category><![CDATA[推理系统]]></category>
		<category><![CDATA[数据参考价值]]></category>
		<category><![CDATA[数据水分]]></category>
		<category><![CDATA[数据逻辑]]></category>
		<category><![CDATA[模型优化策略]]></category>
		<category><![CDATA[模型即服务]]></category>
		<category><![CDATA[深度学习]]></category>
		<category><![CDATA[硅基流动]]></category>
		<category><![CDATA[腾讯DeepSeek]]></category>
		<category><![CDATA[腾讯IMA]]></category>
		<category><![CDATA[芯片性能]]></category>
		<category><![CDATA[训练成本]]></category>
		<category><![CDATA[路深科技]]></category>
		<category><![CDATA[达芬奇架构]]></category>
		<category><![CDATA[阿里云投资]]></category>
		<guid isPermaLink="false">https://lukefan.com/?p=1960</guid>

					<description><![CDATA[啊啊啊啊啊啊啊！！！DeepSeek推理利润545%，行业炸裂！🏆

家人们，谁懂啊！DeepSeek这次真的玩大了，推理利润直接干到545%！！！行业彻底炸裂了💥！你们还记得当年那个557.6万美金的训练成本吗？这次又来了个更狠的！🔥

**为什么这么炸？**
DeepSeek这次公布的数据，直接让所有人傻眼！别人都说亏钱，DeepSeek直接赚到飞起！背后的秘密就是——负载均衡和并行计算！🍃

**负载均衡？**
把每一层的模型专家分配到不同的设备上，让所有芯片都动起来，一点都不浪费！效率直接拉满！🚀

**并行计算？**
所有芯片一起干活，速度飞快！一边干活，一边读写数据，完全不耽误！这操作，简直绝了！🎯

**还有更绝的！**
DeepSeek还用了“驴粪蛋表面光”的策略，表面光滑，细节忽略，效率直接飞升！这操作，真的太秀了！🤯

**545%的利润怎么算的？**
GPU满负荷工作，优化手段全用上，按最贵的价格算，直接算出545%的利润！虽然有点水分，但这数据还是有参考价值的！📊

**DeepSeek的目的？**
证明自己用H800就能搞定一切，顺便让大家都卷起来！这波操作，真的太顶了！🎉

家人们，这波真的不冲不行了！DeepSeek的操作，直接改变了行业规则！赶紧收藏，随时学习！📚

#DeepSeek #推理系统 #行业革命 #负载均衡 #并行计算

从557万美金训练成本到545%利润，DeepSeek如何用惊悚的数字，震撼AI行业的？这些数字，靠谱吗？

DeepSeek以一场让人措手不及的“one more thing”，震撼性地展示其推理系统的超高利润率达545%。从557.6万美金的训练成本到惊为天人的运营优化，DeepSeek凭借负载均衡、并行计算等技术手段实现了“极致节约”。然而，其计算逻辑背后隐藏的水分也备受行业诟病。与此同时，硅基流动与路深科技就DeepSeek的利益布局展开激烈争斗，MAAS厂商格局愈加扑朔迷离。在全球AI推理市场中，DeepSeek如何借助中国价格锁死策略与开源项目继续站稳脚跟？本期深度解读，带你全面认知AI时代下数据逻辑的权衡与商战背后的复杂博弈，探索AI推理的未来发展方向。]]></description>
										<content:encoded><![CDATA[
<figure class="wp-block-embed is-type-video is-provider-youtube wp-block-embed-youtube wp-embed-aspect-16-9 wp-has-aspect-ratio"><div class="wp-block-embed__wrapper">
<iframe title="从557万美金训练成本到545%利润，DeepSeek如何用惊悚的数字，震撼AI行业的？这些数字，靠谱吗？" width="900" height="506" src="https://www.youtube.com/embed/4xBnIP0EtYw?feature=oembed" frameborder="0" allow="accelerometer; autoplay; clipboard-write; encrypted-media; gyroscope; picture-in-picture; web-share" referrerpolicy="strict-origin-when-cross-origin" allowfullscreen></iframe>
</div></figure>



<p>DeepSeek也玩“one more thing”，突然公布了它的推理利润达到545%，就像当初557.6万美金的训练成本那样，再次震惊了行业。大家好，欢迎收听老范讲故事的YouTube频道。今天咱们来讲一讲，DeepSeek结束了连续5天的开园周之后，到礼拜六玩了一次“one more thing”。这个“one more thing”呢，应该是当年乔布斯的梗。他每一次开发布会到最后的时候呢，都要说“还有一件事，等一等”，而且这一件事呢，往往是特别重要、特别颠覆性的事情。那么这一次又来了，DeepSeek公布了它的V1和R3推理系统相关内容，及大规模部署的成本和收益数据。就是说我部署了这东西以后，到底是挣了多少钱？非常非常让人震惊，因为所有人做这个东西都说我不挣钱，我亏钱，结果等到他这好，545%的利润，所有人都傻了，说你到底咋干的？</p>



<p>具体的实现方法呢，就不再跟大家详细分析了。简单来说，第一个负载均衡，你想他有这么多的GPU，这么多的核心，在他这种MOE的架构下，他把每一层的模型里边每一个专家，分配到不同的设备上面去进行运算。这个呢，就是一个负载均衡，尽量让所有的芯片都动起来，不要说有的芯片闲着呢，有的芯片在那排队。第二个，并行计算。并行处理是什么呢？所有的芯片一起来干活，这个速度肯定会变快。另外呢，一边干活的时候，另外一边呢，再同时进行数据的读写。你不能说我这需要数据了，你给我读，然后处理完了以后你再去写，这样就变慢了嘛。所以基本上在做这样的事情，负载均衡和并行处理。</p>



<p>另外还有一个什么样的事情在做呢？就是有一点点叫“驴粪蛋表面光”。这个也算是老北京的一个俏皮话，什么意思呢？就是这个驴粪球外边是很光滑的，但是里边呢，就是一堆的没有消化好的碎草。DeepSeek也是如此，他把很多的计算精度呢进行了调整，他尽可能的能够达到大家的要求，但是很多细节上的这些你看不到的环节呢，就给你忽略掉了。</p>



<span id="more-1960"></span>



<p>所以，这个也可以极大地提高效率。他说：“我通过了这样的方式，达到了545%的利润。”当年给出的DeepSeek V3 557.6万美金的训练成本，已经成为了一个业内的计量标准，或者计量单位了。就跟你说这个东西是一牛顿，那个东西叫一瓦特，他这个557万的训练成本，也成了一个计量单位。OpenAI用了1,400万美金投超级碗广告的时候，很多人就说：“你这玩意够训练几次DeepSeek了？”这个已经成为一个业内梗了。</p>



<p>在制造话题这块，DeepSeek作为AI时代的顶级企业是合格的。大家注意，AI时代跟以前不一样。原来呢是酒香不怕巷子深，但是现在你从OpenAI、Anthropic，再到国内的DeepSeek，每一个都是制造话题的好手。必须要会讲故事，才可以在这个时代好好地玩下去。</p>



<p>那么，545%的利润和557.6万美金的训练成本，到底是一个什么样的概念呢？是真的还是假的？是不是吹牛？很多人一上来就会问这样的问题。事情呢，没这么简单。数据肯定有一定水分，咱们一定要承认这件事。但是呢，这个数据也是有参考价值的，不是说你这个东西是真是假，一刀切完事了。这个还是要具体来去分析一下。</p>



<p>咱们呢来看一看，545%的利润到底是怎么算出来的。说这个GPU都是7*24小时满负荷工作，然后呢把所有的优化手段都用到极致，就是他这5天发布的这些优化手段，我都给用上了。然后计算输出TOKEN的总量，就是我这么长时间，一共可以输出多少TOKEN出来。按照最贵的DeepSeek R1的价格来去收钱，这个是100万TOKEN 16块钱，这个是DeepSeek自己给的价格。国内的这些云服务厂商，基本上都是按这价格做的。等于就是说我一天24小时，满负荷输出这么多的TOKEN，能够说到多少钱。再以GPU租赁的价格，两美金一小时作为成本，把这俩数一除，就算出了一个545%的一个利润率来。他是这么算出来的。那这个水分在什么地方呢？</p>



<p>第一个GPU是不可能7*24小时满负荷工作的。就跟送外卖一样，赶上午餐时间大家都得去送外卖，午餐吃完了以后所有人都在那闲着，这个才是正常的状态。GPU也是如此的，你不可能说大家都商量好了，这个7*24小时达到均匀的来，我们让所有的GPU跑满，谁都别闲着。这个事是绝不可能的，而且距离现实情况相距甚远。</p>



<p>正常应该是什么呢？为了保障高峰时期的服务不崩，必须要容忍非高峰时期，可能有70%到80%的服务器是冗余的，或者在那闲置的。那你说到底有多少这个时间算高峰时间，有多少时间是非高峰时间呢？这个一天里头的高峰时间，可能能够有这么三五个小时也就到头了，不会到8个小时的。</p>



<p>像我们以前做游戏的时候，是什么时候高峰时间呢？中午吃饭的时候，还有吃完晚饭9点以后算是高峰时间。那你说我这是工作上班的事情，那他应该是在早晨10点、11点，你没准是个高峰，然后下午2点多到四五点钟，是有一个高峰。其他的时候这个服务器都是闲着的。所以千万不要觉得说，能够跑20个小时的高峰，想都不想，你能跑4个已经算很好很好了。</p>



<p>那么DeepSeek也不是所有服务都收费的，它是按最贵的那个算，按DeepSeek R1每100万TOKEN 16块来算的。你如果按照DeepSeek V3，每100万TOKEN也才8块钱，就肯定没有500%多的利润。而且DeepSeek上呢，比如说他的网页还有他的APP，这些都是不要钱的，你也得为人服务。那这一块他就没算在里头，都按这个R1去收费了，所以这个肯定是不对的。</p>



<p>而且现在DeepSeek呢，在晚上的非高峰时期，也就是凌晨3点到第二天8点这段时间，他还对这个API的价格打折。这块他也没算在里头。其实我觉得他真没必要打折，因为我在这个时间段试过，依然很慢，他的服务器依然是不反应的。所以呢，他做这样的事情，应该还是有一些奇怪目的的吧。他现在的这个成本呢，只计算了GPU的租赁成本。</p>



<p>这个肯定也是有水分的。当然了，GPU租赁呢，是包含服务器、水电、制冷、相关人员成本的，甚至还包括资金占压成本和一些利润。因为你找别人去租GPU来，人家还挣钱呢。所以这块呢，一个小时两美金这个事还是比较宽裕的。而且DeepSeek自己部署机房的话，可能它的成本还要比一个小时两美金要稍微低一点点。但是呢，他的研发、训练、数据准备等等这些成本都没算在里头去。所以呢，他在整个计算成本的时候呢，肯定是极大的降低了成本的总量。</p>



<p>这个呢，就跟前面咱们讲557.6万美金的DeepSeek V3训练成本其实是一样的，也是这么算出来的。它只计算了2,048块GPU运算了多长时间，其他的什么人员工资、数据准备这些全都没算进去。咱们这里的人员工资就是分两块，一块是机房维护的人员工资，这块呢，应该已经算到了GPU租赁的价格里边去；另外一块是他自己那帮科学家的人员工资，这部分那是没算的。</p>



<p>那么实际利润应该有多少呢？你说没有545%，那到底应该有多少？可以跟大家负责任的说，实际利润一定是亏损的，谁也不可能靠这玩意挣钱，按这价格都挣不回来。那么为什么还说这个数据是有参考价值的呢？大家注意在投融资的时候，或者是在做量化交易的时候，你需要一些简单快捷的方式去计算出某一个数值的极限范围。这个东西最多能挣多少钱，最多能亏多少钱，是要快速的算一下的。只有算完了这个以后，才可以去做一些决策。完全准确的数据说，我这东西算完了以后特别精确，就是挣这么多钱，就是亏这么多钱，这个数呢有时候没有什么意义，时间更重要。</p>



<p>DeepSeek呢就是做量化出身的，所以呢，他们很习惯这样去计算数据。你也不能说人家故意坑你。所以先计算极限，然后再向极限前进。如果发现没法到达，咱们再去分析原因调整数据。这个是甭管做投融资还是做量化，必须要干的事情。那么我们应该如何看待这样的数据呢？无脑吹，无脑喷。</p>



<p>一上来说看DeepSeek好厉害，中华之光。另外一帮人说你看这就是骗人的，这个不可能的。这个呢，您开心就好，您走错频道了，不应该来看老范讲故事。您去找一些更二极管一点的频道去看，会更加开心一点点。还有一些人呢，找出证据来论证他不靠谱，或者是让别人自证清白。你找出证据来呀，你自己列出这个数据来呀，你看你不靠谱吧。这些人呢其实也是一种无脑的表现，就是你要知道这个东西背后的逻辑是什么，以及它的价值在哪个范围内是有效的，而不是说上来体现一下自己的优越感。这种人也没什么意思。还有些人呢上来就说，哎呀，这个事情很复杂，一句两句解释不清楚，然后呢给你说一大堆的专有名词出来。这种人可能是骗子，他总是惦记从你身上得到一些什么的。</p>



<p>所以我们真正要做的是什么呢？就是理解这种数据产生的逻辑意义，以及呢价值，在其合理的范围内使用这些数据作为参考，但是不能迷信。为什么要有合理的范围内使用呢？真理还有适用的范围呢，没有哪项真理是放之四海皆准的。真理离开了他的适用范围就是谬误。同时呢我们要训练自己快速得出类似的这种数据的能力，或者呢，是加强我们对此类数据进行判断的这种能力。</p>



<p>那么DeepSeek为什么要公布这样的一个数据呢？这个目的和险恶用心何在呢？这个才是我们吃瓜的乐趣所在。第一个他要证明自己在H800下完全能够搞定所有的事情，还能挣钱。因为一直有人在质疑DeepSeek走私了H100，手里边有5万块H100，大家都在讲这个事。但是呢，DeepSeek自己不会去证明说我手里有还是没有，这个都没有任何意义。有呢，肯定有问题，可能会造成你这种技术在海外被彻底封禁。你就算是开源说，你这个技术因为是违法获得的，所以谁都不许用，他有可能会得到这样的一个结果。那你说我没有呢，你又很难证明这个事情，说我没有，自证清白这个事是挺难的。那么干脆我们就不证明了，我既不说我干了，我也不说我不干了。他干嘛呢？</p>



<p>他说：“我证明一下，我不需要H100，我用H800完全可以搞定。我把这个事儿证明一次就完事了。DeepSeek现在也没办法把这些H100拿出来，开足马力来为大家服务。现在突然服务的很顺畅了，说你是不是把H100拿出来偷偷用了？没有，你看我说都算好了。这个我是挣钱的，我不需要把他们拿出来。他现在需要给自己做这样的一个辩白，这是第一点。”</p>



<p>“第二点是什么呢？就是我没赚着钱，你们也别想赚钱，大家一起来卷。什么意思？这个学霸经常出来说：‘你看我没有复习功课哦，我就是天天玩，但是我考得很好。’他们是很气人的。可能这跟你说完了不复习功课，炫耀了一下我怎么去玩耍了，回家就苦读到半夜。这个是很多学霸的一种套路。DeepSeek可能也是这么搞的。他自己的网页、APP和API现在基本无法使用的一个情况下，国内的各大厂呢，都在拼命地接DeepSeek。但是呢，又没有给DeepSeek付钱。那DeepSeek只能出来阴阳一下说：‘看我还是挣545%呢，你们挣老鼻子钱了，是不是得意思一下？’那干脆大家一起卷就完了。然后在这个过程中，把这些不挣钱的小的卷死。大的也不是说就挣钱了，大的是有其他业务可以补贴，他赔得起。等到最后剩这帮大的的时候，咱们再来谈这个事情。咱先把这帮小的都卷死。他在干这样的一个事情。你想学霸上来说：‘我从来不复习功课，我上来就考第一。’他干嘛呀？第一个，心里要开心一下，要稍微秀一下优越。另外一个呢，就还是说，咱们这个各层次咱们分别卷起来，要干这个事情。”</p>



<p>“那么这个事情发布了以后呢，周末还炸出一个小瓜来。这只能算小瓜了，就是硅积流动跟路深科技两边掐起来了。这两家呢，都是做MAAS的，就是大模型作为服务。咱们做云计算，有IAS，就是基础架构作为服务；SAS是软件即为服务；PAAS是平台即为服务；MAAS呢，叫model as service，就是大模型就是服务。是这样的两个厂商自己就掐起来了，为什么呢？”</p>



<p>现在，他们都接了DeepSeek，但是肯定都不挣钱，而且亏得很厉害。路深科技呢，就卷不动了。这位CEO是UC Berkeley的博士，所以我看他的这个签名是伯克利什么什么。这个人我也不认识，所以这名字咱就不记了。他呢，算是有一些网红包袱。你说我卷不动这事呢，我又不能承认。我不能承认这个网红塌房了，别人能搞定，我搞不定。所以呢，一定要找一个出口说，你看他们其实也不挣钱，他们就想卷我们，他们也有问题。他找到了谁？找到硅基流动了。这个不能是自己的问题，也不能是DeepSeek的问题。DeepSeek现在是中国之光嘛，这事一定是你自己技术不好。而且这事还不能是华为的问题，这事跟华为有什么关系呢？就是路深科技跟硅基流动，他们接DeepSeek都是跑的华为云的升腾910芯片的，他们没有跑英伟达芯片。那这个事这几家都怪不了，不能怪自己，不能怪DeepSeek，也不能怪华为。那我们怪友商吧，怪这个硅基流动吧。他说硅基流动你春节加班，因为DeepSeek的发布是在春节期间发布的嘛，而且呢还在卷砍一刀的事情。因为这个硅基流动发了好多的代金券出去，赚了一波流量。你发了这个多少亿的代金券出去，你手里就1亿2亿的现金，你根本就没有办法兑现这个事情。这个其实也是有点骗傻子了，代金券出去并不是需要用你手里的现金去兑换的，你是要用服务慢慢地去把这些代金券消耗掉，跟你手里有多少现金本身是没有关系的。当然，卷这个事呢，在中国企业的竞争过程中呢，算是一种常态吧。现在硅基流动的DeepSeek R1也基本上处于不可用状态，我现在也不用他们家的，都是用火山的。待会咱们再讲为什么用火山的。到这了这两家就开始互相掐了，硅基流动说人家是已经发布了这些开源项目了，我们照着去学就完了，但是这个事很难，你搞不定，你不要说别人也搞不定，开始阴阳这个路深科技。这两边就开始相互的指责，说你挖我的人。</p>



<p>硅基流动说你抄袭，开始互相怼起来，这已经离开事实本身了。这个呢，稍微有一点点low。卷不动呢，你就默默地退出就完了。当然，内部人设立不住呢，你就需要在外边立靶子。我们也见到了很多这样的案例了，最后呢在外部还翻了车了，只能回去继续统一思想。</p>



<p>怎么在外部翻车了呢？因为路深科技呢，被硅基流动指责说你抄袭。然后路深科技说，抄袭的那个是原来我CTO干的，CTO已经把它开了。而且呢，CTO被开了以后，还去你硅基流动上班去了。现在这个CTO也出来回复了这件事情，他说我就是当年那CTO，我去的时候这项目就已经是这样了，那个代码也不是我抄进去的。说我去了以后呢，还整理了所有的代码，把所有引用的东西呢，给他写清楚出处。</p>



<p>这个开源项目怎么算抄袭，怎么算不抄袭？就是你违反了人家的开源协议，你用了人代码你没有写说这是哪来的，这就算抄袭。你说我用了人代码了，但是我写清楚我用了谁谁谁家代码，符合人家的协议，然后我在这个基本上做什么修改了，这个就算给开源做贡献。人家的CTO说压根跟我没关系。</p>



<p>然后第二个说我为什么离开呢，是因为他们用假的期权合同骗我，让我去的时候给我承诺了期权，结果最后呢没法兑现。因为这个事情我质问了他们，所以最后离开了。在其他的一些抄袭事件，因为这个路深科技，还有其他的抄袭事件，说这个就跟我完全没关系，等于又把这个路深科技整个放这了。</p>



<p>那么DeepSeek的推理市场，未来到底怎么走呢？首先腾讯去加单了，订购了10-20万块的H20，这个是现在允许向中国出口的型号，全线接入DeepSeek。在它的微信，IMA，还有元宝这些程序里边都接了。IMA呢是一个办公用的AI助手，元宝呢，是个人用的AI助手。现在元宝在疯狂的做推广，微信的搜索里边，现在也在进行灰度测试，直接在里边可以使用DeepSeek R1进行搜索推理。字节呢，本身就是算力大户，它是全世界第二名的算力大户，第一名是微软，第二名就是它。</p>



<p>DeepSeek只做ToB的服务，就是你可以在字节的火山引擎上用它。字节自己的产品里是没有去接DeepSeek R1的，他们还是比较骄傲的，希望这个豆包模型可以追上来。所以字节的DeepSeek R1是我现在用过的所有DeepSeek R1里头最快的，因为算力足够多，用的人不是很多，所以他最快。</p>



<p>阿里云呢，未来三年投入3,800亿人民币做算力投入，说那我们就疯狂去买就完了。至于这些MAAS厂商，就是叫模型及服务的厂商，这个背后都是华为云，价格又被DeepSeek给锁死了，这个就很痛苦。所谓锁死了什么意思？DeepSeek在中国给出的价格，咱们就说R1的输出价格吧，是最贵的一个价格，是每100万TOKEN 16块钱。现在甭管是路深科技还是硅基流动，或者是阿里云火山云，都是用同样的价格给的，100万TOKEN 16块人民币。但你知道国外多少钱吗？在together上刚才我查了一下，美国的服务器上部署的DeepSeek R1，它的100万TOKEN大概是七八块美金了，应该到50多块钱人民币，所以这个还是挺贵的。</p>



<p>他们的V3其实价格都差不太多，咱们的V3的输出呢，是八块钱人民币100万TOKEN，在美国的话是1.25美金100万TOKEN，这个是相差不多的。但是R1这个真的是差三倍的钱，国内这个锁死价格了，以后他们就必然会按照这个价格赔钱赔下去。</p>



<p>至于DeepSeek所开源的这些库呢，他们只能去借鉴一个思路，肯定用不上。为什么？因为DeepSeek所有开源库都是基于CUDA的，都是基于英伟达芯片的。这帮人看着一堆的华为升腾910，只能说，咱们看看这个大概思路是不是可以参考一下。那这个想去做的话难度就大了，而且整个的服务过程必然亏损。原因也很简单，就是你的服务器绝不可能7*24小时很均匀、很平顺的满负荷运转，这个事情从头到尾就是个伪命题，所以肯定是亏的。</p>



<p>而且，华为呢是不会承担这种亏损的。你跟华为合作，人家还忙着爱国呢。你亏了钱，肯定是你自己的问题。而且，人家DeepSeek说了：“我这能挣钱，你亏了，你不能怪我，你也不能怪华为。你看看你自己的技术哪不对。”</p>



<p>而且，这些MAAS的厂商呢，还没有大厂其他的业务可以补血。你比如像刚才我们讲，腾讯在这个IMA或者是元宝里边，去使用DeepSeek R1的时候，你是不用付钱的，免费的。但是，腾讯有游戏收入，有广告收入，还有各种电商收入。他有一堆收入可以补这个窟窿。他去买20万张的H20，花不了多少钱，对于他整个利润来说，都是可以承担的成本。</p>



<p>硅基流动，路深科技，你跟他卷，这你肯定卷不过他。更别说字节跳动了，字节跳动比腾讯还能挣钱呢。所以呢，跟大厂他们也卷不过。model as a service的这些厂商呢，只能看谁坚持到最后。坚持到最后，也不是说他们就能胜出。坚持到最后呢，也就是看最后谁能够下车，被这些大厂所收购。这应该就是他们的出路。</p>



<p>当然，你说我未来是准备被收购的，那也就不能长太胖。什么意思？你不能拿太多的融资，必须要自己挣钱。因为你拿了很多融资以后，你的估值会变得非常高。等到最后大厂去选择一家，把它收下来的时候呢，通常还是要去衡量一下性价比的。</p>



<p>那么，总结一下。首先呢，要感谢DeepSeek又给了一话题，又可以跟大家扯一会儿。如何理性地判断各种夸张数据背后的逻辑和价值，才是今天我们要讲这期视频的核心点。而不是说，我们来批判一下这东西合理还是不合理，这个没有什么意思。</p>



<p>AI正在走向新的时代，过去很多的商业逻辑呢会发生变化。过去的经验未必有效，但是依然是会有一定的价值。你像我给大家分析很多东西，都是根据我过去的很多商业逻辑来分析，但是也不能迷信这个东西。像我每次都会跟大家强调，这个东西呢，有可能分析的不全面，未来有可能会出现我们想象之外的东西。那这个才是我们这个频道始终跟大家所强调的东西。好，这期就讲到这里。</p>



<p>感谢大家收听。请帮忙点赞、点小铃铛，参加Discord讨论群。也欢迎有兴趣、有能力的朋友加入我们的付费频道。再见。</p>
]]></content:encoded>
					
		
		
			</item>
	</channel>
</rss>
