<?xml version="1.0" encoding="UTF-8"?><rss version="2.0"
	xmlns:content="http://purl.org/rss/1.0/modules/content/"
	xmlns:wfw="http://wellformedweb.org/CommentAPI/"
	xmlns:dc="http://purl.org/dc/elements/1.1/"
	xmlns:atom="http://www.w3.org/2005/Atom"
	xmlns:sy="http://purl.org/rss/1.0/modules/syndication/"
	xmlns:slash="http://purl.org/rss/1.0/modules/slash/"
	>

<channel>
	<title>商业逻辑 &#8211; 老范讲故事｜AI、大模型与商业世界的故事</title>
	<atom:link href="https://lukefan.com/tag/%e5%95%86%e4%b8%9a%e9%80%bb%e8%be%91/feed/" rel="self" type="application/rss+xml" />
	<link>https://lukefan.com</link>
	<description>这里是老范讲故事的主站，持续更新 AIGC、大模型、互联网平台、商业冲突与资本市场观察，帮你看清热点背后的底层逻辑。</description>
	<lastBuildDate>Sun, 17 Aug 2025 00:45:49 +0000</lastBuildDate>
	<language>zh-Hans</language>
	<sy:updatePeriod>
	hourly	</sy:updatePeriod>
	<sy:updateFrequency>
	1	</sy:updateFrequency>
	<generator>https://wordpress.org/?v=7.0</generator>

<image>
	<url>https://lukefan.com/wp-content/uploads/2026/03/cropped-jimeng-2026-02-28-5245-用图一的人物形象，替换图二中的人物，使用图二的风格。文字替换：老范讲故事，Yo-32x32.jpeg</url>
	<title>商业逻辑 &#8211; 老范讲故事｜AI、大模型与商业世界的故事</title>
	<link>https://lukefan.com</link>
	<width>32</width>
	<height>32</height>
</image> 
	<item>
		<title>“穷鬼套餐”席卷北京！高档餐厅血亏自救？揭秘消费降级背后的残酷真相。</title>
		<link>https://lukefan.com/2025/08/17/%e7%a9%b7%e9%ac%bc%e5%a5%97%e9%a4%90%e5%b8%ad%e5%8d%b7%e5%8c%97%e4%ba%ac%ef%bc%81%e9%ab%98%e6%a1%a3%e9%a4%90%e5%8e%85%e8%a1%80%e4%ba%8f%e8%87%aa%e6%95%91%ef%bc%9f%e6%8f%ad%e7%a7%98/</link>
		
		<dc:creator><![CDATA[Luke Fan]]></dc:creator>
		<pubDate>Sun, 17 Aug 2025 00:45:47 +0000</pubDate>
				<category><![CDATA[新消费]]></category>
		<category><![CDATA[五星级酒店套餐]]></category>
		<category><![CDATA[低价套餐]]></category>
		<category><![CDATA[住宿业寒冬]]></category>
		<category><![CDATA[体验式消费]]></category>
		<category><![CDATA[公务消费收紧]]></category>
		<category><![CDATA[利润下滑]]></category>
		<category><![CDATA[包间费]]></category>
		<category><![CDATA[北京餐饮]]></category>
		<category><![CDATA[商业宴请减少]]></category>
		<category><![CDATA[商业逻辑]]></category>
		<category><![CDATA[场景化消费]]></category>
		<category><![CDATA[宫宴]]></category>
		<category><![CDATA[开瓶费]]></category>
		<category><![CDATA[必胜客]]></category>
		<category><![CDATA[快餐打折]]></category>
		<category><![CDATA[成本控制]]></category>
		<category><![CDATA[抖音团购]]></category>
		<category><![CDATA[民企消费]]></category>
		<category><![CDATA[水煮鱼]]></category>
		<category><![CDATA[洗浴中心自助餐]]></category>
		<category><![CDATA[消费升级新探索]]></category>
		<category><![CDATA[消费心理]]></category>
		<category><![CDATA[消费降级]]></category>
		<category><![CDATA[直播囤券]]></category>
		<category><![CDATA[社交媒体传播]]></category>
		<category><![CDATA[社会观察]]></category>
		<category><![CDATA[社保大限]]></category>
		<category><![CDATA[穷鬼套餐]]></category>
		<category><![CDATA[经济观察]]></category>
		<category><![CDATA[老范讲故事]]></category>
		<category><![CDATA[背后故事]]></category>
		<category><![CDATA[自助餐优惠]]></category>
		<category><![CDATA[茅台]]></category>
		<category><![CDATA[行业眼泪]]></category>
		<category><![CDATA[行业自救]]></category>
		<category><![CDATA[跑部前进]]></category>
		<category><![CDATA[餐厅打折]]></category>
		<category><![CDATA[餐饮业困境]]></category>
		<category><![CDATA[餐饮内卷]]></category>
		<guid isPermaLink="false">https://lukefan.com/?p=2465</guid>

					<description><![CDATA[北京“穷鬼套餐”=真香+眼泪合集！兄弟们刷抖音是不是都被1折2折喂到饱？三四百吃出千元氛围，79块双披萨送上门🤤。我周四拿券去核销，被告知只能周末…直男逻辑一转：懂了！周末统一小份码，免得你和隔壁比份量；最好再点外卖，省桌子省洗碗，还没得比较，老板更开心🤑。

可数据很扎心：北京餐饮利润两年“腰斩再腰斩”，住宿同比-92%几乎没利润📉。为了活下去只好玩新花活：200+洗浴中心十小时躺平自助🛁；宫宴cosplay边看戏边吃小口菜👘🎭，体验拉满。

对我来说，穷鬼套餐是真香；对他们，是求生。你囤券了吗？核销“塌房”过没？评论区唠唠，顺手点个赞，让我继续给你挖商业内幕👍。

“穷鬼套餐”席卷北京！高档餐厅血亏自救？揭秘消费降级背后的残酷真相。

北京“穷鬼套餐”的火爆背后，隐藏着餐饮业利润暴跌近90%的残酷现实与艰难自救的商业逻辑。从人均上千的五星酒店到街边快餐，为何如今都在抖音上推出一、二折的跳楼价套餐？这究竟是消费降级的无奈之举，还是商家暗藏玄机的新玩法？

本期视频，我们将深入探讨北京餐饮业的“内卷”现状。我将分享一次亲身经历的“塌房”事件，并为你剖析商家在套餐菜量、核销时间上精心设计的商业模式，以及他们为何更希望你选择外卖配送。我们还将揭露导致高端餐饮倒闭近半的深层原因：从商务宴请锐减、反腐禁酒令到“跑部前进”的消失。面对前所未有的经济寒冬，餐饮人并未躺平，而是催生出了“洗浴中心自助餐”和极具传播效应的“宫宴”等新消费形态。

这究竟是行业最后的哀嚎，还是新一轮洗牌的开始？完整视频揭示更多内幕。如果你也对商业故事感兴趣，请务必订阅我们的频道，并点赞、分享给更多朋友！

###
#穷鬼套餐 #消费降级 #商业模式]]></description>
										<content:encoded><![CDATA[
<figure class="wp-block-embed is-type-video is-provider-youtube wp-block-embed-youtube wp-embed-aspect-16-9 wp-has-aspect-ratio"><div class="wp-block-embed__wrapper">
<iframe title="“穷鬼套餐”席卷北京！高档餐厅血亏自救？揭秘消费降级背后的残酷真相。" width="900" height="506" src="https://www.youtube.com/embed/Grh886Wyu8o?feature=oembed" frameborder="0" allow="accelerometer; autoplay; clipboard-write; encrypted-media; gyroscope; picture-in-picture; web-share" referrerpolicy="strict-origin-when-cross-origin" allowfullscreen></iframe>
</div></figure>



<p class="wp-block-paragraph">北京餐厅的“穷鬼套餐”确实是香，但这背后又隐藏了哪些辛酸和眼泪呢？</p>



<p class="wp-block-paragraph">大家好，欢迎收听<a href="https://youtube.com/@StoryTellerFan" target="_blank" rel="noopener">“老范讲故事”的YouTube频道</a>。</p>



<p class="wp-block-paragraph">最近刷抖音，经常看到那种让人惊掉下巴的便宜套餐。很多原来两三千的套餐，现在只需要两三百，经常能够看到一折、两折的套餐在抖音上面做直播。你看着那个餐厅环境，我花一两百块钱居然也可以坐在这里边去吃一顿，就感觉是混到了富人圈里一样。</p>



<p class="wp-block-paragraph">抖音的这个囤券模式呢也很有意思，非常多的这种高档餐厅，都坐在那直播的时候给大家发券。您把这券买下来，你说我哪天不想吃了，可以直接退。这个券也不是永远有效，超过时间你没去吃，也给你直接退。所以相对来说呢，大家购买的时候并没有什么心理负担。你说我买完券，给我配送到家也没毛病。其实店家更希望你配送到家，待会儿咱们再讲为什么。</p>



<p class="wp-block-paragraph">这件事，原来上千的这种高档餐厅，特别是五星级酒店的餐厅，都推出了这种两三百或者三四百的三、四人餐，肯定是能够满满的摆一桌子，而且环境极好。当然，他不可能给你出这种单人套餐，你想，你跑到人那去占一桌吃个100块钱，人家还得收拾桌子，这事儿肯定不划算。所以这种大饭店的套餐呢，一般都是两三人的套餐。</p>



<span id="more-2465"></span>



<p class="wp-block-paragraph">原来商超里边人均两三百的餐厅呢，现在经常会出人均50的套餐，一百几十块钱，不到两百块钱，也够两三个人或者是三四个人可以吃那么一顿的。像我们一家子人出去吃呢，买这种三人套餐肯定是能吃完了，还打包一点点回来，北方的菜量还是比较大的。但你如果是一堆小伙子或者是学生去吃，可能未必够吃。</p>



<p class="wp-block-paragraph">现在自助餐都开始打折了。以前自助餐是不跟着打折的，现在海鲜自助、日料自助，他们都在跟着打折。原来基本上是要到200多甚至300一位的这种自助餐，现在都是100多一位的都出来了。而且呢，不光是这种刚才咱们讲人均500上千的在打折，人均两三百的在打折，自助餐在打折，那些便宜的快餐也在打折，大家都在内卷。比如麦当劳、肯德基、必胜客，这些快餐通通加入了打折大军。</p>



<p class="wp-block-paragraph">咱们以必胜客为例吧，以前咱们去必胜客吃一顿饭，吃多了可能人均都得到七八十甚至上百。现在的话，79双披萨套餐，披萨是9寸的披萨，3样小吃再加上一个饮料，一共给你6样东西：两个披萨，3个小吃，一个饮料，79块钱给你配送到家。你说我不想吃那些小吃，不需要饮料，我就要俩披萨行不行？没问题，两个九寸的披萨59块9。你要想早早的把这东西囤下来，46块9，便宜吧。</p>



<p class="wp-block-paragraph">当然了，这么便宜的套餐呢，有的时候体验未必好。我自己呢就遇到了一次“塌房”。我跟我太太带着儿子买了一个券，就出去消费去了，150多块钱吧，我记得是有水煮鱼再加上几个菜，反正也是绝对够我们吃的这个菜量。周四的晚上，我们就跑到人饭馆去了。你说，你看我有券，给我上菜吧。结果到人那说：“哎，不行，您这个核销不了。”我说啥情况？他说：“你这个券只能礼拜六、礼拜天核销，礼拜一到礼拜五工作日都不允许。”</p>



<p class="wp-block-paragraph">后来我看整个店里也没什么人，我说这什么情况？按道理说，你这礼拜六、礼拜天人多呀。他是一个商超里边，不是这个写字楼里头。你要写字楼里头呢，礼拜六、礼拜天人少，礼拜一到礼拜五人多，这个咱能够理解。但那是个商超，周围都是居民，为什么有这样的一个政策？人说我们也不知道，反正就是这样规定的，我们就这么执行了。</p>



<p class="wp-block-paragraph">当时我们就百思不得其解，赶快换了个饭馆再去吃饭，当然那张券就被我退掉了。然后一边吃就一边在这想，像我这种比较喜欢思考商业逻辑的人，遇到这种反逻辑的事情，你不把它想透的话，这个肯定是不行的。</p>



<p class="wp-block-paragraph">我想到的第一个原因是什么呢？是不是礼拜六、礼拜天他们备的菜比较多，所以他整个原料成本下降了？后来想不对，就算礼拜六、礼拜天你备的原料多一些的话，这个成本下降也没有那么多。毕竟礼拜六、礼拜天他这个饭馆还要排队的，要去翻台的，那你为什么不让我礼拜一到礼拜五把它核销掉了呢？</p>



<p class="wp-block-paragraph">我最后再把这顿晚饭吃完了，当然不是在前面咱们讲到核销失败的这家，换了一下去吃饭。吃完了以后我突然灵机一动，把这事想明白了。礼拜六、礼拜天，他们整个的菜量都要下降。如果你礼拜一到礼拜五去，他所有菜的这个尺寸会稍微大一些；如果礼拜六、礼拜天去，你所有菜的尺寸都会稍微小一些。你如果说是礼拜一到礼拜五，你要去核销这个券的话，你说他按什么样的菜量给你做呢？如果按照这个套餐的量给你做，你一看说：“哎，旁边那桌的水煮鱼怎么比我这桌的碗大呀？”这事没法干了。你说我按着这个礼拜一到礼拜五的菜量去做呢，他又不划算。人家说我们周一到周五能用的券是240、250吧，礼拜六、礼拜天能够核的券是150的，差100块钱，同样是这么几个菜，我说肯定是这个菜量上有毛病。</p>



<p class="wp-block-paragraph">如果礼拜六、礼拜天，大家统一都用这个比较小的菜码，互相看看左右，他的水煮鱼的碗都差不多大，那大家也不会说什么。这是我给他想出来的一个逻辑。</p>



<p class="wp-block-paragraph">那么他们其实更希望什么呢？就是你在家吃，不要到店核销，通通给你配送到家去。为啥呀？你不占人桌子，人家不需要洗碗，你只需要是加上配送费、加上包装盒的钱就完事了。虽然配送费和包装盒它也是成本，但是呢，一般配送费我们也要自己付一部分，但是不需要去占他的房租了，他还是觉得比较好的。另外一个怎么很好的是什么？就是大家都配送到家了以后，你就没得比较了。我这个水煮鱼是不是比旁边那份大点小点？都配送到家了，你比较什么劲。所以他们这种更希望你去配送到家。</p>



<p class="wp-block-paragraph">当然这个事呢，我觉得也不怪人家，是我自己买券的时候没有看好。对于我来说呢，思考一下人家的商业逻辑，还算是给我增加了一些小小的快乐吧。</p>



<p class="wp-block-paragraph">北京的餐饮行业，怎么就变成这样的一个状态了呢？那些五星级酒店，原来这种可能人均上千的这种餐厅，怎么就出了这种人均一两百的这种套餐，让你去感受这样的奢华生活呢？其实呢，这已经是北京餐饮行业在发出的最后哀嚎了。</p>



<p class="wp-block-paragraph">2025年上半年，北京的餐饮跟住宿的利润下降了67%，就是跟2024年上半年比。但是要注意，2024年上半年跟2023年上半年比，这个数据还下降了60%。所以这是连续两年的腰斩再腰斩。</p>



<p class="wp-block-paragraph">最惨的呢，其实还不是餐饮，最惨的是住宿。2025年上半年，住宿的利润同比下降了92%。这是一个多么可怕的数字，92%就相当于没利润了吧。所以2025年上半年，北京规模以上，就是年销售额1000万以上的这些住宿企业，就是宾馆吧，他们呢总共挣了5000多万人民币，5890万人民币。合着呢，每家宾馆上半年6个月的利润是3万块钱，有1000多家宾馆在北京，所以呢基本上就是大家都躺平了。</p>



<p class="wp-block-paragraph">餐饮呢，比宾馆也没好到哪去。2023年上半年，北京餐饮的利润是16.9亿，到2024年和2025年基本上是持平的，北京餐馆的利润是1.8亿，就剩这一点点了，在原来16.9亿的基础上一折多一点点。</p>



<p class="wp-block-paragraph">餐厅里边最倒霉的肯定是大餐厅，这些高档餐厅，我们呢叫千元以上餐厅，也就是人均消费1000块钱以上的这些餐厅。这些餐厅在全国范围内，三年倒闭了一半。北京呢比全国可能还要稍微好那么一点点，只倒闭了47%。上海呢算是还不错的，只缩减了40%，还剩下60%。深圳比较惨，缩减了57%，看来现在做出口也没那么好做。杭州呢整个还不错的，只缩减了35%。这就是全国千元以上餐厅现在的一个惨状。</p>



<p class="wp-block-paragraph">这些千元以上餐厅，其实主要就是北京、上海、广州、杭州这些大城市。那些小的省会级城市呢，可能每一个城市里头没有几家，因为养不活这么多这玩意儿。</p>



<p class="wp-block-paragraph">那为什么这么惨呢？原因也很简单，商业宴请少了很多生意。特别是境内的这种大生意呢，基本停滞了。原来我们如果在境内做生意，什么情况下会去请人吃大饭呢？你要去跟国企做生意，要去跟央企做生意，你才去请人吃大饭呢。现在的话，央企国企说“我这有项目，咱大家来做”，根本没人理他。为啥？都要垫资。你垫了半天资以后，最后找他要钱，他没了，或者他不给你钱，这个事就没办法。现在民企的生意可能还有人接，央国企的生意压根没人接了。人家是有生意让你做，但是没有人说“我为了接您这工程，或者为了接您这项目，还请您吃顿饭”，没有这事了。</p>



<p class="wp-block-paragraph">那民企之间的生意呢，其实没有必要吃那么贵的饭。大家生意都不好做，原来生意好做的时候，大家出去吃吃喝喝一下都是正常的。现在呢，日子都没那么好过，所以呢都勒紧裤腰带了。</p>



<p class="wp-block-paragraph">再加上以前在互联网圈子里，其实也有很多吃大饭的机会是什么呢？你比如说跟人家要点流量，要一点政策呀，干这些事情。但是呢，这几年也是反腐，互联网行业也反腐，把很多的掌握一些小权力的，比如说像阿里的“店小二”，把这些人都直接送进去了。所以现在呢，其实依然敢干，但是不是知根知底的，真不敢出来了。这也是为什么你看到现在杭州的只缩减了35%，所以这块呢有影响，但是影响并没有那么大。这两年没怎么听说杭州反腐，阿里其实反腐并不是那么多，但是你看腾讯在深圳，一把一把的反腐，一把一把往里送人，所以深圳的千元以上的餐厅直接去掉了53%。</p>



<p class="wp-block-paragraph">政府公务方面的吃喝呢，肯定是严管。从咱们这开始提出“光盘行动”开始，就一步一步的在收紧，官员们呢也基本上躺平了。原来呢，大家跑到北京来吃饭，他们叫“跑部前进”。这个“部”呢，不是这个脚步的“步”，而是部门的“部”。你要到部里去办事嘛，你要到部里去申请钱嘛，你要到部里去批项目嘛，你要到部里边去跑官嘛，所以他们以前管这个活叫“跑部前进”。现在呢，都不来了，住宿酒店也玩不转了，这些大饭也吃不下去了。</p>



<p class="wp-block-paragraph">再加上什么呢？禁酒令，非常严格的禁酒令。餐饮里边真正利润来自于酒，再加上现在的什么保护野生动物，没有那么贵的食材，所以这些事现在基本上都没有了。你要真想把这一顿饭吃的比较贵的话，最大头都是酒。像我们以前请客吃饭，大概百分之六七十的钱都是酒钱，菜钱真没有那么多。</p>



<p class="wp-block-paragraph">大家还有“开瓶费”的记忆吗？你说我在街面上买酒好像没那么贵，你到人那大酒店里头去喝酒，他不让你从外边带。你要想从外边带酒进去，他还得给收你开瓶费呢。你想在一个特别好的环境里头，在包间里头大家关上门喝的五迷三道的，称兄道弟勾肩搭背，把这生意做成，这个都是有成本的。你不能说自己在外边偷偷买一瓶茅台进来喝，你是要交钱的。当然这些呢，都是往事云烟，再也回不来了。</p>



<p class="wp-block-paragraph">消费的主题呢，现在在发生巨大的变化。原来呢，这些高档酒店、高档饭店都是为公务吃喝、有人报销，为这件事去办的。即使是商务宴请，两个公司之间吃顿饭，也得有人报销。到现在呢，基本上都是个人和家庭吃喝。</p>



<p class="wp-block-paragraph">新的消费升级其实也在尝试。大家别老看见说“哎呀，这个打了一折、打了两折，消费降级了”，那是为了活下来，他没办法。大家也在尝试说，我们到底做点什么新的花样出来，让这个顾客愿意花钱。原来的饭馆里头搞的是什么呢？叫“大厅揽客，包间有利润”。你一到餐厅里头去，你在大厅里头基本上是没利润的，跑个流水完事了。你只有进到包厢里头，开始喝白酒、红酒，这玩意儿才有利润出来。现在的话，包间都是空置率70%。大家还记得以前还有“包间费”这种东西吗？想占个包间吃顿饭，对不起，您得有交包间费。或者说这个包间费也没有吧，但是包间里头会有低消，就是你最少要花掉多少钱，你才能在包间里吃饭，否则大厅里去。现在玩不转了，包间都空着，你想上包间，想请人到包间里去吃饭，人家都不去。</p>



<p class="wp-block-paragraph">现在咋消费升级呢？第一个玩的是洗浴中心的方式。大家别想歪了，洗浴中心都是很健康的。现在呢是跑进去洗个大澡，以前洗个大澡里头是包括一些灰色地带的。现在洗个大澡，一般都是亲朋好友一块去蒸桑拿。洗完澡以后呢，最核心的是什么？不是按摩呀，不是其他的这些灰色的消费了，而是进去休闲，打游戏、看书、找地方歇着呀，再加上什么呢？十几个小时的自助餐，你可以在里边可劲造，一个人大概是200多块钱。现在兴起了一些这样的消费，你在这一个地方待个十来个小时，管一顿饭，不可能管两顿饭。中间不吃饭的时候呢，你还可以吃水果、喝饮料，这些玩意都包括在洗澡的钱里边去了，其他的都没有单独收费了。</p>



<p class="wp-block-paragraph">那你说这200多块钱，这个消费还不够升级？虽然这里头也是什么这个帝王蟹、北极贝，什么这些玩意全都上来了，但是还不够。还有什么更高一些的这种消费升级没有？还有。现在还实行一种东西叫“宫宴”，宫廷的“宫”，宴会的“宴”。这是什么呢？大家都坐大厅里，这里没包间，他这个包间实际上都是开放的，不是原来关着门谈生意的，而是呢开放敞着口，你可以在下面看表演的那种，你可以认为它是包厢吧，就是类似于剧场包厢似的。大厅里头呢，大家穿上古装，扮上这个cosplay扮相，然后一边看演出，一边在这吃宫廷菜。人家也是一顿饭多少道菜上来，这边有这个古装的表演，还给你吟诗作赋，给你唱歌跳舞。每道菜其实量都很小，主要是吃的体验。</p>



<p class="wp-block-paragraph">这种菜呢，一般人均是在四五百，这就已经比较贵了。服饰、发型、化妆的话，每样呢还要再单收个100-200。就是像我男生去了，也想跟人去照个相什么的，我不能穿着这个大背心、大裤衩跑人那去坐着吃宫宴，我也得穿上古装，带个员外巾，一边吃饭一边照照相。比如说我带着老婆孩子去，那一家三口也都得穿上古装才能在那吃这顿饭。我呢，可能只要换身衣服就完了，100块钱搞定。但是太太呢，肯定你除了这个换衣服之外，你还得在那做头发呀。咱们现代人的这种短发，或者说这种比较简单的头发，你没法去穿人家那衣服，人家可能还有假发什么给你做，这头发又100。你还得化妆吧，那像我们这就老爷们，换上衣服就已经很好了，人家还得化妆，可能又一两百就没有了。所以这可能人均就奔千去了。</p>



<p class="wp-block-paragraph">整个的过程就没有进包间，大家都是坐在大厅里头看着表演，听着音乐，吃着可能一道菜那么一口两口，上个十几二十道菜。但是这样的形式现在也开始搞了，而且现在很多的什么日本人、韩国人打着飞机跑到北京、上海来吃这个宫宴来。他们吃这宫宴的过程必然是干嘛？拍照录像。这些东西它就有新的传播了，你就可以跑到Instagram呀，跑到YouTube呀，跑到各种的社交媒体上去传播一下。至于饭好吃不好吃，咱看着视频、看着这个照片，你看不出来。但是呢，哎，穿的是古装，人家有表演，还给你念诗，你还在这拍的美美的自拍照，这个传播效果是很好的。</p>



<p class="wp-block-paragraph">你说消费还有机会恢复吗？现在大家都在想新的招，让大家活下去。那有没有机会说咱们忍一忍，就重新恢复回来，咱们按照新的方式消费下去？这个怎么说呢，我们只能说怀揣希望吧。前面这么凄惨的数据，还没有跟大家去计算9月1号“社保大限”呢。你想有多少饭馆是给服务员交了社保的？到了9月1号以后，又有多少饭馆还能剩下？这都不知道的事情。</p>



<p class="wp-block-paragraph">餐饮跟住宿呢，现在肯定是在极其积极的自救。生意嘛就是这样，你只要别真的掐死他，他们都是希望自己能够做下去的，是有主观意愿的。</p>



<p class="wp-block-paragraph">抖音呢，肯定是在里边赚了很多的钱。我看到的更多的是快餐打折，人均100以内的各种推送，每天刷抖音都能看到，看的我这个口水直流。估计呢，我已经被抖音打上了“屌丝”标签，里头是不是有更贵的套餐？可能有，但是他没推给我，他觉得我可能消费不起。旅游区的酒店套餐也是经常看到的，比如说到三亚去，住到五星级酒店里头，包括各种自助餐，住个三四天也是一千多块钱，或者是大几百块钱就下来了。这种套餐也在不断的往我推。北京的酒店套餐呢，肯定是没有看到。当然并不是说北京酒店就是生生把自己饿死，就没有套餐拿出来，只能说明推荐算法没有出错。我人在北京，如果给我看北京的酒店套餐的话，就一定是这个出问题了。我人在北京，我为什么要在北京住酒店呢？完全想不到理由，对吧。</p>



<p class="wp-block-paragraph">最后呢，咱就不用总结了。消费到底会不会崩？不知道，到现在为止真不知道。先让我再去挑几张券，出去吃喝一下再说。一些以前吃过、这几年没吃的这些饭馆呢，现在可以安排上了。一些以前就吃不起的饭店，现在也可以稍微惦记一下了。就是这样的一个情况。</p>



<p class="wp-block-paragraph">这些“穷鬼套餐”对于我来说，真香。至于其他那些餐饮人，他们到底有多少心酸和眼泪，我觉得我们现在尽量多买点券，尽量多去吃一吃，就算是对他们的最大帮助了。</p>



<p class="wp-block-paragraph">好，这一期咱们就讲到这里，感谢大家收听。请帮忙点赞、点小铃铛、参加<a href="https://discord.gg/ppKsNkttTv" target="_blank" rel="noopener">DISCORD讨论群</a>，也欢迎有兴趣、有能力的朋友加入我们的<a href="https://www.youtube.com/channel/UCUGLhcs3-3y_yhZZsgRzrzw/join" target="_blank" rel="noopener">付费频道</a>，再见。</p>



<p class="wp-block-paragraph"></p>
]]></content:encoded>
					
		
		
			</item>
		<item>
		<title>小红书突然取消大小周，员工未必开心？解析期权回购、放弃竞业、双休新政背后，隐藏的上市计划、成本优化及应对海外市场监管的战略布局。</title>
		<link>https://lukefan.com/2025/04/28/%e5%b0%8f%e7%ba%a2%e4%b9%a6%e7%aa%81%e7%84%b6%e5%8f%96%e6%b6%88%e5%a4%a7%e5%b0%8f%e5%91%a8%ef%bc%8c%e5%91%98%e5%b7%a5%e6%9c%aa%e5%bf%85%e5%bc%80%e5%bf%83%ef%bc%9f%e8%a7%a3%e6%9e%90%e6%9c%9f%e6%9d%83/</link>
		
		<dc:creator><![CDATA[Luke Fan]]></dc:creator>
		<pubDate>Mon, 28 Apr 2025 13:05:27 +0000</pubDate>
				<category><![CDATA[打工人的日子不好过]]></category>
		<category><![CDATA[996]]></category>
		<category><![CDATA[IPO]]></category>
		<category><![CDATA[MCN]]></category>
		<category><![CDATA[TikTok]]></category>
		<category><![CDATA[YouTube频道]]></category>
		<category><![CDATA[上市准备]]></category>
		<category><![CDATA[互联网公司]]></category>
		<category><![CDATA[人才流失]]></category>
		<category><![CDATA[公司治理]]></category>
		<category><![CDATA[内容生态]]></category>
		<category><![CDATA[出海战略]]></category>
		<category><![CDATA[加班文化]]></category>
		<category><![CDATA[劳动法]]></category>
		<category><![CDATA[双休]]></category>
		<category><![CDATA[反强制劳动]]></category>
		<category><![CDATA[取消大小周]]></category>
		<category><![CDATA[变相降薪]]></category>
		<category><![CDATA[合规]]></category>
		<category><![CDATA[员工权益]]></category>
		<category><![CDATA[员工猝死 (猿辅导案例)]]></category>
		<category><![CDATA[员工福利]]></category>
		<category><![CDATA[商业利益]]></category>
		<category><![CDATA[商业逻辑]]></category>
		<category><![CDATA[大小周]]></category>
		<category><![CDATA[字节跳动 (小黄书)]]></category>
		<category><![CDATA[小米]]></category>
		<category><![CDATA[小米加班曝光]]></category>
		<category><![CDATA[小红书]]></category>
		<category><![CDATA[工作制度改革]]></category>
		<category><![CDATA[工作时长]]></category>
		<category><![CDATA[微信]]></category>
		<category><![CDATA[成本削减]]></category>
		<category><![CDATA[抖音]]></category>
		<category><![CDATA[挖人]]></category>
		<category><![CDATA[效率提升]]></category>
		<category><![CDATA[时事评论]]></category>
		<category><![CDATA[期权]]></category>
		<category><![CDATA[期权回购]]></category>
		<category><![CDATA[欧洲市场]]></category>
		<category><![CDATA[流量竞争]]></category>
		<category><![CDATA[滴滴]]></category>
		<category><![CDATA[猿辅导]]></category>
		<category><![CDATA[科技公司]]></category>
		<category><![CDATA[竞业协议]]></category>
		<category><![CDATA[老范讲故事]]></category>
		<category><![CDATA[职场 PUA]]></category>
		<category><![CDATA[腾讯 (小绿书)]]></category>
		<category><![CDATA[薪资调整]]></category>
		<category><![CDATA[财经分析]]></category>
		<category><![CDATA[降本增效]]></category>
		<category><![CDATA[隐性加班]]></category>
		<category><![CDATA[雷军]]></category>
		<category><![CDATA[香港上市]]></category>
		<guid isPermaLink="false">https://lukefan.com/?p=2138</guid>

					<description><![CDATA[🔥家人们破大防了！今天小红书全员信宣布取消大小周！本打工人刚想开香槟庆祝，仔细一看条款直接emo了！！！

💥先说重点：取消大小周=全员变相降薪！！！
原本每月多干4天拿双倍工资，现在直接砍掉！相当于年薪缩水8%！！（打工人钱包在滴血.jpg）

💼3个细思极恐的商业逻辑：
1️⃣ 上市前合规大扫除！劳动法明令禁止大小周，想港股上市必须装乖宝宝
2️⃣ 降本增效新姿势！表面双休实则工作量不变，隐形加班卷死你
3️⃣ 竞业协议大放水！离职就能套现期权，摆明要放生核心员工（跑路预警！）

🌍更刺激的是海外布局！小红薯正在狂招英文运营，但欧洲反血汗工厂法案可不是吃素的！这波取消大小周妥妥的全球化战略～

💣血泪教训预警！看看某教培机构猝死的准新郎，再看看小米被曝的12小时在岗时长...资本家的福报永远玩出新花样！

👀所以家人们清醒点！取消大小周≠告别加班，取消现金加班费才是真相！！（资本の套路.jpg）

👇🏻评论区告诉我：
你是想要双休但降薪？
还是继续大小周拿钱？
（反正本打工人选择带薪拉屎摸鱼！！）

💡关注我！下期揭秘《小红书200亿美金估值背后的流量黑魔法》！！#职场生存指南 #打工人 #职场真相 #内卷 #摸鱼 #打工人精神状态

小红书突然取消大小周，员工未必开心？解析期权回购、放弃竞业、双休新政背后，隐藏的上市计划、成本优化及应对海外市场监管的战略布局。

小红书突然宣布取消大小周工作制，引发行业热议，但这并非简单的“良心发现”，反而因取消加班费导致员工面临变相降薪。此举背后深藏商业逻辑，被广泛解读为小红书为潜在的香港上市计划进行合规准备，以满足劳动法要求，同时也是一次显著的降本增效措施。结合近期解除竞业条款、启动期权回购等动作，小红书正积极调整内部策略，以应对日益激烈的互联网公司人才竞争和挖人压力。此外，考虑到其出海战略及拓展欧洲市场的需求，取消大小周有助于规避“血汗工厂”标签，适应海外市场的劳动法规。这一决策不仅关乎小红书独特的流量定位和市场价值，也折射出当前中国互联网公司在加班文化、合规性与全球化扩张压力下的普遍困境与转型思考。]]></description>
										<content:encoded><![CDATA[
<figure class="wp-block-embed is-type-video is-provider-youtube wp-block-embed-youtube wp-embed-aspect-16-9 wp-has-aspect-ratio"><div class="wp-block-embed__wrapper">
<iframe title="小红书突然取消大小周，员工未必开心？解析期权回购、放弃竞业、双休新政背后，隐藏的上市计划、成本优化及应对海外市场监管的战略布局。" width="900" height="506" src="https://www.youtube.com/embed/ykL_mGgJC5I?feature=oembed" frameborder="0" allow="accelerometer; autoplay; clipboard-write; encrypted-media; gyroscope; picture-in-picture; web-share" referrerpolicy="strict-origin-when-cross-origin" allowfullscreen></iframe>
</div></figure>



<p class="wp-block-paragraph">大家好，欢迎收听老范讲故事的YouTube频道。今天咱们来讲一讲小红书突然官宣取消大小周，是不是良心发现了？</p>



<p class="wp-block-paragraph">小红书呢，突然发了一个全员信。首先说目的是什么？是员工信任文化，我们要相互信任。第一条讲的还不是取消大小周，第一条是不再增设现金或期权竞业条款，原有的现金和期权竞业全部释放。离职员工可以申请以离职回购价，由公司回购已归属的期权，提供了更多的变现灵活性。2024年5月启动大规模的期权回购，涵盖在职员工和离职员工，回购价格是11.5美金每股，从5月1号起结束。</p>



<p class="wp-block-paragraph">大小周这个呢，是一石激起千层浪。所以大家都在谈这个大小周的事情。原来呢是单周双周吧，有时候是上5天休两天，有的时候上6天休一天，叫大小周。现在呢，就统一双休，周末尽量不开会。就很多这种公司呢，喜欢在周末开会。我原来在一个公司上班的时候，每个礼拜六是中层开会，普通员工是休假的，所有中层必须是周六开会。现在的他说，尽量不周末开会了。如果需要加班，必须提前三天去申请。</p>



<p class="wp-block-paragraph">现在依然有非常多的互联网公司是大小周，特别是一些比较新的公司或者小一点的公司，喜欢搞这个大小周。大公司坚持玩大小周的呢，小红书应该是最后一个，其他的在去年、前年基本上都已经取消了。</p>



<span id="more-2138"></span>



<p class="wp-block-paragraph">正式解除大小周这件事呢，员工其实并不开心。为什么呢？多一天休息本来应该是个好事，但是呢，他这个收入会下降。小红书呢还算是个有良心的，虽然是大小周，但是呢，小周里头多出这一天来是给发双倍薪水的。原来每个月是多出两天的工作日，等于多4天薪水，这4天薪水没了。相当于是所有小红书的员工呢，变相的降薪了，很多人并不是很开心。</p>



<p class="wp-block-paragraph">多一天休息呢，本来应该是好事。像我现在基本上是全年无休，周末其实是我一周里头最忙的时候。为什么？因为虽然周六我一般是不更新的，但是呢要录制周日的节目和会员节目。周日呢，还要录制周一的节目，所以呢周末两天我需要录制三期节目，会比平时更忙。我太太在周末的时候，需要剪辑周五直播的两个故事，周日周一和会员节目。他周末两天需要剪5个视频，所以我们家一般周末是从来不休息的。</p>



<p class="wp-block-paragraph">我现在也在开始考虑，是不是周末也给我跟我太太放个假，稍微的休息一下，或者玩个大小周什么的。我呢算是被YouTube的数据给PUA了，这个跟他们还不太一样。</p>



<p class="wp-block-paragraph">那么为什么在这个时候解除大小周？这个我们一定要讲清楚。就是每一件事情发生在这个时间点，那么在这个时间点上，通常是要有一些事情的。</p>



<p class="wp-block-paragraph">是不是小红书大方是大发善心了呢？这不是我们这个频道的风格。这个频道永远考量的是商业逻辑跟商业利益，我们不去考量善恶的事情。就像今天早晨我去讲“仅退款”这个事情，我不去讨论仅退款这个事的善与恶，而是会去讨论说什么样的情况下，在发生什么样的历史的事件的时候，会有人去解题，然后以仅退款作为答案，把这个题解出来。然后呢，再去跟大家讨论，说这样的一个答案被做出来以后，与各种的条件混合在一起，会对未来产生什么样的影响。这个是咱们这个频道的一个风格。所以呢，这个里头跟大发善心没有什么关系。</p>



<p class="wp-block-paragraph">作为最后的一个大小周的大公司，压力肯定是很大的。首先要讲说小红书是不是个大公司？小红书是没有上市的，它呢有200亿美金的估值，肯定算是大公司。你看10亿美金就独角兽了吧，它是20个独角兽，所以算是个大公司。它有非常独特的流量定位，就是小红书的流量跟抖音的流量、跟微信的流量跟他们都是不一样的。所以它这个流量定位很特殊，别人都想抢，但是抢不到。</p>



<p class="wp-block-paragraph">近期呢，在海外又意外的获得了增长。出海呢是小红书未来一段时间里头必须要去做的事情。在TikTok封禁期间呢，大量的TikTok难民涌入了小红书。当时呢，没有做好国内外用户的隔离。在TikTok跟抖音上呢，这一块做的是比较有经验的。小红书呢虽然原来也有海外用户，但是主要是海外的华人用户，所以并没有特别注意隔离的事情。当时一帮老外涌进来的时候，发现哎，这里还有很多人，大家都是用中文跟他做回复。现在的话应该已经看不到海外内容了，回归常态了，就是国外的用户跟国内的用户各玩各的了。但是他这一次意外的获得流量导致了什么中美大对账，什么海外流量的这些破天的富贵，总还是会留下一些。虽然后来TikTok恢复了，TikTok难民返回了，但是总还是留下了一点点。</p>



<p class="wp-block-paragraph">现在小红书呢，也在很努力的招聘海外的英文运营。在这一块呢才是加班的重灾区，因为原来抖音TikTok在这块也是加班重灾区。他们需要适应全世界的时差去工作。小红书后续呢想在海外变现，就不能成为血汗工厂，这个是一定要注意的。欧洲现在在反强制劳动，所以现在推出这种取消大小周是合适的。而且小红书呢，在这一段时间其实一直在被挖人。其实他很多年一直在被挖人，为什么？因为小红书刚才我们讲有非常独特的站位。流量市场里头，真正可贵的不是你流量有多大，而是你的流量的特征与区隔与其他人不一样，这个是真正……</p>



<p class="wp-block-paragraph">流量市场的一个价值衡量方式，作为热点话题的发源地，总是要有一些自己的特点的。很多的话题都是从这开始。很多做MCN运营的人，每天会去刷小红书，在里头发现有一些热点的时候，你可以早先一步，把它搬运到抖音里头去，运到这个微信公众号里去。</p>



<p class="wp-block-paragraph">最早的发源地一般是在小红书。因为小红书上的人呢，会稍微的——不能叫等级高一点吧——就是要稍微的文雅一点点吧。这些人呢会去做一些小众一些的话题出来。这些话题在小红书里孕育一段时间，就有可能突然爆火。</p>



<p class="wp-block-paragraph">这次小红书放弃大小周，突然被广泛传播，也跟小红书的流量位置是有关的。别的公司如果干这个事，可能不会有这样的传播。但是小红书干这个事了，就被所有的平台都抄了一遍。“小红书放弃大小周了”，大家都去挖他的人，就是想要抢占这一个独特的流量池。</p>



<p class="wp-block-paragraph">有小绿书，有小黄书。小绿书是谁家做的？小绿书是微信家——腾讯他们家做的，因为微信自己是绿的嘛。小黄书呢是字节做的，就是柠檬吧，美国版的小红书。现在在美国也是花了很多的钱去投放。流量巨头呢都盯着他。将故事源头放在别人手里呢，总是不那么放心。</p>



<p class="wp-block-paragraph">流量永远没有够的时候，所以大家就赶快挖他的人，想要复刻小红书。最简单的方式，就是挖小红书的人回来再做一次。人总是有逆反心理的，你越是管他说“我不许你去”，这些人就越想跑。所以小红书今天说：“算了，咱们别费这劲了。原来的现金和期权竞业，我们都解除了。你愿意走你就走你的，没关系了。”</p>



<p class="wp-block-paragraph">本身呢，现金与期权竞业这个事，应该是一个灰色地带。他也不是完全合法。理论上呢，竞业应该是在离职的时候签署，要继续发钱才有效。你如果离职了，以后不再发钱了，这个事是无效的。用已经分配的现金和期权捆绑竞业的话，这件事情可能还需要律师们去动用他们的聪明才智。一般我们讲灰色的部分，就是需要律师们动用聪明才智的地方。</p>



<p class="wp-block-paragraph">那么还有一个问题是什么？就是小红书为什么在现在这个时间点上来去取消大小周？有可能要上市。上市就面临着一个问题叫合规。你必须要合规。你大小周呢本身是违法的，违反劳动法。你这种情况下是没有办法上市的，所以一定要去合规。</p>



<p class="wp-block-paragraph">小红书呢曾经想去美国上市，但是折戟而归了。2021年的4月份，小红书正式向美国SEC递交了上市表格。但是非常不幸，2021年的6月30号，有一个叫滴滴的公司跑到美股去上市了，直接被打回来了，直接就进驻调查组去调查去了。所以小红书就只能灰溜溜的撤销了他的上市申请。后来呢，不断传出来要到香港去上市的消息。</p>



<p class="wp-block-paragraph">小红书前一段时间一直在否认这件事情。现在最新的消息是，2025年下半年或者2026年，小红书准备到香港去上市。上市公司呢，在上市之后，股民是没有办法像原来投资人那样，去对很多细节去进行监管，让公司去做出调整的。所以上市公司通常会设定一套大家共同遵守的规则，保证股民的利益。</p>



<p class="wp-block-paragraph">上市公司呢，其实也加班。因为我原来也是在上市公司上班，照样加班。只是呢，上市公司加班是从来不落在纸面上的，不能作为公司制度大范围执行。在这里看的就是，小红书应该是快要上市了。前面也讲了，说你们已经做好的期权是可以去直接回购的。一般是在上市之前会去做这种操作。</p>



<p class="wp-block-paragraph">还有一点是什么呢？就是小红书的业务呢，最近还是相对比较稳定了，没有那么多事情，就可以换一个方式继续降本增效了。降本增效呢，其实一般是分为三个阶段。第一个阶段叫做裁员，我原来干的事情并没有变化，只是人少了，薪资的支出就会变少，那我降本增效了。第二个呢就是改外包，这个也是国内互联网公司的比较习惯用的一个方法，就是把原来公司的员工裁掉，变成外包团队。你继续给我干活，但是呢我跟你之间就没有劳动协议了，我随时想用就用，不想用就可以不用。你不会再去面临裁员相关的这种赔偿了，这个是改外包。现在很多国内互联网公司在走这条路。</p>



<p class="wp-block-paragraph">第三个阶段就是减少加班。事情呢并没有减少，但是要求更高的执行效率，发出的薪资一直都在减少。小红书节省了加班费，把显性要求的大小周改为了隐性的加班。你可能没干完怎么办？回家接着干，或者你可以自愿加班，每天多工作一段时间，这个是允许的。在这种情况下，加班的工资就不用付了。事情没有减少，也算是一种变相的降本增效吧。</p>



<p class="wp-block-paragraph">互联网公司的加班文化呢，最近遇到了很多新的挑战。2025年4月23号，一个小伙子在猿辅导武汉加班猝死。他们猿辅导的工作时间比较奇葩，他是13点-22点上班。为什么是这样呢？是所有的教培机构，他们都是在这个时间上班的。因为白天或者上午的时候，你的顾客在上别的课，一般你都要到下午或者晚上的时间，才可以给学生去上课。所以教培机构的工作时间通常是下午1点到晚上10点，这已经是11个小时了。这在人家的办公室里边去上班的话，物业是要求锁门的。一般物业晚上不会陪你熬夜的，所以后半夜都会锁门。</p>



<p class="wp-block-paragraph">猿辅导的武汉办公区呢，加班是异常的严重。这个猝死的小伙子呢，是一个优秀员工，华中农业大学化学系毕业，以管培生身份加入猿辅导。</p>



<p class="wp-block-paragraph">一般以管培生身份加入的，都是非常好的员工。就是他希望以后去做管理岗位的这些人。入职了5年，晋升为课程研发骨干，连续三年绩效考核为优秀，曾经主导多个核心课程项目的开发。</p>



<p class="wp-block-paragraph">这是个苦孩子，10岁丧父，随母改嫁后由继父抚养长大，家庭经济条件比较差。未婚妻为大学同学，两人在2025年4月领证，原计划5月2号在老家举办婚礼。他呢，周二跑去加班去了，中午11点就前往公司加班，计划提前完成工作以休婚假。就是后边他要休婚假，他想单独把这个事情做完。</p>



<p class="wp-block-paragraph">当晚23时后，其未婚妻发现他未回复消息，通过手机定位跟踪到公司，但是因为门禁无法进入办公区。凌晨2点到5点，家属与警方多方尝试，想要进入25楼的办公区未果。到早上8点，物业开门以后，保洁发现这位小伙子蜷缩在工位，已无呼吸心跳。9:03送医院，心电监护仪显示直线，宣告临床死亡。今天25号了，两天前的事情。</p>



<p class="wp-block-paragraph">另外一个小米被曝光，在岗员工要求他每天的在岗时长要超过12个小时。其实雷系公司呢，通常都加班。是因为我原来在雷系公司里头，也加班加的。可能我们没有这种要求，就是你没事你就走，有事呢你就在那待着，把事做完了再回家。因为像我们一般都会避免早高峰晚高峰，所以呢，我们也不打卡。</p>



<p class="wp-block-paragraph">我那个时候上班的时候，一般早晨大概是10点半去，到晚上呢一般是到11点或者是12点回家。周末呢就是只要是有事，就一律去上班，如果没事呢就在家待着。就是我们从来不明确要求你必须要去加班，当然也没有加班费。这个就是更惨一点。你像小红书，人家大小周还有加班费呢，我们是没有的。</p>



<p class="wp-block-paragraph">雷系公司一直是这样的。但是你说如果整个部门一直都不加班，大家都是这个上班时间把事干完了，那就该裁员了。所以一般会保持这个强度，到每天工作11-12个小时。降本增效这么久了以后，现在呢我估计雷系公司的加班，应该是比我们那个时候更严重一些。</p>



<p class="wp-block-paragraph">特别是一些管理水平不是那么高的人，会强制员工留下来磨洋工。这个为什么？因为呢有一些人管理水平不高，他也没那么多事干。但是如果让他的再上级的老板发现他的团队没有那么忙的话，就会给他裁员，或者就我们管他叫削减head count。这个是大家不能忍受的，所以装你也得给我装出忙来。</p>



<p class="wp-block-paragraph">作为上市公司呢，加班通常都是口头通知的，不会留下任何书面证据，也不会有加班费。小米为什么会在这个时候被曝光呢？肯定不是头一天加班了吗？我刚才也讲了，雷系公司都加班。雷军自己就是劳模，他经常是凌晨三四点钟给大……</p>



<p class="wp-block-paragraph">家回邮件的一个人。所以你跟他去上班的时候，你说你不加班，他给你回邮件的时候你没看见。当然，雷军给我们回邮件的时候，我们一般不会马上回复，我一般还是会早上起来再看的。这个还是有一些差异的，没有雷军那么勤奋。</p>



<p class="wp-block-paragraph">为什么在这个时候突然被曝光呢？第一个是雷军已经在社交媒体上消失了20多天了。他可能在重大事项，比如说像小米的15周年庆、小米的车展，他会发一条微博，但是他的抖音已经停止更新20多天了。在这个时候呢，大家就要去惦记一下说小米是不是我们可以去折腾他一下了，是不是可以去点他一下了。时间也差不多了，估计雷军后边也该开始发声了。</p>



<p class="wp-block-paragraph">小米在国内一季度的手机销量登顶了。这个肯定还有一些友商看着它不是那么顺眼。按照出货量计算的，小米一季度在国内的出货量应该排第三，应该是vivo、华为、小米。但是如果按激活数算的话，小米是第一。那意思是什么？就是vivo跟华为都是靠压库存得到的第一嘛，小米是真真正正把机器卖掉了，卖到用户手里才有激活数嘛。</p>



<p class="wp-block-paragraph">在车的方面呢，虽然因为车祸的事情最近声量少了很多，但是呢带给竞争对手的压力依然是巨大的。现在每天在上海车展上发5,000顶帽子，发矿泉水，站台被围的水泄不通，肯定是给其他车厂带来很大压力了。小米预期也号称不会延期。在小米的新闻发布会上，小米那一个副总裁嘛也去讲，说小米YU7不会延期的，还是会在6月份、7月份正式跟大家见面。</p>



<p class="wp-block-paragraph">小米呢，新兴市场特别是欧洲市场现在在快速上升。现在小米应该是全球排第三吧，三星是第一，全球手机销量19.9%，苹果是19.0，小米是13.7，是这个第三名。而欧洲呢是有反强迫劳动法案的，小米想在欧洲特别是德国、法国这些发达国家去卖机器的话，就需要告诉大家，我不是血汗工厂。而小米在欧洲的主要销量就来自于德法这些发达国家，东欧那些稍微穷一点的国家，国内那些更便宜的品牌占比会高一些。小米在欧洲占比最高的是德法，占20%，所以增长很迅猛。</p>



<p class="wp-block-paragraph">目前的小米还没有出来回应，估计呢会进行整改。因为这种事情只要被曝光了，你没什么好说，一定要去整改。但是所有的整改都是说你是不是靠招人，还是靠什么样的方式来去整改这个事情，还是说，我们隐藏一下，我们不允许再去对外说加班的事情了，这个可能性也是存在的。</p>



<p class="wp-block-paragraph">总结一下，小红书突然取消大小周制度，引起广泛关注。现在呢看来并不是什么善心大发了，也不是什么良心发作了，而是呢，小红书大概率是快要上市了。在上市之前呢。</p>



<p class="wp-block-paragraph">要把一些明显违法的行为改掉，而且呢，这依然是一次标准的降本增效。只要不伴随着大规模的招聘，就都是降本增效，特别是小红书。这还是伴随着薪资支出下降而取消的大小周政策。</p>



<p class="wp-block-paragraph">但是另外一方面呢，有人愿意向更遵守劳动法的方向去转变，愿意向好的方向去转变，总是有好的一面吧。这个可能未来一段时间，更多的中国人也可以去享受休假，也还算是我们看到了正向的一面。这就是我们今天讲的第一个故事。</p>
]]></content:encoded>
					
		
		
			</item>
		<item>
		<title>从557万美金训练成本到545%利润，DeepSeek如何用惊悚的数字，震撼AI行业的？这些数字，靠谱吗？</title>
		<link>https://lukefan.com/2025/03/04/%e4%bb%8e557%e4%b8%87%e7%be%8e%e9%87%91%e8%ae%ad%e7%bb%83%e6%88%90%e6%9c%ac%e5%88%b0545%e5%88%a9%e6%b6%a6%ef%bc%8cdeepseek%e5%a6%82%e4%bd%95%e7%94%a8%e6%83%8a%e6%82%9a%e7%9a%84%e6%95%b0%e5%ad%97/</link>
		
		<dc:creator><![CDATA[Luke Fan]]></dc:creator>
		<pubDate>Tue, 04 Mar 2025 00:40:05 +0000</pubDate>
				<category><![CDATA[AIGC]]></category>
		<category><![CDATA[DeepSeek大模型]]></category>
		<category><![CDATA[545%利润]]></category>
		<category><![CDATA[557.6万美金]]></category>
		<category><![CDATA[AI优化]]></category>
		<category><![CDATA[AI优化技术]]></category>
		<category><![CDATA[AI公关策略]]></category>
		<category><![CDATA[AI公司争斗]]></category>
		<category><![CDATA[AI利润计算]]></category>
		<category><![CDATA[AI商业模式]]></category>
		<category><![CDATA[AI商战]]></category>
		<category><![CDATA[AI基准价格]]></category>
		<category><![CDATA[AI市场格局]]></category>
		<category><![CDATA[AI开源项目]]></category>
		<category><![CDATA[AI成本分析]]></category>
		<category><![CDATA[AI投资策略]]></category>
		<category><![CDATA[AI推理市场]]></category>
		<category><![CDATA[AI推理未来]]></category>
		<category><![CDATA[AI数据中心]]></category>
		<category><![CDATA[AI服务器管理]]></category>
		<category><![CDATA[AI生态小厂]]></category>
		<category><![CDATA[AI硬件]]></category>
		<category><![CDATA[AI自由市场]]></category>
		<category><![CDATA[AI行业内幕]]></category>
		<category><![CDATA[AI行业梗]]></category>
		<category><![CDATA[AI行业盈利]]></category>
		<category><![CDATA[AI话题营销]]></category>
		<category><![CDATA[AI资源分配]]></category>
		<category><![CDATA[AI量化交易]]></category>
		<category><![CDATA[AI量化模型]]></category>
		<category><![CDATA[AI高峰时段]]></category>
		<category><![CDATA[API定价]]></category>
		<category><![CDATA[CUDA]]></category>
		<category><![CDATA[DeepSeek]]></category>
		<category><![CDATA[Deepseek V3]]></category>
		<category><![CDATA[DeepSeek开源库]]></category>
		<category><![CDATA[DeepSeek计算精度]]></category>
		<category><![CDATA[GPU全天运营]]></category>
		<category><![CDATA[GPU租赁成本]]></category>
		<category><![CDATA[GPU负载均衡]]></category>
		<category><![CDATA[H100芯片]]></category>
		<category><![CDATA[H800]]></category>
		<category><![CDATA[MAAS厂商]]></category>
		<category><![CDATA[MAAS盈利模式]]></category>
		<category><![CDATA[MAAS竞争]]></category>
		<category><![CDATA[R1价格]]></category>
		<category><![CDATA[中国AI企业]]></category>
		<category><![CDATA[中美AI价格差]]></category>
		<category><![CDATA[中美AI市场对比]]></category>
		<category><![CDATA[云服务厂商]]></category>
		<category><![CDATA[云计算]]></category>
		<category><![CDATA[华为云]]></category>
		<category><![CDATA[商业逻辑]]></category>
		<category><![CDATA[大模型服务]]></category>
		<category><![CDATA[大模型训练]]></category>
		<category><![CDATA[字节跳动DeepSeek]]></category>
		<category><![CDATA[并行计算]]></category>
		<category><![CDATA[开源协议]]></category>
		<category><![CDATA[推理利润]]></category>
		<category><![CDATA[推理效率]]></category>
		<category><![CDATA[推理系统]]></category>
		<category><![CDATA[数据参考价值]]></category>
		<category><![CDATA[数据水分]]></category>
		<category><![CDATA[数据逻辑]]></category>
		<category><![CDATA[模型优化策略]]></category>
		<category><![CDATA[模型即服务]]></category>
		<category><![CDATA[深度学习]]></category>
		<category><![CDATA[硅基流动]]></category>
		<category><![CDATA[腾讯DeepSeek]]></category>
		<category><![CDATA[腾讯IMA]]></category>
		<category><![CDATA[芯片性能]]></category>
		<category><![CDATA[训练成本]]></category>
		<category><![CDATA[路深科技]]></category>
		<category><![CDATA[达芬奇架构]]></category>
		<category><![CDATA[阿里云投资]]></category>
		<guid isPermaLink="false">https://lukefan.com/?p=1960</guid>

					<description><![CDATA[啊啊啊啊啊啊啊！！！DeepSeek推理利润545%，行业炸裂！🏆

家人们，谁懂啊！DeepSeek这次真的玩大了，推理利润直接干到545%！！！行业彻底炸裂了💥！你们还记得当年那个557.6万美金的训练成本吗？这次又来了个更狠的！🔥

**为什么这么炸？**
DeepSeek这次公布的数据，直接让所有人傻眼！别人都说亏钱，DeepSeek直接赚到飞起！背后的秘密就是——负载均衡和并行计算！🍃

**负载均衡？**
把每一层的模型专家分配到不同的设备上，让所有芯片都动起来，一点都不浪费！效率直接拉满！🚀

**并行计算？**
所有芯片一起干活，速度飞快！一边干活，一边读写数据，完全不耽误！这操作，简直绝了！🎯

**还有更绝的！**
DeepSeek还用了“驴粪蛋表面光”的策略，表面光滑，细节忽略，效率直接飞升！这操作，真的太秀了！🤯

**545%的利润怎么算的？**
GPU满负荷工作，优化手段全用上，按最贵的价格算，直接算出545%的利润！虽然有点水分，但这数据还是有参考价值的！📊

**DeepSeek的目的？**
证明自己用H800就能搞定一切，顺便让大家都卷起来！这波操作，真的太顶了！🎉

家人们，这波真的不冲不行了！DeepSeek的操作，直接改变了行业规则！赶紧收藏，随时学习！📚

#DeepSeek #推理系统 #行业革命 #负载均衡 #并行计算

从557万美金训练成本到545%利润，DeepSeek如何用惊悚的数字，震撼AI行业的？这些数字，靠谱吗？

DeepSeek以一场让人措手不及的“one more thing”，震撼性地展示其推理系统的超高利润率达545%。从557.6万美金的训练成本到惊为天人的运营优化，DeepSeek凭借负载均衡、并行计算等技术手段实现了“极致节约”。然而，其计算逻辑背后隐藏的水分也备受行业诟病。与此同时，硅基流动与路深科技就DeepSeek的利益布局展开激烈争斗，MAAS厂商格局愈加扑朔迷离。在全球AI推理市场中，DeepSeek如何借助中国价格锁死策略与开源项目继续站稳脚跟？本期深度解读，带你全面认知AI时代下数据逻辑的权衡与商战背后的复杂博弈，探索AI推理的未来发展方向。]]></description>
										<content:encoded><![CDATA[
<figure class="wp-block-embed is-type-video is-provider-youtube wp-block-embed-youtube wp-embed-aspect-16-9 wp-has-aspect-ratio"><div class="wp-block-embed__wrapper">
<iframe title="从557万美金训练成本到545%利润，DeepSeek如何用惊悚的数字，震撼AI行业的？这些数字，靠谱吗？" width="900" height="506" src="https://www.youtube.com/embed/4xBnIP0EtYw?feature=oembed" frameborder="0" allow="accelerometer; autoplay; clipboard-write; encrypted-media; gyroscope; picture-in-picture; web-share" referrerpolicy="strict-origin-when-cross-origin" allowfullscreen></iframe>
</div></figure>



<p class="wp-block-paragraph">DeepSeek也玩“one more thing”，突然公布了它的推理利润达到545%，就像当初557.6万美金的训练成本那样，再次震惊了行业。大家好，欢迎收听老范讲故事的YouTube频道。今天咱们来讲一讲，DeepSeek结束了连续5天的开园周之后，到礼拜六玩了一次“one more thing”。这个“one more thing”呢，应该是当年乔布斯的梗。他每一次开发布会到最后的时候呢，都要说“还有一件事，等一等”，而且这一件事呢，往往是特别重要、特别颠覆性的事情。那么这一次又来了，DeepSeek公布了它的V1和R3推理系统相关内容，及大规模部署的成本和收益数据。就是说我部署了这东西以后，到底是挣了多少钱？非常非常让人震惊，因为所有人做这个东西都说我不挣钱，我亏钱，结果等到他这好，545%的利润，所有人都傻了，说你到底咋干的？</p>



<p class="wp-block-paragraph">具体的实现方法呢，就不再跟大家详细分析了。简单来说，第一个负载均衡，你想他有这么多的GPU，这么多的核心，在他这种MOE的架构下，他把每一层的模型里边每一个专家，分配到不同的设备上面去进行运算。这个呢，就是一个负载均衡，尽量让所有的芯片都动起来，不要说有的芯片闲着呢，有的芯片在那排队。第二个，并行计算。并行处理是什么呢？所有的芯片一起来干活，这个速度肯定会变快。另外呢，一边干活的时候，另外一边呢，再同时进行数据的读写。你不能说我这需要数据了，你给我读，然后处理完了以后你再去写，这样就变慢了嘛。所以基本上在做这样的事情，负载均衡和并行处理。</p>



<p class="wp-block-paragraph">另外还有一个什么样的事情在做呢？就是有一点点叫“驴粪蛋表面光”。这个也算是老北京的一个俏皮话，什么意思呢？就是这个驴粪球外边是很光滑的，但是里边呢，就是一堆的没有消化好的碎草。DeepSeek也是如此，他把很多的计算精度呢进行了调整，他尽可能的能够达到大家的要求，但是很多细节上的这些你看不到的环节呢，就给你忽略掉了。</p>



<span id="more-1960"></span>



<p class="wp-block-paragraph">所以，这个也可以极大地提高效率。他说：“我通过了这样的方式，达到了545%的利润。”当年给出的DeepSeek V3 557.6万美金的训练成本，已经成为了一个业内的计量标准，或者计量单位了。就跟你说这个东西是一牛顿，那个东西叫一瓦特，他这个557万的训练成本，也成了一个计量单位。OpenAI用了1,400万美金投超级碗广告的时候，很多人就说：“你这玩意够训练几次DeepSeek了？”这个已经成为一个业内梗了。</p>



<p class="wp-block-paragraph">在制造话题这块，DeepSeek作为AI时代的顶级企业是合格的。大家注意，AI时代跟以前不一样。原来呢是酒香不怕巷子深，但是现在你从OpenAI、Anthropic，再到国内的DeepSeek，每一个都是制造话题的好手。必须要会讲故事，才可以在这个时代好好地玩下去。</p>



<p class="wp-block-paragraph">那么，545%的利润和557.6万美金的训练成本，到底是一个什么样的概念呢？是真的还是假的？是不是吹牛？很多人一上来就会问这样的问题。事情呢，没这么简单。数据肯定有一定水分，咱们一定要承认这件事。但是呢，这个数据也是有参考价值的，不是说你这个东西是真是假，一刀切完事了。这个还是要具体来去分析一下。</p>



<p class="wp-block-paragraph">咱们呢来看一看，545%的利润到底是怎么算出来的。说这个GPU都是7*24小时满负荷工作，然后呢把所有的优化手段都用到极致，就是他这5天发布的这些优化手段，我都给用上了。然后计算输出TOKEN的总量，就是我这么长时间，一共可以输出多少TOKEN出来。按照最贵的DeepSeek R1的价格来去收钱，这个是100万TOKEN 16块钱，这个是DeepSeek自己给的价格。国内的这些云服务厂商，基本上都是按这价格做的。等于就是说我一天24小时，满负荷输出这么多的TOKEN，能够说到多少钱。再以GPU租赁的价格，两美金一小时作为成本，把这俩数一除，就算出了一个545%的一个利润率来。他是这么算出来的。那这个水分在什么地方呢？</p>



<p class="wp-block-paragraph">第一个GPU是不可能7*24小时满负荷工作的。就跟送外卖一样，赶上午餐时间大家都得去送外卖，午餐吃完了以后所有人都在那闲着，这个才是正常的状态。GPU也是如此的，你不可能说大家都商量好了，这个7*24小时达到均匀的来，我们让所有的GPU跑满，谁都别闲着。这个事是绝不可能的，而且距离现实情况相距甚远。</p>



<p class="wp-block-paragraph">正常应该是什么呢？为了保障高峰时期的服务不崩，必须要容忍非高峰时期，可能有70%到80%的服务器是冗余的，或者在那闲置的。那你说到底有多少这个时间算高峰时间，有多少时间是非高峰时间呢？这个一天里头的高峰时间，可能能够有这么三五个小时也就到头了，不会到8个小时的。</p>



<p class="wp-block-paragraph">像我们以前做游戏的时候，是什么时候高峰时间呢？中午吃饭的时候，还有吃完晚饭9点以后算是高峰时间。那你说我这是工作上班的事情，那他应该是在早晨10点、11点，你没准是个高峰，然后下午2点多到四五点钟，是有一个高峰。其他的时候这个服务器都是闲着的。所以千万不要觉得说，能够跑20个小时的高峰，想都不想，你能跑4个已经算很好很好了。</p>



<p class="wp-block-paragraph">那么DeepSeek也不是所有服务都收费的，它是按最贵的那个算，按DeepSeek R1每100万TOKEN 16块来算的。你如果按照DeepSeek V3，每100万TOKEN也才8块钱，就肯定没有500%多的利润。而且DeepSeek上呢，比如说他的网页还有他的APP，这些都是不要钱的，你也得为人服务。那这一块他就没算在里头，都按这个R1去收费了，所以这个肯定是不对的。</p>



<p class="wp-block-paragraph">而且现在DeepSeek呢，在晚上的非高峰时期，也就是凌晨3点到第二天8点这段时间，他还对这个API的价格打折。这块他也没算在里头。其实我觉得他真没必要打折，因为我在这个时间段试过，依然很慢，他的服务器依然是不反应的。所以呢，他做这样的事情，应该还是有一些奇怪目的的吧。他现在的这个成本呢，只计算了GPU的租赁成本。</p>



<p class="wp-block-paragraph">这个肯定也是有水分的。当然了，GPU租赁呢，是包含服务器、水电、制冷、相关人员成本的，甚至还包括资金占压成本和一些利润。因为你找别人去租GPU来，人家还挣钱呢。所以这块呢，一个小时两美金这个事还是比较宽裕的。而且DeepSeek自己部署机房的话，可能它的成本还要比一个小时两美金要稍微低一点点。但是呢，他的研发、训练、数据准备等等这些成本都没算在里头去。所以呢，他在整个计算成本的时候呢，肯定是极大的降低了成本的总量。</p>



<p class="wp-block-paragraph">这个呢，就跟前面咱们讲557.6万美金的DeepSeek V3训练成本其实是一样的，也是这么算出来的。它只计算了2,048块GPU运算了多长时间，其他的什么人员工资、数据准备这些全都没算进去。咱们这里的人员工资就是分两块，一块是机房维护的人员工资，这块呢，应该已经算到了GPU租赁的价格里边去；另外一块是他自己那帮科学家的人员工资，这部分那是没算的。</p>



<p class="wp-block-paragraph">那么实际利润应该有多少呢？你说没有545%，那到底应该有多少？可以跟大家负责任的说，实际利润一定是亏损的，谁也不可能靠这玩意挣钱，按这价格都挣不回来。那么为什么还说这个数据是有参考价值的呢？大家注意在投融资的时候，或者是在做量化交易的时候，你需要一些简单快捷的方式去计算出某一个数值的极限范围。这个东西最多能挣多少钱，最多能亏多少钱，是要快速的算一下的。只有算完了这个以后，才可以去做一些决策。完全准确的数据说，我这东西算完了以后特别精确，就是挣这么多钱，就是亏这么多钱，这个数呢有时候没有什么意义，时间更重要。</p>



<p class="wp-block-paragraph">DeepSeek呢就是做量化出身的，所以呢，他们很习惯这样去计算数据。你也不能说人家故意坑你。所以先计算极限，然后再向极限前进。如果发现没法到达，咱们再去分析原因调整数据。这个是甭管做投融资还是做量化，必须要干的事情。那么我们应该如何看待这样的数据呢？无脑吹，无脑喷。</p>



<p class="wp-block-paragraph">一上来说看DeepSeek好厉害，中华之光。另外一帮人说你看这就是骗人的，这个不可能的。这个呢，您开心就好，您走错频道了，不应该来看老范讲故事。您去找一些更二极管一点的频道去看，会更加开心一点点。还有一些人呢，找出证据来论证他不靠谱，或者是让别人自证清白。你找出证据来呀，你自己列出这个数据来呀，你看你不靠谱吧。这些人呢其实也是一种无脑的表现，就是你要知道这个东西背后的逻辑是什么，以及它的价值在哪个范围内是有效的，而不是说上来体现一下自己的优越感。这种人也没什么意思。还有些人呢上来就说，哎呀，这个事情很复杂，一句两句解释不清楚，然后呢给你说一大堆的专有名词出来。这种人可能是骗子，他总是惦记从你身上得到一些什么的。</p>



<p class="wp-block-paragraph">所以我们真正要做的是什么呢？就是理解这种数据产生的逻辑意义，以及呢价值，在其合理的范围内使用这些数据作为参考，但是不能迷信。为什么要有合理的范围内使用呢？真理还有适用的范围呢，没有哪项真理是放之四海皆准的。真理离开了他的适用范围就是谬误。同时呢我们要训练自己快速得出类似的这种数据的能力，或者呢，是加强我们对此类数据进行判断的这种能力。</p>



<p class="wp-block-paragraph">那么DeepSeek为什么要公布这样的一个数据呢？这个目的和险恶用心何在呢？这个才是我们吃瓜的乐趣所在。第一个他要证明自己在H800下完全能够搞定所有的事情，还能挣钱。因为一直有人在质疑DeepSeek走私了H100，手里边有5万块H100，大家都在讲这个事。但是呢，DeepSeek自己不会去证明说我手里有还是没有，这个都没有任何意义。有呢，肯定有问题，可能会造成你这种技术在海外被彻底封禁。你就算是开源说，你这个技术因为是违法获得的，所以谁都不许用，他有可能会得到这样的一个结果。那你说我没有呢，你又很难证明这个事情，说我没有，自证清白这个事是挺难的。那么干脆我们就不证明了，我既不说我干了，我也不说我不干了。他干嘛呢？</p>



<p class="wp-block-paragraph">他说：“我证明一下，我不需要H100，我用H800完全可以搞定。我把这个事儿证明一次就完事了。DeepSeek现在也没办法把这些H100拿出来，开足马力来为大家服务。现在突然服务的很顺畅了，说你是不是把H100拿出来偷偷用了？没有，你看我说都算好了。这个我是挣钱的，我不需要把他们拿出来。他现在需要给自己做这样的一个辩白，这是第一点。”</p>



<p class="wp-block-paragraph">“第二点是什么呢？就是我没赚着钱，你们也别想赚钱，大家一起来卷。什么意思？这个学霸经常出来说：‘你看我没有复习功课哦，我就是天天玩，但是我考得很好。’他们是很气人的。可能这跟你说完了不复习功课，炫耀了一下我怎么去玩耍了，回家就苦读到半夜。这个是很多学霸的一种套路。DeepSeek可能也是这么搞的。他自己的网页、APP和API现在基本无法使用的一个情况下，国内的各大厂呢，都在拼命地接DeepSeek。但是呢，又没有给DeepSeek付钱。那DeepSeek只能出来阴阳一下说：‘看我还是挣545%呢，你们挣老鼻子钱了，是不是得意思一下？’那干脆大家一起卷就完了。然后在这个过程中，把这些不挣钱的小的卷死。大的也不是说就挣钱了，大的是有其他业务可以补贴，他赔得起。等到最后剩这帮大的的时候，咱们再来谈这个事情。咱先把这帮小的都卷死。他在干这样的一个事情。你想学霸上来说：‘我从来不复习功课，我上来就考第一。’他干嘛呀？第一个，心里要开心一下，要稍微秀一下优越。另外一个呢，就还是说，咱们这个各层次咱们分别卷起来，要干这个事情。”</p>



<p class="wp-block-paragraph">“那么这个事情发布了以后呢，周末还炸出一个小瓜来。这只能算小瓜了，就是硅积流动跟路深科技两边掐起来了。这两家呢，都是做MAAS的，就是大模型作为服务。咱们做云计算，有IAS，就是基础架构作为服务；SAS是软件即为服务；PAAS是平台即为服务；MAAS呢，叫model as service，就是大模型就是服务。是这样的两个厂商自己就掐起来了，为什么呢？”</p>



<p class="wp-block-paragraph">现在，他们都接了DeepSeek，但是肯定都不挣钱，而且亏得很厉害。路深科技呢，就卷不动了。这位CEO是UC Berkeley的博士，所以我看他的这个签名是伯克利什么什么。这个人我也不认识，所以这名字咱就不记了。他呢，算是有一些网红包袱。你说我卷不动这事呢，我又不能承认。我不能承认这个网红塌房了，别人能搞定，我搞不定。所以呢，一定要找一个出口说，你看他们其实也不挣钱，他们就想卷我们，他们也有问题。他找到了谁？找到硅基流动了。这个不能是自己的问题，也不能是DeepSeek的问题。DeepSeek现在是中国之光嘛，这事一定是你自己技术不好。而且这事还不能是华为的问题，这事跟华为有什么关系呢？就是路深科技跟硅基流动，他们接DeepSeek都是跑的华为云的升腾910芯片的，他们没有跑英伟达芯片。那这个事这几家都怪不了，不能怪自己，不能怪DeepSeek，也不能怪华为。那我们怪友商吧，怪这个硅基流动吧。他说硅基流动你春节加班，因为DeepSeek的发布是在春节期间发布的嘛，而且呢还在卷砍一刀的事情。因为这个硅基流动发了好多的代金券出去，赚了一波流量。你发了这个多少亿的代金券出去，你手里就1亿2亿的现金，你根本就没有办法兑现这个事情。这个其实也是有点骗傻子了，代金券出去并不是需要用你手里的现金去兑换的，你是要用服务慢慢地去把这些代金券消耗掉，跟你手里有多少现金本身是没有关系的。当然，卷这个事呢，在中国企业的竞争过程中呢，算是一种常态吧。现在硅基流动的DeepSeek R1也基本上处于不可用状态，我现在也不用他们家的，都是用火山的。待会咱们再讲为什么用火山的。到这了这两家就开始互相掐了，硅基流动说人家是已经发布了这些开源项目了，我们照着去学就完了，但是这个事很难，你搞不定，你不要说别人也搞不定，开始阴阳这个路深科技。这两边就开始相互的指责，说你挖我的人。</p>



<p class="wp-block-paragraph">硅基流动说你抄袭，开始互相怼起来，这已经离开事实本身了。这个呢，稍微有一点点low。卷不动呢，你就默默地退出就完了。当然，内部人设立不住呢，你就需要在外边立靶子。我们也见到了很多这样的案例了，最后呢在外部还翻了车了，只能回去继续统一思想。</p>



<p class="wp-block-paragraph">怎么在外部翻车了呢？因为路深科技呢，被硅基流动指责说你抄袭。然后路深科技说，抄袭的那个是原来我CTO干的，CTO已经把它开了。而且呢，CTO被开了以后，还去你硅基流动上班去了。现在这个CTO也出来回复了这件事情，他说我就是当年那CTO，我去的时候这项目就已经是这样了，那个代码也不是我抄进去的。说我去了以后呢，还整理了所有的代码，把所有引用的东西呢，给他写清楚出处。</p>



<p class="wp-block-paragraph">这个开源项目怎么算抄袭，怎么算不抄袭？就是你违反了人家的开源协议，你用了人代码你没有写说这是哪来的，这就算抄袭。你说我用了人代码了，但是我写清楚我用了谁谁谁家代码，符合人家的协议，然后我在这个基本上做什么修改了，这个就算给开源做贡献。人家的CTO说压根跟我没关系。</p>



<p class="wp-block-paragraph">然后第二个说我为什么离开呢，是因为他们用假的期权合同骗我，让我去的时候给我承诺了期权，结果最后呢没法兑现。因为这个事情我质问了他们，所以最后离开了。在其他的一些抄袭事件，因为这个路深科技，还有其他的抄袭事件，说这个就跟我完全没关系，等于又把这个路深科技整个放这了。</p>



<p class="wp-block-paragraph">那么DeepSeek的推理市场，未来到底怎么走呢？首先腾讯去加单了，订购了10-20万块的H20，这个是现在允许向中国出口的型号，全线接入DeepSeek。在它的微信，IMA，还有元宝这些程序里边都接了。IMA呢是一个办公用的AI助手，元宝呢，是个人用的AI助手。现在元宝在疯狂的做推广，微信的搜索里边，现在也在进行灰度测试，直接在里边可以使用DeepSeek R1进行搜索推理。字节呢，本身就是算力大户，它是全世界第二名的算力大户，第一名是微软，第二名就是它。</p>



<p class="wp-block-paragraph">DeepSeek只做ToB的服务，就是你可以在字节的火山引擎上用它。字节自己的产品里是没有去接DeepSeek R1的，他们还是比较骄傲的，希望这个豆包模型可以追上来。所以字节的DeepSeek R1是我现在用过的所有DeepSeek R1里头最快的，因为算力足够多，用的人不是很多，所以他最快。</p>



<p class="wp-block-paragraph">阿里云呢，未来三年投入3,800亿人民币做算力投入，说那我们就疯狂去买就完了。至于这些MAAS厂商，就是叫模型及服务的厂商，这个背后都是华为云，价格又被DeepSeek给锁死了，这个就很痛苦。所谓锁死了什么意思？DeepSeek在中国给出的价格，咱们就说R1的输出价格吧，是最贵的一个价格，是每100万TOKEN 16块钱。现在甭管是路深科技还是硅基流动，或者是阿里云火山云，都是用同样的价格给的，100万TOKEN 16块人民币。但你知道国外多少钱吗？在together上刚才我查了一下，美国的服务器上部署的DeepSeek R1，它的100万TOKEN大概是七八块美金了，应该到50多块钱人民币，所以这个还是挺贵的。</p>



<p class="wp-block-paragraph">他们的V3其实价格都差不太多，咱们的V3的输出呢，是八块钱人民币100万TOKEN，在美国的话是1.25美金100万TOKEN，这个是相差不多的。但是R1这个真的是差三倍的钱，国内这个锁死价格了，以后他们就必然会按照这个价格赔钱赔下去。</p>



<p class="wp-block-paragraph">至于DeepSeek所开源的这些库呢，他们只能去借鉴一个思路，肯定用不上。为什么？因为DeepSeek所有开源库都是基于CUDA的，都是基于英伟达芯片的。这帮人看着一堆的华为升腾910，只能说，咱们看看这个大概思路是不是可以参考一下。那这个想去做的话难度就大了，而且整个的服务过程必然亏损。原因也很简单，就是你的服务器绝不可能7*24小时很均匀、很平顺的满负荷运转，这个事情从头到尾就是个伪命题，所以肯定是亏的。</p>



<p class="wp-block-paragraph">而且，华为呢是不会承担这种亏损的。你跟华为合作，人家还忙着爱国呢。你亏了钱，肯定是你自己的问题。而且，人家DeepSeek说了：“我这能挣钱，你亏了，你不能怪我，你也不能怪华为。你看看你自己的技术哪不对。”</p>



<p class="wp-block-paragraph">而且，这些MAAS的厂商呢，还没有大厂其他的业务可以补血。你比如像刚才我们讲，腾讯在这个IMA或者是元宝里边，去使用DeepSeek R1的时候，你是不用付钱的，免费的。但是，腾讯有游戏收入，有广告收入，还有各种电商收入。他有一堆收入可以补这个窟窿。他去买20万张的H20，花不了多少钱，对于他整个利润来说，都是可以承担的成本。</p>



<p class="wp-block-paragraph">硅基流动，路深科技，你跟他卷，这你肯定卷不过他。更别说字节跳动了，字节跳动比腾讯还能挣钱呢。所以呢，跟大厂他们也卷不过。model as a service的这些厂商呢，只能看谁坚持到最后。坚持到最后，也不是说他们就能胜出。坚持到最后呢，也就是看最后谁能够下车，被这些大厂所收购。这应该就是他们的出路。</p>



<p class="wp-block-paragraph">当然，你说我未来是准备被收购的，那也就不能长太胖。什么意思？你不能拿太多的融资，必须要自己挣钱。因为你拿了很多融资以后，你的估值会变得非常高。等到最后大厂去选择一家，把它收下来的时候呢，通常还是要去衡量一下性价比的。</p>



<p class="wp-block-paragraph">那么，总结一下。首先呢，要感谢DeepSeek又给了一话题，又可以跟大家扯一会儿。如何理性地判断各种夸张数据背后的逻辑和价值，才是今天我们要讲这期视频的核心点。而不是说，我们来批判一下这东西合理还是不合理，这个没有什么意思。</p>



<p class="wp-block-paragraph">AI正在走向新的时代，过去很多的商业逻辑呢会发生变化。过去的经验未必有效，但是依然是会有一定的价值。你像我给大家分析很多东西，都是根据我过去的很多商业逻辑来分析，但是也不能迷信这个东西。像我每次都会跟大家强调，这个东西呢，有可能分析的不全面，未来有可能会出现我们想象之外的东西。那这个才是我们这个频道始终跟大家所强调的东西。好，这期就讲到这里。</p>



<p class="wp-block-paragraph">感谢大家收听。请帮忙点赞、点小铃铛，参加Discord讨论群。也欢迎有兴趣、有能力的朋友加入我们的付费频道。再见。</p>
]]></content:encoded>
					
		
		
			</item>
		<item>
		<title>百度为什么不做Sora？探索百度的独特AI发展路径与未来方向，背后原因是吃不到葡萄说葡萄酸吗？</title>
		<link>https://lukefan.com/2024/11/19/%e7%99%be%e5%ba%a6%e4%b8%ba%e4%bb%80%e4%b9%88%e4%b8%8d%e5%81%9asora%ef%bc%9f%e6%8e%a2%e7%b4%a2%e7%99%be%e5%ba%a6%e7%9a%84%e7%8b%ac%e7%89%b9ai%e5%8f%91%e5%b1%95%e8%b7%af%e5%be%84%e4%b8%8e%e6%9c%aa/</link>
		
		<dc:creator><![CDATA[老范 讲故事]]></dc:creator>
		<pubDate>Tue, 19 Nov 2024 00:52:17 +0000</pubDate>
				<category><![CDATA[AIGC]]></category>
		<category><![CDATA[AI Agent]]></category>
		<category><![CDATA[AIagent]]></category>
		<category><![CDATA[AI创新]]></category>
		<category><![CDATA[AI发展路径]]></category>
		<category><![CDATA[AI商业化]]></category>
		<category><![CDATA[AI商业探索]]></category>
		<category><![CDATA[AI工具]]></category>
		<category><![CDATA[AI市场]]></category>
		<category><![CDATA[AI平台]]></category>
		<category><![CDATA[AI技术]]></category>
		<category><![CDATA[AI方向]]></category>
		<category><![CDATA[AI模型调用]]></category>
		<category><![CDATA[AI生成]]></category>
		<category><![CDATA[AI竞争]]></category>
		<category><![CDATA[AI节目主持]]></category>
		<category><![CDATA[AI落地应用]]></category>
		<category><![CDATA[AI行业]]></category>
		<category><![CDATA[AI行业评论]]></category>
		<category><![CDATA[AI视觉生成]]></category>
		<category><![CDATA[AI革命]]></category>
		<category><![CDATA[AI项目]]></category>
		<category><![CDATA[IRAG]]></category>
		<category><![CDATA[IRAG系统]]></category>
		<category><![CDATA[OpenAI]]></category>
		<category><![CDATA[Scaling law]]></category>
		<category><![CDATA[Sora]]></category>
		<category><![CDATA[Token计费]]></category>
		<category><![CDATA[YouTube频道]]></category>
		<category><![CDATA[中国AI]]></category>
		<category><![CDATA[中国式创新]]></category>
		<category><![CDATA[云计算]]></category>
		<category><![CDATA[产品发布]]></category>
		<category><![CDATA[创新保守]]></category>
		<category><![CDATA[创新挑战]]></category>
		<category><![CDATA[前沿科技]]></category>
		<category><![CDATA[发展趋势]]></category>
		<category><![CDATA[商业逻辑]]></category>
		<category><![CDATA[图像RAG]]></category>
		<category><![CDATA[图像技术]]></category>
		<category><![CDATA[多模态]]></category>
		<category><![CDATA[大企业应用]]></category>
		<category><![CDATA[市场策略]]></category>
		<category><![CDATA[市场需求]]></category>
		<category><![CDATA[幻觉问题]]></category>
		<category><![CDATA[快手]]></category>
		<category><![CDATA[技术发展]]></category>
		<category><![CDATA[技术定向]]></category>
		<category><![CDATA[技术路线]]></category>
		<category><![CDATA[抖音]]></category>
		<category><![CDATA[搜索增强生成]]></category>
		<category><![CDATA[政府应用]]></category>
		<category><![CDATA[文心一言]]></category>
		<category><![CDATA[文心智能体]]></category>
		<category><![CDATA[文心研]]></category>
		<category><![CDATA[无代码工具]]></category>
		<category><![CDATA[智能体]]></category>
		<category><![CDATA[智能体平台]]></category>
		<category><![CDATA[智能技术]]></category>
		<category><![CDATA[智能生成]]></category>
		<category><![CDATA[未来展望]]></category>
		<category><![CDATA[未来技术]]></category>
		<category><![CDATA[李彦宏]]></category>
		<category><![CDATA[消除幻觉]]></category>
		<category><![CDATA[涌现]]></category>
		<category><![CDATA[爱奇艺]]></category>
		<category><![CDATA[现有需求]]></category>
		<category><![CDATA[百度]]></category>
		<category><![CDATA[百度AI战略]]></category>
		<category><![CDATA[百度AI技术路径]]></category>
		<category><![CDATA[百度世界大会]]></category>
		<category><![CDATA[百度发布会]]></category>
		<category><![CDATA[百度应用]]></category>
		<category><![CDATA[百度战略分析]]></category>
		<category><![CDATA[百度技术展示]]></category>
		<category><![CDATA[百度智能眼镜]]></category>
		<category><![CDATA[百度的未来]]></category>
		<category><![CDATA[百度视频平台]]></category>
		<category><![CDATA[确定性创新]]></category>
		<category><![CDATA[科学家质疑]]></category>
		<category><![CDATA[科技前沿]]></category>
		<category><![CDATA[科技评论]]></category>
		<category><![CDATA[秒哒]]></category>
		<category><![CDATA[老范讲故事]]></category>
		<category><![CDATA[规模法则]]></category>
		<category><![CDATA[视觉数据库]]></category>
		<category><![CDATA[视频模型]]></category>
		<category><![CDATA[超级APP]]></category>
		<category><![CDATA[超级智能体]]></category>
		<guid isPermaLink="false">https://lukefan.com/?p=1706</guid>

					<description><![CDATA[大家好呀！今天我们来聊聊一个让人惊讶的话题——为什么百度选择不做Sora？啊啊啊！这个问题真的是激动人心，背后有没有什么内幕呢？

在11月12号的百度世界大会上，李彦宏亲口说出，百度从来没有想过要进入Sora这样的竞争。这让我不禁思考，难道真的是因为吃不到葡萄就说葡萄是酸的？🤔 百度到底在想什么？！

百度选择的道路是“消除幻觉”的方向，IRAG技术的发布就是他们的一大步！🤯 这个技术看似复杂，但其实是通过图像产生生成，然后来保证生成的准确性！说到这里，我忍不住想试试效果，结果测试后发现——画小米苏7完全失败，反而是画出了一辆问界M5！😂

不过，画郭德纲的效果简直让人震撼，逼真得以假乱真！但对比于谦却又变成了两个郭德纲，这让我一下子笑掉大牙！🤣 这是算法数据的不够精准造成的。看得出来，百度这条路走的还是有些吃力啊！

而且我们也要注意，百度的15亿调用量听上去很牛，但换算一下，实际收入却让人无奈，只能算个小打小闹🙄。李彦宏提出的方向，似乎更依赖的是产业应用和政府合作。这种中国式创新，真的能带来可持续的发展吗？🤨

所以，百度不做Sora，深思熟虑之后选择了踏实的IRAG，并不是因为他们没有能力，而是有着超凡的商业思维和稳定的操作方案。不管未来会如何发展，我期待能看到百度带来更多惊艳的产品和技术！💪

希望你们喜欢今天的话题，记得点赞关注我哦～我们下次再见！💖

百度为什么不做Sora？探索百度的独特AI发展路径与未来方向，背后原因是吃不到葡萄说葡萄酸吗？

在百度世界大会上，李彦宏揭示了百度不同于OpenAI的AI发展路径，即不开发Sora这样的视频模型，而是专注于多模态技术和消除AI幻觉。在大会上，百度发布了全新的IRAG技术，以图像为基准的搜索增强生成系统，以及无代码工具“秒哒”，引发了广泛的关注。然而，尽管有着15亿日均调用的文心一言，百度在AI领域的收益有限。百度不参与视频平台的竞争，背后的原因是其没有类似抖音或快手的平台支持。最终，百度选择了确定性更高的技术路线，但这一保守策略是否能使百度在未来AI竞争中占据领先地位，仍需时间验证。
]]></description>
										<content:encoded><![CDATA[
<figure class="wp-block-embed is-type-video is-provider-youtube wp-block-embed-youtube wp-embed-aspect-16-9 wp-has-aspect-ratio"><div class="wp-block-embed__wrapper">
<iframe loading="lazy" title="百度为什么不做Sora？探索百度的独特AI发展路径与未来方向，背后原因是吃不到葡萄说葡萄酸吗？" width="900" height="506" src="https://www.youtube.com/embed/Ep_ehhnY-Tc?feature=oembed" frameborder="0" allow="accelerometer; autoplay; clipboard-write; encrypted-media; gyroscope; picture-in-picture; web-share" referrerpolicy="strict-origin-when-cross-origin" allowfullscreen></iframe>
</div></figure>



<p class="wp-block-paragraph">百度为什么不做Sora？是不是吃不到葡萄就说葡萄是酸的呢？大家好，这里是老范讲故事的YouTube频道。</p>



<p class="wp-block-paragraph">11月12号，百度世界大会上就透露出来说，百度从来就没有想去过做Sora这样的世界模型，或者叫视频模型，从来没想过。百度呢，是一直希望走自己的多模态道路，不希望去跟OpenAI这样的公司卷入世界模型的竞争。虽然到现在为止，Sora也没出来，但是跟在后面跑的人还是很多的，特别是抖音、快手，都推出了各自的视频模型，还有很多国际上的厂商也在视频模型上争先恐后地往前跑。</p>



<p class="wp-block-paragraph">但百度说，我不干这个事，我有更重要的事情在做。这是百度李彦宏亲口说的。那么，百度努力的方向到底是什么呢？百度努力的方向是消除幻觉。大模型都是有幻觉的，百度呢说，我们作为一个中国公司，你可以不说话，但是说错了是很麻烦的，所以我们不能产生幻觉，保证我们说的都是对的。而且这个是在各种角度上，所有的评判标准来看，都得是对的，不能有任何问题。因为有的时候，你说的你觉得对了，但别人觉得不开心，这也是不行的。</p>



<span id="more-1706"></span>



<p class="wp-block-paragraph">所以百度呢，作为一个有中国特色的AI领军公司，他们向着消除幻觉的方向前进了。他们准备怎么去消除呢？他们这一次在11月12号的百度世界大会上，推出了一个很有趣的东西，叫IRAG。大家要知道，RAG是我们在做AI agent，或者叫AI智能体里头，用得比较多的一个技术，叫搜索增强生成。就是我们先搜索，搜索完了以后，根据搜索的内容再去生成，这样的话，能够保证生成出来的东西没有什么幻觉，是在你给定的范围内去生成的。它倒不一定说保证生成出来的东西是对的，但呢，它保证说你给我的是什么，我生成出来的就是什么。</p>



<p class="wp-block-paragraph">那么，IRAG是一个什么样的东西呢？这个前面这个I到底是做了一个什么样的单词放进去了呢？I这个词呢，是图像（image），以图像为基准的RAG。什么叫以图像为基准的RAG呢？就是正常情况下，咱们RAG都是做的文本或者是表格。</p>



<p class="wp-block-paragraph">搜索完了以后，把这些文本和表格通通都做成矢量数据库里面的一个点。然后找到离他比较近的点拿出来，去生成跟问题相关的答案。这是RAG的标准过程。IRAG呢，就是百度说我有好多图片，我把所有这些图片，以及图片识别出来以后的各种信息，直接拿去做嵌入，然后形成史料数据库。在这个里边去搜索，搜索完了以后再去重新生成图片。这意思是什么呢？就是你去训练说这个人叫张三，张三长这个样子，张三坐着，张三站着，张三乐了，张三哭了，张三吃东西了。他把所有这些东西都训练好了，放到一个矢量数据库里边。等你下次要求他去生成图片的时候，说张三穿着什么什么样的衣服，站在哪里，在做一个什么动作，有什么样的表情，有什么样的风格，他就可以从矢量数据库里头把你要的这些信息都找出来。张三长这样，我有了；然后呢，穿什么衣服，我在数量数据库里再去查。查完了以后，哦，衣服长这样我也有了。做什么动作他可以画得很准。他做了这么一个很神奇的技术出来，但是我看到这个介绍以后说：“哎，这玩意好玩哈，我得去试试。”然后我就跑去试了一下。首先我跑到了百度文心一言的网站上，测试一下，发现文心一言3.5版本一如既往的拉胯，依然在那胡说八道，依然在那前言不搭后语，咱就对他没有什么预期了吧。然后闻心欲言4.0依然需要收费，算了不测试了。那么画图吧。画图的过程呢，稍微有些吓人。首先让他画车，你让他画各种型号的车，都非常的准。说我迈巴赫哪个款，在巴黎的凯旋门下，哎呀，那个做的非常的漂亮，一张照片绝对一下乱真。大众这个车呢，除了车牌子上看不太清楚之外，也是非常像的。比较遗憾的是，我要求他画小米苏7，他没画出来，估计是小米苏7他的素材不够多，或者训练这个模型的时候没有用很多的小米苏7的图片，或者说他的IREG的这个矢量库里头没有那么多的小米苏7的图片。每次要求他画小米苏7的时候，他画出来的呢，都是问界M5，这个就没办法了。然后画人吧，要求他画郭德纲。</p>



<p class="wp-block-paragraph">哎呀，我天呐，简直就是拿照片直接贴上来。你说郭德纲干什么？马上就给你做一个一模一样，绝对以假乱真。但是呢，你要求他画于谦，这个事就没法整了。画出来的也是郭德纲。大家想明白了没有？为什么会这样呢？</p>



<p class="wp-block-paragraph">说为什么我要求他画于谦，这个IRAG产生的结果是郭德纲呢？因为很简单，你所有在百度图片里头搜索于谦的照片，郭德纲都站旁边了。于谦、郭德纲，郭德纲、于谦，你郭德纲站的照片多一些，那么他就认为说是不是于谦应该也长这样。可是这样的一种运作方式，实际上呢，他向我们展示了用IRAG的这个技术，依然是没有办法避免幻觉的。你要求他画于谦，他画的是郭德纲。</p>



<p class="wp-block-paragraph">有一张照片，我告诉他说，来，给我画一个郭德纲跟于谦在德云社说相声的照片。画完了以后，就是两个郭德纲，都很像。就是你单独拆出任何一个来，都是以假乱真的。俩郭德纲站在台上说相声了，就变成这样了。要求画其他人，就没有那么像了，比如说郭麒麟、马斯克，这个就不太容易认出来了。其他的我就没有再敢去测试，再测试可能会被警告了。</p>



<p class="wp-block-paragraph">但是呢，他整个这套的IRAG的系统还是挺吓人的。如果你想让他去给你生成一些广告图片或者是一些假图，就是郭德纲出去做了一些丢人现眼的事情，绝对以假乱真，画的极像，已经是可以达到一定的商业用途了。特别是你，比如说我做一些店铺的装修或者是这种电商的图片生成，这个玩意还是可以的。</p>



<p class="wp-block-paragraph">除了这个IRAG之外，这一次的百度世界大会上呢，还发布了无代码工具“秒哒”。一秒、两秒的秒，哒呢是一个口一个到达的达。所谓的无代码工具“秒哒”呢，其实类似于字节跳动的codes，对吧？也是让大家把智能体拼起来，然后形成AI agent去干活了。只是呢，秒哒现在呢还不开放使用，依然是让企业去报名排队。据说已经有很多人排队了。这些企业不知道为什么想不开，Codes现在就可以免费使，你干嘛还要去使用秒哒呢？像我这种稍微有点动手能力的人，可以使用Defi。</p>



<p class="wp-block-paragraph">这个咱们就不说到这么远了。今年，除了前面我们讲的IRAG以及秒哒之外，还发布了什么呢？这个牛肯定还是要吹的嘛。现在吹的牛是什么？就是文心一言大模型，日均调用量15亿。我们已经数涨上来了，去年是5,000万，现在涨了30倍了。这个15亿呢，大家注意，没有单位，15亿次，15亿人，不可能15亿人，中国没有。15一次，这个也稍微有点不太好去评估，怎么算一次呢？那么我们就稍微保守一点评估吧，我们把这个单位写成TOKEN，就是每天可以生成15亿TOKEN。</p>



<p class="wp-block-paragraph">哎呀，很多人说这个数好大呀，百度文心一言好厉害，这么多人使用它，生成了这么多的内容。但是你要想想，15亿TOKEN按照百度的收费标准，能够挣多少钱呢？百度文心一言4.0 Turbo，按照每千TOKEN的价格乘上15亿的话，一天的收入大概不到10万块钱。那你以为像百度这样的一个公司，这样的一个项目，值得上来去讲吗？如果这就是他的AI未来的话，百度一年挣个3,000万、4,000万这种水平，这个够干嘛的呀？</p>



<p class="wp-block-paragraph">所以呢，这个数字基本上可以忽略不计，他只是跟大家玩了一个文字游戏，一天15亿，好大好大。你把它乘上钱数，你看看有多少。除了给自己吹牛之外，当然还要指明一下方向，说未来的AI发展是哪个方向呢？两个大方向，一个是智能体，应该也就是刚才我们讲的AI Agent这样的东西；另外一个呢叫产业应用，就是政府有钱或者是大的企业有钱，你们愿意为这个事情买单，你们就是未来方向了。这是李彦宏为AI中国指明的两个方向。</p>



<p class="wp-block-paragraph">而且呢，保证说百度自己不会去做超级APP，实际上他也没这个本事，所以干脆吃不到葡萄说葡萄是酸的，我不做这个事。然后呢，要去打造上百万个超级APP，也不知道李彦宏怎么想的。超级APP不可能有上百万，到上百万了，以后这东西就不叫超级APP了，你没有那么多用户，叫什么超级APP？但那意思呢，就是降维打击，这个是很多互联网人喜欢讲的一种说法。</p>



<p class="wp-block-paragraph">你是二维生物，我用三维的方式去干掉你；你是三维生物，我用四维的方式去干掉你。这是《三体》里边的一个词。这个所谓的降维打击是什么呢？就是你们都去卷超级APP去了，我要当你爹。在百度下边做的应用都是超级APP，我比你高一个层次。</p>



<p class="wp-block-paragraph">当然了，也展示了一些智能体，包括百度自己的文心智能体平台。这个上面呢，号称有15万家企业使用，有80万开发者，但是也没有看到砸出什么响动来。如果产生了超级APP的话，广大的民众应该是能够有感知的。咱们现在没有感知，别说上百万个了，一个都没看到。然后也展示了一些超级智能体，什么法律问答呀，基本上也就是说我们通过百度的文心研做的一些AI Agent，怎么能够解决一点点的实际问题，这个也给大家展示了一下。</p>



<p class="wp-block-paragraph">另外，时髦还是要赶的，赶什么时髦呢？百度智能眼镜，扎克伯格干成了，我们也得干去。这就是这一次的百度世界大会上发的东西。那咱们回过来说，百度为什么自己不做Sora呢？其实这个里头最本质的原因只有一个，就是百度自己是没有视频平台的。虽然百度有视频，百度有爱奇艺什么这些东西，但是百度自己没有像抖音、快手这样的平台。你像国内现在即梦跟可灵，卷的那叫死，天天俩人卷来卷去的。即梦后边是字节跳动是抖音，可灵后边是快手。生成完了视频，就放在我们的抖音、快手平台上，大家就可以宣传了，就可以直接用上了。百度自己没这东西，所以说那我就不跟你费这劲了。</p>



<p class="wp-block-paragraph">而百度跟Sora呢，实际上是两条完全不同的路径。Sora是什么路径？Sora的路径是scaling low，大力出奇迹。中间很多东西我们也不去研究了，我们就把料堆齐了，数据堆齐了，算法堆齐了，再加上足够的算力，烧钱等待它涌现。原来的这些传统的方式，我们就不去考虑了，think differently。我们不用再去想说要不要更快的马车，我们直接去造飞机去了，还不是汽车。这就是Sora干的事情，是一帮有理想的人去做的事情。</p>



<p class="wp-block-paragraph">而且呢，未必有结果。其实到现在为止，Sora都没有任何要做出来的迹象。而百度他们做的事是什么呢？是在现有的技术范畴下，满足现有的需求。这个呢，就属于典型的中国式创新了。要求的是什么？确定性高。我们要卷吗？卷的一定要确定性很高。哪方面要确定呢？第一，技术路线要确定。一帮老学究们，他们来去确定技术路线，不能让年轻人上。年轻人，你们没有经验，万一走错了路怎么办呢？这个你们不要去动。第二个呢，成本要确定。我投入多少钱以后，可以得到一个什么样的结果。成本确定了以后呢，收益也要确定。我做出来的东西得有人用，我得卖得掉，这个事才能去干。就比较现实。这个就是百度走的这条路。百度呢，要求是有市场能赚钱，所以呢，百度算是比传统的中国式创新更加保守一点的一个公司。</p>



<p class="wp-block-paragraph">那么现在有很多人去讲说，scaling low现在到底行不行？美国有很多大学、很多机构，甚至一些著名的科学家都出来讲，scaling low是不是玩不转了，这种规模法则是不是有问题了？再往前堆，是不是堆不出东西来了？这件事呢，只能这么说，从scaling low诞生的第一天开始，质疑就从来没有停止过。为什么呢？因为scaling low指望的那个东西，就是scaling low成功的最终结果叫涌现。这个词什么意思？就是你不确定他来不来，你不确定哪次行哪次不行，你也不确定说我到底是增加多少。以后有这么一次，因为涌现这个东西，它一定是不连续的。不是说我上了10块显卡，出了一个东西；上了11块显卡，又出了一个东西；上了12块显卡，又出了一个东西。这个是不连续的。你有可能10块显卡，你最后算出来一个数据可以用，然后呢，11、12、13都没用。结果你发现上到第100块显卡的时候，又跑出一个结果来，又有一个跳跃式的创新，又往前走了一步。那你说咱堆吧，堆到1,000块显卡，咱再做一次，发现哎，好像有那么点提升，但是又不是那么明显。哎呀，这个好像不对。</p>



<p class="wp-block-paragraph">但这个事情是不是就不行了？不一定，因为在下一个节点在哪，谁也不知道。这个才叫涌现呢。如果你知道下一个节点在什么地方，比如说有这么多数据堆在一起以后得到结果，那下一个节点，比如说我们说是乘10倍、乘20倍、乘30倍或者是1,000倍，这都不知道。这个才叫真正的 scaling law。就是我们就只管往前堆，未来是不可预期的，不确定的不连续的。</p>



<p class="wp-block-paragraph">这个东西从开始的那天大家就质疑它。这个过程呢，其实很像什么？就是咱们小时候都看过一个故事，叫小马过河。什么意思呢？这个小马背着一包货准备过河，人家就跟他讲说你这个过不去的，这个河很深，会淹死你的。这个不同的人就都跟他讲不同的话。就是每一个老的科学家或者是一些进行成本核算的会计师们，看到 scaling law 就会跟他讲：“小马过河，你是过不去的，你这个事有问题的。”那这个怎么办呢？必须要往前蹚，蹚完了以后去寻找下一个的节点，这个是没有什么办法的。</p>



<p class="wp-block-paragraph">百度这么想到底对不对？百度说我不去作死 Sora，我要去做 IRAG，我要去消除幻觉，做有中国特色的创新，这事对不对呢？其实百度这么想并不丢人，作为一家成熟的商业企业，这样思考算是一个正常的商业逻辑。但是呢，如果按照百度自取的那样，他是中国 AI 行业的领军企业，这么想问题的话，就有点可悲了。</p>



<p class="wp-block-paragraph">但好在是什么？就是中国做 AI 这一块，反正至少我测试的各种产品里头，我觉得百度基本上还是排不上号的。百度自称是中国 AI 行业的领军企业，这个事呢，让百度自己开心就好了，关起门来称大王就可以了，让我们每天看着百度是怎么思考问题的。我觉得他思考问题的很多的方式还是有借鉴意义和价值的。但是呢，作为一个国家的这种 AI 领军人物，最好还是有一点梦想，愿意努力的，跳一步往前走一走，有可能你就会走到一些不一样的地方。</p>



<p class="wp-block-paragraph">好，这一期就跟大家讲到这里，感谢大家收听，请帮忙点赞，点小铃铛，参加 Discord 讨论群。</p>



<p class="wp-block-paragraph">也欢迎有兴趣、有能力的朋友加入我们的付费频道。再见。</p>
]]></content:encoded>
					
		
		
			</item>
		<item>
		<title>在中国，到底是谁在爆买英伟达显卡？揭秘中国企业疯狂购买英伟达显卡的背后真相：中国移动领衔—国内GPU市场大揭秘。</title>
		<link>https://lukefan.com/2024/09/06/%e5%9c%a8%e4%b8%ad%e5%9b%bd%ef%bc%8c%e5%88%b0%e5%ba%95%e6%98%af%e8%b0%81%e5%9c%a8%e7%88%86%e4%b9%b0%e8%8b%b1%e4%bc%9f%e8%be%be%e6%98%be%e5%8d%a1%ef%bc%9f%e6%8f%ad%e7%a7%98%e4%b8%ad%e5%9b%bd%e4%bc%81/</link>
		
		<dc:creator><![CDATA[Luke Fan]]></dc:creator>
		<pubDate>Fri, 06 Sep 2024 00:40:46 +0000</pubDate>
				<category><![CDATA[AIGC]]></category>
		<category><![CDATA[英伟达，黄仁勋的故事]]></category>
		<category><![CDATA[4090显卡]]></category>
		<category><![CDATA[A800显卡]]></category>
		<category><![CDATA[AI差距]]></category>
		<category><![CDATA[AI进步]]></category>
		<category><![CDATA[B W 200]]></category>
		<category><![CDATA[BAT]]></category>
		<category><![CDATA[Blackwell芯片]]></category>
		<category><![CDATA[Daniel Naily]]></category>
		<category><![CDATA[EFC]]></category>
		<category><![CDATA[GPU采购]]></category>
		<category><![CDATA[H20显卡]]></category>
		<category><![CDATA[H800显卡]]></category>
		<category><![CDATA[IBM]]></category>
		<category><![CDATA[IOE]]></category>
		<category><![CDATA[Oracle]]></category>
		<category><![CDATA[Scaling law]]></category>
		<category><![CDATA[SemiWiki]]></category>
		<category><![CDATA[中国企业]]></category>
		<category><![CDATA[中国电信]]></category>
		<category><![CDATA[中国移动]]></category>
		<category><![CDATA[中美AI对比]]></category>
		<category><![CDATA[云计算]]></category>
		<category><![CDATA[云计算机房]]></category>
		<category><![CDATA[人才]]></category>
		<category><![CDATA[光缆]]></category>
		<category><![CDATA[全球GPU市场]]></category>
		<category><![CDATA[半导体自媒体]]></category>
		<category><![CDATA[半导体行业]]></category>
		<category><![CDATA[华为]]></category>
		<category><![CDATA[台湾]]></category>
		<category><![CDATA[台湾显卡市场]]></category>
		<category><![CDATA[合规成本]]></category>
		<category><![CDATA[商业逻辑]]></category>
		<category><![CDATA[大基建]]></category>
		<category><![CDATA[央企]]></category>
		<category><![CDATA[字节跳动]]></category>
		<category><![CDATA[小公司]]></category>
		<category><![CDATA[巨头]]></category>
		<category><![CDATA[带宽资源]]></category>
		<category><![CDATA[应用场景]]></category>
		<category><![CDATA[微信聊天记录]]></category>
		<category><![CDATA[技术升级]]></category>
		<category><![CDATA[技术维护]]></category>
		<category><![CDATA[政府拨款]]></category>
		<category><![CDATA[政策解读]]></category>
		<category><![CDATA[数据中心]]></category>
		<category><![CDATA[数据中心建设]]></category>
		<category><![CDATA[数据训练]]></category>
		<category><![CDATA[数据质量]]></category>
		<category><![CDATA[文学作品]]></category>
		<category><![CDATA[新加坡]]></category>
		<category><![CDATA[新加坡显卡购买]]></category>
		<category><![CDATA[显卡需求]]></category>
		<category><![CDATA[比较优势]]></category>
		<category><![CDATA[电信运营商]]></category>
		<category><![CDATA[百度]]></category>
		<category><![CDATA[短视频]]></category>
		<category><![CDATA[算力云]]></category>
		<category><![CDATA[算力分散]]></category>
		<category><![CDATA[算力卡数量]]></category>
		<category><![CDATA[算力市场]]></category>
		<category><![CDATA[缩放法则]]></category>
		<category><![CDATA[美云计算]]></category>
		<category><![CDATA[腾讯]]></category>
		<category><![CDATA[英伟达显卡]]></category>
		<category><![CDATA[英伟达股价]]></category>
		<category><![CDATA[资源整合]]></category>
		<category><![CDATA[转租显卡]]></category>
		<category><![CDATA[阿里云]]></category>
		<guid isPermaLink="false">https://lukefan.com/?p=1544</guid>

					<description><![CDATA[这篇文章深入探讨了各大中国企业在2023年购买英伟达显卡的实际情况，揭示了中国移动、中国电信和华为等公司在显卡市场中的地位。文章分析了中美之间在AI领域的差距，并详细解释了中国在算力、数据、和应用场景上的优势与劣势。透过华为的采购策略、国内爆买GPU的原因、以及全球显卡采购的数据分布，本文提供了全面的市场洞察和深刻的行业分析。

**再教你一遍！中国移动和电信才是显卡界的无冕之王！🧐**

家人们！今天我要狠狠地打破你的认知泡泡了！💥你以为中国大陆买英伟达显卡最多的就是BAT那几家互联网巨头？再不行也是华为、阿里这些科技大佬吧？但事实上啊，事情可没有你想的那么简单！🤯

👇划重点！各位打工人们，看好啦：根据最新的数据，咱们中国移动和中国电信才是真正的“显卡大户”，每个季度嗷嗷地买显卡，排在中国显卡购买榜单的最顶端！而且这还不是搞笑，是真的大手笔！2023年Q2到Q4，移动和电信的显卡采购量简直高到吓人，甚至都有可能接近整个中国市场的一半！🌊🌊

为什么这么卷？🤔 因为人家定位的可不是“玩游戏”，而是建算力中心啊！打造一个为数不多的巨型算力池，吸引各路豪杰租用！而那些被你们视作天神的互联网巨头，有可能都得愁眉苦脸地跑来“打托”！甚至华为这样的老大，也要乖乖跟他们下订单！😂

至于你还在想那些“普通企业”的市场份额，那更是别想了！走到哪里，中国三大运营商的身影都是无处不在的！而那些被禁运的H800也好，A800也罢，它们正在逐步填充这些巨头的库房，其他厂根本就是玩命跟着人家的节奏！

所以以后别再提什么阿里云、腾讯视频自己建啥的，不现实！真正的大人物，都是去租“云算力中心”啊！未来，请记住，在英伟达显卡的江湖中，中国的通信三巨头，才是真正的无冕之王！！🔑🔑

👏不要再犹豫，给这些市场数据点个赞！我宣布，这就是2023年最令人破防的显卡真相！💥如果你对中国AI的未来还感兴趣，那赶紧加入我们吧，让我们一起继续探索更多的“蝴蝶效应”！💡

标签：#显卡市场 #英伟达 #中国电信 #打工人 #AI #内容揭秘]]></description>
										<content:encoded><![CDATA[
<figure class="wp-block-embed is-type-video is-provider-youtube wp-block-embed-youtube wp-embed-aspect-16-9 wp-has-aspect-ratio"><div class="wp-block-embed__wrapper">
<iframe loading="lazy" title="在中国，到底是谁在爆买英伟达显卡？揭秘中国企业疯狂购买英伟达显卡的背后真相：中国移动领衔—国内GPU市场大揭秘。" width="900" height="506" src="https://www.youtube.com/embed/aqqvbj5EeSY?feature=oembed" frameborder="0" allow="accelerometer; autoplay; clipboard-write; encrypted-media; gyroscope; picture-in-picture; web-share" referrerpolicy="strict-origin-when-cross-origin" allowfullscreen></iframe>
</div></figure>



<p class="wp-block-paragraph">到底有哪些企业在购买英伟达的显卡？这个跟大家想象的可能不太一样。中国只有这些显卡吗？跟大家想的可能也不太一样。另一方面，中美之间的AI差距到底在什么地方？</p>



<p class="wp-block-paragraph">大家好，这里是老范讲故事的YouTube频道。最近网上流传了一张图，直接把大家给看懵了。这张图写的是什么呢？就是到底哪些数据中心买家在买英伟达的显卡。我们不算是大家打游戏去买4090，或者是普通的一些小公司买了一堆4090去干活，这不算。我们算的是数据中心的，这到底是什么人在买？</p>



<p class="wp-block-paragraph">在这个图上显示，在2023年Q2、Q3到Q4，实际上每一个季度，中国人从英伟达买的显卡数量都是快速上升的。到2024年呢，有所下降。2024年Q1的话，大概比2023年的Q2还要再少一些，但是到Q2继续在上升，应该是达到2023年Q2的一个同等水平了。</p>



<span id="more-1544"></span>



<p class="wp-block-paragraph">那么在所有的这些买家里头，排第一的是谁呢？不是BAT，也不是字节跳动，这个公司叫做中国移动。每一个季度，虽然大家买的显卡总量是有这样的一个区别，但是比例上，基本上中国移动永远是第一，甚至有可能已经接近了小一半的这样的一个比例。</p>



<p class="wp-block-paragraph">第二名是谁呢？第二名是中国电信。第三名是不是联通？这里头没有联通啥事，第三名叫遥遥领先，也就是华为。第四名是腾讯，第五名是阿里。其实原来我一直以为阿里应该占的量是比较大，现在说中国有一半的大模型跑在阿里云上，结果阿里云其实买的并没有那么多。下一名是字节跳动，再下一名是百度，其他的基本上就排不上号了。</p>



<p class="wp-block-paragraph">中国爆买GPU的，跟大家的想象是不是有一些差异？那么从这张图上看，中国移动、中国电信真的是很强啊。这其实也很简单，比较好理解。什么呢？他们建算例中心了嘛，其他人跑到那去租了。你比如说像阿里云，没准说我上中国电信的机房里去租了一些，你已经买到手的这种H20或者是A800、H800这样的显卡，我来去把阿里云部署上去去用，不也是可以的吗？电信运营商的云计算机房。</p>



<p class="wp-block-paragraph">他就是这样的一种东西。以前我们在盛大网络的时候，其实跟这些电信运营商就是这么打交道的。怎么干呢？我们有网络游戏，电信营商有机房，我们就跑到那去说：“来吧，你就成为我的代理商吧！你用你的机房入股，只要把我的点卡卖掉了，在你那把它消耗掉了，咱们就直接来分钱就完事了。”现在应该很多的算力云也是这么在去操作。</p>



<p class="wp-block-paragraph">那么，中国联通去做什么了？这事稍微有些好奇。因为你想，移动电信都这么猛，联通没有什么事，这也很奇怪。那你说华为这个遥遥领先，自己还造显卡，他买这么多英伟达干嘛？自己家的升腾910B难道它不香了吗？原因其实也很简单，华为其实是个系统集成商，它会给很多的机构单位、政府去搭建这种算力中心。在搭建的过程中，可能有很多的显卡就会从华为这边进口买进来。甲方要什么他就给什么，他也不能说：“我有升腾910，甲方说不，我一定要买英伟达。”但是我就不卖给你，这事人家也不会干。</p>



<p class="wp-block-paragraph">中国基础设施建设的红利呢，英伟达肯定是吃到了，而且量还很大。所谓的基础设施建设，也就是大基建。这是咱们原来做东数西算，英伟达在这个时代就算是新的IOE了。IOE是什么？就是IBM、Oracle和EFC。为什么叫IOE？这是这一品类里边最好的品牌。你只要买了这个品牌的东西，出了任何问题，你怪不到我头上来。所有这个品牌的东西，或者符合IOE规律的这种品牌的东西，只有一个缺点，其他全是优点。这唯一的缺点是什么？贵。</p>



<p class="wp-block-paragraph">你只要是把钱花掉了，剩下的出了任何问题。你比如说你在我的机房里头发现不兼容了，或者出现事了，那你找到我，你这为什么买了他们家的东西？英伟达都出错了，你要买别的更烂了，这肯定是这样的。国家会有一些拨款，直接拨下来做这种算力中心建设。在各个大会小会，从年初开到年终，所有的会上国家都在喊：“说我们的基础设施建设里头，要去建这个算力中心。”所以这块是有大量的拨款下来的啊，哪一个企业，哪一个地区，如果没有把这拨款给你花掉。</p>



<p class="wp-block-paragraph">那他们会觉得亏死了。你不花，别人会花。而且这些大的央企，特别是电信企业，他们自己也有巨大的现金储备，或者说很低廉价格的现金渠道。什么意思？他借钱的利息都比你借的低。所以在这样的情况下，干脆他就动用他背后的现金储备，或者是他的信用，直接从银行拿到无息、低息，或者各种贴补的贷款，他就可以来干这个事了。要比普通的企业做这个事，肯定要方便得多。</p>



<p class="wp-block-paragraph">那真正的这些大厂，比如说BAT这些厂，我租就好了。我为什么要一下把现金都占压在这里，把我的信誉都变成显卡堆在这里？不划算。而且英伟达那边还在更新换代、升级。我万一买一大堆这个东西，旧了以后，你说我到底是更新换代，还是不更新换代？这个事太麻烦了。咱还是吃大户的就完了。所谓大户呢，也就是国家的。所以他们就直接租。</p>



<p class="wp-block-paragraph">而这个小厂，他们有些时候就直接转租大厂。什么意思？租这种云设备，如果说我租一个比较小的单位，比如说我租个两天、租个两台，它是比较贵的，成本也比较高。所以一般的这种大厂，像阿里、百度、腾讯这些大厂，他们会一次性打包一大堆东西给他一起租下来。租完了以后，再在这个里边切分划分，划好了以后再分别包给这些小厂。而且他在这个过程中，还给你上了BAT的服务，BAT相应的软件系统都给你做好了。这个呢，对于小厂来说，你不需要那么高的技术维护能力，就可以直接用起来了。</p>



<p class="wp-block-paragraph">所以这就是在国内正常的玩法。而且呢，在国内要注意，有很多生意只有官家来做才方便。普通人你做这个事是很痛苦的，做不了。为什么？第一个，各种证书你要想去申请，你申请得到吗？特别是跟ICP、ISP这种算力中心相关的证书，你是申请不到的。就算是阿里云、腾讯云，他们很多也是跟各地政府一起去合用这些证书，或者说我挂靠，或者通过一些收购的方式，能够有一些证书去使用。</p>



<p class="wp-block-paragraph">所以在中国，第一个就是证书你搞不定；第二个，什么外汇？你如果手里有美元，你敢说你有？你为什么没有从国外结汇结回来？</p>



<p class="wp-block-paragraph">如果你把这个外汇结回来，变成人民币了。你说我现在再想用美金，到海外去买伟达显卡，那你看看是不是又要去搞批文，要重新做进口，这事很麻烦的啊。但是对于这种大型的央国企来说，处理这个事就比较简单。你说我现在需要很大的一笔外汇，到那边是进口，去买价值可能几千万美金或者上亿美金的这种英伟达显卡回来，对于他来说是比较好做的。但是你对于其他人就费劲了。</p>



<p class="wp-block-paragraph">而且呢，还有什么，接口跟带宽，这事也是一种政府资源。什么叫接口和贷款？以前啊，很多这种云计算的公司，其实他也不算公司，他们是什么，比如什么张家口电信啊，有的时候会找我们。找你干嘛呢？我们最近啊，整到了一个特别紧俏的资源。我说什么资源啊？一个什么万兆网口，或者是最近有一些什么其他的这种接口资源、带宽资源，整这个你们谁要用一下子，咱们把它分一分，把它用掉。</p>



<p class="wp-block-paragraph">作为一个普通的企业，你想搞到这种东西是很麻烦的。而且就算你搞到了，你也必须在他的监督下去使用，这个不是一般人能用的了的东西。所以呢，直接让移动他们买完了，大家租是最方便的。这些生意，咱们就留给官家去做，普通的商家就别碰了，就完事了。</p>



<p class="wp-block-paragraph">而且还有什么，很多政策的制定解读和相关政策执行过程中的辩解和保护，这件事，咱们跟这些大的央国企比起来，也是不具备任何优势的。什么意思呢？很多相关的政策去制定的时候，实际上就是这帮央国企自己在定，他们就有专家。像我们以前也参加过类似这样的标准制定，是安全公司嘛，企业安全的标准，我也会去开会。那会场上的人就是工信部的人、电信移动的人、猎豹、什么360、BAT的人，大家坐在一个屋子里，开始谈说这个东西该怎么弄。</p>



<p class="wp-block-paragraph">所有这种规则的制定，三大运营商的人都是在场的。而且这些规则，别看BAT人也在场，最终话语权最重的还是第一个是官方，就是工信部，第二个实际上是三大运营商，其他人都是提供参考意见而已。但是吵架时，我们下边这帮人吵得凶啊，总还是要表现一下存在感啊。</p>



<p class="wp-block-paragraph">最后，都是这些不言声的人。人家把规则标准定下来，定完了以后呢，真正的最后执行跟解读的时候，就没有其他人什么事了。三大运营商还是可以跟工信部去稍微的去挑战一下，去搞一下，争取一下，或者说我们执行的过程中，哪一个地方松一点，哪一个地方严一点，最近有什么新的风向，他们还能搞明白。</p>



<p class="wp-block-paragraph">这个一般的企业，即使是BAT这样的大厂，通常也没有那么明白。那么，这个图到底哪来的，靠不靠谱？咱们说这么热闹，这个图是海外一个专注于半导体行业的知名自媒体那来的。一看自媒体，这事肯定不靠谱，但这个呢还可以啊。他应该叫Semi Wiki，这个维基呢，后边的博主叫Daniel Naily吧。这位老兄呢，是半导体行业的一位知名人士，从业40多年了，也是写了很多书，写了非常多的文章，所有跟半导体相关的事情，大家还是喜欢去参考他的这个自媒体，或者你说它就是一个大的这种百科全书，大家还是喜欢去参考的。</p>



<p class="wp-block-paragraph">原文地址：<a href="https://semiwiki.com/semiconductor-services/semiconductor-business-intelligence/348913-nvidia-pulled-out-of-the-black-well/" target="_blank" rel="noopener">https://semiwiki.com/semiconductor-services/semiconductor-business-intelligence/348913-nvidia-pulled-out-of-the-black-well/</a></p>



<p class="wp-block-paragraph">SEMI Wiki的内容跟数据呢，也还是相对来说比较靠谱。从2011年上线到现在，一共更新了7000多篇博客，有350万读者在读，就是所有跟半导体相关的一个权威，大家认为是杂志也好，或者是一个维基吧。这个图呢，是来自一篇专栏文章，这个专栏呢叫半导体商业智能，估计应该主要是讲英伟达和各种算力芯片。</p>



<p class="wp-block-paragraph">然后，这个专栏里头写了一篇文章，叫做“英伟达被拉出了黑井啊”，Blackwell。Blackwell是英伟达最新造的这个算力芯片B W 200。但是呢，现在传说B W 200有一些问题，需要迟后交付，导致了英伟达的股价下跌。他写了一篇很长的一篇文章，力挺英伟达，说你们不用担心，这个东西可厉害了，大家不要慌。</p>



<p class="wp-block-paragraph">那么，这个权威人士的内容也是靠谱的，数据呢我们也认为是靠谱的。中国就只有这些GPU嘛，这是我们需要讨论的下一个问题。这个文章里头还有另外几幅截图，咱们看一下，这个截图呢是购买国家分布。</p>



<p class="wp-block-paragraph">就是到底有哪些国家在购买英伟达的显卡？这个里头呢，第一名肯定是美国，第二名是台湾，这个也很有趣。美国的话，我按照最新的一个季度，2024年Q2的这个季度来看，他大概是买了全世界可能43%这么多的显卡。而台湾呢，是买了接近20%的比例的显卡。第三名是谁？还不是中国，因为中国现在毕竟是在禁运嘛。第三名是新加坡，买了全世界18%的显卡，然后中国是12%。剩下其他所有国家加在一块是7%。中国大陆在被限制的这么死的情况下，我们去买H20、A20、A800、H800这样的显卡，也能够买到整个英伟达销量的12%，这个是非常吓人的一个数据啊。</p>



<p class="wp-block-paragraph">这个图呢，还可以看出一点什么，就是英伟达的销量是从2023年的Q2开始爆发的。再往前，其实它的销量是相对来说比较稳定的，到2023年Q2就直接就喷了，基本上是一条直线上去，而且这个线还很陡。英伟达卖掉的显卡都是哪些型号？因为他讲，我们不要看Blackwell怎么样，咱们去看看其他型号卖怎么着。它里头呢，有一大块收入是网络收入（network），我估计应该是在英伟达卖机房的时候，里面进行一些网络连接，什么NW link，可能相关的软硬件给它带来的收入。真正的销售大头其实是H100，大家现在非常疯狂努力地在买H100。剩下的呢，还有极个别的开始买GB 200，就是Blackwell 200，还有一些A100现在也还在销售。</p>



<p class="wp-block-paragraph">这是英伟达现在整个的收入，大概能够占到我觉得60%往上70了，都是H100。所以他那意思就是说，大家不用那么担心，Blackwell搞不定了怎么办，现在H100大家觉得够使，还在努力的买着。咱们看到了这么三张图之后，大家觉得中国还是只有这点显卡吗？能够被统计的按道理来说，就是刚才咱们讲中国移动、中国电信、华为，他们买的这些显卡应该是H20，特别是到2024年了，肯定都是H20。那么大家有没有想过一个另外的问题？</p>



<p class="wp-block-paragraph">台湾跟新加坡，他们需要这么多显卡吗？他们会买这么多显卡，把它堆起来吗？这些显卡有多少通过走私渠道到了中国呢？台湾的20%，新加坡的18%，这一部分到底去哪里了？是不是会有些人感到困扰？其他国家真的能买得起7%的显卡吗？这东西好贵的。</p>



<p class="wp-block-paragraph">还有人说不要看不起欧洲的AI，他们现在融资很厉害。咱们看看谁买多少显卡，就知道他到底是真的是假的，是不是在吹牛。我们相信还有相当一部分显卡是通过台湾、新加坡以及很多其他国家，或者东南亚的一些国家回流到中国来了。</p>



<p class="wp-block-paragraph">特别要注意的是新加坡，为什么呢？因为大家知道，在咱们经济开始稳中向好之后，大量的中国企业，特别是VIE企业，他们喜欢把运营总部放在新加坡。在新加坡这个地方去进行各种全球性的贸易，跟美国、跟台湾、跟各个地方去交易，都是在新加坡交易。所以新加坡买了很多东西，未必是用在新加坡的。</p>



<p class="wp-block-paragraph">另外，新加坡就是一个城市国家，你在这样的一个国家里头寸土寸金的，盖一大堆机房在里头塞显卡，而且还是个热带地方，你还要烧了空调。算算力中心，这个事儿他不划算。所以新加坡大量的跑货，都应该是转口到其他地方去了。</p>



<p class="wp-block-paragraph">新加坡，你不要说地贵、电贵，或者其他这些资源贵，只有一样东西他就搞不定，那就是人。在新加坡建立一个机房，让一堆的技术人员、维护人员去维护这些机房，他得多贵。所以在那个地方去建算力机房这件事，在商业上是完完全全不符合逻辑的。</p>



<p class="wp-block-paragraph">但你说新加坡一点没有吗？也不至于，新加坡还有这么多大学，他们可能还是有那么一小部分的算力云什么在那儿。但是我真不认为他们可以买到全世界18%的算力卡，在那个地方去吭哧吭哧地算。这些算力卡应该大量还是流回到中国了。</p>



<p class="wp-block-paragraph">那你说这些卡哪去了？除了中国电信之外，这些卡去哪了？大家注意啊，除了移动电信，各个省市其实都是有计算中心的。咱们的这种计算中心也算是一种资源，每一个行政机构，甭管是横管还是竖管，他都会说我们自己是不是整一个。</p>



<p class="wp-block-paragraph">哪怕说：“哎，我这是交通部，我这是铁道部。”我们是不是整个集团中心？所以这些卡可能就彻底被分散到了各个国有企业、央企或者一些政府机构里边去。那么这些卡是哪来的呢？或者怎么进来的？</p>



<p class="wp-block-paragraph">最近，超微电脑正在被做空，做空的理由是账目混乱，导致出口管制没有很好地被执行。这是做空机构给他写的做空信。超微电脑也很神奇，不说承认，也不说反驳，什么也没说，给了一个回复，说：“我这个财报晚两天再发。”这个大家自己品就好了。</p>



<p class="wp-block-paragraph">所以我觉得，中国大陆拥有全世界第二多的英伟达各个型号的显卡，还是存在一定的合理性的。而且在这个里面，有大量的是美国政府禁止出口的。中国的显卡实际上都禁了啊，即使是算允许进口那部分，中国也可以在全世界所有的国家里头排到第四：美国第一，台湾地区第二，新加坡第三，中国第四。</p>



<p class="wp-block-paragraph">那么最后一个问题，我们在AI领域里头跟美国到底差多少呢？原来老说我们没有算例，现在我告诉大家，有！我们有算力，而且算力其实并不少。正常情况下，我们现在做AIGC需要三样东西：人才、算力和数据。人才这个事我从来不认为中国缺，特别是这种工程技术人员。咱们在这块一定是全世界最好的。</p>



<p class="wp-block-paragraph">算力，刚才按照我们的分析，中国应该也没有那么缺算力。我们算力肯定没有美国多，这个事是确认的，但应该是第二多，估计应该拥有全世界可能20%多，甚至接近30%的算力卡。这个事是相对来说合理的，美国大概拥有40%多，咱们大概拥有30%多，剩下的所有国家和地区去分，剩下的可能百分之二三十的这种算力卡。</p>



<p class="wp-block-paragraph">数据，其实我们也不缺，我们产生了大量数据。至于说数据质量高低这件事，我觉得没什么可讨论的。英文数据质量确实是要有一些很有质量的，比如说论文这个东西，也不是说咱就拿不到，咱也可以拿到回来去训练嘛。中文的数据也有大量的，你不能说大家每天去做政治学习文章就低质量。你写了很多出来以后，还是可以学出一些不一样的东西来。</p>



<p class="wp-block-paragraph">再加上中国这么多人产生了这么多的文学作品、这么多的小说、这么多的短视频、这么多的微信里的聊天记录，这些东西它都是内容。那么这些内容一样是可以作为数据去跑大模型的，这个都是没有问题。所以数据我从来不觉得咱们缺。</p>



<p class="wp-block-paragraph">那你说咱们啥都不缺，那到底跟美国人之间差哪了？有什么东西？咱是不是还有点优势？我们有些地方还有优势，就是应用场景跟收益这一块，我们其实更好一点。什么意思？在中国很多新技术来了以后，不管是国有企业还是政府机构，他们都属于可以义无反顾地去用起来的。这帮人没有那么多的说：“哎，我这以前刚用过，或者刚升级过，我是不是用一段时间再升级。”他们从来不抢这个，哎，又有机会花钱了，我要赶快去花一把。这个是国内的很多政府机构和大企业习惯性的思路。</p>



<p class="wp-block-paragraph">他们还干嘛叫“拉锁路”？我这个路挖开了，铺根管子进去，待会再挖开了再铺根线进去，再待会挖开了再铺根光缆进去。他们为什么干这事？你不停的折腾，不折腾哪有钱？所以中国人在应用AI的角度上说，在这个全世界范围内，我们应该是跑得比较快的。而且从投入产出来说，我们其实也还算划算。为什么？因为我们工程师便宜，而且人还多。收益，因为大家愿意用，你还是有一定收益。没准一些企业就可以直接在这活下去了。</p>



<p class="wp-block-paragraph">那同样的事情，你在美国未必活得下来，因为他工程师贵，大家去采购这种项目的时候，也相对来说要比中国的政府和这种大企业要谨慎。所以这块咱们还有些优势。</p>



<p class="wp-block-paragraph">那你说中国到底有什么劣势啊？那照我这说法，咱们是不是又厉害了我的国了？咱们也有一些劣势。第一个劣势就是合规成本不可控。这个什么叫合规成本呢？咱这就不再详细讲了，听我节目的人应该是知道啥叫合规成本的。那为什么叫不可控，而不是说合规成本高这个事呢？很有意思啊，咱们是分两个方面来去理解这件事。第一方面，所有ToC的应用合规成本都是很高的。什么叫ToC应用？就是个人用户来使用的这些项目，它的合规成本很高。</p>



<p class="wp-block-paragraph">说错了话就要拔网线，或者有很多人要受到巨大的处分，或者要受到巨大的经济损失。这件事是非常危险的。另一方面，所有对政府和对商业的这种方面，我们的各种应用是百无禁忌的。你在美国，比如说我们想上一个什么医疗系统，想上一个监控系统，那麻烦死你，我告诉你，他不允许，各种的保护隐私。但是在国内，上呗，这有什么？我只听我老板的，其他的都不重要。领导的看法是第一大法的，所以他们完完全全肆无忌惮。咱们的合规成本在这块，对一部分来说很高，对一部分来说基本上可以忽略不计。</p>



<p class="wp-block-paragraph">那么，中国真正的劣势在哪？合规算是一部分，但也不是完全负面的。有一部分是正面的。咱们做的很多监控软件和一些奇奇怪怪的软件，我们做的是要比美国人好的，因为没有那么多条条框框。咱们真正的劣势在于算力太分散。什么叫算力太分散？你想，马斯克的XAI有多少算卡？非常多，十万块还是多少万块算卡。他拿这些算力卡可以集中力量办大事，可以把他的这个grok的版本一级一级往上推。OpenAI有多少算力卡？他可以拿着微软的算力卡去疯狂的计算。谷歌有多少？亚马逊有多少？Anthropic跑的是亚马逊的这个算力卡，他们都是几十万块的往上跑。他们等于非常集中的算力卡，才可以去维护一个什么东西，叫做缩放法则。</p>



<p class="wp-block-paragraph">因为现在大家冲的就是缩放法则，我用更多的数据，用更多的算力卡集中在一起进行一次的这种运算，他可以推出更好的不一样的模型来。而这些算力卡一旦分散开了，比如我现在都到云计算中心去了，都交给中国移动、中国电信了，或者交给各省市，再加上交通部、航天航空，每间都买一堆，那这个就分散掉了。以后你就没有办法说我现在想要十万块H100，我们去推一个grok2出来，你就没有这个能力了。这个是我们现在真正缺的。所以，中国需要的是巨头，这样才能够去追赶Scaling law。如果像现在这样，我们整了一大堆的算力卡进来，四处分散，撒了胡椒面了。或者说，我搁在云计算机房里头。你租5块，他租10块，大家都做一大堆实验型的这种小模型出来。那个是会跟美国越拉越远的。</p>



<p class="wp-block-paragraph">好，这就是我们今天主要讲的内容：中国到底有哪些大企业在去买美国的英伟达的显卡？中国是不是真的只有这么多显卡？以及中国跟美国之间，AI到底差在什么地方？</p>



<p class="wp-block-paragraph">好，感谢大家的收听。请帮忙点赞，点小铃铛，参加<a href="https://discord.gg/ppKsNkttTv" target="_blank" rel="noopener">Discord讨论群</a>。也欢迎有兴趣、有能力的朋友加入我们的<a href="https://www.youtube.com/channel/UCUGLhcs3-3y_yhZZsgRzrzw/join" target="_blank" rel="noopener">付费频道</a>。再见。</p>
]]></content:encoded>
					
		
		
			</item>
		<item>
		<title>揭秘Google与Wiz的230亿美金收购案：以色列安全团队的坚决拒绝。Wiz的价值，体现在中国为什么封禁Docker hub上。与Windows蓝屏无关</title>
		<link>https://lukefan.com/2024/07/26/%e6%8f%ad%e7%a7%98google%e4%b8%8ewiz%e7%9a%84230%e4%ba%bf%e7%be%8e%e9%87%91%e6%94%b6%e8%b4%ad%e6%a1%88%ef%bc%9a%e4%bb%a5%e8%89%b2%e5%88%97%e5%ae%89%e5%85%a8%e5%9b%a2%e9%98%9f%e7%9a%84%e5%9d%9a/</link>
		
		<dc:creator><![CDATA[Luke Fan]]></dc:creator>
		<pubDate>Fri, 26 Jul 2024 00:57:33 +0000</pubDate>
				<category><![CDATA[AIGC]]></category>
		<category><![CDATA[230亿美金]]></category>
		<category><![CDATA[AI/ML/CV]]></category>
		<category><![CDATA[AIGC大模型]]></category>
		<category><![CDATA[Docker镜像]]></category>
		<category><![CDATA[Term Sheet]]></category>
		<category><![CDATA[wiz]]></category>
		<category><![CDATA[上市估值]]></category>
		<category><![CDATA[上市计划]]></category>
		<category><![CDATA[云主机]]></category>
		<category><![CDATA[云端安全]]></category>
		<category><![CDATA[云计算安全]]></category>
		<category><![CDATA[亚马逊云]]></category>
		<category><![CDATA[代码扫描]]></category>
		<category><![CDATA[以色列创业]]></category>
		<category><![CDATA[以色列安全团队]]></category>
		<category><![CDATA[保密条款]]></category>
		<category><![CDATA[创业惯例]]></category>
		<category><![CDATA[创始人背景]]></category>
		<category><![CDATA[商业头脑]]></category>
		<category><![CDATA[商业逻辑]]></category>
		<category><![CDATA[安全公司]]></category>
		<category><![CDATA[安全漏洞]]></category>
		<category><![CDATA[安全解决方案]]></category>
		<category><![CDATA[客户端安全]]></category>
		<category><![CDATA[容器安全]]></category>
		<category><![CDATA[容器隔离]]></category>
		<category><![CDATA[对赌协议]]></category>
		<category><![CDATA[市场份额]]></category>
		<category><![CDATA[市场竞争]]></category>
		<category><![CDATA[市场需求]]></category>
		<category><![CDATA[市场预期]]></category>
		<category><![CDATA[微调调用]]></category>
		<category><![CDATA[微软云]]></category>
		<category><![CDATA[微软蓝屏]]></category>
		<category><![CDATA[投资人]]></category>
		<category><![CDATA[投资意向书]]></category>
		<category><![CDATA[收购价格]]></category>
		<category><![CDATA[收购失败]]></category>
		<category><![CDATA[数据安全]]></category>
		<category><![CDATA[数据扫描]]></category>
		<category><![CDATA[数据泄露]]></category>
		<category><![CDATA[替代解决方案]]></category>
		<category><![CDATA[未来展望]]></category>
		<category><![CDATA[特拉维夫]]></category>
		<category><![CDATA[犹太裔创始人]]></category>
		<category><![CDATA[病毒库]]></category>
		<category><![CDATA[盈利点]]></category>
		<category><![CDATA[私有数据]]></category>
		<category><![CDATA[精算]]></category>
		<category><![CDATA[纽约办公室]]></category>
		<category><![CDATA[股东大会]]></category>
		<category><![CDATA[股市表现]]></category>
		<category><![CDATA[股票增长]]></category>
		<category><![CDATA[自由创业]]></category>
		<category><![CDATA[英伟达]]></category>
		<category><![CDATA[萨斯系统]]></category>
		<category><![CDATA[虚拟机]]></category>
		<category><![CDATA[计算机安全]]></category>
		<category><![CDATA[谷歌云]]></category>
		<category><![CDATA[谷歌收购wiz]]></category>
		<category><![CDATA[静态镜像]]></category>
		<category><![CDATA[风险检测]]></category>
		<guid isPermaLink="false">https://lukefan.com/?p=1434</guid>

					<description><![CDATA[GPT5如果再不出的话，可能就没有机会了。大家好，这里是老范讲故事的YOUT5频道。今天咱们来讲一讲OpenA ... <a title="揭秘Google与Wiz的230亿美金收购案：以色列安全团队的坚决拒绝。Wiz的价值，体现在中国为什么封禁Docker hub上。与Windows蓝屏无关" class="read-more" href="https://lukefan.com/2024/07/26/%e6%8f%ad%e7%a7%98google%e4%b8%8ewiz%e7%9a%84230%e4%ba%bf%e7%be%8e%e9%87%91%e6%94%b6%e8%b4%ad%e6%a1%88%ef%bc%9a%e4%bb%a5%e8%89%b2%e5%88%97%e5%ae%89%e5%85%a8%e5%9b%a2%e9%98%9f%e7%9a%84%e5%9d%9a/" aria-label="阅读 揭秘Google与Wiz的230亿美金收购案：以色列安全团队的坚决拒绝。Wiz的价值，体现在中国为什么封禁Docker hub上。与Windows蓝屏无关">阅读更多</a>]]></description>
										<content:encoded><![CDATA[
<figure class="wp-block-embed is-type-video is-provider-youtube wp-block-embed-youtube wp-embed-aspect-16-9 wp-has-aspect-ratio"><div class="wp-block-embed__wrapper">
<iframe loading="lazy" title="揭秘Google与Wiz的230亿美金收购案：以色列安全团队的坚决拒绝。Wiz的价值，体现在中国为什么封禁Docker hub上。与Windows蓝屏无关。" width="900" height="506" src="https://www.youtube.com/embed/cemXO5eBc2I?feature=oembed" frameborder="0" allow="accelerometer; autoplay; clipboard-write; encrypted-media; gyroscope; picture-in-picture; web-share" referrerpolicy="strict-origin-when-cross-origin" allowfullscreen></iframe>
</div></figure>



<p class="wp-block-paragraph">GPT5如果再不出的话，可能就没有机会了。大家好，这里是老范讲故事的YOUT5频道。今天咱们来讲一讲OpenAI现在身上的压力到底有多大。再不出GPT5，可能真的要出事儿了，因为前面吹过的牛实在太多了，特别是Sola这样的模型，号称可以直接生成长的视频出来，到现在已经半年了，还没有真正拿出来，只是每个月放出几个视频而已。而其他各个公司，按照Sora方向做的产品，已经都开始在公众测试了，这对他们来说一定是巨大的压力。</p>



<p class="wp-block-paragraph">前一段时间发布的Aceropic Claude 3.5 Sonnet，也把压力给到了OpenAI，因为这个模型的效果已经非常好，而且极其便宜。更不要说昨天刚刚发布的LlamaB这样的一个开源模型。前面咱们讲的Aceropic的模型还是闭源的，而Llama可是个开源模型。405B的话，在各个层次上，都赶超了OpenAI的Chat GPT-4。老大的位置有可能会丧失。</p>



<span id="more-1434"></span>



<p class="wp-block-paragraph">大家注意，OpenAI这样的一家公司，可能不会轰然倒下，但对于一个领域的开拓者来说，丢失老大的位置是非常非常可悲的，基本上跟死掉了没有太大的区别。所以现在对于OpenAI来说，他们最害怕的就是把老大的位置丢了。</p>



<p class="wp-block-paragraph">目前的应对方式也很怪，头一天先发了GPT-4欧MINI，第二天人家Llama3.1 405B就开始偷跑。是谁在偷谁的家？我们现在看到了一个叫互相偷家的故事。</p>



<p class="wp-block-paragraph">就是每一边都是在对方最强大的地方打了一根钉子。GPT4O MINI是打的Llama这样的小模型。原来很多人图便宜啊，我要用这种8币的模型，用70币的模型去进行微调，去进行各种各样的定制化开发，以后满足特定场景需求。那么好了，我现在推出GPT4O MINI啊，把这个市场抢过来。这边一个嘴巴子扇过去了，那头一看说：“哎，还有这事呢，老师来，我给你上个大的。你们原来不是说大模型厉害吗？PPT4O厉害，对吧？我直接给你上一个拉嘛，3.1405B超越你的碳模型。”所以叫相互偷家。</p>



<p class="wp-block-paragraph">咱们还记得谷歌I/O开始的前一天，OpenAI在干嘛吗？啊，他发布了GPT4O端到端的语言训练模型。其实到现在为止，我们依然没有看到端到端的语言模型。现在看到的GPT4O依然是啊，要给它进行语音识别，处理完了以后，再给我们念回来的一个过程。这个端到端的模型，包括加上视觉的模型这一部分，现在也没拿出来。但是，就是要赶在谷歌I/O之前发，提前一天，导致了谷歌I/O上发布的Gemini 1.5 Flash，本来是做类似事情的模型一下就显得不香了，对吧？</p>



<p class="wp-block-paragraph">那么这一次呢，我们看到的是非常神奇的GPT4O MINI，应该是啊，计划好了进行发布。阿克伯格那边说：“哎，我们原来虽然没计划好，但是咱们表演一个偷家吧，直接把磁力链放到Reddit里头，就直接偷跑出来了。”所以这一次呢，应该算是OpenAI被梅塔抄了后路了。</p>



<p class="wp-block-paragraph">Open AI GPT4O Mini 这样的一个模型，最初想去偷梅塔拉嘛的，后加的时候还有后续的动作出来。这个后续动作是什么呢？免费微调啊。什么意思呢？就是我们发布的这种预训练模型，如果想让它按照你所期望的方式去工作，是需要去微调的。微调这种模型本身是比较贵的，原来 GPT3.5 和 GPT4 都是允许微调的。</p>



<p class="wp-block-paragraph">这个怎么干呢？就是说你上传一个文件上去，这个文件就是我说什么你回答什么，大概是这样的一个格式。当你把这个文件上传上去以后，就可以请求这个文件给你微调一个版本出来。那么这个版本的模型，是只有你自己能用的。原来也有这样的功能，现在到 GPT4O Mini 这儿，我们不是要抢Llama 38B 这样的生意吗？来，微调免费了，至少在一段时间内，微调是限时免费的。</p>



<p class="wp-block-paragraph">本身这种小模型的微调就比较便宜，GPT4O Mini 就算是过完了限面，开始收费了。它的调试成本也是相对来说比较低的，100 万 TOKEN 的调试可能是 3 美金还是 5 美金。但是微调以后的那个模型，你再去使用就要贵一些了。GPT4O Mini 正常的输出 100 万 TOKEN 是 60 美分，而微调过的版本，因为这个版本只给你一个人用或者只给你一个团队来使用，这个成本就都要你自己来承担，100 万 TOKEN 是 1.2 美金，价格翻了一倍。这就是直接放出来的价格，这就是要抄家了。</p>



<p class="wp-block-paragraph">大家知道Llama3这种东西的微调成本是多少吗？你说自己有显卡啊，或者说我用谷歌的云上，谷歌云上是可以薅羊毛的啊。你是可以免费开一个云主机，快速的调完了把它关掉，这个过程是不用付钱的。咱们不去参考这个价格，咱们看看gather上的价格是什么样的啊。</p>



<p class="wp-block-paragraph">Llama3.18B的模型啊，咱们不要去调那个405B啊，那个东西很贵的。咱们调这个8B的模型，100万TOKEN，10次以内的迭代。因为你微调的时候，它会让你选你到底是调几次，10次以内的迭代，5美金啊，基本上是在同样的价格。所以我也在猜测GPT4O MINI的大小，应该也就是8币9币这样的一个程度，否则的话，这个价格是没法去比对的。</p>



<p class="wp-block-paragraph">因为Llama3.18币啊，输出100万TOKEN的价格大概是0.9美金，微调100万TOKEN的价格是5美金。那GPT四O Mini输出100万TOKEN的价格是0.6美金，微调的话是3美金。当然现在是限免啊。</p>



<p class="wp-block-paragraph">稍微在这里讲一下微调跟RAG之间的差别。以前我们讲了很多跟RAG自我、本地知识库相关的这种知识。那么什么时候上微调，什么时候上RAG呢？举一个简单案例吧，就是现在来了一个新的毕业生。微调相当于什么呢？叫入职培训。你来了以后，我先给你做个入职培训，看到领导要鞠躬，看到客户要说，先说你好，然后呢再给你一个入职手册，先把这东西都背下来。你以后就按照这个方式去工作。微调了以后，这样的版本。</p>



<p class="wp-block-paragraph">我们经过了入职培训以后的版本。你问他相关的问题，就是入职手册写过的问题，他都会对答如流，按对入职手册回答给你，没有任何问题。而且呢，按照你要求的格式来输出。看见领导鞠躬，他会干的。</p>



<p class="wp-block-paragraph">微调有一个问题是什么呢？就是超出手册的东西就没有了，这就是微调干的活。那你说RAG是干什么呢？RAG相当于给你发了一本字典，你随时需要查，随时可以查。说我现在需要查一下这个问题怎么办？那个问题怎么办？你随时在字典里去查。</p>



<p class="wp-block-paragraph">我们一个新员工入职了，比如某位同学大学毕业，到公司上班来了，入职培训要做，对吧？字典也要发。这就是微调跟RAG之间的关系。RAG其实对于OpenAI来说，对于Llama来说没有太大的区别，大家都可以做。但是呢，微调原来GPT这块是要贵很多的，这个模型也贵。你微调了以后，整个微调的过程也都相对来说比较贵。</p>



<p class="wp-block-paragraph">现在，OpenAI就在这一块跟Llama彻底找齐了。你说我们去调那个405B去，其实意义不大。一般微调就是调小模型，你去找一个大模型出来调，这实在太贵了。咱们还是以刚才这个新员工入职的过程来讲微调。你去找一个应届毕业生，让他做新员工入职培训，这个效果是相对来说比较好的。</p>



<p class="wp-block-paragraph">对，我找猎头公司，从别的公司挖一大牛回来，或者我从其他公司挖一CEO回来，让他坐在这给新员工培训，这不扯淡吗？就这样，微调大模型的效果就是这样，又费劲效果还未必好。</p>



<p class="wp-block-paragraph">所以，一般微调都是调小的。那么，OpenAI到底挣不挣钱呢？今天看了一些数据，OpenAI是真的不挣钱啊。前面还有人讲说OpenAI的收入已经很厉害了，今年可以达到30亿美金了。30亿美金的收入对于很多公司来说，是完全可望而不可及的一个数字。作为一个新创建没几年的公司，能够入账30亿美金的收入，这个非常厉害。</p>



<p class="wp-block-paragraph">但是，挣的多，人家花的更多。花了多少钱呢？因为OpenAI不是一个上市公司，所以大家只能去根据各种蛛丝马迹去算它到底花了多少钱。基本上算下来的，它的成本大概是80亿美金，所以它一年亏50亿美金。</p>



<p class="wp-block-paragraph">这80亿美金怎么算出来的呢？每年交给微软的钱就是去买算力的钱，大概是40亿。这个是微软内部的一些人，或者说了解OpenAI向微软付款的一些内部员工透露的，这个数基本认为是靠谱。第二块是什么呢？就是OpenAI还需要购买很多数据，比如说上Reddit里去买数据，包括一些其他的数据集，去购买和清洗加工，这个钱他是要去花的。</p>



<p class="wp-block-paragraph">还有一块的钱是什么呢？人家那么多新员工，对吧？现在有1500人了，而且还在快速扩张，现在还有200个职位开着，准备再接着招人呢，这个也是一大笔钱。所以呢，他现在每年的成本大概在80亿美金左右，而且这个成本还在快速上升之中。你想，他还在疯狂的招人进来，前面还吹了那么多牛皮，还没有抹上呢。你要想把前面吹的牛皮补上，要干嘛？接着开足马力训练大模型啊。</p>



<p class="wp-block-paragraph">Scaling low啊，接着跑啊。我进一步扩大模型的规模，进一步整更多的数据，然后整更多的人回来。而且现在整个行业已经热起来了啊，他这一千几百口的人，那一定得给到比较高的薪水，比较高的这种收益才可以啊，要不然别人会挖人的。全世界都在盯着他的人吧，哪怕是一个街边扫地的。你说我在OpenAI扫过地，那其他人说我把你请回来，是不是多给你点钱啊？OpenAI的人员成本一定是不低的。</p>



<p class="wp-block-paragraph">微软呢，其实已经算是对OpenAI很好了啊，为什么呢？就是微软给OpenAI机房的价格应该是一个成本价，并没有真正的按照微软云的那种啊，对外报价去找OpenAI收钱，已经算是非常非常支持了。销售呢，这个没办法，特别是B端销售，大家都有KPI，谁也不能让着谁。所以微软在B端销售上，包括在Windows客户端的Copilot的这种产品的竞争上，肯定是跟OpenAI有一定的约定的啊。B端销售各打各的，你要能卖掉是你的，我要能卖掉是我的，Windows客户端你别碰啊，这个是我的。</p>



<p class="wp-block-paragraph">所以现在OpenAI只有Mac版的客户端，没有Windows版的客户端啊，那边是留给微软自己家亲儿子Copilot的。作为一个公司来说呢，微软对OpenAI已经是非常非常好了啊，那么对比起Anthropic，OpenAI算是好的。这个玩意叫不患寡而患不均，那你说Anthropic后边是谁？是亚马逊。</p>



<p class="wp-block-paragraph">微软对OpenAI好，这一定要有对比，那就要对比亚马逊对Anthropic 。推理成本肯定是不低的，而且Anthropic 其实并没有跑那么多的大模型。新的模型训练、新的模型的推理没有做这么多，而且用户量也没有OpenAI高。可是呢，以亚马逊找Anthropic 收的钱是不少的。</p>



<p class="wp-block-paragraph">另外一个Anthropic ，如果通过亚马逊云赚到了钱，比如说我把这个产品卖掉了一些弊端的用户买了我的产品，亚马逊是要在里边抽成的。所以Anthropic 跟OpenAI比起来，属于过得更凄惨一点。Anthropic收入的话，大概是OpenAI的1/5。刚才我们讲了OpenAI是30亿美金，它大概有个五六亿美金的样子吧。</p>



<p class="wp-block-paragraph">因为都不是上市公司，所以大家都不会说这个事。亏损也亏，他亏多少呢？亏大概是OpenAI的一半。OpenAI大概亏50亿美金，他亏25亿美金，就是这样的一个比例。所以前面我们也讲过，Anthropic现在也快玩不下去了，玩不下去的话，亚马逊可以落袋为安了。</p>



<p class="wp-block-paragraph">我记得以前有一个故事，电影院想去卖饮料，怎么能够把饮料卖得更多一些呢？我把空调开的小一点，让电影院里稍微热一点，这样我就可以多卖一些饮料出去。看看亚马逊跟Anthropic 之间的故事，是不是有点像这个？当然了，OpenAI现在也很渴，也需要去买饮料喝了，像微软爸爸去买，现在山姆奥特曼的应该正在努力地找钱。</p>



<p class="wp-block-paragraph">愿意给钱的人肯定不少啊，这个不用担心。毕竟是开拓一个新领域里边的老大，那这个时候肯定很多人都愿意给钱。那你说愿意给钱不就没事了吗？拿着钱接着烧呗。不那么容易啊，为什么？因为你要问微软同不同意。微软占49%，给了130多亿美金进来了。你现在再找，说我让苹果给钱啊，苹果愿意给，那微软说不行啊，这个必须排他。</p>



<p class="wp-block-paragraph">像我们以前签很多这样的协议，进去的时候，特别是我成为大股东的时候，一定会有排他条款的，对吧？你让我的竞争对手进去，这事不行啊。微软就是说，我虽然愿意看着你努力成长，但我也更愿意看到你落到我的口袋里，在我这再多买些饮料。我说算了，我卖身给你得了，这个也是微软乐见其成的事情。</p>



<p class="wp-block-paragraph">所以并不是谁的钱他都可以去拿的。一些微软的竞争对手，比如谷歌，比如说苹果是愿意给钱的时候，他就需要做微软的工作，说求求你让他们进来吧，他就会变成这样。那么下一个问题是什么呢？到底估值是什么样的？估值涨到多少，这个事微软才能乐意啊？其实还是跟微软有关。</p>



<p class="wp-block-paragraph">现在OpenAI的估值是860亿美金，这个估值是OpenAI上一次进行内部的股票兑现的时候，或者说一些内部员工股票变现的时候的估值，并不是一个正式的估值。正式的估值的话，我觉得他现在有个大概两三百亿应该是合理的。嫁一个人进来，到底按什么样的估值进去，这个就很难去平衡。为什么？因为这个数已经很大了。嫁一个人，你说我为什么进去，投资这样的公司的目的。</p>



<p class="wp-block-paragraph">一定是说你以后能够长得更高啊。然后呢，你去上市，我能够啊，多少倍啊，能够退出，至少是3-5倍能够退出，因为这么高的估值嘛，承担这么高的风险，一定希望能够尽快的按更高的倍数退出。现在已经是两三千亿了，你再往上翻这个数就不好翻了。而且如果真的是几千亿的估值，又拿了钱了，你上市怎么办？股市能不能支撑得住这样的公司？几千亿美金的公司上市，还是有一些难度的。</p>



<p class="wp-block-paragraph">像AM上去，也就是几百亿上去，虽然上去了以后快速在增长，但是你说我直接就是按照几千亿，没准这一轮再上去了以后，大家就希望他上1万亿美金去上市。这个纽交所也好，纳萨克也好，虽然是注册制，只要是你提交的申请文件符合格式，你就可以去上市。但是这些地方啊，这些基金们啊，因为所有的美股大量的都是基金盘，很多基金经理会去看你这个产品到底值不值这么多钱，所以这个事对于所有人来说都是很有压力的。</p>



<p class="wp-block-paragraph">那么现在怎么办呢？比当前的估值直接上市也许就是唯一的解决方案了。坚持到年底，Open I的业绩还是有爆发的可能性的。于现在，大家虽然预估他一年挣三十几亿美金，这事儿是怎么算出来的呢？是他每个月大概能挣到两点几亿美金，这两点几亿美金里头大概2亿美金，是他去卖那个20美金一个月的Plus的费用，在七八千万美金吧，是卖API的费用啊。他是这样来算的。那么，为什么到年底的时候会业绩大爆发呢？咱们想一想，9月份会发生什么大事情？9月份iPhone 16发布。</p>



<p class="wp-block-paragraph">iPhone 16如果发布了，虽然它的成本会进一步上升，因为所有用iPhone的至少在国外吧，就可以去访问GPT-4了。但是，另外一方面，这些用户会大批量地转换成OpenAI Plus用户。那么它的收入也会爆炸式增长一下。所以到今年年底，还可以再大涨一波。</p>



<p class="wp-block-paragraph">苹果算是OpenAI的一个救命稻草。如果它能够坚持到年底，数据再大涨一波，为所有的股民展示一下未来美好的前景，然后直接去上市，这个事还是有得救的。现在行业的心态肯定也是很矛盾的，竞争跟追赶这是必须的。甭管是谷歌、ISOPEC还是梅塔，都是在努力的竞争与追赶。但是谁也承担不起一个后果，就是老大倒下。</p>



<p class="wp-block-paragraph">这是一个全新的行业，在全新的行业里头，一旦老大倒了，对于整个行业来说都是巨大的打击。每次开新行业的时候，有几件事是比较害怕的。第一是老大废了，一旦老大废了以后，就相当于是老大证明了跑得最快的人没跑出来，拼命往前跑，跑到头上是一条死路，撞在墙上，磕地上了。那后边紧追不舍的人该咋办，这事是很危险的。</p>



<p class="wp-block-paragraph">另外一个是什么呢，就是老大上市了。上市了以后，发现业绩一般，因为大家一般在上市之前会冲业绩嘛。上市了以后，你要公布财报，很多东西变成公开透明了。那么下面的人也会觉得很危险。这就是一个新行业的宿命，至少要验证行业有未来。在这之前，老大是不能倒下的。如果说没有验证，直接就趴下了。</p>



<p class="wp-block-paragraph">那么，整个行业都很麻烦啊。开天辟地的这种新行业，肯定都是非常困难的。这个呢，分几种情况。</p>



<p class="wp-block-paragraph">第一种情况叫大企业开创新市场。举一个案例，比如说亚马逊，开创云计算这个新市场。这就是大企业开创新市场。但是，亚马逊也很痛苦。在开始的很长一段时间里，顶着非常大的压力，再往前走，也是用了好几年的时间，才慢慢地验证了说，云计算这个市场是一个真正的方向，大家要去向这个方向前进。这是大企业开创新方向。</p>



<p class="wp-block-paragraph">当然，也有走得不是那么好的例子。比如说，Meta做的元宇宙，原来叫Facebook，后来改名叫Meta。他去做元宇宙这件事呢，就不是那么好。一直到现在，虽然名字还没改回来，但他得挂在那，挂上了还没有死掉。可是，他挂在那，所有人看着。在这么大一只半死不活的尸体挂在这个枝头上，所有人在想去做元宇宙的时候，都要稍微掂量掂量。而且，现在这个枝头上，还挂了另外一颗叫Vision Pro的东西，也挂在那了。在剩下的人就在这看着，在下面驻足观望，再也没有人敢往上冲了。这就是大企业开创的两种结果：坚持到底能够成功，或者跨在上面挂着。</p>



<p class="wp-block-paragraph">那么，小公司开创新天地是什么样的呢？比如说，特斯拉、SpaceX，都是一开始的小公司。马斯克冲上来说，我要开创新天地了，开创一个新赛道出来。那是什么？就是耐心的，经历很长时间的亏损，十几年的亏损，不停地融钱，所有人都不看好，独自前行，慢慢把这个项目做起来。那你说，再举个失败的例子。</p>



<p class="wp-block-paragraph">失败的例子没有啊。那么是不是小企业开创新天地就都能成功？错了，你只能看到成功的，剩下的全都不见了。我们没有机会看到，所以小企业开创新天地，我们只能看到幸存者。这是一种幸存者偏差。那你说一群人一拥而上，大家看好了方向，大家全上。这种事呢，通常是发生在商业模式创新上。如果是技术创新的话，这个机会不是特别大。</p>



<p class="wp-block-paragraph">这种方式呢，也有成功的。你比如像国内的千团大战，最后就跑出了像美团这样的公司；滴滴共享单车大战，最后也是跑出来一些结果，是有能成功的案例的。但是呢，也有一些最后失败的，比如像刚才咱们讲的VR，所有人都冲，最后什么也没剩下。</p>



<p class="wp-block-paragraph">现在的OpenAI呢，有点儿是骑虎难下的状态。按道理说呢，它应该是小公司，独自慢慢发展。但是它一下把这个热度炒太高了，现在搞成什么了？现在搞成一群人一拥而上了。这种乱拳打死老师傅的状态呢，一定是最危险的。</p>



<p class="wp-block-paragraph">所以为了稳住阵脚，现在OpenAI必须拿出重量级的拳头产品出来，也就是咱们开篇时候讲的GPT-5，一定要拿出这种产品。如果在今年年底之前GPT-5还出不来的话，它的老大位置真的是危险了。而且它一旦倒下的话，可能整个行业都要至少颤三颤。不能说整个行业会为它陪葬，但颤抖一下是跑不了的。</p>



<p class="wp-block-paragraph">好，这一期就讲到这里。感谢大家收听，请帮忙点赞，点小铃铛，参加Discord讨论群。也欢迎有兴趣有能力的朋友加入我们的付费频道，再见。</p>
]]></content:encoded>
					
		
		
			</item>
	</channel>
</rss>
