<?xml version="1.0" encoding="UTF-8"?><rss version="2.0"
	xmlns:content="http://purl.org/rss/1.0/modules/content/"
	xmlns:wfw="http://wellformedweb.org/CommentAPI/"
	xmlns:dc="http://purl.org/dc/elements/1.1/"
	xmlns:atom="http://www.w3.org/2005/Atom"
	xmlns:sy="http://purl.org/rss/1.0/modules/syndication/"
	xmlns:slash="http://purl.org/rss/1.0/modules/slash/"
	>

<channel>
	<title>付费用户 &#8211; 老范讲故事｜AI、大模型与商业世界的故事</title>
	<atom:link href="https://lukefan.com/tag/%e4%bb%98%e8%b4%b9%e7%94%a8%e6%88%b7/feed/" rel="self" type="application/rss+xml" />
	<link>https://lukefan.com</link>
	<description>这里是老范讲故事的主站，持续更新 AIGC、大模型、互联网平台、商业冲突与资本市场观察，帮你看清热点背后的底层逻辑。</description>
	<lastBuildDate>Tue, 15 Oct 2024 01:29:50 +0000</lastBuildDate>
	<language>zh-Hans</language>
	<sy:updatePeriod>
	hourly	</sy:updatePeriod>
	<sy:updateFrequency>
	1	</sy:updateFrequency>
	<generator>https://wordpress.org/?v=6.9.4</generator>

<image>
	<url>https://lukefan.com/wp-content/uploads/2026/03/cropped-jimeng-2026-02-28-5245-用图一的人物形象，替换图二中的人物，使用图二的风格。文字替换：老范讲故事，Yo-32x32.jpeg</url>
	<title>付费用户 &#8211; 老范讲故事｜AI、大模型与商业世界的故事</title>
	<link>https://lukefan.com</link>
	<width>32</width>
	<height>32</height>
</image> 
	<item>
		<title>OpenAI完成超募融资，未来发展方向是否陷入停滞？</title>
		<link>https://lukefan.com/2024/10/15/openai%e5%ae%8c%e6%88%90%e8%b6%85%e5%8b%9f%e8%9e%8d%e8%b5%84%ef%bc%8c%e6%9c%aa%e6%9d%a5%e5%8f%91%e5%b1%95%e6%96%b9%e5%90%91%e6%98%af%e5%90%a6%e9%99%b7%e5%85%a5%e5%81%9c%e6%bb%9e%ef%bc%9f/</link>
		
		<dc:creator><![CDATA[Luke Fan]]></dc:creator>
		<pubDate>Tue, 15 Oct 2024 01:29:43 +0000</pubDate>
				<category><![CDATA[AIGC]]></category>
		<category><![CDATA[AI Agent]]></category>
		<category><![CDATA[AIGC泡沫]]></category>
		<category><![CDATA[AI技术发展]]></category>
		<category><![CDATA[Anthropic]]></category>
		<category><![CDATA[API价格]]></category>
		<category><![CDATA[API开发]]></category>
		<category><![CDATA[Apple Intelligence]]></category>
		<category><![CDATA[Canvas]]></category>
		<category><![CDATA[Cloud Artifacts]]></category>
		<category><![CDATA[GPT-4o]]></category>
		<category><![CDATA[iPhone 16]]></category>
		<category><![CDATA[OpenAI融资]]></category>
		<category><![CDATA[Real Time API]]></category>
		<category><![CDATA[Sora世界模型]]></category>
		<category><![CDATA[不竞争条款]]></category>
		<category><![CDATA[亏损]]></category>
		<category><![CDATA[交通标识识别]]></category>
		<category><![CDATA[付费用户]]></category>
		<category><![CDATA[代码编辑]]></category>
		<category><![CDATA[使用案例]]></category>
		<category><![CDATA[兴盛资本]]></category>
		<category><![CDATA[创新停滞]]></category>
		<category><![CDATA[商业战略]]></category>
		<category><![CDATA[商业模式]]></category>
		<category><![CDATA[多人协作]]></category>
		<category><![CDATA[多人协作平台]]></category>
		<category><![CDATA[客服应用]]></category>
		<category><![CDATA[小模型]]></category>
		<category><![CDATA[市场竞争]]></category>
		<category><![CDATA[开发者日]]></category>
		<category><![CDATA[微软]]></category>
		<category><![CDATA[技术发布]]></category>
		<category><![CDATA[投后估值]]></category>
		<category><![CDATA[投资分配]]></category>
		<category><![CDATA[投资退出]]></category>
		<category><![CDATA[提示词缓存]]></category>
		<category><![CDATA[收入增长]]></category>
		<category><![CDATA[政府合作]]></category>
		<category><![CDATA[数据增长]]></category>
		<category><![CDATA[文档处理]]></category>
		<category><![CDATA[月活用户]]></category>
		<category><![CDATA[期权池]]></category>
		<category><![CDATA[未来预测]]></category>
		<category><![CDATA[机器学习]]></category>
		<category><![CDATA[模型蒸馏]]></category>
		<category><![CDATA[涨价策略]]></category>
		<category><![CDATA[特殊目的载体]]></category>
		<category><![CDATA[用户体验]]></category>
		<category><![CDATA[盈利模式]]></category>
		<category><![CDATA[红杉]]></category>
		<category><![CDATA[编程开发]]></category>
		<category><![CDATA[股权激励]]></category>
		<category><![CDATA[苹果]]></category>
		<category><![CDATA[行业创新]]></category>
		<category><![CDATA[行业前景]]></category>
		<category><![CDATA[行业影响]]></category>
		<category><![CDATA[行业挑战]]></category>
		<category><![CDATA[行业衰退]]></category>
		<category><![CDATA[视觉微调]]></category>
		<category><![CDATA[认股权证]]></category>
		<category><![CDATA[语言学习]]></category>
		<category><![CDATA[语音识别]]></category>
		<category><![CDATA[财务预测]]></category>
		<category><![CDATA[超募]]></category>
		<category><![CDATA[软银]]></category>
		<category><![CDATA[领投方特权]]></category>
		<category><![CDATA[马斯克XAI]]></category>
		<guid isPermaLink="false">https://lukefan.com/?p=1622</guid>

					<description><![CDATA[这篇文章详细介绍了OpenAI最近完成的超募融资，从原计划的65亿美金增加到66亿美金，投后估值达到1,570亿美金。文章深入探讨了各大投资方的出资情况，包括兴盛资本、微软和软银的详细出资额及其特权。此外，文章还分析了OpenAI在开发者日上发布的最新技术，如Real Time API、提示词缓存和视觉微调技术，以及这些技术对行业的潜在影响。最后，文章对OpenAI未来的发展方向和可能面临的挑战进行了预测，尤其是其在提高收入和与政府合作方面的策略。关键词包括：OpenAI融资、超募、期权池、领投方特权、Real Time API、提示词缓存、视觉微调、开发者日、兴盛资本、微软、软银、AI技术发展、行业影响。

家人们！OpenAI 融资 66 亿美金后，终于官宣结束啦！🎉🎉🎉 本以为开发者大会会放个大招，结果... 就这？？？😭😭😭

**我真的破防了！** 说好的AGI革命呢？说好的改变世界呢？怎么感觉 OpenAI 现在只想躺着数钱啊！💔💔💔

**先来扒一扒这次融资的瓜！** 🍉🍉🍉 OpenAI 原本只想募资 65 亿美金，结果超募了 1 个亿！估值更是高达 1570 亿美金！🤯🤯🤯 领投方兴盛资本为了它，又是自掏腰包，又是搞特殊目的载体，还搞了个“对赌协议”，也是拼了老命了！

**再来看这次开发者大会，我真的无力吐槽！** 就发布了几个新功能，还都是别人玩剩下的！模型蒸馏、视觉微调... 就这？就这？就这？🙄🙄🙄

**更过分的是，OpenAI 还准备涨价！** 月费要从 20 美金涨到 44 美金！你咋不去抢钱啊？！🤬🤬🤬

**以前那个一心想要改变世界的 OpenAI 去哪儿了？** 现在满脑子都是怎么赚钱，怎么跟政府合作... 哎，老大一旦摆烂，整个行业都要遭殃啊！😭😭😭

**不过，事情也不是完全没有转机！** OpenAI 不思进取，说不定 AI agent 的机会就来了！💪💪💪 让我们一起期待更开放、更有活力的 AI 生态吧！🔥🔥🔥]]></description>
										<content:encoded><![CDATA[
<figure class="wp-block-embed is-type-video is-provider-youtube wp-block-embed-youtube wp-embed-aspect-16-9 wp-has-aspect-ratio"><div class="wp-block-embed__wrapper">
<iframe title="OpenAI完成超募融资，未来发展方向是否陷入停滞？" width="900" height="506" src="https://www.youtube.com/embed/mPZ5dRVVlLw?feature=oembed" frameborder="0" allow="accelerometer; autoplay; clipboard-write; encrypted-media; gyroscope; picture-in-picture; web-share" referrerpolicy="strict-origin-when-cross-origin" allowfullscreen></iframe>
</div></figure>



<p>我们开始第二个故事。OpenAI完成融资，开始摆烂了吗？Day Dev Day都发了些什么奇怪的东西呢？</p>



<p>首先，官宣已经完成这轮融资了，是在9月底这几天官宣的。现在呢，他是实现了超募。什么叫超募？就是我原来说要募多少钱，但实际上得到的钱比这个多，就叫超募啊。他原来说我要募65亿美金，现在实际上是66亿美金，就是多1亿。也是募投后的估值，原来说的是1,500亿，但其实我相信那个数是错的。原来那1,500亿美金应该是投前估值。他现在结束这一轮投资以后的投后估值是1,570亿，所以呢，实际上多了70亿。</p>



<p>那你说怎么会多出70亿出来呢？这个很奇怪，你明明投了66亿，那多出4亿是什么来呢？这个呢大概率是期权池。做这种投资案的时候啊，如果你投前估值是1,500亿，那么投了66亿美金进去以后呢，他的投后估值一般应该是1,566亿。多出4亿来是会做一些其他处理。</p>



<span id="more-1622"></span>



<p>那你说如果是4亿美金的期权池，是占多少股份呢？期权池是0.255%。跟传闻中山姆·奥特曼要拿到的7%的股份比，这个事肯定是不匹配的。因为7%的股份如果在1,570亿里头的话，那是109.9亿美金，那是百亿美金富豪了。所以呢，这个具体怎么分配的，多出来的4亿现在并没有公布出来。</p>



<p>那么各家出了多少钱呢？领投方叫兴盛资本，多出了3亿美金。他原来说我出不少于10亿美金，现在一共出了13亿美金。但是呢，他这个特别有意思啊，他自己出了7.5亿美金，叫自有资金。然后呢，发行了一个叫特别目的载体，这个实际上就是说我现在发现一只小基金，这个小基金呢就是为了去投资OpenAI的。谁愿意上来，谁就在这只小基金里头放钱。这个小基金呢是募了4.5亿，所以这两个加一块13亿啊，这是这个领投方给的。</p>



<p>领投方呢还得到了一个特权，一般领投方都会给自己弹一点点特权出来。这个特权叫什么呢？叫Warrant，是认股权证。这个东西干嘛使了呢？实际上是个对赌协议，但是呢，这是一个正向的对赌协议。它规定到明年2025年，如果OpenAI实现了预期收入116亿美金的话，它可以再以1,500亿美金的估值再投10亿美金进去。</p>



<p>这个是一个什么样的权利呢？跟大家解释一下，OpenAI这样的一个公司，从2023年拿到上一轮融资，它的估值是300亿美金，到现在2024年10月拿到这一轮融资以后，达到了1,500亿美金。所以他的估值涨得是非常快的。<br>现在呢，能够达到1,500亿美金，肯定是做了一些这种承诺，说我今年挣多少钱，明年挣多少钱，后年挣多少钱。这叫财务预测。现在这个领投方说，你这个财务预测如果准了，那你要允许我再以1,500亿美金的估值再投10亿美金去。那可能过了一年以后，OpenAI的估值就已经到3,000亿美金，甚至5,000亿美金了。这种可能性都是存在的，但是你还是要让我用1,500亿美金的估值再往里投。这个东西叫认股权证。</p>



<p>很多的金融机构都喜欢干这件事情，就是说：“哎，我先谈一个价格，然后呢，也投一点钱，但是呢，我们来对赌。如果你实现了，我按当时的价格再投一步。”我以前所在的公司融资的时候，遇到过一次那种认股权证的交易。其实我们自己做早期投资，一般很少干这个事，只有是后期投资才会干这个事情。</p>



<p>当时我们遇到了谁呢？这个投资方叫做硅谷银行，就是后来倒闭了。这个硅谷银行，他呢，当时进来说：“我们也不投资你，我们借钱给你。你可以在我们贷款，而且没有抵押，也没有任何其他的担保。你就可以直接在我这借钱了。”但是呢，借钱的这个协议后，是带一个Warrant的条款的，就是要在五年以后，按照当时我们融资的那个价格，再进来百分之零点几的股份。那其实就很赚了吧，可能五年以后我们都上市了，可能都已经十几亿美金了，那他要按着一个五年前的价格再进来一点点。</p>



<p>这个是以前我们遇到过的，这个是领投方。第二个呢是微软。微软呢是给了7.5亿美金，还是49%。所以跟我上一个礼拜去讲的这个是一致的。就是微软其实动用的叫反稀释权，就是我原来占49%，我以后还占49%。那么差的这部分我给它补上就完了。他补了7.5亿美金，他还占49%。然后软银是第一次进来给了5亿美金，其他的参投方没有公布具体的金额，就是还有一些其他的基金，我们就不再去讲。</p>



<p>然后呢，还做了一些限制性的条款。这个限制性条款特别有意思啊，第一个2.5亿美金起投。如果你少于2.5亿美金，就别参与了。所以任何一个参投方应该都是多于2.5亿美金的。那你说我这没有2.5亿美金，我就有这个100万美金，我想投这个案子行不行？也不是不行，那你又怎么投进去呢？你去参加领投方的那个特殊目的载体，他这个基金里，你就可以转投到这个融资里边，够2.5亿美金了，你可以上桌来跟我谈这个事情。</p>



<p>再往后呢，是叫不竞争条款。这个其实也是比较奇葩的一个条款，通常呢会要求被投资方要做不竞争条款。什么意思啊……<br>比如说，有一个公司投了一个什么什么项目，那么你这个被投的项目，你不能跟母公司竞争，一般有这样的条款。但这次是反过来的，是要求投资方不可以跟OpenAI竞争，也不可以投资OpenAI的竞争对手。这个确实是有点奇葩，这也是说OpenAI自己太强势了。所以呢，他提出这样的条款以后，剩下的这些投资方都认可这个条款，在上面签字了。</p>



<p>现在所谓的不得投资OpenAI的竞争对手，主要指的是马斯克的XAI和Anthropic这两个公司。那么在这种情况下，红杉跟苹果最后就拒绝签字，表示我们不投了，这事我不玩了。为什么会出现这样的情况呢？一方面，可能是因为不满足前面的领投方特权，特别像苹果，肯定是希望有这种领投方特权的。待会讲为什么。另一个原因是没法去接受这种不竞争条款。红杉这样的公司，估计XAI也好，Anthropic也好，他们应该都投了。以后这些公司再融资的时候，至少要去处理这个反稀释条款，他们也得跟投。一旦投资了OpenAI的这一轮，签了字以后，就没法再去在XAI和Anthropic里边去追加了，所以他也没法接受这种条款，只能退出了。</p>



<p>那么OpenAI这一轮融资呢，是画了很大的大饼，在收入和数据上。第一个，现在他讲述我已经有3.5亿的月活了，这是非常非常大的一个数字。当然，这个数字应该还会大涨，为什么？因为iPhone 16发布了，Apple Intelligence来了，可以把这个数字再翻一翻。这是怎么算的呢？2023年苹果卖了2.35亿只iPhone，2023年里卖的是iPhone 15、iPhone 15 Pro、iPhone 15 Pro Max这些机型。其中iPhone 15的Pro和Pro Max都是可以使用Apple Intelligence的，加上2024年销售的iPhone 16，都是全系可以使用Apple Intelligence的。所以基本上可以认为，苹果现在可以使用Apple Intelligence的这些机型，去掉中国大陆用户和OpenAI重叠部分的话，再涨出3.5亿来，应该是一个相对合理的猜测。所以，它能够达到7亿左右的月活，在苹果进入之后。</p>



<p>所以，为什么我前面讲说苹果应该得到这个领投方特权，因为它要想让数据继续上升，那苹果在里头一定是功不可没的。后面的话，苹果没有参与这一轮投资。<br>所以后面，苹果上面继续使用OpenAI的GPT-4O这样的方案，可能就会受到一定的阻碍，有可能会转向。因为苹果原来讲说，我们除了OpenAI之外，我们也在考虑谷歌的，也没准在往后一段时间，真正的全线的Apple Intelligence上来以后，谷歌的服务也会加进来，这个可能性是很大的。</p>



<p>因为在整个这一个协议里边，苹果其实是亏大了。就是苹果如果给了钱，然后把它这个数据做上去，拿到这个领投方特权的话，苹果是能挣到很大一笔钱的。如果OpenAI以后能够放开中国用户的话，那它在原来这个基础上可以再长根，可能1亿多用户出来都是有可能的。</p>



<p>这个是OpenAI的数据，现在有多少人在付费呢？一个月20美金在订这个OpenAI的服务呢？1,000万付费用户。当然苹果加入以后，可能这个数字还能够再翻一翻，甚至更多一些。</p>



<p>现在有多少人在使用API在写程序呢？100万第三方开发者在使用OpenAI的API，再用这样的方式来付费。所以这个数据其实已经是非常好了。今年的收入是37亿美金，但是在今年亏损了50亿美金啊。这个50亿美金的亏损，还没有计算上股权激励计划。</p>



<p>大家说股权激励计划我又没发钱出去，怎么就亏了呢？所有股权激励计划就是你承诺给员工的，这个他未来是会去卖的啊，这个就还是应该把它算成一个成本。像我们以前有一次，有一年是怎么干的，就是公司实在没利润了，就直接把大量已经离职员工的期权注销掉，然后公司就有利润了，就直接可以到纽交所去录盈利了。这是他们比较会玩的一个方法吧。</p>



<p>今年37亿收入，明年呢是116亿美元的收入。如果明年实现了这个，前面的领投方还会再给10亿美金。然后后年呢，要做到256亿美元的收入，到2029年，准备做到1,000亿美元的收入，这个也是很大的收入进来啊。1,000亿美元一年的收入相当于谁啊？相当于Target和雀巢。</p>



<p>但是这个里头，Target的市值就比较低，只有700亿美金不到，雀巢的市值是比较高的，大概到2,800亿美金。但是你想，现在这个1,500亿美金的OpenAI，它一年的收入才三十几亿美金。所以为什么互联网公司或者人工智能公司，所有新科技公司的PE的倍数都很高啊，大家可以去想一想。这还不用算PE，因为没法算PE，它的盈利是负的，他只能算PS。</p>



<p>那么OpenAI准备怎么提高收入呢？很简单啊，涨价，这刚才我们讲的，第一个是用户量会上升。<br>第二个呢，是说我们的涨价，到年底就准备涨到22美金一个月了。准备在五年之内，把每个月的月费涨到44美金一个月，并没有涨到200美金一个月。到这呢，就是他们把这一次的融资彻底算做完了，已经正式官宣结束了。官宣结束了以后呢，就开始躺平摆烂了。</p>



<p>因为在十月一号刚刚开的开发者日，这个Open AI就是我们就躺在这不动了。十月一号在旧金山，10月30号准备在伦敦，11月21号准备在新加坡开Open AI的开发者日。这一次在旧金山的开发者日上呢，到底有多少人到现场，可能有100多人，反正人不多。预定了100份草莓，因为他们是在现场使用Open AI的API的技术，直接定了100份草莓给现场分发。所以啊，我们猜测现场的人并不是很多。</p>



<p>那么这一次到底发布了什么呢？第一个东西叫Real Time API。因为大家知道，GPT-4O有一个叫高级语音功能，最近是都可以用了吧，可以跟他聊天，效果还是非常不错的。这个产品现在就有API出来了，这个API呢叫实时API。它呢是等于可以随机的打断，而且在整个的开发过程中，会变得很简单。因为以前我们要想开发这种语言教学类的应用的话，必须是先识别，然后再进行处理，处理完了以后，再去进行朗读。而现在你使用Real Time API了，就可以一次性把语音给它，它就处理完了，然后一次性把语音给你输出出来，这个效果就会好很多啊。这是第一个发布的东西，而且这个东西呢，在语言学习、客服类里头会有极其广泛的应用，只是这个玩意儿很贵，它的API的价格是非常昂贵的。</p>



<p>第二个发布的东西呢，叫提示词缓存。什么意思呢？大家知道我们跟Open AI或者跟China CPT聊天的时候，它是怎么聊的吗？你聊的第一句给你一个回复，等你聊第二句的时候呢，你聊的第一句跟第一个回复，就作为下一次提示词一起都扔上去。等于我们在调用的时候，是第一个问题、第一个回复加上第二个问题一起扔上去，才能得到聊天的结果。在这样的情况下，你不是越聊聊的时间越长，这个提示词就累加的越来越多嘛。所以呢，现在Open AI说，那咱们少少了搞一点吧，把提示词缓存在云端，你就不用来回提交了啊。但是呢，并不是说这个钱就不用交了。原来Open AI的输入输出的价格是不一样的，一般输入的TOKEN是要便宜很多的，输出的TOKEN要变贵。现在呢，这些输入TOKEN，特别是重复的部分，你就不用再给他了。<br>都放在服务端就完事了。所以说这些TOKEN啊，你按五折给钱吧。原来比如说是100万TOKEN一美金的，现在你给50美分就可以了。反而我觉得降价降的不够多啊。这是第二个提示词缓存。第三个给的是什么呢？叫模型蒸馏技术。模型蒸馏是什么呢？就是可以把大模型生成和过滤一些内容，再把这些内容去蒸馏出一些适应特定场景的小模型来。这个呢应该是奔着封杀拉玛去的，并没有模型广场或者市场出来。按道理说，大家争流出一堆小模型来，你应该有一个地方拿来卖呀。但这次没错啊，OpenAI看来也确实发现了自己并不擅长干这个事情。</p>



<p>再往后呢，第四个出来的东西，也就是最后一样东西，是什么叫视觉微调。做了这么一奇怪的一个东西，这是干嘛呢？就是刚才我们讲了，OpenAI是可以允许我们去微调它的这种线上模型的，现在也允许我们用图片再去做微调了。可以输入提示词和图片，对视频模型进行一定的微调，也是对开源模型去的。因为现在我们使用Lama 3加上其他的一些模型，也可以直接实现这种视频微调。现在他准备去把这一条路也封死掉。</p>



<p>Grab就是东南亚打车软件，是第一个使用这个视觉微调技术的公司，做了一个demo，主要是干嘛呢？识别交通标识。这有可能是对着马斯克的FSD去的，给FSD添堵去了。</p>



<p>那这一次发布为什么说摆烂了呢？第一个是没有任何新模型出来，也没有任何新的方向出来。说我们又可以有些原来做不了的事，现在可以做了，都没有。这里头唯一可能稍微新一点的东西，就是实时API。其他的呢，其实都是别人已经做好的东西，他要上去给人家添堵，或者去跟人竞争用的东西。</p>



<p>开发者日里边，开发者真正关心的是什么？真正想看到的是什么呢？就是新的开发方向，原来做不了的事情你能做了。而real-time API是原来做不了的，现在能做了。但是其他的，比如说模型蒸馏、视觉微调，其实都没有新的功能，都是在跟拉玛竞争。</p>



<p>另外呢，开发者希望能够看到新的商业模式，这次完全没有。开发者希望看到一个东西，提速降费。因为大家知道，调用OpenAI的API是有速限制的，你不能调太多，也希望每一次调用可以便宜一点。这一次整个的发布的所有产品里头，只有提示词缓存算是变相的降价，但降的也不够彻底。我的提示词都已经在服务端了，你还是要找我收钱，只是收的比原来便宜而已。提速完全没提，成功故事也是开发者希望看到的东西，这一次只有两个成功故事。<br>一个就是现场吃到草莓了，因为现场呢使用 Realtime API 做了一个应用，直接去呼叫“请给我送草莓来”，订了一份外卖出来。另一个成功故事就是 Grab 进行交通标志的识别。</p>



<p>那你说去年的 Dev Day 发布什么东西？是不是这个 Dev Day 都是发布这种东西呢？咱们看看去年啊，第一个去年发布的是 GPT-4 Turbo，有新模型出来。然后第二个呢是去年发布了 GPTS，发布了 GPTS 商店，就是大家可以自己去做自己定制的 GPT，这也算是有一个新的商业模式，新的流量在赋能进来，就是 GPT 商店。很遗憾啊，GPTS 商店现在基本上烂尾了。</p>



<p>还有一个叫 Assistance API，是协助很多开发者开发自己的这种聊天机器人的，但这个现在好像也没有听到什么响动。然后达利 3 的 API 出来了，就是可以拿它去画图了，这个呢现在应该有人用，但是应该不多。在画图这一块上，我觉得 OpenAI 跟 Midjourney 和最新的 Flux 的竞争上，不是特别占优势。然后是 Audio API，也就是语音转文字、文字转语音，这些 API 是去年开发者日上发布的。</p>



<p>然后做了这个叫 Copyright Shield，就是对版权进行音乐的保护，还给出了用户模型计划，也就是让用户自己训练和建立自己的模型。做了 Vaspers 这个 Large V3，也就是这种语音识别模型的第三个版本，也对 GPT 进行了提速。这是去年做的，所以我说他今年呢基本上是摆烂了，给的东西非常少，反而融资已经结束了，咱们就再接着折腾就完了。</p>



<p>而且啊，按照苹果和红杉透露出的这些信息，OpenAI 在明年应该还要再融一次钱，因为他现在融到的 60 多亿美金应该不够他花的。明年如果不再融一次的话，他还是会死，所以这个也是很多人觉得很危险。</p>



<p>另外呢，今天早上还突然上线了一个产品，叫 GPT-4O with Canvas。这个东西呢，其实是有点像 Cloud 出的叫 Artifacts，一面是输出框，一面是输入框，另外一面是编辑的代码或者文档，你可以在两边同时进行处理，而且呢可以进行多人协作。GPT-4O with Canvas 这个东西呢，从用户体验上说一定是有提升的，但从模型本身来说，并没有什么大的改变。在现在的这样的一个时代，很多人都在去讨论说，唉，OpenAI 如果不行的话，是不是 AIGC 的泡沫就破掉了，是不是出问题了？这个呢肯定是会有一定问题的。<br>有可能会有一定的泡沫在里头啊。老大一旦摆烂，行业就会衰退啊，这个是非常危险的。现在OpenAI融资之前出的是GPT-01，融资以后就马上不一样了。就跟很多那个什么似的，结婚之前，甭管是男方还是女方，都是表现得很好。一旦结婚了以后，发现哎，都摆烂了。这个是我们原来谈恋爱的男朋友女朋友吗？好像就不是那么回事的那种感觉。</p>



<p>OpenAI这一次就没有给出任何新方向，而且前面挖的很多坑，到现在也没有填上。包括他的Sora的世界模型，就是做视频的一个模型，到现在也没出来。还有很多他们说要去做的事情，到现在都没有做出来。现在呢，OpenAI其实已经开始思考如何在现有的体系下挣钱了。这个其实是很危险的，因为呢，如果没有真正找到新的盈利模式，只想着在现在这个收年费的方式上去涨价，这种挣钱方式不是整个行业希望看到的。整个行业还是希望他能够给AI领域带来一些不同的商业模式。</p>



<p>现在OpenAI想干的事情就是，第一个涨价；第二个呢，跟政府合作。OpenAI要跟美国政府以及比较友好的一些政府直接进行合作。山姆·奥特曼也确实有一点点的这种政客的属性吧。那么老大的职责，肯定不应该是小富即安，而应该是为整个行业寻找方向。现在呢，OpenAI在老大这个位置上已经有点越来越怎么说呢，不那么合格的一个状态了。咱们还要看看未来到底是向哪个方向发展。</p>



<p>如果OpenAI就站在那不动了，可能到2025年就是AI agent都要爆发了。因为原来大家不太敢在AI agent上做过度投入的一个核心原因，是害怕OpenAI自己突然爆发，然后把AI agent所有的东西都给覆盖掉。如果OpenAI自己就站着站着了，后边涨涨价，然后就这么着了，可能围绕AI周边的各种创业和应用就会大量冒出来。不会说我做完了以后，哎，OpenAI1升级发现已经被干掉了。这个怎么说呢，也算是对行业的一个小利好吧。但是没有新方向的话，对于整个行业来说还是很危险的。</p>



<p>好啊，这就是我们今天讲的第二个故事，就是OpenAI终于完成了融资，融资完成了以后就开始摆烂，这样的一个故事啊。</p>
]]></content:encoded>
					
		
		
			</item>
		<item>
		<title>Open AI 免费GPT4大放送，苹果WWDC翻车预警？</title>
		<link>https://lukefan.com/2024/06/04/open-ai-%e5%85%8d%e8%b4%b9gpt4%e5%a4%a7%e6%94%be%e9%80%81%ef%bc%8c%e8%8b%b9%e6%9e%9cwwdc%e7%bf%bb%e8%bd%a6%e9%a2%84%e8%ad%a6%ef%bc%9f/</link>
		
		<dc:creator><![CDATA[Luke Fan]]></dc:creator>
		<pubDate>Tue, 04 Jun 2024 00:50:30 +0000</pubDate>
				<category><![CDATA[AIGC]]></category>
		<category><![CDATA[AI]]></category>
		<category><![CDATA[AI芯片自主研发]]></category>
		<category><![CDATA[AMD]]></category>
		<category><![CDATA[DC新动向]]></category>
		<category><![CDATA[Gemini]]></category>
		<category><![CDATA[GPT Plus]]></category>
		<category><![CDATA[GPT-4]]></category>
		<category><![CDATA[GPT-4o]]></category>
		<category><![CDATA[GPT-6]]></category>
		<category><![CDATA[GPT4]]></category>
		<category><![CDATA[GPTS]]></category>
		<category><![CDATA[GPU]]></category>
		<category><![CDATA[H100]]></category>
		<category><![CDATA[H100算力卡]]></category>
		<category><![CDATA[iOS 18]]></category>
		<category><![CDATA[iOS18]]></category>
		<category><![CDATA[iPadOS18]]></category>
		<category><![CDATA[M2 Ultra]]></category>
		<category><![CDATA[M2Ultra性能]]></category>
		<category><![CDATA[Mac Studio]]></category>
		<category><![CDATA[MRUltra芯片应用]]></category>
		<category><![CDATA[OpenAI]]></category>
		<category><![CDATA[Siri]]></category>
		<category><![CDATA[TOKEN收费]]></category>
		<category><![CDATA[WWDC]]></category>
		<category><![CDATA[WWDC2024展望]]></category>
		<category><![CDATA[中国市场]]></category>
		<category><![CDATA[乔布斯]]></category>
		<category><![CDATA[云计算]]></category>
		<category><![CDATA[产品更新策略]]></category>
		<category><![CDATA[人工智能]]></category>
		<category><![CDATA[付费用户]]></category>
		<category><![CDATA[企业权力结构]]></category>
		<category><![CDATA[免费开放]]></category>
		<category><![CDATA[内存带宽需求]]></category>
		<category><![CDATA[内部决策]]></category>
		<category><![CDATA[功能扩大]]></category>
		<category><![CDATA[合作伙伴关系]]></category>
		<category><![CDATA[图像处理]]></category>
		<category><![CDATA[图像识别]]></category>
		<category><![CDATA[多模态]]></category>
		<category><![CDATA[多模态AI模型]]></category>
		<category><![CDATA[多模态交互]]></category>
		<category><![CDATA[大模型]]></category>
		<category><![CDATA[大模型训练]]></category>
		<category><![CDATA[天威不可测管理]]></category>
		<category><![CDATA[定制开发]]></category>
		<category><![CDATA[对话框]]></category>
		<category><![CDATA[市场竞争分析]]></category>
		<category><![CDATA[技术合作风险。]]></category>
		<category><![CDATA[技术规范设定]]></category>
		<category><![CDATA[挤牙膏]]></category>
		<category><![CDATA[推理任务]]></category>
		<category><![CDATA[提姆库克]]></category>
		<category><![CDATA[数据中心建设]]></category>
		<category><![CDATA[斯嘉丽约翰逊]]></category>
		<category><![CDATA[显卡]]></category>
		<category><![CDATA[未来趋势预测]]></category>
		<category><![CDATA[本地设备限制]]></category>
		<category><![CDATA[李开复]]></category>
		<category><![CDATA[百度]]></category>
		<category><![CDATA[盛大创新院]]></category>
		<category><![CDATA[端到端]]></category>
		<category><![CDATA[算力中心]]></category>
		<category><![CDATA[统一内存]]></category>
		<category><![CDATA[翻车]]></category>
		<category><![CDATA[英伟达]]></category>
		<category><![CDATA[苹果]]></category>
		<category><![CDATA[行业标准]]></category>
		<category><![CDATA[行业标准制定者]]></category>
		<category><![CDATA[计算器]]></category>
		<category><![CDATA[计算器争议]]></category>
		<category><![CDATA[训练大模型]]></category>
		<category><![CDATA[诉讼]]></category>
		<category><![CDATA[语音功能]]></category>
		<category><![CDATA[语音识别]]></category>
		<category><![CDATA[调用频率]]></category>
		<category><![CDATA[谷歌]]></category>
		<category><![CDATA[迁移成本]]></category>
		<category><![CDATA[销量增长]]></category>
		<guid isPermaLink="false">https://lukefan.com/?p=1284</guid>

					<description><![CDATA[大家好，欢迎收听老范讲故事YouTube频道。今天咱们来讲第一个故事。Open AI进一步开放了GPT-4欧的 ... <a title="Open AI 免费GPT4大放送，苹果WWDC翻车预警？" class="read-more" href="https://lukefan.com/2024/06/04/open-ai-%e5%85%8d%e8%b4%b9gpt4%e5%a4%a7%e6%94%be%e9%80%81%ef%bc%8c%e8%8b%b9%e6%9e%9cwwdc%e7%bf%bb%e8%bd%a6%e9%a2%84%e8%ad%a6%ef%bc%9f/" aria-label="阅读 Open AI 免费GPT4大放送，苹果WWDC翻车预警？">阅读更多</a>]]></description>
										<content:encoded><![CDATA[
<figure class="wp-block-embed is-type-video is-provider-youtube wp-block-embed-youtube wp-embed-aspect-16-9 wp-has-aspect-ratio"><div class="wp-block-embed__wrapper">
<iframe title="Open AI 免费GPT4大放送，苹果WWDC翻车预警？" width="900" height="506" src="https://www.youtube.com/embed/dA28B93LJ3Y?feature=oembed" frameborder="0" allow="accelerometer; autoplay; clipboard-write; encrypted-media; gyroscope; picture-in-picture; web-share" referrerpolicy="strict-origin-when-cross-origin" allowfullscreen></iframe>
</div></figure>



<p>大家好，欢迎收听老范讲故事YouTube频道。今天咱们来讲第一个故事。Open AI进一步开放了GPT-4欧的免费功能和范围，留给苹果的时间真的不多了。所以，这一个话题里我们会讲两件事。</p>



<p>第一个是Open AI进一步开放了很多免费用户可以使用GPT-4，主要是4欧了。另外呢，就是苹果现在的日子并不好过。虽然我们前面反复在想说，大家万众瞩目，万众期待WWDC，6月5号吧，大家都在等这一天。但是，呃，越是大家期待的事情，可能最后啊，越让大家失望。</p>



<p>最近Open AI呢，肯定是消息不断。为什么呢？山伯特曼本人是一个呃，政客或者说他政治手腕非常的强大。前面闹出了很多的负面，比如说伊利尔走人，超级队旗团队的负责人走人，而且这两天呢，超级队旗那个负责人已经去了anceropic，还在跟瓦解，也就是斯嘉丽约翰逊才在这打着官司。各种的负面都很多，所以呢，一定会放出很多消息来，去纠正这些负面信息啊。</p>



<span id="more-1284"></span>



<p>先跟大家讲，他们去跟斯加利约翰逊诉讼的这个事情啊，非常有意思啊，因为瓦解说了，说他们来找到我，在这个GPT-4欧里头有很多角色，有一个角色叫sky啊，叫天空啊，说希望用我的声音去做这个sky，但是呢我拒绝了。结果呢，他们就找了一个跟我声音很像的人，去把这个声音录了。现在呢，我们要求他马上下架，而且起诉他。现在呢，是找到了配音的人，也找到了跟他联系的经纪人，整个一串，都找找到了。找到完了以后呢，人家作证说，Open AI找到我们，只是因为我们的声音很好听。在整个的沟通和谈判过程中，以及签协议的里头，没有提到斯嘉丽约翰逊的名字，一次都没提。只要你没有任何的证据证明，说确确实实照着戴着约翰逊的声音样本去找的人啊，那么在诉讼过程中呢，就还是占有一定的优势。现在就是这样的一个情况。当然了，另外一方面呢，Uki已经这个sky这个声音，也就是使用斯嘉丽约翰逊的这个声音，下架了，现在听不到这个声音了。也是教了大家一个漏洞吧，就是下次再想抄谁的声音的时候，你千万不要在纸面上落下任何字了。说因为你的声音像谁谁谁，所以我用你的，对吧？只要落下来，这事就不利啊。</p>



<p>那么现在，open AI放了些什么样的新消息出来呢？第一啊，我们又开始训练下一代大模型了。到现在为止，GPT5咱没看着呢，现在人家说我开始宣传GPT6了。叫什么名字不重要啊，但是消息放出来了，而且呢，以open AI前面做了这么多次的宣传来看，就是他放了消息，大家还是信的啊，不是说你发完消息大家都不信了，所以现在又欢欣鼓舞。</p>



<p>再往后就是GPT4O进一步免费开放。那么现在，到底免费用户可以得到些什么样的东西呢？第一个，我们现在如果拿到一台新的电脑，或者打开一个新的浏览器，里头没有登录过的，你进去以后，你能够看到，上面只有一个标题叫GPT，没有3.5，没有4，没有4O，没有任何标记了，就叫GPT。其他的宣传的功能通通都没有了，但是你可以用GPT，在没有登录的情况下。</p>



<p>下面你去登录或者注册一个新用户，也没有付费的情况下，你呢就会看到一个呢叫GBT4。如果你想选择GBT4，它就要求你去定位plus。如果你不选择，你就使用GBT。实际上就是GBT和GBT4O。你说，我就跟他随随便聊聊天啊，这个是没事的，你就像原来用3.5一样。但是现在3.5已经不再显示了，没有了。</p>



<p>那你说我想用一些新的功能，我想跟他语音对话啊，想去上传照片，让他去给我啊，做一些这个图像识别啊，想去调GPS啊，那个呢就要去遵守它的啊，频度限制。就是你一分钟可以钓多少次。当然了，它这个频度是，比较低的，3个小时16次。这三个小时之内，你调够16次了，他就退回到GPT 3.5。但是呢，这上面不会有任何的变化，你还是在PPT里面啊，他不告诉你哪个版本了。当然呢，3个小时16次这个事呢，稍微有点玄学。因为很多人上去测，去发现呢，有些人用了10次就被踢出来了啊，有些人用了5次啊，还有些人说用的次数更少，或者更多一点。但是应该没有超过16次的。现在呢，官方的数据呢，也不是特别明确，说我3个小时到底让你使多少次。相信呢，应该还是跟用户的热情相关，比如现在用的人少了，我就让大家多用几次；用的人多了，他少用几次。付费用户，像我们这样的plus用户，3个小时呢，可以调用80次，也就是GPT 4。语音相关的功能吧，可以调84啊。但是现在呢，其实4里面啊，这些语音功能，还是用的传统方式啊，就是先做语音识别，后台文字处理，然后再回来做说的部分，并没有真的实现所谓的端到端语音。他的这种开摄像头这个功能对吧，我们看了很多演示，都是开摄像头说哎，这个怎么回事，那怎么回事，对吧这件事情呢，跟大家想象的也还是有一些差别的，并不是这么干的，而是什么呢，你可以用摄像头去拍一张照片，照片传给他，然后他去解释这是怎么回事，这个工作已经可以干了啊。但你说我这个实时摄像头都开着，这事干不了，哈哈，可能未来也未必能干啊。那么现在呢，在免费用户里的还可以用什么，用GPTs啊，就是各种定制开发的这个GPT，你比如说啊，我在里边去开发了一个如何去英语学习啊，如何去比如Canva，或者让他去给我做一些设计。对吧，这些呢，现在都允许去调用了啊。这个是这一次开放出来的新功能啊。但是你调用GPTS的次数呢，也是受刚才我们讲这个39264限制。然后呢，还可以关联应用啊，你可以在GPT里头关联你的Google Drive啊，或者是微软的one drive，可以从这里边去上传文件。你比如说，现在给我做一次数据分析，你可以上传一个文件上去，给我分析下这个文件啊。或者说你让他给你做一个图像识别啊，拿着摄像头拍一张照片上来，哎，这是个什么菜啊。我上次试了一下，出去吃饭啊，拍了一个这个菜，已经吃了，大概还剩一两口了，那个菜拍完了以后问他这什么菜啊，这个我认得好好的，说啊，你这个是酸菜鱼啊。为什么呢？里头有白色的鱼片，绿色的酸菜，金黄色的汤和红色的辣椒，所以这个菜一定是酸菜鱼，还是很厉害的啊。就算你是免费用户，也是可以用到这些功能的，前提是要注册，但是不登录就没有啊，不登录就只有GPT聊天啊，其他的都没有了。这一次，免费用户呢，跟付费用户之间还有一个差别，是什么？不能出图啊，就是你想让他给你画画，这事画不了。你说我3个小时16次也好，3个小时多少次也好，你给我画画去啊，这事不行。它里头有一个GPTS叫达利三啊，包括呃，图像生成这些GPS都是让你使用的，但是呢，你向他下完命令以后，你会看到那个圈儿在转，说我在画图，我在画图画图，然后等这圈儿转完了以后，呃，说对不起，我现在还干不了啊，你去定一个plus吧。对吧，它会给你出这样的提示。你说都已经到这样的状态了，这20美金还值不值得付呢？对吧，我现在是每个月在付20美金，在用这个东西啊。首先要想清楚啊，GPT4欧呢，虽然多模态相对来说要强一些，但是单纯的文字处理能力，其实并没有GPT4强。PT-4还是能力最强的模型。如果你要做一些复杂的工作，还是要用GPT-4。我也在Gemini里试了Gemini Flash和1.5 Flash，虽然很快，但是它的功能是没有Gemini 1.5 Pro强的，还是要差很大一块的。所以，你付了费，可以好好的去使用GPT-4。付费用户呢，GPT-4达到极限次数以后，会降级使用GPT-3.5。这样大家就知道谁强谁弱了。</p>



<p>我有时候使用GPT-4的时候也会超限制，对吧，它就会自动降级。而且呢，20美金还可以画画，还可以自己创建GPTs。你说我想调教一下GPT，让他给我干一些特殊的事情，想上传一些数据，让他给我做一些专门结合这些数据的一些工作，那你就老老实实的去订阅就好了。</p>



<p>前面我们讲的GPT-4，那些免费的用户，他们可以用现有的GPTs，但是你不能自己做，不能自己去定制。另外，使用额度这件事，也还是很重要的。就是三个小时80次这件事，基本上其实是够用的。前几天，我老婆拿这个东西去试验英语口语练习，用免费的版本，发现没聊两句他就被踢下来了，觉得非常不爽。但是他觉得80句呢，可能也差一点，因为拿这个东西做英语口语练习，一个来回就算一次。所以，他那个80句，可能3个小时也不是那么够用吧。但是这块呢，80句至少对于像我这样比较懒惰的学生来说，应该是已经够够的了。聊一会呢，懒得跟他说了。</p>



<p>那么，OpenAI为什么会在这样的一个时间点里头，进一步的推出免费的GPT-4呢？因为GPT-4前面就告诉大家是免费，但是里头很多的功能是没有的，比如上传图片、上传布局文件、使用GPS这些功能都没给大家。为什么现在要来做这件事？呃，先问大家一个问题啊。大家知道云计算厂商赚钱最大的秘密是什么吗？你上了阿里云，上了腾讯云，上了亚马逊云，这里面最大的秘密叫迁移成本太高。你一旦上去以后，你很难搬走啊。云计算厂商基本上靠这件事来挣钱的。所以他们一开始那个价格都很便宜，吸引你去了。等你要搬的时候，费劲了，咱就别搬了，就这么凑合着吧，对吧，将就过吧。</p>



<p>OpenAI也在干这个事啊。就是当用户习惯了OpenAI之后，再想迁移到其他平台上去，就会有巨大的成本。所以呢，现在就一定要来搞。那你说为什么原来不搞？原来呢，他比其他人其实强好大一块，没有任何人能赶上他，所以呢并不着急。但是现在，甭管是Cloud3 Opus，还是GMDI1.5 PRO，已经基本上赶上他了。而且Cloud后边有亚马逊，Gemini后面呢，是有谷歌，有固有的用户群体。万一让大家最后觉得哎，Gemini也挺好使，我就这么使着吧，那他这个用户等于就抢不回来了啊，就没法再去培养这种用户行为习惯了。所以必须要在现在这个时间点啊，要去稳住霸主的话语权。就是他要制定规则，而且呢在现在，大家其实都是按照OpenAI的规则在做事情。</p>



<p>OpenAI其实是在整个的行业里边，是做了很多坏事的，起到了很多非常差的作用。第一个就是上来做对话，所以现在好多人都说，我也要去做对话啊，这个事不那么容易啊。做对话这个方式并不容易去变现，也没有办法去进行深入的用户产品的研发。但是呢，这个OpenAI开了头了，任何人做这个大模型都没办法老老实实的去做对话框去。第二个是什么呢，就是按这个20美金收费啊，一个月收这个月费。这个里头呢，百度就属于被忽悠了，上去收费去了，其他人上来都免费。功能比他那收费的还好。然后第三个，就是按TOKEN收费啊，就是open AI在张掖这些三板斧啊，都不是那么好使。再往后就是什么，就GPS啊，就是第四个GPS，这种模式呢，到底好不好用，我觉得也还有待商榷。因为他太追求什么呢，就是无代码化了。按道理说呢，使用API去做很多东西是挺方便的，但是呢他说不，我不推这个东西啊，我要推GPTS，我要让大家无代码去把各种事做掉。因为我最近也在尝试，各种无代码的方式，使用PT使用各种大模型，哇那叫一个酸爽啊，不不替都费劲了，而且最终的结果很难进行控制。像我们这些程序员，最喜欢干的事是什么，就是结果可控啊，这不对了，我把这数改大点，把这数改小点啊，或者把这个语句怎么调一下顺序，但是你通过GPTS也好，通过流程控制也好，或者工作流也好，你去控制这一大堆大模型，干活的时候你会发现，你的结果每一次都不一样，你想去调试，想去调优，这个真不是一般的费劲。这就是啊，PPT给大家留下了这么多刻板印象，但是呢大家没办法，只能跟啊，现在大家都在这条路上，慢慢的往前跟着往前走。现在GPTS GPT4欧的这种多模态端到端，就是open i希望进一步推进的标准啊。前面它做的这个对话框的啊，做的这个按TOKEN收费的，做的这个一个月20美金的啊，这些标准大家都已经认了啊，现在再推下一步，GPT4O呢迟迟无法交付，现在呢大家也在着急，大家用的还都是语言模型，其实呃我们在国内使用的很多的呃，这种工具，已经接近了GPT4O的这种水平了啊，这个回头有机会再跟大家分享。那现在呢，GP 4 o，最后能不能变成像他们演示的那样，不好说我觉得难度还是蛮大的啊，真的到他那样了，这个东西实实在在开着了。你还能看到后边有没有人走过去。这个对于网络，对于前端算力的要求都是非常高的。现在的GPT搜肯定是达不到啊，或者说，现在我们使用的ChatGPT的这种APP，绝对是达不到的。这是GPT4欧啊，现在免费开放出来的一个原因了。当然还有一个原因是什么，DC越来越近了，PPT4O呢也要站稳自己的脚跟。</p>



<p>这个话是什么意思呢？就是很多新闻都已经讲了，open AI跟苹果之间已经达成协议了，准备呢在手机上实现啊，类似于GPS Siri这样的功能啊。那苹果呢，同时也没有放弃跟谷歌的谈判，来咱接着谈啊，这个Gemini还是有机会的，他并不希望GPT4O在苹果手机上，一家独大，或者成为唯一解决方案。为什么呢？因为你一旦成为唯一解决方案，它这个价格就不好谈了，对吧这两边就可以谈嘛，哎谷歌你现在是一什么价格啊，这个另外一头啊，GPT4O你是一个什么价格啊，咱们就可以来谈功能啊，哪些功能有啊，哪些权限你是不是可以少要一点，对吧大家可以来谈判，有一个平衡的过程。</p>



<p>苹果其实也喜欢干这种，你比如说现在苹果设备上的所有搜索，还是多选一啊，我在这个Safari上我没有一个搜索的，苹果搜索可以用啊，这个是没有的啊，但是呢我可以使用谷歌搜索，可以使用Beam，可以使用达克达go还是什么东，国内你还可以选百度，所以未来的苹果设备上，大模型估计也是这样，大家选就完了啊，我到底是要用谷歌，还是要用open AI你去选，谷歌Gemini如果和苹果的合作也能达成，那这个费用大家就要好好算一下了，对吧假设苹果是向open AI付费的啊，或者苹果是t open AI，向它的用户付收费的啊，叫扣费外接这种服务，一共三种服务方式嘛，谷歌搜索。现在跟苹果的服务方式是什么呢？是谷歌给苹果钱。你只要是苹果设备上，使用了谷歌搜索，点了广告，我这个广告收益我跟苹果分。而这个钱很大，每年可能几十上百亿美金的给。</p>



<p>然后第二种方式呢，就是大家免费。你也别收我钱，我也别收你钱。</p>



<p>然后第三种方式呢，就是苹果说来我付钱。这个钱我苹果付了，你拿去用吧。早期三星是特别喜欢干这个事，跟什么Joe box啊，跟很多这样的公司，三星付了钱，说来只要买了三星手机的第一年，让他们白用这个钱，三星付了以后的钱呢，让他们自己付去。</p>



<p>当然最可能的方式是什么呢，就像icloud这样。比如说苹果出了一个新套餐，叫智慧icloud套餐。原来呢，需要用每个月两美金，或者多少钱，你可以买一个空间。现在你说我还需要用open AI的功能，或者用Gemini的功能，那我还需要再去付一个钱在里头，每个月多付10美金。然后他就把这个东西集成在Siri里，让你去用去了。哎，如果你说我不愿意付，那你买了苹果手机说哎，我给你一个基础的版本可以用，比如说GPT-4，3个小时18次，没准你在苹果手机上，我让你多用10次。这个也可以对吧，这个有可能是未来的一种服务方式。</p>



<p>你说我想敞开的使，我就想拿苹果手机这么使了，行不行啊？那你就再多买一个套餐，买完了以后，苹果自己收一部分钱，扣个30%苹果税，剩下呢跟open AI，跟谷歌的Gemini去分取。这个我觉得是未来比较大可能性的这种复位方式。</p>



<p>那么现在开放出来，这个免费的GPT-4的这些功能在干嘛？其实是告诉谷歌，告诉苹果，你要想搭进去，你至少应该有这些功能，你才能搭进去。而且这些功能，我已经免费可以给大家用了。谷歌你再去签协议的时候，你也得小心点。要钱少要点。现在，其实是在干这样的一个搅浑水的事情。啊，但是呢现在开放出来的免费GPT-4，肯定是不够iOS 18去用的啊。谷歌现在呢，也还是在里边在谈到底怎么弄。但比较悲催的是什么？就是作为iPhone全世界第二消费国的中国，哎呀估计可能是要用百度了啊，因为甭管是OpenAI还是谷歌，我们都用不了，甭管他们是不是在中国落地，中国是不是允许，现在美国政府也不允许他们给咱们用，咱就凑合用百度吧。</p>



<p>苹果其实今年一季度的销售是很烂的，在中国，到4月份就疯狂降价，由苹果官方降价。4月份苹果iPhone在中国区的出货量，比去年同期增长了52%，这也是一个很大的数据啊。那我们疯狂的买完苹果以后，没有OpenAI，这也是一个啊比较悲惨的事情。</p>



<p>苹果今年的WWDC呢，感觉翻车的可能性还是蛮大的。为什么这么讲？因为这边OpenAI还在闹幺蛾子呢，那边呢，谷歌合作协议也还没签下来呢。你等于这边OpenAI搞个幺蛾子以后，苹果谈判代表说来，咱们再谈谈吧。谈呢一般就谈这三件事啊，第一你提供什么功能给我，第二，我给什么权限给你，第三怎么收钱。现在OpenAI做完这个事情以后啊，谷歌那边的谈判就会变难一些。而且大家要知道，往年开WWDC之后啊，马上就该开始干嘛，推送iOS的下一个版本，比如去年吧，iOS 17的第一个测试版，什么时候推的呢？2023年的6月6号。去年可能也是6月5号，6月6号开的WWDC，当天就退。然后正式版什么时候出呢？2023年的9月19号就要出正式版。但今年这事就困难了啊，叫没有困难，我们制造困难也要上，OpenAI就属于制造困难。你想还剩一个礼拜，这会就要开了，开完了以后马上就要发版本。那这边啊，open i还在这说，我今儿免费这个，明儿免费那个，后天改改功能，再后天我再扩充点功能，还得干这事呢。谷歌那边协议还没签下来呢。那你说下礼拜他发的版本里，到底长啥样，这个事真的是不太好说啊。而且就算是他把这版本发出来了，三个月能够做出真正能用的版本，推送给所有人用吗？真不好说啊。所以大家还是要拭目以待一下。</p>



<p>而且苹果内部呢，很多事情推动起来，其实也并没有那么容易啊。他也是这种天微不可测模式。什么叫天微不可测啊？就是你上面有一大老板啊，或者有一皇上，这个皇上有一些喜好啊，你是知道的。你有遇到一些事情，比如说有可能处到皇上逆鳞的时候呢，你说我到底上去问一罪呢，还是不问一罪呢，还是说这事我猜皇上不喜欢这个，我猜皇上喜欢那个，然后我就这么办，去了。这个到底怎么办，这种事情的选择其实也很简单啊，就是如果啊，你上去报一下啊，发现也没什么损失，你肯定上去报。如果你上去报一下，发现损失很严重啊，你比如像以前皇宫里这些太监，知道皇上有可能不喜欢某样东西，你还上去说去哎，这个事是有可能丢性命的。那在这样的威权统治下呢，很多的事情大家都不敢说，怎么办呢，都是猜哎，老板今天喜欢这个吗，喜欢那个吗，啊不喜欢啊，不喜欢我就不干了，我也不告诉老板有这个事啊，很多都是这么干的。</p>



<p>先跟大家讲一故事吧，我原来在盛大创新院，盛大创新院的老板呢叫陈大年，是陈天桥的弟弟。当时呢我们在内部就流传啊，说陈大年不喜欢李开复，咱们就当八卦，我讲的大家都不要太当真。有些时候啊，我们就需要跟创新工厂合作啊，要跟李开复合作。然后这事呢，我们就先去问下边人，哎呀我说这个事情，要跟李开复那边合作一个啊，咱们到底谈不谈啊。通常大家说别弄啊，别弄啊。\n老板不喜欢李海福啊。你这上去不是找骂吗？然后这个事就放弃了。</p>



<p>甚至呢，有很多本身就是谈一个合作，就可以很容易搞定的事情，我们最后没办法，只能绕着走啊，而且连问都不敢问的。这种事情在苹果里头有没有呢？也有啊。举一个案例，大家知道，iPad上马上要发的是iOS 18和iPad OS 18。iPad OS 18里头有一个重大的更新，是什么呢？是加入了计算器。现在反正，已经不是乔布斯时代了。再过一个礼拜开WWDC，现在能够发的东西，其实已经被曝光的差不多了哎。所以iPad OS 18里头有计算器。那你说iPad号称生产力工具，里头为什么没有计算器呢？</p>



<p>2010年iPad一代发布的时候，里面本来是有计算器的啊。但是乔布斯呢，把软件部门的高级副总裁叫过来问，说新设计的计算器在哪啊？他就一直觉得，iPad上的计算器应该有新的，不应该把那iPhone上的计算器，就直接搬过来。结果对方就回答说，没有新设计啊。哎，这就是要发布的版本就长这样。乔布斯就愤怒了，说不行啊，把他给我拿出去，我们不能发布这样的东西啊。咱其实说的，基本上就是这样的一个原话，相对来说也比较模糊。</p>



<p>现在14年过去了，2010年的事情，iPad一代发布，乔布斯呢，是2011年就去世了。这14年里头，iPad就一直没有计算器。为什么你连问的地方都没有？乔布斯已经不在人世了。你现在在问，他说，您看我把这计算器做成这样行不行呢？没地问去了。人家已经说了，我们不能发布这样的东西。那你说这事怎么弄？我们只能理解，乔布斯如果活着的话，他会怎么看这事呢？当然了，2024年了，提姆库克呢，又做出了违反祖宗意愿的事情啊，把计算器又加回去了。这些年呢，其实提姆库克做了不少。这个违反祖宗意愿的事情，比如说把这个iPhone的屏幕做大了。原来乔布斯说，我这个屏幕就必须这么巧，一个手要能操纵得过来啊。但是现在，我们已经可以有这巨大屏幕的iPhone了。但是这个计算器，真的是等了这么多年才加回来。那你说我讲这个故事，跟我们今天讲WWDC，跟我们今天讲AIGC大模型，有什么关系呢？哎，这个就涉及了苹果另外一个祖先的这个遗愿啊。这个遗愿是什么呢？这个故事要从2009年开始说起。</p>



<p>2009年，苹果出了一批Mac电脑，在这个电脑的型号上，加装了英伟达的显卡。结果这些显卡的兼容性很差，散热也不好。就只要是做大型的这种图像渲染的时候，就直接的冒烟，或者说就直接卡顿，就不干了，就死机，出现这样的问题。英伟达呢，一开始拒绝承担责任。苹果、戴尔和惠普等都买了他这款显卡嘛，一起对他提起了集体诉讼。最终，迫使英伟达同意更换有缺陷的GPU。</p>



<p>从此以后，苹果跟英伟达的关系，就可以说是彻底决裂了。苹果再也没有买过英伟达设计的任何产品。苹果甚至选择了这个性能和功耗更差的AMD的GPU——就是苹果有一些MIC Pro里头是有GPU的，它用的是AMD的，包括苹果有时候会让你去带这种叫做外接GPU盒子，但那个里头都是AMD的啊，英伟达的一律没有。后来苹果定制一些GPU，也是去跟AMD去合作啊，这英伟达我就不玩了。</p>



<p>但是现在呢，大模型时代了，这不买H100吗，你不买英伟达的设备吗，这不没得玩了吗，这个事是很大的问题所。以现在大家也明白，为什么苹果电脑从来不能打游戏了，它压根就没法往里头插英伟达的GPU，因为祖宗已经留下这个话了啊，我们这辈子不跟英伟达合作了，他有这样的一个祖训在里头。那你说咋弄？那现在你说苹果怎么办呢？彻底不买吗？这个肯定也不行啊。现在呢，据第三方猜测，苹果还是少量的购买过英伟达的算力卡，就是H100这种东西，组建了自己的算力中心。但是即使买了第一个，数量非常少啊，苹果并没有买很多这个东西。第二呢，偷偷买啊，也不能说啊，自己用一用就算了。但是现在呢，要o in AI了，怎么办？</p>



<p>这个苹果又做了一个特别奇葩的决定，他呢，去订购了一大堆的叫MR Ultra的芯片，嘛呢，拿这个M2 Ultra去填计算中心去啊。这个呢就很危险了啊。大家要知道，M2系列的芯片，应该2022年出来的啊，包括2023年也还卖了一段时间。到2023年，呃，年底的时候就开始出M3系列的芯片，现在的M3 Max都出来了，M3 Max就是最大的这个芯片，一般叫Ultra的，是把两个Max粘一块，那东西叫Ultra啊。这M3 Max呢，现在在MacBook Pro上已经开始卖了。本来呢，按部就班，到今年呢，应该发布M3 Ultra的Mac mini，Mac studio这样的台式机。但是呢，到现在你到苹果官网上去看MacBook Pro，你可以买到M3 Max，你说我现在想买Mac studio，你还只有M2 Ultra，它压根就没有M3 Ultra这个产品，M3 Ultra这个产品型号被取消了，没了。为什么呢？因为太着急，现在iPad都用上M4了，所以也许到明年的这个时候，我们会看到M4 Ultra的Mac studio，但是现在不赶趟了。所以赶快把M2 Ultra再造一批，拿去藏数据中心就完事了。那你说，这个M2 Ultra挂数据中心行不行呢？这个东西在Max studio上，那绝对足够。即使是性能超级过剩的一个芯片，比如将两个M2 Max粘在一块。印象中，一个M2 Max已经非常好用了，在本地做推理完全没有问题。但是，如果你想用它来训练大模型，对不起，搞不定。为什么呢？因为它的内存带宽不够宽。苹果发明了统一内存，将电脑上的内存与缓存合二为一，速度相对较快，能够达到家用游戏显卡的速度，但与真正的算力卡如H100或AMD的MI300相比，差距非常大。而且，它能够挂载的内存数量也不够多。在这种情况下，依靠M2 Max搭建的苹果数据中心，算力堪忧，可能只能勉强完成推理任务。想自己训练新的大模型，基本不现实。苹果可能在研发新的算力芯片，但即使现在开始研究，至少两年后才能用上。而两年后，大模型会发展成什么样，大家已经无需惦记了。苹果可能已经放弃了大模型，但小模型还是会做，就像iPhone手机和Mac电脑上的本地搜索引擎，大型搜索引擎则直接识别。WDC现在感觉翻车的可能性还是有些大，因为剩余时间不多，合作伙伴都不是省油的灯，尤其是谷歌，虽然算是中规中矩的合作伙伴，但也这么多年了。\n也相对稳重一些了。Open AI呢，经常是不按常理出牌，属于性格还不是很稳定的一个公司。你跟他去合作，反正日子不是那么好把握吧。</p>



<p>苹果自己的AI这一块上呢，因为遵从了祖训啊，不跟英伟达合作，后边的日子肯定也不好过啊。你像马斯克的AI，人家还是老老实实的，买了一大堆的英伟达的这个H100，回去做算力中心去了吧。任何的其他人，包括谷歌，你说我有TPU，他也老老实实的去买H100。哎，只有苹果说不，哈哈我不买啊，祖训传下来了。</p>



<p>而且苹果这些年呢，挤牙膏已经挤的太多了，现在有点无处下手了，对吧？现在以大家曝光出来的WWDC上有可能发布的东西来说，呃，我觉得计算器算个惊喜，就是也没有什么惊喜了。这个里头，one more thing，大家都已经在开会之前的一个礼拜都说完了，看看他们到底弄点什么啊。这种WWDC的话，应该不会又整了个什么大地之母出来晃一圈吧，啊我估计应该不会。</p>



<p>我这里头可能唯一可以one more thing的，是不是给题目顾客指令一接班人可以斑驳适应一下，啊，没准大家还可以稍微的开心一点点。好啊，这就是我们今天讲的第一个话题，就是Open AI把GPT-4免费范围放大，苹果WWDC翻车的可能性还是蛮大的。</p>
]]></content:encoded>
					
		
		
			</item>
		<item>
		<title>GPT-4o重磅发布：提前一天，正对着Google I/O骑脸开大，所有人都可以免费使用的GPT-4o，最贴近人的语音聊天助手，就像电影“her”中觉醒了的AI一样。AGI正在向我们走来。</title>
		<link>https://lukefan.com/2024/05/15/gpt-4o%e9%87%8d%e7%a3%85%e5%8f%91%e5%b8%83%ef%bc%9a%e6%8f%90%e5%89%8d%e4%b8%80%e5%a4%a9%ef%bc%8c%e6%ad%a3%e5%af%b9%e7%9d%80google-i-o%e9%aa%91%e8%84%b8%e5%bc%80%e5%a4%a7%ef%bc%8c%e6%89%80%e6%9c%89/</link>
		
		<dc:creator><![CDATA[Luke Fan]]></dc:creator>
		<pubDate>Wed, 15 May 2024 00:37:39 +0000</pubDate>
				<category><![CDATA[AIGC]]></category>
		<category><![CDATA[4O功能]]></category>
		<category><![CDATA[4O模型]]></category>
		<category><![CDATA[5月9号]]></category>
		<category><![CDATA[AIGC产品]]></category>
		<category><![CDATA[AIPC]]></category>
		<category><![CDATA[AI助手]]></category>
		<category><![CDATA[AI发展]]></category>
		<category><![CDATA[AI运算]]></category>
		<category><![CDATA[API价格]]></category>
		<category><![CDATA[APP重要性]]></category>
		<category><![CDATA[Deepseak]]></category>
		<category><![CDATA[Devon]]></category>
		<category><![CDATA[Google Gemini]]></category>
		<category><![CDATA[Google I/O]]></category>
		<category><![CDATA[Google压力]]></category>
		<category><![CDATA[GPT Siri]]></category>
		<category><![CDATA[GPT-4]]></category>
		<category><![CDATA[GPT-4o]]></category>
		<category><![CDATA[GPT4]]></category>
		<category><![CDATA[GPT4与GPT5]]></category>
		<category><![CDATA[GPT4与收费]]></category>
		<category><![CDATA[Group]]></category>
		<category><![CDATA[IPAD]]></category>
		<category><![CDATA[Kimi]]></category>
		<category><![CDATA[M4芯片]]></category>
		<category><![CDATA[OpenAI]]></category>
		<category><![CDATA[OpenAI官网]]></category>
		<category><![CDATA[OpenAI活跃度]]></category>
		<category><![CDATA[OpenAI签约]]></category>
		<category><![CDATA[Perplexity]]></category>
		<category><![CDATA[PPT修改]]></category>
		<category><![CDATA[Sam Altman]]></category>
		<category><![CDATA[Siri GPT]]></category>
		<category><![CDATA[Siri替代]]></category>
		<category><![CDATA[XAI]]></category>
		<category><![CDATA[上海取景]]></category>
		<category><![CDATA[中文标签]]></category>
		<category><![CDATA[付费用户]]></category>
		<category><![CDATA[免费API]]></category>
		<category><![CDATA[免费GPT4]]></category>
		<category><![CDATA[免费使用]]></category>
		<category><![CDATA[发布会]]></category>
		<category><![CDATA[响应速度]]></category>
		<category><![CDATA[国内大模型]]></category>
		<category><![CDATA[多模态识别]]></category>
		<category><![CDATA[大模型]]></category>
		<category><![CDATA[实时翻译]]></category>
		<category><![CDATA[手机发热]]></category>
		<category><![CDATA[摄像头功能]]></category>
		<category><![CDATA[文心一言]]></category>
		<category><![CDATA[新功能]]></category>
		<category><![CDATA[未来AI]]></category>
		<category><![CDATA[未来风格电影]]></category>
		<category><![CDATA[本地识别]]></category>
		<category><![CDATA[本地运行]]></category>
		<category><![CDATA[李开复]]></category>
		<category><![CDATA[浏览器与APP]]></category>
		<category><![CDATA[浏览器使用]]></category>
		<category><![CDATA[灵异万物]]></category>
		<category><![CDATA[现实演示]]></category>
		<category><![CDATA[网络负担]]></category>
		<category><![CDATA[股价波动]]></category>
		<category><![CDATA[自动编程]]></category>
		<category><![CDATA[自动编程机器人]]></category>
		<category><![CDATA[芯片]]></category>
		<category><![CDATA[英文标签]]></category>
		<category><![CDATA[苹果]]></category>
		<category><![CDATA[视频剪辑]]></category>
		<category><![CDATA[视频识别]]></category>
		<category><![CDATA[语气语调]]></category>
		<category><![CDATA[语音识别]]></category>
		<category><![CDATA[谷歌演示]]></category>
		<category><![CDATA[跨语言沟通]]></category>
		<category><![CDATA[通一千问]]></category>
		<category><![CDATA[长城防火墙]]></category>
		<category><![CDATA[预处理]]></category>
		<category><![CDATA[马斯克]]></category>
		<guid isPermaLink="false">https://lukefan.com/?p=1243</guid>

					<description><![CDATA[GPT-4oo大家好，欢迎收听老范讲故事的YouTube频道。今天咱们来讲一讲Open AI最新发布的GPT- ... <a title="GPT-4o重磅发布：提前一天，正对着Google I/O骑脸开大，所有人都可以免费使用的GPT-4o，最贴近人的语音聊天助手，就像电影“her”中觉醒了的AI一样。AGI正在向我们走来。" class="read-more" href="https://lukefan.com/2024/05/15/gpt-4o%e9%87%8d%e7%a3%85%e5%8f%91%e5%b8%83%ef%bc%9a%e6%8f%90%e5%89%8d%e4%b8%80%e5%a4%a9%ef%bc%8c%e6%ad%a3%e5%af%b9%e7%9d%80google-i-o%e9%aa%91%e8%84%b8%e5%bc%80%e5%a4%a7%ef%bc%8c%e6%89%80%e6%9c%89/" aria-label="阅读 GPT-4o重磅发布：提前一天，正对着Google I/O骑脸开大，所有人都可以免费使用的GPT-4o，最贴近人的语音聊天助手，就像电影“her”中觉醒了的AI一样。AGI正在向我们走来。">阅读更多</a>]]></description>
										<content:encoded><![CDATA[
<figure class="wp-block-embed is-type-video is-provider-youtube wp-block-embed-youtube wp-embed-aspect-16-9 wp-has-aspect-ratio"><div class="wp-block-embed__wrapper">
<iframe title="GPT-4o重磅发布：提前一天，正对着Google I/O骑脸开大，所有人都可以免费使用的GPT-4o，最贴近人的语音聊天助手，就像电影“her”中觉醒了的AI一样。AGI正在向我们走来。" width="900" height="506" src="https://www.youtube.com/embed/DnEiWn5YCdY?feature=oembed" frameborder="0" allow="accelerometer; autoplay; clipboard-write; encrypted-media; gyroscope; picture-in-picture; web-share" referrerpolicy="strict-origin-when-cross-origin" allowfullscreen></iframe>
</div></figure>



<p>GPT-4oo大家好，欢迎收听老范讲故事的YouTube频道。今天咱们来讲一讲Open AI最新发布的GPT-4，到底是一个什么样的东西。专门赶在谷歌I/O之前的一天开，这就是司马昭之心，路人皆知了。对，指的是谁，大家心里都明白。当然，选择这一天开发布会的还有其他人，比如李开复也在这一天发布了他“灵异万物”新的大模型。以后找机会学习再跟大家分享。通义千问呢，是早几天，5月9号发了他们自己新的大模型。</p>



<p>我呢，自己肯定是懒得去在凌晨2点看直播了，所以到今天，看看录屏，然后看看其他人都在说什么，再跟大家介绍一下GPT-4到底是一个什么样的东西。在这之前，大家一直知道，说他要在这个时间点开发布会，甚至在他没有公布发布会时间的时候，大家也都在猜，说是不是上周要发布，是不是这周要发布，然后猜了很多有可能会发布的产品。有些人猜GPT-5，有些人猜测试GPT。</p>



<p>战猫奥特曼说了，不是GPT-5，也不是测试GPT。我呢，在礼拜天，也就是在发布会前的一天，还在推特上在问，说这个新发布的东西会不会是GPT Siri或者是Siri GPT，对吧，因为已经传出消息了，苹果要跟Open AI签约嘛，那么出来的东西应该是这样的一个东西吧。甚至呢，我也猜过，说是不是GPT-5出来了以后，GPT-4就免费了啊，万一GPT-4免费了呢，现在惦记收费的这些版本该咋办呢，还活不活得下去，这事没法混了。所以呢，当时拆解了这么多种可能性，从我个人角度上说，我猜了GPT-40，免费的GPT-4，GPT Siri，拆了三个方向。现在看呢，我觉得我也没猜错。对吧，现在的GPT-40啊，基本上是这样，这四个方向的事其实都干了。都发布了什么呢？第一个是GPT-40，它可以进行语音识别与翻译，支持50多种语言，可以进行实时搜索。但是，它并没有进行搜索之后的很完善的内容组织，不像Perplexity那样，可以进行很好的搜索结果组织。GPT-40免费对公众开放了，这也是一个逐步开放GPT-4的过程，虽然开放的是40版本。</p>



<span id="more-1243"></span>



<p>我今天还专门去问了一下GPT，我说：“你40版本都开放了，我为什么要买GPT-4呢？”它回答说GPT-4的功能要更强，处理效果更好，物有所值。跟我讲了半天，当然，这可能是它产生的幻觉，编的故事，这个就不重要了。</p>



<p>那么，更高的响应速度，号称响应速度从320毫秒降低到了232毫秒。这意味着，你和它聊天，语音或发消息给它时，它能更快地回复。这还是很有价值的。但是，因为我们在国内，需要挂节点或梯子，所以我并没有感觉到它变快。不知道以后是否能主观感受到这个提升。</p>



<p>然后，更便宜的API价格，GPT-40的API已经公开，我现在已经可以调用了，价格大约是GPT-4标准版的一半，便宜很多，而且很快。当然，它有限额。虽然可以免费使用，但现在具体每天或每小时能用多少次，我没有找到公开信息说明。即使是像我这样的Plus用户，每月交20美金的，也是有限额的。我们的限额是免费用户的5倍。比如说，免费用户用了一个小时5次，就到限额了。而我，作为付费用户，可能一个小时可以用25次。如果达到限额，免费用户就自动退回GPT3.5。对于付费用户，达到限额后并没有额外奖励，同样会受限。</p>



<p>此外，除了GPT之外，还将推出一个新功能——集成GPT的桌面板。这个桌面板就像一个桌面精灵，能悬浮在屏幕上。你可以随时询问，比如：“我这程序写得怎么样？”它能实时查看你的屏幕，指出错误，让你及时修改。不过，它的交流方式会更加自然，不会这么生硬。虽然没有详细演示，但大家都很期待。</p>



<p>桌面板真正让人震惊的，或者说大家真正关注的是GPT4.0带来了什么新东西。其实，我们提到的所有功能GPT4都有，它只是更快、更便宜，功能整合得更好。这似乎不值得大惊小怪，感觉是更新而非革命。所以，我们只是做了更新，并没有推出新产品，连GPT5的影子都没见着。但为何依然引起巨大轰动？</p>



<p>原因在于，GPT4有几个真正的新亮点。首先是“所见即所得”体验的升级。不同于谷歌Gemini允许上传照片和视频，GPT现在可以直接通过摄像头工作。你只需把摄像头对准目标，比如一张纸，就能直接提问并得到回应。\n你看我这纸上写的什么？你看看我身边是什么样的一个环境？你给我描述一下我现在这个状态啊。刚才有什么反常的事情发生吗？你可以问他这样的问题了，这是一个巨大的进步。叫眼见为实。而且呢，通过这个演示，现实地打脸了谷歌的General。为什么？因为谷歌当时也是放了这么样的一个视频，后来被大家打脸，说你这个视频是剪辑过的，你实际上还是上传的照片，然后让他自己去读照片，而不是举着手机让人看了一眼，说：“你看上什么了？”哎，不是这么干的啊。你把中间这个放照片、换照片这个过程呢，都给剪掉了啊，这个是骗人的啊。但是现在Open AI呢，就真的找了几个大活人坐在这，然后举着手机来，“你看看这，你看看那。”然后这个纸上写了什么啊？我在这个纸上出了一个数学题，应该是怎么做的？我做对了没有？对吧，现实的给人看，对吧？因为你旁边有大活人嘛，你肯定不能是剪辑，对吧？你一旦剪辑了以后，那个人的动作就不连贯了嘛，因为你人没法说，“哎，我这剪了两刀啊，来，请这个做好原来那个动作不要动啊，然后再接着往下演。”这个事是做不到的。对吧，所以他一定要上大活人。人家告诉你说，“哎，谷歌是剪辑骗你们，但是我是上真的啊。”这个是真的很让人震惊的啊。</p>



<p>视频演示的艺术呢，其实是AIGC整个发展过程中，大家不断地去研究和深化的一个新的门类了。为什么讲这样的一个话？因为大家会发现，所有AIGC产品的发布，基本上都是要上视频的。上视频的好处是什么呢？就是我可以剪辑，可以编导，可以去处理，而且呢，它很有感染力。不是说让用户自己去试，因为让用户自己试了，你还有翻车的可能。但是如果是我，给你一个视频，我可以把它剪辑一下，把翻车的部分都剪掉，然后可以提速，可以减速，可以把不该让你看到的东西删掉。那么大家都在很努力地提升，当然有的时候会翻车了，包括前面这个Devon，也就是这个自动编程机器人，也是翻车了。然后马斯克说，“来，我给大家演示机器人啊。”然后发现，“哎，你旁边还有一人呢。”这个漏出来了啊，穿帮了啊。也有这样的事情。谷歌啊，做Gemini的演示也是穿帮了。视频演示的这种艺术呢，谷歌基本上靠的是剪辑。Open AI靠的是什么呢？哎，千万不要以为说，你们看到的就是现实，看到的就是这个样子了。Open AI肯定也是做了一些花活，Open AI靠的叫编导，他事先要编辑好故事，然后呢，来给大家演示。他指着说，“哎，我编辑好了，然后演示一遍，失败了，没有啊，好像失败了啊，再来一次。”然后这次又失败了，再“来一次”。哎，那你说不是从头到尾一镜合成吗？一镜到底啊。对啊，但是他可能拍了20条、30条一镜到底，最后挑了一条能看的给你看。所以，千万不要认为说，你看到的就是最终结果，就是他的平均水平。他可能也是挑了一条好的给你看。</p>



<p>而且在演示的过程中，他们可能不是说，“哎，我演示完了以后错了，再来一条啊。”不是这样，他们说先写好脚本，照着脚本演了一遍，发现，“哎，不对啊，回答的有问题。”改脚本，改完了以后，咱们再练一次。哎，发现又差了一点点，效果不是很满意，再改脚本，再试一次，最后给你一个能用的。所以，这个东西真的落到我们自己手里头，未必能有那么好使。</p>



<p>因为有人测试了GPT-4的这个翻译功能，发现呢，稍有偏差，这个内容就不见了。比如涉及成人问题，涉及一些血腥暴力问题，这个内容就直接不见了。大家在看演示的时候，肯定不会给你演示这部分。人家肯定演示的是啊，开心的交流，上来是一个小哥，用英语跟旁边的美女进行意大利语的沟通和交流。但是你想，很多的这种漂亮小伙跟漂亮小姐姐之间，需要靠GPT-4进行实时翻译的时候，经常聊着聊着，然后中间有一些这个敏感内容，就不见了。这不是一个非常无聊的事情吗？对，但是这部分不会给你演示，所以，惦记靠GPT-4出去找小姐姐的这些人啊，就可以休息一下了，不要想太多啊。有些事情呢，看到了事后问起，啊，还能想起来，这个真的是很绝啊。因为Greg在上面做演示，这个时候，突然有一个女同事…\n呀，么巧动的走到他身后，然后在他脑袋后头比了个兔子耳朵，然后走了。Grag就问说：“刚才有什么反常的事情发生吗？”这个GBT40就说了：“啊，刚才有一个人要跟你开玩笑，站在你身后，在你后边比了一个手势，是这个兔子耳朵。”说得非常清楚。这个我觉得真的是挺吓人的。哪怕说我看了当时没有处理，但是我记住了，下次你问我，我还能给你总结出来。而且，我还知道他在跟你开玩笑，他等于把整个这个过程都理解得很好。所以我现在越来越相信，Sora是世界模型，真的可以仿真出一个世界来。这是第一点，让人感到很震惊的。</p>



<p>然后，另外一点让人感到很震惊的是，它真的像个人了。他的说话的语气语调，对这个人的判断，“哎，我看着你不太开心啊。”对人的语气语调的判断，对着摄像头前的这个人的表情的判断都非常好。他自己的输出情感也很充沛，有笑声，有害羞，各种各样的感情都非常充沛，而且很自然。你并不会感觉很吓人，这个过程。而且呢，他还可以中间打断，这个其实很难。就是他聊着聊着天，你中间打断他，而且呢，可以多角色聊天。因为Greg也演示了一点，就是两个AI自己在这聊天，然后他在中间还可以叫停他们，“哎，说咱们一块再聊个，说一个其他的事情啊。”这个是非常强的，因为AI等于已经可以分清谁在说话，这些之间的这个关系到底怎么样。你中间打断他了，再跟他聊天，他还可以停止他刚才正在说的话，继续去回答你的问题。这个已经非常强了，越来越像人了，就是他有这个察言观色的能力了。</p>



<p>詹姆斯·奥特曼也在讲，说：“你们有没有看过那个电影《Her》？”啊，这个我也看过，就讲的是一个工程师吧，他呢，跟一个装在口袋里的，有着很温柔、很性感声音线的一个女性的AI机器人去聊天，然后深深地爱上了这个机器人。讲了这样的一个故事。那个故事非常好，就是它的拍摄成本极低，但是呢，极其引人深思。这个电影另外一个值得推荐的是什么？它是一个美国人拍的科幻片，但是所有的外景地是在上海取的。对，这个非常神啊。为什么呢？因为他们觉得上海这个地方实在是太魔幻了，魔都嘛，对吧？要想拍这种有未来风格的电影，一定要去上海取景。这也是推荐大家去看的一部片子吧。有很多人说，我要去买啊，甚至我还有一个朋友说，我马上就去买这个M4芯片的iPad去了。</p>



<p>呃，首先啊，跟大家讲，免费用户手机端现在还是只能用3.5，你还用不了4。但是呢，免费用户呢，可以在PC端用浏览器使用GPT4了，这个没有任何问题啊。我刚才已经试过了，就是我到浏览器上去，然后呢登录一个新的OpenAI账号，那就肯定没有付过费嘛，他说你现在可以使用3.5和4了。但是在浏览器里头的话，他是没有录音键的啊，就是你只能是打字或者是上传图片，这个是OK的。他并不能去调用摄像头。</p>



<p>如果是付费用户呢，在手机端也可以选择GPT4，可以使用了。但是呢，并没有想象中那么快，刚才我讲了，为什么？因为我们需要挂梯子。语气语调呢，其实也没有加载，就是我们现在跟GPT4的各种沟通，它并没有那么丰富的语气语调，还是原来的这种慢条斯理在跟你说。摄像头的功能现在并没有打开，我估计应该没有那么快，为什么呢？因为摄像头这件事情，其实对你的手机、服务器、对网络的压力都实在太大了。这个事情未来到底会怎么被打开，还要等着看。而且你一旦开了摄像头功能，他对于隐私保护，原来有争议的问题就都会出来。你说这玩意为什么会有隐私保护？再跟大家讲啊，以前有一位工程师…\n是专门做人脸识别支付的。他有一次就发了帖子说：“这提醒小姐姐们，你们再去做人脸支付的时候，请一定要穿上上衣啊，千万不要问我是怎么知道的。”这个，跟各位小姐姐们共勉。</p>



<p>API用户的话，现在已经可以用了。因为我自己也会写程序，啊，我刚才试了一下，GPT-4o这个模型的API已经可以用了，比PT4特本要更便宜、更快，而且呢，支持读模态识别。全部的功能肯定要等，有些功能可能需要等很久，特别是视频识别。我估计视频识别真的跑起来以后，手机会发热的，甚至有可能会冒烟。咱们现在看到他现场演示的这个，他可能服务器就在他楼下，或者没准就在背后的那面墙旁边，就是他的服务器，离得非常近。所以，他有可能能够举着手机就去识别去。如果像咱们这种，服务器还在大洋彼岸，那你想去靠手机识别的话，这个很难啊。</p>



<p>这件事情对行业的冲击是什么？这个一定要去讲。第一个冲击：免费最可怕。OpenAI用户数活跃度虽然近期有一定的下降，但是呢，我并不觉得有了免费的GPT-4o之后，这个事就会有多大的变化。这个数会发生波动，但是没有什么意义。为什么呢？你的用户再多，付费的人再多，你能把OpenAI烧掉的钱挣出来不？你能盈利不？依然是九牛一毛。所以这件事本身对于OpenAI意义不大。</p>



<p>那么对于其他的币源呢，还惦记收费的服务啊，你们就该想想了。比如说Group，比如说Gemini，你们最后还惦记收费啊。虽然Gemini的这个Pro你是免费的，但是你的Control你是惦记收费的。那你要看看你收费的那个版本，跟我现在免费的GPT-4o比起来，到底行不行啊。这就是要去喊一嗓子了，你行吗？</p>



<p>第二个呢，以后的那些虚拟男友女友们，就赶快去更换新的大模型就好了，统统都换成GPT-4o。然后你们的用户啊，这个粘性会上升的，你们的用户会留存下来的。这又指明了一次方向。当然了，到了那边以后，他是不是继续做“盗学先生”，这个是需要打一个问号的。苹果新的Siri，我觉得是可以预期一下的。如果苹果新的Siri里头搭载的是GPT-4，呃，那还是一个非常棒的结果。当然，他在国内会搭载什么呢？难道是文心一言？呃，最好还是换一个，因为苹果到中国，肯定是要换一个大模型塞进去的。你就像苹果在美国用的是谷歌搜索，在中国的话，默认的都是百度搜索啊。千万千万不要上文心一言，然后最后还给我们解释了什么呢？就是APP才是王道。</p>



<p>在大模型出来以后，很多人都觉得，“哎呀，我在网站上就可以把这事搞定了。”“我在OpenAI的网站上，我在Rook的网站上，我在推特，我就可以把这事搞定了。”“我不需要APP了，APP已经没有什么意义了。”现在看到了，没有APP才是王道。为什么呢？啊，因为还是要有很大的内容，或者很大的这种算力要到本地去跑。AI的大模型公司可以将一些AI的小模型直接封到APP里面去，这样就可以分摊服务器的压力，可以分摊网络流量。</p>



<p>你比如说，我现在需要拿手机直接进行识别，比如原来的语音识别，你是怎么着呢？在只管录音，录完音以后是传到服务器上识别的，就是用OpenAI的Whisper的大模型直接处理。这事为什么可以呢？就是你可以在语音录下来以后，把它压缩得很厉害，压缩得很小了以后，然后再上去识别，识别的效果还很好。这个对于网络的压力其实没有那么大，对服务器压力也没有那么大。但是你想，现在他要做视频识别了，视频识别，你说我传1080P回去还是传4K回去？你就算传1080P，这个速度有多少？虽然我们的手机是可以做1080P的直播的，因为我有时候会做直播嘛。啊，1080P直播直接用5G流量是推得上去的，但是如果所有人都推这个玩意上去，他受得了吗？他肯定受不了啊。这个事肯定是不行的。所以，一定需要在本地做一些视频的预处理，然后才能回去。那么，你视频预处理可能也需要一些啊，闭园的小模型。这个就要在本地跑，就要在APP里边跑。你如果没有一个APP，你说我完全靠浏览器去搞这个事情，搞不了的啊，想都不用想。</p>



<p>如果是真的在APP里边进行AI运算，那么后边的AI手机，AIPC这条路就有一些价值了啊，大家就该掏钱去买那个M4的iPad Pro啊，该干嘛干嘛去了。后面压力就传导出去了啊。第一个，谷歌肯定会感觉到压力，今天的半夜谷歌IO就该开幕了，明天我们又可以讲新节目，说谷歌IO都讲了些什么。我估计皮彩正在连夜的改PPT，说&#8221;Open AI已经贴脸开大了&#8221;，我们原来那个PPT不好使了，咱必须得写一版新的，这次讲点啥啊。没准一着急还盲目出错，又给人演示点什么不该看的东西，或者演示一些内容有问题，那这个谷歌的股价，又可以稍微的波动一下了。这个可以稍微预期一下。</p>



<p>另外一个集团啊，马斯克的XAI后面的这个大模型，到底怎么样了？我觉得是越拉越远了啊。在group开源的时候，我当时做了预测，是跟所有人都不一样了啊。我当时觉得，马斯克基本上放弃这东西了，这东西就这样了。现在我们看看后边，是不是他还能感觉到有压力啊？咱们看一看。至于百度文心一言呢，还是要好好的感谢我们的长城防火墙。啊，当然，即使有了墙，我觉得它在国内都不算是特别强的模型了。国内我现在使用的比较强的模型，像Kimi啊…\n通一千问啊，包括像灵异万物，还有现在有一个新的叫DeepSea，这些新的模型，我觉得都比AlphaFold要好。现在唯一期盼的就是，苹果新的手机到国内来的时候，千万不要去用百度文心新语言去替代Siri，千万不要干这个事情，实在是太难用了。好，这就是今天跟大家讲的GPT-4，都发布了一些什么东西。感谢大家收听，请帮忙点赞，点小铃铛，参加Disco讨论群。也欢迎有兴趣、有能力的朋友加入我们的付费频道，再见。\n</p>
]]></content:encoded>
					
		
		
			</item>
	</channel>
</rss>
