<?xml version="1.0" encoding="UTF-8"?><rss version="2.0"
	xmlns:content="http://purl.org/rss/1.0/modules/content/"
	xmlns:wfw="http://wellformedweb.org/CommentAPI/"
	xmlns:dc="http://purl.org/dc/elements/1.1/"
	xmlns:atom="http://www.w3.org/2005/Atom"
	xmlns:sy="http://purl.org/rss/1.0/modules/syndication/"
	xmlns:slash="http://purl.org/rss/1.0/modules/slash/"
	>

<channel>
	<title>Gemini 2.0 &#8211; 老范讲故事｜AI、大模型与商业世界的故事</title>
	<atom:link href="https://lukefan.com/tag/gemini-2-0/feed/" rel="self" type="application/rss+xml" />
	<link>https://lukefan.com</link>
	<description>这里是老范讲故事的主站，持续更新 AIGC、大模型、互联网平台、商业冲突与资本市场观察，帮你看清热点背后的底层逻辑。</description>
	<lastBuildDate>Wed, 16 Apr 2025 00:52:33 +0000</lastBuildDate>
	<language>zh-Hans</language>
	<sy:updatePeriod>
	hourly	</sy:updatePeriod>
	<sy:updateFrequency>
	1	</sy:updateFrequency>
	<generator>https://wordpress.org/?v=7.0</generator>

<image>
	<url>https://lukefan.com/wp-content/uploads/2026/03/cropped-jimeng-2026-02-28-5245-用图一的人物形象，替换图二中的人物，使用图二的风格。文字替换：老范讲故事，Yo-32x32.jpeg</url>
	<title>Gemini 2.0 &#8211; 老范讲故事｜AI、大模型与商业世界的故事</title>
	<link>https://lukefan.com</link>
	<width>32</width>
	<height>32</height>
</image> 
	<item>
		<title>震撼发布！GPT-4.1，牛马的新工具来了，专为程序员打造百万Token上下文API利器，超低价与高指令遵从度能否颠覆Gemini与Claude主导的工程市场格局？</title>
		<link>https://lukefan.com/2025/04/16/%e9%9c%87%e6%92%bc%e5%8f%91%e5%b8%83%ef%bc%81gpt-4-1%ef%bc%8c%e7%89%9b%e9%a9%ac%e7%9a%84%e6%96%b0%e5%b7%a5%e5%85%b7%e6%9d%a5%e4%ba%86%ef%bc%8c%e4%b8%93%e4%b8%ba%e7%a8%8b%e5%ba%8f%e5%91%98%e6%89%93/</link>
		
		<dc:creator><![CDATA[Luke Fan]]></dc:creator>
		<pubDate>Wed, 16 Apr 2025 00:52:31 +0000</pubDate>
				<category><![CDATA[AIGC]]></category>
		<category><![CDATA[100万Token上下文]]></category>
		<category><![CDATA[AI Agent]]></category>
		<category><![CDATA[AI agent开发]]></category>
		<category><![CDATA[AI工具更新]]></category>
		<category><![CDATA[AI市场竞争]]></category>
		<category><![CDATA[AI成本优化]]></category>
		<category><![CDATA[AI技术更新]]></category>
		<category><![CDATA[AI模型对比]]></category>
		<category><![CDATA[API发布]]></category>
		<category><![CDATA[API调用]]></category>
		<category><![CDATA[B端市场]]></category>
		<category><![CDATA[Claude 3.5]]></category>
		<category><![CDATA[Claude 3.7]]></category>
		<category><![CDATA[C端用户]]></category>
		<category><![CDATA[DeepSeek R1]]></category>
		<category><![CDATA[Deepseek V3]]></category>
		<category><![CDATA[Gemini 2.0]]></category>
		<category><![CDATA[Gemini Pro 2.5]]></category>
		<category><![CDATA[GPT-4.1]]></category>
		<category><![CDATA[GPT-4.1评测]]></category>
		<category><![CDATA[Grok 3 mini]]></category>
		<category><![CDATA[LLM]]></category>
		<category><![CDATA[MidJourney]]></category>
		<category><![CDATA[OpenAI]]></category>
		<category><![CDATA[OpenAI战略]]></category>
		<category><![CDATA[RAG (检索增强生成)]]></category>
		<category><![CDATA[Sora]]></category>
		<category><![CDATA[人工智能]]></category>
		<category><![CDATA[价格便宜]]></category>
		<category><![CDATA[低成本AI]]></category>
		<category><![CDATA[可控性强]]></category>
		<category><![CDATA[多模态AI]]></category>
		<category><![CDATA[多版本 (Standard/Mini/Nano)]]></category>
		<category><![CDATA[大海捞针测试]]></category>
		<category><![CDATA[大语言模型]]></category>
		<category><![CDATA[实时AI (Realtime AI)]]></category>
		<category><![CDATA[工程应用]]></category>
		<category><![CDATA[工程需求]]></category>
		<category><![CDATA[开发者API]]></category>
		<category><![CDATA[开发者福音]]></category>
		<category><![CDATA[开源模型]]></category>
		<category><![CDATA[技术发展趋势]]></category>
		<category><![CDATA[技术解读]]></category>
		<category><![CDATA[技术选型]]></category>
		<category><![CDATA[指令遵循度高]]></category>
		<category><![CDATA[推理能力]]></category>
		<category><![CDATA[模型评测]]></category>
		<category><![CDATA[牛马工具 (程序员自嘲)]]></category>
		<category><![CDATA[程序员工具]]></category>
		<category><![CDATA[稳定性好]]></category>
		<category><![CDATA[编程能力提升]]></category>
		<category><![CDATA[观点分享]]></category>
		<category><![CDATA[视频理解能力]]></category>
		<category><![CDATA[速度快]]></category>
		<category><![CDATA[长上下文处理]]></category>
		<category><![CDATA[高性价比]]></category>
		<category><![CDATA[高效AI模型]]></category>
		<guid isPermaLink="false">https://lukefan.com/?p=2104</guid>

					<description><![CDATA[**不允许有人不知道！牛马程序员续命神器GPT4.1杀疯了！**

家人们谁懂啊！！OpenAI这次真的把程序员当亲爹宠了！！💥
新出的GPT4.1简直是把「便宜大碗+指哪打哪」刻进DNA！！程序员看完直接跪着喊爸爸！！

**🔥 炸裂亮点速看：**
1️⃣ **100万TOKEN白给价！！**
扔100万字文档进去才花7毛钱！！（输入0.1刀/百万token）
什么会议纪要合同小说直接无脑塞！！不用分段不用切！！
打工人的本地知识库直接下岗！！

2️⃣ **指令依存度拉满！！**
程序员狂喜！！终于不用和AI斗智斗勇了！！
「标号必须用#1#2#3」「输出给我JSON格式」...
以前GPT4o像叛逆期儿子，现在GPT4.1秒变听话小奶狗！！🐶

3️⃣ **速度卷死同行！！**
Nano版回车一按秒出结果！！（虽然跑不过GROK3 mini但够用！）
搞什么RAG什么向量库？？直接暴力塞文档问就完事！！

4️⃣ **价格屠夫实锤！！**
输出100万token才0.4刀！！（DeepSeek看了连夜改价）
程序员薅羊毛姿势+1！！甲方爸爸需求改100遍也不心疼预算！！

**🤯 普通人和程序员的区别：**
普通人：要AI写诗写歌风花雪月！
程序员：AI你给我老实当工具人！！
而GPT4.1！！就是程序员梦中的牛马！！拉磨快还不吃草！！

**🚨 紧急通知：**
搞副业的！做知识库的！玩Agent的！现在立刻马上调API！！
我已经玩了一上午！！会议纪要总结比实习生快10倍！！（实习生：？？）

⚠️注意：非程序员用不上网页版！！这是API玩家的狂欢！！
但！你们马上会用到基于4.1开发的超便宜APP！！（资本家狂喜）

**👉 最后说句大实话：**
OpenAI这次被Gemini/Claude逼疯了吧？？
但...卷死同行造福百姓的事儿请多来点！！程序员集体起立鼓掌！！👏👏

**#AI神器 #打工人自救 #程序员福音 #OpenAI杀疯了**

震撼发布！GPT-4.1，牛马的新工具来了，专为程序员打造百万Token上下文API利器，超低价与高指令遵从度能否颠覆Gemini与Claude主导的工程市场格局？

OpenAI突发**GPT-4.1**，这款并非面向普通用户的**大模型**更新，而是专为**程序员**和**开发者**通过**API**设计的强大工具。其核心亮点包括惊人的**100万TOKEN上下文窗口**，显著提升的**指令依存度**与**稳定性**，以及极具竞争力的**价格**——特别是**Nano版**和**Mini版**，成本极低且**速度**飞快，堪称“**牛马**”程序员的福音。**GPT-4.1**旨在满足**工程市场**对**可控性**和效率的需求，虽然**编程能力**相较于**Gemini**或**Claude 3.7**仍有提升空间，但在处理大规模文档（强大的“**大海捞针**”能力）和无字幕**多模态视频理解**方面表现突出。面对来自**DeepSeek**、**Grok**等对手在价格、速度、特定能力上的挑战，**OpenAI**此举意在稳固并夺回**API**市场份额，为**AIGC应用开发**和构建**AI Agent**提供了更具性价比和稳定性的新选择，预示着更高效、廉价的AI工具将加速落地。
]]></description>
										<content:encoded><![CDATA[
<figure class="wp-block-embed is-type-video is-provider-youtube wp-block-embed-youtube wp-embed-aspect-16-9 wp-has-aspect-ratio"><div class="wp-block-embed__wrapper">
<iframe title="震撼发布！GPT-4.1，牛马的新工具来了，专为程序员打造百万Token上下文API利器，超低价与高指令遵从度能否颠覆Gemini与Claude主导的工程市场格局？" width="900" height="506" src="https://www.youtube.com/embed/xWY-HIosMsM?feature=oembed" frameborder="0" allow="accelerometer; autoplay; clipboard-write; encrypted-media; gyroscope; picture-in-picture; web-share" referrerpolicy="strict-origin-when-cross-origin" allowfullscreen></iframe>
</div></figure>



<p class="wp-block-paragraph">GPT4.1发布了！牛马们的好工具终于上线了。大家好，欢迎收听老范讲故事的YouTube频道。</p>



<p class="wp-block-paragraph">GPT4.1突然发布，这是程序员们的工具。普通的用户你是用不上的。你用网页版，你用APP，甭管是手机端的还是电脑端的，你是付费用户还是免费用户，你都用不到GPT4.1。只有程序员可以通过API调用GPT4.1。</p>



<p class="wp-block-paragraph">但是这个事儿对于非程序员来说，也是有很大改变，很大帮助的。那么我们今天来讲一讲，GPT4.1到底是一个什么样的东西。</p>



<p class="wp-block-paragraph">首先，它有100万TOKEN的上下文，这个是非常吓人。100万单词吧，基本上你可以直接塞到GPT4.1里头去，它统一给你处理。而且大海捞针做的也很不错。</p>



<span id="more-2104"></span>



<p class="wp-block-paragraph">什么叫大海捞针？就是比如说你找一个100万字以内的小说，你直接扔进去，然后呢，在里面稍微插几句。比如说OpenAI干什么了，山姆奥特曼干什么了，甭管在文章的任何地方，你稍微插几句，然后你提相关的问题，它能给你找出来。这个玩意叫大海捞针。</p>



<p class="wp-block-paragraph">很多的模型都需要做类似这种测试。为什么呢？就是说我一次给了你一大堆上下文以后，你是不是通盘考虑了？不会说把其中的一部分扔掉了，或者说我看看开头看看结尾，就告诉你是怎么回事了，不会干这个事。所以GPT4.1的100万TOKEN还是非常强的，绝大部分场景直接可以应对了。</p>



<p class="wp-block-paragraph">但是现在还不是最强的。现在Gemini Pro 2.5是可以走200万TOKEN的，Gemini Pro 2.0也是可以有100万TOKEN的。但是在其他的模型就没有了，可能也就是64K（64,000 TOKEN），也有一些是128K（128,000 TOKEN）。但是到100万TOKEN的其实还是比较少的。</p>



<p class="wp-block-paragraph">指令依存度非常的高。什么叫指令依存度？就是你让它干嘛，它就给你干什么，不会说每一次出来的都是惊吓惊喜。你让他去找什么什么样的文章，找什么样的信息，做什么样的排序，按照什么格式输出，他都会非常非常认真的按照你的要求去把它做好。</p>



<p class="wp-block-paragraph">编程能力有了非常大的提升，但是依然比不过Gemini 2.5 Pro，也比不过Claude 3.7。它的编程能力只是在原来GPT4O的基础上有了很大的提升。</p>



<p class="wp-block-paragraph">标准版、mini版和Nano版，分了三个版本。为什么要分这么三个版本？速度飞快。当然现在速度最快的不是它，现在速度最快的是Grok 3 mini。这个版本是所有程序员能够使用到API里头速度最快的，原因也很简单。</p>



<p class="wp-block-paragraph">用的人不多，模型又小，而且后边是马首富。家里头穷的光剩卡了，所以那东西跑的飞快飞快的。我前面有一个项目拿这玩意做，一个回车下去，夸夸夸那个刷的那个字你都看不过来。</p>



<p class="wp-block-paragraph">价格非常便宜，GPT4.1，特别是这个Nano的版本，100万TOKEN的输入只需要0.1美金，换人民币7毛多钱，就可以输入100万TOKEN了。输出的话是0.4美金100万TOKEN输出，是目前大家能够用到的所有付费模型里头最便宜的一个，没有比它更便宜的了。就算是GROK3 mini，大概也要到0.3美金100万TOKEN的输入。</p>



<p class="wp-block-paragraph">那么牛马们工具终于更新了，要好好去干活了。程序员们对大模型的要求，其实跟普通人还是有一些差别的。普通人呢说我要跟他聊天，他要显得聪明一点，要给我写的不像AI，要给我有很好的创造力，这个是普通人的要求。</p>



<p class="wp-block-paragraph">但是程序员呢，通常要求的叫指令依存度、可控性，在这两方面要求是非常高的。因为既然是程序员，我们只是让大模型成为我们整个程序中的一个模块。我们要求的是输入，然后按照一个统一的逻辑，有一个可以预期的输出，这个是程序员想干的。就是真正那些才华横溢，不太听招呼的不是好牛马哈，所以一定是要让干嘛就干嘛的这种。</p>



<p class="wp-block-paragraph">工程方面呢对于大模型的要求，跟普通人也是有一定差异的。为什么呢？普通人说你这个模型越大越好，越聪明越好。但是对于工程上来说，在满足预期的情况下，尽可能的降低成本，提高效率，提升一致性跟稳定性。在可以接受的成本下，获得可预期的结果，我给了一分钱还是给了两分钱，我就要这个结果出来，这个是工程上的需要。</p>



<p class="wp-block-paragraph">GPT4.1呢，就像是牛马们突然得到了曲辕犁，这个也是中国古代的一个很著名的发明。有了这个农具以后，牛马犁地的这个效率就会极大提升。GBT4.1基本上就是这么个东西，价格便宜速度快。刚才我试了一下，至少Nano的版本，那个速度非常的快，虽然还没有GROK3 MINI那个快，但是已经很快了。</p>



<p class="wp-block-paragraph">MINI的版本效果也还是不错的。这三个版本里头，大家可以按照需求自己去选择和优化。你让他做很复杂的事情，你就是选用GPT4.1。稍微简单一些的事情，或者我不需要你去发挥创造力，我给你一堆的会议纪要，你给我总结归纳一下。或者说我去到本地知识库，检索完了东西以后，你给我总结一下，这种事情你用Nano版或者是用mini版足够了，这个效果非常非常的好。</p>



<p class="wp-block-paragraph">100万TOKEN的上下文。</p>



<p class="wp-block-paragraph">绝大部分场景都可以满足了。你都不需要去做本地知识库做RAG，你可以直接把文档啪一把都扔给他，说来给我看看怎么回事，不需要去做更复杂的分段了。指令依存度高，这件事是非常非常重要的。</p>



<p class="wp-block-paragraph">程序员最怕的是什么？叫指东打西，指南打北。像我原来使用GPT-4O的很多模型的时候，每一次输出的结果都不一样，这个让我很烦。我举一个例子吧，我让他给我的视频起标题，每一个标题后头有一个标号，但是呢，他每一次输出的都不一样。有的时候输出的是123，有的时候呢先要写一个引号，再写123，有的时候在前面给你写中文的123。这个就很烦，因为我到下一个环节去处理这个标题的时候，我需要去找到数字123打个点，然后后边是标题的这三行字，但我就找不到。经常是找着找着就出错了，因为我写程序的时候，必须是通过这个比较固定的格式去读取信息，经常会错。现在的话就不会出这种问题。</p>



<p class="wp-block-paragraph">程序员喜欢的是不需要太聪明，让往东绝不往西，让追狗绝不撵鸡。GPT-4.1就是这样的一个工具。OpenAI在这个时候呢，推出GPT-4.1也是无奈之举。这个老大真的很难当，为什么这么讲？因为AIGC呢是一个基础技术，OpenAI想把AIGC的整个的盘都占住，在里头当老大，这个是很难的。</p>



<p class="wp-block-paragraph">因为对于大模型的评判标准在快速的分裂。有的说我这个大模型创意最好，就像前面的GPT-4.5似的，我可以去生成各种各样的内容，而且你可以指定说给我按鲁迅那样说，他都可以做的很好。有些呢，是需要做可衡量的项目。什么叫可衡量的项目？就刚才那种创意项目是没法衡量的到底好不好，大家是要靠主观去评测的。可衡量的项目最简单的就是编程，你这个程序编的对不对，里头是不是有错误，是不是把上下文和所有的东西都考虑到了，这个叫可衡量项目。这块也是可以去评估的，谁的大模型编程最好，而且还有稳定性的要求，指令依存性的要求，这块也可以去评测。</p>



<p class="wp-block-paragraph">大模型还有推理能力的要求，这块你的推理能力够不够好，这也是一个新的维度了。包括速度和价格以及多模态，多模态包括理解和生成以及realtime。Realtime是什么？就是我实时的输入，实时的输出。现在谷歌也好，OpenAI也好，都可以去进行这种real time的回复。就是你拿着一个摄像头，对着人呢也好，对着外面也好，你说这是一什么东西，那是一什么东西，就像是一个真人一样跟他聊天，去打断他，它可以实时的根据摄像头拍到的东西。</p>



<p class="wp-block-paragraph">和听到的内容，给你进行回复。而且这个多模态还要去评估音频，还有是语音和音乐，还有图片，还有视频。我们要做这么多行业，这么多领域去进行评估。</p>



<p class="wp-block-paragraph">而这一次，GPT-4.1可以对没有字幕的视频进行理解和分析，而且它现在在这一块的得分是最高的。它比其他所有的这些Gemini也好，包括GPT自己早期的版本也好，都提升了非常多。</p>



<p class="wp-block-paragraph">GPT-4.5呢，算是一次失败的表演。就是前面先发了一个4.5出来，然后现在又发4.1。因为4.5这个东西其实是给这种Pro用户用的，就是你一个月交200美金以上可以用。后来呢，发现实在用的人很少，它又降低下来，一个月交20美金的人也可以用吧。</p>



<p class="wp-block-paragraph">现在我也可以用4.5，只是到目前为止我都没有用过。为什么呢？第一个，很贵。虽然我一个月交20美金，他让我用，但是这个效果对于我来说其实看不太出来。为什么呢？因为他的文学上，在他的很多这种创意上做的非常好，但是我是一个程序员，是个直男，他写的天花乱坠的东西，到我这看不出来，还真会有这样的问题。</p>



<p class="wp-block-paragraph">而且呢，4.5这东西还挺慢，这个也不是我喜欢的。所以到现在为止我没怎么用过，包括4.5的API我也没怎么调过，因为实在是贵。调API的话，你是要按TOKEN付钱的，不是说一个月交20美金就完事了。</p>



<p class="wp-block-paragraph">GPT-4.5在工程方面绝对是战五渣。为什么呢？就这个价格，就让工程师直接望而却步了，实在是玩不转。稳定性、指令依存度这一块的话，肯定也不怎么样。我看创意越好的东西，这个指令依存度和稳定性就越差。</p>



<p class="wp-block-paragraph">OpenAI现在在表演什么节目呢？叫“六大派围攻光明顶”。什么意思？就是在推理上被DeepSeek-R1摆了一道。并不是说OpenAI的推理做的不好，只是它原来呢，因为没有其他人竞争，所以它的推理是隐藏的，就整个的推理过程不给你看，只给你推理的结果。</p>



<p class="wp-block-paragraph">而DeepSeek-R1是上来我就把整个推理的结果原原本本拿出来给你看。很多人看了推理过程之后，我还受到了启发，我还发生了思维的碰撞，可以有一些新的想法出来。在这一块，真的是给OpenAI了一些教训。山姆·奥特曼现在自己出来也承认这件事，他说：“我们并不认为DeepSeek-R1真的有做的多好，但是呢，在这一点上，确实是我们原来没想到。”</p>



<p class="wp-block-paragraph">价格上呢，也被DeepSeek-R1和DeepSeek-V3摆了一道。这东西确实是便宜。这东西花多少钱训练的咱不管它，但是呢，因为它是完完全全开源免费，各个平台都在部署。</p>



<p class="wp-block-paragraph">所以呢，DeepSeek V3也好，DeepSeek R1也好，对于很多的第三方开放平台来说，它所提供的这个基本可用的功能是相当便宜的。但是现在，4.1的MINI和Nano的价格已经下来了，但是4.1标准版还是稍微有一些贵的，比4O要便宜。但是应对DeepSeek的V3和R1来说，还是稍微贵一些。</p>



<p class="wp-block-paragraph">在编程能力上呢，被Claude 3.5长期碾压。现在呢，还有Gemini 2.5 Pro和Claude 3.7。到目前为止，GPT 4.1在编程上的评分依然赶不上Gemini 2.5 Pro和Claude 3.7。在多模态生成这一块呢，视频，它的Sora基本上是废了，现在大家再也不想这事了。图片距离Midjourney还是有非常遥远的距离的，很难追赶。</p>



<p class="wp-block-paragraph">AI agent方向就是它的下一个大方向。现在面对Anthropic的MCP和Gemini，以及Grok给出的deep research或者deep search这些功能来说，现在还是需要去追赶的。因为它下一个GPT5的版本应该就是要追赶这一块了，所以真的是四面楚歌。</p>



<p class="wp-block-paragraph">除了这些之外，还有一大堆千问小模型在不停的跑冒滴漏，把各种各样零碎的用户需求都给实现掉了。为什么说一大堆呢？现在通过各种尺寸的千问模型微调出来的一个小模型，在Huggingface上大概有十几万种，所以这个是非常大批量的。</p>



<p class="wp-block-paragraph">现在的OpenAI呢，在个人用户这边那绝对是遥遥领先。从用户数量、使用时长，其他所有的AI助手加一块大概都赶不上它。但是在程序员和工程方面，已经被Claude、Gemini和DeepSeek给吃干抹净了。我自己应该已经有几个月没有再调用过OpenAI的API了，没必要。你效果又不好，价格还挺贵，还不快，我为什么要调你？</p>



<p class="wp-block-paragraph">所以我现在已经把自己的很多AI agent里头的大模型都换成Gemini，换成Grok，换成Claude和DeepSeek，都换成这些东西了。当然，我今天上午又把它很多换回4.1了，效果很好，好极了。</p>



<p class="wp-block-paragraph">现在GPT4.1呢，就是为了挽救工程市场，挽救API市场而诞生的。这个东西并不是给c端用户去用的。那你说4.1是不是牙膏呢？你看这数就知道了呀，人家不叫4.5，不叫4.6，不叫4.7，人家叫4.1，这个肯定还是一个小牙膏。它呢，在这个创意上，在模型更聪明这块做的一般，只是说这是一个比较老实的。</p>



<p class="wp-block-paragraph">指哪打哪的一个工程工具而已，这个还是很好用的。GPT5呢，估计后边还是要稍微难产一些。现在OpenAI也出来说了，我们低估了GPT5训练的困难，可能还需要再多等几个月，大家才可以看到GPT5。必须在这个时候先稳住局面，使用DeepSeek、Gemini、Claude以及MCP，其实已经可以做很多真正有用、有价值的商品了。</p>



<p class="wp-block-paragraph">如果OpenAI继续放任这个事情往前走的话，程序员们可能就会被这几种模型直接都抢走了，就不会再向OpenAI去迁移了。那么OpenAI就有可能会变成一个像苹果那样的纯C端公司，这个是OpenAI所不希望看到的。他作为AIGC行业的排头兵，他希望在所有的方方面面都领头，这是他现在会遇到的问题。</p>



<p class="wp-block-paragraph">OpenAI手里边的各种模型、技术和工程实践呢，肯定还是非常多的。我们现在看到的应该是冰山一角。OpenAI目前在做的事情是什么呢？如果没有人震动它，它可能还在那继续挤牙膏，继续在这晃荡。实际上2024年一整年，它就是这么个状态。但是到2025年，随着DeepSeek R1的出现，发现不行了，必须要冲出来，赶快把后院里头各种能跑能跳的东西都拎出来，稍微的包装一下，打扮打扮就直接上线了。</p>



<p class="wp-block-paragraph">所以现在我们看到，OpenAI的动作是非常多的。但是即使如此，每一次我们所看到的，依然是OpenAI内部技术的冰山一角。</p>



<p class="wp-block-paragraph">总结一下：如果不是程序员，GPT4.1跟大家呢，会有一些间接的关系，就是很多新的应用会出来。因为用GPT4.1做应用会更方便一些，而且这些应用呢，速度会更快，价格会更便宜，而且也会更稳定。如果是程序员，或者是说您虽然不是程序员，但是呢，想搞点Agent自己玩一下，那么4.1是一个非常非常有趣的小工具，赶快去玩起来。我已经玩了一上午了，非常非常有意思。</p>



<p class="wp-block-paragraph">好，这期就跟大家讲到这里。感谢大家收听，请帮忙点赞、点小铃铛，参加DISCORD讨论群，也欢迎有兴趣、有能力的朋友加入我们的付费频道。再见！</p>
]]></content:encoded>
					
		
		
			</item>
		<item>
		<title>鲶鱼效应搅翻AI江湖：DeepSeek 671B开源来袭，GPT-5和百度文心一言迎巨大挑战！</title>
		<link>https://lukefan.com/2025/02/18/%e9%b2%b6%e9%b1%bc%e6%95%88%e5%ba%94%e6%90%85%e7%bf%bbai%e6%b1%9f%e6%b9%96%ef%bc%9adeepseek-671b%e5%bc%80%e6%ba%90%e6%9d%a5%e8%a2%ad%ef%bc%8cgpt-5%e5%92%8c%e7%99%be%e5%ba%a6%e6%96%87%e5%bf%83%e4%b8%80/</link>
		
		<dc:creator><![CDATA[Luke Fan]]></dc:creator>
		<pubDate>Tue, 18 Feb 2025 00:46:01 +0000</pubDate>
				<category><![CDATA[AIGC]]></category>
		<category><![CDATA[DeepSeek大模型]]></category>
		<category><![CDATA[671B开源模型]]></category>
		<category><![CDATA[AI免费服务]]></category>
		<category><![CDATA[AI发展趋势]]></category>
		<category><![CDATA[AI商业模式创新]]></category>
		<category><![CDATA[AI垄断]]></category>
		<category><![CDATA[AI安全性]]></category>
		<category><![CDATA[AI对话模型]]></category>
		<category><![CDATA[AI幻觉问题]]></category>
		<category><![CDATA[AI广告收入]]></category>
		<category><![CDATA[AI开源]]></category>
		<category><![CDATA[AI推理模型]]></category>
		<category><![CDATA[AI未来发展]]></category>
		<category><![CDATA[AI模型对齐]]></category>
		<category><![CDATA[AI流量焦虑]]></category>
		<category><![CDATA[AI用户忠诚度]]></category>
		<category><![CDATA[AI盈利困局]]></category>
		<category><![CDATA[AI系统集成]]></category>
		<category><![CDATA[AI行业竞争]]></category>
		<category><![CDATA[AI语音功能]]></category>
		<category><![CDATA[AI黑箱子]]></category>
		<category><![CDATA[B端市场]]></category>
		<category><![CDATA[Claude 4发布时间]]></category>
		<category><![CDATA[Claude4]]></category>
		<category><![CDATA[C端市场]]></category>
		<category><![CDATA[DeepSeek]]></category>
		<category><![CDATA[DeepSeek API]]></category>
		<category><![CDATA[DeepSeek R1一体机]]></category>
		<category><![CDATA[DeepSeek安全性]]></category>
		<category><![CDATA[DeepSeek对OpenAI影响]]></category>
		<category><![CDATA[Gemini 2.0]]></category>
		<category><![CDATA[Google AI Studio]]></category>
		<category><![CDATA[GPT-4.5]]></category>
		<category><![CDATA[GPT-5]]></category>
		<category><![CDATA[GPT-5功能]]></category>
		<category><![CDATA[Llama4]]></category>
		<category><![CDATA[OpenAI]]></category>
		<category><![CDATA[OpenAI盈利]]></category>
		<category><![CDATA[OpenAI订阅]]></category>
		<category><![CDATA[ToB市场]]></category>
		<category><![CDATA[ToB部署]]></category>
		<category><![CDATA[ToC市场]]></category>
		<category><![CDATA[ToC用户体验]]></category>
		<category><![CDATA[多模态生成]]></category>
		<category><![CDATA[大模型]]></category>
		<category><![CDATA[大模型商业模式]]></category>
		<category><![CDATA[大模型统一接口]]></category>
		<category><![CDATA[大模型计算成本]]></category>
		<category><![CDATA[山姆·奥特曼]]></category>
		<category><![CDATA[开放源代码]]></category>
		<category><![CDATA[开源大模型]]></category>
		<category><![CDATA[推广成本]]></category>
		<category><![CDATA[推理成本]]></category>
		<category><![CDATA[推理模型O系]]></category>
		<category><![CDATA[文心一言4.0]]></category>
		<category><![CDATA[文心一言4.5]]></category>
		<category><![CDATA[文心一言Turbo]]></category>
		<category><![CDATA[文心一言免费]]></category>
		<category><![CDATA[李彦宏]]></category>
		<category><![CDATA[百度AI]]></category>
		<category><![CDATA[百度搜索广告]]></category>
		<category><![CDATA[百度文心一言]]></category>
		<category><![CDATA[谷歌AI策略]]></category>
		<category><![CDATA[谷歌Gemini]]></category>
		<guid isPermaLink="false">https://lukefan.com/?p=1920</guid>

					<description><![CDATA[啊啊啊啊啊啊啊！家人们，今天咱们来聊聊最近大模型赛道的大新闻！DeepSeek彻底改变了游戏规则，GPT5也即将发布，百度还要免费开源文心一言！这一波操作简直让人眼花缭乱！🤯

DeepSeek，这个满血版671B的开源模型，彻底搅浑了大模型市场的水！OpenAI和谷歌都被它搞得焦头烂额。OpenAI的20美金订阅模式已经被证明是个大坑，谷歌也在努力往外爬，而DeepSeek却凭借其完全可控的开源模型，迅速占领了B端市场。中国的DeepSeek一体机卖得火爆，虽然价格高达三四百万，但大企业们依然愿意买单！💸

GPT5也即将发布，山姆·奥特曼终于要放大招了！从GPT4到GPT5，OpenAI的路线彻底改变，免费用户将能够使用全部功能，这无疑是对自身商业模式的巨大挑战。但是，GPT5的核心问题依然是如何盈利，毕竟C端用户忠诚度低，B端市场又面临开源模型的激烈竞争。🚀

百度也不甘示弱，宣布文心一言将免费开源！李彦宏这一波操作简直是180度大转弯，直接颠覆了之前的收费模式。但百度的核心问题依然是搜索引擎广告收入的流失，如何在大模型市场中找到新的盈利模式，依然是他们面临的巨大挑战。🔍

未来的大模型市场将如何发展？DeepSeek、GPT5、百度文心一言，谁将主宰未来？家人们，你们怎么看？快来评论区讨论一下吧！👇

#DeepSeek #GPT5 #百度文心一言 #大模型 #AI #科技前沿

鲶鱼效应搅翻AI江湖：DeepSeek 671B开源来袭，GPT-5和百度文心一言迎巨大挑战！

DeepSeek带来671B满血版开源模型，引发AI行业重大震荡，直接冲击OpenAI、百度等巨头的ToB和ToC市场。OpenAI推出GPT-4.5和GPT-5，转向更聪明的推理模型统一接口，但同时面临高推理成本和用户流失的挑战；百度文心一言则宣布全面免费和开源，但遭遇搜索广告收入危机。DeepSeek的高性价比部署方案，以及开源趋势，引发对行业变革的深思。大模型市场进入空前竞争时代，盈利模式如何创新，仍是未解难题。]]></description>
										<content:encoded><![CDATA[
<figure class="wp-block-embed is-type-video is-provider-youtube wp-block-embed-youtube wp-embed-aspect-16-9 wp-has-aspect-ratio"><div class="wp-block-embed__wrapper">
<iframe title="鲶鱼效应搅翻AI江湖：DeepSeek 671B开源来袭，GPT-5和百度文心一言迎巨大挑战！" width="900" height="506" src="https://www.youtube.com/embed/kAeOCWFBJr4?feature=oembed" frameborder="0" allow="accelerometer; autoplay; clipboard-write; encrypted-media; gyroscope; picture-in-picture; web-share" referrerpolicy="strict-origin-when-cross-origin" allowfullscreen></iframe>
</div></figure>



<p class="wp-block-paragraph">大家好，欢迎收听老范讲故事的YouTube频道。今天咱们来讲一讲DeepSeek。这条鲶鱼搅浑了水，GPT5要来了，百度也要免费开源了，到底是一个什么样的情况？大模型这个赛道未来会怎么去发展？</p>



<p class="wp-block-paragraph">DeepSeek呢，算是彻底改变了游戏规则。OpenAI给整个行业挖的坑，到现在呢，还有一些公司没查出来呢。什么坑？就是客户端这个订阅20美金一个月这个坑。这个其实是一个非常失败的商业模式。谷歌到现在还在往外爬，因为谷歌他其实自己不太想爬出来。为什么？因为他一旦爬出来以后的话，谷歌搜索的广告收入就没了，只能在那里头装聋作哑了。Perplexity到现在也还在思考，到底是不是要爬出来。</p>



<p class="wp-block-paragraph">大家有没有想过一个问题？开源模型，因为DeepSeek是满血版671B的开源模型，它对于OpenAI的伤害，到底是ToB的伤害大，还是ToC的伤害大？这是一个大家值得去思考的事情。虽然现在DeepSeek在很多的C端有非常大的影响力，就是很多的个人去下载这个东西去用去，但其实真正的开源模型影响最大的是B端。我这是一个自己的公司，我是一个政府项目，或者是一个什么样的商业相关的事情，我要去使用大模型的时候，一定是会优先去选择这种完全可控的开源模型，而不是说我去用人家的闭源的，买人家API。因为你一旦是有开源模型的话，你就可以选择完全私有部署，我自己买台服务器往里装就完了。</p>



<span id="more-1920"></span>



<p class="wp-block-paragraph">现在中国卖的特别好的就是DeepSeek一体机。什么叫DeepSeek一体机？就是它一个机器里边给你塞满了，比如说8块或者16块升腾910，华为的这个算力卡，可以把DeepSeek 671B的这样的模型直接塞进去，就是一台机器搞定。但是这机器很贵，这一台机器大概是三四百万人民币。但很多的大企业说，我们愿意去花这个钱。中国的那些大企业，特别是央国企，他们花这种钱还是蛮开心的。花完了以后，华为就可以发挥他们比较擅长的事情。</p>



<p class="wp-block-paragraph">做这种ToB销售、做大客户销售，剩下的这个我们就不能细说了。所以一旦是有这种完全开源的大模型，而且是跟你这个OpenAI差不多功能的这种大模型的话，对于OpenAI也好，对于谷歌也好，最大的伤害是B端的。C端的其实你说有伤害吗？有，但是C端的人呢，主要是凑个热闹，我们上去看一下就可以了，发现“哎，慢了吧唧不太好使呢”，就跑掉了，也就这样。但是B端真的是差异很大，现在大家都已经开始动起来了。谷歌的Gemini 2.0 Pro已经发出来了，而且谷歌Gemini 2.0，就是Flash、Flash light什么一大堆的版本出来，那是真便宜，而且是比DeepSeek还便宜的一个价格。你不是跟我卷价格吗？我卷的比你还低，现在是谷歌的应对方式。</p>



<p class="wp-block-paragraph">而山姆·奥特曼的话，也终于要发布他的GPT-5了。这个是路线的一个彻底改变，从去年年底12天连续的挤牙膏，到现在突然说“哎，GPT-4.5要出来了，马上GPT-5也要出来了”，这个转变是非常非常巨大的。而且我相信到目前为止，这个弯应该没有转完，这只是转了其中的一半，剩下的我们还要再等它继续去发布，还有一些新的消息，可能未来一段时间会出来。为什么说这个弯还没有转完呢？因为你还得开源一部分，你光说我4.5和5这事不行。到目前为止，OpenAI到底怎么开源这件事，山姆·奥特曼都没说，这个肯定是有问题的。</p>



<p class="wp-block-paragraph">而且山姆·奥特曼也好，OpenAI也好，现在已经开始有流量焦虑了，就是他们的流量到底了，靠自然增长涨不上去了。所以他们1,400万美金，跑到超级碗去打广告去了。他们等于进入到下一个阶段了，原来就是我自然增长，再涨上去就完了，现在涨不动了。而且呢，除了出4.5和5之外，还要求什么呢？就是他还说了，我们要开放全部的功能给免费用户使用，不用再去说一定要交钱了。这个是非常大的变化，就是你甭管是GPT-4.5还是GPT-5，什么搜索、什么生成图片，这个东西免费用户都可以用起来。</p>



<p class="wp-block-paragraph">这个是真的要革自己的命的路子了。GPT-4O以后，其实再往后发展，这个事本身是挺难的。就是普通的这种对话模型，在GPT-4O出来以后，我们就做过这个结论。其实GPT-4到4O之间，主要增加的东西是什么？是语音的部分，是多模态的部分，高级语音功能。为什么涨不上去呢？原因就是你再往上涨，大家其实没法欣赏了。</p>



<p class="wp-block-paragraph">马上要跟大家见面的GPT-4.5，就是说未来几周就会见面。那么4.5代表的是什么意思？有提升，但是呢，提升又不够大，所以它的名字叫4.5。越往后发展，这个提升就越难被普通大众所感知。你说我今天去跟一个出租车司机聊个天，哎，聊得还挺开心。待会你在这给我做一个博士，我跟他聊天发现聊不到一块去。人家说什么我不懂，我说什么，人家都是像看傻子一样看着我。那这个事肯定是没法整。因为你GPT这种东西从4到4.5或者到5，你变得更聪明了以后，是不是就是我说点什么，对面都像看傻子一样看着我呢？这个就会很痛苦。</p>



<p class="wp-block-paragraph">而且加入搜索以后的话，其实对于大模型本身，就没有那么高的要求。他只要把我们的内容通过互联网搜索以后，再去进行一个总结归纳的话，他对于模型本身的能力要求，其实已经下降了。还有一个问题是什么？就是越聪明的模型，对于安全和对齐就越费劲。我还记得在GPT-3.5出来的时候，他们就说说，我们这个模型其实训出来一年多了。那这一年多干嘛呢？就是不停的在去做对齐，做安全性的这种防护，不能让人去攻破它呀。而且发出来以后还不停的有人上来说，我奶奶告诉我怎么样，或者是我做了个梦造原子弹了什么，还不停的去绕他。绕了这么多年了以后肯定是攒的，各种各样的防越狱的手段越来越多。</p>



<p class="wp-block-paragraph">那么现在GPT-4.5可能早就训练出来，但是他就为什么没有办法把它拿出来？就是没法去搞定这个安全措施。原来可能还要再去蘑菇很长时间，内部才能达成一致，说我们把它放出来。现在DeepSeek来了以后说算了，不用费劲了，咱们拿出去用吧。</p>



<p class="wp-block-paragraph">其实，在Llama出来的时候，OpenAI这边就应该想明白了。就是在这个时候再把它做这个，那么安全其实意义不大。因为有开源的，你这个做的再安全都没有什么意义。</p>



<p class="wp-block-paragraph">DeepSeek在安全跟对齐这方面呢，有点像拼多多的商品。原来很多人说DeepSeek是AI界的拼多多，这个是有道理的。拼多多的商品有什么特点？能用，这个东西不是说不能用，能用便宜，但是安全性跟稳定性呢，就没有那么讲究。你去拿DeepSeek，特别是DeepSeek的API，基本上是百无禁忌的。一个模型放在那里，那你说这个大模型这样百无禁忌，他有问题，你万一说点不该说的怎么办？</p>



<p class="wp-block-paragraph">但是你想想，我们今天相当于雇了个人在家里干活。我们希望这个人的道德标准是由我们掌握的，而不是由DeepSeek或者OpenAI，由对方来掌握的。我觉得宁肯找一个百无禁忌的人回来，我们重新给他立规矩，也不要说哎，已经训练好了一个道德规范，在进我们家来。这个还是有区别的。而且现在大模型安全性这一块事，大家都还在摸索，谁也没有搞明白，到底怎么能够让大模型彻底安全下来。现在就是一抓就死，一放就乱的这么一个状态。DeepSeek就属于彻底乱带了，像Claude呀OpenAI，都属于抓的相对来说比较死。</p>



<p class="wp-block-paragraph">但是我觉得对于很多ToB，就是自己可以去做这个开发的，这些用户来说，我自己把握，你不要指手画脚。GPT4.5这个呢，应该就是OpenAI的最后一个对话模型了，再往后不做了。再往后的所有方向都是向O系列，也就是推理模型的方向前进了。那么GPT5是什么？GPT5其实是不用太期待的一个东西，它呢应该会在几周或者几个月之后发布。这个名字呢应该是逼出来的，就如果没有人逼它，我估计它也就不叫GPT5了。GPT4.5发完就完事了，接着做O3、O4、O5，就这么发下去了。那现在不行了，要改方向，新的方向就是GPT5。那这个名字到底是什么意思呢？其实GP5不是一个模型。</p>



<p class="wp-block-paragraph">它是一个AI agent的聚合体。他后面有大量的O系列模型，如O1、O3等，这些模型在后面盯着。然后，4.5这样的对话模型也在后面盯着。他呢，是每一次接到一个问题以后，根据用户的意图来判断，说你到底想干嘛，然后再调用不同的模型来解决用户的需求。</p>



<p class="wp-block-paragraph">很多人使用OpenAI以后说很讨厌，说你这个上面有一个叫模型选择器的东西。你上来以后先要选，我到底是用4回答问题、4o回答问题、4O mini，还是用O1、O3，用哪个去回答问题。选来选去的很麻烦。现在甭选了，我们就统一入口。你就来问，问完了以后我替你选，替你去回答就完事了。你就不用管后边我是怎么调度的了。这个呢，算是又一次指明了方向。</p>



<p class="wp-block-paragraph">OpenAI说这个话之前，或者山姆·奥特曼说这个话之前，谷歌呢，还是发了一大堆的模型出来。他那个模型叫Gemini 2.0 Flash、Gemini 2.0 Flash light、Gemini 2.0 Pro、Gemini 2.0 Flash thinking，等于是这个系列的模型出了一堆。OpenAI说别费劲，咱们统一接口。而且呢，所有功能都统一放在一起。像去年其实我讲过好多次，就OpenAI这个模型不支持上传图片，那个模型不支持搜索，再了一个模型不支持什么canvas，就是那种画板。每一个都是很别扭。现在说，哎都有，GPT5所有的这些功能，什么搜索、高级语音、多模态生成、生成视频、生成音频、图片识别、文件上传、canvas，统统都放在一起。就是你就不用管它后边儿到底是谁了，我给你搁一块儿完事儿了。这个还是非常棒的一个事情。</p>



<p class="wp-block-paragraph">所有免费用户都可以使用全部的功能。那你说还有没有人付费呢？付费用户是可以根据付费的情况，获得更聪明的回答，或者是更多步骤的回复。但这个效果怎么样呢？我觉得还有待观察。我现在感觉，OpenAI又在给大家挖坑儿了。就前面它这个一个月20美金，我就觉得是个大坑儿。</p>



<p class="wp-block-paragraph">免费用户获得这个比较笨的回答，付费用户获得比较聪明的回答。这件事我觉得被人歧视了，总觉得浑身不舒服。当然了，我现在已经准备要退定它了，一个月20美金，可能等到GPT5出来的时候我就退定了。以后呢，就是有钱人获得更聪明的AI服务，穷人的话面对的就是敷衍了事的扑克脸了。未来只有O系的推理模型还会继续发展，这种普通对话模型到4.5到头了，到此结束了。</p>



<p class="wp-block-paragraph">为什么是走这条路呢？你说我们真的需要那么多工程师吗？真的需要去解决什么全人类的这个疾病问题吗？其实不是。这种推理模型有一个很大的优势是什么？它可以一部分地解决幻觉的问题。有的时候说真话，有的时候说假话，或者是有的时候一本正经胡说八道。这个事大家是受不了的。大家要注意AI犯错误的方式跟人犯错误的方式是完全不一样的。</p>



<p class="wp-block-paragraph">人类犯错误的方式是什么？就是我们会在不熟悉的领域犯错误，还有什么？在疲惫的状态下容易犯错误。而我状态好的时候可能说的比较顺溜。人呢，在不熟悉的领域或者是疲惫状态不好的时候，情绪能表达出来，他会犹犹豫豫的，说的不是那么肯定。所以大家也比较容易判断你这个答案是不是靠谱。有很多人就他自己也不懂，这个东西到底对不对，但是只看对方的这个语气语调，就能猜出来：“哦，这个事原来你也不太拿准。”</p>



<p class="wp-block-paragraph">人呢，在被反复询问的时候其实会不耐烦，这都是人的特性。AI正好反过来，它呢是任何时候犯错误的概率都差不多，就是甭管这东西你熟还是不熟，AI其实没有什么状态的问题，他都会犯错，而且犯错误的概率是一样的。而且呢，人犯错误的时候会显得犹疑不定，AI呢不管是不是犯错误都一本正经，所以我们经常说他一本正经胡说八道嘛。</p>



<p class="wp-block-paragraph">当然AI有一个好处是什么？他被反复询问的时候不会不耐烦。所以推理模型呢，他就可以解决这个问题。一个问题我问你3遍，问你5遍，再拿这些结果进行判断，看看是不是一个靠谱的结果。所以这个就是O系推理模型，大家很努力地再去往前推这个事情的原因。</p>



<p class="wp-block-paragraph">因为我最近一段时间是 DeepSeek R1 用的比较多。O1 出来，O3 出来，其实我用的都比较少。但是 DeepSeek 出来了以后，我还是很努力的用了一下。我发现就是很多事情，不是一些数学问题、物理问题、工程问题，就是普通的这种生活中的问题，你扔给推理模型去干，效果也挺好的。唯一缺点就是慢，还有一个就是啰里八嗦的。中间上这个思维链这个事是比较讨厌的，其他的都还可以。</p>



<p class="wp-block-paragraph">再往后呢，就是 API 可能会比较麻烦。现在山姆奥特曼就是说以后 API 也是统一接口，但这个就很麻烦了。为什么？就是你可能问了一个很简单的问题，不定他哪根筋搭错了，直接跳到推理模型那边去干活去了。那你可能这一个问题就直接几千个 TOKEN，上万个 TOKEN 就直接干掉了，而且出了一大堆啰里八嗦的东西，你也不知道他在说什么。这个事是比较讨厌的。所以我估计 API 可能还是分模型去处理的，这个应该是让我们自己去选择。你不能说你替我选完了就直接干了。</p>



<p class="wp-block-paragraph">所以呢，GPT5 呢其实是一个黑箱子。每个用户提问之前，也不知道会为哪个模型去服务，也不知道会获得多大的算力，或者是推理预算。免费用户获得的服务可能会不太稳定。就是用的人少，没准多给你思考一下；用的人多就拉倒了。就跟我们去医院看病似的，如果一大堆人在外面排着队呢，那大夫肯定可不耐烦了。但是你说哎，我有钱，我去看这个特需门诊，那个大夫肯定脸上笑出花来，说您哪不舒服，慢慢跟你说一下。当然我每次去看病的时候，那个大夫看我一眼说，哎，该减肥了。这个也是让我比较不爽的一个事情了。</p>



<p class="wp-block-paragraph">现在呢，对于 B 端市场，统一黑箱的这个方式其实并不是一个特别好的办法。为什么？因为弊端市场他肯定还是要先试用，测试完了以后，再去确定说我是不是要去下单。那你现在没有什么可以定制的地方，上来给你一黑箱子，结果你说我弊端市场要测试的时候，遇到一个脑子不太灵光的扑克脸，那这个成单的可能性就会下降很多。统一接口为什么费劲？就是原来……</p>



<p class="wp-block-paragraph">为什么大家不是做这种统一的接口？原因呢，是这样：就是大模型跟传统软件是不一样的。传统软件是模块化的，大家可以拼来拼去的。大模型呢，是训练完了你就不能拆分拆迭代了。说我训练完一整块，说我把胸间哪一块拆出来改一改行不行？不行，训练完了就是一整块，它是不允许动的。每一个模型训练完了以后，都需要单独的调整，才能够接上各种外挂。这个是大模型跟传统软件之间的一个比较大的差异。传统软件就是模块化随意增减，大模型是一次成型不可分拆。</p>



<p class="wp-block-paragraph">那么，你说到底是一个诸葛亮厉害，还是三个臭皮匠厉害呢？像我们以前一起合作或者带团队干活的时候，都会理解这件事，就是沟通确认这个成本是很高，效率是很低的。很多事情都是说，哎，干脆一人把他干完了，也比跟很多人商量着做要快很多。所以呢，如果你有一个特别特别强的基座模型，要肯定要比一大堆的模型凑一块干活要顺畅的多。大模型之间的配合呢，其实更像是一堆人商量着干活。就是为什么原来没有统一接口，大家都是一大堆的模型让你去选，这个也是有原因的。</p>



<p class="wp-block-paragraph">GPT5的这种方式呢，为什么说我感觉它像一个坑呢？这是一种突c的全能型助手，就是你甭管是问他什么问题，他都来给你判断意图，然后进行回答。可以说呢，是像端到端的这种智能助手的方向迈进了一大步。未来呢，给这种端到端的黑盒子做定制开发，或者是和系统集成的话，应该是比较费劲的。为什么呢？就是各种OpenAI基础上搭建的这个系统的话，它的底层会没有那么稳定。就是你每一次把命令扔进去以后，你不知道它会用哪个模型给你回复。比如说你写了5,000字的提示词进去，OpenAI给你回答一个好的，或者叫回答一个阅，已阅，那这个事不就这个哭笑不得了吗？或者是你问他说，哎，明吃什么呀，他给你思考了半天，说哎呀明天是一个什么样的日子，啰里吧嗦给你写了2万字出来，这个就可能会造成一些坑。</p>



<p class="wp-block-paragraph">那你说统一接口这件事，对OpenAI自己有什么好处呢？有一个巨大的好处。</p>



<p class="wp-block-paragraph">就是你要再想分析、开解、蒸馏它的模型，就费劲了。原来我们可以逮着O1去蒸馏，蒸馏出来的东西去训练，比如说DeepSeek R1。现在变成了一个统一接口的黑箱子，你说我现在想对你去进行蒸馏，大家想一想这多费劲吧。你不一定哪句话回来一个“已阅”，不一定哪句话回来了，给你回答一大堆乱七八糟事情。这个有点像咱们现在看3D电影，这个3D电影的效果未必好，但是呢，最主要的这个功能是防止盗录。就是我现在拿个手机或者拿个摄像机，在这个电影院里把这个3D电影拍下来，是没用的，出去没法看。所以我觉得统一接口这个事情，未来也许是大方向，但现在的话，应该主要是OpenAI一个防盗措施。</p>



<p class="wp-block-paragraph">现在呢，商业上统一接口这件事呢，我觉得可能也是个坑。为什么？得屌丝者得天下，明显带有歧视性的这种政策，会把屌丝用户都推给竞争对手的。就像我们现在为什么在国内看病，大家老觉得不爽。你去挂普通号，就是要一堆人在那排队乌泱乌泱的，进去了以后这个大夫极其没有耐心。你每次这样看完了以后，你看旁边那个特需门诊窗明几净，大夫特别耐心的这种诊疗制度的话，你肯定会觉得不爽。所以在这样的一个情况下，免费用户你再怎么使，你都会觉得不舒服的。这玩意叫“不患寡而患不居”呢，这个是应该是有坑。</p>



<p class="wp-block-paragraph">而且现在OpenAI，虽然号称每年可以降低成本90%，就是说我推理成本会不断下降，原来是10块钱的事儿，过一年就变一块钱了。但是呢，这一次失去的收益，估计不一定少于90%。目前OpenAI的收入75%来自于订阅，就是一个月20美金也好，一个月200美金也好，就是这个钱是占他整个收入的75%的。2024年可能预计他是挣了40亿美金，然后这个钱可能都不用算训练新模型，就是他原来的这个旧模型的这个推理，压根这个40亿美金都未必覆盖的了。到新的一年，他可能大量的订阅就会流失掉，C端用户一定会大量流失。B端用户的话，如果不走开源的路，那么在B端的这个市场上。</p>



<p class="wp-block-paragraph">面对DeepSeek这种全开源模型，我觉得OpenAI的竞争力是比较差的。而且，如何盈利的问题现在还是需要思考。目前的收入还是很难覆盖公司其实有三大成本（不算人员成本）：第一个是训练成本，第二个是推理成本，第三个是推广成本，也就是获取用户的成本。</p>



<p class="wp-block-paragraph">训练成本，比如说我招了一大堆科学家回来，来做新模型，我要去收集数据。这个成本是一次性的，我有一个模型可以对外服务了，我就可以一直收钱了。推理成本的话，就是你要让一大堆的GPU在那等着给我们回答问题。推广成本的话，OpenAI在这个超级板上花了1,400万美金，那个就叫推广成本。</p>



<p class="wp-block-paragraph">正常的一个公司运作下来，应该是训练成本最低，推理成本应该比训练成本高一些，推广成本有可能会比推理成本还要再高一些。但是现在这一块大家还在有争论，为什么？因为原来推广成本最高的一个六小虎，现在快玩不下去了。Kimi花了好多钱去推广，结果发现DeepSeek一出来，完全为他人做嫁衣了。</p>



<p class="wp-block-paragraph">使用大模型聊天工具这件事上，用户基本上是没有忠诚度的。只要有一个比你好的基座大模型，大家就直接跑了。所以大家也在想说，我是不是不应该花钱去推广，还是应该把这个模型再往前推一步。但是这个事没有地吃后悔药去。后面的话，我估计OpenAI还会有比较大的调整，应该会开源一部分东西出来。你如果不开源的话，对于ToB市场是基本上没有办法的。</p>



<p class="wp-block-paragraph">说完OpenAI以后，咱们再讲讲李彦宏同学。那真的给大家演绎了一下，什么叫唾面自干。文心一言不但要免费还要开源。李彦宏呢，就属于被OpenAI忽悠瘸了的那个，上来就开始收费，什么都不行。文心一言还比较烂的时候，就找人去收钱，而且呢，一个月是50多块钱，很贵的这个玩意在中国。当然，这坑肯定是他自己愿意跳的嘛。搜索引擎嘛都是这样，因为他后边还有搜索广告输入。你一旦是免费让人用搜索，免费让人用这个东西，那你这个搜索广告收入就没有了。</p>



<p class="wp-block-paragraph">所以，李彦宏就跳到这坑里去了。如果模型还没有遥遥领先就开始收费的话，那用户肯定是很反感的吧。他现在到底有多少人订阅了文心一言4.0版本？反正我是从来没有用过，也从来没有定过。现在的话，直接就是180度大转弯，文心一言全部的模型都免费，而且直接开放深度搜索功能。而且呢，带有搜索功能的其实是叫文心一言4.0 Turbo的一个版本。带有搜索功能的所有大模型，一般都是有什么Turbo、light呀，或者是快速的Flash呀，有这样的这种标签在上的。就是它实际上是一个中量级的，我估计可能也就是30B或者是70B这样的一个模型，绝不可能是那种几百B的模型。这是文心1.4.0 Turbo的一个版本。他准备呢，在未来几个月陆续发布4.5版本。他到底是陆续发布，还是直接向OpenAI学习，整一个统一接口出来，现在还不确定。而且呢，讲到6月30号，4.5版本就要开源。但是呢，具体4.5版本有几个版本开源，哪些不开源，哪些到现在都没有说。</p>



<p class="wp-block-paragraph">另外呢，在让人失望这件事上，百度是从来没有让人失望过。我看到新闻以后就好开心的，赶快跑到百度去用一下呗，结果告诉你说不行，你现在还用不了，你要收费。我说不是免费了吗？他说对，我们从4月1号才开始免费的。那天是愚人节，我们要从愚人节那天开始免费。为什么会有这么傲慢的人？你这个免费了就要在愚人节嘲笑我是傻瓜，那天给我来用。今天我上去看了，还要求付费。据说最近一段时间，百度在开会研究怎么退款，因为有些人直接订了一年的，那你没有用掉的这个部分是要给人退钱的。未来到底会不会做统一模型的入口，这个还有待来去看。百度这条路会更加的难走，为什么呢？主要是搜索收入。因为一旦大家转型了，说我们以后都去用AI搜索了，百度的搜索广告输入就没了。现在根本就没有办法去填补这块空白。就算是我们去交这每个月的使用费，他挣那点钱也绝对弥补不了搜索引擎的或者搜索广告的这个输入。</p>



<p class="wp-block-paragraph">根本就顶不住。所以，一旦流量流向了免费的百度文心一言深度搜索功能的话，百度的命格子就断了。谷歌其实也面临同样的问题。谷歌的处理方式是什么呢？到现在为止，Gemini的客户端还收费，但是呢，AI&nbsp;<a href="http://studio.google.com/" target="_blank" rel="noreferrer noopener">studio.Google.com</a>，就是Gemini的这个程序员网站，大量的模型是可以免费使用的，最新的模型都在那里使。所以，谷歌是非常矛盾的。通过这个Gemini调用谷歌搜索，这个功能是可以的。我原来算过，具体是一毛多钱还是两毛多钱，我想不起来了，反正你调一次就要给钱，调一次就要给钱。这个到底是不是未来的方式不好说，大家也还在摸索。</p>



<p class="wp-block-paragraph">Grok3和Llama4应该是在未来几周都会出来。所以我估计呢，2月和3月份应该会非常非常热闹，大家所期待的大模型都会出来。现在还有人说Claude也快出4了，这个事现在大家也在期待看看，他们到底能够做出一个什么样的东西出来。未来的模型市场，会向什么样的方向发展呢？其实核心的问题，到现在为止依然没决掉。什么是核心问题？就是大模型到底咋挣钱。这个事情其实到目前为止，谁也没想明白，特别是C端的钱，到底怎么把它挣回来。因为B端的钱，你一旦有这个彻底开源免费的版本了，这个B端的钱，就基本上跟大模型公司没关系了，后边的就是系统集成公司该去挣这个钱了。因为我们现在已经都有开源、免费的大模型了，我们只要用这个大模型就可以了，剩下的就是，我们去买这个几百万一台的一体机，DeepSeek R1一体机，买的过程中呢没准还可以有些回扣。剩下能够挣的钱就是C端的钱。那么C端到底咋挣钱？是这个广告费吗？还是做电商呢？还是做直播带货还是做什么？这个还是需要未来一段时间大家去思考。</p>



<p class="wp-block-paragraph">OpenAI想的这个方式，就是给这个免费用户用笨一点的模型，给这个付费用户用聪明一点的模型。这件事呢，反正我觉得，这是OpenAI为整个行业挖的下一个坑，这个大家拭目以待，等这个事情开始跑起来以后。</p>



<p class="wp-block-paragraph">咱们看看效果到底怎么样。这就是我们今天的第一个故事：鲶鱼已经来了，所有的鱼都得动起来，甭管你乐意不乐意。DeepSeek来了，所有的人就不要再想着在ToB这块能够大捞特捞了。在ToC这一块儿，怎么去寻找新的商业机会和商业模式，才是大家需要去思考的问题。好，这就是我们今天的第一故事。</p>
]]></content:encoded>
					
		
		
			</item>
		<item>
		<title>软银OpenAI日本公司背后的资本阳谋——5,000亿星际之门是如何影响全球AI格局的？</title>
		<link>https://lukefan.com/2025/02/05/%e8%bd%af%e9%93%b6openai%e6%97%a5%e6%9c%ac%e5%85%ac%e5%8f%b8%e8%83%8c%e5%90%8e%e7%9a%84%e8%b5%84%e6%9c%ac%e9%98%b3%e8%b0%8b-5000%e4%ba%bf%e6%98%9f%e9%99%85%e4%b9%8b%e9%97%a8%e6%98%af/</link>
		
		<dc:creator><![CDATA[Luke Fan]]></dc:creator>
		<pubDate>Wed, 05 Feb 2025 00:40:36 +0000</pubDate>
				<category><![CDATA[AIGC]]></category>
		<category><![CDATA[AI Agent]]></category>
		<category><![CDATA[AI agent方向]]></category>
		<category><![CDATA[AI代金券机制]]></category>
		<category><![CDATA[AI任务优化]]></category>
		<category><![CDATA[AI分析工具]]></category>
		<category><![CDATA[AI创新瓶颈]]></category>
		<category><![CDATA[AI劳务派遣制度]]></category>
		<category><![CDATA[AI商业化]]></category>
		<category><![CDATA[AI商业模式]]></category>
		<category><![CDATA[AI市场前景]]></category>
		<category><![CDATA[AI市场变革]]></category>
		<category><![CDATA[AI开放性]]></category>
		<category><![CDATA[AI手动规划]]></category>
		<category><![CDATA[AI技术]]></category>
		<category><![CDATA[AI技术应用]]></category>
		<category><![CDATA[AI技术演变]]></category>
		<category><![CDATA[AI技术进化]]></category>
		<category><![CDATA[AI技术革新]]></category>
		<category><![CDATA[AI新方向]]></category>
		<category><![CDATA[AI旧势力]]></category>
		<category><![CDATA[AI时代竞争]]></category>
		<category><![CDATA[AI普世性]]></category>
		<category><![CDATA[AI核心问题]]></category>
		<category><![CDATA[AI综合能力]]></category>
		<category><![CDATA[AI舆论制高点]]></category>
		<category><![CDATA[AI行业垄断]]></category>
		<category><![CDATA[AI行业竞争]]></category>
		<category><![CDATA[AI财报分析]]></category>
		<category><![CDATA[AI资源整合]]></category>
		<category><![CDATA[Claude 3.5]]></category>
		<category><![CDATA[Deep Research]]></category>
		<category><![CDATA[DeepSeek]]></category>
		<category><![CDATA[DeepSeek影响]]></category>
		<category><![CDATA[Gemini 2.0]]></category>
		<category><![CDATA[GPT-4]]></category>
		<category><![CDATA[Meta]]></category>
		<category><![CDATA[OpenAI]]></category>
		<category><![CDATA[OpenAI代金券]]></category>
		<category><![CDATA[OpenAI最新动态]]></category>
		<category><![CDATA[SB OpenAI Japan]]></category>
		<category><![CDATA[Softbank AI]]></category>
		<category><![CDATA[大手企业AI改革]]></category>
		<category><![CDATA[孙正义]]></category>
		<category><![CDATA[开源大模型]]></category>
		<category><![CDATA[微软与OpenAI合作]]></category>
		<category><![CDATA[微软云代金券]]></category>
		<category><![CDATA[日本AI]]></category>
		<category><![CDATA[日本AI困境]]></category>
		<category><![CDATA[日本AI市场分析]]></category>
		<category><![CDATA[日本AI应用案例]]></category>
		<category><![CDATA[日本AI掉队]]></category>
		<category><![CDATA[日本AI未来]]></category>
		<category><![CDATA[日本AI行业现状]]></category>
		<category><![CDATA[日本企业AI应用]]></category>
		<category><![CDATA[日本科技创新]]></category>
		<category><![CDATA[日本移动运营商]]></category>
		<category><![CDATA[星际之门]]></category>
		<category><![CDATA[未来AI行业趋势]]></category>
		<category><![CDATA[水晶智能]]></category>
		<category><![CDATA[科技创新]]></category>
		<category><![CDATA[自动规划]]></category>
		<category><![CDATA[谷歌AI]]></category>
		<category><![CDATA[资本运作]]></category>
		<category><![CDATA[软银]]></category>
		<guid isPermaLink="false">https://lukefan.com/?p=1886</guid>

					<description><![CDATA[啊啊啊啊！！！大新闻！！孙正义带着他的软银，狠狠出手，成立了SB OpenAI Japan！这可不仅仅是个名字，它背后隐藏着一场科技革命的序幕！你们知道这意味着什么吗？

首先，SB可不是骂人的意思！它代表的是软银，哇哦！这就给人一瞬间的误解啊！孙正义这位商业巨头，真的是视野宽广，目光长远啊！他不仅要参与竞争，更想占据行业的话语权！

想想看，在技术不断质疑和竞争对手层出不穷的情况下，OpenAI为了稳住自己在市场的地位，不得不频频发声，是不是有点压力山大呀！而在这个背景下，SB OpenAI Japan的成立，恰好为OpenAI带来了新的资源和机会！每年30亿美元的合作服务，简直是个大肥肉啊！

但是，嘿嘿，这里边还有更深的故事哦！软银的这个新项目，核心产品“水晶智能”，听上去就让人期待不已！打算靠AI agent来服务日本这些大企业，难道日本真的要面临掉队的危机吗？

想象一下，传统企业中的各种流程被AI替代，而这些流程又是老一辈的决策者们不愿轻易改变的！我们真的要警惕啊，谁能打破这种壁垒，谁就能在未来的市场中脱颖而出！

总而言之，SB OpenAI Japan的成立，不仅是一场资本运作，还是对日本科技未来方向的深刻挑战！未来会怎样？我们拭目以待吧！别忘了点赞、评论、分享哦！让更多人加入这个讨论吧！💥💥

软银OpenAI日本公司背后的资本阳谋——5,000亿星际之门是如何影响全球AI格局的？

软银与OpenAI联手成立SB OpenAI Japan，坐标日本，目标是借助孙正义的“水晶智能”计划推动AI agent的实际应用。然而，这一举措背后却隐藏复杂的资本运作：5,000亿星际之门项目如何通过代金券等方式促进高效落地？OpenAI连续发声应对技术、安全性和垄断质疑，而DeepSeek的开源战略成为最大挑战。尽管每年30亿美金的交易为双方带来可观收入，日本在AI时代或因自上而下的创新机制继续掉队。未来，AI产业是要扶助传统巨头，还是培育新兴生产力？这一选择将决定全球AI的走向。本次深度解析涵盖了SB OpenAI Japan的成立背景、资本策略、技术创新方向以及可能的行业影响，可供行业人士全面了解其意义。]]></description>
										<content:encoded><![CDATA[
<figure class="wp-block-embed is-type-video is-provider-youtube wp-block-embed-youtube wp-embed-aspect-16-9 wp-has-aspect-ratio"><div class="wp-block-embed__wrapper">
<iframe title="软银OpenAI日本公司背后的资本阳谋——5,000亿星际之门是如何影响全球AI格局的？" width="900" height="506" src="https://www.youtube.com/embed/BdCBL-RdV_8?feature=oembed" frameborder="0" allow="accelerometer; autoplay; clipboard-write; encrypted-media; gyroscope; picture-in-picture; web-share" referrerpolicy="strict-origin-when-cross-origin" allowfullscreen></iframe>
</div></figure>



<p class="wp-block-paragraph">SB OpenAI日本公司宣布成立，这怎么听怎么像是在骂人呢？大家好，欢迎收听老范讲故事的YouTube频道。今天咱们来讲一讲SB OpenAI日本公司到底是一个什么样的情况。</p>



<p class="wp-block-paragraph">孙正义上台宣布Softbank OpenAI Japan这个公司成立了，所以这个SB不是骂人，它是软银Softbank的意思。今年我们发现OpenAI的声音连续不断，这是为什么呢？原因也很简单，老大的位置不是很稳固了。你要想在这一个行业里面当老大，要么你技术特别好大家都服气，比如像谷歌这样的，各个行业里头，只要跟计算机技术有关的，大家都知道谷歌的技术最好；要不然你垄断，比如像苹果这样，或者像Meta这样的，在社交媒体里我直接垄断了，大家知道你是老大。</p>



<p class="wp-block-paragraph">如果技术也被人质疑了，花了好多钱训练出一堆模型来，别人也都可以达到了Claude 3.5、Sonnet、Gemini 2.0、Flash这样的模型，其实现在已经跟GPT-4相差仿佛了。你新发布了一大堆乱七八糟的模型呢，都是很小众的高端产品，对于大众来说无感。在这种情况下，你的技术就会被人质疑。</p>



<span id="more-1886"></span>



<p class="wp-block-paragraph">垄断的话，现在OpenAI距离这个位置还相差甚远，因为现在整个大模型行业里的格局就没有确定下来，后边还有谷歌呢，还有亚马逊呢，还有一大堆中国厂商在这盯着呢，所以垄断也难。那么怎么办呢？占据舆论的制高点吧。这个道德现在他还占不住，他占据舆论的制高点。</p>



<p class="wp-block-paragraph">OpenAI呢，本身是比较擅长于造势，比较擅长于占据舆论制高点的。咱们要看到去年的Sora、去年的GPT-4以及去年连续12天发布会什么的，OpenAI很会搞事儿。它呢，可以把有限的新产品、新特性通过一些非常戏剧化的手段，让整个的社会形成一个讨论风潮。因为DeepSeek出来了，大家对他的各种技术、各种挤牙膏更加质疑了。而且DeepSeek跟其他的所有这些竞争对手都不一样。</p>



<p class="wp-block-paragraph">Claude 3.5是个闭源的，Gemini 2.0也是个闭源的。结果现在，DeepSeek可给了你一个开源的，还巨便宜无比。它跟原来的像Llama这样的开源还不一样，因为Llama对OpenAI基本上是行不成竞争的，而DeepSeek是可以完完全全跟OpenAI打个有来有回的一个状态。</p>



<p class="wp-block-paragraph">现在，OpenAI必须要出来，不停地发出声音说：“来，公众们，虽然我现在发布的产品都是给你们的老板们用的，给这些真正的社会精英用的，但是请把眼光看过来，不要把眼光挪走。”这就是今年为什么OpenAI连续发声的原因了。</p>



<p class="wp-block-paragraph">软银OpenAI日本公司成立，也是OpenAI连续发声的最新的一个声音。这个呢，是软银跟OpenAI各自出资50%成立的一个合资公司，但是具体出了多少钱，并没有对外宣布。为什么呢？因为这应该是星际之门整个资本运作中的一个环节。说了要给5,000亿造星际之门，那这5,000亿怎么变出来呢？你不是真的拿出5,000亿现金啪拍这儿，你肯定是可以用很多的方式让这个钱在里边转起来。你只要最后总的流动量达到5,000亿了就可以了。</p>



<p class="wp-block-paragraph">所以呢，软银OpenAI日本公司应该也是在为这5,000亿添砖加瓦的一个事情。在这里面唯一确定的交易是什么呢？就是软银集团每年会向OpenAI采购30亿美金的服务，用于自己的子公司或者是下面的一些分支机构。这个是现在唯一确认的交易，每年30亿美金。</p>



<p class="wp-block-paragraph">假设吧，在这个里边每家出了100亿美金，软银出了100亿美金，OpenAI出了100亿美金，200亿美金我们把这公司做下来了。OpenAI这100亿美金呢，估计他是拿不出来。那个钱自己在家里头烧显卡玩都不够呢。而且OpenAI拿到的大量的投资实际上压根就不是现金，而是什么呢？而是微软云的代金券。你不能说我跑到软银这来说我出100亿美金，咱们来做一个公司，结果掏出一堆代金券，这还不够人笑话的呢。</p>



<p class="wp-block-paragraph">那怎么办呢？说我OpenAI出了100亿美金吧。我先欠着，我先不实缴。每年软银不是要给我30亿美金来买服务吗？把这30亿美金收到了以后，再填回到OpenAI的日本分公司去，不就完事了吗？你填个三年基本上填满了，剩下的钱再出一些别的技术也就搞定了。咱们就技术入股一下嘛，一里一外，这个钱不就赚过来了吗？</p>



<p class="wp-block-paragraph">假设是这么赚法，这笔钱呢，完完全全可以成为OpenAI投资SB OpenAI Japan的一个代金券，就跟微软发给OpenAI这个130亿的代金券是一样的。说你OpenAI，你就拿着130亿代金券到微软去买这个云服务就完事了。它是这样的一个运作机制。这样运作起来以后，第一，OpenAI每年就多出30亿美金的收入来。他去年应该是40亿美金吧，但今年一下就多出30亿，而且每年都有30亿美金。这也是一个挺好的事情。</p>



<p class="wp-block-paragraph">而且在这笔钱里头，就是每年他会转一圈，30亿从软银集团手里给出来，到OpenAI手里头。OpenAI说来，我再把这个钱填回去，到OpenAI日本的这个公司里头去，大家的销售额就都上升了。这是一个皆大欢喜的事情。</p>



<p class="wp-block-paragraph">对于中国观众来说，软银是一个投资机构，或者是很多人说他是个银行吧，Softbank嘛，它后面有一个bank。但其实大家注意，日本最大的移动营销商之一就是软银，相当于像中国移动这样的一个公司似的。等于中国移动说，我这儿有很多的机房设备，有很多的这种可以作价的一些资产，我们把这些东西打包打包，然后搁在一块去整一个什么事情来。OpenAI，你的服务也打包打包，搁在一块放在里头，每年我们得30亿，来回倒腾一下，你的销售额也有了，我的销售额也有了，整个的资产也上升了。</p>



<p class="wp-block-paragraph">我们5,000亿的星际之门，又盖出了一个小门槛来。他是这么玩的一个事情。而软银呢，这一次整的这个项目呢，叫SB OpenAI Japan，这个项目里头有一个核心产品叫水晶智能，这个产品呢，估计会让日本彻底掉队。</p>



<p class="wp-block-paragraph">为什么呢？你说每年花30亿来回倒腾来倒腾去，但是最后日本的这些企业，你肯定还是能够用到一部分OpenAI的这个产能的呀，或者说他提供的这个服务，你还是能用得到的。按道理说呢，这些产能应该是部署在日本的软银机房里的。原来OpenAI的所有这些服务必须要部署到微软云的这个机房里边去，但是软银如果把新的一轮融资搞定的话，微软云应该就可以去松口。在这样的情况下，为什么会让日本反而落后呢？</p>



<p class="wp-block-paragraph">其实所谓的水晶智能，就是以OpenAI的各种大模型为基础开发的AI agent，或者说是AI agent的一个集群。到目前为止，其实大家并不知道水晶智能到底是以一种什么样的方式来对外服务的。但是呢，以孙正义现在讲出来的话来说，应该是自上而下的创新，也就是首先为日本这些大手企业服务。他讲述我们要在未来一段时间里头，把1亿个大手企业里面遇到的这种场景变成AI agent，让AI agent来替代这1亿个场景。就是你一旦听他想这个话的时候，你就知道完蛋了。</p>



<p class="wp-block-paragraph">为什么？我们继续讲，水晶智能这样的东西出来以后，大家知道大手企业肯定并没有那么容易就屈从，说来我就用吧。大手企业都是自己一帮老头坐在一块，开个会说，我们哪儿改一个什么东西，哪儿添一个什么预算，哪个地方稍微调整一下流程。那一定还是要有榜样的力量，谁是榜样呢？软银手里头还有一家公司叫ARM，说来你先用上，你先用水晶智能，把内部的各种研发管理环节都整个改造一遍，其他人说来你们参观一下，俺们就是这么干的，你们也照这样干吧。他大概是要这么去搞法。</p>



<p class="wp-block-paragraph">我记得去年我从日本回来以后，做过一期节目，讲过日本在互联网、移动互联网的时候掉队了，而在AIGC时代会掉得更远。原因其实很简单，并不是日本人不聪明，也不是说他们不愿意花钱，或者说人家没有看到这块机会。唯一的原因，就是他们这种自上而下的创新，以及他们的这种劳务派遣制度。</p>



<p class="wp-block-paragraph">这个是造成日本在每一次大的技术浪潮前都会掉队的一个核心原因。为什么呢？不打破旧的桎梏，就不可能产生新的交易。没有新的利润被分配，就没有办法到新的时代里去跟这些新时代大厂去竞争。</p>



<p class="wp-block-paragraph">你比如说，原来都是大厂往下派单子，那他就没有办法去产生一个像谷歌那样的广告公司，去跟谷歌去打一仗。移动互联网时代，他也没有能力去产生像TikTok这样的产品，去跟YouTube、去跟Facebook去战斗。因为大厂永远不会有这种需求的。你越是维护大厂的利益，越是自上而下去创新，你就越没有机会参与到新的竞争里边去。</p>



<p class="wp-block-paragraph">所以，摆在AI面前的实际上是两条路。第一条路是协助旧有势力，降本增效，稳固地位。那国内其实也有很多厂在干这个事。而另外一条路呢，就是创建新的用户体验，创建新的用户需求，寻找新的市场。一部分旧有势力呢，在这个过程中会沦为基础设施，已经退出新时代的竞争；而另外一部分就直接死掉了。</p>



<p class="wp-block-paragraph">这个才是每一次技术革新真正带来的这种社会的改变，而不是说每一次技术革新了，我们把旧的体制、旧的这些既得利益者、旧的势力继续维护，让他们继续稳固的发展下去。很那个就已经放弃了在新时代竞争的这个入门卷了。</p>



<p class="wp-block-paragraph">哪些旧有势力在新时代沦为了基础设施呢？其中有一个最典型的行业就是Softbank这个行业。移动运营商在3G时代的时候，移动运营商真的是如日中天，各种服务都是他们提供的。但是一旦到了4G时代，移动运营商马上就退居后台了。而在前台上叱诧风云的，就变成互联网企业，移动互联网企业再也没有移动运营商的任何事情了。</p>



<p class="wp-block-paragraph">咱们现在看到站在前台、努力大放光彩的这些企业里头，有哪个是移动运营商出身吗？一个都没有。谷歌是吗？苹果是吗？Meta是吗？中国的BAT加上字节，谁是移动运营商出身？没有一个是。那难道移动运营商在这个转换的过程中没有挣扎过吗？挣扎过呀，他们也希望在移动互联网时代。</p>



<p class="wp-block-paragraph">在互联网时代能够占有一席之地，但是这个是没有办法的，因为他原来的这个桎梏一定会捆绑他的手脚。你不打破的话，就永远掺不起来。所以孙正义搞的这套SB OpenAI Japan，一定会拉着日本进一步退出新时代的竞争。</p>



<p class="wp-block-paragraph">那么现在孙正义他们要搞AI agent，AI agent也是今年整个AIGC行业里边必须要去冲的一个山头了。那么AI agent到底是应该怎么做呢？OpenAI为我们指明了什么样的方向呢？</p>



<p class="wp-block-paragraph">OpenAI在今年实际上在AI这里头下了三部棋。第一部叫task，它可以为我们去创建各种定时任务。第二个呢叫operator，等于是用户可以直接操作远程的浏览器，通过网站解决各种实际问题。第三个呢是这两天发布的叫deep research，是干嘛的呢？就是你给了他一个命令以后，他去搜索几百个网页，然后再进行总结归纳之后，得到一份像财报一样的报告。这是OpenAI给出的三个样例。</p>



<p class="wp-block-paragraph">我们现在要看到AI agent，去年大家都在努力的做，但是OpenAI指向了不同的方向。它指向了什么呢？第一个叫做手动规划跟自动规划。原来我们使用很多AI agent都是进行手动规划的，我们要去设置自己的私有的本地库或者是本地支付，要去设定工作流程，要去设定各种各样的工具，让这个AI agent可以去发邮件或者是执行交易，可以去做这些事情。</p>



<p class="wp-block-paragraph">原来是这样的，但OpenAI说不，不是这样的。我们应该让他自动的去规划。你只要告诉他干什么，剩下的你就别管他了。哪怕是像deep research这样的功能，你只要告诉他我具体要去做哪方面的研究，他自己去找，去找完了以后自己给你总结。你不需要告诉他使用谷歌搜索，搜索这个财报，再去搜索学术论文，然后再怎么去进行总结归纳。你不需要告诉他，这个事情他自己就搞定了，然后就给你出一个很完整的报告出来。这是OpenAI给我们指明的方向。</p>



<p class="wp-block-paragraph">然后，另外呢，就是综合能力和普世性。这个问题其实OpenAI也解决不了。OpenAI现在给出的这三个AI agent：task、operator、deep research，实际上都是分方向的。让某一个AI政策可以解决所有问题，解决不了，必须要术业有专攻。</p>



<p class="wp-block-paragraph">OpenAI现在跟所有做AI agent的人一样，面临了一个新问题。是什么呢？就是普通人没法用这东西。他希望通过自动规划，让普通人能够用上这些AI agent。但是，咱们就这么说吧，财报，这是由专业人士直接替我们书写的内容。我们到底有多少人可以坐在这，把上市公司每年每季的这个财报看明白了？绝大部分人能够去看明白财报解读，就已经很不错了。</p>



<p class="wp-block-paragraph">真给你一份财报，看着一大堆的Excel表格，在这里边找到各种的问题，这个是很难的。大家要注意，这个财报写的时候，并不是说我要把所有的事情都给你写清楚。这可能跟很多人想象的不一样，财报写的时候也是要粉饰太平的，也是要把很多的问题隐藏起来的。</p>



<p class="wp-block-paragraph">虽然他有一定的规范和格式要求，要求你必须要去披露所有的信息，但是我们可以用很多的方式，让有些信息被你忽略掉。这个是所有写财报的人必须要掌握的一个技巧，既要合规，又要突出重点，隐藏一些问题。看财报的人也是需要训练的，这些东西对于普通人来说，其实已经距离很远了。</p>



<p class="wp-block-paragraph">所以，像deep research这样的工具，就算给普通人了，他拿出来的东西，大部分人是看不明白的，也没有能力去阅读这种东西。那么，这样的东西对于普通人来说，就是无感。普通人也不会愿意帮他去传播这件事情。我看deep research出来以后，现在在推特平台上去讲这个东西很棒的，都是一帮老板。这些人可能会有需求，说我要去做这种深度的研究。绝大部分的人可能压根就没这个需求，或者说就算你花200美金一个月，开启这个功能了，进去search一次，那也就是说高山仰止，不明觉厉，这个东西写的好棒，完了。</p>



<p class="wp-block-paragraph">这个事情也就不用普通人每一次都进去自取其辱了。现在我还使不了这功能，因为我是20美元一个月的这个账号。据说再过一个月，这个deep research会开放给我们使用，一天大概能用个几次的样子。但是大家要相信，这一份财报类的这种综合报告，一般人一天是看不完的。那么2025年大家努力的方向是什么呢？咱们先不研究AI agent的事情，咱们现在要看到山姆奥特曼，他们在干嘛呢？</p>



<p class="wp-block-paragraph">2025年，星际之门是他们的一个最核心、最重要的事情。山姆奥特曼跟孙正义前面刚在川普面前去签了字。这两天呢，因为SB OpenAI Japan成立，山姆奥特曼跑去日本了，孙正义带着山姆奥特曼去见石破茂去了，日本首相。有来有回嘛，过两天山姆奥特曼要再带着孙正义回去见川大爷。大家要重新去运作起来。那么这个到底在干嘛呢？其实我觉得这是一个阳谋，这是在对抗国运级的DeepSeek。</p>



<p class="wp-block-paragraph">很多人说DeepSeek是一个国运级的科技创新。那么为什么这是一个阳谋呢？如果DeepSeek真的跑去跟国家绑定了，那么OpenAI可能就真赢了。并不是说国家扶持DeepSeek或者国家主持DeepSeek的工作就会有什么问题。孙正义做水晶智能的时候，其实已经讲过了，到底新的技术是应该培养新的交易、新的大型公司，还是让传统的公司、传统的势力变得更加强大，这是两条不同的路。</p>



<p class="wp-block-paragraph">而现在的话，OpenAI、孙正义这些人在日本美国之间，见完首相见总统，见完总统见首相的话，那么DeepSeek可能未来也会去跟最上层绑定，就不会有这么多的机会去扶植或者是孵化真正的新兴生产力。新兴的这些公司可能就不行了。大家要注意，新质生产力还是传统大公司干的活，而我刚才讲的这些新兴的是要找到新的场景，培植新的这种大厂出来，这个是完全不一样的。</p>



<p class="wp-block-paragraph">好，这就是我们今天讲到的SB OpenAI Japan的故事。感谢大家收听。</p>



<p class="wp-block-paragraph">请帮忙点赞、点小铃铛，参加Discord讨论群。也欢迎有兴趣、有能力的朋友加入我们的付费频道。再见。</p>
]]></content:encoded>
					
		
		
			</item>
		<item>
		<title>OpenAI连续12天发布会回顾：科技领军者的12大跨越式创新，Sora、Canvas与GPT-4O带来哪些启示？</title>
		<link>https://lukefan.com/2024/12/16/openai%e8%bf%9e%e7%bb%ad12%e5%a4%a9%e5%8f%91%e5%b8%83%e4%bc%9a%e5%9b%9e%e9%a1%be%ef%bc%9a%e7%a7%91%e6%8a%80%e9%a2%86%e5%86%9b%e8%80%85%e7%9a%8412%e5%a4%a7%e8%b7%a8%e8%b6%8a%e5%bc%8f%e5%88%9b%e6%96%b0/</link>
		
		<dc:creator><![CDATA[老范 讲故事]]></dc:creator>
		<pubDate>Mon, 16 Dec 2024 00:39:10 +0000</pubDate>
				<category><![CDATA[AIGC]]></category>
		<category><![CDATA[AGI]]></category>
		<category><![CDATA[AIGC行业]]></category>
		<category><![CDATA[AI技术]]></category>
		<category><![CDATA[AI硬件]]></category>
		<category><![CDATA[AI行业趋势]]></category>
		<category><![CDATA[Apple Intelligence]]></category>
		<category><![CDATA[Canvas]]></category>
		<category><![CDATA[ChatGPT]]></category>
		<category><![CDATA[Dalle更新]]></category>
		<category><![CDATA[Gemini 2.0]]></category>
		<category><![CDATA[GPT4.5]]></category>
		<category><![CDATA[Her语音功能]]></category>
		<category><![CDATA[LLaMA 3.3]]></category>
		<category><![CDATA[Meta]]></category>
		<category><![CDATA[O1订阅]]></category>
		<category><![CDATA[OpenAI发布会]]></category>
		<category><![CDATA[Project功能]]></category>
		<category><![CDATA[Siri集成]]></category>
		<category><![CDATA[Sora]]></category>
		<category><![CDATA[产品发布]]></category>
		<category><![CDATA[产品总结]]></category>
		<category><![CDATA[创新产品]]></category>
		<category><![CDATA[创新科技]]></category>
		<category><![CDATA[强化微调]]></category>
		<category><![CDATA[技术革新]]></category>
		<category><![CDATA[新功能]]></category>
		<category><![CDATA[新科技产品]]></category>
		<category><![CDATA[智能体框架]]></category>
		<category><![CDATA[未来科技]]></category>
		<category><![CDATA[用户交互]]></category>
		<category><![CDATA[用户交互界面]]></category>
		<category><![CDATA[用户体验]]></category>
		<category><![CDATA[用户体验提升]]></category>
		<category><![CDATA[科学家工具]]></category>
		<category><![CDATA[科技产品]]></category>
		<category><![CDATA[科技产品创新]]></category>
		<category><![CDATA[科技产品创新趋势]]></category>
		<category><![CDATA[科技产品发展]]></category>
		<category><![CDATA[科技产品发布]]></category>
		<category><![CDATA[科技产品趋势]]></category>
		<category><![CDATA[科技公司]]></category>
		<category><![CDATA[科技公司产品]]></category>
		<category><![CDATA[科技公司产品创新]]></category>
		<category><![CDATA[科技公司产品创新趋势]]></category>
		<category><![CDATA[科技公司产品发展]]></category>
		<category><![CDATA[科技公司产品发布]]></category>
		<category><![CDATA[科技公司创新]]></category>
		<category><![CDATA[科技公司发展]]></category>
		<category><![CDATA[科技公司发展趋势]]></category>
		<category><![CDATA[科技公司发布]]></category>
		<category><![CDATA[科技公司发布会]]></category>
		<category><![CDATA[科技公司行业趋势]]></category>
		<category><![CDATA[科技公司趋势]]></category>
		<category><![CDATA[科技创新]]></category>
		<category><![CDATA[科技创新趋势]]></category>
		<category><![CDATA[科技发展方向]]></category>
		<category><![CDATA[科技发布]]></category>
		<category><![CDATA[科技发布会]]></category>
		<category><![CDATA[科技巨头]]></category>
		<category><![CDATA[科技行业发展]]></category>
		<category><![CDATA[科技行业趋势]]></category>
		<category><![CDATA[科技趋势]]></category>
		<category><![CDATA[行业领军]]></category>
		<category><![CDATA[视频交互]]></category>
		<category><![CDATA[视频模型]]></category>
		<category><![CDATA[视频生成]]></category>
		<category><![CDATA[视频生成模型]]></category>
		<category><![CDATA[语音功能]]></category>
		<category><![CDATA[语音识别]]></category>
		<category><![CDATA[谷歌]]></category>
		<category><![CDATA[项目管理]]></category>
		<category><![CDATA[项目管理工具]]></category>
		<category><![CDATA[高级语音]]></category>
		<category><![CDATA[高级语音功能]]></category>
		<guid isPermaLink="false">https://lukefan.com/?p=1770</guid>

					<description><![CDATA[啊啊啊啊！OpenAI的连续12天发布会真的太刺激了！🤯🤯🤯每天都有新惊喜！我已经迫不及待想看看最后会发布什么了！

先来给大家总结一下前7天都发布了啥：

**Day 1：**OpenAI说，我们要涨价了！😱😱😱O1和O1 Pro每月200美金！不过对于咱们普通人来说，4.0就够用了啦～

**Day 2：**发布了一个叫强化微调的科学家工具，普通人用不上，跳过跳过！

**Day 3：**期待已久的Sora终于来了！🎉🎉🎉我连夜爬上去体验了一把，效果确实比其他视频模型好一些，交互方式也更方便了！

**Day 4：**Canvas免费开放！🎉🎉🎉这个功能真的绝绝子！以后都不用Office了！

**Day 5：**Apple Intelligence和Siri接入ChatGPT，可惜国内用不了😭

**Day 6：**Her真的来了！🎉🎉🎉可以打开摄像头和GPT聊天了！我试了试，真的太好玩了！

**Day 7：**发布了Project功能，可以把文件上传给ChatGPT处理，效率提升1000%！

除了OpenAI，谷歌、Meta、Pica、Midjourney等公司也都发布了新产品，AIGC行业真的太卷了！😱😱😱

我已经搬好小板凳，坐等OpenAI接下来的发布会了！你们最期待什么功能呢？评论区告诉我！

OpenAI连续12天发布会回顾：科技领军者的12大跨越式创新，Sora、Canvas与GPT-4O带来哪些启示？

在连续12天的发布会中，OpenAI已经发布了包括O1、强化微调、Sora、Canvas、Apple Intelligence、Her和Project在内的7款重磅产品，从科学家工具到通用用户应用，每款创新都指明了AI行业的未来发展方向。例如，Sora引领了视频生成领域新潮流，Canvas提升了文档与代码编辑效率，而增强语音和视频交互的Her则让人工智能更贴近人类。随着Project进一步探索工作流整合，OpenAI正在为未来取代传统操作系统铺路。这些发布在吸引全球关注的同时，也引发了行业巨头如谷歌、Meta、MidJourney等快速跟进，各大技术公司争相优化多模态生成和视频模型等领域。结合即将推出的Dalle改进版、智能体框架及可能的GPT4.5更新，这场发布盛宴将为未来的人工智能生态打开更多的可能性。]]></description>
										<content:encoded><![CDATA[
<figure class="wp-block-embed is-type-video is-provider-youtube wp-block-embed-youtube wp-embed-aspect-16-9 wp-has-aspect-ratio"><div class="wp-block-embed__wrapper">
<iframe loading="lazy" title="OpenAI连续12天发布会回顾：科技领军者的12大跨越式创新，Sora、Canvas与GPT-4O带来哪些启示？" width="900" height="506" src="https://www.youtube.com/embed/760VNZv1O1k?feature=oembed" frameborder="0" allow="accelerometer; autoplay; clipboard-write; encrypted-media; gyroscope; picture-in-picture; web-share" referrerpolicy="strict-origin-when-cross-origin" allowfullscreen></iframe>
</div></figure>



<p class="wp-block-paragraph">OpenAI的连续12天发布会现在已经过半，发布了些什么东西呢？咱们来总结一下。</p>



<p class="wp-block-paragraph">大家好，欢迎收听老范讲故事的YouTube频道。12天开12场发布会，算是前无古人了。人家以前的发布会都是在集中一两天的时间里，聚集尽可能多的人把它开掉。但是，OpenAI就是要不走寻常路，选择连续发布12天，每天发布一点新东西出来。而且他们的发布会是在网上开了个直播间，有时候山姆·奥特曼在，有时候他不在，大家就一起来讲讲这段时间又做了点什么新东西。这还是非常有趣的一种发布方式，算是把年底这一段时间所有人的注意力又都拉回了OpenAI以及AIGC这个赛道上。</p>



<p class="wp-block-paragraph">那么到年底了，大家都得卷，大伙有没有？有。但是，肯定没有12个。如果真的说年底有12个重磅级产品发布的话，他们也不会用这种方式。应该还是会有很多零七八碎的小功能在这12天发布出来，但也会有一些比较激动人心的东西。而且要卷，大家一起卷嘛。OpenAI作为AIGC行业的领军人物，既然开始卷了，其他人必然会跟进。</p>



<span id="more-1770"></span>



<p class="wp-block-paragraph">前段时间我们讲过，OpenAI的最主要的社会贡献是什么？就是为行业指明方向。他指明了方向，其他人就会跟。那么都发了些什么东西呢？</p>



<p class="wp-block-paragraph">第一天特别逗，首先涨价，上来先说我们做一个200美金一个月的订阅。如果你要去使用O1的完整版或者是O1 Pro，每个月的成本是200美金，这就是第一天发布的东西。而且，O1也好，O1 Pro也好，如果你不是科学家，不是那种真正需要进行推理的人，其实意义没有那么大。对于普通人来说，4O就已经足够了，O1完完全全就是很小众的一个产品。</p>



<p class="wp-block-paragraph">第二天发布的其实还是一个科学家工具，叫强化微调。意思是什么呢？就是大家现在都在讲炼丹，说明这个大模型不知道你到底是什么，不知道你具体要干嘛，所以他经常会所答非所问。</p>



<p class="wp-block-paragraph">我们对这个模型进行一定的微调之后，他就知道说：“哎，我今天是上岗来干什么什么事情呢。”就会做得好一些。OpenAI说来，我们发布一个强化微调的功能，你只需要提供比较少的数据，它就可以有一个非常好的微调的结果。这个呢也是一位科学家上来演示。像这种功能呢，跟前面我们讲的O1一样，就是普通人用不上，都是非常小众的科学家产品。</p>



<p class="wp-block-paragraph">等到第三天，终于有这个大活上来了，Sora千呼万唤始出来。我呢，基本上是等了接近一周的时间才爬上去。Sora出来以后，大家就都疯狂的往上去爬，想去尝试使用。但是呢，他一直是关闭注册的状态。就是你可以在第一个页面上看到演示的这个视频，但是你没有办法登录进去自己去创作。大概是等了，我忘了是几天了，四五天吧，然后才进去。</p>



<p class="wp-block-paragraph">Sora的模型呢，跟其他的一些视频模型比较起来，算是领先一点点。但是具体的感受，其实也没有那么大差异。对于像我这种一个月20美金的plus用户来说，我每个月应该可以生成50段动画。测试了感觉跟Runway、Pica，还有包括国内的可灵和集梦比起来，有差异，但是不是特别明显。从这个模型角度上说，更多的改进是什么呢？就是用户交互方式上改了。他给你了一些故事版，比如说你可以在一个时间线上写多段的这种提示词。这个呢，其实是给了大家很多的启示了。</p>



<p class="wp-block-paragraph">因为以前大家生成图片的时候，你给他一个提示词，他给你画出来没毛病。但是呢，生成视频的时候，再给他一个提示词，让他给你画出来，这个事就有点难了。因为视频是很多张图片凑在一起的嘛。所以说别费劲了，咱们就是在不同的时间点上使用不同的提示词，让这个大模型知道我们怎么在这个场景里边进行转换。我相信很快就会有其他的产品来跟进。</p>



<p class="wp-block-paragraph">到第四天呢，他们发了canvas。canvas其实原来就发过，只是现在告诉大家说，免费用户你也可以用了。现在canvas这个产品呢，基本上是垫进去隔office的命。什么意思呢？就是它等于是有一测试。</p>



<p class="wp-block-paragraph">你可以去跟他聊天了，但是最大的一个窗口实际上是个编辑器。你可以在一个编辑器里边说：“哎，给我去增加点什么内容，删除点什么内容。”然后哪一段呢，稍微的怎么去调整一下。然后你说：“你给我整个检查一下。”再检查一下说：“哎，这段怎么样，那段怎么样？”它有点像Word的使用方式。</p>



<p class="wp-block-paragraph">当然，你可以一边在这种对话框里跟他去聊天，另外一边什么呢？你可以直接在编辑器里改这个文件。改完了以后说：“哎，这样是不是好一点，那样是不是好一点？”就是人跟这个OpenAI的ChatGPT一起配合来去修改这个文件。如果这套东西大家使用习惯了以后，那么就不会再有Office什么事了。</p>



<p class="wp-block-paragraph">它现在呢，只是一个Word文档，大家可以在上面折腾，但是代码也可以，Canvas改代码的效果也是极好的。现在你说有没有像PPT这样的东西，或者像Excel这个表格这样的东西，可以让他在Canvas这边去干活的？我相信未来会有，这一定是奔着Office全家桶去的一个产品，这个产品还是非常非常好用的。现在免费也可以用嘛，这个功能上来以后，整个的效率会提升非常非常多的。</p>



<p class="wp-block-paragraph">然后到第五天，Apple Intelligence和Siri就上来了，其实就是给大家演示一下怎么可以在苹果设备上，甭管是电脑还是手机上，挂上ChatGPT，然后进行沟通、进行聊天，还可以做一些截屏，以及图片和视频方面的这种工作。这个呢确实是比较激动人心，但是对于中国来说其实没有用的。为什么？因为咱使不了。这个产品发布了以后，整个OpenAI的服务器，我觉得能有个五六个小时就直接宕机了。这个呢充分显示了苹果用户的威力，就是苹果的用户量还是非常非常大的，即使刨除掉中国，剩下的苹果用户也是非常给力的，直接把OpenAI的服务器干崩了。</p>



<p class="wp-block-paragraph">到第六天呢，是Her真的来了。原来我记得在发布GPT-4O的时候，当时大家看完了以后非常激动，实在是太震撼了。只是呢，在GPT-4O发布之后。</p>



<p class="wp-block-paragraph">它就又往回退了一点。它发布的是期货，并不是马上就能用的。刚才咱们讲的所有这些东西里头呢，有一个叫强化微调的功能，那也是个期货，现在使不了。其他的是马上就可以用下来了。OpenAI发布了GPT-4O之后呢，大概是过了也是几个月吧，才把高级语音功能拿出来，就是大家真的可以去跟GPT去聊天了。你可以打断它，它还可以去判断你的语气语调，这一块其实就已经强很多了。</p>



<p class="wp-block-paragraph">在这个之前呢，它还是通过说把语音识别出来，然后变成文字处理，处理完了以后，再把这个文字念出来，通过这样的方式来工作的。但是高级语音功能呢，等于语音进去，语音出来，端到端的中间并没有变成文字的这个过程。虽然你最后结束了以后，是可以去看到所有生成的文字的，但是它会流畅得非常非常多。</p>



<p class="wp-block-paragraph">但是呢，依然没有让我们看到完整的GPT-4O，或者叫Her，实际上是那个电影的名字，就是一个人工智能，像一个伴侣一样陪着你。这一次彻底出来了，加上什么呢？视频。我们可以打开摄像头，让GPT看着我们，跟我们去聊天。但是这个过程呢，GPT还是稍微有一点小滑头的。我让它看着我，我说你看我怎么样，它说你很精神。我说你看我年轻吗，它说你很有活力。后来我说，你能不能判断一下我的年龄，它说不行，我尽量不惹你生气。反正还是比较油滑的。</p>



<p class="wp-block-paragraph">我还跟我太太两个人一起上镜，我说来，我们俩谁好看，它说你们两个都很有活力。好吧，这个就当是它骂人吧，反而给我们带来了很多的欢乐。让它去拍各种场景，你家里边的各种家具，屏幕上的各种截图，你让它拍下来以后，它都可以实时地去做出反馈了。甚至呢，你比如说，你让它拍自己的视频的时候，你不跟他说话，朝它笑一笑，它都会马上这个回应你：“哎，笑一笑真好。”这个就显得非常非常智能了。</p>



<p class="wp-block-paragraph">这个功能极其好玩，如果你订阅了Plus，一定要去试一试，非常非常欢乐的一个产品。到第七天呢，发布了一个产品叫Project，Project的这个产品非常有意思，它等于是……</p>



<p class="wp-block-paragraph">在ChatGPT里边给大家开了一个目录。你可以把它打开了以后，然后说：“我现在需要处理这些文件。”然后你把这些文件都上传上去。然后呢，它根据这些文件去进行响应。</p>



<p class="wp-block-paragraph">原来呢，甭管是拆CPT也好，还有其他的所有这种聊天工具也好的，有一个很大的问题是什么？就是无状态。每一次去的时候，它都不认识你，需要从头去告诉它：“我今天有什么具体的事情。”如果你说：“哎，你把我的硬盘都搜索一下，在这个基础上跟我聊天呢？”它也很痛苦。为什么？因为你硬盘里的东西很多，它搞不清楚你到底要跟它聊具体什么事情。</p>



<p class="wp-block-paragraph">所以，让它在某一个具体的任务上聚焦起来，现在我们就来做一个旅游规划。我把旅游相关的所有信息都给你，你就在这个范围内给我回答。这件事情原来是比较难以做到的。很多人去做AI Agent，去做工作流，去做RAG，实际上都是为了解决这个问题。</p>



<p class="wp-block-paragraph">现在OpenAI说来了，咱们直接给你提供一个project的功能。你为了实现一个具体的功能，就把相应的文件都传上来，然后我就在你传上来的这批文件内给你去干活。这其实是OpenAI在向着自成操作系统的路上继续狂奔。他们认为以后不再需要操作系统了，什么Mac OS、Linux、Windows都不要这些玩意儿，我们自己干。我们自己把这些需要的东西找到了，以后就可以直接工作了。</p>



<p class="wp-block-paragraph">大家以后就慢慢地把各种各样的文件都存在OpenAI的服务器上。你每次就问它：“我这个项目里头都有什么事情？我应该如何继续往前走？”“我另外一个项目里都有什么事情？有什么文件？有什么信息？我应该如何往前走？”这以后就不再需要操作系统了。</p>



<p class="wp-block-paragraph">大家注意，前面谷歌出了一个产品，叫Workspace，其实已经部分实现了这件事情。Workspace就是你上去以后，实际上是个网盘，把各种文件都存上去。以后你就可以在网页端。</p>



<p class="wp-block-paragraph">直接去有所有的Office功能，不再需要说我在硬盘上存在什么地方，我在这个其他地方怎么去存，然后怎么去找到它，不用干这个事了。我们在全世界任何一台电脑上，只要你能登陆到自己的谷歌账户，我们就可以使用云端的这台电脑，它里面存着我们所有需要的文件，有完整的Office相应的功能。</p>



<p class="wp-block-paragraph">现在OpenAI说来，我们也照这个方式来。以后可能我们下一个产品，就是叫OpenAI网盘，大家以后就可以在那个上面干活了。那么以后你就问OpenAI说：“哎，某个目录里有些什么东西，或者是哪天放了一些什么东西上来呀？我最近有些什么样新的文件变化呀？”他就去工作去了。</p>



<p class="wp-block-paragraph">那么OpenAI可能就会有新的收费方式，按照这个网盘存储空间这样去收钱。这可能也是未来大家可以去前进的方向，因为我一直讲OpenAI对于社会的最大贡献，就是指明方向。其实现在你用谷歌的Gemini已经可以部分完成这种工作了。如果你给谷歌Gemini去付费，它也可以在你的Workspace里边去干活。</p>



<p class="wp-block-paragraph">但是Gemini目前为止呢，还没有那么聪明，虽然发了Gemini 2.0 Flash要稍微好一些，但是在各种的组件结合上，谷歌还有待提升。目前为止，12天里他已经过了7天了，大家注意，他礼拜六礼拜天是休息的，发布了7个新产品，后边呢还有5个新产品等待发布。其他公司呢，肯定也都没闲着，这个行业带头大哥已经冲了，其他人如果不跟着的话，肯定你的态度不够端正。</p>



<p class="wp-block-paragraph">第一个冲上来的是谷歌，谷歌的Gemini 2.0 Flash这个版本上来了，它的整个工作效果确实是要比原来的Gemini 1.5要强非常非常多。而且它是个Flash版本，速度非常快还免费。它比咱们在1.5以及他们中间出的各种各样的版本的这个模型都要快得多，效果也非常的好。只是呢，他演示的非常多的东西，其实你压根找不着在哪。为什么？这是个技术型的公司，大家不要对谷歌这种。</p>



<p class="wp-block-paragraph">技术型公司的产品能力抱有太高的期望，这个怎么讲呢？就是按他的说法，Gemini 2.0呢，完完全全可以像GPT-4那样，具备高级语音功能，像电影《Her》一样去工作。你可以与它对话，可以让它进行视频采集或图片采集。它生成的内容呢，甚至比PPT-4还要强。它可以生成混合内容，生成完文字后，再夹杂着图片一起生成出来。OpenAI现在只能生成图片或文字，无法将二者混合输出。</p>



<p class="wp-block-paragraph">现在的谷歌的Gemini 2.0，据说可以做到这些。只是呢，它把所有的多模态输入和输出功能，都放在了开发者工具里，或者是一些未来项目中，让大家去加入waitlist，等待使用。因此，我们现在唯一使用它的方式，就是像我这样去申请开发者账号，然后将Gemini 2.0 Flash的模型挂到自己的应用里，可以使用它的部分功能。完整功能，生成混合的文字和图片，目前还做不了。</p>



<p class="wp-block-paragraph">谷歌更新了之后，Meta肯定也不闲着。第一个呢，是把Llama 3.370币这个模型放出来了。现在Llama 3.370币的效能，比原来的Llama 3.1 405币高很多。其实在国内，我们一般不太尝试使用Llama，因为一旦Llama更新，可能过一个月左右，通义千问以及国内其他开源模型就会更新，补上这个窟窿。所以我觉得稍微等一等，可以期待下一步的产品。</p>



<p class="wp-block-paragraph">Meta也公布了自己的视频生成模型，OpenAI已经上来了，Sora也出来了。Meta也要有其他的，比如说腾讯混元纹身视频大模型，这两天也突然开放，大家可以去试用。我去试了试，还是有点一言难尽。做这种视频生成模型里，最难的其实不是视频生成，而是模型操控。它的用户交互界面稍微差了点。但是既然OpenAI已经指明了方向，大家就朝着这个方向努力就好了。</p>



<p class="wp-block-paragraph">Pica也更新了。Pica是华人团队做的一个美国的视频生成模型。他们呢，就很快地把OpenAI Sora的这些视频交互方式搁进去了。他怎么弄呢？就是你先上一副照片，说我要这个人，然后这个人呢，要去飞翔。他等于就可以很好地保持这个人的样子，然后去做后边这个动作。然后你再给他一幅图，说：“哎，现在要在这个环境下飞。”他这一块就可以编排得比较好了。现在已经可以做出一些非常有趣的小视频，在推特上面去传播了。</p>



<p class="wp-block-paragraph">Pica更新了，MidJourney也更新了。MidJourney更新的那个产品特别有意思，它叫故事版。什么意思呢？就是大家原来不都抱怨说这个东西的一致性差吗？说我想让它连续地输出一些内容，输出不出来。MidJourney你说来，我们这次更新一个有趣的功能。在一个故事版里头，你先定义角色，这叫张三，那叫李四，这叫王五，这叫赵六，定义了一堆角色。然后呢，再定义一堆场景，这是厨房，这是厕所，这是客厅，那是卧室，哪个地方是教室。定义完了以后呢，你再去定义，说张三在厕所里边碰到了李四，李四在厨房里边给王五做饭，王五在教室里边去做什么。当你把这些提示词写完了以后，他就用你前面定义的角色，在你前面定义的这个场景里边发生各种互动了。</p>



<p class="wp-block-paragraph">再往后，他家去做各种漫画，做各种的故事书，就非常非常方便了。你后边可以把这个故事写得很长，他在整个的生成过程中不会发生大的偏移。这个也是非常棒的。我觉得呢，也算是被Sora稍微提醒了一点吧，或者说大家可能殊途同归，都向这个方向走。只是呢，Sora发布了以后，MidJourney呢也再往前走一步。中国的各大模型公司呢，现在应该都在加班加点，Sora指明方向了以后，可灵还有像吉梦这样的视频模型，应该都会向这个方向前进，就是向故事版前进。视频生成过程中，某一些提示词在某几秒钟，或者某一些提示词在某个特定时间点里边起作用，这个大家应该都会跟上。</p>



<p class="wp-block-paragraph">CANVAS和Project的这样的功能的话，字节的豆包还有像Kimi，他们应该都会去学习一下。至于数学大模型的话，从O1 Preview出来之后，大家其实就都已经在追赶了。比如说像阿里出的QWQ，通义千问下面专门有一个模型叫QWQ，就是做这种推理模型的，32B在我本机就可以跑起来，推理效果还是相当不错的。Kimi呢，也专门做了一个叫K0MAS，专门的一个数学模型，都是进行推理使用的。</p>



<p class="wp-block-paragraph">搜索这一块的话，其实大家都已经做得还不错了。这就是前面七天给大家带来的这些变化。还有五天有可能发布什么呢？第一个很多人都在期待，Dalle是不是该出师了。Dalle3已经发布了很久很久了，没有什么更新。而且Dalle3现在明显的已经跟其他所有的图片生成模型比起来，落后非常多了。现在大家再去做视频生成的时候，都是用MidJourney生成的图片去做视频生成的地图。Dalle呢，是需要努力了，这个有可能会再往前走一步。</p>



<p class="wp-block-paragraph">他们发布会的时候，其实是有一些暗示的。这一次在发布的时候，OpenAI X7BT在网页端做了一个比较大的这种改变。什么呢？就是他在聊天窗底下加了一堆工具栏，然后这工具栏里头有一批呢，是搜索、Dalle，还有Canvas，这些东西是在一个栏里头。你要先选我要用哪个工具，然后再去跟它说话。大家想，这个里头为什么会有一个Dalle呢？肯定他是有事情了。他把这样的一个已经稍微有一点点小落后的产品，跟这次新出来的这种搜索呀、Canvas放在一起，那么它有可能会更新。</p>



<p class="wp-block-paragraph">然后新的智能体框架有可能也会出来。由于现在大家都在讲，说大模型就卷成这样可以了，后边呢，大家去搞一搞智能体。大家注意，现在的OpenAI呢，这么多新功能，其实是不能一起使的。什么意思呢？就是CANVAS、Search、语音功能，你每次必须选一个，你不能说我都选，说我一边语音功能，一边你去给我搜索。</p>



<p class="wp-block-paragraph">这事不行。你说我一边canvas一边去搜索，这事也不行。或者说，哎，我去推理一下，推理完了以后，你给我放到canvas里头，或者去做语音这个事，都是不允许的。每次只需选一个，这个还是非常不方便。未来可能会有一些方法把这些功能串起来，而这些功能串起来以后，OpenAI的ChatGPT的可用性会提高非常大的一大截。</p>



<p class="wp-block-paragraph">还有什么可以期待的呢？就还有人会去期待这个AI硬件。到年底了，折腾了这么长时间了，是不是也该拿出一个东西来？特别是前面，苹果当年iPhone的设计师，号称是在跟OpenAI一起合作做AI硬件。那么到年底了，是不是给大家瞅一瞅？这个有可能会出现，但这块呢，完全是咱们猜测，没有任何的依据。</p>



<p class="wp-block-paragraph">还有一个是什么呢？就是有可能会出GPT4.5，就是它有可能会在GPT4的基础上再往前走一点。你说一下到GPT5，这个呢稍微有一点点难度，但应该还是会继续往前走的。因为在发布Siri那一天，他呢也做了一个暗示。在发布Siri那天呢，他们拿这个是iPhone，上面呢只有一个日历的框，在这个屏幕上，那个日历上写着说，我们要去发布下一代的AGI或者什么这样的东西。大家就去猜测说，这有可能是GPT4.5。这就是未来五天里头，大家还是可以去期待一下的事情。</p>



<p class="wp-block-paragraph">等OpenAI把所有的12天、12个产品都发布齐了以后，我会再录视频跟大家进行总结。好，这一期就跟大家讲到这里，前面已经发布的产品，赶快去使用起来，非常好玩。好，感谢大家收听，帮忙点赞，点小铃铛，参加Discord讨论群，也欢迎有兴趣有能力的朋友加入我们，付费频道再见。</p>
]]></content:encoded>
					
		
		
			</item>
	</channel>
</rss>
