<?xml version="1.0" encoding="UTF-8"?><rss version="2.0"
	xmlns:content="http://purl.org/rss/1.0/modules/content/"
	xmlns:wfw="http://wellformedweb.org/CommentAPI/"
	xmlns:dc="http://purl.org/dc/elements/1.1/"
	xmlns:atom="http://www.w3.org/2005/Atom"
	xmlns:sy="http://purl.org/rss/1.0/modules/syndication/"
	xmlns:slash="http://purl.org/rss/1.0/modules/slash/"
	>

<channel>
	<title>自动化流程 &#8211; 老范讲故事｜AI、大模型与商业世界的故事</title>
	<atom:link href="https://lukefan.com/tag/%e8%87%aa%e5%8a%a8%e5%8c%96%e6%b5%81%e7%a8%8b/feed/" rel="self" type="application/rss+xml" />
	<link>https://lukefan.com</link>
	<description>这里是老范讲故事的主站，持续更新 AIGC、大模型、互联网平台、商业冲突与资本市场观察，帮你看清热点背后的底层逻辑。</description>
	<lastBuildDate>Sun, 20 Jul 2025 00:41:30 +0000</lastBuildDate>
	<language>zh-Hans</language>
	<sy:updatePeriod>
	hourly	</sy:updatePeriod>
	<sy:updateFrequency>
	1	</sy:updateFrequency>
	<generator>https://wordpress.org/?v=7.0</generator>

<image>
	<url>https://lukefan.com/wp-content/uploads/2026/03/cropped-jimeng-2026-02-28-5245-用图一的人物形象，替换图二中的人物，使用图二的风格。文字替换：老范讲故事，Yo-32x32.jpeg</url>
	<title>自动化流程 &#8211; 老范讲故事｜AI、大模型与商业世界的故事</title>
	<link>https://lukefan.com</link>
	<width>32</width>
	<height>32</height>
</image> 
	<item>
		<title>ChatGPT Agent重磅发布，山姆奥特曼亲自站台却惨遭现场翻车，这究竟是Manus的机遇还是整个泛Agent赛道的丧钟？</title>
		<link>https://lukefan.com/2025/07/20/chatgpt-agent%e9%87%8d%e7%a3%85%e5%8f%91%e5%b8%83%ef%bc%8c%e5%b1%b1%e5%a7%86%e5%a5%a5%e7%89%b9%e6%9b%bc%e4%ba%b2%e8%87%aa%e7%ab%99%e5%8f%b0%e5%8d%b4%e6%83%a8%e9%81%ad%e7%8e%b0%e5%9c%ba%e7%bf%bb/</link>
		
		<dc:creator><![CDATA[Luke Fan]]></dc:creator>
		<pubDate>Sun, 20 Jul 2025 00:41:29 +0000</pubDate>
				<category><![CDATA[AIGC]]></category>
		<category><![CDATA[AGI]]></category>
		<category><![CDATA[AI Agent]]></category>
		<category><![CDATA[AI创业]]></category>
		<category><![CDATA[AI行业分析]]></category>
		<category><![CDATA[API]]></category>
		<category><![CDATA[ChatGPT Agent]]></category>
		<category><![CDATA[Deep Research]]></category>
		<category><![CDATA[Manus]]></category>
		<category><![CDATA[OpenAI]]></category>
		<category><![CDATA[OpenAI发布会]]></category>
		<category><![CDATA[Operator]]></category>
		<category><![CDATA[PPT生成]]></category>
		<category><![CDATA[Sam Altman]]></category>
		<category><![CDATA[SDK]]></category>
		<category><![CDATA[TOKEN成本]]></category>
		<category><![CDATA[YouTube频道]]></category>
		<category><![CDATA[二次验证]]></category>
		<category><![CDATA[产品评测]]></category>
		<category><![CDATA[人工智能]]></category>
		<category><![CDATA[人工智能代理]]></category>
		<category><![CDATA[任务打断]]></category>
		<category><![CDATA[创业公司危机]]></category>
		<category><![CDATA[商业模式]]></category>
		<category><![CDATA[技术前沿]]></category>
		<category><![CDATA[技术局限]]></category>
		<category><![CDATA[数据分析]]></category>
		<category><![CDATA[未来科技]]></category>
		<category><![CDATA[模型即应用]]></category>
		<category><![CDATA[沙盒]]></category>
		<category><![CDATA[浏览器模拟]]></category>
		<category><![CDATA[演示翻车]]></category>
		<category><![CDATA[生产力工具]]></category>
		<category><![CDATA[用户体验]]></category>
		<category><![CDATA[科技评论]]></category>
		<category><![CDATA[竞品分析]]></category>
		<category><![CDATA[老范讲故事]]></category>
		<category><![CDATA[自动化任务]]></category>
		<category><![CDATA[自动化流程]]></category>
		<category><![CDATA[虚拟机]]></category>
		<category><![CDATA[跨设备同步]]></category>
		<category><![CDATA[连接器]]></category>
		<category><![CDATA[长链路任务]]></category>
		<guid isPermaLink="false">https://lukefan.com/?p=2406</guid>

					<description><![CDATA[救命啊！！家人们真的要看这个史诗级抓马现场😱
OpenAI的智能体居然被订票网站吊打！！！
（本宫已经反复拉进度条笑出八块腹肌hhh）

🎯重点先说：
GPT智能体发布新功能本来要封神👉
结果现场上演墨西哥湾神秘棒球场事件！！
奥特曼强行挽尊的样子像极了甲方对接人🤦♀

💣史诗级翻车实录：
当智能体要预定30个棒球场门票时
✨前半段：帅气抓取数据生成地图
💥后半段：把纽约波士顿的球场全扔进墨西哥湾！！！
更绝的是订票卡在二次验证环节👇
系统：等您60秒回我验证码哦~
智能体：对方已挂断（疯狂弹出红字报错）

🆘笑疯全网名场面：
台下憋笑憋到面部扭曲
奥特曼紧急救场说"之后修bug"
（翻译：本程序员今晚别想下班了）

💼创业公司生死局：
1️⃣ OpenAI用钞能力硬砸智能体（每月可用400次！！）
2️⃣ 每次任务耗费天价算力（普通公司根本烧不起）
3️⃣ 最绝的是演示证明这赛道压根不靠谱！！！
（连亲儿子都hold不住浏览器操作）

👉结论亮瞎眼：
OpenAI这波等于官宣👉
"泛用型智能体暂时没搞头！友商别送人头了"
（建议Manus转行教AI避坑指南🙏）

————————————
姐妹们觉得这波GPT智能体表现打几分？
本宫已经连夜囤了十包瓜子等续集了hhh！
（坐等智能体下次表演买鞋翻车秀🛒）

ChatGPT Agent重磅发布，山姆奥特曼亲自站台却惨遭现场翻车，这究竟是Manus的机遇还是整个泛Agent赛道的丧钟？

OpenAI在Sam Altman亲自坐镇下，重磅发布了最新的ChatGPT Agent，然而，一场尴尬的现场翻车事件，让人们不禁为Manus的未来捏了一把汗。这款集成了Operator网页交互与Deep Research深度分析能力的智能体，虽然展示了强大的跨应用任务处理能力，但其依赖模拟浏览器点击的模式，在面对二次验证等现实问题时显得力不从心。这不仅暴露了当前泛Agent赛道的技术瓶颈，更揭示了一个残酷的商业现实：高昂的TOKEN成本。OpenAI可以凭借自有模型优势承担亏损，但对于依赖外部模型的Manus而言，这无异于被釜底抽薪，其商业模式将难以为继。因此，ChatGPT Agent的发布，与其说是对Manus的直接打击，不如说是为整个泛Agent赛道划定了天花板，证实了这条技术路径的局限与高昂代价。]]></description>
										<content:encoded><![CDATA[
<figure class="wp-block-embed is-type-video is-provider-youtube wp-block-embed-youtube wp-embed-aspect-16-9 wp-has-aspect-ratio"><div class="wp-block-embed__wrapper">
<iframe title="ChatGPT Agent重磅发布，山姆奥特曼亲自站台却惨遭现场翻车，这究竟是Manus的机遇还是整个泛Agent赛道的丧钟？" width="900" height="506" src="https://www.youtube.com/embed/BiVSfZWJEmA?feature=oembed" frameborder="0" allow="accelerometer; autoplay; clipboard-write; encrypted-media; gyroscope; picture-in-picture; web-share" referrerpolicy="strict-origin-when-cross-origin" allowfullscreen></iframe>
</div></figure>



<p class="wp-block-paragraph">ChatGPT Agent来了。</p>



<p class="wp-block-paragraph">Manus到底是该哭还是该笑呢？</p>



<p class="wp-block-paragraph">大家好，欢迎收听<a href="https://youtube.com/@StoryTellerFan" target="_blank" rel="noopener">老范讲故事的YouTube频道</a>。</p>



<p class="wp-block-paragraph">ChatGPT重磅发布了他的Agent。怎么个重磅法？山姆·奥特曼亲自坐台。现在很多ChatGPT自己产品的发布，山姆·奥特曼都不在前台坐着，这次是亲自坐台。而且旁边坐了四位主讲，很多时候发布会就是俩人或者仨人，这次是山姆·奥特曼坐在这，旁边坐了四个人。而且呢，足足讲了25分钟。</p>



<p class="wp-block-paragraph">很多人就想起Manus来了，好像有些测试还不如Manus。因为他现场有翻车的，大老板在旁边坐着，你测试翻车的话还是压力挺大的。在这个时候就有人说了，GPT也就这样，你们现在还觉得Manus做的不好吗？就有一些讨论在发生了。</p>



<span id="more-2406"></span>



<p class="wp-block-paragraph">ChatGPT的Agent到底会给Manus带来什么呢？Manus到底是该哭还是该笑呢？今天咱们讲讲这个事儿。</p>



<p class="wp-block-paragraph">首先呢，咱们先回顾一下GPT Agent的一个发布过程。时间呢是太平洋时间2025年7月17号上午10点，也就是北京时间7月18号的凌晨1点。山姆·奥特曼坐在最边上，他不是主讲，他就是一个串场的。另外一头呢坐着一个印度老哥，中间呢是三个亚洲脸，两位男士呢应该确认是中国人，还有一位女士呢，虽然看起来是亚洲脸，但是是不是华人不知道。</p>



<p class="wp-block-paragraph">25分钟的视频演示也很无奈，他这种演示你没法短，因为很多的任务，跑起来的时间就非常长，特别是婚礼差旅一条龙的。这个任务基本上是从头跑到尾，就是一开始布置任务下去，中间穿插了几个其他任务，最后到那个结束的时候，算是差不多跑完。</p>



<p class="wp-block-paragraph">让Agent去帮忙参加朋友婚礼，挑酒店、挑礼物、定穿搭，中间还打断他说，我还要再买双鞋。这个其实挺好玩的，因为以前这种Agent，最讨厌的一点是什么呢？就是你只要让他开始跑，半个小时或者多长时间，你没法打断他，发现他错了以后呢你也没办法，只能让他重新开始。现在呢，我说我可以打断你，或者中间可以把你叫停，让你去帮我调整一些东西，加一双鞋或者做一些其他的。这个呢，算是一个，我觉得算是用户体验角度上的一个比较大的前进吧。</p>



<p class="wp-block-paragraph">从技术角度上来说呢，并没有那么费劲。只是呢，在Agent的执行框架上需要做一些调整，你比如说多线程，或者是一些守护线程，他需要做一些这样的东西。在大家做了这么长时间的手机应用、前端后端应用以后，这个不是那么费劲的。</p>



<p class="wp-block-paragraph">手机端呢，也可以进行即时的创意，也就是在iPhone上请求制作团队吉祥物贴纸，就是做了一些可以做设计的任务。这个应该是对着像LoveArt这种设计Agent去的。然后呢，做了一个财务数据分析，他讲的是去我的Google Drive上，把评估指标拉出来，给我做一个汇报。幻灯片还做的可以吧。</p>



<p class="wp-block-paragraph">后面就是演示了随时打断和二次确认，在Agent里头点击打断，可以进行指令修改，Agent结束前弹窗确认邮件内容。但是呢，在现场还失败了一个，找球场这个是一个失败演示。</p>



<p class="wp-block-paragraph">他干了一什么呢？规划一场夏季旅行，走遍30座职业棒球球场，并给每座球场买两张最便宜的日场票。给了他这样的一个任务。一开始呢，是先用文本浏览器，抓取了2025年赛程和票价，到这呢数据还是正常的。然后是通过脚本去终端执行，通过终端去执行脚本，生成Excel和绘制地图。但是呢，这儿就开始出错了，地图坐标严重错位，纽约、波士顿等东海岸的球队就没了，墨西哥湾里头凭空出现了一些球场，引起场下的一些窃笑了。</p>



<p class="wp-block-paragraph">再往后呢，是用可视化浏览器，跳转到一个订票网站上，要去下单订票了。但是呢，因为这是一个跟金融和这种高风险相关的操作，所以呢进入了人工模式，就是你必须要确认一下要花钱了吗。然后就遇到了一个问题，Agent自动去填邮箱了以后呢，它网站需要跳这个叫二次验证，二次验证，就比如说我给你发个邮件，你给把这个邮件里头那个码给我呀，或者是给你发个短信，就是这种验证程序。这个Agent就跑不动了，他呢触发了订票网站等待用户的一个进程，要求你60秒钟之内呢要去接管，结果呢他也没有好好的接管这个东西，就直接超时终止了。这个稍微有些丢人，还跳出了红色的长串错误信息，反正现场就有点绷不住了。主持人呢只能尴尬收场，这个主持人是谁？山姆·奥特曼。他呢出来打了个圆场，说买票这步我们之后会在debug的。这是整场直播唯一强制终止的一个demo。</p>



<p class="wp-block-paragraph">最新的ChatGPT Agent到底有哪些新特性呢？第一个呢，它是Operator加上Deep Research，这两个功能加一块的东西。Operator其实应该是今年年初的时候发布过一次，所谓Operator，就是在一个虚拟机上打开浏览器，给大家去做各种的操作，模仿真人去点击各种的网页。但是呢，这个功能呢，一直是在200美金的用户那里使用，像我这种20美金的用户是没使过的。而且即使是200美金的用户呢，应该对这个功能也不太感冒，因为你要去使用互联网的网站的话，难度还是很大的。</p>



<p class="wp-block-paragraph">咱们做各种软件里头，最难做的一个软件不是操作系统，而是浏览器。为什么？因为每家做的网站都不一样，我到底用的是谁家的前端库后端库，在里边隐藏了哪些信息，怎么去做的缓存，做了哪些防刷以及防骗的这种工具，做了哪些多次验证的东西，这个真的是千奇百怪的。所以你要想完全兼容这种东西是很难的，你让一个机器人去点网页，成功率还是不太高的。所以这个产品虽然发布了，但是大家使得并不是那么爽。</p>



<p class="wp-block-paragraph">现在说Deep Research这功能做的还不错了，那跟Operator两个功能结合起来，就是这一次我们所看到的GPT Agent。这俩功能呢，Operator我从来没用过，Deep Research呢是我经常用，而且经常把额度跑光，需要等到下边一个时间周期，重新分配额度接着跑的一个功能。</p>



<p class="wp-block-paragraph">它呢是由一台虚拟化电脑，就还是Operator这套东西里头呢，内置了图形界面浏览器和文本浏览器。什么叫图形界面浏览器？就是我真的打开了一个网页，这边是有按钮的，那边是有输入框的有菜单的，这种浏览器呢叫做图形界面浏览器。而文本浏览器的话基本上就是，我把你这个网页抓出来了，直接把里头的内容呢进行了总结归纳，或者说把里头的内容直接提出来了。他们在这个里头是两个都有，大部分情况，你说我只需要进行信息总结的话，就是文本浏览器就够了。实际上文本浏览器大家可以理解为一个爬虫。图像浏览器的话其实，对于这种虚拟机来说是难度很大的。为什么？因为我们写网站的时候，还经常会去研究，比如说设备的自动适配，就是我在手机上，这个网页应该长成啥样，在平板上应该长成啥样，在PC上应该长成啥样，遇到特别大的浏览器应该长成啥样，这个都是不一样的。还有一些比如说我们有些网站上，会写这种不可见的字符，干嘛呢？骗AI的，说你遇到我这个网站就不能爬了，或者说不能做一些其他的工作。还有很多这样的东西。</p>



<p class="wp-block-paragraph">另外呢，上浏览器的呢，其实还有一点小的问题，大家知道网站上有一个文件叫robots.txt，这个文件干嘛使的？实际上是应对爬虫的，告诉你说哪个爬虫你可以看哪些东西，不可以看哪些东西。而你一旦上浏览器了，Robots这个文件实际上就不起作用了。</p>



<p class="wp-block-paragraph">那它这个一体化的虚拟电脑，除了图形化浏览器和文本浏览器之外，还有什么呢？还有终端，你可以在上面去跑一些程序，以及API连接器，包括一些模型，都在同一个沙盒里边完成。点击键入运行代码，调用Gmail、Calendar等等这些操作。为什么叫沙盒呢？就是这个盒里头出错了，其他的盒不影响。这个呢，就是这一次的ChatGPT Agent最核心的东西，就是一体化虚拟电脑。</p>



<p class="wp-block-paragraph">另外呢，就是它可以自动的选择工具，跨步骤的自主执行，将Operator网页交互，加上Deep Research的深度分析，整合在一个流程里边。Agent自行决定何时调用浏览器，何时跑脚本，无需用户指定。这一块呢，确实是做的相当不错的，因为他演示的时候，几个很长的案例中间呢并没有出错，一直在往前走。因为让他去干这种活最怕什么？就中间出错了，中间出错了以后，可能跑非常非常多的TOKEN，而且在里边死循环，都是有可能，你可能早上一起来破产了。这个TOKEN是很贵的。</p>



<p class="wp-block-paragraph">长链路任务加上时间轴回放，也是一个挺好玩的东西，就是你的一个任务跑完了以后，他们最后是像放这个视频一样去看，说跑了几十分钟很多步骤的工作，第几步跑成什么样了。为什么要看这个呢？就是你中间万一跑错了，或者说这个结果跟我想的不太一样，你可以看看哪错了，让他再去进行调整。否则的话，就是前头下了命令，中间不可干预，然后直接就结束了，你还没法看中间哪错了，你连改进的机会都没有。所以这个呢，也算是一个改进吧。</p>



<p class="wp-block-paragraph">再往后呢，是它的任务是可以暂停继续和打断的，也算是在用户体验上做了很大的提升吧。当然了，可以打断可以暂停那件事呢，说明另外一个问题，就是这种任务周期很长，而且呢结果经常不可控。实际上它算是个缺陷吧，为了给这个缺陷打个补丁，所以加上这样的功能。</p>



<p class="wp-block-paragraph">ChatGPT Agent呢，还有一些其他的功能，比如说叫Watch Mode观察模式，以及这种二次确认。为什么呢？就是涉及付款发信这种高后果或者叫高风险的行动，会自动的进入这种叫Watch Mode，用户呢需要保持焦点，并且手动确认，否则的话流程就会超时终止。这个还是不敢直接替你花钱买东西，还要看后边怎么去改进吧。</p>



<p class="wp-block-paragraph">端到端的成果交付，可以直接生成可编辑的PPT、Excel、PDF等文件。这个算是对标Manus，或者是对标其他人做的Agent，现在大家都是有这功能，所以这一次ChatGPT的Agent也把这功能给你做上来了。他做的PPT还没有Manus做的好看呢。</p>



<p class="wp-block-paragraph">那另外就是跨设备的无缝切换，专门给大家演示了iOS安卓设备上，你也可以看看，你这个项目跑到多少了，你这个项目跑到什么状态了。像我平时用Deep Research的时候也是这样，我在电脑上说我现在要Deep Research了，然后我的手机上就会弹出来说，你有一个Deep Research的工作开始跑了，跑到什么样状态有个进度条，跑完了以后，他会告诉你说你这个结束了，你去看看结果是不是OK。因为Deep Research一次的话，有的时候长的也要10分钟，快的可能是五六分钟，也能跑出来。你不可能说我这边打了回车以后一直坐这等，还是要去做其他事情的。</p>



<p class="wp-block-paragraph">这次呢，把ChatGPT的连接器和计划任务呢，也都整进来了。可以通过官方的ChatGPT的Connectors，叫连接器，直接呢连接Gmail、GitHub、Google Drive这些服务。也可以将一次性任务，保持为定期的自动执行任务，比如每周干一什么事，这个现在都是允许的。</p>



<p class="wp-block-paragraph">然后多层的安全站，它既然已经这么强大了，你可以干各种各样事情了，你要注意，你不要去做一些危害人类的事情，所以OpenAI还是有一点点小底线的吧。也面向开发者呢提供了Agent SDK和API，但是这一块呢，现在应该还是一个预览版吧，我反正没有看到谁去用这个东西。</p>



<p class="wp-block-paragraph">性能呢，全面的跃升，它去解决各种人类实际问题的评分这块是上升了。这个呢，就是ChatGPT Agent的一个基本特性。</p>



<p class="wp-block-paragraph">谁能用呢？我还没用上。Pro用户就是200美元的用户，现在已经可以用了，每个月呢可以用400次。这玩意肯定不能让你随便使，因为实在是太耗TOKEN了。Plus用户，就像我这样20美元用户呢，每个月可以使用40次，其实基本也够用。像我现在，用Deep Research我觉得一天用不了一次，但是还是经常把额度跑光。现在Plus用户呢，应该是未来三天进行灰度推送，但是还没轮到我，哈哈，再继续等待。</p>



<p class="wp-block-paragraph">我自己观看演示以后的感受是什么样的？第一个是产品确实非常强大，能把这么复杂的任务，自己把它分配好，顺序的执行下来中间不乱，这个已经非常非常难了。另外第二个是什么呢？大概率是不会去用的。为什么呢？前面刚夸完人家这个很强大，你咋就不用呢？因为它的结果依然是不太可控的。</p>



<p class="wp-block-paragraph">直接通过模拟浏览器去点击网站，我一直觉得这个方向有毛病。为什么呢？就是每个网站都不一样，而且这个网站上还有各种防刷防骗的东西。比如说吧，有些网站，你通过一个IP地址打开多少次以后，我就直接把你封掉了，把这个IP地址给你封黑了。那你遇到这样的网站你咋办？因为它这个虚拟机，它的IP地址都一样的，它是跑在微软的机房里头的，你通过统一的机房IP，你去访问人家的这个网站去，那你跑着跑着给你封了。</p>



<p class="wp-block-paragraph">有的时候你需要二次验证，像前面我们讲的一个翻车，需要做二次验证，你也搞不定这个事你咋办？而且像我们比如说注册了很多账号，像谷歌呀、Twitter什么，这些账号我们都是要去做二次验证的，你不做二次验证就很容易被偷嘛。那你一旦做了二次验证以后，虚拟机里边的这个产品，他怎么去做二次验证？他根本就没法搞。还有一些需要去遵循其他的这种约定俗成的东西，你其实也是没有办法去完全的实现的。而且还有时候呢，这些网站自己还会更新，他更新的时候也不通知你，而且更新了以后到底是不是有bug，其实谁也不知道，经常更新出来那个网站是有bug的嘛。</p>



<p class="wp-block-paragraph">所以呢，你通过这样的一种非常不确定的方式，去连接各种服务的话，到底未来行会变成什么样，到底能不能稳定的去执行任务，我是表示怀疑的。像他这种用仿真浏览器的方式，去执行任务的这种模式呢，更像什么呢？更像是马斯克的纯视觉自动驾驶，说人既然可以搞定，那我用纯视觉的方式车也可以搞定。其他人说我们不太相信这玩意，我们上激光雷达，它更准确。对于我来说，我可能觉得激光雷达会更好一点。</p>



<p class="wp-block-paragraph">所以呢，未来可能是很多的服务，比如说订球票这些东西，应该是一些经过验证以后的安全的API出来，或者是MCP这样的这种服务出来，然后再由这些AI Agent去调用，才有可能让大家很好的把各种的交易串联起来，而不是说像现在似的，我们在各种的防骗网站中间，去点击鼠标，模拟人类点击，这个还是太不靠谱了。</p>



<p class="wp-block-paragraph">那么ChatGPT Agent到底给Manus这种泛Agent的项目带来什么呢？最后我们来回答一下这个问题。首先呢，给结论，这个绝对不是好消息，应该算是又敲响了一次丧钟吧。OpenAI每一次发表新的功能呢，都会有很多的创业项目就直接死掉了。这一次呢应该不算直接枪毙，但是绝对不是一个好的声音。</p>



<p class="wp-block-paragraph">虽然ChatGPT的Agent演示的，跟这个Manus的演示呢，算是各有所长，有些做的好一点，有些做的其实都不怎么样。但其实的结果是什么？ChatGPT也证明了说，这条路最后大概也就能走成这样的一个半半拉拉的样子就完事了。在一个赛道里边，其实不怕老大强大，而怕老大倒下。如果ChatGPT也就只能做成这个样子，那你所有在这个赛道上前进的人，就都比较危险。这是第一个，证明这种范Agent的模式是有问题的。</p>



<p class="wp-block-paragraph">而且呢，这一次虽然OpenAI演示翻了一次车，但是它也验证了另外一个事情是什么？就是模型及应用，你跑这种Agent是非常非常消耗TOKEN的。OpenAI模型是我们自己家的，我自己可以优化，可以定价可以亏钱，但是对于Manus这样的公司来说，模型是别人家的，你对它进行底层优化的能力就没有，那你需用了这些模型以后，你就得老老实实去按TOKEN付钱，去跑这种Agent的项目，你要去按TOKEN付钱的话，那是会跑破产的。</p>



<p class="wp-block-paragraph">在结果不那么靠谱的情况下，无法对模型层面进行优化，完全依靠这个外部调用的话，Manus这种项目其实是没有什么机会的。而OpenAI就是另外一回事，反正没那么靠谱，大家就去用就完了。Plus用户一个月44，Pro用户一个月440，你们就用吧。对于OpenAI来说它又不怕亏钱，每年亏个几十亿上百亿，对于它来说都是正常的。但是你Manus你亏得起这个吗？你亏不起的。</p>



<p class="wp-block-paragraph">所以最终的结论就是，OpenAI的ChatGPT Agent证明了两件事情。第一件事就是，这种泛应用的Agent依然没那么靠谱，就算是OpenAI，也没有办法让这个东西更加靠谱，因为它需要靠模拟人类去点击浏览器的方式去做事情。原来双十一上的时候，也经常是淘宝网站崩了，或者是银行网站崩了，中间需要多做一次验证什么，这种事多去了。所以你现在想让机器去替代人去做点击的话，我觉得这个这条路是有问题的。</p>



<p class="wp-block-paragraph">第二个是什么？第二个就是从成本的角度来去分析，Manus在这个赛道上它也跑不远。这就是今天咱们讲这故事。感谢大家收听，请帮忙点赞点小铃铛，参加<a href="https://discord.gg/ppKsNkttTv" target="_blank" rel="noopener">DISCORD讨论群</a>，也欢迎有兴趣、有能力的朋友加入我们的<a href="https://www.youtube.com/channel/UCUGLhcs3-3y_yhZZsgRzrzw/join" target="_blank" rel="noopener">付费频道</a>。再见。</p>



<p class="wp-block-paragraph"></p>
]]></content:encoded>
					
		
		
			</item>
		<item>
		<title>揭秘AIGC如何颠覆生活与工作，流量争夺战：从ChatGPT、MidJourney、Copilot、DALL·E再到AI Agent流程，大数据时代的博主生存法则！AIGC如何革新数字时代工作模式？</title>
		<link>https://lukefan.com/2024/07/14/%e6%8f%ad%e7%a7%98aigc%e5%a6%82%e4%bd%95%e9%a2%a0%e8%a6%86%e7%94%9f%e6%b4%bb%e4%b8%8e%e5%b7%a5%e4%bd%9c%ef%bc%8c%e6%b5%81%e9%87%8f%e4%ba%89%e5%a4%ba%e6%88%98%ef%bc%9a%e4%bb%8echatgpt%e3%80%81midjourne/</link>
		
		<dc:creator><![CDATA[Luke Fan]]></dc:creator>
		<pubDate>Sun, 14 Jul 2024 00:57:38 +0000</pubDate>
				<category><![CDATA[AIGC]]></category>
		<category><![CDATA[AI Agent]]></category>
		<category><![CDATA[AI剪辑软件]]></category>
		<category><![CDATA[AI字幕优化]]></category>
		<category><![CDATA[AI技术]]></category>
		<category><![CDATA[AI技术应用]]></category>
		<category><![CDATA[AI推荐]]></category>
		<category><![CDATA[AI提示词]]></category>
		<category><![CDATA[AI文章优化]]></category>
		<category><![CDATA[AI翻译]]></category>
		<category><![CDATA[AI问答]]></category>
		<category><![CDATA[Copilot]]></category>
		<category><![CDATA[DALL·E]]></category>
		<category><![CDATA[GitHub]]></category>
		<category><![CDATA[Github Copilot]]></category>
		<category><![CDATA[GPT-3.5]]></category>
		<category><![CDATA[MidJourney]]></category>
		<category><![CDATA[RAG系统]]></category>
		<category><![CDATA[SEO优化]]></category>
		<category><![CDATA[YouTube频道]]></category>
		<category><![CDATA[个人品牌]]></category>
		<category><![CDATA[中英双语]]></category>
		<category><![CDATA[互动体验]]></category>
		<category><![CDATA[互联网红人]]></category>
		<category><![CDATA[代码编写]]></category>
		<category><![CDATA[信息处理]]></category>
		<category><![CDATA[信息收集]]></category>
		<category><![CDATA[信息筛选]]></category>
		<category><![CDATA[信息管理]]></category>
		<category><![CDATA[内容优化]]></category>
		<category><![CDATA[内容分段]]></category>
		<category><![CDATA[内容创作]]></category>
		<category><![CDATA[内容创作工具]]></category>
		<category><![CDATA[内容创作成本]]></category>
		<category><![CDATA[内容创作闭环]]></category>
		<category><![CDATA[内容制作]]></category>
		<category><![CDATA[内容扩展]]></category>
		<category><![CDATA[创作效率]]></category>
		<category><![CDATA[博主工具]]></category>
		<category><![CDATA[博客生成器]]></category>
		<category><![CDATA[商业模式]]></category>
		<category><![CDATA[图片生成]]></category>
		<category><![CDATA[宣传策略]]></category>
		<category><![CDATA[工作方式]]></category>
		<category><![CDATA[情感倾向]]></category>
		<category><![CDATA[技术结合]]></category>
		<category><![CDATA[技术进步]]></category>
		<category><![CDATA[技术革命]]></category>
		<category><![CDATA[技术革新]]></category>
		<category><![CDATA[推特爆红]]></category>
		<category><![CDATA[推荐算法]]></category>
		<category><![CDATA[效率工具]]></category>
		<category><![CDATA[数字人]]></category>
		<category><![CDATA[数字平台]]></category>
		<category><![CDATA[数字时代]]></category>
		<category><![CDATA[数据分析]]></category>
		<category><![CDATA[智能助手]]></category>
		<category><![CDATA[智能搜索]]></category>
		<category><![CDATA[智能生成]]></category>
		<category><![CDATA[未来畅想]]></category>
		<category><![CDATA[标题生成]]></category>
		<category><![CDATA[流量争夺]]></category>
		<category><![CDATA[流量红利]]></category>
		<category><![CDATA[流量获取]]></category>
		<category><![CDATA[生产力提升]]></category>
		<category><![CDATA[生成内容]]></category>
		<category><![CDATA[生成式AI]]></category>
		<category><![CDATA[生活方式]]></category>
		<category><![CDATA[短视频剪辑]]></category>
		<category><![CDATA[社交媒体]]></category>
		<category><![CDATA[自动化效率]]></category>
		<category><![CDATA[自动化流程]]></category>
		<category><![CDATA[自动总结]]></category>
		<category><![CDATA[自动生成]]></category>
		<category><![CDATA[自动翻译]]></category>
		<category><![CDATA[自动配音]]></category>
		<category><![CDATA[视频剪辑]]></category>
		<category><![CDATA[视频封面]]></category>
		<category><![CDATA[视频标题]]></category>
		<category><![CDATA[视频生成]]></category>
		<category><![CDATA[评论分类]]></category>
		<category><![CDATA[阅读效率]]></category>
		<category><![CDATA[音乐生成]]></category>
		<category><![CDATA[音乐生成器]]></category>
		<category><![CDATA[音效生成]]></category>
		<category><![CDATA[高效工作]]></category>
		<category><![CDATA[高频搜索词]]></category>
		<guid isPermaLink="false">https://lukefan.com/?p=1400</guid>

					<description><![CDATA[大家好，欢迎收听“老范讲故事”的YouTube频道。今天，我们来讲一讲AIGC如何改变我的工作与生活。之所以录 ... <a title="揭秘AIGC如何颠覆生活与工作，流量争夺战：从ChatGPT、MidJourney、Copilot、DALL·E再到AI Agent流程，大数据时代的博主生存法则！AIGC如何革新数字时代工作模式？" class="read-more" href="https://lukefan.com/2024/07/14/%e6%8f%ad%e7%a7%98aigc%e5%a6%82%e4%bd%95%e9%a2%a0%e8%a6%86%e7%94%9f%e6%b4%bb%e4%b8%8e%e5%b7%a5%e4%bd%9c%ef%bc%8c%e6%b5%81%e9%87%8f%e4%ba%89%e5%a4%ba%e6%88%98%ef%bc%9a%e4%bb%8echatgpt%e3%80%81midjourne/" aria-label="阅读 揭秘AIGC如何颠覆生活与工作，流量争夺战：从ChatGPT、MidJourney、Copilot、DALL·E再到AI Agent流程，大数据时代的博主生存法则！AIGC如何革新数字时代工作模式？">阅读更多</a>]]></description>
										<content:encoded><![CDATA[
<figure class="wp-block-embed is-type-video is-provider-youtube wp-block-embed-youtube wp-embed-aspect-16-9 wp-has-aspect-ratio"><div class="wp-block-embed__wrapper">
<iframe title="揭秘AIGC如何颠覆生活与工作，流量争夺战：从ChatGPT、MidJourney、Copilot、DALL·E再到AI Agent流程，大数据时代的博主生存法则！AIGC如何革新数字时代工作模式？" width="900" height="506" src="https://www.youtube.com/embed/bykCtus02CE?feature=oembed" frameborder="0" allow="accelerometer; autoplay; clipboard-write; encrypted-media; gyroscope; picture-in-picture; web-share" referrerpolicy="strict-origin-when-cross-origin" allowfullscreen></iframe>
</div></figure>



<p class="wp-block-paragraph">大家好，欢迎收听“老范讲故事”的YouTube频道。今天，我们来讲一讲AIGC如何改变我的工作与生活。之所以录这个视频，是因为我应邀参加了一个访谈，题目就是“生成式AI如何改变我的生活与工作”。</p>



<p class="wp-block-paragraph">啊，我是从什么时候开始接触到AIGC的呢？或者叫生成式AI的呢？应该说，第一个产品是Github Copilot，啊，一个自动生成代码的产品。第二个产品呢，是Midjourney，啊，一个可以画图的产品。这应该是在2022年，5月6月左右的时间。大家注意啊，那个时候，ChatGPT 还没有爆火。应该是在2022年11月左右，啊，GPT 3.5突然爆火，大家才知道，说有AIGC这样的一个东西出来。在这个之前的话，一般管这个叫做生成式AI。当时呢，我还录了节目啊，有节目为证。Github Copilot如何震惊到我了。我们觉得，有了这样的一种生成式AI以后，程序员的工作与生活会变得多么不一样。Midjourney刚刚发布的时候，当时Midjourney应该还是啊3.0的版本，还没有到4.0版本。现在我们使用的是Mijourney的6.0版本了。当时我们已经可以画出很多很有趣的图画出来。我记得啊，Midjourney最早改变我生活的是什么呢？就是我生成了一个自己的迪斯尼风格的3D头像，把这个头像发布到了推特上去。呃，我正常一个推特的阅读量，应该是几百条，因为当时的推特的关注数还比较少。这一条推特发出去以后，阅读量突然飙升，我收获了成千上万的点赞和评论，这让我意识到生成式AI的影响力，以及它如何迅速地融入并改变了我们的生活和工作方式。</p>



<span id="more-1400"></span>



<p class="wp-block-paragraph">我的这一条推特的阅读量，应该可以达到几十万，甚至还要更高一些。到不到百万，这也算是改变我生活的一个案例吧。原来，一个不会画画的人，一个只能在推特上用他匮乏的言辞去表达自我思想的人，可以通过一幅画得到这么多的流量，得到这么多的关注啊。这深深震撼到了我。再到2022年的11月份啊，DALL·E横空出世，AIGC这个名头就算彻底火了。对于我来说，流量才是AIGC天生的组合。你说我用AIGC生成了内容，这些内容我拿它去做了科学研究，拿它去做了各种各样的伟大的事情，其实意义没有那么大啊。对于我来说，AIGC可以获得流量，可以被更多的人关注，可以被推荐算法所推荐，这才是AIGC真正有价值的地方。AIGC极大地降低了内容创作成本，提升了生产质量，提升了生产效率。当有了更多内容之后，下一件事呢，就是要争夺更多的用户时长。在DALL·E刚刚发布的时候，我就已经预见到了这一点。我们的用户量没有上升，我们的用户使用时长没有上升，那么当内容不值钱了以后，人和流量就会变得越来越贵。经过了两年啊，我觉得我当时的猜测和预言吧，逐渐在被证实。我们讲一个小故事啊，以前经常有很多饭馆和包括一些酒店，会去做抽奖啊。怎么做呢？就是往一个盒子里头，不透明的盒子往里去扔名片。等这个饭馆的老板或者酒店的老板，从这个盒子里头摸出某一张名片的时候，你就可以免单啊，或者是得到一些住房券。怎么能够提高中奖的概率呢？</p>



<p class="wp-block-paragraph">大家有没有思考过这个问题？方法很简单啊。多放几张——你想啊，一大家都在往这个盒子里头放名片。如果你只放一张的话，比如说这盒子里有啊，100张名片，你中奖的几率就是1%。当我放两张的话，就是2%啊。当我一次把一整盒名片，一整盒应该是100张名片，把都扔进去，那我不肯定中奖吗？</p>



<p class="wp-block-paragraph">AIGC来了以后，我们可以往盒子里多放一些名片了啊。你中奖的机会就会上升。而且呢，AICC给我们赋能，让我们拥有了一些原来没有的能力。一个不会画画儿的人，现在可以去画画儿了。而画儿对于用户的点击，对于情绪的感染，绝对是比文字高非常多的。所以，AIGC呢，可以让我们创造更大量的内容，在推荐算法，在流量的洪流里边去获得更多的流量，获得更多的关注，也就是说，获得更多的金钱。这是AIGC对于我来说最大的改进啊。</p>



<p class="wp-block-paragraph">让我来还原一下，一个日更科技、创投、互联网、流量方向的博主，每天是怎么工作的啊。然后我们再去看，说AIGC到底怎么改变这个工作。我每天的工作是从阅读和选题开始。我先要看看今天有什么新闻，然后选一些题目来进行个人的演绎。对于我们来说呢，讲的永远是叫大众话题的小众观点，对吧。你说我如果讲一个很小众的话题，没人听。如果我也讲一个很大众的观点啊，大家都这么讲，我也这么讲，也没有人听，而且讲的也没意思。那么一定是大众话题的小众观点。所以第一件事呢，我们先要去筛选话题啊。那你说，你不能自己去讲一些独特的东西吗？人生短短几十年。</p>



<p class="wp-block-paragraph">你要是讲自己的人生经历，估计一个礼拜就讲完了。啊，所以每天第一件事是阅读和选题；第二件事是撰稿。撰稿的话，就是具体要讲什么，还是要去写一个简单的稿件呢？对于我来说，写的是提纲，对于我，逐字稿是不适用的啊，因为阅读起来有一些障碍。然后呢，是录制，就是真正拿设备也好，拿手机也好，把整个的稿件讲出来。再下一步呢，是剪辑——你录完了以后，肯定还是有一些不是那么满意的地方，要把它剪掉。再下一步呢，是进行点击率和SEO优化。什么意思？呃，就是YouTube也好啊，TikTok也好，任何这种视频平台，想去推荐我们的内容，或者想去理解我们到底在说什么，其实是有难度的。那在这种情况下，我们就需要给他一些信息，说我们今天到底想什么，通过标题，通过简介，通过分段信息，通过标签，把这些东西呢，告诉YouTube也好，告诉TikTok也好，告诉这一些推荐算法啊，推荐引擎，然后呢，他们才可以啊，根据我们提供的这些信息，去将我们的内容，推荐给他们认为应该看的人。这一块呢，是有很多需要优化的地方，包括用户看完了以后，如何提高点击率，比如说，YouTube把我的视频给一些用户看了，然后看的过程是展示在这个页面上，用户到底点不点，这是我要关心的事情。用户点击率上升了，那么YouTube认为说，哎，这是一条很好的视频啊，我应该推荐给更多的人看。如果用户去搜索了，那我怎么能够让这些搜索关键词，命中我的视频，而且在最后。</p>



<p class="wp-block-paragraph">YouTube给出的视频搜索结果里头，排的性可能是靠前一些。而这也是我们需要去思考的问题。这个是我们录完剪辑完视频以后，要去干的事情。做完这个事情以后，我们就可以把视频发布到平台上去。然后呢，进行数据回收。啊，什么叫数据回收？就是到底有多少人看了呀，点击率怎么样啊，评论都是什么样的，有多少人点赞了呀。然后呢，再进行新内容的调整。我下次怎么吸取经验教训，把它做的更好一点。总之呢，要形成一个闭环。当我总结了一定经验教训以后啊，我再去选题的时候，我看选一些什么样的题目。这是一个完整闭环啊。</p>



<p class="wp-block-paragraph">那么，从一个Youtuber的角度上来看，让我们来看看AIGC到底是如何来提高我的效率的。先说错误的选项啊，首先，要告诉大家啊，他到底什么不能干。因为AIGC现在有很多课程，很多人上来去告诉你啊，这个东西无所不能，你什么都不用干，就可以躺在这挣钱了啊。首先，要告诉你他不能做什么。第一个，要放弃AIGC肯定是不可取的。你说别人都用，我不用这事肯定不行。为什么呢？逆水行舟，不进则退。AIGC是提高我们创作效率的。你创作一条，我可以创作10条。就像我们在一个名片箱子里头，去抽奖的过程中一样，这个箱子里头有你一张名片，有我10张名片啊。那么，抽出来我的名字的几率，一定是更大的啊。所以，一定不能放弃。第二个呢，叫不劳而获，也是错误的。任何人告诉你说哎，你使了AICC以后，你就可以自动起稿，就可以自动生成稿件。请注意，这里应该是AIGC，不是AICC。</p>



<p class="wp-block-paragraph">在当今的数字时代，确实存在一些关于数字人或虚拟人物能够自动创造收益的神话，你或许会听到这样的话：“拥有一个数字人，你就可以躺着挣钱，无需任何努力。”然而，对于这些言论，你需要保持警惕，因为它们往往出自那些意图收取智商税、推销课程的骗子之口。切勿轻信这些承诺，它们通常都是虚假的。</p>



<p class="wp-block-paragraph">在构建个人品牌或内容创作的过程中，我有一套完整的闭环策略，特别是在作为Youtuber的旅程中，我巧妙地结合了人工智能生成内容（AIGC）的应用。这一切的起点是阅读和选题。为了提升阅读效率，我自建了一个RAG系统，亦即个人知识库。这个系统能够存储我从网络上筛选出的大量信息，随后，我通过向知识库提问的方式，快速获取所需知识，极大地提高了阅读速度。这样一来，我不必通读整篇文章，特别是针对那些为了吸引点击率和延长阅读时间而采用夸张标题的文章。这些文章往往利用夸张的标题吸引点击，一旦点击量增加，推荐算法就会给予更多曝光。同时，为了在文章中插入多次广告，一些写手会将关键信息放在文章后半部分，迫使读者阅读冗长的无关内容。面对这样的文章，阅读体验无疑是痛苦的，浪费时间且信息重复。</p>



<p class="wp-block-paragraph">因此，在这个信息泛滥的时代，构建高效的信息筛选和处理系统，显得尤为重要。通过使用RAG系统和AIGC技术，我能够更高效地获取和利用信息，避免时间的浪费，专注于创造真正有价值的内容。</p>



<p class="wp-block-paragraph">没有意义的内容啊，但是，我一旦把它扔到这种个人知识库里，以后我就可以通过AI搜索，直接找到相对应的重要信息出来啊。这是我用的第一个工具。第二件事呢，是撰稿——就是我还是要去写这个提纲。现在呢，我也用AI提示词做了一个专门的保健，或者说提纲优化的一个过程。在这一块呢，我觉得AI起到的作用还没有那么大，因为AI给我的结果并没有那么让我满意。经常是它出了一个稿件之后，我最后会扔掉重写啊，这个没有办法，因为我没法确定，到底是自己直接做的稿件更好一些，还是AI写的稿件更好一些。因为这种内容的结果回收周期太长，污染因素太大，所以没有办法简单地做A/B测试啊。但是，作为一个视频博主，我是要坐在这讲这个故事的，只有我自己写的稿件，我可能讲得更痛快一点。做视频博主很重要的一点，不是说有多少人看你，你自己先得把自己讲开心了。如果你讲得越讲越痛苦，越讲越难受啊，那么听的人也会感受到这一点的啊。所以在撰稿这一块，我虽然使用AI，但是并不依赖它啊，而且我觉得AI在这块还有待提高吧。录制这一部分呢，我只能说，我的各种设备都号称使用上AI了，但是具体怎么用的我也搞不清楚，就据说是有各种AI优化美颜啊。对，你们看到了我吧，这个还是有一定的AI参与。在剪辑这一块的话，AI其实是帮了大忙的。现在呢，各种的剪辑软件，都有专门的AI剪口播的这种功能啊，他会先把我们讲的内容，整个识别成文字，然后根据内容的连贯性和重要性，自动剪辑成一段流畅的视频。这个过程大大提高了我的工作效率，让我有更多的时间专注于创作本身，而不是技术细节。虽然AI在某些方面还有待提高，但在剪辑方面，它的表现确实令人满意。</p>



<p class="wp-block-paragraph">然后，再将其中的重复语气词删掉，把空白时间直接自动删掉。我们还可以直接根据文字去剪辑视频。原来剪辑视频是很麻烦的，你需要看这个地方说重复了，需要找到这句开始的地方，一句结束的地方，再把它删掉。现在，已经完全不用了。现在，你只要在文字上去删删改改，就可以得到最终的视频了。但是，这一块还不是那么成熟，就是你删是没问题的。你说，我想改几个字，这事就费劲了。因为改的话，它需要重新平衡你的语音，重新生成你的口型。在这块，有一些工具在做，但是成本很高，效果也还没有那么好。我相信，可能在不久的将来，这一块也可以补上。</p>



<p class="wp-block-paragraph">至于说自动配音和数字人，我尝试过，效果一般。我可以写一段话，它就自动的给我配音去了。也找了一个人在那给我稍微演绎一下。这个有，但是不喜欢。至于说自动的字幕优化、翻译和高亮这一块，这是现在剪辑软件最新的功能。原来，这些字幕会自动的给你识别出来，但是这个识别，是做的传统语音识别。传统语音识别的话，就有一个很严重的问题，就是一句话，它其实很难去判断里头每一个字具体是什么，所以它错误率很高。那你说，AI怎么这么笨。这个跟AI没关系，我们如果是人的话，去听别人单独的说某一句话或者某一个单词，你可能识别正确的几率也是不高的。但你说，我们没感觉，听人说话听不明白，那是因为什么？有上下文，以及有各种生活习惯。你把它这些东西综合在一起，进行考量的时候。</p>



<p class="wp-block-paragraph">识别的准确率就会上升。所以现在，在AI识别字幕的这个板块里头，也应用上了这些知识和功能。现在的字幕识别已经相当准确了，但不是完全准确。然而，准确率已经上升很高了。而且，AI识别完字幕后，还会自动地将它认为相对重点的地方标注成比较明显的高亮，让用户看到字幕的时候知道这一块相对来说重要一些。它还可以进行自动翻译。其实，翻译对于它来说相对容易，就是它可以把我们的内容变成中英双语字幕。只是，现在这个交互的过程还有一些问题。你想让它再提高准确率，其实已经挺难的了。应该是什么呢？就是先去识别，然后呢，有一个跟用户交互的过程，让用户去进行错误修改，或者告诉它说哪一块你没听清楚的词应该如何去纠正。这样的话，可以慢慢地让AI熟悉我们的语气语调，熟悉我们各种口头禅，熟悉我们的各种发音，然后可以逐渐提高准确率，也可以进行一些特定的修订。应该在这个之后再去做翻译，否则的话，就是属于完全单纯的浪费算力了。所以，很多跟AI相关的操作，不是AI有多厉害，而是我们的交互应该如何设计的问题。这一块呢，也有待提升。</p>



<p class="wp-block-paragraph">待字幕处理完了以后，我现在的整个拍摄环境还是相对比较杂乱的。所以呢，我会进行AI抠像。这也算是多模态识别吧，把人抠出来。后面呢，用me journey再去画一幅跟我们今天讲的话题相对来说比较贴近的背景，再把人放上去。哎，也算是一个AI应用。</p>



<p class="wp-block-paragraph">这是关于剪辑相关的内容。再往后，点击率和SEO优化也全都是AI干的事情。封面很重要，因为用户在决定是否点进去之前，先要看封面。这个时候，Mijourney又大显神通了。我们现在能够使用到的画图软件，基本上是三个：第一个是Mijourney，第二个是Open AI的DALL·E 3，第三个是Stable Diffusion。国内使用的，诸如“同1,000问”、字节跳动，基本上都是Stable Diffusion的各个版本。</p>



<p class="wp-block-paragraph">在这三个画图软件里头，Stable Diffusion的特点很明确：稳定性非常好，但是艺术性差一点。操控要稍微麻烦一些，而它的优点就是稳定性。你要求它按照统一的风格，出连续的内容的时候，它相对来说要好一点，所以更适合工业生产。DALL·E 3是Open AI的这个产品，它语言理解能力非常强。当你跟它说我要画什么的时候，它是所有这些工具里头理解能力最强的一个。但是它的艺术性要稍微差一些。但是看各取所需吧，有些人说我不需要那么精细、那么艺术的这种内容，但是我希望我讲的所有东西都给我画出来，那么在这个时候，DALL·E 3会更适合一些。</p>



<p class="wp-block-paragraph">我也在用，Stability AI我用的很少。最后一个就是我常用的Mijourney。Mijourney的最大好处是什么？就是它的艺术性最强，感染力也最好。但是它的缺陷是什么呢？就是稳定性可能没有Stable Diffusion那么好，而语言理解能力可能没有DALL·E 3那么强。不过，如果你追求的是艺术性和感染力，Mijourney无疑是最佳选择。</p>



<p class="wp-block-paragraph">稳定性没有那么好啊。你每次让他画的时候，他未必会出来统一风格的内容啊。第二个是什么呢？就是他对于文字的理解能力呢，也要稍微差一些啊。他毕竟不是一个语言模型，对吧？他是一个画图的。你给了他太复杂的描述了以后，他可能理解不了啊。这是它的各自优缺点啊。对于我来说呢，啊，最主要的是用me journey，用me journey画封面了以后啊，再加上一些其他的工具，做出视频的封面来。再下一步是做标题啊。标题这个东西呢，呃，我现在基本上都是让AI去声称标题。要注意啊，前半截，或者说前面十几个字是给人看，后面呢是给机器看的。它什么意思？因为人会会看到标题，然后他看到标题以后，会决定点不点进来。对吧？所以前面是给人看的。那为什么人不看后面的呢？因为我们的标题后面的部分，都变成点点点了。甭管是YouTube还是TikTok，后面都是点点点啊。TikTok你可能连标题都看不见啊，直接划过去了。YouTube是可以看到标题的。那你说我就写前面这个简短标题，不就完事了吗？啊，不要这样啊。当你去搜索的时候，比如说吧，我今天要搜索open AI这个词，你的视频里它出现了，我的视频里也出现了，那么谁排前头呢？如果我这个open AI这几个字，出现在标题里头，我这排前头。如果是出现在简介里头，也可以排的相对靠前一些。你说我标题简介里都没出啊，我只是出现在啊标签里面了。因为它是允许我们在里面去打标签的。那这个呢？</p>



<p class="wp-block-paragraph">就会出现在最后，或者可能压根对这个搜索结果排序影响就会比较小。它是有权重的，所以，我们要利用人看不到的这个部分标题，尽量呢把一些搜索高频的词放上去。这样的话啊，在用户使用搜索的时候，我们可以占到一些小便宜。那么你想去啊，写出这么复杂要求的标题来，你还是让AI去干吧。甚至呢现在还有人去总结出经验，比如说这种咆哮体标题啊，我不能允许你不知道，99%的人都不知道，就属于咆哮体。包括像小红书，二极管式标题也是这样的啊，只有我知道的秘密这个事情，难道你还不知道。反正有很多这样的标题风格啊，这个也是允许我们直接写提示词，让AI来替我们生成的。这是标题啊，简介呢也是如此的啊。简介我们会呃给机器看，你说有没有人去看那个简介，有啊但是很少。绝大部分的简介是机器看的，在谷歌啊，或者在其他的这种平台上，在搜索推荐的时候，由机器来去读取这些内容，来决定把我们的内容推荐给谁。所以简介呢，我现在完全是由机器生成的啊，我的标题，我一般是机器生成完了以后，会人工去改。简介基本机器生成完了我是不改的。</p>



<p class="wp-block-paragraph">再往后呢，是做分段信息。AI呢，也可以去自动的给我生成分段信息，我这个视频第从哪个时间点开始讲哪一段，从哪个时间点开始讲哪一段。这个呢是盖码史啊。如果用户点开你的视频以后啊，他不想从头看，他想从中间哪个地方开始看，他可以直接点击分段信息往后走。另外呢，所有分段信息是先加入搜索的。用户搜完了以后说。</p>



<p class="wp-block-paragraph">我想搜一个什么什么内容啊，你这里的写好分段了。我的视频是从几分几秒以后讲，这一段内容，你有可能直接被搜索命中啊。搜索命中了以后，一点就进去就可以看了。然后是视频的标签啊，你可以给视频打很多很多标签啊。那么这些呢，通通都是由AI自动生成的。我呢，自己写了一个AI agent啊，写了一个很长的流程。这个流程输入什么？输入的是字幕。刚才我们讲了，我们在剪辑的时候，已经生成了字幕了。我把字幕扔给这个AI agent，它会一步一步的去完成，刚才我们讲的所有工作：生成标题，生成简介，生成标签，生成分段信息啊，生成一个完整的博客。最后我还会把所有内容，生成一个完整的博客。这些博客呢，我也会贴到一些博客网站上去啊。为什么呢？啊，有些人说我不，我不能给你字幕。你给了你字幕以后，你们就不好好看我的视频了。啊，你都用YouTube GPT啊，或者说Tube GPT，用这样的工具去看。我不开心了，你让我没有挣到广告费啊。千万别这么想，哈哈，为什么？就是，当你提供更多的内容到网上去以后，啊，真正能够看到这些内容的，其实不是人啊，而是搜索引擎的爬虫。当他爬到了以后，我们就又有被谷歌，搜索引擎去命中的机会了。比如说我写了一篇博客，把我的一个视频录完了以后，把博客贴到我自己的网站上去了，那么就有可能会被谷歌搜索命中啊。命中了以后呢，用户大概率还是会回来看视频的。永远不要跟流量过不去。我们到啊这一步了。</p>



<p class="wp-block-paragraph">是后期点击与SEO优化啊，再下一步是数据回收与再优化。这一块呢，基本上目前还是人工在处理啊。未来是不是有机会改成AI处理呢？啊，那是未来的问题了，现在还搞不定啊。我每天还会去看数据啊，看评论，然后来决定未来的内容怎么做。下一步说，我们可以如何更进一步的使用AI来改进我的工作呢？前面是我现在已经做到的，未来的是，以后边是一些未来畅想。</p>



<p class="wp-block-paragraph">第一个呢，内容收集和整理还可以进一步优化。那我现在的处理方式是先去阅读啊，然后录入到机器的数据库，或者本地知识库里头。以后再通过AI智能搜索，得到我所需要的信息。但是我们真正去做研究的时候，会怎么样呢？会进行延展的阅读。那么我可能会再去写一个更复杂的AI侦探流程啊。当我搜索结果之后，然后我会在搜索结果中啊，自动的，再去生成进一步需要去探索的信息啊，进一步需要去收集的数据。把这些东西拿出来以后，再进一步去搜索，再进一步啊，结合我内部的个人知识库，或者是外部搜索的一些结果，得出更复杂的或更完整的调查结果出来啊。这是可能未来要做的事情。</p>



<p class="wp-block-paragraph">我的评论内容啊，应该会自动的阅读，至少要统计，这个事还是应该去做的。现在呢，并没有做啊。我现在是人工去阅读所有的评论啊，找有趣的去回复啊。以后的话，我会去啊，让AI去读所有的评论，但我不会让AI去回复的啊，因为AI回复的话，是对所有给我发评论的人不够尊重啊。但是我会让AI去统计啊，哪些评论特别有趣。</p>



<p class="wp-block-paragraph">在评论区中，一些明显的风向或思潮正在流行，这是AI可以自动总结的。下一步的目标是自动总结评论中的主流观点或情感倾向。至于短视频的自动剪辑，这是一项我尚未着手的工作，但我认为这是应该去做的，也希望AI能在这方面给予我一定的帮助，或是提供剪辑建议。不过，这可能还需等待AI剪辑软件的进一步进化。我自己直接完成AI短视频剪辑，可能仍有些许难度。</p>



<p class="wp-block-paragraph">AI视频生成，以及音乐和音效的智能生成，这些领域我正在尝试，但尚未找到实际应用的方法。之前我提到过，AI在内容生成、代码编写、图片生成方面，我都有所涉猎。对于AI生成视频，我试用了目前几个较为领先的产品，但使用方法仍需探索。我曾尝试将用majority画好的图交给AI视频生成软件，让它生成动图，再将这些动图作为视频背景，但用户反馈不佳，他们认为太过杂乱，甚至不如静态背景图，这样他们可以专心听我讲故事。</p>



<p class="wp-block-paragraph">当前AI视频生成的可控性和艺术性尚未达到理想状态，我们还需等待其进一步进化。至于音乐生成，我尝试过几次，但生成的音乐连我自己都难以忍受，因此未敢拿出来“污染”大家的耳朵。期待未来AI音乐生成能有更合适的发展。</p>



<p class="wp-block-paragraph">技术，或者更进一步说，技术的进步，有了更好的商业模式。有的时候，其实跟技术没关系。就是当大家都生成了很好的AI音乐，因为它成本降低了，决定把这些音乐无版权的开放出来，给大家用。然后再有一些筛选的机制，能够自动的筛选出来，我应该用的音乐的话，可能我以后会去用这些音乐。但你让我自己去生成音乐，短期内应该不会去做。至于更进一步的剪辑呢，比如说AI的一些，呃，阿巴塔，不是说数字人，而是什么呢？我可以跟AI的一些虚拟形象进行问答。这个，可能是未来我希望有的一些功能吧。至少现在还做不了运营数据，或者说，我视频播放数据的回收，以及优化建议呢。嗯，未来应该也还是会用AI agent，再去做一个。目前还没有开始做这个，工程量稍微大了那么一点点。这也是未来需要去思考的一个问题。还有一些什么可以用AI来做的呢？就是更多的，人与人之间沟通的润滑剂，也是很适合AI去在里边去尝试的一个方向。什么叫人与人之间沟通？比如很多的博主，我们经常会一起去录一些节目。那么在这个过程中，AI可以去给我建议说，哎，这个话题你去找谁谁谁去录，其实会更好。包括他可以帮我去看一些别人的视频。因为我现在每天自己去阅读，撰稿，录制，剪辑，上传，优化等等，这个过程的话，没有那么多的时间去看其他人在做什么。嗯，这一块的话，AI其实是可以给我一些帮助。其他人都在做什么？哪些话题更有趣？哪个话题更受欢迎？</p>



<p class="wp-block-paragraph">技术的进步，尤其是AI技术的发展，正在改变商业模式和人与人之间的沟通方式。AI音乐的低成本生成和无版权开放，使得音乐的使用变得更加便捷。AI的筛选机制能够帮助用户快速找到适合的音乐。未来，AI将不仅限于音乐领域，还能实现与虚拟形象的问答互动，提供更个性化的体验。在数据分析方面，AI能够回收和分析运营数据及视频播放数据，为优化提供科学建议。此外，AI还能在人与人沟通中发挥润滑剂的作用，例如，为博主提供话题建议，分析他人视频，节省时间，提高效率。AI技术的广泛应用，正逐步改变我们的工作和生活方式。</p>



<p class="wp-block-paragraph">你可以跟谁谁谁去讨论一下啊，或者两个人一起去做一些联合直播。这是AI可能能够大展身手的一个地方吧。总结一下，AIGC或者叫生成式AI呢，肯定是一场革命。在AIGC时代呢，一个人就是一支团队啊。像刚才我分享了我工作的整个过程啊，所以你们看看啊，我基本上是按照一个整个团队在工作的啊。与AI在一起呢，主要是要卷那些不用AI的人啊。有一些人说我就不使啊，那我们就卷死他，不用AI的人。最后呢，只会留下来很少的一部分精英，作为文化遗产传承下去也就可以了。给大家表演一下，就跟日本这个寿司仙人一样，你就去看一下他的表演。但你说所有日本人吃寿司，都是需要那么做吗？这个事是不行的。找到自己的定位啊，做人适合做的事情，让AI去做AI适合做的事情。这是非常重要的啊。就是在我们去使用AI的时候，一定要注意：AI不是无所不能的。里头怎么去让他干他擅长的事情啊，这是我们需要注意，需要不断尝试和碰撞的地方。永远不要相信不劳而获啊，这个一定要大家记住啊。大家都在寻找新的机会与定位，社会是不允许不劳而获的啊。为什么呢？因为如果不劳而获可以在社会中生存的话，整个社会会发生崩塌的。这会破坏社会的稳定性与发展啊。所以千万不要相信不劳而获，所有对外宣传不劳而获的人都是享受智商税的人。好啊，这就是这一期的内容啊。这一期内容里边提到的各种的流程，我一般会在付费频道里头跟大家分享。</p>



<p class="wp-block-paragraph">说：“哎，这个流程具体是怎么做的，对吧？或者有人希望说：‘啊，我希望了解一些很特殊的流程，应该如何去做。’你也可以跟我讲，我会在付费频道里去录出来。好，啊，这一期就跟大家讲到这里。感谢大家收听，请帮忙点赞，点小铃铛，参加Disco讨论群，也欢迎有兴趣、有能力的朋友加入我的付费频道。再见。”</p>
]]></content:encoded>
					
		
		
			</item>
	</channel>
</rss>
