7 月 08
Luke FanAIGC AI Agent, AIGC, AI产业, AI幻觉, AI应用开发, AI趋势, Claude 3, DeepSeek, Few-shot (少样例提示), Gemini 2.5 Pro, GPT-4o, Grok, JSON输出, LangChain, LLaMA, LLMOS (大模型操作系统), MISTRAL, OpenAI, RAG (检索增强生成), Shopify, Simon Wilkinson, 上下文工程 (Context Engineering), 上下文窗口 (Context Window), 上下文隔离, 信息压缩, 函数调用 (Function Calling), 大语言模型 (LLM), 安德烈·卡帕西 (Andrej Karpathy), 工具调用 (Tool Calling), 技术解读, 提示词工程 (Prompt Engineering), 模型稳定性, 特斯拉, 程序员, 系统提示词, 英伟达 (Nvidia), 豆包大模型, 软件2.0 (Software 2.0), 通义千问, 长期记忆
上下文工程又有新词了。AIGC不怎么赚钱,造词的速度还是非常非常快的。大家好,欢迎收听老范讲故事的YouTube频道。
提示词工程已经稍微有点过时了,现在的新词叫上下文工程。提示词工程长什么样,大家还记得吗?就是上来先说你是谁,谁先给大模型定一个位置。比如说你是一个资深翻译,你是个语文老师。然后呢,说我现在想要干一点什么事情了,给我出个题,给我做个翻译,再给他一个简单的例子,说你照这样给我把东西做出来。
光有提示词呢,肯定是不够的。除了刚才我们讲的完整的、结构化的提示词之外,你还是需要很多相关的上下文,才能够让大模型稳定的输出结果。那你说我们继续把提示词写长不就行了吗?我还见过那种直接写出几百字或者是上千字小作文的提示词。这个是不是可以继续往前走呢?不行了。因为你如果继续叫提示词工程呢,会容易引起误解。大家觉得只要不断的把提示词写长,就可以把这事解决掉。但其实除了提示词之外,还有非常非常多的上下文数据需要一起写进去,才能够让大模型稳定的输出我们所预期的、有价值的结果出来。
所以呢,就不能继续叫提示词工程了,一定要起个新词。而且呢,AI时代呢,起新词是非常重要的,因为可以吸引眼球。只有足够吸引眼球的东西,才有发展的前景。所以在这个时候,上下文工程就来了,一个新词诞生了。
More
6 月 19
Luke FanAIGC AIGC, AIGC版权第一案, AI绘画, AI视频生成, AI诉讼, Getty Images, Google Gemini, GPT-4o, Grok, IP形象保护, Meta, MidJourney, musical.ly (TikTok前身), OpenAI, Stability AI, stable diffusion, YouTube, 人工智能, 估值, 判例法, 史莱克, 合理使用原则, 吉卜力, 吉梦, 商业模式, 大卫·霍尔兹 (David Holz), 大语言模型, 宫崎骏风格, 小黄人, 并购, 开源模型, 影视巨头, 扎克伯格, 提示词屏蔽, 文生图, 星球大战, 未来趋势, 标志性案件, 法律风险, 深度解析, 漫威, 版权侵权, 环球影业 (Universal), 环球影业诉讼, 用户协议, 知识产权, 禁令, 科技评论, 米老鼠, 老范讲故事, 股权和解, 行业影响, 订阅制, 训练数据, 迪士尼 (Disney), 迪士尼起诉Midjourney, 麻将
迪士尼环球起诉Midjourney,最终的结果可能跟大家想的不太一样。大家好,欢迎收听老范讲故事的YouTube频道。
第一次,影视巨头起诉了AI平台。前面也有起诉的,说你侵犯我版权了,或者是拿着我的画去复制了。但是呢,影视巨头参与到这件事情里头,这是有史以来第一次。2025年6月11日,迪士尼和环球影业正式向美国加州中区联邦法院提交了诉状。他们诉什么呢?Midjourney侵犯其版权。这事我们早知道,但是呢,大家要注意,甭管是迪士尼还是环球,人家真正要去起诉的东西,其实不是影视版权这些东西,而是什么呢?动漫形象的这些IP。比如说你今天做了个米老鼠,做了个唐老鸭,你没有得到人家的授权,这事就算是侵权了。
迪士尼跟环球呢,写了110页的诉状,其中详细列举了Midjourney生成的大量知名角色图像与原创视频素材的对比例证。这个不用对比,我们知道的画的很像。受保护的角色包括迪士尼旗下的星球大战、漫威超级英雄、狮子王、冰雪奇缘、辛普森一家等,以及环球影业旗下神偷奶爸里边这个小黄人、怪物史莱克、宝贝老板这些。在未经授权的情况下,大量抓取并利用其版权素材训练AI模型,允许用户持续生成这些知名角色的翻版图像,无底的剽窃深渊,这是给他们定的这个罪状。
More
6 月 01
Luke FanAIGC AI Agent, AI 数字人, AIGC, AIGC (AI生成内容), AI产品分析, AI创业, AI动画, AI发展趋势, AI商业模式, AI工具测评, AI教程, AI模型聚合, AI绘画, AI视频生成, AI设计, AI赋能设计, Canva, ComfyUI, Demo演示, Flex, Google Imagine, GPT-4o, LibLib AI, Lovart, MidJourney, Photoshop, stable diffusion, YouTube封面, YouTube封面设计, 产品体验, 剪映, 剪映 (CapCut), 可灵, 可灵 (Keling), 垂类Agent, 多模态AI, 工作流自动化, 提示词工程, 泛Agent, 泡泡玛特风格, 科技评论, 老范讲故事, 设计师, 设计师AI, 设计师失业, 设计师就业, 陈冕
设计师这次是不是真的要失业了?咱们从Lovart这个为设计师专门设计的垂直agent来看看AI agent在垂直品类里的一些玩法儿。
大家好,欢迎收听老范讲故事的YouTube频道。Lovart又一个现象级产品出来了,设计师专用的一个垂直agent。它呢没有Manus当时引起的那么大的动静,但是呢,我用了一下,感觉比Manus这种泛agent还是要好用一些。
什么叫泛agent?就是它啥都能干。Lovart这种能够专门为设计师工作的agent呢,它就是垂类agent,它其它事干不了。你说你给我去写个文章,给我去做个总结,这它干不了。但是你说你给我画个画,做个视频,设计一个PPT,设计个海报,做的可好了。他们设计的产品在x上被马斯克亲自点赞。因为这种设计类产品嘛,一个图片什么的,你要设计的非常好的话,确实会引起大佬点赞。很多的使用者也是惊为天人,我去使了一下,确实是很神奇,能够解决非常多的问题。
More
5 月 05
Luke FanAIGC, Meta的故事 2023年, 2024年, 2025年预测, AI Agent, AIGC (AI Generated Content), AI发展, AI战略, Anthropic, API服务, ChatGPT, DeepSeek, Facebook, Gemini, Google, GPT-4o, Grok, Groq, LLaMA, LLAMA API, LLAMA Con, LLAMA发布历史, Meta, Meta AI APP, OpenAI, Qwen (通义千问), XAI (马斯克), 云计算, 亚马逊云, 产品体验, 人工智能, 元宇宙战略影响, 免费策略, 商业模式, 大语言模型 (LLM), 字节, 应用程序 (APP), 开发者大会, 开源模型, 微软云, 战略失误, 战略惯性, 扎克伯格, 扎克伯格 (Mark Zuckerberg), 技术社区, 播客内容, 智能眼镜, 杨乐坤 (Yann LeCun), 杨乐坤观点, 模型对比, 流量入口争夺, 深度学习, 百度, 社交优势, 科技评论, 竞品分析, 老范讲故事, 腾讯, 腾讯元宝, 行业分析, 起了个大早赶了个晚集, 追赶者, 阿里, 马斯克 (Elon Musk)
Meta召开LLAMA Con开发者大会。他原来丢的这些课程,现在补还来得及吗?
大家好,欢迎收听老范讲故事的YouTube频道。4月29号,Meta召开了首届的LLAMA CON开发者大会。Meta原来是开open大会,他反正每年都会开一到两次的这种开发者大会,这是开了第二次开发者大会了。这一次呢,主要就是对LLAMA进行了一些发布。前面LLAMA4已经发布过了,而且发完了以后还翻车了。现在呢,Meta说我也要去补课了。
补什么课呢?第一个是我要出一个独立的APP智能助手,叫MetaAI APP,对标ChatGPT。另外呢,我要开始面向开发者直接提供官方的LLAMA API服务了。这块呢,还准备去跟Groq这些芯片厂商去合作去,我帮他们去部署。现在呢,LLAMA的这些服务都是免费给大家使用的,LLAMA API未来有可能会收费。
你说人家OpenAI一出ChatGPT就开始给大家提供服务,APP也出了这么长时间了。这Meta真的是起了个大早赶了个晚集,到今天才想起来说我的这些API也要为大家服务了,我的APP也要为大家服务了,还来得及来不及?
More
4 月 24
Luke FanAIGC, 字节跳动,故事多 AI Agent, AI应用, AI竞争格局, Anno 1800, Anthropic, API接口, Baidu, ByteDance, Claude 3.5, Coze Space, Coze Space评测, DeepSeek R1, Gemini 2.5 Pro, Google, GPT-4o, Llama 4, LLM, Manus, MCP (模型控制插件/标准), Meta, OpenAI, PPT生成, Token消耗, Waiting List, 产品体验, 产品对比 (Coze vs Manus vs Grok vs XinXiang), 产品评测, 代码生成, 任务拆解, 优劣势分析, 免费试用, 内容生成, 功能演示, 可视化网页生成, 呼伦贝尔自驾, 复杂任务处理, 大语言模型, 字节跳动, 工具调用 (内部/外部), 市场调研, 心想APP, 扣子空间, 扣子空间使用, 搜索质量, 数据调用, 文档生成, 旅游攻略, 智能体, 游戏攻略, 现象级产品, 用户分析, 用户反馈, 电动车充电, 百度, 简历筛选, 自动化, 自我规划, 行程规划, 表格生成, 访谈记录整理, 豆包大模型, 通义千问, 邀请码, 阿里, 高德地图, 黑神话悟空
Manus的后劲来了。百度、字节都有了自己的agent产品上线。
大家好,欢迎收听老范讲故事的音乐节目频道。字节上线了扣子空间,百度上线了心想APP。Manus的光环不再。Manus本身就属于意外爆火,当时它突然火了以后,咱们还做了直播,说这个东西没有什么技术门槛,只是产品设计的很有意思。
Manus跑去跟阿里合作了之后,那字节、百度说这不行,咱们也得有自己的产品上线。又不是有多难做的东西,那就做呗。我呢,搞了一个字节扣子空间的邀请码,咱们呢试一试,看看这个产品到底怎么个用法儿。
Manus呢,到现在我也没用上。原因也很简单,我去申请测试,等了很久,到现在都已经开始收费了,也没有收到说你可以来玩一下的这个邀请。所以也就别费劲了。我自己呢也没有特别着急,我要特别着急想用的话,随便找两个人去要一些邀请码,也还是可以搞得定的。既然没有那么热心的话,也就没有上心去找嘛。
More
4 月 18
Luke FanAIGC AI发展趋势, AI局限性, AI幻觉, AI应用, AI易用性, AI普及, AI未来, AI模型发布, AI编程, AI视觉, AI记忆 (Memory), AI评测, API, API代理 (Open Router), API定价, ChatGPT Plus, Function Calling, Github Copilot, GPT-4o, GPT-5展望, Greg Brockman, IDE集成, Mark Chen, Meta data分析, O3, O4 mini, OpenAI, OpenAI发布会, Sam Altman, Scaling law, Sora, TikTok直播带货话题生成, YouTube话题推荐, 一站式AI服务 (Total Solution), 世界模型, 人工智能, 内容创作, 图片推理 (Image Reasoning), 大语言模型, 实时交互, 实用AI, 工具调用 (Tool Calling), 强化学习, 推理模型, 搜索集成, 模型对比 (OpenAI vs 竞品), 潭柘寺图片识别, 科技评论, 跨模态AI
GPT-3和O4 mini发布了,这次绝不再仅仅是科学家们的玩具了。大家好,欢迎收听老范讲故事的YouTube频道。
本来GPT-3和O4 mini发布呢,我并没有抱太大的期望。为什么呢?因为前面O1和O3 mini发布的时候呢,看得我头晕眼花的。我记得应该是在去年12天连续发布会的时候发布的O3 mini,实在是太不明觉厉了。各种的复杂科学问题,咔咔就给解决了,然后各种的排名都排得很高。但是呢,我自己其实并不怎么用。
为什么呢?第一个,ChatGPT Plus用户里边呢,它是有用量限制的,并不是随便让你用的。所以在有用量限制的情况下,你就得省着用,而且你也感觉不出有太大差异来。你说你用它干嘛?据说编程很强,但是它没法跟IDE结合,基本上也就放弃了。你是可以出一大堆的代码,但是你还得向IDE里边去考来考去的,很麻烦。那你说我通过API调用吧,直接使用O1和O3 mini这些模型,实在是贵,所以就放弃了。
More
4 月 07
Luke FanAIGC 1000万Token上下文, 400B, AI Agent, AI应用场景, AI新闻, AI未来发展, AI模型发布, AI竞赛, AI算力, Claude 3.7, DeepSeek, FP8精度, Function Call, Gemini 2.5 Pro, GPT-4o, Grok (XAI), H100 GPU, INT4量化, Llama 3, Llama 4, Llama 4 Behemoth, Llama 4 MARVELIC, Llama 4 Scout, Llama 4发布反响平淡原因, LLM, Meta AI, Meta战略, Mixture of Experts, MOE架构, 专家模块, 中文能力提升, 人工智能, 全模态AI进展, 千问 (Qwen), 卡估值, 多模态输入, 大语言模型, 字节AI, 小模型竞争, 开源LLM对比, 开源模型, 开源模型内卷, 开源社区, 推理速度, 文本输出, 模型微调, 模型性能比较, 模型测评, 模型训练, 活跃参数, 流量入口, 知识蒸馏, 硬件要求, 端到端模型, 腾讯AI, 谷歌AI, 超级APP趋势, 长上下文, 阿里AI
Llama4发布了。这里的黎明静悄悄,没有什么响动。这是怎么回事?
大家好,欢迎收听老范讲故事的YouTube频道。一觉醒来,Llama4就发布了。扎克伯格亲自在Facebook的REELS(也就是Facebook的短视频里面)发了一条视频,说Llama4发布了,今天是Llama4日。
Llama4呢,一共是有三个版本:
第一个叫Scout(侦察兵版本),总参数1,090亿(也就是109B),活跃参数是170亿,包含16个专家模块。对的,Llama终于也放弃抵抗了,从Llama4开始变成Moe了。在Llama4之前的版本都是单一体的模型,Llama3.3还给了一个400多B的单一模型,到Llama4彻底放弃抵抗了。
现在呢,支持1,000万TOKEN这种上下文,这个是Llama4最大的一个特点。DeepSeek是64K(也就是64,000个TOKEN上下文),现在上下文比较大的Gemini大概是能到2兆(200万),Llama4直接给了一个10兆(1,000万TOKEN),这是它做的一个很创新的点。
More
4 月 06
Luke FanAIGC 30美元), 3D模型, AI Agent, AI大模型内卷, AI绘图, AI绘画工具, Alpha版, DeepSeek R1, Gemini 2.0 Flash, GPT-4o, Grok (XAI), MidJourney V6.1, MidJourney V7, MidJourney更新, MidJourney评测, Relax模式, Turbo模式, V7发布, 一致性问题, 个性化设置, 中文提示词, 书店, 人工智能, 人物绘画 (汉服新娘), 优缺点分析, 厨房, 吉卜力风格, 图像生成, 图像质量, 场景绘画, 基础模型竞争, 定价策略, 戏精AI, 手绘风格, 指令理解, 文字生成能力, 横评对比, 照片真实感, 生产力工具潜力, 用嘴生图, 皮克斯3D风格, 细节狂魔, 艺术表现力, 草稿模式, 视频生成, 订阅费用 (10美元, 语音生成, 酒吧, 食物绘画 (拉面)
MidJourney V7终于发布了,是不是王者归来了呢?
大家好,欢迎收听老范讲故事的YouTube频道。2025年,大模型进入了快速内卷期。从春节的时候,DeepSeek R1发布,打响了第一枪。前面DeepSeek V3大家还没觉得怎么样,R1一出来,第一枪打响了,大家开始卷推理、卷开源、卷免费、卷基础模型。
基础模型是什么?GPT-4.5、Claude 3.7、Gemini 2.5 Pro以及DeepSeek V30324版,这是在卷基础模型。然后大家去卷AI agent,各种deep search、deeper search或者是deep research,Manus,各种的AI agent开始卷起来。最后卷绘图,绘图应该是从GROK3开始卷起。GROK3说:“我可以不设限的让大家去画图。”算是给了大家一点点小惊喜。
Gemini 2.0 Flash直接说:“天塌了,这个以后做Photoshop的人要没饭吃了。”他对语言文字的理解和执行能力非常非常的强。你给他一个美女,给他一个包,说让美女拎着包,一致性很好。这个美女拎着这个包没有任何问题。当时大家就讲说Photoshop这帮人要失业,但是并没有引起特别大的风潮。为什么?因为Gemini 2.0 Flash画太复杂的东西是画不了的。
More
11 月 03
Luke FanAIGC AI代理, AI搜索工具, Bing搜索, ChatGPT app, ChatGPT搜索, Chrome, Chrome插件, Copilot, Google, Google 搜索, GPT-4o, GPT聊天窗口, O1模型, OpenAI, OpenAI战略, Perplexity, Plus用户, SearchGPT, Teams用户, 万圣节, 严肃内容, 产品功能, 产品预览, 人工智能, 任务分解, 使用体验, 使用感受, 信息丰富度, 信息分类, 信息整合, 信息秩序, 信息获取, 信息过滤, 候补名单, 免费用户, 内容审查, 内容质量, 原型产品, 固件, 大模型, 小模型, 幻觉, 幻觉生成, 引用追踪, 技术原型, 技术尝试, 排序问题, 插件, 搜索引擎, 搜索接口, 搜索模式, 搜索精度, 搜索结果, 数字助手, 数据摘要, 数据集成, 数据鲁棒性, 新闻源, 样式, 概念产品, 深度搜索, 版权, 生成质量, 用户体验, 用户流量, 用户群体, 移动端, 适应能力, 限定产品, 鬼故事, 默认搜索引擎
ChatGPT搜索,OpenAI在万圣节给大家讲的鬼故事。这是一个什么样的情况?大家好,这里是老范讲故事的YouTube频道。今天咱们来讲一讲ChatGPT搜索。我使用一天以后的感受,以及为什么觉得它是一个万圣节的鬼故事。
11月1号,北京时间0:35,我收到了一封邮件。这个邮件上写了,说我们发布了ChatGPT搜索,这是OpenAI的官方邮件。首先感谢,我去注册了SearchGPT原型候补名单。这个里头大家注意有三个词:第一个是SearchGPT,第二个是原型产品,第三个叫waitlist。他首先感谢了这件事情,说我们很荣幸地宣布,这个ChatGPT搜索发布了,而且向您和所有候补名单上的用户开放访问权限。只要原来申请过的,现在还没有被批准的SearchGPT的候补名单里的这些人,通通都可以访问了。
现在,其实你即使不在候补名单里头,Plus用户和Teams用户都是可以使用的。免费用户可能要稍微等一等,但我不确定免费用户是不是可以在SearchGPT的候补名单里。这个事我不确定,如果是在里边,可能也能够使用。邮件是这么写的。
More
10 月 15
Luke FanAIGC AI Agent, AIGC泡沫, AI技术发展, Anthropic, API价格, API开发, Apple Intelligence, Canvas, Cloud Artifacts, GPT-4o, iPhone 16, OpenAI融资, Real Time API, Sora世界模型, 不竞争条款, 亏损, 交通标识识别, 付费用户, 代码编辑, 使用案例, 兴盛资本, 创新停滞, 商业战略, 商业模式, 多人协作, 多人协作平台, 客服应用, 小模型, 市场竞争, 开发者日, 微软, 技术发布, 投后估值, 投资分配, 投资退出, 提示词缓存, 收入增长, 政府合作, 数据增长, 文档处理, 月活用户, 期权池, 未来预测, 机器学习, 模型蒸馏, 涨价策略, 特殊目的载体, 用户体验, 盈利模式, 红杉, 编程开发, 股权激励, 苹果, 行业创新, 行业前景, 行业影响, 行业挑战, 行业衰退, 视觉微调, 认股权证, 语言学习, 语音识别, 财务预测, 超募, 软银, 领投方特权, 马斯克XAI
我们开始第二个故事。OpenAI完成融资,开始摆烂了吗?Day Dev Day都发了些什么奇怪的东西呢?
首先,官宣已经完成这轮融资了,是在9月底这几天官宣的。现在呢,他是实现了超募。什么叫超募?就是我原来说要募多少钱,但实际上得到的钱比这个多,就叫超募啊。他原来说我要募65亿美金,现在实际上是66亿美金,就是多1亿。也是募投后的估值,原来说的是1,500亿,但其实我相信那个数是错的。原来那1,500亿美金应该是投前估值。他现在结束这一轮投资以后的投后估值是1,570亿,所以呢,实际上多了70亿。
那你说怎么会多出70亿出来呢?这个很奇怪,你明明投了66亿,那多出4亿是什么来呢?这个呢大概率是期权池。做这种投资案的时候啊,如果你投前估值是1,500亿,那么投了66亿美金进去以后呢,他的投后估值一般应该是1,566亿。多出4亿来是会做一些其他处理。
More
Older Entries