4 月 24
Luke FanAIGC, 字节跳动,故事多 AI Agent, AI应用, AI竞争格局, Anno 1800, Anthropic, API接口, Baidu, ByteDance, Claude 3.5, Coze Space, Coze Space评测, DeepSeek R1, Gemini 2.5 Pro, Google, GPT-4o, Llama 4, LLM, Manus, MCP (模型控制插件/标准), Meta, OpenAI, PPT生成, Token消耗, Waiting List, 产品体验, 产品对比 (Coze vs Manus vs Grok vs XinXiang), 产品评测, 代码生成, 任务拆解, 优劣势分析, 免费试用, 内容生成, 功能演示, 可视化网页生成, 呼伦贝尔自驾, 复杂任务处理, 大语言模型, 字节跳动, 工具调用 (内部/外部), 市场调研, 心想APP, 扣子空间, 扣子空间使用, 搜索质量, 数据调用, 文档生成, 旅游攻略, 智能体, 游戏攻略, 现象级产品, 用户分析, 用户反馈, 电动车充电, 百度, 简历筛选, 自动化, 自我规划, 行程规划, 表格生成, 访谈记录整理, 豆包大模型, 通义千问, 邀请码, 阿里, 高德地图, 黑神话悟空
Manus的后劲来了。百度、字节都有了自己的agent产品上线。
大家好,欢迎收听老范讲故事的音乐节目频道。字节上线了扣子空间,百度上线了心想APP。Manus的光环不再。Manus本身就属于意外爆火,当时它突然火了以后,咱们还做了直播,说这个东西没有什么技术门槛,只是产品设计的很有意思。
Manus跑去跟阿里合作了之后,那字节、百度说这不行,咱们也得有自己的产品上线。又不是有多难做的东西,那就做呗。我呢,搞了一个字节扣子空间的邀请码,咱们呢试一试,看看这个产品到底怎么个用法儿。
Manus呢,到现在我也没用上。原因也很简单,我去申请测试,等了很久,到现在都已经开始收费了,也没有收到说你可以来玩一下的这个邀请。所以也就别费劲了。我自己呢也没有特别着急,我要特别着急想用的话,随便找两个人去要一些邀请码,也还是可以搞得定的。既然没有那么热心的话,也就没有上心去找嘛。
More
4 月 18
Luke FanAIGC AI发展趋势, AI局限性, AI幻觉, AI应用, AI易用性, AI普及, AI未来, AI模型发布, AI编程, AI视觉, AI记忆 (Memory), AI评测, API, API代理 (Open Router), API定价, ChatGPT Plus, Function Calling, Github Copilot, GPT-4o, GPT-5展望, Greg Brockman, IDE集成, Mark Chen, Meta data分析, O3, O4 mini, OpenAI, OpenAI发布会, Sam Altman, Scaling law, Sora, TikTok直播带货话题生成, YouTube话题推荐, 一站式AI服务 (Total Solution), 世界模型, 人工智能, 内容创作, 图片推理 (Image Reasoning), 大语言模型, 实时交互, 实用AI, 工具调用 (Tool Calling), 强化学习, 推理模型, 搜索集成, 模型对比 (OpenAI vs 竞品), 潭柘寺图片识别, 科技评论, 跨模态AI
GPT-3和O4 mini发布了,这次绝不再仅仅是科学家们的玩具了。大家好,欢迎收听老范讲故事的YouTube频道。
本来GPT-3和O4 mini发布呢,我并没有抱太大的期望。为什么呢?因为前面O1和O3 mini发布的时候呢,看得我头晕眼花的。我记得应该是在去年12天连续发布会的时候发布的O3 mini,实在是太不明觉厉了。各种的复杂科学问题,咔咔就给解决了,然后各种的排名都排得很高。但是呢,我自己其实并不怎么用。
为什么呢?第一个,ChatGPT Plus用户里边呢,它是有用量限制的,并不是随便让你用的。所以在有用量限制的情况下,你就得省着用,而且你也感觉不出有太大差异来。你说你用它干嘛?据说编程很强,但是它没法跟IDE结合,基本上也就放弃了。你是可以出一大堆的代码,但是你还得向IDE里边去考来考去的,很麻烦。那你说我通过API调用吧,直接使用O1和O3 mini这些模型,实在是贵,所以就放弃了。
More
4 月 16
Luke FanAIGC 100万Token上下文, AI Agent, AI agent开发, AIGC, AI工具更新, AI市场竞争, AI成本优化, AI技术更新, AI模型对比, API发布, API调用, B端市场, Claude 3.5, Claude 3.7, C端用户, DeepSeek R1, Deepseek V3, Gemini 2.0, Gemini Pro 2.5, GPT-4.1, GPT-4.1评测, Grok 3 mini, LLM, MidJourney, OpenAI, OpenAI战略, RAG (检索增强生成), Sora, 人工智能, 价格便宜, 低成本AI, 可控性强, 多模态AI, 多版本 (Standard/Mini/Nano), 大海捞针测试, 大语言模型, 实时AI (Realtime AI), 工程应用, 工程需求, 开发者API, 开发者福音, 开源模型, 技术发展趋势, 技术解读, 技术选型, 指令遵循度高, 推理能力, 模型评测, 牛马工具 (程序员自嘲), 程序员工具, 稳定性好, 编程能力提升, 观点分享, 视频理解能力, 速度快, 长上下文处理, 高性价比, 高效AI模型
GPT4.1发布了!牛马们的好工具终于上线了。大家好,欢迎收听老范讲故事的YouTube频道。
GPT4.1突然发布,这是程序员们的工具。普通的用户你是用不上的。你用网页版,你用APP,甭管是手机端的还是电脑端的,你是付费用户还是免费用户,你都用不到GPT4.1。只有程序员可以通过API调用GPT4.1。
但是这个事儿对于非程序员来说,也是有很大改变,很大帮助的。那么我们今天来讲一讲,GPT4.1到底是一个什么样的东西。
首先,它有100万TOKEN的上下文,这个是非常吓人。100万单词吧,基本上你可以直接塞到GPT4.1里头去,它统一给你处理。而且大海捞针做的也很不错。
More
4 月 13
Luke FanAIGC A2A, AGI (通用人工智能), AI Agent (智能代理), AI助理, AI行业发展, Anthropic, API, ChatGPT, Google (Gmail), MCP (模型调用协议/工具调用), Meta, OpenAI, RAG (搜索辅助生成), Sam Altman, Sam Altman (山姆·奥特曼), Token限制, XAI (Grok), 个性化体验, 个性化设置, 临时聊天, 人工智能 (AI), 共享账号限制, 关键一步, 大语言模型 (LLM), 字节跳动 (ByteDance), 小模型, 平台战略, 微调 (Fine-tuning), 微软 (Microsoft), 携程 (Ctrip), 数据安全, 无状态服务, 有状态服务, 本地知识库, 流量转化, 消费互联网公司, 生态系统, 用户画像, 用户留存, 用户粘性, 用户记忆, 百度 (Baidu), 缓存Token, 美团 (Meituan), 聊天记录引用, 腾讯 (Tencent), 苹果 (Apple), 记忆功能, 账号登录体系, 长期记忆, 阿里 (Alibaba), 隐私保护, 高德地图
ChatGPT推出了记忆功能,这是整个行业迈出的非常重要的一步。大家好,欢迎收听老范讲故事的YouTube频道。这是让山姆·奥特曼都兴奋得睡不着觉的一个功能,也就是给ChatGPT加GE。很多人都在讲说这个好像并没有多难,使用起来也没有觉得有多大的差异。这样的一个功能,怎么到老范这就变成了整个行业迈出了关键一步?到了山姆·奥特曼那里,就变成了兴奋的睡不着觉了呢?这到底是一个什么样奇葩的功能?有什么是大家没有理解到的?今天咱们来讲一讲。
在2025年4月10号,山姆·奥特曼发了一条推,说:“有那么几次,我会因为太兴奋而早早醒来,再也睡不着。今天就是这样的一天。”今天我们就来讲一讲这个GPT的记忆功能,为什么这么强大、这么好,能够让山姆·奥特曼都兴奋的睡不着,能够让老范来说这是整个行业迈出的关键一步。那么,ChatGPT的记忆功能其实以前也有,并不是没有,不是说到4月10号才推出的,而是4月10号做了一个相对比较关键的更新。那么更新了哪些东西呢?
第一个就是它直接可以引用我们的聊天记录了。它可以根据我们跟ChatGPT聊天的过程来去提取各种需要具体记下来的信息,而不需要像原来那样很显示的告诉他说:“请记住这个,请记住那个。”这个都不需要,现在他是完全可以自己记下来的。而且在后面我们跟ChatGPT聊天的过程中,可以非常灵活的来利用这些记忆,让ChatGPT变成一个越来越懂我们的助手。
More
4 月 09
Luke FanAIGC, Meta的故事 AI伦理, AI生成, AI评测, AI负责人辟谣, Benchmark作弊, DLIU DLIU, Llama 4, LLM, Meta, Meta AI, Meta回应, 人工智能, 作弊指控, 内部爆料, 基准测试, 大语言模型, 学术不端, 实际使用效果, 开源模型, 开源社区, 快速发布后果, 性能评估, 技术报告缺失, 数据污染, 模型蒸馏, 沃顿商学院教授, 测试集污染 (背真题), 版本不一致 (开源vs测试), 科技争议, 科技新闻, 稳定性问题, 编程能力差, 自然语言处理, 跑分作弊, 过度优化, 验证方法
Meta的Llama4发布之后,深陷作弊风潮。大家好,欢迎收听老范讲故事的YouTube频道。今天咱们来讲一讲Meta的Llama4被人怀疑作弊,他到底是不是真的作弊了。
前面我们做过一期视频,说Llama4发布的时候没有太大的响动,因为它出来以后发现,虽然评测还不错,但是使用起来并没有感觉比现在主流的模型强到哪去。现在不行了,负面消息传出来了,说你大模型出来的时候跑分的成绩很高,但是我们使起来不是这么回事,有点名不副实的样子,特别是编程的效果极差。
为什么大家去比较编程呢?两个原因:
第一个,去玩这些开源大模型的,一般都是程序员。
第二个,编程是一个相对来说标准比较统一的评测。你编得出来编不出来,编完了效果怎么样,这个一眼就能看出来,没法作假。你说我写个诗或者写个小说,这个玩意还有仁者见仁、智者见智的时候。这编程这个东西,对就是对,不对就是不对,或者你做完了以后它的效果有问题,一眼就能看出来。所以现在被人质疑了。
More
4 月 07
Luke FanAIGC 1000万Token上下文, 400B, AI Agent, AI应用场景, AI新闻, AI未来发展, AI模型发布, AI竞赛, AI算力, Claude 3.7, DeepSeek, FP8精度, Function Call, Gemini 2.5 Pro, GPT-4o, Grok (XAI), H100 GPU, INT4量化, Llama 3, Llama 4, Llama 4 Behemoth, Llama 4 MARVELIC, Llama 4 Scout, Llama 4发布反响平淡原因, LLM, Meta AI, Meta战略, Mixture of Experts, MOE架构, 专家模块, 中文能力提升, 人工智能, 全模态AI进展, 千问 (Qwen), 卡估值, 多模态输入, 大语言模型, 字节AI, 小模型竞争, 开源LLM对比, 开源模型, 开源模型内卷, 开源社区, 推理速度, 文本输出, 模型微调, 模型性能比较, 模型测评, 模型训练, 活跃参数, 流量入口, 知识蒸馏, 硬件要求, 端到端模型, 腾讯AI, 谷歌AI, 超级APP趋势, 长上下文, 阿里AI
Llama4发布了。这里的黎明静悄悄,没有什么响动。这是怎么回事?
大家好,欢迎收听老范讲故事的YouTube频道。一觉醒来,Llama4就发布了。扎克伯格亲自在Facebook的REELS(也就是Facebook的短视频里面)发了一条视频,说Llama4发布了,今天是Llama4日。
Llama4呢,一共是有三个版本:
第一个叫Scout(侦察兵版本),总参数1,090亿(也就是109B),活跃参数是170亿,包含16个专家模块。对的,Llama终于也放弃抵抗了,从Llama4开始变成Moe了。在Llama4之前的版本都是单一体的模型,Llama3.3还给了一个400多B的单一模型,到Llama4彻底放弃抵抗了。
现在呢,支持1,000万TOKEN这种上下文,这个是Llama4最大的一个特点。DeepSeek是64K(也就是64,000个TOKEN上下文),现在上下文比较大的Gemini大概是能到2兆(200万),Llama4直接给了一个10兆(1,000万TOKEN),这是它做的一个很创新的点。
More
4 月 06
Luke FanAIGC 30美元), 3D模型, AI Agent, AI大模型内卷, AI绘图, AI绘画工具, Alpha版, DeepSeek R1, Gemini 2.0 Flash, GPT-4o, Grok (XAI), MidJourney V6.1, MidJourney V7, MidJourney更新, MidJourney评测, Relax模式, Turbo模式, V7发布, 一致性问题, 个性化设置, 中文提示词, 书店, 人工智能, 人物绘画 (汉服新娘), 优缺点分析, 厨房, 吉卜力风格, 图像生成, 图像质量, 场景绘画, 基础模型竞争, 定价策略, 戏精AI, 手绘风格, 指令理解, 文字生成能力, 横评对比, 照片真实感, 生产力工具潜力, 用嘴生图, 皮克斯3D风格, 细节狂魔, 艺术表现力, 草稿模式, 视频生成, 订阅费用 (10美元, 语音生成, 酒吧, 食物绘画 (拉面)
MidJourney V7终于发布了,是不是王者归来了呢?
大家好,欢迎收听老范讲故事的YouTube频道。2025年,大模型进入了快速内卷期。从春节的时候,DeepSeek R1发布,打响了第一枪。前面DeepSeek V3大家还没觉得怎么样,R1一出来,第一枪打响了,大家开始卷推理、卷开源、卷免费、卷基础模型。
基础模型是什么?GPT-4.5、Claude 3.7、Gemini 2.5 Pro以及DeepSeek V30324版,这是在卷基础模型。然后大家去卷AI agent,各种deep search、deeper search或者是deep research,Manus,各种的AI agent开始卷起来。最后卷绘图,绘图应该是从GROK3开始卷起。GROK3说:“我可以不设限的让大家去画图。”算是给了大家一点点小惊喜。
Gemini 2.0 Flash直接说:“天塌了,这个以后做Photoshop的人要没饭吃了。”他对语言文字的理解和执行能力非常非常的强。你给他一个美女,给他一个包,说让美女拎着包,一致性很好。这个美女拎着这个包没有任何问题。当时大家就讲说Photoshop这帮人要失业,但是并没有引起特别大的风潮。为什么?因为Gemini 2.0 Flash画太复杂的东西是画不了的。
More
3 月 30
Luke FanAIGC, Musk传奇 14%高息危机, 20万显卡算力池, 3.35亿活跃用户, 8%低息置换, AI Agent迭代, AI算力泡沫, API平台缺陷, Cap Table计算, Grok 3技术突破, H100显卡估值模型, Hotshot视频生成, SpaceX协同效应, Twitter私有化, xAI收购X, 估值与市值差异, 估值模型崩塌预警, 估值锚定逻辑, 信息搜集革命, 信息质量革命, 债务转股策略, 全股票交易, 内容生成限制突破, 反稀释条款, 可转债券设计, 吉卜力风格生成, 垃圾债券置换, 垃圾债风险转移, 多模态AI布局, 寒冬前融资冲刺, 工程团队整合, 工程短板补齐, 左手倒右手并购, 并购估值溢价, 并购时间窗口, 广告收入腰斩, 微信化战略, 战略资源打包, 数据训练闭环, 数据造假疑云, 星链生态整合, 泡沫破裂倒计时, 现金流反哺AI, 现金流过冬, 用户付费转化, 用户数据造假, 用户活跃度悖论, 社交AI融合范式, 社交严肃化转型, 社交平台暴跌, 移动端付费订阅, 移动转型成功, 股东权益稀释, 脑机接口协同, 语音功能短板, 资本信任游戏, 资本腾挪教科书, 资本魔术, 非上市公司运作, 预期管理博弈, 马斯克战略野心, 马斯克绝对控盘, 马斯克资本运作, 高息债转低息债
马斯克下令xAI收购x,终于等到了这一天。大家好,欢迎收听老范讲故事的YouTube频道。
3月29号,马斯克命令终于下达,xAI以全股票的形式收购x。现在,xAI的估值是800亿美金,x的估值是330亿美金,另外还有120亿美金的债务,等于把这个交易就做掉了。xAI以330亿美金全股票的形式收购了x。
从x到马斯克手上进行私有化之后,其实大家就在等着这一天。当时马斯克全资把Twitter收下来,后来改名为x,我们就在讲说,马斯克收购了以后做了私有化,它不再是一家上市公司。那么,马斯克就会通过各种各样的资本游戏,把它装到这个壳里,跟那个壳合并,然后包装出一个新的项目来。至于说这个项目最终是不是可以上市,那是以后的事情。
所以现在其实是马斯克左手倒右手。实际上,甭管是x还是xAI,最大的股东都是马斯克自己,他只要自己乐意,就可以来做这件事情。马斯克手上的未上市资源是很多的,而且都非常值钱,比如说像SpaceX、Neuralink脑机接口,对吧?包括今天我们讲到的x和xAI,这都是非常值钱的,应该还不是最值钱的。Neuralink值多少钱,现在不确定,但是SpaceX应该比他们两个都值钱。
More
3 月 27
Luke FanAIGC 3D建模辅助, AI图像生成, AI绘图工作流, DALL-E 3升级, Gemini 2.0 Flash, GPT-4o评测, GROK3图像编辑, IP形象开发, MidJourney对比, OpenAI更新, UI图标库生成, 个性化头像生成, 中文AI绘图, 中文提示词优化, 中文艺术字生成, 产品包装设计, 企业级API接入, 创意内容商业化, 动态分镜制作, 商业logo设计, 商业应用场景, 团队协作绘图, 图像生成API, 图像生成速度对比, 图像生成限制放宽, 复杂指令解析, 多模态AI, 多模态输入输出, 多轮对话绘图, 多风格控制测试, 实时绘图优化, 宫崎骏风格头像, 广告素材生成, 庆丰包子铺乐高, 影视分镜制作, 影视概念设计, 指令理解模型, 教育培训禁用, 数字水印技术, 数字水印溯源, 数字资产创作, 智能修图革命, 模型迭代路径, 泡泡玛特风格, 游戏角色建模, 版权内容生成, 版权合规生成, 生产力工具革新, 生成式AI进化, 电商主图优化, 电商图标设计, 电子书插图, 皮克斯风格绘图, 社交媒体配图, 聊天式图像编辑, 艺术性与实用性平衡, 虚拟偶像创作, 角色一致性生成, 语义依存度测试, 语义精准控制, 跨平台图像生成, 透明图标设计, 靠嘴修图
OpenAI更新了他们的图像生成模型。看来20美金一个月的套餐,还要继续续下去啊。大家好,欢迎收听老范讲故事的YouTube频道。OpenAI最近也开始卷起来了,对吧?前面开始出O1、O3,出GPT4.5,现在好了,把这个图像生成模型也更新了。最近其实大家都在卷图像,卷了一整波的图像。最早开始卷图像的是国内的这些应用,像豆包、千问,他们最早开始卷。这个模型没更新,卷的是客户端和手机端的应用,希望说你出去照完相以后,说给我去换个衣服,换个背景,去做这样的事情。但是这个因为模型本身的能力有限,所以效果并不是特别好。我试过比如说,我把自己的一张照片发上去以后,说来,给我把这个背景换成海滩。背景确实换成海滩了,但是他把前面这个人物也重绘了,不像我了。这就是国内卷了一波。
真正拉开序幕的是谁?是谷歌的Gemini 2.0 Flash。他们出了一个可以同时输出文字和图像的模型。这个模型出来以后,很多人惊呼,以后Photoshop修图就没你们什么事了啊。为什么?你可以上传一个杯子的图片,再上传一个美女的图片给它,提示词说请让美女举着杯子。那个图片出来了以后,是非常逻辑自洽的,不会看着有任何别扭的地方。或者你给她个包,说想让这个美女拎着包,这个效果好极了。甚至我拿了一些MidJourney画的图片上去,说再给我把某个公司的logo贴上,效果极好,特别的逻辑自洽,而且支持中文输出。这个其实挺难的。目前为止,支持中文输出的图像生成模型,原来就是国内的极梦,也是字节下边有一个版本是支持的。现在Gemini也是支持中文输出的,而且它支持多模态输入。你可以跟它说话,你可以给它输入图片,说你把这张图片跟那张图片合在一起,它效果都很好,完全可以实现聊天修图像。
More
3 月 26
Luke FanAIGC, 英伟达,NVIDIA,黄教主,GPU AI Agent盈利前景, AI云计算, AI行业泡沫, CoreWeave上市, GPU小时定价权, OpenAI算力租赁, 云计算开机率, 云计算微利模式, 互联网泡沫对比, 以太坊POS转型, 企业上市前包装, 企业估值模型, 企业财务健康度, 供应链深度绑定, 供应链金融创新, 加密货币崩盘, 加密货币转型, 华尔街金融玩法, 单一客户依赖风险, 合作伙伴利益链, 外包运营模式, 客户迁移成本, 对冲基金创业, 巴菲特式财技, 市场信心维护, 市场锚定策略, 影视渲染技术, 微软OpenAI站台, 微软百亿合同, 意向合同陷阱, 技术转型案例, 投资风险警示, 数据中心租赁, 数据真实性审查, 显卡硬通货神话, 显卡质押贷款, 显卡连环质押, 服务价格竞争, 服务器租赁协议, 硬件折旧周期, 税务减免策略, 算力市场乱象, 算力租赁价格战, 算力经济模型, 算力需求虚标, 管理层套现争议, 英伟达H100显卡, 英伟达投资内幕, 行业估值锚定, 行业信任危机, 行业合规性质疑, 行业定价权争夺, 行业标准制定者, 行业生态暗箱, 裸金属服务器, 设备利用率真相, 设备循环采购, 设备折旧避税, 设备资产证券化, 财务数据争议, 资本密集型行业, 资本泡沫预警, 资本运作套路, 金融杠杆游戏
CoreWeave要上市了。金融人搞AI,城会玩。大家好,欢迎收听老范讲故事的YouTube频道。什么叫城会玩呢?这实际上是个梗,叫“你们城里人真会玩”,就是使用一些非常奇葩的手段,来达到一些让大家意想不到的效果,这个叫城会玩。
首先,我们来讲一下CoreWeave的传奇创业过程。三个金融人,前华尔街对冲基金的经理,在2017年创立了Atlantic Crypto(大西洋加密货币),创建了这么一家公司。他们主要干嘛?主要是挖以太坊的,整了一大堆的显卡去挖以太坊去了。到2018年,加密货币市场崩盘后,CoreWeave于2019年收购了大量矿场破产后低价出售的GPU。他买了一堆的,这东西到手里头,还是以挖矿为主。到2019年,开始做一些其他方向的AI尝试。当然,那个时候还不是AI了,当时使用这些显卡主要是做渲染,拿它去做一些动画渲染,或者电影特效渲染。
CoreWeave转向了提供AI裸金属这样的一个服务。什么叫裸金属?我给你机房搭好了,里头什么都没有,你自己去部署系统,自己去做,想干嘛干嘛,我就不管了。他做这样的服务。其实很多挖矿的人,在这一段时间都在提供裸金属服务。他们据说是参与了《权力的游戏》的一些制作,但是去认真核实一下,《权力的游戏》的最后一季应该是2019年,所以他们应该没赶上。应该是CoreWeave在2023年,9,900万美金收购了一家叫Conductor Technology的,这是一家提供影视渲染技术的公司,有可能参与过权游项目。所以现在,CoreWeave也在讲,说我参与过权游项目。这个Conductor公司,是Autodesk公司投资的一个项目啊。这个Autodesk就是什么AutoCAD啊,什么3DS,做这些软件的老牌软件公司。
More
Older Entries