7 月 08
Luke FanAIGC AI Agent, AIGC, AI产业, AI幻觉, AI应用开发, AI趋势, Claude 3, DeepSeek, Few-shot (少样例提示), Gemini 2.5 Pro, GPT-4o, Grok, JSON输出, LangChain, LLaMA, LLMOS (大模型操作系统), MISTRAL, OpenAI, RAG (检索增强生成), Shopify, Simon Wilkinson, 上下文工程 (Context Engineering), 上下文窗口 (Context Window), 上下文隔离, 信息压缩, 函数调用 (Function Calling), 大语言模型 (LLM), 安德烈·卡帕西 (Andrej Karpathy), 工具调用 (Tool Calling), 技术解读, 提示词工程 (Prompt Engineering), 模型稳定性, 特斯拉, 程序员, 系统提示词, 英伟达 (Nvidia), 豆包大模型, 软件2.0 (Software 2.0), 通义千问, 长期记忆
上下文工程又有新词了。AIGC不怎么赚钱,造词的速度还是非常非常快的。大家好,欢迎收听老范讲故事的YouTube频道。
提示词工程已经稍微有点过时了,现在的新词叫上下文工程。提示词工程长什么样,大家还记得吗?就是上来先说你是谁,谁先给大模型定一个位置。比如说你是一个资深翻译,你是个语文老师。然后呢,说我现在想要干一点什么事情了,给我出个题,给我做个翻译,再给他一个简单的例子,说你照这样给我把东西做出来。
光有提示词呢,肯定是不够的。除了刚才我们讲的完整的、结构化的提示词之外,你还是需要很多相关的上下文,才能够让大模型稳定的输出结果。那你说我们继续把提示词写长不就行了吗?我还见过那种直接写出几百字或者是上千字小作文的提示词。这个是不是可以继续往前走呢?不行了。因为你如果继续叫提示词工程呢,会容易引起误解。大家觉得只要不断的把提示词写长,就可以把这事解决掉。但其实除了提示词之外,还有非常非常多的上下文数据需要一起写进去,才能够让大模型稳定的输出我们所预期的、有价值的结果出来。
所以呢,就不能继续叫提示词工程了,一定要起个新词。而且呢,AI时代呢,起新词是非常重要的,因为可以吸引眼球。只有足够吸引眼球的东西,才有发展的前景。所以在这个时候,上下文工程就来了,一个新词诞生了。
More
7 月 02
Luke FanAIGC, Meta的故事 1亿美金签字费, AI Agent, AIGC, AI人才战争, AI团队重组, Anthropic, DeepSeek, Facebook, Kimi, Llama 4失败, Meta, Meta与OpenAI, MiniMax * 其他公司: 谷歌 (Google), OpenAI, XAI, 人力资源 (HR), 人工智能 (AI), 企业文化, 元宇宙 (Metaverse), 创新工厂 (Innovation Works), 华为 (Huawei), 员工挽留, 商业故事, 团队管理, 大语言模型 (LLM), 山姆·奥特曼 (Sam Altman) AI模型: Llama 4, 开源模型, 战略方向, 扎克伯格 (Mark Zuckerberg), 扎克伯格亲自下场, 招聘策略, 推理能力, 文心一言, 模型刷榜, 盛大 (Shanda), 盛大故事, 硅谷文化, 科技巨头挖人, 科技评论, 算力竞争, 职场八卦, 股票期权, 腾讯 (Tencent), 腾讯挖华为HR, 薪酬体系, 行业内幕, 行业分析, 谷歌Gemini, 金山 (Kingsoft), 金山喝酒留人, 闭源模型, 阿里千问 (Qwen)
Meta急了,扎克伯格亲自下场疯狂挖人,重新组建AI团队。
大家好,欢迎收听老范讲故事的YouTube频道。Meta的1亿美金签字费最近成为了一个新梗。签字费什么意思?就是说我去挖人,你只要过来签个字,说我同意上班来了,1亿美金到手。这个又算是创造历史了吧。
现在AI呢,确实是资本最密集,和整个行业都在关注的一个点。所以Meta这样的一家美股七姐妹的公司,突然发现自己落后了,那就一定要赶快出来补救。而补救的方式的话,一亿美金签字费。
Meta呢,在Llama4上栽了一个大跟头,而且摔得非常非常惨。这个产品呢本来是寄以厚望的,因为Llama1、Llama2、Llama3,大家都是觉得非常成功。而且呢,Meta算是建立了一个自己的品牌。甭管是谷歌呀,Anthropic呀,OpenAI,你都是闭源,只有我是开源,而且我是开源圈的领军人物。其他的人只要是愿意用开源模型,必须以Llama为基础去干活去。至少在Llama2的这个阶段呢,它这个目标是实现了。就像当年的iOS跟安卓一样,iOS是闭源的,安卓是我开源,你只要惦记自己做手机,想要一操作系统,你就使我的。
More
6 月 26
Luke Fan机器人与具身智能 AI Agent, AI工具, Gemini, GPT, 专业选择, 人工智能(AI), 人才招聘标准, 人生规划, 人脉资源积累, 企业面试, 信息差, 信息检索, 兴趣导向, 具身智能, 动手能力, 升学规划, 大学选择, 学校与专业, 宇树科技 (Unitree Robotics), 实践经验, 工程能力, 开源项目贡献, 报考建议, 挖掘底层信息, 教育焦虑, 智能制造, 曹德旺大学, 机器人, 机械工程, 核心竞争力, 王兴兴, 电子信息, 研究教授方向, 科技树, 老范讲故事, 职业规划, 自学能力, 解读招生简章, 计算机科学, 跨专业学习, 项目经历, 高考志愿填报
宇树科技的王兴兴给高考生的报考建议突然就火了。大家好,欢迎收听老范讲故事的YouTube频道。
宇树科技呢,就是在春晚上让机器人转手绢那公司。他们家的老板王兴兴,号称是因为英语没考好,所以就留在国内了。公司的名字叫“语文跟数学”——宇树科技,因为没有英语。但后来人家辟谣了,说不是这样的,我们这个是“宇宙间的科技树”,不是英语没考好。
这个哥们最近还有一件事火了,是什么呢?他应该是上完硕士就出来创业。给曹德旺大学做校长的老教授最近突然问了一个问题,说:“王兴兴如果去上博士的话,他还能有这样的成就吗?梁文峰如果去上博士的话,他还能做的出DeepSeek来吗?”当时问的很多人哑口无言。
More
6 月 01
Luke FanAIGC AI Agent, AI 数字人, AIGC, AIGC (AI生成内容), AI产品分析, AI创业, AI动画, AI发展趋势, AI商业模式, AI工具测评, AI教程, AI模型聚合, AI绘画, AI视频生成, AI设计, AI赋能设计, Canva, ComfyUI, Demo演示, Flex, Google Imagine, GPT-4o, LibLib AI, Lovart, MidJourney, Photoshop, stable diffusion, YouTube封面, YouTube封面设计, 产品体验, 剪映, 剪映 (CapCut), 可灵, 可灵 (Keling), 垂类Agent, 多模态AI, 工作流自动化, 提示词工程, 泛Agent, 泡泡玛特风格, 科技评论, 老范讲故事, 设计师, 设计师AI, 设计师失业, 设计师就业, 陈冕
设计师这次是不是真的要失业了?咱们从Lovart这个为设计师专门设计的垂直agent来看看AI agent在垂直品类里的一些玩法儿。
大家好,欢迎收听老范讲故事的YouTube频道。Lovart又一个现象级产品出来了,设计师专用的一个垂直agent。它呢没有Manus当时引起的那么大的动静,但是呢,我用了一下,感觉比Manus这种泛agent还是要好用一些。
什么叫泛agent?就是它啥都能干。Lovart这种能够专门为设计师工作的agent呢,它就是垂类agent,它其它事干不了。你说你给我去写个文章,给我去做个总结,这它干不了。但是你说你给我画个画,做个视频,设计一个PPT,设计个海报,做的可好了。他们设计的产品在x上被马斯克亲自点赞。因为这种设计类产品嘛,一个图片什么的,你要设计的非常好的话,确实会引起大佬点赞。很多的使用者也是惊为天人,我去使了一下,确实是很神奇,能够解决非常多的问题。
More
5 月 09
Luke FanAIGC, Google的故事 A2A协议, AI Agent, AI协作标准, API设计, Function Calling, Gemini, Google AI, HTTP, JSON, LLM, Lotus Domino, MCP模型上下文协议, OpenAI, SharePoint, SOA (服务导向架构), SSE, YouTube频道, 人工智能, 历史失败案例, 复杂系统风险, 大语言模型, 屎山代码, 开发者视角, 异构系统集成, 异步处理, 微服务, 技术史借鉴, 技术演进规律, 技术评论, 技术选型, 智能体互操作, 智能体协作, 看起来很美就不要想得太美了, 科技趋势解读, 程序员经验, 系统设计, 老范讲故事, 谨慎评估, 谷歌A2A, 跨平台协作, 软件架构, 顶层设计批判
谷歌的A2A看起来很美,就不要想得太美了。
大家好,欢迎收听老范讲故事的YouTube频道。
“看起来很美,就不要想得太美了。”这句话哪来的呢?来自于猫腻的小说《将夜》。这个里面有一句话叫:“你长得很美,所以就不要想得太美了。”事情是在哪呢?是在隆庆皇子看到桑桑酒量很好,就想收其为侍女。桑桑呢,是里面的一位女主,而隆庆皇子呢,长得很漂亮,而且身份地位非常高,手持大义的一个人。他提出了这样的一个要求,当时的主人公宁缺就进行了反击,说:“你长得很美,就不要想得太美了。”意思是什么呢?就是保持对现实的清醒认知,你要知道自己是谁,几斤几两。而且呢,也要敢于对强权逻辑进行挑战。
那么,这个事儿跟今天咱们要讲的谷歌A2A有什么样的关系呢?首先先讲一下,谷歌A2A到底是个什么东西。
More
5 月 05
Luke FanAIGC, Meta的故事 2023年, 2024年, 2025年预测, AI Agent, AIGC (AI Generated Content), AI发展, AI战略, Anthropic, API服务, ChatGPT, DeepSeek, Facebook, Gemini, Google, GPT-4o, Grok, Groq, LLaMA, LLAMA API, LLAMA Con, LLAMA发布历史, Meta, Meta AI APP, OpenAI, Qwen (通义千问), XAI (马斯克), 云计算, 亚马逊云, 产品体验, 人工智能, 元宇宙战略影响, 免费策略, 商业模式, 大语言模型 (LLM), 字节, 应用程序 (APP), 开发者大会, 开源模型, 微软云, 战略失误, 战略惯性, 扎克伯格, 扎克伯格 (Mark Zuckerberg), 技术社区, 播客内容, 智能眼镜, 杨乐坤 (Yann LeCun), 杨乐坤观点, 模型对比, 流量入口争夺, 深度学习, 百度, 社交优势, 科技评论, 竞品分析, 老范讲故事, 腾讯, 腾讯元宝, 行业分析, 起了个大早赶了个晚集, 追赶者, 阿里, 马斯克 (Elon Musk)
Meta召开LLAMA Con开发者大会。他原来丢的这些课程,现在补还来得及吗?
大家好,欢迎收听老范讲故事的YouTube频道。4月29号,Meta召开了首届的LLAMA CON开发者大会。Meta原来是开open大会,他反正每年都会开一到两次的这种开发者大会,这是开了第二次开发者大会了。这一次呢,主要就是对LLAMA进行了一些发布。前面LLAMA4已经发布过了,而且发完了以后还翻车了。现在呢,Meta说我也要去补课了。
补什么课呢?第一个是我要出一个独立的APP智能助手,叫MetaAI APP,对标ChatGPT。另外呢,我要开始面向开发者直接提供官方的LLAMA API服务了。这块呢,还准备去跟Groq这些芯片厂商去合作去,我帮他们去部署。现在呢,LLAMA的这些服务都是免费给大家使用的,LLAMA API未来有可能会收费。
你说人家OpenAI一出ChatGPT就开始给大家提供服务,APP也出了这么长时间了。这Meta真的是起了个大早赶了个晚集,到今天才想起来说我的这些API也要为大家服务了,我的APP也要为大家服务了,还来得及来不及?
More
4 月 24
Luke FanAIGC, 字节跳动,故事多 AI Agent, AI应用, AI竞争格局, Anno 1800, Anthropic, API接口, Baidu, ByteDance, Claude 3.5, Coze Space, Coze Space评测, DeepSeek R1, Gemini 2.5 Pro, Google, GPT-4o, Llama 4, LLM, Manus, MCP (模型控制插件/标准), Meta, OpenAI, PPT生成, Token消耗, Waiting List, 产品体验, 产品对比 (Coze vs Manus vs Grok vs XinXiang), 产品评测, 代码生成, 任务拆解, 优劣势分析, 免费试用, 内容生成, 功能演示, 可视化网页生成, 呼伦贝尔自驾, 复杂任务处理, 大语言模型, 字节跳动, 工具调用 (内部/外部), 市场调研, 心想APP, 扣子空间, 扣子空间使用, 搜索质量, 数据调用, 文档生成, 旅游攻略, 智能体, 游戏攻略, 现象级产品, 用户分析, 用户反馈, 电动车充电, 百度, 简历筛选, 自动化, 自我规划, 行程规划, 表格生成, 访谈记录整理, 豆包大模型, 通义千问, 邀请码, 阿里, 高德地图, 黑神话悟空
Manus的后劲来了。百度、字节都有了自己的agent产品上线。
大家好,欢迎收听老范讲故事的音乐节目频道。字节上线了扣子空间,百度上线了心想APP。Manus的光环不再。Manus本身就属于意外爆火,当时它突然火了以后,咱们还做了直播,说这个东西没有什么技术门槛,只是产品设计的很有意思。
Manus跑去跟阿里合作了之后,那字节、百度说这不行,咱们也得有自己的产品上线。又不是有多难做的东西,那就做呗。我呢,搞了一个字节扣子空间的邀请码,咱们呢试一试,看看这个产品到底怎么个用法儿。
Manus呢,到现在我也没用上。原因也很简单,我去申请测试,等了很久,到现在都已经开始收费了,也没有收到说你可以来玩一下的这个邀请。所以也就别费劲了。我自己呢也没有特别着急,我要特别着急想用的话,随便找两个人去要一些邀请码,也还是可以搞得定的。既然没有那么热心的话,也就没有上心去找嘛。
More
4 月 16
Luke FanAIGC 100万Token上下文, AI Agent, AI agent开发, AIGC, AI工具更新, AI市场竞争, AI成本优化, AI技术更新, AI模型对比, API发布, API调用, B端市场, Claude 3.5, Claude 3.7, C端用户, DeepSeek R1, Deepseek V3, Gemini 2.0, Gemini Pro 2.5, GPT-4.1, GPT-4.1评测, Grok 3 mini, LLM, MidJourney, OpenAI, OpenAI战略, RAG (检索增强生成), Sora, 人工智能, 价格便宜, 低成本AI, 可控性强, 多模态AI, 多版本 (Standard/Mini/Nano), 大海捞针测试, 大语言模型, 实时AI (Realtime AI), 工程应用, 工程需求, 开发者API, 开发者福音, 开源模型, 技术发展趋势, 技术解读, 技术选型, 指令遵循度高, 推理能力, 模型评测, 牛马工具 (程序员自嘲), 程序员工具, 稳定性好, 编程能力提升, 观点分享, 视频理解能力, 速度快, 长上下文处理, 高性价比, 高效AI模型
GPT4.1发布了!牛马们的好工具终于上线了。大家好,欢迎收听老范讲故事的YouTube频道。
GPT4.1突然发布,这是程序员们的工具。普通的用户你是用不上的。你用网页版,你用APP,甭管是手机端的还是电脑端的,你是付费用户还是免费用户,你都用不到GPT4.1。只有程序员可以通过API调用GPT4.1。
但是这个事儿对于非程序员来说,也是有很大改变,很大帮助的。那么我们今天来讲一讲,GPT4.1到底是一个什么样的东西。
首先,它有100万TOKEN的上下文,这个是非常吓人。100万单词吧,基本上你可以直接塞到GPT4.1里头去,它统一给你处理。而且大海捞针做的也很不错。
More
4 月 07
Luke FanAIGC 1000万Token上下文, 400B, AI Agent, AI应用场景, AI新闻, AI未来发展, AI模型发布, AI竞赛, AI算力, Claude 3.7, DeepSeek, FP8精度, Function Call, Gemini 2.5 Pro, GPT-4o, Grok (XAI), H100 GPU, INT4量化, Llama 3, Llama 4, Llama 4 Behemoth, Llama 4 MARVELIC, Llama 4 Scout, Llama 4发布反响平淡原因, LLM, Meta AI, Meta战略, Mixture of Experts, MOE架构, 专家模块, 中文能力提升, 人工智能, 全模态AI进展, 千问 (Qwen), 卡估值, 多模态输入, 大语言模型, 字节AI, 小模型竞争, 开源LLM对比, 开源模型, 开源模型内卷, 开源社区, 推理速度, 文本输出, 模型微调, 模型性能比较, 模型测评, 模型训练, 活跃参数, 流量入口, 知识蒸馏, 硬件要求, 端到端模型, 腾讯AI, 谷歌AI, 超级APP趋势, 长上下文, 阿里AI
Llama4发布了。这里的黎明静悄悄,没有什么响动。这是怎么回事?
大家好,欢迎收听老范讲故事的YouTube频道。一觉醒来,Llama4就发布了。扎克伯格亲自在Facebook的REELS(也就是Facebook的短视频里面)发了一条视频,说Llama4发布了,今天是Llama4日。
Llama4呢,一共是有三个版本:
第一个叫Scout(侦察兵版本),总参数1,090亿(也就是109B),活跃参数是170亿,包含16个专家模块。对的,Llama终于也放弃抵抗了,从Llama4开始变成Moe了。在Llama4之前的版本都是单一体的模型,Llama3.3还给了一个400多B的单一模型,到Llama4彻底放弃抵抗了。
现在呢,支持1,000万TOKEN这种上下文,这个是Llama4最大的一个特点。DeepSeek是64K(也就是64,000个TOKEN上下文),现在上下文比较大的Gemini大概是能到2兆(200万),Llama4直接给了一个10兆(1,000万TOKEN),这是它做的一个很创新的点。
More
4 月 06
Luke FanAIGC 30美元), 3D模型, AI Agent, AI大模型内卷, AI绘图, AI绘画工具, Alpha版, DeepSeek R1, Gemini 2.0 Flash, GPT-4o, Grok (XAI), MidJourney V6.1, MidJourney V7, MidJourney更新, MidJourney评测, Relax模式, Turbo模式, V7发布, 一致性问题, 个性化设置, 中文提示词, 书店, 人工智能, 人物绘画 (汉服新娘), 优缺点分析, 厨房, 吉卜力风格, 图像生成, 图像质量, 场景绘画, 基础模型竞争, 定价策略, 戏精AI, 手绘风格, 指令理解, 文字生成能力, 横评对比, 照片真实感, 生产力工具潜力, 用嘴生图, 皮克斯3D风格, 细节狂魔, 艺术表现力, 草稿模式, 视频生成, 订阅费用 (10美元, 语音生成, 酒吧, 食物绘画 (拉面)
MidJourney V7终于发布了,是不是王者归来了呢?
大家好,欢迎收听老范讲故事的YouTube频道。2025年,大模型进入了快速内卷期。从春节的时候,DeepSeek R1发布,打响了第一枪。前面DeepSeek V3大家还没觉得怎么样,R1一出来,第一枪打响了,大家开始卷推理、卷开源、卷免费、卷基础模型。
基础模型是什么?GPT-4.5、Claude 3.7、Gemini 2.5 Pro以及DeepSeek V30324版,这是在卷基础模型。然后大家去卷AI agent,各种deep search、deeper search或者是deep research,Manus,各种的AI agent开始卷起来。最后卷绘图,绘图应该是从GROK3开始卷起。GROK3说:“我可以不设限的让大家去画图。”算是给了大家一点点小惊喜。
Gemini 2.0 Flash直接说:“天塌了,这个以后做Photoshop的人要没饭吃了。”他对语言文字的理解和执行能力非常非常的强。你给他一个美女,给他一个包,说让美女拎着包,一致性很好。这个美女拎着这个包没有任何问题。当时大家就讲说Photoshop这帮人要失业,但是并没有引起特别大的风潮。为什么?因为Gemini 2.0 Flash画太复杂的东西是画不了的。
More
Older Entries Newer Entries