5 月 04
Luke FanAIGC Agent能力, AI agent开发, DeepSeek R1 对比, Gemini 2.5 Pro 对比, GitHub 开源, GPT-4o 对比, Grok 对比, Llama 4 对比, MCP协议支持, MOE模型 (混合专家模型), Ollama, Open Router, PC端应用, Qwen3, XAI 对比, 上下文窗口 (128K/256K), 专业数据, 云部署, 人工智能 (AI), 代码生成, 优缺点, 全系列模型 (0.6B-235B), 划时代的胜利 vs 翻车, 千问3, 原生数据, 参数效率, 合成数据, 后训练, 商业应用, 多场景适配, 多语言支持 (119种), 大语言模型 (LLM), 工具调用, 幻觉问题, 开源模型, 强化学习 (RLHF), 微调 (Fine-tuning), 性能分析, 性能评测, 技术创新, 指令遵循, 数学推理, 数据来源, 本地部署, 模型使用, 模型发布, 模型对齐, 混合推理架构, 用户体验, 田忌赛马策略, 真实感受, 硅基流动, 移动端应用, 稠密模型, 评测数据, 逻辑推理, 长思维链, 阿里云百炼, 阿里大模型, 预训练 (36T数据)
Qwen3发布了。这到底是划时代的胜利,还是翻车了呢?
大家好,欢迎收听老范讲故事的YouTube频道。Qwen3真的是千呼万唤始出来。前面好几周就已经不断有传言说Qwen3要发布,要多么多么强大。突然发布之后,当然也肯定是伴随着一大堆的评测数据了。官方评测数据呢,永远是我超越了谁、超越了谁。但是很多评测的人呢,觉得好像差那么一点点意思,没有达到预期。所以今天我们来讨论一下,这到底是又一次划时代的胜利,还是翻车。
Qwen3呢是凌晨发布的,4月29日凌晨上线,在Github上全面开放。我呢已经开始用上了。使用的方法有几种:
第一种是本地部署。我是MacBook Pro,M2 Max的芯片,32G内存。其他的不重要,你到底有多少硬盘,这个事没有那么重要。本地使用OlAmA部署,我使用了8B、32B和30B-A3B。最后这个是什么意思?最后是一个MOE的模型,它是30B-A3B,就是说它每一次干活的时候激活3B,也就是30亿参数。它是这样的一个标注。就这三个版本的模型,在我本机都可以跑,速度呢都是还可以接受。
More
4 月 16
Luke FanAIGC 100万Token上下文, AI Agent, AI agent开发, AIGC, AI工具更新, AI市场竞争, AI成本优化, AI技术更新, AI模型对比, API发布, API调用, B端市场, Claude 3.5, Claude 3.7, C端用户, DeepSeek R1, Deepseek V3, Gemini 2.0, Gemini Pro 2.5, GPT-4.1, GPT-4.1评测, Grok 3 mini, LLM, MidJourney, OpenAI, OpenAI战略, RAG (检索增强生成), Sora, 人工智能, 价格便宜, 低成本AI, 可控性强, 多模态AI, 多版本 (Standard/Mini/Nano), 大海捞针测试, 大语言模型, 实时AI (Realtime AI), 工程应用, 工程需求, 开发者API, 开发者福音, 开源模型, 技术发展趋势, 技术解读, 技术选型, 指令遵循度高, 推理能力, 模型评测, 牛马工具 (程序员自嘲), 程序员工具, 稳定性好, 编程能力提升, 观点分享, 视频理解能力, 速度快, 长上下文处理, 高性价比, 高效AI模型
GPT4.1发布了!牛马们的好工具终于上线了。大家好,欢迎收听老范讲故事的YouTube频道。
GPT4.1突然发布,这是程序员们的工具。普通的用户你是用不上的。你用网页版,你用APP,甭管是手机端的还是电脑端的,你是付费用户还是免费用户,你都用不到GPT4.1。只有程序员可以通过API调用GPT4.1。
但是这个事儿对于非程序员来说,也是有很大改变,很大帮助的。那么我们今天来讲一讲,GPT4.1到底是一个什么样的东西。
首先,它有100万TOKEN的上下文,这个是非常吓人。100万单词吧,基本上你可以直接塞到GPT4.1里头去,它统一给你处理。而且大海捞针做的也很不错。
More
3 月 19
Luke FanAIGC Agent SDK, Agent协调系统, AI agent开发, AI产品生命周期, Anthropic, API兼容性, API格式战争, API调用成本, Coze平台转型, Cursor插件, DeepSeek, Dify系统升级, Docker集成, HTTP调用规范, Manus, MCP协议, OpenAI, OpenRouter生态, Python开发包, RAG技术, Responses API, SDK开发趋势, Together AI适配, Token计费优化, TypeScript支持, VSCode扩展, 上下文管理革命, 中国云厂商应对, 企业数据安全, 多轮对话优化, 天气服务接口, 安卓launcher模式, 小米MIUI案例, 工具函数扩展, 工具描述语言, 开发者工具链, 开发者社区迁移, 开源工具包, 开源社区响应, 搜索服务竞价, 文件解析系统, 服务替换接口, 本地模型部署, 标准之争, 模型为核心开发, 流程驱动范式, 火山引擎, 状态管理, 生态绑定策略, 矢量数据库, 知识库存储成本, 知识库迁移, 硅基流动推理, 第三方服务集成, 网页自动化, 聚合平台危机, 股票查询API, 虚拟机控制, 计算机控制, 谷歌Gemini, 通义千问
第二个故事:OpenAI最新发布的AI agent,是不是应该感谢Manus呢?现在大家都在讲这个事情。OpenAI又被中国人挤牙膏了,突然就宣布自己的AI agent开发套件上线了。有人在下边回复感谢Manus,好像还是一个英语回复的。
去年连续12天的无聊发布会之后,春节又赶上了DeepSeek的暴击,明显加快了发布的进程。像什么GPT4.5、GPT5的新方向,AI agent的各种工具,它当时发布的还不是开发者工具,当时发布的是使用者工具,给它的200美元一个月的Pro账号用的这些工具,包括operator、deep research和task。到目前为止,我应该还不能用operator,其他的都可以用了。这些呢,都是今年OpenAI发出来的东西。他也在思考到底是不是要开源,目前还在纠结。
现在呢,又被Manus给输出了一把。Manus到底怎么样咱们不去管呢,但是呢Manus肯定对他还是有压力的。如果没有前面Deepsick R1的输出的话,OpenAI大概压根就不会看Manus一眼。但是现在有了Deepsick了,中国人到底干什么,他还是要稍微认真看一下了。Manus的发布让业界看到了AI agent的另外一种可能性。真正对OpenAI agent的领导地位所造成威胁的并不是Manus,而是另外一个东西,是Anthropic的MCP协议。这个东西已经快要成为事实标准了。因为在这儿呢,不可能真的谁说咱们坐下来定个标准吧。在这么快速发展的行业里头,一定是谁跑得最前头,谁用得最多,谁成为事实标准。现在Anthropic的MCP,随着Manus的爆火快速地,在成为事实标准的这条路上狂奔。OpenAI说这个事是不能忍的,我必须得把这个东西抢回来,我是行业老大,标准必须我说了算。所以这是他这次发布AI agent开发工具包的一个核心原因。这个是标准之争,是agent SDK和MCP之间的竞争。Manus在里边算是一个催化剂,也起作用了,但是呢,起到的并不是根本作用。
More