8 月 28
Luke FanAIGC, Google的故事 3D玩偶生成, AI Agent, AIGC, AI修图, AI发展趋势, AI取代人工, AI生成, AI科普, AI绘画, AI视频生成, DALL·E, Gemini 2.5 Flash image, MidJourney, Nano Banana, OpenAI, stable diffusion, VEO 3, YouTube, 产品图设计, 保持一致性, 偷跑模型, 千问, 可灵, 国内大模型, 图像编辑, 多图融合, 多模态大模型, 局部编辑, 技术评测, 模型评测, 电商作图, 科技前沿, 科技评论, 移除瑕疵, 美工, 老范讲故事, 职业危机, 自然语言编辑, 草图转设计图, 行业变革, 视觉推理, 视觉设计, 设计师, 谷歌AI, 谷歌DeepMind, 豆包, 迭代式修改
美工,或者说设计师,又要失业了吗?Gemini 2.5 Flash image发布了。
大家好,欢迎收听老范讲故事的YouTube频道。
前一段时间,有一个叫“小香蕉”的模型,叫Nano Banana。这样的一个模型呢,在很多的开源模型评比网站上,突然就火了。这种网站是干嘛的呢?还有很多的同类型的模型放在上头,你去向他提出要求,他让不同的模型同时生成结果以后,大家去做评比用的。很多人发现,这个模型很棒。
最近在很多的社交媒体上出现这种:有一个照片,旁边是根据这个照片做的3D PVC的打印玩偶的一个图像。这种图其实都是用这个叫Nano Banana做出来的。你先给他个照片,然后你给他提示词说:“请按照这个照片给我布置一个桌面,桌面的左边是个电脑,电脑上应该有这个3D设计软件,正在设计3D人偶。右边呢,是一个相框,里头是他的照片。桌面上放一个有支架的PVC的3D打印人偶,这个人偶就是根据这个照片打出来的。”给它这样的一个提示词,它就一次性给你搞定了。这个还是非常非常强悍的。
这个模型到底谁家的?搞不清楚。而且很多人还去造假的Nano Banana,为什么?因为太有流量了。一堆一堆人上来说:“我这也有一个Nano Banana,你们赶快来试一下。”我就被人骗过,上去了以后发现效果一般嘛,就很失望就走掉了。大家就猜说,这有可能是谷歌家新出的图片模型。到8月26号,突然这个模型就发布了——谷歌的Gemini 2.5 Flash image。拿出来一看,就是这个Nano Banana。而且呢,在谷歌发布这个模型之前,Deepmind——就是谷歌下边做AI这个部门的——很多人都发了画了一只香蕉的Twitter,说:“你看我们在暗示点什么吗?你们自己来猜一下,我们到底要干什么。”实际上,大家都已经明白他们要干什么了。
More
8 月 08
Luke FanAIGC, OpenSource 128K上下文, AI伦理, AI开源策略, AI监管与合规, COT思维链, DeepSeek(深度求索), Gemma, GLM, GPT-OSS, Grok(xAI), Kimi, LLaMA, MacBook, Meta, Minimax, MOE混合专家模型, MXFP4量化技术, Ollama, OpenAI, Phi-4, YouTube, 中美AI竞争, 中美科技博弈, 人工智能(AI), 千问(Qwen), 原生训练, 商业模式, 大语言模型(LLM), 应开全开, 开小闭大, 开源, 微调(Fine-tuning), 微软(Microsoft), 推理模型, 数据安全, 本地部署, 模型性能, 模型评测, 田忌赛马, 科技自媒体, 科技评论, 老范讲故事, 谷歌(Google), 马斯克
OpenAI再次开源,中美AI竞争加剧,这一次体现在了不同的开源策略上。
大家好,欢迎收听老范讲故事的YouTube频道。
OpenAI再次开源,这一次发布的版本叫GPT-OSS (Open Source System),8月5号突然上线了。这一次又不是GPT-5,我们从7月份就开始等GPT-5,现在已经等得大家开始胡思乱想了。很多人猜,说为什么出不来。现在最新的说法是48小时之内出来,等等看吧。
这一次呢,开出来的是GPT-OSS,是一个开源模型,20B和120B两种参数。它呢,是一个MOE模型,就是混合专家模型。其实在GPT-4的时候呢,大家就已经猜测它开始使用混合专家模型了,只是呢它不开源,大家只能猜。现在开出来了MOE推理模型,是有COT的思维链,是直接给大家展示出来的。而且呢,是一个文本模型,没有多模态的东西。上下文比较长,128K的上下文,要比国内的一些开源模型还要再长一些。因为现在没办法,你要使用工具、使用MCP,没有足够长的上下文,你是跑不起来的。所以呢,这一次的GPT-OSS说,我们很擅长使用工具,有的时候有点太擅长了。因为我测试的时候,有的时候工具调用次数非常多,直接就把自己的上下文填满了,这种情况也是不少的。
More
4 月 16
Luke FanAIGC 100万Token上下文, AI Agent, AI agent开发, AIGC, AI工具更新, AI市场竞争, AI成本优化, AI技术更新, AI模型对比, API发布, API调用, B端市场, Claude 3.5, Claude 3.7, C端用户, DeepSeek R1, Deepseek V3, Gemini 2.0, Gemini Pro 2.5, GPT-4.1, GPT-4.1评测, Grok 3 mini, LLM, MidJourney, OpenAI, OpenAI战略, RAG (检索增强生成), Sora, 人工智能, 价格便宜, 低成本AI, 可控性强, 多模态AI, 多版本 (Standard/Mini/Nano), 大海捞针测试, 大语言模型, 实时AI (Realtime AI), 工程应用, 工程需求, 开发者API, 开发者福音, 开源模型, 技术发展趋势, 技术解读, 技术选型, 指令遵循度高, 推理能力, 模型评测, 牛马工具 (程序员自嘲), 程序员工具, 稳定性好, 编程能力提升, 观点分享, 视频理解能力, 速度快, 长上下文处理, 高性价比, 高效AI模型
GPT4.1发布了!牛马们的好工具终于上线了。大家好,欢迎收听老范讲故事的YouTube频道。
GPT4.1突然发布,这是程序员们的工具。普通的用户你是用不上的。你用网页版,你用APP,甭管是手机端的还是电脑端的,你是付费用户还是免费用户,你都用不到GPT4.1。只有程序员可以通过API调用GPT4.1。
但是这个事儿对于非程序员来说,也是有很大改变,很大帮助的。那么我们今天来讲一讲,GPT4.1到底是一个什么样的东西。
首先,它有100万TOKEN的上下文,这个是非常吓人。100万单词吧,基本上你可以直接塞到GPT4.1里头去,它统一给你处理。而且大海捞针做的也很不错。
More