我们都被骗了？Nano Banana Pro 真相揭秘：它根本不是Gemini 3简单叠加，原生多模态骨架才是颠覆关键｜Nano Banana Pro、Gemini 3 Pro、Gemini 3

2025-11-23 作者 Luke Fan

Nano Banana Pro发布了，它在Nano Banana的基础上到底做了些什么新东西？

大家好，欢迎收听老范讲故事的YouTube频道。

大家等了半天的Nano Banana 2没有来，出来的是Nano Banana Pro。当然，前面Nano Banana Pro也是隐姓埋名，在各种的大模型评测平台上偷跑了好长时间。所以很多人呢，信誓旦旦地说：“我已经用到了这个东西，强的没边了。”现在终于发布出来了。

从Nano Banana到Nano Banana Pro：核心区别是什么？

从名字上呢，一个叫Nano Banana，另外一个呢加了个Pro，它们到底差在哪呢？原来的Nano Banana，其实是叫做Gemini 2.5 Flash image。现在的Nano Banana Pro呢，它背后的模型是Gemini 3.0 Pro image，是两个不同版本。而且一个呢是Flash，一个呢是Pro。Flash一定是比较快，出来的东西呢相对比较粗糙；而Pro的话，出来的东西就会比较笨重了，或者说比较昂贵，而且出来的东西非常非常细致和完善，它们核心的区别就在这里。

Nano Banana也是先在外边测试了很久然后才发布，这个名字也是当时他们测试的时候使用的名字。当然这一次测试呢，并没有叫纳米香蕉，这次换了个名字，因为纳米香蕉这名字你用过了嘛，好像叫GENIMG，大概是这样的一个名字去测试的。

超级App vs 独立操作系统：山姆·奥特曼的野心远不止取代搜索，52分钟发布会暴露其真正想颠覆的是整个应用平台｜ChatGPT OpenAI Sam Altman Operating System

2025-10-08 作者 Luke Fan

OpenAI开发者日，暴露了山姆·奥特曼的隐藏野心。

大家好，欢迎收听老范讲故事的YouTube频道。今天咱们先讲结论，然后告诉大家我怎么得出这样的结论，验证一下这个结论是否正确，再让大家行动起来，看看咱们在山姆·奥特曼指明方向以后，到底能干点什么。

OpenAI的开发者日呢，隐藏在发布会背后的野心和方向到底是什么？表面上这东西咱就不重复了，说到底发布了什么东西，只讲结论。
第一个，ChatGPT要做操作系统了。
第二个，自然语言和语音交互才是未来。
第三个，全栈、全生态、全模态的开发都在OpenAI。
有三个大的结论。

那咱们怎么得到这样的结论的呢？咱们看发布会，要稍微换一个方向来看。我自己呢，举办、参加过很多发布会，也专门受过训练，主持过发布会。咱们发布会一般看什么呢？叫“wow时刻”，一看这个东西，“wow，好厉害”，叫“wow时刻”。在52分钟的发布会视频里头，有哪些“Wow时刻”呢？那你说我是不是拿了个纸、拿了个笔，52分钟的发布会反复看，在这记笔记，哪个地方有掌声？不是这样的。我到GPT里边直接下了一个指令，把YouTube的视频链接贴进去，我说：“请给我统计一下，什么时候有掌声，掌声中度还是高度，有掌声的时候是谁在演讲，在讲什么，给我画个表格出来。”剩下的事情就交给GPT去干了，效果还是很好的。

流量真相被揭开：为什么你的AI产品功能越完善，用户流失越快？ChatGPT成功的秘密竟是“锥子理论”｜AI、Traffic Management、Innovation、Congestion

2025-09-25 作者 Luke Fan

AI时代如何获得流量与关注？跟原来的互联网和移动互联网时代，到底有什么相同与不同吗？

大家好，欢迎收听老范讲故事的YouTube频道。今天咱们来讲一讲，AI时代我们想去获得流量，到底是如何去获得的。

我们现在先不去讲如何做出一个好产品吧。如果你没有办法获得流量，或者说获得免费的流量的话，那你可能还需要花钱去买流量，或者说跟你固有的业务去捆绑、去绑定你的用户获得流量的话，那么你的AI产品本身就没有那么成功。

在AI时代想要去获得流量，想要去获得关注的话，你还是要在某一个细节上做出一个突破，或者做出一个有感知的革新出来。什么叫有感知的？我这个评分跑了多少，我比别人多出什么东西来，这个其实是没有感知的。只有是用户能够使用了，然后真的感觉好了，他才叫有感知。

马斯克重磅发布GROK4：史上最聪明AI大模型横空出世，强化学习碾压GPT-4与Claude，20万张H100显卡大力出奇迹，中美科技差距再度拉大，谁将主导AI未来？

2025-07-15 作者 Luke Fan

史上最聪明的AI大模型GROK4诞生了。马斯克亲自坐镇开发布会。视频发布会呢，并不是特别的顺畅。第一个呢，是他晚了一个小时，也没说为什么。反正马斯克的直播经常会晚。然后呢，太多的东西需要集中发布，上下衔接的呢比较仓促一点。

最早期很多的互联网公司开发布会也是这样的，两三个小时七差咔嚓发一大堆东西。后来OpenAI这些公司习惯了在网上开直播以后呢，就慢慢把这风格改了。改成什么呢？就是每次发一个功能，发个十分钟二十分钟就完事了。然后呢，不停的发，每个月发每个月发。Xai呢，现在还没有彻底学会这件事情，还是一股脑给大家扔了一大堆东西出来。

我们以前在面对创业者的时候，每次都会苦口婆心的去做一种劝告。大家可能不知道会劝什么。作为投资人来说，我们每次看到任何一个创业者，都会上去劝一件事，叫不要憋大招。你一次要惦记着做一个大的东西，就很容易失败。你应该是做一些小的东西，一点一点放出来。OXAI现在还是憋了一个大招。当然了，XAI后面呢，也会每个月发布一个新的工具出来，它也慢慢的向这样的一个方向去前进。

设计师的未来已来？Lovart垂直AI Agent震撼体验，从Midjourney到多模型协作，揭秘AI如何颠覆传统设计流程与商业模式。

2025-06-01 作者 Luke Fan

设计师这次是不是真的要失业了？咱们从Lovart这个为设计师专门设计的垂直agent来看看AI agent在垂直品类里的一些玩法儿。

大家好，欢迎收听老范讲故事的YouTube频道。Lovart又一个现象级产品出来了，设计师专用的一个垂直agent。它呢没有Manus当时引起的那么大的动静，但是呢，我用了一下，感觉比Manus这种泛agent还是要好用一些。

什么叫泛agent？就是它啥都能干。Lovart这种能够专门为设计师工作的agent呢，它就是垂类agent，它其它事干不了。你说你给我去写个文章，给我去做个总结，这它干不了。但是你说你给我画个画，做个视频，设计一个PPT，设计个海报，做的可好了。他们设计的产品在x上被马斯克亲自点赞。因为这种设计类产品嘛，一个图片什么的，你要设计的非常好的话，确实会引起大佬点赞。很多的使用者也是惊为天人，我去使了一下，确实是很神奇，能够解决非常多的问题。

从乔布斯“灵魂伴侣”到山姆奥特曼的座上宾，强尼艾夫的IO团队以65亿美金估值并入OpenAI，是AI iPhone的黎明将至，还是又一个AI硬件泡沫的开始？

2025-05-26 作者 Luke Fan

OpenAI以65亿美金收购了强尼艾夫爵士的IO团队，要做AI iPhone了吗？大家好，欢迎收听老范讲故事的YouTube频道。

OpenAI最大的硬件收购来了。没办法，他自己3,000亿美金的估值了，现在收购任何的团队都是比较贵的，所以又变成了有史以来最大的AI硬件团队收购。这一次呢，是以50亿美金的纯股票交易收购强尼艾夫创建的IO团队手里边77%的股票。

这个团队呢，2023年底其实已经被OpenAI投资过了。当时投资了以后占股了是23%。这一次呢，等于是交50亿美金，或者叫以50亿美金的对价收购了剩余的77%的股票。这个65亿美金怎么算出来的？很简单，50亿除0.77就等于65了。所以它的总价值呢，是按照50亿美金收购77%股票的方式反推出来的。

震撼发布！GPT-4.1，牛马的新工具来了，专为程序员打造百万Token上下文API利器，超低价与高指令遵从度能否颠覆Gemini与Claude主导的工程市场格局？

2025-04-16 作者 Luke Fan

GPT4.1发布了！牛马们的好工具终于上线了。大家好，欢迎收听老范讲故事的YouTube频道。

GPT4.1突然发布，这是程序员们的工具。普通的用户你是用不上的。你用网页版，你用APP，甭管是手机端的还是电脑端的，你是付费用户还是免费用户，你都用不到GPT4.1。只有程序员可以通过API调用GPT4.1。

但是这个事儿对于非程序员来说，也是有很大改变，很大帮助的。那么我们今天来讲一讲，GPT4.1到底是一个什么样的东西。

首先，它有100万TOKEN的上下文，这个是非常吓人。100万单词吧，基本上你可以直接塞到GPT4.1里头去，它统一给你处理。而且大海捞针做的也很不错。

GPT-4o图片生成工具，真正的生产力工具发布了，GPT-4o图像生成全面碾压DALL-E 3？指令理解超神但艺术感仍是致命短板！

2025-03-27 作者 Luke Fan

OpenAI更新了他们的图像生成模型。看来20美金一个月的套餐，还要继续续下去啊。大家好，欢迎收听老范讲故事的YouTube频道。OpenAI最近也开始卷起来了，对吧？前面开始出O1、O3，出GPT4.5，现在好了，把这个图像生成模型也更新了。最近其实大家都在卷图像，卷了一整波的图像。最早开始卷图像的是国内的这些应用，像豆包、千问，他们最早开始卷。这个模型没更新，卷的是客户端和手机端的应用，希望说你出去照完相以后，说给我去换个衣服，换个背景，去做这样的事情。但是这个因为模型本身的能力有限，所以效果并不是特别好。我试过比如说，我把自己的一张照片发上去以后，说来，给我把这个背景换成海滩。背景确实换成海滩了，但是他把前面这个人物也重绘了，不像我了。这就是国内卷了一波。

真正拉开序幕的是谁？是谷歌的Gemini 2.0 Flash。他们出了一个可以同时输出文字和图像的模型。这个模型出来以后，很多人惊呼，以后Photoshop修图就没你们什么事了啊。为什么？你可以上传一个杯子的图片，再上传一个美女的图片给它，提示词说请让美女举着杯子。那个图片出来了以后，是非常逻辑自洽的，不会看着有任何别扭的地方。或者你给她个包，说想让这个美女拎着包，这个效果好极了。甚至我拿了一些MidJourney画的图片上去，说再给我把某个公司的logo贴上，效果极好，特别的逻辑自洽，而且支持中文输出。这个其实挺难的。目前为止，支持中文输出的图像生成模型，原来就是国内的极梦，也是字节下边有一个版本是支持的。现在Gemini也是支持中文输出的，而且它支持多模态输入。你可以跟它说话，你可以给它输入图片，说你把这张图片跟那张图片合在一起，它效果都很好，完全可以实现聊天修图像。