我们都被骗了?Nano Banana Pro 真相揭秘:它根本不是Gemini 3简单叠加,原生多模态骨架才是颠覆关键|Nano Banana Pro、Gemini 3 Pro、Gemini 3

我们都被骗了?Nano Banana Pro 真相揭秘:它根本不是Gemini 3简单叠加,原生多模态骨架才是颠覆关键|Nano Banana Pro、Gemini 3 Pro、Gemini 3已关闭评论

Nano Banana Pro发布了,它在Nano Banana的基础上到底做了些什么新东西?

大家好,欢迎收听老范讲故事的YouTube频道。

大家等了半天的Nano Banana 2没有来,出来的是Nano Banana Pro。当然,前面Nano Banana Pro也是隐姓埋名,在各种的大模型评测平台上偷跑了好长时间。所以很多人呢,信誓旦旦地说:“我已经用到了这个东西,强的没边了。”现在终于发布出来了。

从Nano Banana到Nano Banana Pro:核心区别是什么?

从名字上呢,一个叫Nano Banana,另外一个呢加了个Pro,它们到底差在哪呢?原来的Nano Banana,其实是叫做Gemini 2.5 Flash image。现在的Nano Banana Pro呢,它背后的模型是Gemini 3.0 Pro image,是两个不同版本。而且一个呢是Flash,一个呢是Pro。Flash一定是比较快,出来的东西呢相对比较粗糙;而Pro的话,出来的东西就会比较笨重了,或者说比较昂贵,而且出来的东西非常非常细致和完善,它们核心的区别就在这里。

Nano Banana也是先在外边测试了很久然后才发布,这个名字也是当时他们测试的时候使用的名字。当然这一次测试呢,并没有叫纳米香蕉,这次换了个名字,因为纳米香蕉这名字你用过了嘛,好像叫GENIMG,大概是这样的一个名字去测试的。

More

超级App vs 独立操作系统:山姆·奥特曼的野心远不止取代搜索,52分钟发布会暴露其真正想颠覆的是整个应用平台|ChatGPT OpenAI Sam Altman Operating System

超级App vs 独立操作系统:山姆·奥特曼的野心远不止取代搜索,52分钟发布会暴露其真正想颠覆的是整个应用平台|ChatGPT OpenAI Sam Altman Operating System已关闭评论

OpenAI开发者日,暴露了山姆·奥特曼的隐藏野心。

大家好,欢迎收听老范讲故事的YouTube频道。今天咱们先讲结论,然后告诉大家我怎么得出这样的结论,验证一下这个结论是否正确,再让大家行动起来,看看咱们在山姆·奥特曼指明方向以后,到底能干点什么。

OpenAI的开发者日呢,隐藏在发布会背后的野心和方向到底是什么?表面上这东西咱就不重复了,说到底发布了什么东西,只讲结论。
第一个,ChatGPT要做操作系统了。
第二个,自然语言和语音交互才是未来。
第三个,全栈、全生态、全模态的开发都在OpenAI。
有三个大的结论。

那咱们怎么得到这样的结论的呢?咱们看发布会,要稍微换一个方向来看。我自己呢,举办、参加过很多发布会,也专门受过训练,主持过发布会。咱们发布会一般看什么呢?叫“wow时刻”,一看这个东西,“wow,好厉害”,叫“wow时刻”。在52分钟的发布会视频里头,有哪些“Wow时刻”呢?那你说我是不是拿了个纸、拿了个笔,52分钟的发布会反复看,在这记笔记,哪个地方有掌声?不是这样的。我到GPT里边直接下了一个指令,把YouTube的视频链接贴进去,我说:“请给我统计一下,什么时候有掌声,掌声中度还是高度,有掌声的时候是谁在演讲,在讲什么,给我画个表格出来。”剩下的事情就交给GPT去干了,效果还是很好的。

More

流量真相被揭开:为什么你的AI产品功能越完善,用户流失越快?ChatGPT成功的秘密竟是“锥子理论”|AI、Traffic Management、Innovation、Congestion

流量真相被揭开:为什么你的AI产品功能越完善,用户流失越快?ChatGPT成功的秘密竟是“锥子理论”|AI、Traffic Management、Innovation、Congestion已关闭评论

AI时代如何获得流量与关注?跟原来的互联网和移动互联网时代,到底有什么相同与不同吗?

大家好,欢迎收听老范讲故事的YouTube频道。今天咱们来讲一讲,AI时代我们想去获得流量,到底是如何去获得的。

我们现在先不去讲如何做出一个好产品吧。如果你没有办法获得流量,或者说获得免费的流量的话,那你可能还需要花钱去买流量,或者说跟你固有的业务去捆绑、去绑定你的用户获得流量的话,那么你的AI产品本身就没有那么成功。

在AI时代想要去获得流量,想要去获得关注的话,你还是要在某一个细节上做出一个突破,或者做出一个有感知的革新出来。什么叫有感知的?我这个评分跑了多少,我比别人多出什么东西来,这个其实是没有感知的。只有是用户能够使用了,然后真的感觉好了,他才叫有感知。

More

马斯克重磅发布GROK4:史上最聪明AI大模型横空出世,强化学习碾压GPT-4与Claude,20万张H100显卡大力出奇迹,中美科技差距再度拉大,谁将主导AI未来?

马斯克重磅发布GROK4:史上最聪明AI大模型横空出世,强化学习碾压GPT-4与Claude,20万张H100显卡大力出奇迹,中美科技差距再度拉大,谁将主导AI未来?已关闭评论

史上最聪明的AI大模型GROK4诞生了。马斯克亲自坐镇开发布会。视频发布会呢,并不是特别的顺畅。第一个呢,是他晚了一个小时,也没说为什么。反正马斯克的直播经常会晚。然后呢,太多的东西需要集中发布,上下衔接的呢比较仓促一点。

最早期很多的互联网公司开发布会也是这样的,两三个小时七差咔嚓发一大堆东西。后来OpenAI这些公司习惯了在网上开直播以后呢,就慢慢把这风格改了。改成什么呢?就是每次发一个功能,发个十分钟二十分钟就完事了。然后呢,不停的发,每个月发每个月发。Xai呢,现在还没有彻底学会这件事情,还是一股脑给大家扔了一大堆东西出来。

我们以前在面对创业者的时候,每次都会苦口婆心的去做一种劝告。大家可能不知道会劝什么。作为投资人来说,我们每次看到任何一个创业者,都会上去劝一件事,叫不要憋大招。你一次要惦记着做一个大的东西,就很容易失败。你应该是做一些小的东西,一点一点放出来。OXAI现在还是憋了一个大招。当然了,XAI后面呢,也会每个月发布一个新的工具出来,它也慢慢的向这样的一个方向去前进。

More

设计师的未来已来?Lovart垂直AI Agent震撼体验,从Midjourney到多模型协作,揭秘AI如何颠覆传统设计流程与商业模式。

设计师的未来已来?Lovart垂直AI Agent震撼体验,从Midjourney到多模型协作,揭秘AI如何颠覆传统设计流程与商业模式。已关闭评论

设计师这次是不是真的要失业了?咱们从Lovart这个为设计师专门设计的垂直agent来看看AI agent在垂直品类里的一些玩法儿。

大家好,欢迎收听老范讲故事的YouTube频道。Lovart又一个现象级产品出来了,设计师专用的一个垂直agent。它呢没有Manus当时引起的那么大的动静,但是呢,我用了一下,感觉比Manus这种泛agent还是要好用一些。

什么叫泛agent?就是它啥都能干。Lovart这种能够专门为设计师工作的agent呢,它就是垂类agent,它其它事干不了。你说你给我去写个文章,给我去做个总结,这它干不了。但是你说你给我画个画,做个视频,设计一个PPT,设计个海报,做的可好了。他们设计的产品在x上被马斯克亲自点赞。因为这种设计类产品嘛,一个图片什么的,你要设计的非常好的话,确实会引起大佬点赞。很多的使用者也是惊为天人,我去使了一下,确实是很神奇,能够解决非常多的问题。

More

从乔布斯“灵魂伴侣”到山姆奥特曼的座上宾,强尼艾夫的IO团队以65亿美金估值并入OpenAI,是AI iPhone的黎明将至,还是又一个AI硬件泡沫的开始?

从乔布斯“灵魂伴侣”到山姆奥特曼的座上宾,强尼艾夫的IO团队以65亿美金估值并入OpenAI,是AI iPhone的黎明将至,还是又一个AI硬件泡沫的开始?已关闭评论

OpenAI以65亿美金收购了强尼艾夫爵士的IO团队,要做AI iPhone了吗?大家好,欢迎收听老范讲故事的YouTube频道。

OpenAI最大的硬件收购来了。没办法,他自己3,000亿美金的估值了,现在收购任何的团队都是比较贵的,所以又变成了有史以来最大的AI硬件团队收购。这一次呢,是以50亿美金的纯股票交易收购强尼艾夫创建的IO团队手里边77%的股票。

这个团队呢,2023年底其实已经被OpenAI投资过了。当时投资了以后占股了是23%。这一次呢,等于是交50亿美金,或者叫以50亿美金的对价收购了剩余的77%的股票。这个65亿美金怎么算出来的?很简单,50亿除0.77就等于65了。所以它的总价值呢,是按照50亿美金收购77%股票的方式反推出来的。

More

震撼发布!GPT-4.1,牛马的新工具来了,专为程序员打造百万Token上下文API利器,超低价与高指令遵从度能否颠覆Gemini与Claude主导的工程市场格局?

震撼发布!GPT-4.1,牛马的新工具来了,专为程序员打造百万Token上下文API利器,超低价与高指令遵从度能否颠覆Gemini与Claude主导的工程市场格局?已关闭评论

GPT4.1发布了!牛马们的好工具终于上线了。大家好,欢迎收听老范讲故事的YouTube频道。

GPT4.1突然发布,这是程序员们的工具。普通的用户你是用不上的。你用网页版,你用APP,甭管是手机端的还是电脑端的,你是付费用户还是免费用户,你都用不到GPT4.1。只有程序员可以通过API调用GPT4.1。

但是这个事儿对于非程序员来说,也是有很大改变,很大帮助的。那么我们今天来讲一讲,GPT4.1到底是一个什么样的东西。

首先,它有100万TOKEN的上下文,这个是非常吓人。100万单词吧,基本上你可以直接塞到GPT4.1里头去,它统一给你处理。而且大海捞针做的也很不错。

More

GPT-4o图片生成工具,真正的生产力工具发布了,GPT-4o图像生成全面碾压DALL-E 3?指令理解超神但艺术感仍是致命短板!

GPT-4o图片生成工具,真正的生产力工具发布了,GPT-4o图像生成全面碾压DALL-E 3?指令理解超神但艺术感仍是致命短板!已关闭评论

OpenAI更新了他们的图像生成模型。看来20美金一个月的套餐,还要继续续下去啊。大家好,欢迎收听老范讲故事的YouTube频道。OpenAI最近也开始卷起来了,对吧?前面开始出O1、O3,出GPT4.5,现在好了,把这个图像生成模型也更新了。最近其实大家都在卷图像,卷了一整波的图像。最早开始卷图像的是国内的这些应用,像豆包、千问,他们最早开始卷。这个模型没更新,卷的是客户端和手机端的应用,希望说你出去照完相以后,说给我去换个衣服,换个背景,去做这样的事情。但是这个因为模型本身的能力有限,所以效果并不是特别好。我试过比如说,我把自己的一张照片发上去以后,说来,给我把这个背景换成海滩。背景确实换成海滩了,但是他把前面这个人物也重绘了,不像我了。这就是国内卷了一波。

真正拉开序幕的是谁?是谷歌的Gemini 2.0 Flash。他们出了一个可以同时输出文字和图像的模型。这个模型出来以后,很多人惊呼,以后Photoshop修图就没你们什么事了啊。为什么?你可以上传一个杯子的图片,再上传一个美女的图片给它,提示词说请让美女举着杯子。那个图片出来了以后,是非常逻辑自洽的,不会看着有任何别扭的地方。或者你给她个包,说想让这个美女拎着包,这个效果好极了。甚至我拿了一些MidJourney画的图片上去,说再给我把某个公司的logo贴上,效果极好,特别的逻辑自洽,而且支持中文输出。这个其实挺难的。目前为止,支持中文输出的图像生成模型,原来就是国内的极梦,也是字节下边有一个版本是支持的。现在Gemini也是支持中文输出的,而且它支持多模态输入。你可以跟它说话,你可以给它输入图片,说你把这张图片跟那张图片合在一起,它效果都很好,完全可以实现聊天修图像。

More