11 月 23
Luke FanAIGC, Google的故事 4K图像, AI Studio, AI图像生成, AI绘画, Gemini 3 Pro, Gemini API, Gemini使用教程, Google AI, MidJourney对比, Nano Banana Pro, Nano Banana Pro价格, Nano Banana Pro免费, Nano Banana Pro测评, PPT设计, 信息图表, 图像编辑, 多图融合, 多模态AI, 搜索增强绘图, 文字渲染, 文生图, 自然语言修图, 角色一致性, 谷歌AI绘画
Nano Banana Pro发布了,它在Nano Banana的基础上到底做了些什么新东西?
大家好,欢迎收听老范讲故事的YouTube频道。
大家等了半天的Nano Banana 2没有来,出来的是Nano Banana Pro。当然,前面Nano Banana Pro也是隐姓埋名,在各种的大模型评测平台上偷跑了好长时间。所以很多人呢,信誓旦旦地说:“我已经用到了这个东西,强的没边了。”现在终于发布出来了。
从Nano Banana到Nano Banana Pro:核心区别是什么?
从名字上呢,一个叫Nano Banana,另外一个呢加了个Pro,它们到底差在哪呢?原来的Nano Banana,其实是叫做Gemini 2.5 Flash image。现在的Nano Banana Pro呢,它背后的模型是Gemini 3.0 Pro image,是两个不同版本。而且一个呢是Flash,一个呢是Pro。Flash一定是比较快,出来的东西呢相对比较粗糙;而Pro的话,出来的东西就会比较笨重了,或者说比较昂贵,而且出来的东西非常非常细致和完善,它们核心的区别就在这里。
Nano Banana也是先在外边测试了很久然后才发布,这个名字也是当时他们测试的时候使用的名字。当然这一次测试呢,并没有叫纳米香蕉,这次换了个名字,因为纳米香蕉这名字你用过了嘛,好像叫GENIMG,大概是这样的一个名字去测试的。
More
10 月 08
Luke FanAIGC AI Agent, AI商业变现, AI开发者, AI硬件, Apps SDK, ChatGPT, ChatGPT操作系统, Codex, GPT-5 Pro API, OpenAI, OpenAI DevDay, OpenAI生态, Sam Altman, Sora 2 API, 人工智能未来, 全栈AI, 多模态AI, 小程序开发, 技术趋势分析, 股价影响, 自然语言编程, 行业领袖, 语音交互
OpenAI开发者日,暴露了山姆·奥特曼的隐藏野心。
大家好,欢迎收听老范讲故事的YouTube频道。今天咱们先讲结论,然后告诉大家我怎么得出这样的结论,验证一下这个结论是否正确,再让大家行动起来,看看咱们在山姆·奥特曼指明方向以后,到底能干点什么。
OpenAI的开发者日呢,隐藏在发布会背后的野心和方向到底是什么?表面上这东西咱就不重复了,说到底发布了什么东西,只讲结论。
第一个,ChatGPT要做操作系统了。
第二个,自然语言和语音交互才是未来。
第三个,全栈、全生态、全模态的开发都在OpenAI。
有三个大的结论。
那咱们怎么得到这样的结论的呢?咱们看发布会,要稍微换一个方向来看。我自己呢,举办、参加过很多发布会,也专门受过训练,主持过发布会。咱们发布会一般看什么呢?叫“wow时刻”,一看这个东西,“wow,好厉害”,叫“wow时刻”。在52分钟的发布会视频里头,有哪些“Wow时刻”呢?那你说我是不是拿了个纸、拿了个笔,52分钟的发布会反复看,在这记笔记,哪个地方有掌声?不是这样的。我到GPT里边直接下了一个指令,把YouTube的视频链接贴进去,我说:“请给我统计一下,什么时候有掌声,掌声中度还是高度,有掌声的时候是谁在演讲,在讲什么,给我画个表格出来。”剩下的事情就交给GPT去干了,效果还是很好的。
More
9 月 25
Luke FanAIGC AI, AIGC, AI产品策略, AI时代, AI流量获取, AI营销, ChatGPT, GPT-4o, MidJourney, 互联网思维, 产品创新, 产品发布会, 单点突破, 口碑传播, 多模态AI, 大模型应用, 开源模型, 流量密码, 流量迁移, 爆款产品打造, 用户增长, 用户增长策略, 用户感知, 自有流量, 锥子理论, 预期管理
AI时代如何获得流量与关注?跟原来的互联网和移动互联网时代,到底有什么相同与不同吗?
大家好,欢迎收听老范讲故事的YouTube频道。今天咱们来讲一讲,AI时代我们想去获得流量,到底是如何去获得的。
我们现在先不去讲如何做出一个好产品吧。如果你没有办法获得流量,或者说获得免费的流量的话,那你可能还需要花钱去买流量,或者说跟你固有的业务去捆绑、去绑定你的用户获得流量的话,那么你的AI产品本身就没有那么成功。
在AI时代想要去获得流量,想要去获得关注的话,你还是要在某一个细节上做出一个突破,或者做出一个有感知的革新出来。什么叫有感知的?我这个评分跑了多少,我比别人多出什么东西来,这个其实是没有感知的。只有是用户能够使用了,然后真的感觉好了,他才叫有感知。
More
7 月 15
Luke FanAIGC, Musk传奇 20万H100显卡, 256K上下文, AI大模型, AI安全中心, AI融资, AI进程改变, API调用, Claude, DeepSeek, Elon Musk, Gemini, Grok Heavy, Grok2, GROK3, GROK4, LLaMA, OpenAI, Oracle云, Scale AI, XAI, 三体小说, 中美AI差距, 人类终极测试, 企业私有部署, 众包题库, 动态任务池, 华为盘古, 南京大屠杀, 南非白人种族屠杀, 多智能体合作, 多模态AI, 川建国, 工具支持, 市场占有率, 开源承诺, 强化学习, 意识形态投毒, 技术爆炸, 推理能力, 日本烟花事件, 昇腾芯片, 模型蒸馏, 模型迭代, 理工男模型, 电力消耗, 科研提速, 算力竞争, 编程工具, 视频生成, 越狱提示词, 过拟合预防, 预训练模型, 马斯克发布会, 黄仁勋访华, 黄色小说生成, 黑暗森林法则, 黑色幽默
史上最聪明的AI大模型GROK4诞生了。马斯克亲自坐镇开发布会。视频发布会呢,并不是特别的顺畅。第一个呢,是他晚了一个小时,也没说为什么。反正马斯克的直播经常会晚。然后呢,太多的东西需要集中发布,上下衔接的呢比较仓促一点。
最早期很多的互联网公司开发布会也是这样的,两三个小时七差咔嚓发一大堆东西。后来OpenAI这些公司习惯了在网上开直播以后呢,就慢慢把这风格改了。改成什么呢?就是每次发一个功能,发个十分钟二十分钟就完事了。然后呢,不停的发,每个月发每个月发。Xai呢,现在还没有彻底学会这件事情,还是一股脑给大家扔了一大堆东西出来。
我们以前在面对创业者的时候,每次都会苦口婆心的去做一种劝告。大家可能不知道会劝什么。作为投资人来说,我们每次看到任何一个创业者,都会上去劝一件事,叫不要憋大招。你一次要惦记着做一个大的东西,就很容易失败。你应该是做一些小的东西,一点一点放出来。OXAI现在还是憋了一个大招。当然了,XAI后面呢,也会每个月发布一个新的工具出来,它也慢慢的向这样的一个方向去前进。
More
6 月 01
Luke FanAIGC AI Agent, AI 数字人, AIGC, AIGC (AI生成内容), AI产品分析, AI创业, AI动画, AI发展趋势, AI商业模式, AI工具测评, AI教程, AI模型聚合, AI绘画, AI视频生成, AI设计, AI赋能设计, Canva, ComfyUI, Demo演示, Flex, Google Imagine, GPT-4o, LibLib AI, Lovart, MidJourney, Photoshop, stable diffusion, YouTube封面, YouTube封面设计, 产品体验, 剪映, 剪映 (CapCut), 可灵, 可灵 (Keling), 垂类Agent, 多模态AI, 工作流自动化, 提示词工程, 泛Agent, 泡泡玛特风格, 科技评论, 老范讲故事, 设计师, 设计师AI, 设计师失业, 设计师就业, 陈冕
设计师这次是不是真的要失业了?咱们从Lovart这个为设计师专门设计的垂直agent来看看AI agent在垂直品类里的一些玩法儿。
大家好,欢迎收听老范讲故事的YouTube频道。Lovart又一个现象级产品出来了,设计师专用的一个垂直agent。它呢没有Manus当时引起的那么大的动静,但是呢,我用了一下,感觉比Manus这种泛agent还是要好用一些。
什么叫泛agent?就是它啥都能干。Lovart这种能够专门为设计师工作的agent呢,它就是垂类agent,它其它事干不了。你说你给我去写个文章,给我去做个总结,这它干不了。但是你说你给我画个画,做个视频,设计一个PPT,设计个海报,做的可好了。他们设计的产品在x上被马斯克亲自点赞。因为这种设计类产品嘛,一个图片什么的,你要设计的非常好的话,确实会引起大佬点赞。很多的使用者也是惊为天人,我去使了一下,确实是很神奇,能够解决非常多的问题。
More
5 月 26
Luke FanAIGC 65亿美金收购, AI, AI iPhone, AI Pin, AI伴侣, AI助手, AI手机, AI硬件收购, AI设备, AI趋势, Apple, ChatGPT, GPT-5, HCI, IO团队, Jony Ive, LLM, Love From, M&A, OpenAI, Sam Altman, Scaling law, UX, YouTube, 乔布斯, 交互革命, 产品设计, 人工智能, 人机交互, 企业估值, 可穿戴AI, 多模态AI, 大语言模型, 孙正义, 山姆奥特曼, 工业设计, 强尼艾夫, 微软, 情绪感知, 手势识别, 播客, 无屏交互, 智能硬件, 未来科技, 用户体验, 硬件创新, 科技创业, 科技并购, 科技行业分析, 科技评论, 移动互联网, 纯股票交易, 老范讲故事, 自然交互, 苹果公司, 语音交互, 软银, 风险投资
OpenAI以65亿美金收购了强尼艾夫爵士的IO团队,要做AI iPhone了吗?大家好,欢迎收听老范讲故事的YouTube频道。
OpenAI最大的硬件收购来了。没办法,他自己3,000亿美金的估值了,现在收购任何的团队都是比较贵的,所以又变成了有史以来最大的AI硬件团队收购。这一次呢,是以50亿美金的纯股票交易收购强尼艾夫创建的IO团队手里边77%的股票。
这个团队呢,2023年底其实已经被OpenAI投资过了。当时投资了以后占股了是23%。这一次呢,等于是交50亿美金,或者叫以50亿美金的对价收购了剩余的77%的股票。这个65亿美金怎么算出来的?很简单,50亿除0.77就等于65了。所以它的总价值呢,是按照50亿美金收购77%股票的方式反推出来的。
More
4 月 16
Luke FanAIGC 100万Token上下文, AI Agent, AI agent开发, AIGC, AI工具更新, AI市场竞争, AI成本优化, AI技术更新, AI模型对比, API发布, API调用, B端市场, Claude 3.5, Claude 3.7, C端用户, DeepSeek R1, Deepseek V3, Gemini 2.0, Gemini Pro 2.5, GPT-4.1, GPT-4.1评测, Grok 3 mini, LLM, MidJourney, OpenAI, OpenAI战略, RAG (检索增强生成), Sora, 人工智能, 价格便宜, 低成本AI, 可控性强, 多模态AI, 多版本 (Standard/Mini/Nano), 大海捞针测试, 大语言模型, 实时AI (Realtime AI), 工程应用, 工程需求, 开发者API, 开发者福音, 开源模型, 技术发展趋势, 技术解读, 技术选型, 指令遵循度高, 推理能力, 模型评测, 牛马工具 (程序员自嘲), 程序员工具, 稳定性好, 编程能力提升, 观点分享, 视频理解能力, 速度快, 长上下文处理, 高性价比, 高效AI模型
GPT4.1发布了!牛马们的好工具终于上线了。大家好,欢迎收听老范讲故事的YouTube频道。
GPT4.1突然发布,这是程序员们的工具。普通的用户你是用不上的。你用网页版,你用APP,甭管是手机端的还是电脑端的,你是付费用户还是免费用户,你都用不到GPT4.1。只有程序员可以通过API调用GPT4.1。
但是这个事儿对于非程序员来说,也是有很大改变,很大帮助的。那么我们今天来讲一讲,GPT4.1到底是一个什么样的东西。
首先,它有100万TOKEN的上下文,这个是非常吓人。100万单词吧,基本上你可以直接塞到GPT4.1里头去,它统一给你处理。而且大海捞针做的也很不错。
More
3 月 27
Luke FanAIGC 3D建模辅助, AI图像生成, AI绘图工作流, DALL-E 3升级, Gemini 2.0 Flash, GPT-4o评测, GROK3图像编辑, IP形象开发, MidJourney对比, OpenAI更新, UI图标库生成, 个性化头像生成, 中文AI绘图, 中文提示词优化, 中文艺术字生成, 产品包装设计, 企业级API接入, 创意内容商业化, 动态分镜制作, 商业logo设计, 商业应用场景, 团队协作绘图, 图像生成API, 图像生成速度对比, 图像生成限制放宽, 复杂指令解析, 多模态AI, 多模态输入输出, 多轮对话绘图, 多风格控制测试, 实时绘图优化, 宫崎骏风格头像, 广告素材生成, 庆丰包子铺乐高, 影视分镜制作, 影视概念设计, 指令理解模型, 教育培训禁用, 数字水印技术, 数字水印溯源, 数字资产创作, 智能修图革命, 模型迭代路径, 泡泡玛特风格, 游戏角色建模, 版权内容生成, 版权合规生成, 生产力工具革新, 生成式AI进化, 电商主图优化, 电商图标设计, 电子书插图, 皮克斯风格绘图, 社交媒体配图, 聊天式图像编辑, 艺术性与实用性平衡, 虚拟偶像创作, 角色一致性生成, 语义依存度测试, 语义精准控制, 跨平台图像生成, 透明图标设计, 靠嘴修图
OpenAI更新了他们的图像生成模型。看来20美金一个月的套餐,还要继续续下去啊。大家好,欢迎收听老范讲故事的YouTube频道。OpenAI最近也开始卷起来了,对吧?前面开始出O1、O3,出GPT4.5,现在好了,把这个图像生成模型也更新了。最近其实大家都在卷图像,卷了一整波的图像。最早开始卷图像的是国内的这些应用,像豆包、千问,他们最早开始卷。这个模型没更新,卷的是客户端和手机端的应用,希望说你出去照完相以后,说给我去换个衣服,换个背景,去做这样的事情。但是这个因为模型本身的能力有限,所以效果并不是特别好。我试过比如说,我把自己的一张照片发上去以后,说来,给我把这个背景换成海滩。背景确实换成海滩了,但是他把前面这个人物也重绘了,不像我了。这就是国内卷了一波。
真正拉开序幕的是谁?是谷歌的Gemini 2.0 Flash。他们出了一个可以同时输出文字和图像的模型。这个模型出来以后,很多人惊呼,以后Photoshop修图就没你们什么事了啊。为什么?你可以上传一个杯子的图片,再上传一个美女的图片给它,提示词说请让美女举着杯子。那个图片出来了以后,是非常逻辑自洽的,不会看着有任何别扭的地方。或者你给她个包,说想让这个美女拎着包,这个效果好极了。甚至我拿了一些MidJourney画的图片上去,说再给我把某个公司的logo贴上,效果极好,特别的逻辑自洽,而且支持中文输出。这个其实挺难的。目前为止,支持中文输出的图像生成模型,原来就是国内的极梦,也是字节下边有一个版本是支持的。现在Gemini也是支持中文输出的,而且它支持多模态输入。你可以跟它说话,你可以给它输入图片,说你把这张图片跟那张图片合在一起,它效果都很好,完全可以实现聊天修图像。
More