数字水印技术 - 老范讲故事｜AI、大模型与商业世界的故事

OpenAI更新了他们的图像生成模型。看来20美金一个月的套餐，还要继续续下去啊。大家好，欢迎收听老范讲故事的YouTube频道。OpenAI最近也开始卷起来了，对吧？前面开始出O1、O3，出GPT4.5，现在好了，把这个图像生成模型也更新了。最近其实大家都在卷图像，卷了一整波的图像。最早开始卷图像的是国内的这些应用，像豆包、千问，他们最早开始卷。这个模型没更新，卷的是客户端和手机端的应用，希望说你出去照完相以后，说给我去换个衣服，换个背景，去做这样的事情。但是这个因为模型本身的能力有限，所以效果并不是特别好。我试过比如说，我把自己的一张照片发上去以后，说来，给我把这个背景换成海滩。背景确实换成海滩了，但是他把前面这个人物也重绘了，不像我了。这就是国内卷了一波。

真正拉开序幕的是谁？是谷歌的Gemini 2.0 Flash。他们出了一个可以同时输出文字和图像的模型。这个模型出来以后，很多人惊呼，以后Photoshop修图就没你们什么事了啊。为什么？你可以上传一个杯子的图片，再上传一个美女的图片给它，提示词说请让美女举着杯子。那个图片出来了以后，是非常逻辑自洽的，不会看着有任何别扭的地方。或者你给她个包，说想让这个美女拎着包，这个效果好极了。甚至我拿了一些MidJourney画的图片上去，说再给我把某个公司的logo贴上，效果极好，特别的逻辑自洽，而且支持中文输出。这个其实挺难的。目前为止，支持中文输出的图像生成模型，原来就是国内的极梦，也是字节下边有一个版本是支持的。现在Gemini也是支持中文输出的，而且它支持多模态输入。你可以跟它说话，你可以给它输入图片，说你把这张图片跟那张图片合在一起，它效果都很好，完全可以实现聊天修图像。

国家发文件了，以后AI生成的内容再也不可以“裸奔”了，必须要进行标注。这到底是一个什么样的事情？大家好，欢迎收听老范讲故事的YouTube频道。

今年两会期间，雷军讲了个冷笑话。什么样的冷笑话呢？说去年十一放假7天，大家在家里头被雷军骂了8天。什么意思呢？很多人用雷军的形象和声音，生成了数字人的骂人视频。十一期间，法务部都放假了，但是大家又在家里没事干，刷短视频刷到的都是雷军四处骂人，骂了友商，社会事情全都骂了一遍。

雷军呢，一开始说：“我觉得骂就骂吧，我也贡献出形象来，让大家去娱乐一下也没什么。”骂了几天以后呢，觉得不对劲了：“你天天拿我的脸，拿我的声音出去骂人，这个受不了，所以还是要管一管。”

雷军呢，有两个很重要的提案。一个呢是改这绿牌儿，他觉得这个新能源车的绿牌儿实在太难看了：“我造了50多万的小米速汽Ultra，这么漂亮的车，你给我挂这么恶心的牌子上去，实在太难看了，咱们能不能改一改？”另外一个呢就是要管理AI生成内容，不能再发生这种国庆放7天假，被雷军骂8天这种事情。

GPT-4o图片生成工具，真正的生产力工具发布了，GPT-4o图像生成全面碾压DALL-E 3？指令理解超神但艺术感仍是致命短板！

AI生成内容戴上紧箍咒：四部门新规如何从雷军骂人视频到全网追责？