AI生成内容戴上紧箍咒:四部门新规如何从雷军骂人视频到全网追责?
3 月 17
AIGC, 中国故事 6个月数据追溯, AI小说出海监管, AI生成内容监管, AI短剧出海监管, AI绘本版权争议, IP属地显示制度, Midjourney水印问题, stable diffusion合规, 主旋律内容豁免权, 义乌AI直播乱象, 人工智能标识办法, 付费去水印机制, 传播平台责任, 传播要素信息留存, 元数据擦除技术, 内容创作者合规指南, 内容生产成本上升, 内容生成追责机制, 即梦水印争议, 可灵平台责任, 国内国外双标运营, 国家网信办新规, 图片元数据修改, 地方政府AI企业保护, 多手指AI图片识别, 小米汽车绿牌, 开源模型监管漏洞, 数字人直播带货, 数字指纹加密技术, 数字水印技术, 显性标注要求, 服务商追踪编码, 海外平台传播漏洞, 深度学习模型本地化, 深度学习模型监管, 生成内容属性编号, 生成内容润色规避, 生成工具实名制, 生成平台日志留存, 生成式AI法律风险, 生成链完整追溯, 短视频平台审核压力, 社交媒体内容审核, 绿牌改革提案, 老大哥监控体系, 虚假信息认定标准, 虚假预告片整治, 虚拟场景标识规范, 视频起始画面标注, 语音合成标注标准, 跨国内容产业链, 跨境内容失控, 运动式执法困境, 隐性元数据追踪, 雷军数字人事件, 音频特定音节标识 AI生成内容戴上紧箍咒:四部门新规如何从雷军骂人视频到全网追责?已关闭评论
国家发文件了,以后AI生成的内容再也不可以“裸奔”了,必须要进行标注。这到底是一个什么样的事情?大家好,欢迎收听老范讲故事的YouTube频道。
今年两会期间,雷军讲了个冷笑话。什么样的冷笑话呢?说去年十一放假7天,大家在家里头被雷军骂了8天。什么意思呢?很多人用雷军的形象和声音,生成了数字人的骂人视频。十一期间,法务部都放假了,但是大家又在家里没事干,刷短视频刷到的都是雷军四处骂人,骂了友商,社会事情全都骂了一遍。
雷军呢,一开始说:“我觉得骂就骂吧,我也贡献出形象来,让大家去娱乐一下也没什么。”骂了几天以后呢,觉得不对劲了:“你天天拿我的脸,拿我的声音出去骂人,这个受不了,所以还是要管一管。”
雷军呢,有两个很重要的提案。一个呢是改这绿牌儿,他觉得这个新能源车的绿牌儿实在太难看了:“我造了50多万的小米速汽Ultra,这么漂亮的车,你给我挂这么恶心的牌子上去,实在太难看了,咱们能不能改一改?”另外一个呢就是要管理AI生成内容,不能再发生这种国庆放7天假,被雷军骂8天这种事情。
雷军呢,也算是一个受害者。这个事情发生了以后呢,政府就发文了。大家注意,人大是立法的,政府只能发文。3月14号,国家网信办、工信部、公安部、广电总局联合发文《人工智能生成合成内容标识办法》,要求从9月1号起,所有利用AI生成的文字、图片、视频、音频等内容必须添加标识,违者面临法律追责。
发了这么一个文件,那么要求怎么标识呢?第一,文本必须在起始和结尾添加文字提示,开头写一个“我这是AI生成的”,结尾写一个“我到这里结束,AI生成的”。大家要干这样的事情。图片要在显著位置标注,这个图片上应该是有一个水印,像我现在比如用即梦生成的图片,右下角就有一个水印是“即梦生成”。然后音频中要插入特定的音节和语音,如果你再生成雷军骂人的,那开始的时候一定要说“这是AI生成的”,结尾的时候再说一句什么事情。虚拟场景起始画面要添加标识,视频需要在起始画面、播放界面设置标识。
这个事情我是很支持的。为什么?最近被骗了好多,一上来看阿凡达3预告片,赶快点进去看,结果发现是阿凡达1、阿凡达2的视频剪辑了一个片段下来以后,再加上一点点AI生成的这种过程,就告诉你是阿凡达3的预告片了。我最近是被这种视频骗了好几次。
还要求什么呢?在所有生成内容文件的原数据中,必须嵌入隐式标识,包括生成内容的属性、服务提供者的编号、内容编号等信息。这句话什么意思?大家注意我们看到的图片。
听到的音频,还有视频,这些呢都是存在文件里的一个图片文件。在这个图片文件里头呢,分两部分。后边这个具体图片文件的信息,他其实就是告诉你每个点是红的、绿的、蓝的,下一个点红的、绿的、蓝的,大概是一大堆这样的数据。前面呢,有一个叫文件头的地方,或者叫文件元数据的地方,metadata。这个里边原来写的是什么呢?我这个是什么格式的,是如何压缩的,横有多宽,竖有多高,用什么样的相机拍的,拍的时候呢,我的快门是多少,我的这个ISO是多少,我的这个光圈是多少。他有一大堆这样的信息写在里头。
现在要求你们必须把这个AI生成的信息也给我记在里头,而且是谁生成的这个要写在里头。你说我这是字节跳动即梦生成的,还是快手的可灵生成的,你要在上头有编号的。然后内容编号是什么意思?每一个内容要有唯一编号,要跟我们自己的账户关联起来。万一我们用这个东西生成了一些让人觉得不舒服的内容吧,他是可以找到个人的。咱们使用这种AI生成工具的时候,都是实名制的。所以一旦是把这个内容生成的编号记在metadata里了,你就逃不掉了,就知道这事是谁干的。张三李四某年某月某日,在快手的可灵平台上,生成了一张什么样的画,这个是可以追责的。
然后是支持服务提供者添加数字水印等技术形式的隐式标识,但非强制要求。这句话什么意思?大家注意前面我们讲到的,在图片上加一个数字水印,我们人是能看见的,可以通过人眼识别这个东西。你如果是在metadata里边去加一个初始数据的话,这些东西人眼虽然看不到,但是呢,你可以通过图片读取工具去把这个metadata读出来,你也可以看到。但一旦是添加了这种数字水印了,或者叫水纹这个东西呢,人眼看不着,你用其他的这种解读工具呢,也不是可以直接看到。他有需要一些很特殊的解读工具,他可以看到。他是通过一种加密的方式把一些信息写进去,但是这块呢就不强制要求了。这个确实对于普通的这个技术平台来说,是有一定难度的,或者说需要增加它的成本吧。
最后发布AI内容时,需要主动声明并添加标识,否则可以被判定为传播虚假信息。这个是给你定性了。因为在中国,传播虚假信息这件事情是很严重的。原来这个是由有些有关部门来定义什么是虚假信息的,现在他们给你加了一条,如果你传播AI内容的时候,没有标注是AI内容,就算是传播虚假信息。大家注意这个里头讲的是什么?是传播,不是生成。别人生成好了,我从那盗图把这图抓下来。
然后到另外一个这个地方去发去了。在这个过程中,我也得标识说这个东西是AI生成的。如果我在这个搬运的时候没有标识,也算是传播虚假信息。那么标识的目的是什么呢?就是让大家负起责任来。
用户申请无显示标识的时候,这个服务提供者可通过用户协议,明确用户的标识义务和使用责任后,提供不含显示标示内容,并依法留存相关日志不少于6个月。这句话什么意思呢?你比如说像即梦,我如果进去交钱去了,如果我订会员了,我就可以下载这个上头不带即梦水印的图片或者是视频下来。但是呢,一旦我干了这个事情了,极梦就会提醒我说:“你要注意你做的这个东西,我要留6个月的日志。万一被人逮着了,我在6个月之内都可以证明这事是你干的。”他是有这样的一个要求。
因为现在很多的AI生成平台都是这么去做的,说你免费的,我就把这个水印搁上,也顺手做个广告嘛。付费的我就可以把这个水印去掉了。他一般都是这么干的,但是也要告诉你,是去除了以后你也跑不掉,我这有日志呢。国家要查的时候,我依然会把你供出来的。
那么传播平台的责任也是很重的。若是发现隐式标识缺失,但是内容疑似AI生成的,需要添加提示并留存传播要素信息。什么意思呢?就是应该在原数据里头,图片呀,还是这个视频,就是这个文件头上,这个原数据里头,我应该标识上说这个是哪个平台生成的AI内容。但是这个玩意是可以擦除的,或者说我们可以通过一些图片转换的过程,是可以把它隐藏掉的。
到后边的传播平台里,比如说我现在AI生成了一张图片,然后我把里边这个数据给擦掉了,就是这个标签擦掉了。然后我把这个图片发到微博上去了,微博发现了以后,他要自己去判断这个东西是不是AI生成的。比如说这个小姐姐有6个手指头,这个一定是AI生成的。那么它要在旁边去标注一下,而且呢,要记入它的日志算:某人往我这个里头贴了张照片,像是AI生成的,但是呢他这个照片上又把这个标记擦掉了,这个是他要记录的。
中国呢,做各种的办法,永远是以追责为目的的。所以咱们看一看他这个里头,生成平台他有责任。第一个你要把标识打进去,然后要保留日志,6个月之内我还要去查。至于6个月以后是不是还在,这个大概率还在。个人创作和传播都要被记录,甭管我是自己生成了文字、图片还是视频,这个是要被记录下来的。然后我抄别人的,搬运别人的,这个内容也是会被记录的。传播平台保留并凸显标识,就如果上面是有标识的,我一定要在这个传播平台上再标注一下。
发现篡改标识的、标识可疑内容的,要记录日志。万一以后这个政府过来找我了,我就马上去把这个日志提交出来。这谁谁干的,跟我没关系。每一个内容都可以追责到生成的个人、平台,以及传播的个人和平台。一条完整的内容生成和传播链就都在可控范围内了。而这个是我们一般制定各种规则的一个核心目标吧。这个呢,也是为了告诉每个生成内容、发布内容的个人和平台:老大哥在看着你,你们要自己稍微小心一点。
我记得去年还是前年,所有社交媒体要标注你的所在地。你的IP地址会告诉你,你是在南京发的,是在杭州发的,还是在哪儿发的。标注上去以后,大家马上就变得收敛很多了。就不可以在社交平台上随便去胡说八道了,因为大家知道了,说:“哎,老大哥看着你。”老大哥其实原来也看着你,只是呢,现在要求你在身上挂一标签,说我正在被老大哥看着。那么这个大家还是会稍微小心一些的。那么会有什么结果呢?办法出来了,9月1号以后,是不是清朗行动就成功了?就没有人出来骂人了?其实挺难的,为什么呢?因为第一个文字内容只能靠自觉。你说我AI生成的文字,这个是没有地儿去打任何标记的。这种标记你可以随手就改掉了,我稍微人再润色一下就没有了。而且就算是在后台有日志,他也只能是记录是某人某年某月生成了一个什么文字。至于这个文字再出去传播的时候,你是不是进行了修改和运作,去去一些AI的这个信息,他是不知道的。他没法去处理这个问题。所以所有文字内容的追踪基本上都是没有可能的。而且文字内容的生成是所有AI生成内容里的数量最大的,压根没地方标注。
那么图片、视频跟音频呢?这个也挺难的。为什么?因为大量是使用国外的模型。比如说我用stable diffusion,我用这个Flux,我用Midjourney,我用达利,这种生成出来内容上的都是没有水印的。所以这个你是没有办法限制的。大量的开源模型也在流行,在这个过程中你怎么去处理?你是没有办法要求这些开源模型去给你生成水印,或者给你去打标签。这事都是没戏。你比如说阿里刚刚发的视频生成大模型,他那种模型是直接可以在显卡上跑的。你把提示词放进去,他就直接出这个视频了。这个过程中是没有水印的。那你怎么办?你是没有办法的。所以生成过程根本是无法限制。至于说这个传播平台呢,现在肯定是重点了。和过往管理社交媒体平台的方式是没有区别的。我们就是看你们上面平台上的内容,甭管是不是AI生成的,只要我不喜欢了。
我就上来管你,并不是说一定是AI生成的就怎么样,或者说我这个是AI生成的,所以不需要承担责任。没有那个,你只要在社交媒体平台上放这张图片了,甭管是不是AI生成的,你该负责任还是要负。所以呢,应该不会跟以前有特别大的变化。
另外是什么?国内有人管,出去了就没人管了。咱们刚才讲了,我们可以用国外的模型生成的内容在国内放,上头没有标记。那现在我还可以用国内生成的内容放到国外去,国外也没有要求说我一定要有标记。这个事情就完完全全的失控了。现在中国人正在批量的生产AI小说、漫画、绘本、短剧,AI数字人,AI直播带货,这些内容行销全球。义乌一帮的AI直播室,现在在用全世界各种各样的语言进行直播。那你在这个过程中到底有没有人管?没有人管,我们就放心大胆的往外输出就好了。所以呢,这又是一个普遍违法、选择执法的过程。
虽然它叫办法吧,但是呢,各级政府应该还是会在需要的时候去执行的。为什么我们经常搞这种普遍违法、选择执法呢?因为我们经常会制定一些高到无法执行的标准,然后呢,根据需求选择执行。如果出了大事,再进行集中的运动式严打,运动过去了恢复原状。标准太高,执行成本和效率其实是完全无法满足的。就是刚才我们讲的这一整套的规范,是很难实现的,因为从技术上,从生态上,都很难实现。但是标准在那儿,所以呢,这也会导致双标。
一方面地方保护主义发展经济,其他一些影响因素也在不断的拉拉扯扯。有人冲上去说,你这个怎么可以有不标识的内容就出来了?下边人就说,这是我们市最重点的AI企业了,你不能去碰它。经常会有这样的故事出来,而且符合时代要求,宣扬主旋律的,是不是AI生成的,其实都不重要。有问题的,伤害了什么别人感情的,可能就由更多的人去担负责任。这个就是这一次的这个办法发布,最终能够影响的。
原来可能只是说我找到这个人了,找到这个传播源头,找到传播者,找到传播平台,我们把它处罚一下就完事了。现在呢,我们可以从最上头的这个生成平台,你能生成这样的内容,当时的提示词是什么呀?他前后都问了什么事了呀?这些东西都可以根据日志直接给你拎出来。那么生成的人,传播的人,传播的平台,生成的平台,等于在这个里头一起都可以承担责任。内容生成和传播的成本呢,应该会有所上升吧。这就是这一次发布的这个文件所带来的结果。
当然,你说我就是不想受你这个管,怎么办?我在国内生成内容,或者是在自己的服务器上生成内容。
我在国外传播,不去不就完事了吗?所以你看我生成的Midjourney的封面,各种的这个抠图背景,我这上头也没有标记,就到YouTube上来传播了。YouTube不管我,也就如此了。是不是9月1号以后,这个东西在国内传播可能就会有问题了?咱们就不要把老范的内容传到国内去。
好,这一期呢,咱们就讲到这里。感谢大家收听,请帮忙点赞、点小铃铛,参加discord讨论群,也欢迎有兴趣、有能力的朋友加入我们的付费频道。再见!