AI生成内容戴上紧箍咒:四部门新规如何从雷军骂人视频到全网追责?

AI生成内容戴上紧箍咒:四部门新规如何从雷军骂人视频到全网追责?已关闭评论

国家发文件了,以后AI生成的内容再也不可以“裸奔”了,必须要进行标注。这到底是一个什么样的事情?大家好,欢迎收听老范讲故事的YouTube频道。

今年两会期间,雷军讲了个冷笑话。什么样的冷笑话呢?说去年十一放假7天,大家在家里头被雷军骂了8天。什么意思呢?很多人用雷军的形象和声音,生成了数字人的骂人视频。十一期间,法务部都放假了,但是大家又在家里没事干,刷短视频刷到的都是雷军四处骂人,骂了友商,社会事情全都骂了一遍。

雷军呢,一开始说:“我觉得骂就骂吧,我也贡献出形象来,让大家去娱乐一下也没什么。”骂了几天以后呢,觉得不对劲了:“你天天拿我的脸,拿我的声音出去骂人,这个受不了,所以还是要管一管。”

雷军呢,有两个很重要的提案。一个呢是改这绿牌儿,他觉得这个新能源车的绿牌儿实在太难看了:“我造了50多万的小米速汽Ultra,这么漂亮的车,你给我挂这么恶心的牌子上去,实在太难看了,咱们能不能改一改?”另外一个呢就是要管理AI生成内容,不能再发生这种国庆放7天假,被雷军骂8天这种事情。

雷军呢,也算是一个受害者。这个事情发生了以后呢,政府就发文了。大家注意,人大是立法的,政府只能发文。3月14号,国家网信办、工信部、公安部、广电总局联合发文《人工智能生成合成内容标识办法》,要求从9月1号起,所有利用AI生成的文字、图片、视频、音频等内容必须添加标识,违者面临法律追责。

发了这么一个文件,那么要求怎么标识呢?第一,文本必须在起始和结尾添加文字提示,开头写一个“我这是AI生成的”,结尾写一个“我到这里结束,AI生成的”。大家要干这样的事情。图片要在显著位置标注,这个图片上应该是有一个水印,像我现在比如用即梦生成的图片,右下角就有一个水印是“即梦生成”。然后音频中要插入特定的音节和语音,如果你再生成雷军骂人的,那开始的时候一定要说“这是AI生成的”,结尾的时候再说一句什么事情。虚拟场景起始画面要添加标识,视频需要在起始画面、播放界面设置标识。

这个事情我是很支持的。为什么?最近被骗了好多,一上来看阿凡达3预告片,赶快点进去看,结果发现是阿凡达1、阿凡达2的视频剪辑了一个片段下来以后,再加上一点点AI生成的这种过程,就告诉你是阿凡达3的预告片了。我最近是被这种视频骗了好几次。

还要求什么呢?在所有生成内容文件的原数据中,必须嵌入隐式标识,包括生成内容的属性、服务提供者的编号、内容编号等信息。这句话什么意思?大家注意我们看到的图片。

听到的音频,还有视频,这些呢都是存在文件里的一个图片文件。在这个图片文件里头呢,分两部分。后边这个具体图片文件的信息,他其实就是告诉你每个点是红的、绿的、蓝的,下一个点红的、绿的、蓝的,大概是一大堆这样的数据。前面呢,有一个叫文件头的地方,或者叫文件元数据的地方,metadata。这个里边原来写的是什么呢?我这个是什么格式的,是如何压缩的,横有多宽,竖有多高,用什么样的相机拍的,拍的时候呢,我的快门是多少,我的这个ISO是多少,我的这个光圈是多少。他有一大堆这样的信息写在里头。

现在要求你们必须把这个AI生成的信息也给我记在里头,而且是谁生成的这个要写在里头。你说我这是字节跳动即梦生成的,还是快手的可灵生成的,你要在上头有编号的。然后内容编号是什么意思?每一个内容要有唯一编号,要跟我们自己的账户关联起来。万一我们用这个东西生成了一些让人觉得不舒服的内容吧,他是可以找到个人的。咱们使用这种AI生成工具的时候,都是实名制的。所以一旦是把这个内容生成的编号记在metadata里了,你就逃不掉了,就知道这事是谁干的。张三李四某年某月某日,在快手的可灵平台上,生成了一张什么样的画,这个是可以追责的。

然后是支持服务提供者添加数字水印等技术形式的隐式标识,但非强制要求。这句话什么意思?大家注意前面我们讲到的,在图片上加一个数字水印,我们人是能看见的,可以通过人眼识别这个东西。你如果是在metadata里边去加一个初始数据的话,这些东西人眼虽然看不到,但是呢,你可以通过图片读取工具去把这个metadata读出来,你也可以看到。但一旦是添加了这种数字水印了,或者叫水纹这个东西呢,人眼看不着,你用其他的这种解读工具呢,也不是可以直接看到。他有需要一些很特殊的解读工具,他可以看到。他是通过一种加密的方式把一些信息写进去,但是这块呢就不强制要求了。这个确实对于普通的这个技术平台来说,是有一定难度的,或者说需要增加它的成本吧。

最后发布AI内容时,需要主动声明并添加标识,否则可以被判定为传播虚假信息。这个是给你定性了。因为在中国,传播虚假信息这件事情是很严重的。原来这个是由有些有关部门来定义什么是虚假信息的,现在他们给你加了一条,如果你传播AI内容的时候,没有标注是AI内容,就算是传播虚假信息。大家注意这个里头讲的是什么?是传播,不是生成。别人生成好了,我从那盗图把这图抓下来。

然后到另外一个这个地方去发去了。在这个过程中,我也得标识说这个东西是AI生成的。如果我在这个搬运的时候没有标识,也算是传播虚假信息。那么标识的目的是什么呢?就是让大家负起责任来。

用户申请无显示标识的时候,这个服务提供者可通过用户协议,明确用户的标识义务和使用责任后,提供不含显示标示内容,并依法留存相关日志不少于6个月。这句话什么意思呢?你比如说像即梦,我如果进去交钱去了,如果我订会员了,我就可以下载这个上头不带即梦水印的图片或者是视频下来。但是呢,一旦我干了这个事情了,极梦就会提醒我说:“你要注意你做的这个东西,我要留6个月的日志。万一被人逮着了,我在6个月之内都可以证明这事是你干的。”他是有这样的一个要求。

因为现在很多的AI生成平台都是这么去做的,说你免费的,我就把这个水印搁上,也顺手做个广告嘛。付费的我就可以把这个水印去掉了。他一般都是这么干的,但是也要告诉你,是去除了以后你也跑不掉,我这有日志呢。国家要查的时候,我依然会把你供出来的。

那么传播平台的责任也是很重的。若是发现隐式标识缺失,但是内容疑似AI生成的,需要添加提示并留存传播要素信息。什么意思呢?就是应该在原数据里头,图片呀,还是这个视频,就是这个文件头上,这个原数据里头,我应该标识上说这个是哪个平台生成的AI内容。但是这个玩意是可以擦除的,或者说我们可以通过一些图片转换的过程,是可以把它隐藏掉的。

到后边的传播平台里,比如说我现在AI生成了一张图片,然后我把里边这个数据给擦掉了,就是这个标签擦掉了。然后我把这个图片发到微博上去了,微博发现了以后,他要自己去判断这个东西是不是AI生成的。比如说这个小姐姐有6个手指头,这个一定是AI生成的。那么它要在旁边去标注一下,而且呢,要记入它的日志算:某人往我这个里头贴了张照片,像是AI生成的,但是呢他这个照片上又把这个标记擦掉了,这个是他要记录的。

中国呢,做各种的办法,永远是以追责为目的的。所以咱们看一看他这个里头,生成平台他有责任。第一个你要把标识打进去,然后要保留日志,6个月之内我还要去查。至于6个月以后是不是还在,这个大概率还在。个人创作和传播都要被记录,甭管我是自己生成了文字、图片还是视频,这个是要被记录下来的。然后我抄别人的,搬运别人的,这个内容也是会被记录的。传播平台保留并凸显标识,就如果上面是有标识的,我一定要在这个传播平台上再标注一下。

发现篡改标识的、标识可疑内容的,要记录日志。万一以后这个政府过来找我了,我就马上去把这个日志提交出来。这谁谁干的,跟我没关系。每一个内容都可以追责到生成的个人、平台,以及传播的个人和平台。一条完整的内容生成和传播链就都在可控范围内了。而这个是我们一般制定各种规则的一个核心目标吧。这个呢,也是为了告诉每个生成内容、发布内容的个人和平台:老大哥在看着你,你们要自己稍微小心一点。

我记得去年还是前年,所有社交媒体要标注你的所在地。你的IP地址会告诉你,你是在南京发的,是在杭州发的,还是在哪儿发的。标注上去以后,大家马上就变得收敛很多了。就不可以在社交平台上随便去胡说八道了,因为大家知道了,说:“哎,老大哥看着你。”老大哥其实原来也看着你,只是呢,现在要求你在身上挂一标签,说我正在被老大哥看着。那么这个大家还是会稍微小心一些的。那么会有什么结果呢?办法出来了,9月1号以后,是不是清朗行动就成功了?就没有人出来骂人了?其实挺难的,为什么呢?因为第一个文字内容只能靠自觉。你说我AI生成的文字,这个是没有地儿去打任何标记的。这种标记你可以随手就改掉了,我稍微人再润色一下就没有了。而且就算是在后台有日志,他也只能是记录是某人某年某月生成了一个什么文字。至于这个文字再出去传播的时候,你是不是进行了修改和运作,去去一些AI的这个信息,他是不知道的。他没法去处理这个问题。所以所有文字内容的追踪基本上都是没有可能的。而且文字内容的生成是所有AI生成内容里的数量最大的,压根没地方标注。

那么图片、视频跟音频呢?这个也挺难的。为什么?因为大量是使用国外的模型。比如说我用stable diffusion,我用这个Flux,我用Midjourney,我用达利,这种生成出来内容上的都是没有水印的。所以这个你是没有办法限制的。大量的开源模型也在流行,在这个过程中你怎么去处理?你是没有办法要求这些开源模型去给你生成水印,或者给你去打标签。这事都是没戏。你比如说阿里刚刚发的视频生成大模型,他那种模型是直接可以在显卡上跑的。你把提示词放进去,他就直接出这个视频了。这个过程中是没有水印的。那你怎么办?你是没有办法的。所以生成过程根本是无法限制。至于说这个传播平台呢,现在肯定是重点了。和过往管理社交媒体平台的方式是没有区别的。我们就是看你们上面平台上的内容,甭管是不是AI生成的,只要我不喜欢了。

我就上来管你,并不是说一定是AI生成的就怎么样,或者说我这个是AI生成的,所以不需要承担责任。没有那个,你只要在社交媒体平台上放这张图片了,甭管是不是AI生成的,你该负责任还是要负。所以呢,应该不会跟以前有特别大的变化。

另外是什么?国内有人管,出去了就没人管了。咱们刚才讲了,我们可以用国外的模型生成的内容在国内放,上头没有标记。那现在我还可以用国内生成的内容放到国外去,国外也没有要求说我一定要有标记。这个事情就完完全全的失控了。现在中国人正在批量的生产AI小说、漫画、绘本、短剧,AI数字人,AI直播带货,这些内容行销全球。义乌一帮的AI直播室,现在在用全世界各种各样的语言进行直播。那你在这个过程中到底有没有人管?没有人管,我们就放心大胆的往外输出就好了。所以呢,这又是一个普遍违法、选择执法的过程。

虽然它叫办法吧,但是呢,各级政府应该还是会在需要的时候去执行的。为什么我们经常搞这种普遍违法、选择执法呢?因为我们经常会制定一些高到无法执行的标准,然后呢,根据需求选择执行。如果出了大事,再进行集中的运动式严打,运动过去了恢复原状。标准太高,执行成本和效率其实是完全无法满足的。就是刚才我们讲的这一整套的规范,是很难实现的,因为从技术上,从生态上,都很难实现。但是标准在那儿,所以呢,这也会导致双标。

一方面地方保护主义发展经济,其他一些影响因素也在不断的拉拉扯扯。有人冲上去说,你这个怎么可以有不标识的内容就出来了?下边人就说,这是我们市最重点的AI企业了,你不能去碰它。经常会有这样的故事出来,而且符合时代要求,宣扬主旋律的,是不是AI生成的,其实都不重要。有问题的,伤害了什么别人感情的,可能就由更多的人去担负责任。这个就是这一次的这个办法发布,最终能够影响的。

原来可能只是说我找到这个人了,找到这个传播源头,找到传播者,找到传播平台,我们把它处罚一下就完事了。现在呢,我们可以从最上头的这个生成平台,你能生成这样的内容,当时的提示词是什么呀?他前后都问了什么事了呀?这些东西都可以根据日志直接给你拎出来。那么生成的人,传播的人,传播的平台,生成的平台,等于在这个里头一起都可以承担责任。内容生成和传播的成本呢,应该会有所上升吧。这就是这一次发布的这个文件所带来的结果。

当然,你说我就是不想受你这个管,怎么办?我在国内生成内容,或者是在自己的服务器上生成内容。

我在国外传播,不去不就完事了吗?所以你看我生成的Midjourney的封面,各种的这个抠图背景,我这上头也没有标记,就到YouTube上来传播了。YouTube不管我,也就如此了。是不是9月1号以后,这个东西在国内传播可能就会有问题了?咱们就不要把老范的内容传到国内去。

好,这一期呢,咱们就讲到这里。感谢大家收听,请帮忙点赞、点小铃铛,参加discord讨论群,也欢迎有兴趣、有能力的朋友加入我们的付费频道。再见!

Comments are closed.