硕鼠的博客站

范路的博客主站,时而会发些东西。

四个部门六条举措,要去整治算法乱象了。大家好,这里是老范讲故事的YouTube频道。首先,我们来讲一下基本事实:时间是2024年11月24号发文,这很神奇,礼拜天发的文,讲的是即日起至2025年2月14日截止。这个非常有意思,它是有起止时间的。四个部门:网信办、公安部、工信部、市场监督总局。但是大家要注意,他们这一次使用的全称是什么?是中央网络安全和信息委员会办公室秘书局、工业和信息化部办公厅、公安部办公厅、国家市场监督管理总局办公厅。为什么要重新念一下这个事?要注意,这个四部门跟四部委是有差异的,现在都是由各部委的办公厅发出来的文,所以叫四部门。那么文件叫什么?叫《关于开展清朗网络平台算法典型问题治理专项行动的通知》,这是它完整的名称。在礼拜天发了文件,说我们到明年的2月14号之前,我们集中整治。

那么这六个举措是什么呢?信息茧房、热搜榜单、新就业形式劳动者权益、大数据杀熟、算法向上向善、落实算法安全主体责任。这是这六个措施。咱们一项一项的解读一下。

首先是信息茧房,深入整治信息茧房诱导沉迷问题,构建信息茧房的防范机制,提升推送内容多样性、丰富性,严禁推送高度同质化内容,诱导用户沉迷。这句话说得很长,意思是什么?咱们的算法首先去判断你喜欢什么,再去给你推送,让你继续看下去。算法的设计指标是什么?就是你不退出,你要一直看下去。那么在这样的一个情况下,会去给你尽量推同质的东西,就是你喜欢的东西我接着给你推。但是同时,这种推荐算法其实还有一个小的分支叫新鲜感。如果始终推同样的东西,那么你就没有新鲜感。所以他每过一段时间,会去尝试给你推一些新的东西出来。这一条其实把它放在文件里,主要讲的是防沉迷。

然后是说,不得强制要求用户选择兴趣标签,不得将违法和不良信息记入用户标签,并据此推送信息。这两句话什么意思?因为我们现在使用很多的软件,特别像小红书,还有很多的,比如说阅读类软件,包括今日头条。

这些软件你第一次使用的时候,都问你兴趣爱好是什么。他好去给你一个基本的画像,然后根据这些信息向你推送。说这个事以后不允许了,都去改去。然后呢,什么叫违法不良信息记入用户标签,并以此进行推送呢?比如说,有些人说:“我就爱看小姐姐扭屁股。”他把这个东西记到里头去了以后,我就始终给你推荐这些东西。或者说我就喜欢看一些,比如一些血腥暴力的东西,那他也给你记在标签里头去,始终给你推这一类信息出来。

在这个里头,其实是有一些擦边的东西,或者说他没有那么明确说这个东西一定是违规的,或者一定是合规的,但是一定是贴近违规那一边。是否违规这个事是一个梯度的,那么越是贴近违规的那边的东西,其实大家越爱看。所以这个都是明令禁止,不得超范围收集用户个人信息,用于内容推送。这个到底什么叫超范围,并没有详细解释。

然后,要规范设置不感兴趣等副反馈功能。有些系统他是没有这种副反馈功能的。我不喜欢这东西,其实像我很喜欢刷抖音,也很喜欢看今日头条。前提是什么?你一旦遇到不喜欢的东西,一定要马上告诉他不喜欢,否则这个系统就会变得越来越难用。你只有是比较多的去点不感兴趣举报。为什么举报?因为里头有一些你不喜欢的这种内容,它又诱导你去点。

那么在这个时候就举报他,比如说经常有人去今日头条上或者在抖音上刷什么呢?如何在iPhone上设置NFC门禁卡?其实iPhone是设不了这东西的,直到目前为止,苹果依然没有开放NFC门禁卡这些东西。但是有很多人专门去做这种假视频,因为这个很吸引流量。而且iPhone用户点了这些视频以后,他后边的变现能力会上升的,因为iPhone用户的购买力强嘛。我每次遇到这种内容,它等于明显有欺诈性内容,我都会去举报,说这个是骗人的。

那么这是信息茧房。下一个是什么?下一个是热搜榜单,要提升榜单透明度,打击操纵榜单的行为。现在他也知道说大家想去被别人看到,最好的方式就是冲热搜榜单。

因为有很多人说最近什么流行啊,我要去看一看榜单。现在一定要有更强的监管和控制了。咱们现在打开今日头条,咱们自己去看看今日头条前三条到底是什么。任何人打开今日头条的前三条,永远是一样东西。自己去看去,这个就是要有更强的可控性了。

当然,冠冕堂皇的话还是要说了:全面公示热搜榜单的算法原理,提升榜单透明度和可解释性,完善榜单日志留存,提高榜单算法原理可验证性。什么东西冲上热榜了?因为现在很多的政府跟民众之间的一些冲突与矛盾,会很容易上到热榜上去。现在你就必须要给我解释为什么上去了。如果你解释不清楚,这个锅你就要去背。你不能说莫名其妙就上去了,这事是不行的。这一定要可以控制。

所以这句话基本上大家可以认为是在说反话就好了。能够上榜单的,一定是可控制的。至于什么公开、什么透明、什么这种可解释,这个都不用想。这里头唯一有用的叫留存日志啊,这个到底怎么上去,你要把日志留下来,到时候我们来解释一下为什么某地政府发生了一个什么事情,就榜单就冲上去了。你得给我解释清楚。

还有一条是什么?就是要健全水军刷榜、水军账号等违规行为,账号检测识别技术手段,严管不法分子恶意利用榜单排序规则,操纵榜单炒作热点的行为。你不是说有一些政府事件跑到榜单前面去了吗?那么这个锅谁来背呢?水军来背。出了问题一定是他们恶意刷榜,咱们普通民众一定是相信政府的。出现任何问题,都不会把他刷到榜单前面去的。一旦刷到前面去了,那么一定是有坏人。

所以这件事我们还是要认真的识别。这个是前两条。第三条叫新就业形式劳动者权益。这个讲的是什么?只要是外卖小哥、滴滴司机这些人,其实是靠算法来管理的。你到哪去派单,一单要多长时间跑完,你的全勤是什么样人,还有多少投诉,他们完全生活在算法的世界里面。现在要求防范盲目追求利益,损害新就业形态劳动者权益。你说我要快、要准时拿,不能有人投诉,像这些东西,现在要去进行一定的管控了。

严防一味压缩配送时间,导致配送超时率、交通违章率、事故发生率上升等问题。你说我就要求配送时间了,那么剩下这些东西你也得管。我们必须把所有这些都搁在一起管理,而且要求详细公示时间预估、费用计算、线路规划等算法规则。你就得算明白,说这一单到底应该多长时间到。你不能给人家一个“mission impossible”,是无法达到的。这种东西你天天发出去,这个事是不允许的。你一定要搞清楚,预期你10分钟到,那么为什么你预期是10分钟,这个事你是要公示的。

还有一条特别有意思,叫搭建畅通的申诉渠道。因为无论是外卖小哥也好,还是滴滴司机、货拉拉司机也好,他们其实是弱势群体。他们站在平台面前,基本上没有能力去挑战平台或者要求任何权利。他们没有这个能力,而且他们的所有投诉,平台也不太愿意管。在这样的情况下,这些人又是相对不那么稳定的因素,所以要求平台必须要有畅通的申诉渠道。

在这里跟大家讲一个最近刚发生的事情,就是保时捷事件。保时捷事件是什么?应该也是在这周日,11月24号左右,保时捷上海浦东的一个展厅做了一个展览。展完了以后叫了一辆货拉拉的车,说你帮我把某一个展品或者某一些参展用品送回到某个广告公司或者咨询公司。这个货拉拉的司机说行,但是我只管送货,我是不管搬东西的。这个保时捷的员工说,你还是给我搬一下呗,咱们商量商量,我给你600块钱,你帮我把这东西从这头搬到车上,再从那头下了车后帮我搬到这个楼上去,行不行啊?

这个司机想了想说,那行。说你先给钱吧。他说不,万一给你钱到那边你不搬了怎么办?后给钱。我跟他说好,这个钱还是要付的。司机就把这个货搬到车上去了。到了那头以后,把这个货给人卸好了,说你给钱,你应该给我600块钱。大家要知道,货拉拉的钱其实跟滴滴的钱是一样的,大家是在平台上交易的,跟司机之间。

正常情况下是不发生任何的现金交易,或者叫线下交易。他也不应该发生这件事情。现在收货的人一看货,反正已经到了,那看看是不是可以把600块钱赖掉,就上演了一出闹剧。说我要跟这个货拉拉去核实这个事情,我要向货拉拉投诉你,你单独找我收钱,在这个货拉拉订单之外找我收钱了啊。最后导致投诉到了货拉拉,货拉拉把这个司机的账号封了。这个司机就很生气,他说我有病,我要去做肾透析,我就是靠拉货拉拉的钱来这个救命的。你现在不但答应好的钱不给我,你欺负我,还举报我,让我封号,这个事情我没法活了,你要杀了我。

这个事情现在发酵了两天了,所有人都讲说保时捷多大个牌子,你在中国就搞这种事。你这一个甭管是广告公司也好,还是咨询公司也好,一帮白领,你去欺负一个司机,然后不给人600块钱,这到底怎么回事?其实很多人在想这个事,但是有没有人想过这个问题?其实这里边最坏的人是货拉拉平台。他通过一个算法,把这个司机绑定在这里头。大家想明白了没有,货拉拉为什么会制定这种规则?规则其实很简单,就是如果每一个司机都可以去跟用户去沟通,去进行线下的交易,那么货拉拉所提供的服务质量实际上在下降。

什么意思?我们每一个人去使用货拉拉的时候,希望是可以得到一个有保障的服务,符合标准的服务。而且我在获得服务之前,我首先需要知道我需要支付多少钱。所以一定是到货拉拉点说我有多少东西要送,从哪送到哪,给你一个价格,这就是我的预期。我不希望在这个预期之外有任何的支付,这个是服务质量的一个基本保障。货拉拉为了保证服务质量,就一定要尽可能的杜绝什么线下直接交易,在货拉拉交易金额之外再去要钱,这个是货拉拉绝对要去禁止的。

所以只要是被举报了,那么货拉拉肯定是封号,这没什么好说的。人家收货方把这东西搬上来以后,也是威胁这个司机,说你收600块钱有依据没有,是不是跟前面说好了。他不管他说我要,货拉拉给我一个说法,货拉拉觉得这个钱是合理的。

那我就给你这个钱。那货拉拉一看,说你居然敢在线下找人收钱,他肯定封你没商量,一定是这样的。现在货拉拉发现这个声音已经起来了,马上又出来辟谣:我没封号,我也没有不给他派单,这个都是没有问题的。但是大家要想清楚一个问题是什么?对于司机来说,他的单多还是单少,他其实是没法控制的,而算法对于他来说是个黑匣子。

货拉拉需要的很简单:我要维持我的服务符合标准,没有任何一个司机在我的服务平台之外去跟这个客户进行线下交易,在我的标准收费之外进行额外的这种索要费用。因为你一旦进行额外索要费用,你这个服务水平就下降了。大家可能下一次就不敢叫货拉拉了。

比如我去叫货拉拉,说好了这个1,000块钱给我拉走,结果到那边人家又在这时候要一笔钱,那我下回可能就换一个去弄,或者我去想一些什么其他办法,一定是这样的。那你说,货拉拉能不能把这个系统做在里头,说如果搬货了,我就单独有一个新的费用出来,是不是可以?这样货拉拉是不会干这个事的,因为第一个有这种需求的人,有一部分没有那么多,因为有些人是自己有装卸能力的,还有一些人的这个东西本身并没有那么大件。

第二个你也没有标准,这个到底是装多少货、爬多少楼应该是怎么去收钱。而且装货的过程其实还有一个很麻烦的事情:你有破损,你给人把东西碰了磕了,这怎么算?没法算。所以货拉拉为了服务统一,说我们这块就不算了,所有司机你到那就别搬就完事了。如果是有搬运了,那咱们再说啊,但是你不能在平台上明面上说我们又多了一笔费用,这事是不允许的。

对于司机来说,他就说我在开了手机以后抢不到单了,这个我就被平台歧视了。甭管滴滴司机还是货拉拉司机,或者是这些跑外卖的人来说,他们都会有这样的对平台面对算法的无力感。他们都说好像受到处罚了,又好像没有,也没有明文规定,只是我觉得最近很倒霉,接到的单都很不好,或者我就抢不到单了。他们经常会有这种事情,甚至有些人说,这个人为什么抢的单都是那么好?他总能抢到最好的单,我为什么总抢不到?这个事情对于他们来说是完全无解的。所以这块也是要增强管理。再往后是避免大数据杀熟,这个是老生常谈了。因为这个算法一方面是要促成交易,另外一方面是要促成尽可能高消费额的这种交易。同样的一个人,明明可以买更贵的这个商品,为什么会给他推荐便宜的?当然,所谓的大数据杀熟,并不是说你这个人平时消费能力高,就给你推荐比较贵的商品,不是这个意思。

大数据杀熟的意思是,两个人都到一个平台上消费,一个人消费能力高,一个人消费能力低,买同样的商品,消费能力高的人用更多的钱,这个叫大数据杀熟。其实现在的大数据杀熟更多用在另外一个地方。你比如说你去买一个套餐,或者买一个团购券,你看了是一个价格,在这个时候你把它退了以后,待一会儿他会再重新向你推荐,再给你一个券,让这个价格下来一点。意思是什么?你还是得把这个交易做了。

在这个过程中,其实我们可以通过大数据反向杀熟杀回去。但是现在要求同样的年龄、职业、消费能力的情况下,相同的商品你必须是同样的价格,那你不能给他改。但是现在的大数据杀熟很多,我们都是通过用户的一些行为去把这个价格进行一定的调整。

再往后叫算法向上向善,这是第五条了。什么意思?这个很有意思。他讲的是要增强算法向上向善服务,保证网民的合法利益,这个要持续优化,完善未成年人、老年人的算法推荐的服务,便利未成年人、老年人获得有益于身心健康的信息。那么什么叫有益于身心健康的信息?这个没有规定,这就是一个道德要求了。

建立健全算法,在赋能优质内容传播、违法行为识别、发现等方面的社会治理应用,要把这个事情做好。总之,我们还是要去宣扬社会主义核心价值观,讲好中国故事,这些东西多给老年人看,多给年轻人看。那些举行暴力、有荷尔蒙诱导的,咱就别给人看了。大概是这么个意思。要持续提升生成合成信息检测识别能力,及时发现处理违法违规。

生成合成信息这块就是数字人,这是对他的一些管控。你们要去注意,因为最近是余东来又被合成数字人出来骂人来了。十一期间,是把雷军合成了数字人出来骂人,这次是把余东来合成出来骂人。但是余东来这个难度还稍微大一点,为什么?他得说河南话。这个雷军其实基本上说的还是普通话。我看了几个余东来骂人的这个视频,还是挺惟妙惟肖的。现在胖东来他们已经开始起诉了,要把这些人抓起来,这个我觉得还是应该的。

最后第六条是什么?落实算法安全主体责任,这个就是出了事打谁的板子,谁运营这个算法就打谁的板子。其实就是平台你们要小心点,字节跳动你要小心一点,腾讯你要小心一点。另外,美团、滴滴什么这些人你们要注意一些。所以它这个里头讲的叫落实算法安全主体责任,健全算法机制机理的整合。你们谁上这种算法,算法更新了你要上,我这来审批一下。

数据安全管理制度和技术措施,这块也要单独强调,以及确保算法的训练数据具有合法来源啊。这块是专门针对最近的大模型AIGC这块讲的。前面其实主要讲的不是AIGC的东西,前面只能有一条是跟AIGC相关的,就是生成数据这块是跟AIGC相关的。传统的这种推荐算法,其实跟AIGC没什么关系,但是训练新模型这块是有关的。

这四个部门发了这6条内容出来,那么为什么是现在要发这东西?咱们总要问一下,你现在有什么不一样的时候?第一个,钟睒睒刚喊了“算法之恶是大恶”,因为他说大家都网爆钟睒睒。你们这些网爆我的人跟我一样,都是受害者,你们都是钟睒睒。那么在这个过程中谁是坏人?是算法。你们把这些片面的信息传给了这些网爆我的人,导致他们来网爆我。这个事是钟睒睒刚喊的,虽然是首富,但是他喊,这四个部门马上就发文,这个也有点过分了。

中国不是这么运作的,毕竟还有一些事情。第一个是什么叫实名举报之风盛行,动不动就举个身份证去举报,这个肯定还是要杀一杀了。如果你实名举报完了以后,这些信息……

慢慢地,在推荐算法里边沉淀掉了,不会被很多人关注。那么实名举报就不会产生那么大的效果,这个是肯定要去处理的。第二个,余东来跟雷军被恶意生成数字人,这个也给领导们拉响了警钟。现在只是做他们两个,万一哪一天真的有胆大包天的人,把一些中央领导,我估计他们不一定敢做,但是一些地方领导给你做出来,放了一下,这个对于他们的伤害力还是很大的,所以这个也要专门拿出来说一下。

有一些社会事件,莫名其妙地被传播了以后,造成了一些不稳定的因素,比如说郑州骑行开封的事件,明显是算法出了问题,算法失控了。你原来就是几个大学生,从郑州骑到开封去,吃了个汤包,发了个小红书,这些内容快速膨胀爆发了,形成了一些链式反应,就跟核反应似的,一下就爆炸了。爆炸完了以后,几万个郑州的大学生就骑着自行车奔开封去了。这个事情以后就不能再发生了,要敲响警钟。

还有什么?各种的献忠事件最近频发,开车撞人了,或者是其他的一些什么砍人,这种事情,这个也是要专门注意的。像前面讲的,给新形势就业者保护他们的劳动权益,就是什么保护滴滴司机,保护外卖员,保护这个货拉拉司机,基本上是为这条讲的。就像刚才我们讲的保时捷事件里的这位司机,身上有尿毒症,要去做透析,就指望挣这点钱去做透析呢。你说我举报你,给你把号封了,在这样的情况下他还开个车,这样多吓人,所以这个要注意。

还有什么?一些不那么好看的信息被广泛传播,平台也不是很听招呼了。比如说最近广东潮州的集体停业事件,以及各地的禁摩禁电动车,实际上,这都属于是社会矛盾的突然爆发。特别是前面这个广东潮州的事情,说我们现在要检查一下大家的消防,所有的市面上的人就都闭市了,这个怎么可以?而且就算是你闭市了,这个东西你不能传播。你不能每天在抖音上、在快手上、在各种平台上去刷广东潮州的事情,这个太难看了。所有的推荐算法和平台,你们要处理这个事情,各地现在又在新搞禁摩、禁电动车的事情。

这个事情其实跟上一条也是有关系的。什么?就是外卖员。你想,外卖员都是骑电动自行车的,他们的电动自行车如果不超标,根本就送不到。他必须是超重、超速了以后,那个车才有可能在美团的系统内把这个订单跑到。结果现在警察天天在街上逮你,这个车有问题,我一定要把你扣下来。那就会有人在边上摔头盔大哭,说我完蛋了,我又迟到了,我又被扣钱了。他这个事他就要去解决,这个问题。

还有一个什么原因?最近突然要下这样的一个文件。中国一直在努力加入一个组织,叫全面与进步跨太平洋伙伴关系协定,叫CPTPP的这样的一个组织。咱们已经连续申报了好几年,都没有通过。今年又去申报去了,今年未必能通过。咱们看看11月27号在加拿大温哥华开会来审议啊。这一次主要是讨论中国、台湾、厄瓜多尔、乌拉圭等国家和地区的入会申请。那么CPTPP对于信息流动是有专门要求的,如果不符合这个要求,人家是不允许你加入的。咱们肯定是在这个之前,要先敲打敲打这些平台,你们要注意一下,看看后边怎么去处理相关的问题。那么肯定也在折腾关于CPTPP的事情。明后天咱们再专门做一条来讲一讲。

这些原因凑在一起,导致现在要发这个文。那你说这个文下来以后会有效果吗?咱们一开始就讲了,这是一个有起止日期的活动,这种活动一般我们叫运动,哪天开始到哪天结束。一堆描述性的表述,没有具体的量化标准,没有具体详细的奖惩条款,真正有用的东西其实根本就没有。真正有用的是什么?对于算法伤害诉讼的这种严厉判例,这个东西是真正有用的。比如说,我是一个外卖员,他因为我超时,或者说用了一些不合理的时间约定让我去超时,扣了我的钱了,我去告他,告美团,给美团判了一个比如罚款多少钱,就对我进行赔偿。要很多这样的判例出来以后,这个才会真正有效果。其他其实都是没用的。但是你说一点效果没有,那这个事肯定也不至于。因为中国政府一般做事情,还是会有一定效果的。它的效果会是什么?

第一,平台方还是要知道一下谁是老大。你们不能自己放飞了。政府跟民众之间发生的一些事情,到底应该怎么报道,你自己心里要有个数。第二个,你自己有点小心思,这事没人管你。你比如说,我们希望利用算法实现垄断竞争,这个事其实还没什么人去理你的,但老大的眼色还是要看好的。

有一些地方政府消息压不下去了,比如说广东潮州这种事情。你以为潮州相关的部门,他们希望这些信息被流通吗?他们难道没有去打招呼,没有去问人吗?肯定都动了。但是现在平台没有理他。以后再出现类似这个事情,那么这个信息到底怎么去处理,平台心里还是应该有数的。

好,这就是我们今天要讲的四个部门,六条措施进行算法整治的故事。感谢大家收听,请帮忙点赞,点小铃铛,参加Discord讨论群。也欢迎有兴趣、有能力的朋友加入我们的付费频道。再见。

 

Both comments and pings are currently closed.

Comments are closed.

Close Bitnami banner
Bitnami