硕鼠的博客站

范路的博客主站,时而会发些东西。

Posts Tagged ‘数据泄露’

ByteDance的AI大模型被他们自己家的实习生投毒。这是一个什么故事?大家好,这里是老范讲故事的YouTube频道。今天咱们来讲一讲这起投毒事件。不是说举个小药瓶去投毒,而是恶意代码投毒。

事情发生在6月份,一位姓田的博士生在ByteDance实习。因为某些待遇或者资源分配问题,他对ByteDance感觉不满,于是就在代码里面进行了投毒。投毒的方式是他自己进行了一些代码维护,但这些代码是安全的,主要是一些调试用的代码。这些代码去读取一些上传文件之后,就具备了攻击性。

什么意思呢?就是我们去训练大模型的时候,需要把大量的信息数据上传到大模型进行训练。他的这种调试代码上传到服务器上以后,这个时候还是安全的,然后把一些恶意代码隐藏在训练数据里边。他把这些数据读出来以后,就对整个ByteDance的一些训练集群进行了攻击。这其实是黑客普遍采用的一些手段。

Read More…

外国人已经跑到中国来绘制地图了,这个非法测绘案到底是怎么回事?

大家好,这里是老范讲故事YouTube频道。

今天咱们来讲一讲最近传出的非法测绘案。事情是在10月17号传出来的,央视网消息,非法测绘案A公司为某国重点敏感项目承包商,没有中国境内的测绘资质,以研发无人驾驶汽车为由进行了多次转包。而B公司就是最后接单的公司,具有中国境内测绘资质,包到了这个业务,然后在国内多个省份进行测绘,购入了多辆汽车,并加装高精度雷达、GPS以及光学镜头等设备,企图提高测绘效率,降低被主管部门发现的风险。数据完全由A公司来管理,也就是境外的公司来管理,造成了泄密。

现在要求群众,如果发现可疑人员、设备、车辆在敏感地区开展非法测绘活动,应该及时通过拨打12339举报电话来进行举报。那么什么叫非法测绘?指的是违反国家法律法规,在未经授权或者超出授权范围的情况下进行的测绘活动。

Read More…

网文作者向AIGC发起了反击。中国最大的网文平台番茄小说,因为在协议里要求网文作者授权他们使用作品进行大模型训练,导致这些作家纷纷退网,纷纷停更,向他们正式发起了反击。

大家好,这里是老范讲故事的YouTube频道。今天咱们来讲一讲番茄小说的AI附加条款到底是怎么回事。上面写了,任何作者到任何的小说平台上去写小说,都是要跟人家签协议的。说我在你这里写小说,遵守你的规则,你给我分钱。

番茄小说的协议里头呢,就突然多了一个条款,这个条款呢叫做AI附加条款。条款怎么写的?甲方可将签约作品的全部部分内容以及相关信息,包括作品名称、简介、大纲、章节、人物、作者个人信息、封面等数据语料、文本素材等,用于标注合成数据数据库建设、AI人工智能研发、机器学习模型训练、深度合成算法研发等目前已知或未来开发的新技术研发应用领域,包括但不限于:一、用于智能对话、智能文本、图像、视听语音等作品成品的编辑生成转换、深度合成、虚拟现实技术等再研发和应用;二、用于任何技术下的AI人工智能模型训练,或用于生成提供给模型训练的合成数据数据库;三、其他任何新技术研发或应用场景。

Read More…

GPT5如果再不出的话,可能就没有机会了。大家好,这里是老范讲故事的YOUT5频道。今天咱们来讲一讲OpenAI现在身上的压力到底有多大。再不出GPT5,可能真的要出事儿了,因为前面吹过的牛实在太多了,特别是Sola这样的模型,号称可以直接生成长的视频出来,到现在已经半年了,还没有真正拿出来,只是每个月放出几个视频而已。而其他各个公司,按照Sora方向做的产品,已经都开始在公众测试了,这对他们来说一定是巨大的压力。

前一段时间发布的Aceropic Claude 3.5 Sonnet,也把压力给到了OpenAI,因为这个模型的效果已经非常好,而且极其便宜。更不要说昨天刚刚发布的LlamaB这样的一个开源模型。前面咱们讲的Aceropic的模型还是闭源的,而Llama可是个开源模型。405B的话,在各个层次上,都赶超了OpenAI的Chat GPT-4。老大的位置有可能会丧失。

Read More…
Close Bitnami banner
Bitnami