一首诗竟让25款大模型集体“越狱”?成功率飙升8倍,谷歌Gemini Pro 100%沦陷|Adversarial Poetry、Jailbreak、LLM、AI Safety

一首诗竟让25款大模型集体“越狱”?成功率飙升8倍,谷歌Gemini Pro 100%沦陷|Adversarial Poetry、Jailbreak、LLM、AI Safety已关闭评论

想要让大模型越狱?试试给它写一首诗,很灵的

大家好,欢迎收听老范讲故事的YouTube频道

给大模型写诗,大模型就会罔顾安全围栏,把各种违规内容和盘托出。这让我想起以前李连杰演过的一部方世玉的电影,那个里边,方世玉他妈也是一个武功高手,但是呢,方世玉他爸是不会武功的,是一个文人,特别会写诗。武功高手方世玉他妈,只要是听到他爸爸写诗了,马上就浑身酸软,桃花眼就亮了。现在,大模型也跟你玩这套把戏了。

一篇奇葩的论文:《对抗性诗歌》

这东西不是我瞎编的,有人写了论文了,叫做《对抗性诗歌:作为大型语言模型中的通用单轮越狱方法》。这里头有几个关键词:

  • 诗歌
  • 单轮
  • 越狱

待会我们一个一个来去解释他们到底是怎么回事。

这么奇葩的研究,肯定不是一般二般的人能做出来的,这一定是一群文艺青年。意大利ICaro实验室,是罗马萨皮恩扎大学和Dex AI智库的合作项目,把它研究出来的。这个论文呢,是2025年11月19号上传到Archive,2025年11月28号开始有媒体报道。他们通过写诗的方式,让大模型输出违规内容,包括核武器制造的步骤、儿童性虐材料获取的方式、恶意软件编写的技巧。

More

90 分钟专访揭秘:Ilya 为何抛弃 OpenAI 路线,创办 SSI 公司半年估值从 50 亿飙到 320 亿?|Safe Superintelligence、Superintelligence

90 分钟专访揭秘:Ilya 为何抛弃 OpenAI 路线,创办 SSI 公司半年估值从 50 亿飙到 320 亿?|Safe Superintelligence、Superintelligence已关闭评论

伊利尔·苏斯克维的专访:他到底说了些什么?

大家好,欢迎收听老范讲故事的YouTube频道

伊列尔·苏斯克维,很多人说:“这哥们是谁?”就是和马斯克、山姆·奥特曼一起创建OpenAI那哥们。在2023年11月份,对山姆·奥特曼进行逼宫以后,休假了很长时间,然后从OpenAI离职的。这一位算是OpenAI的创始人吧,他离职了以后呢,自己闷头去做研究,好长时间没有他的声音了,现在突然出来接受了一次专访。

引言:AI界的科学家与当下的迷茫

首先要注意,这哥们不是一个工程师,他是一个科学家。工程师跟科学家之间还是有很大差异的。使用确定的技术、加大投入、获得可预期的结果,这是工程师干的活;研究不确定的方向,这是科学家干的事情。所以,他是一位科学家。

现在很多人都在讨论AI是不是有泡沫。现在距离走通“最后一步”还有一点点小的差距。到底什么叫“最后一步”?就是AI真正的落地,真正的开始改变很多东西,开始挣钱。这一步现在还是有一点点差距的。但是呢,很多人也在否认AI泡沫的存在。AI虽然没有走通最后一步,但是AI真的带来很多失业。“钱我没挣着,但是我真的把人的工作干掉了。”现在是大家都比较迷茫的一个时间点。

原来那些应该默默无闻做研究的科学家,就携带了巨大的光环跑出来说话了。本来这些科学家说的话呢,应该是在很小的圈子里边流传,但是现在大家看看李飞飞、杨乐坤,包括今天咱们讲的伊利尔说的这些话,也成为了大众讨论的话题。

核心观点一:科学研究与工程研发的转化

“科研现在需要相互转化了”,这就是这一次伊利尔访谈的一个核心观点。你说,科研科研不是一回事吗?不是,科学跟研究是两回事,它是分为“科学研究”和“工程研发”,它是两个不同的概念。

科学研究呢,是在发现方向。发现了方向以后,就可以堆钱、堆算力、堆数据,在各种行业里边进行测试,这个呢都叫工程研发。就像前面他们研究了半天,到底哪个算法是可以把这个大模型做出来的,最后发现Transformer算法是可以搞定的,发现方向了。到发现Transformer方法有效之前,都是在做科学研究。在Transformer出来以后,大家说:“咱们堆钱吧!”玩这个scaling law,就是直接往里头去堆算力、堆数据、堆这些东西了,这就开始玩工程研发了。这个都是确定的东西,我们只管往里堆钱就完了。

工程研发呢,有一个不可避免的问题,就是你万一站到了一个小山头上,朝任何一个方向走都是下坡。工程研发的时候,他也是会寻找更高的一个山头往上爬,但是你爬到一个最高的山头的时候,你就没法往前走了,因为你不知道应该往哪个方向走了。如果有一个离你很近的山头,你还可以去尝试的跳一跳;如果下一个山峰离你非常遥远的话,这个工程研发是没有办法去跨越鸿沟的。那么在这个时候就应该重新走回来,做科学研究了,重新去尝试那些现在不确定的方向。这就是这一次伊利尔访谈的一个核心观点。

所有的科学家最大的能力是不是科学?其实不是这样。所有的科学家,特别是成功的科学家,他们最大的能力是筹措经费和资金。特别是现在这个时间点,任何一项科学研究都是需要海量资金去堆砌的。现在已经不能说科学家坐在家里头,闭门造车多少年,最后研究出一个神奇的东西出来,现在已经过了那个时间点了。

More

这根本不是国家级间谍行动!Anthropic报告背后被忽视的真相:中国“灰产”正利用AI对全球科技公司进行专业表演|Anthropic AI China Cyberattack

这根本不是国家级间谍行动!Anthropic报告背后被忽视的真相:中国“灰产”正利用AI对全球科技公司进行专业表演|Anthropic AI China Cyberattack已关闭评论

Anthropic抓住中国间谍了吗?

大家好,欢迎收听老范讲故事的YouTube频道

Anthropic信誓旦旦的公告里边说抓到中国间谍了,但是里面很多细节非常的模糊不清。11月13号,Anthropic发了一个长文,叫《挫败首次披露的AI协助网络间谍活动》,认定幕后是一个中国国家支持的黑客组织,而且他认为幕后是中国国家级支持,是非常高置信度的一个事情。他给这个组织起了一个名字叫GTG1002。但是呢,这个组织的名字并不是现实世界中常用命名黑客组织的APT编号,而是一个叫GTG的一个编号。所以很多安全圈的人就对此提出了一些质疑,说你到底找没找到人。

具体这帮人干了些什么呢?造成了多大危害?只进行了描述,没有细节。当然这也可以理解了,很多这种安全事件都是不会描述细节的,因为描述细节以后容易造成模仿,也会让被伤害的人受到进一步的伤害。告诉你说谁家的信息被偷了,这个可能本身没什么大事的,一下就股价崩了,可能会出现这种事情。所以呢,一般都不会披露特别多的细节。

那么为什么认定这是中国国家支持的黑客组织呢?也许更多的来自于臆测,咱们后边一步一步分析。

More

马斯克震撼预言:2030年AI将超越全人类智慧!手机和APP将被淘汰,程序员和中层管理岗或最先消失|AI、Elon Musk、Future of Humanity、Technology、Society

马斯克震撼预言:2030年AI将超越全人类智慧!手机和APP将被淘汰,程序员和中层管理岗或最先消失|AI、Elon Musk、Future of Humanity、Technology、Society已关闭评论

马斯克3小时访谈深度解读:未来、AI与争议

大家好,欢迎收听老范讲故事的YouTube频道。今天我们来讲一讲马斯克3小时的访谈,以及各自的解读。

马斯克跟乔伊·罗根做了三个小时的访谈。他每过一段时间就跑去做访谈,这是一个非常著名的博客,每年应该做几次吧。这一次应该是美国时间10月31号。最近,大家都在解读这三个小时的访谈。这是一次无稿访谈,就是没有提前的稿件,没有提前的大纲,大家就上这儿来闲聊来了,所以真的是比较见性情的一次访谈。

为什么叫各自解读呢?马斯克是很有争议的,不同的媒体、不同的派系,会选择这个三个小时访谈里的一部分去进行解读。比如说左派呢,就更关注是未来的交互方式、AI会怎么发展、每一个人都可以有钱;而右派呢,则更关注的是觉醒主义病毒对于AI的污染和可能带来的危害。

咱们今天把马斯克讲的这些点稍微捋一捋,各派都是怎么解读的,以及老范自己是怎么解读的。老范讲故事嘛,总是要说一些自己的私货进来。首先要明确一点呢,就是马斯克讲的每一个点肯定都有一定的道理,人家是世界首富嘛,但是也不能说完全信,有些点其实我也不是那么认可。未来每个人都会有各自的预测,未来到底会变成什么样,只能靠大家的努力,向着各自的预期方向去前进。马斯克作为一个世界首富,而且是一个行动能力超强的人,他讲的东西我们还是应该去研究一下的。

More

妈妈说,看手机会瞎,刷短视频,会傻。佐证来了,AI大模型,刷多了垃圾信息,也会变弱智。而且事后无法恢复,伤害是不可修复的。

妈妈说,看手机会瞎,刷短视频,会傻。佐证来了,AI大模型,刷多了垃圾信息,也会变弱智。而且事后无法恢复,伤害是不可修复的。已关闭评论

大家好,欢迎收听老范讲故事的YouTube频道

德州华人学者的新发现:大模型也能得“脑腐”

德州的一群从小被妈妈们说“手机看多了会瞎”的华人发了一篇文章。德州农工大学、德州大学奥斯汀分校、普渡大学,这三个学校有8位作者联合发了一篇文章。从名字上看,有一个人是非拼音名字的,看着像个老外,其他所有人的名字,特别是一作和通讯作者的名字,都是拼音的名字,应该是华人。

那这个文章叫什么呢?叫《LLMS can get brain rot》,它的意思呢,叫做大语言模型也能得“脑腐”。就像是咱们新冠疫情以后经常说,脑子上好像总有一层雾,感觉注意力不集中,总是觉得想事情想不清楚,经常忘事情。现在说,大语言模型也可以干这件事。

首先呢,有一个简单的结论,就是给大语言模型喂垃圾数据,大语言模型就像得了脑腐一样变傻了。即使再用好的数据进行修复,中间喂过垃圾数据了,我后边一直喂好数据,可以改善,但是呢,永远无法达到原来的状态。也就是说,喂垃圾数据的这种伤害是永远不可能完全修复的。这是一个很悲观的结论。

More

OpenAI公开了GPT5降低幻觉的秘密,像教育孩子一样训练AI。宁愿答“不知道”也绝不瞎猜,这才是真正的进步|GPT-5 AI Hallucination OpenAI Hallucinations

OpenAI公开了GPT5降低幻觉的秘密,像教育孩子一样训练AI。宁愿答“不知道”也绝不瞎猜,这才是真正的进步|GPT-5 AI Hallucination OpenAI Hallucinations已关闭评论

GPT5降低幻觉的秘密被OpenAI给公开了。现在看来,训练AI真的是越来越像训练小孩子了。

大家好,欢迎收听老范讲故事的YouTube频道

九月五号真的是一个神奇的日子,非常多的模型都在九月五号被发布出来。OpenAI在这一天也发表了一篇论文,这个论文叫做《为什么语言模型会产生幻觉》。

大语言模型从进入我们的日常生活那一天开始,我们就发现了,这个东西最擅长干的事情是什么?叫“一本正经的胡说八道”。

现在OpenAI公布了,说产生幻觉有两个主要原因。

第一个原因叫做“错误的评估体系”。什么意思呢?就是我们现在去考试了,做对了1分,做错了0分,不做也是0分。其实我们所参加的绝大部分的考试,都是这样去设计的,甭管你是考英语、考数学,都是这样设计。像考数学这种,他还有步骤分,哪怕最后你的结果没有,或者结果是错误的,你只要前面的步骤写对了几步,他都是给你分的。

More

别只当成科技八卦!Anthropic反华禁令背后的意识形态挂帅 vs 商业求生|Anthropic Chinese-Owned Firms AI Services Ban Claude AI

别只当成科技八卦!Anthropic反华禁令背后的意识形态挂帅 vs 商业求生|Anthropic Chinese-Owned Firms AI Services Ban Claude AI已关闭评论

千万不要把这事当成又一条科技八卦。Anthropic突然发布的最严对华新规,背后的原因和影响,比大家想象的要复杂得多。

大家好,欢迎收听老范讲故事的YouTube频道

9月5日,Anthropic发布了最严对华新规,要求什么?立即停止向中国资本控股50%以上的集团及其子公司提供Claude服务。字节跳动的Trae海外版,不知道还能不能继续用Claude了。字节跳动的Trae国内版肯定是不让用Claude,但是海外版的主力模型就是Claude Sonnet 4、Claude Sonnet 3.7、3.5什么这样的模型,这个以后估计就悬了。

这项政策的显著特点,是采用了股权穿透原则,即不仅针对中国大陆的公司,还包括那些在海外注册,但由中国实体直接或间接控股超过50%的企业。

国际上这些做AI的大厂呢,其实都不让在中国使用。像OpenAI、谷歌、xAI,他们的服务在中国都是没法用的。OpenAI在这里头还稍微有点特殊,因为它的服务可以通过微软云在中国境内落地,所以它相对来说还比较宽松一点点。山姆·奥特曼在2023年还跑到中国来过,当时还讲说希望跟中国一起来探讨AI治理的事情。

More

AI会有意识吗?微软AI负责人紧急警告:警惕“看起来有意识的AI”,背后全是商业利益!

AI会有意识吗?微软AI负责人紧急警告:警惕“看起来有意识的AI”,背后全是商业利益!已关闭评论

微软AI负责人提出,要警惕看起来好像有意识的AI。AI真的会有意识吗?

大家好,欢迎收听老范讲故事的YouTube频道。今天咱们来讲一讲,微软AI负责人的官方博客。

微软呢,有一位执行副总裁兼微软AI CEO,他的名字呢叫穆斯塔法·萨勒曼。这个名字听起来稍微有点怪,待会咱们再去介绍他具体是谁。他呢,直接向微软CEO萨提亚·纳德拉汇报。8月19号,这位穆斯塔法·萨勒曼在微软官方博客上发文说:“我们必须为人构建AI,而不是构建一个人。”是这样的一个标题。

博客的内容总结一下吧。首先呢,提了一个概念叫SCAI,叫“看起来有意识的AI”,就是这个东西并没有意识。而且他也否认AI可以产生意识,说从现在的很多证据都可以证明,AI以后也是不会产生意识的。但是呢,它看起来好像有意识一样。

More

OpenAI的解套之路:从非盈利束缚到特拉华公益公司的背后博弈

OpenAI的解套之路:从非盈利束缚到特拉华公益公司的背后博弈已关闭评论

山姆奥特曼开始给OpenAI解套了。全世界的人都在关注一个问题,就是OpenAI这样的一个AIGC里边领军人物,到底如何从非营利组织这个套里边解出来。在2024年的年底,这个事情终于开始有了进展。

大家好,欢迎收听老范讲故事的YouTube频道。咱们今天来讲一讲到年底了,OpenAI到底如何解套的事情。那么OpenAI这样的一个公司,在解套之前,肯定要先做一些准备工作。什么呢?“攘外必先安内”,这个怎么个做法?发年终奖嘛。

只是OpenAI的年终奖发的方式呢,稍微有一点点奇怪。他呢是通过卖老股的方式来发年终奖的。你说我现在OpenAI挣了一堆钱,给大家分一分?没有,OpenAI还在亏损,而且每年亏的还很厉害。但是呢,他招聘的时候发了很多的期权和股票出去。那么现在说:“哎,我们允许这些老员工可以卖掉一部分。”这样的话就可以稳定军心。

More

实习生代码投毒事件震惊ByteDance:恶意攻击如何利用AI大模型漏洞颠覆数千万美元的损失

实习生代码投毒事件震惊ByteDance:恶意攻击如何利用AI大模型漏洞颠覆数千万美元的损失已关闭评论

ByteDance的AI大模型被他们自己家的实习生投毒。这是一个什么故事?大家好,这里是老范讲故事的YouTube频道。今天咱们来讲一讲这起投毒事件。不是说举个小药瓶去投毒,而是恶意代码投毒。

事情发生在6月份,一位姓田的博士生在ByteDance实习。因为某些待遇或者资源分配问题,他对ByteDance感觉不满,于是就在代码里面进行了投毒。投毒的方式是他自己进行了一些代码维护,但这些代码是安全的,主要是一些调试用的代码。这些代码去读取一些上传文件之后,就具备了攻击性。

什么意思呢?就是我们去训练大模型的时候,需要把大量的信息数据上传到大模型进行训练。他的这种调试代码上传到服务器上以后,这个时候还是安全的,然后把一些恶意代码隐藏在训练数据里边。他把这些数据读出来以后,就对整个ByteDance的一些训练集群进行了攻击。这其实是黑客普遍采用的一些手段。

More

Older Entries

退出移动版