AI用多了人会变笨吗?深度解读AI对人类思维与独立思考的深远影响

AI用多了人会变笨吗?深度解读AI对人类思维与独立思考的深远影响已关闭评论

AI用多了人会变笨吗?

大家好,欢迎收听老范讲故事的YouTube频道。今天咱们来讲一讲MIT最新的一个研究:用AI会让人变笨。

文章的标题是“你的大脑与ChatGPT:使用人工智能助手完成论文写作任务时的认知负债积累”。说白了,就是你用ChatGPT用得越多,你的认知负债也就越多。这个文章是MIT的媒体实验室发出来的,MIT这个媒体实验室还是非常著名的一个实验室。这篇文章呢,是2025年6月10日在Arxiv上的预印本的论文。现在有一个新的发论文的地方叫Arxiv,很多没有经过编辑审核、没有杂志社确认的这些论文就都可以放在这了。数学、计算机等等这些学科的大量论文都是会先放在这里,大家可以先开始看起来,因为科技实在是发展得太快了。有一些呢,修改过以后会重新发到杂志社上去,放到这上面并不算抢发。杂志社发的时候还会提出修改意见,你改完了以后会去更新Arxiv上的论文。

这个实验做了什么呢?18-39岁的54个人分成三组:纯脑力组、使用谷歌搜索引擎组和使用ChatGPT组。这三组呢,在20分钟之内写一篇SAT水平的考试作文。SAT呢,一般要求是开放式的、哲学或社会性讨论的这种问题,比如艺术的力量、成就的意义等等这样的题目。所以相对来说比较文科,比较开放的一个题目。

实验的数据是怎么获得的呢?首先,是戴脑电图头盔检测大脑活动。你说我到底思考了没有?这个脑电图头盔是可以给你一个真实的数据的。然后,是测试参与者文章的记忆情况,你写完文章了以后,你给我复述一下你文章里的内容。第三个,是对文章质量进行一下评分,到底写得好不好嘛。最后,是要询问参与者对文章归属感的认同:你觉得这文章是你写的吗?大概是做这么四项的测试。

实验的结果呢,首先从文章质量说,这一块还是符合大家认知的。AI组的得分是最高的,因为你想20分钟写一篇这种口水文,什么艺术的力量,这种哲学相关的口水文,那肯定AI的效果是最好的。文章在语法、结构、连贯性上都是表现最好的。但是,文章内容趋向于模板化和平庸,原创性和多样性不足,有很强的“AI味儿”。这个是大家能感受到的,至于“AI味儿”哪来,待会咱们再讲。

搜索组呢,居中。在获取事实和论据上有优势,写出来的文章呢,信息量比较大。它比ChatGPT组要稍微差一些,但是比那个纯脑组呢,要好一点点。逻辑性不错,但是表达流畅度呢,略逊于AI组,因为你搜索了半天,这个文章你还是得自己写嘛,那肯定是要比AI差一些的。

纯大脑组呢,文章的语言质量和结构性普遍偏弱,得分最低。但是文章的个人风格和多样性更强,更能看出作者独立思考的迹象。这就是文章的质量,特别是写口水文这件事情哈,请放心地交给AI,它已经可以干得很好很好了。

大脑活跃程度,就是拿这个脑电图帽戴在脑袋上,效果怎么样呢?这个一定是纯脑组最高,大脑活跃,思维负荷最高。搜索引擎组呢,活跃程度居中。AI组活跃度最低,脑区参与度下降。为什么说AI使多了以后人会变笨?因为你用AI干活的时候,你那脑子啥也没干,所以会变笨的。

文章记忆情况,要求参与者引用文章中的一句话。纯脑组89%是能够成功引用的。搜索引擎组呢,差得不太远,83%可以准确引用,因为你毕竟是自己写了嘛。AI组,对不起,0%。所有参加AI组实验的人,没有任何人可以从文章里边准确地引用出句子来。这个也是一个比较悲催的结果。

至于归属感的话,纯脑组认为这个文章绝对是我的,从构思到书写都是我自己来的,所以一定是我的。搜索组呢,也是有归属感的,但是没那么强。他说我这个文章肯定算我的,但是因为很多的内容是从搜索引擎来的,所以没有那么确信。AI组的话,大家能想象,“这文章绝不是我的,跟我一点关系没有”,是这样的一个状态。

结论呢,他们叫“认知债务”。你越用AI的话,实际上你AI输出的所有东西,你连看都没看,你的脑子也没有活跃,你也不认为这东西是你的,你在这个AI的文章里头也没有办法引用任何东西。所以AI确实可能出的文章效果还可以,得分最高,但是你这个脑子就越来越笨了。

AI呢,现在确确实实是在影响我们的语言,我说话可能“AI味”越来越重了,特别是像我,我自己可能这块是比较明显的。当然这个也是结论有出处。这个文章呢,叫“模型错位于语言变化:非脚本英语口语中与人工智能相关的语言迹象”。当然他讲的是英语,我讲的是中文,但是我相信我讲的中文里头肯定也是有很多AI词汇的使用量在不断地地上升。

这篇文章呢,是由佛罗里达州立大学三位作者写的。2025年8月1日呢,也是Arxiv上首先发布了预印版。他这个文章呢,跟刚才咱们讲这个“AI用多了会变笨”这个文章呢,有一点差异是什么呢?就这个文章已经被接受了,“人工智能伦理与社会会议”第八次会议已经收取了这篇论文,所以在这个Arxiv上呢,已经给你修改过了。

这个文章的数据是怎么来的呢?他呢,是找了一堆的科技与科学的博客。你说我找别的博客,他们受AI的影响并没有那么重,但是你科技跟科学的,一定是受AI影响比较大的。所以呢,他们找了10万条录音,2210万个单词,拿这些单词去做词频分析去了。而且这些口播呢,一定是随口聊、无脚本对话。有些口播虽然是一个人坐在这聊,但是呢,他们是写的逐字稿,这种逐字稿你就没有任何统计意义了,你一定是随口讲的话才有统计意义。这个实验呢,以2022年ChatGPT发布前后的这个时间对比,2022年ChatGPT发布之前,哪些词汇用得多一些,哪些词汇用得少一些。到2022年ChatGPT发布以后,我们再拿出来去比较。

观察到了什么样的现象呢?就是有些单词出现的频率明显地增加了,而这些词的同义词呢,使用的频率并没有明显变化。你比如说我现在天天讲AI、AI、AI,那么这个词的使用频率上升了,但是如果它的同义词的使用频率也在上升,那说明大家关注的焦点在发生变化,并不是说AI真正的渗透了我们的生活。但是它的同义词使用频率没有发生变化的时候,这个时候就是AI对我们进行渗透、进行影响了。

它这个里头找到了一些词是什么呢?第一个是叫“Dive”,叫钻研、深入研讨,但是它的同义词呢,就没有明显的上升,而这个词是明显上升了。这是ChatGPT比较喜欢用的一个词。然后呢是“intricate”,是复杂的、错综的,这也是ChatGPT比较爱用的一个词。“surpass”,超越、胜过的意思。“boast”,夸耀、以什么什么为傲。这都属于明显上升的。剩下的词就不跟大家念了,我自己念这些词还是比较费劲的。他们呢,是找了8个词,说这8个词明显上升,而它的同义词并没有明显上升。以此为证据得到结论:AI正在重新塑造人类的表达习惯。

而且呢,他这里头有一个很大的潜在风险,叫“语言同质化的潜在风险”,以后大家都按这些话说了,那些这个词的同义词可能就慢慢地会被遗忘掉。但是我觉得最大的风险并没有披露,其实人思想很大程度上是受语言影响的。所以中国人、日本人、英国人、美国人,我们其实很多思考模式的差异,其实是来自于语言差异。当AI渗透到我们的语言,特别是没有稿、直接拍脑袋就来的这种口头语言的时候,那说明我们的思考方式也在发生变化。这个可能要比语言同质化要更恐怖一些。

现在呢,有很多人在批评我的内容像AI内容,我肯定是被影响比较深远的这一类。这样的结论出来以后,那很多的妈妈们就该着急了。妈妈们以前经常跟我们讲的是什么?看手机会瞎呀。现在的话,用了AI会变笨,会像AI一样去说话和思考问题,而且这都是国外有大学真的发论文了呀,这是真实存在的呀。

但是我要讲的是什么?就不要断章取义,形成这种武断的结论。就是说你看人家已经出论文了,以后我们就要少用这东西。甚至有些人说你看,有论文了,吃什么什么东西有害,以后我们不吃了。我记得原来还有一个故事讲的什么,正面躺在床上容易得什么什么病,左侧躺容易得什么病,右侧躺容易得什么病,趴着睡容易得什么病,这哥们说算了,我不睡了行不行?所以呢,我们不要断章取义,不要扩大它的范围。但是呢,我也知道,这种信誓旦旦喊口号呢,会更有听众一些,因为“群众思维单纯,缺乏逻辑推理能力,因此最能打动群众的是简洁、反复的口号,而不是复杂的论证”。刚才咱们讲的是文章是怎么去获取数据的,怎么去得到结论的,这实际上是一个论证过程,一般人是不爱听这个的,大家喜欢听简洁反复的口号。这句话哪来的呢?也是有出处的,这句话来自于一本书叫《乌合之众》,有兴趣可以去看。

这个报告最大的价值是什么呢?你既然说不是说用了AI就变笨,以后大家别用AI了,那它的价值在哪呢?在于实验设计的方法。它设计实验的过程是什么样的?我应该如何去找人,如何去用脑电波的这个帽子,如何去让大家做问卷,这些人怎么去分组,怎么去比较,怎么在这个数据里边去选择?包括刚才咱们讲找了科技博主,那你不找科技博主,他这个数据变化不明显嘛。然后呢,一定要找非脚本口播,然后呢做大量的数据分析。而且呢,他获得了一个相对比较开放的结果,但这个结果呢,只是我们观察到的现象。至于未来我们到底应该怎么用这个东西,甭管是MIT的这个文章,还是后面说AI渗透我们语言的这个文章呢,并没有说大家要如何去修改,如何注意这事,人家也没说小孩不要用AI,用AI会变笨,人家没说这话,这都是好多妈妈们自己想出来的。

而且呢,这个论文里头还有一点是让我比较喜欢的,是什么呢?他们会承认实验设计的缺陷。MIT这个实验呢,人家写了,说我们找的这50来个人呢,都是名校的学生,他们肯定是有偏差的。普通人到底是什么样的,我们不知道,但这个实验并不代表他们的数据。第二个呢,我们采样的人数太少了,就50多个人,肯定是没有那么代表性的。第三个是什么呢?他说我们选的这个作文题目,是20分钟完成一篇SAT的考题,非常非常地不全面。做其他的题到底是什么样,不知道。你说你让他去做个研究,或者做一些别的这种考题,他可能会有不同的结果出来。

关于AI渗透效应的这篇文章呢,人家里头也说了,说我们这里头也有不足。第一个,语料来源是有限的,只找了科技与科学的口播的博主。然后呢,因果关系难以确认。到底是为什么变成这样,我们没法去确认。到底是因为AI出来了以后这些词的使用频率就上升了呢,还是说因为这个词使用频率上升了以后AI可能也在发生进化,也在这个不断地去迭代?这个事我们没法去证明,我们只得到了一个结果。然后呢,说关键词选择呢,可能带有偏差。这些词并不是直接统计出来,是他们先根据自己的印象选出来的,不到10个词吧。还有就是语言层次的局限,研究主要就聚焦在词汇频率上,就是这些词变多了,它们的同义词并没有变多,观察了这样的一个现象,并没有深入去分析句法、语法的这些变化,包括语言的一些组织是否受到AI渗透的这种影响。而且呢,他们还认为自己整个实验的时间跨度要稍微小一点。其实现在有了AI以后,完完全全是可以把非常非常大跨度的这些数据去进行统计分析,是可以重新建模,得到一些不同的结果出来的。这还是一个很有意思的研究。

那我们应该如何应对AI后的时代呢?我们现在其实已经进入AI后的时代了,我说的很多话已经在受AI的影响,但是我相信我在用AI做各种稿件或者做各种的这个视频的时候,我应该还是很努力地在动脑子,绝对不会像MIT实验里头讲的说做完了以后,他都不觉得这东西是他自己做的,让他复述里边的任何话,他复述不出来。你看我经常有时候会引用一些以前自己节目里的内容,因为我觉得这东西就是我做的,这没有任何问题。

那么我们应该如何应对呢?第一个是AI渗透,这个事其实是没有办法避免的,因为语言本身就是活的。语言的渗透带来的是思维方式的转变。既然已经发现了,就可以长期监控,然后有意引导。大家有没有发现,现在有好多人是按照提示词的方式在说话。什么意思?就是我们怎么写提示词?上来第一句话,“你是一个什么什么,我现在要做什么,按照什么样的例子来,希望结果受到哪些约束”。因为我们在很多的时候跟AI聊天的时候在尝试说,我们怎么用一个结构化提示词得到一个可控的、符合预期或者超越预期的一个结果。在这个过程中不断优化提示词,但优化的过程,你肯定你的思考方式也在发生变化。那我们现在有些人在说话的时候,就是按照提示词的方式再去说,按照这个结构去说,上来说“你是什么什么,我想要什么什么,我给你什么,我需要得到什么,有些什么样的约束”。我们现在按照结构化的方式在思考问题,你既然已经思考了,就会习惯性地把这个在口头表达的时候把它输出出来。

至于说用AI人会变笨的问题呢,也确实是敲响了警钟。这个警钟是什么?不是说不让用AI,而是不能完全依靠AI。其实在AI开始的时候,我就跟大家讲过,绝对不能不劳而获。AI开始的时候,很多人就说一键就可以干这个了,我不需要露脸,不需要做任何事情,我只要点一下,我就可以用AI生成文章,用AI生成画,用AI生成视频,然后就上外边挣钱去了。这个都属于叫不劳而获,这个事是坚决不能要的。而刚才我们看MIT的那篇文章,里头有很多这些测试的人,他们最后没有办法复述自己文章内的任何内容,他们就属于是完全不过脑子,这个就是不劳而获,这个真正是需要反对的。

AI呢,可以让人更高效地处理更多的信息,这是我自己用AI的一个很巨大的感受。我原来很多的内容,可能只能靠以前的积累、靠自己的思考。现在的话,我可以参考大量的网上信息,AI会给我搜索来总结归纳,好让我去阅读。当然我阅读了以后,我很注意的一点是什么?就是最后我给大家讲的这个东西,一定是自己写的提纲,自己写的稿子,然后再照着一个提纲,用口头语言跟大家表达出来。当我们遇到了不是20分钟SAT口水文的时候,就可以开动脑筋,调动更多的信息,完成更有价值的工作,这才是AI对我们的帮助。

人们和AI的协作方式呢,肯定是需要重新思考。无法复述内容是不可接受的。以后面试的时候一定要加进去,你发现这哥们写了文章了,你就找他来问,说这文章你写什么了呀?到底是在干什么呀?这个事我还真干过。还没有AI的时代,我想给整个投资团队招一些研究员,我们就去面试了几个36氪的写手。36氪呢,要求的这些写手之所以不能叫他们作者,是因为他们干的活真的不配叫作者。给他们的要求是每天两篇半。什么意思呢?就是他们需要去阅读英文的文件,阅读中文的稿件,每天要写两篇短消息和半篇的深度文章。为什么是半篇?就是一周两篇,你要写一些稍微深度、稍微长一点的东西。这个两篇呢,就是,要从国内的媒体和消息上写一个短消息复述下来,然后呢,要从国外的英文媒体上翻译一篇短消息复述下来。所以呢,他们每一个人的每天KPI是两篇半。

我一开始看到这样的一个简历以后,我其实挺兴奋的。为什么呢?因为我们就需要这种快速的信息处理能力。当时你想2015年那个时候没有AI,没有这些工具,最多有个搜索引擎可以用一下,确实需要有人来帮我去做一些调研。我就找了这么几个小孩回来去面试,都很年轻。我说那你们都写过什么文章?给我一个列表,说这些文章都是我们写的。我说这个文章里头,哪个你觉得写得还可以呢?或者说你自己有什么感受呢?说不出来。我说你的文章最受欢迎的哪几篇?就告诉我这几篇最受欢迎。为什么知道这事呢?因为是他们有KPI考核的,你写完文章以后点击率、文章数据指标是跟他们的公司挂钩的,所以他能记着哪篇文章的点击率高、打开率高,这能记着。后来我说,那你就给我讲讲你自己觉得写得最好的这几篇文章到底都说了什么,有些什么样的观点?说不出来。

当时我就很诧异,我说这个文章是你写的吗?他是我写的呀,我靠这玩意挣了好多年工资呢,怎么可能不是我写的?我说那你写了半天文章,为什么你没有办法复述任何内容呢?他说人在这种一天两篇半的KPI下,你的脑子完全就是一个通道,你不可能留下任何东西。如果你留下任何东西开始思考的话,你就完不成这个一天两篇半。我说那些深度的文章,每周两篇的这些文章呢?他说也是一样的。这个人的脑子已经完全被洗干净了,不停地有信息进来,不停地有信息按照一个格式输出出去,你是不会有任何残余的。后来我说这些文章算你们写的吗?他们也跟我乐。但是后来的结论就是,这样履历的学生,或者叫这样履历的同学吧,我们一个也没招进来。这个是我当时的面试标准所无法容忍的。以后大家再去面试的时候,建议使用我的这种面试技巧。你就问问他说,这文章你到底写完什么感觉?你觉得写得最好的文章跟这个比如点击率最高的文章有什么偏差?哪个文章是你觉得写得好或者有什么遗憾?如果发现他完全想不出来的话,这个慎重招聘。

对于结果没有归属感这个事情呢,其实要比这个无法复述更不可接受。为什么呢?因为没有归属感,他就不可能认真,也不可能负责任地去把这个文章写好,因为他从来不认为我需要为这篇文章负责任,这跟我有什么关系?就跟刚才我讲的36氪的小编上我这来面试似的,他并不觉得这个文章写得好,他自己怎么怎么样了,他只觉得点击率高的文章我可以多挣点钱,点击率低的文章怎么怎么样。他有这样的想法。那么在设计任务的时候,就必须要去规避这种让人失去参与感的这样的过程,这个是很重要的。

从我个人来说呢,语言和思考的方式肯定是受到了AI巨大的影响,但是应该并没有变笨,即使有,我也绝对不会承认的。

最后总结一下,请大家还是多思考、多观察,看看AI对我们到底有什么样的影响。

好,这个节目就跟大家讲到这里,感谢大家收听。请帮忙点赞、点小铃铛,参加DISCORD讨论群。也欢迎有兴趣、有能力的朋友加入我们的付费频道。再见。

Comments are closed.