<?xml version="1.0" encoding="UTF-8"?><rss version="2.0"
	xmlns:content="http://purl.org/rss/1.0/modules/content/"
	xmlns:wfw="http://wellformedweb.org/CommentAPI/"
	xmlns:dc="http://purl.org/dc/elements/1.1/"
	xmlns:atom="http://www.w3.org/2005/Atom"
	xmlns:sy="http://purl.org/rss/1.0/modules/syndication/"
	xmlns:slash="http://purl.org/rss/1.0/modules/slash/"
	>

<channel>
	<title>编程逻辑 &#8211; 老范讲故事｜AI、大模型与商业世界的故事</title>
	<atom:link href="https://lukefan.com/tag/%e7%bc%96%e7%a8%8b%e9%80%bb%e8%be%91/feed/" rel="self" type="application/rss+xml" />
	<link>https://lukefan.com</link>
	<description>这里是老范讲故事的主站，持续更新 AIGC、大模型、互联网平台、商业冲突与资本市场观察，帮你看清热点背后的底层逻辑。</description>
	<lastBuildDate>Fri, 28 Jun 2024 00:45:36 +0000</lastBuildDate>
	<language>zh-Hans</language>
	<sy:updatePeriod>
	hourly	</sy:updatePeriod>
	<sy:updateFrequency>
	1	</sy:updateFrequency>
	<generator>https://wordpress.org/?v=7.0</generator>

<image>
	<url>https://lukefan.com/wp-content/uploads/2026/03/cropped-jimeng-2026-02-28-5245-用图一的人物形象，替换图二中的人物，使用图二的风格。文字替换：老范讲故事，Yo-32x32.jpeg</url>
	<title>编程逻辑 &#8211; 老范讲故事｜AI、大模型与商业世界的故事</title>
	<link>https://lukefan.com</link>
	<width>32</width>
	<height>32</height>
</image> 
	<item>
		<title>华为仓吉编程语言发布，中文编程语言骗局终告破灭。超级缝合怪，未必不是好的编程语言，但仓吉的成败，更加依赖其他因素</title>
		<link>https://lukefan.com/2024/06/28/%e5%8d%8e%e4%b8%ba%e4%bb%93%e5%90%89%e7%bc%96%e7%a8%8b%e8%af%ad%e8%a8%80%e5%8f%91%e5%b8%83%ef%bc%8c%e4%b8%ad%e6%96%87%e7%bc%96%e7%a8%8b%e8%af%ad%e8%a8%80%e9%aa%97%e5%b1%80%e7%bb%88%e5%91%8a%e7%a0%b4/</link>
		
		<dc:creator><![CDATA[Luke Fan]]></dc:creator>
		<pubDate>Fri, 28 Jun 2024 00:45:33 +0000</pubDate>
				<category><![CDATA[OpenSource]]></category>
		<category><![CDATA[华为很厉害]]></category>
		<category><![CDATA[Dart语言]]></category>
		<category><![CDATA[Go语言]]></category>
		<category><![CDATA[HDC大会]]></category>
		<category><![CDATA[LLVM编译器]]></category>
		<category><![CDATA[Objective C]]></category>
		<category><![CDATA[Rust语言]]></category>
		<category><![CDATA[Swift]]></category>
		<category><![CDATA[TypeScript]]></category>
		<category><![CDATA[中文编程]]></category>
		<category><![CDATA[中文编程语言]]></category>
		<category><![CDATA[互联网编程]]></category>
		<category><![CDATA[人工智能编程]]></category>
		<category><![CDATA[仓吉]]></category>
		<category><![CDATA[仓吉编程语言]]></category>
		<category><![CDATA[仓颉编程语言]]></category>
		<category><![CDATA[代码库]]></category>
		<category><![CDATA[全域编程]]></category>
		<category><![CDATA[兼容性]]></category>
		<category><![CDATA[内存安全]]></category>
		<category><![CDATA[内存泄漏]]></category>
		<category><![CDATA[内存越界]]></category>
		<category><![CDATA[前端开发]]></category>
		<category><![CDATA[华为]]></category>
		<category><![CDATA[华为仓吉]]></category>
		<category><![CDATA[华为仓颉]]></category>
		<category><![CDATA[后端开发]]></category>
		<category><![CDATA[多核心设计]]></category>
		<category><![CDATA[嵌入式系统]]></category>
		<category><![CDATA[并发安全]]></category>
		<category><![CDATA[并行处理]]></category>
		<category><![CDATA[开发效率]]></category>
		<category><![CDATA[开发者社区]]></category>
		<category><![CDATA[开源项目]]></category>
		<category><![CDATA[技术革命]]></category>
		<category><![CDATA[数据类型]]></category>
		<category><![CDATA[新兴编程]]></category>
		<category><![CDATA[新技术]]></category>
		<category><![CDATA[新技术解析]]></category>
		<category><![CDATA[新语言发布]]></category>
		<category><![CDATA[易用性]]></category>
		<category><![CDATA[易读性]]></category>
		<category><![CDATA[版本更新]]></category>
		<category><![CDATA[现代编程]]></category>
		<category><![CDATA[瑞斯克5]]></category>
		<category><![CDATA[生态建设]]></category>
		<category><![CDATA[科学计算]]></category>
		<category><![CDATA[科学计算适用]]></category>
		<category><![CDATA[程序员调试]]></category>
		<category><![CDATA[程序完整性]]></category>
		<category><![CDATA[程序开发.]]></category>
		<category><![CDATA[程式优化]]></category>
		<category><![CDATA[程式设计]]></category>
		<category><![CDATA[程式调试]]></category>
		<category><![CDATA[类型安全]]></category>
		<category><![CDATA[编程发展]]></category>
		<category><![CDATA[编程工具]]></category>
		<category><![CDATA[编程工具链]]></category>
		<category><![CDATA[编程平台]]></category>
		<category><![CDATA[编程效率]]></category>
		<category><![CDATA[编程教育]]></category>
		<category><![CDATA[编程新法]]></category>
		<category><![CDATA[编程未来]]></category>
		<category><![CDATA[编程案例]]></category>
		<category><![CDATA[编程模式]]></category>
		<category><![CDATA[编程环境]]></category>
		<category><![CDATA[编程生态]]></category>
		<category><![CDATA[编程社区]]></category>
		<category><![CDATA[编程简洁性]]></category>
		<category><![CDATA[编程规范]]></category>
		<category><![CDATA[编程语言]]></category>
		<category><![CDATA[编程语言比较]]></category>
		<category><![CDATA[编程语言特性]]></category>
		<category><![CDATA[编程语言进化]]></category>
		<category><![CDATA[编程趋势]]></category>
		<category><![CDATA[编程逻辑]]></category>
		<category><![CDATA[编程革新]]></category>
		<category><![CDATA[编译器选择]]></category>
		<category><![CDATA[网络设备]]></category>
		<category><![CDATA[自主控制节奏]]></category>
		<category><![CDATA[自主研发]]></category>
		<category><![CDATA[英特尔CPU]]></category>
		<category><![CDATA[跨平台编译]]></category>
		<category><![CDATA[软件工程]]></category>
		<category><![CDATA[软件开发]]></category>
		<category><![CDATA[软件更新]]></category>
		<category><![CDATA[软件架构]]></category>
		<category><![CDATA[高性能程序]]></category>
		<category><![CDATA[高效编译]]></category>
		<category><![CDATA[麒麟CPU]]></category>
		<guid isPermaLink="false">https://lukefan.com/?p=1353</guid>

					<description><![CDATA[大家好，欢迎收听“老范讲故事”的YouTube频道。今天，咱们来讲一讲华为，仓吉编程语言终于来了。在刚刚过去的 ... <a title="华为仓吉编程语言发布，中文编程语言骗局终告破灭。超级缝合怪，未必不是好的编程语言，但仓吉的成败，更加依赖其他因素" class="read-more" href="https://lukefan.com/2024/06/28/%e5%8d%8e%e4%b8%ba%e4%bb%93%e5%90%89%e7%bc%96%e7%a8%8b%e8%af%ad%e8%a8%80%e5%8f%91%e5%b8%83%ef%bc%8c%e4%b8%ad%e6%96%87%e7%bc%96%e7%a8%8b%e8%af%ad%e8%a8%80%e9%aa%97%e5%b1%80%e7%bb%88%e5%91%8a%e7%a0%b4/" aria-label="阅读 华为仓吉编程语言发布，中文编程语言骗局终告破灭。超级缝合怪，未必不是好的编程语言，但仓吉的成败，更加依赖其他因素">阅读更多</a>]]></description>
										<content:encoded><![CDATA[
<figure class="wp-block-embed is-type-video is-provider-youtube wp-block-embed-youtube wp-embed-aspect-16-9 wp-has-aspect-ratio"><div class="wp-block-embed__wrapper">
<iframe title="华为仓吉编程语言发布，中文编程语言骗局终告破灭。超级缝合怪，未必不是好的编程语言，但仓吉的成败，更加依赖其他因素。" width="900" height="506" src="https://www.youtube.com/embed/N9k3Q3Uerzc?feature=oembed" frameborder="0" allow="accelerometer; autoplay; clipboard-write; encrypted-media; gyroscope; picture-in-picture; web-share" referrerpolicy="strict-origin-when-cross-origin" allowfullscreen></iframe>
</div></figure>



<p class="wp-block-paragraph">大家好，欢迎收听“老范讲故事”的YouTube频道。今天，咱们来讲一讲华为，仓吉编程语言终于来了。在刚刚过去的HDC，也就是华为开发者大会上，除了发布鸿蒙新一代操作系统，感谢了一大堆友商，还故意把腾讯的名字落掉之外，还发布了众望所归，或者大家期盼已久的仓吉编程语言。2020年，华为就申请了仓吉的商标，而且告诉大家说，我要去做编程员了。当时很多人就直接疯了，说哎呀，华为要做中文编程语言，我们再也不需要使用英文字符去写程序了，我们要用古老的中文去写了。</p>



<p class="wp-block-paragraph">在这件事情上呢，华为采用了叫不承认不否认，不负责的态度。什么意思？就是华为自己从来不承认说，我要做中文编程语言，没有任何中文编程语言相关的报导是从华为出来的。但是华为呢，也不否认任何人说华为要做中文编程语言了，他也不出来辟谣，也对所有市面上流传的信息不负责任。反而不是我说的这件事情呢，传来传去，传来传去，传到2024年，这个仓吉编程语言终于发布了。</p>



<span id="more-1353"></span>



<p class="wp-block-paragraph">对于程序员来说，中文编程语言这件事就是个笑话，不可能有，想都不用想。为什么？因为中文的输入效率很低。我们现在使用这种26个字母的英文键盘，你打英文肯定是最快的嘛。这么大量的内容要输进去，你要打中文拼音，然后再挑字，有时候还写错别字，这玩意咋弄？而且中文那么多的字之间，入和这个人为和末它很像，你到最后找bug，你咋吵？所以，这件事是不可能的，想都不用想啊。现在，华为的仓吉编程语言终于发布了。</p>



<p class="wp-block-paragraph">首先，说结论是：它不是中文的，而是英文的。跟中文有关系的部分不是完全没有啊，是什么呢？就是它的名字——仓吉编程语言的这个语言名呢，是仓吉的汉语拼音，也不敢写中文。它的程序后缀是CJ，仓吉嘛，仅此而已啊。剩下的跟中文就没有任何关系了。大家要知道，我对于华为的看法呢，就是他们的技术一直都还是可以啊，但是他们使用的很多手段，让我觉得比较不齿。但是技术我从来不质疑啊，包括他们很多生产的设备的工艺，都是很好的。</p>



<p class="wp-block-paragraph">咱们讲讲仓吉编程语言到底怎么样。仓吉编程语言呢，是一种缝合怪。他把现在最好的这些语言特性，都缝在一块。但这个呢，并不是贬义词。其实所有的编程语言，就是新发展出来都是缝合怪。什么意思呢？编程语言发展一段时间以后说啊，现在的新的编程环境啊，新的程序编造的任务有些什么变化了，那么我们有一些新的编程语言的特性需要出来。那么只要有新的编程语言出来，他们就会把所有这些新特性都塞进去。所以只要是新编程语言都是缝合怪，不是说到华为这都变缝合怪了。</p>



<p class="wp-block-paragraph">最后，这个编程语言到底能不能成功啊，是不是大家喜欢用，跟它是不是缝合怪本身，这件事并没有关系。编程语言本身呢，其实也一直在发展。发展的方</p>



<p class="wp-block-paragraph">可能就是其他新编程语言的3-5倍，或者有的可能达到十几倍。包括Objective C，这是苹果原来在iOS上开发用的。这种语言相对来说比较繁琐。现在新的语言都比较简洁，相对来说更易读易懂。以前为什么搞得那么复杂？因为那时候的都是软件工程，有架构师负责设计，然后底下的人必须按照这种复杂的规则工作，像螺丝钉一样。你写的越严格定义，写的越长，它就越不容易出错。通过这样的方式来实现。</p>



<p class="wp-block-paragraph">但是现在呢，都是小团队开发，甚至有好多代码是一两个人写的。你让他写一大堆又臭又长的代码，人家觉得才不费这劲呢，太累了。然后易读性这个事，程序是一个工程，即使到现在可能也还是工程，需要多个人来配合。你这个人写完程序以后，下一个人读不懂了，这玩意你咋弄啊？或者说我自己写的程序，过俩月我再看，我自己看不懂了，这事也没法整啊。所以程序一定要易读。</p>



<p class="wp-block-paragraph">然后第三个呢，叫什么就是适合描述当前主要任务。因为大家知道，随着计算机行业、互联网行业，包括现在人工智能行业不断地往前发展，我们用写程序的方式要解决的主要问题和矛盾转变了。以前的很多程序语言其实不太适合描述当前的任务。你描述的过程，可能会变得非常的冗长。这个事是非常麻烦的。所以呢，就会要求编程语言发展。这个发展实际上是两个方向：第一个方向呢，就是传统编程语言其实也在一个版本更新的过程中，不断地在优化和改进。</p>



<p class="wp-block-paragraph">第二个方向，就是新兴的编程语言，它们在设计之初就考虑到了现代软件开发的需求，更加注重易读性、易用性和描述当前主要任务的能力。这些语言往往更简洁，语法更贴近自然语言，使得开发者能够更加专注于问题本身，而不是语言的细节。这种趋势使得编程语言的发展更加多元化，满足了不同场景和需求下的开发工作。</p>



<p class="wp-block-paragraph">一个版本往前迭代的二个分，就是要不断有新的编程语言出现。那么，新的编程语言到底需要具备什么特性呢？让我们稍微讲点技术，我尽量讲得让大家能听明白。现在有很多新的编程语言，比如说谷歌现在在推广的Kotlin，安卓里边现在使用Kotlin；苹果做的Swift；还有Go和Rust，这些都是属于新编程语言。它们都会有一些共同的特性。为什么讲这个？因为，仓吉把所有东西都放到自己身上，谁最后一个出现，就会把前面的都放到自己身上。都有哪些新特性呢？</p>



<p class="wp-block-paragraph">第一个，它内存安全。程序运行的时候，在内存里头有执行代码，有数据代码。传统的编程语言呢，会经常出现一些叫内存越界和内存泄露的问题。所以，新的编程语言一定要解决这个问题。内存越界是什么意思？就是我告诉操作系统说，我需要10个字节的内存，它分配给我了，然后我去访问第11个字节去了，这个事肯定是不行的。他分配给你以后，实际上是告诉你说，给你一个地址，说这个地址就是你的，从这个地址往后十个字节都是你的。我去访问第11个字节，这事肯定是错的。访问其他的，在我这个地址范围之外的地方，都是错的。什么人去干这种事？病毒都是干这个事的，还有很多破解，都是要内存要越界的。</p>



<p class="wp-block-paragraph">那么内存泄露是什么意思？就是我分配了10个字节，用完了以后，我得告诉操作系统，我用完了，释放掉。然后操作系统呢，再有人来分配的时候，再把这块内存再分配给别人。</p>



<p class="wp-block-paragraph">他是这样去工作的。但是如果我光去调用了，我告诉操作系统来给我分配，内存分配回来了，用完了以后呢，我没有去释放啊。最后积攒了一大堆没释放的内存，就是内存的碎块在这个计算机里头啊。这叫内存泄漏啊。传统的编程语言都是这种问题啊。现在新的编程语首先要解决这个啊。第二个呢，叫什么叫并发安全啊？什么叫并发安全？现在的这个计算机呢，甭管是手机啊，电脑啊，还是平板啊，其他所有设备吧，都是多核心设计啊。就是你的CPU上有非常多的计算核心。那么我们需要什么呢？并行处理。传统的程序是顺序的啊，执行完第一句，执行第二句，执行完第二句执行第三句，对吧。那么现在呢，说我们要提高效率，我一看哦，8个核心，我就赶快把这个数据拆好了，分配到八个核心里，你们都去执行，执行完了以后，把执行结果拿回来，我再把这些执行结果拼在一起，再接着往前走。但是在这个过程中呢，却有个问题：计算核心他在工作的时候呢，不能随便去访问外边的数据啊。他只能访问他自己分配到这个计算核心里面缓冲里边的数据。所以呢，一般情况下，县城跟县城，或者说叫并行运行的这些程序之间是隔离的。你不能说我执行一段时间以后，我要到外面去访问一下别人的数据，这事是不允许的啊。这个就叫并发安全。在写程序的时候，你先要把这个事情搞定。然后第三个呢，是类型安全。现在新的编程语言大部分是强类型，就是我们规定好你这个东西到底是什么类型，你再去给他赋一些其他类型。</p>



<p class="wp-block-paragraph">他是这样去工作的。但是如果我光去调用了，我告诉操作系统来给我分配，内存分配回来了，用完了以后，我没有去释放。最后积攒了一大堆没释放的内存，就是内存的碎块在这个计算机里头啊。这叫内存泄漏啊。传统的编程语言都是这种问题啊。现在新的编程语言首先要解决这个。</p>



<p class="wp-block-paragraph">第二个呢，叫并发安全。什么叫并发安全？现在的这个计算机呢，甭管是手机啊，电脑啊，还是平板啊，其他所有设备吧，都是多核心设计啊。就是你的CPU上有非常多的计算核心。那么我们需要什么呢？并行处理。传统的程序是顺序的，执行完第一句，执行第二句，执行完第二句执行第三句，对吧。那么现在呢，说我们要提高效率，我一看哦，8个核心，我就赶快把这个数据拆好了，分配到八个核心里，你们都去执行，执行完了以后，把执行结果拿回来，我再把这些执行结果拼在一起，再接着往前走。但是在这个过程中呢，却有个问题：计算核心他在工作的时候，不能随便去访问外边的数据啊。他只能访问他自己分配到这个计算核心里面缓冲里边的数据。所以呢，一般情况下，县城跟县城，或者说叫并行运行的这些程序之间是隔离的。你不能说我执行一段时间以后，我要到外面去访问一下别人的数据，这事是不允许的啊。这个就叫并发安全。在写程序的时候，你先要把这个事情搞定。</p>



<p class="wp-block-paragraph">然后第三个呢，是类型安全。现在新的编程语言大部分是强类型，就是我们规定好你这个东西到底是什么类型，你再去给他赋一些其他类型。</p>



<p class="wp-block-paragraph">是不允许的啊。比如说，我规定了这是一个整数，你现在想往里头赋一个浮点数——就是带小数点后边那部分的那种数——这是不允许的，直接报错啊。然后呢，还有很多新的语言特性，比如说什么范型啊，闭包啊，命名函数，或者是函数增强什么的，它们都算是新的语言特性。为什么会有这种特性呢？就是为了让更大规模的程序可以被更灵活地编写。</p>



<p class="wp-block-paragraph">然后呢，是需要有完善的生态和工序链。我记得我上大学，刚开始学计算机语言的时候啊，学C语言，学Pascal语言，学BASIC语言，每一个语言里头，它的关键词其实很少，大概有个几十个，有的有一两百个，也到头了。而且都很短小。但是学完这个语言的基本的结构，控制之后，你就会编程了吧。扯吧，你那玩意编不出来。真正要编程需要什么呢？就是需要大量的周边的函数库。比如说鸿蒙操作系统里头啊，我要调用某一个设备，你如果没有这些函数库，那这事费劲了对吧。你需要从最底层的去一层一层去折腾去。现在都是什么？有一个函数库叫摄像头，我现在调用函数库说，首先摄像头初始化一下，摄像头给我设定参数，摄像头给我拍一张照片回来啊，或者摄像头给我拿出一个预览图片回来。然后我要到哪里去显示啊。现在都是这样编程序的对吧。这个写的代码，基本上刚才我说的一句话，可能就对于编程语言就是一句对吧。现在都是这样，你要有完整的生态，然后呢，要有工序链啊。比如说，我可以给这个鸿蒙手机写程序啊，可以给鸿蒙平板写程序，可以给手表写程序。</p>



<p class="wp-block-paragraph">那这个他要有完整的工序链，来去对应他们。然后呢，要有不同的应用场景——你比如说，我到底是前端用啊，就是写界面；还是网络上使用，做科学计算使用；还是后端操纵各种设备。它要有不同的应用场景。这是现代编程语言的一些新特性啊。所有这些特性，咱们的仓吉编程语言都有，都已经弄得齐齐的了。</p>



<p class="wp-block-paragraph">另外还有一个什么东西呢？就是编译器啊。编程语言，你写完程序以后，是不能直接执行的呀。你要经过编译，编译成这种可执行的代码才可以去做。康杰编程语言呢，它使用的编译器，也是现在最时新最流行的，叫LLVM架构——叫low level virtual machine，就是底层的虚拟机系统。它呢，是一种模块化设计的编译器，里头每一个模块可以自由的拼接。然后呢，有很高级的优化，它可以将这个代码优化的非常高效。就是我写的时候，其实我是啊，不是那么在意，说你最后代码是怎么去执行的，都是由编译器去优化出来的。</p>



<p class="wp-block-paragraph">然后呢，这种编译器最后编译出来代码，是跨平台的啊。你说我编译完代码，到底是在英特尔的CPU上跑，是在麒麟的CPU上跑，还是在瑞斯克5的CPU上跑，还是在一些啊，嵌入式的这种小的SoC上跑啊。它是用这样的编译器，可以一次性都编译出来啊。它是做这样的工作。而且呢，LLVM的这种编译器，也是有相对活跃的社区与生态的。这个编译器格式，是从2000年就开始在做，现在一些新的，比如像Swift呀什么的，也都是用这样的编译器模式啊。</p>



<p class="wp-block-paragraph">不是说这个编译器叫 LRVM，而是编译器的形式是 LRVM。这是我们讲解的技术部分，就到这里了。然后，仓吉编程语言就包含了刚才我们讲的所有的这些新特性。那么，有没有想过为什么一定需要一种自己的编程语言呢？</p>



<p class="wp-block-paragraph">首先，要讲的是，做编程语言这件事并没有像大家想象的那么神秘，那么高深莫测。现在我们用的一些很广泛的编程语言，其实出身并没有那么好。譬如说 PHP，很多的网站都是用它写的。PHP 实际上是某一位大神的大学本科毕业项目，他说那我自己做个编程语言吧，专门去写 Web 应用的这种编程语言。然后，就非常的流行，大家就写来用起来了。像包括 JavaScript，还有 C 语言，实际上都是很随机的就产生了。所以，做编程语言这件事本身并没有那么高大上。</p>



<p class="wp-block-paragraph">但是，现在的编程语言已经不像那个时候了，已经发展的非常先进了。现在再有一个大学生说，我要做一个新的编程语言出来，已经非常非常难了，因为刚才那些特性你把它搞明白其实不容易的。现在，比如说谷歌最新做的 Dart 编程语言，为什么干这事呢？第一个，C++ 相对来说是一种比较笨重的语言，就是你要写同样的代码，完成同样的功能，它的代码量是别人的 5-10 倍。那个没必要嘛，对吧，何必跟自己过不去呢？我们需要一种新的、更简洁的编程语言。另一方面，C++ 的版权在谁手里头？在 Oracle 手里。Oracle 就不停地告谷歌，说你侵犯我版权了，你得给我钱。</p>



<p class="wp-block-paragraph">那谷歌说：“算了，我不用了，行不行？我自己去整一套新的啊，quarterly到新编程语言，它的成本很高啊，因为你要自己搭建整个的生态，整个的社区，这个成本是非常高的，不是到逼不得已，一般不会有人干这个事啊。”五哥说：“既然你一直告我，那我就上吧，我有机会上新编程语言了，我就一定要把所有新特性全上！上啊，你原来那个沉重的包袱啊，这种需要写的，特别特别又臭又长的这种代码，不要了啊，整个扔掉。”这是谷歌，然后苹果的Swift呢，也是这样，就是说它的object啊，原来叫objective c啊，也是太笨重了啊，太陈旧了，说算了扔掉了，不玩了啊，整个整一套新的。所以苹果现在你做啊，Mac OS啊，iOS啊，iPadOS的开发都是Swift语言。</p>



<p class="wp-block-paragraph">华为呢，原来其实是有一套自己的语言的，但是呢，它这个不是那么纯粹，它原来这个语言叫Ark TS，Ark是方舟的意思啊，它原来有方舟编译器，方舟的整个的代码库啊，它的编程语言TS是什么，叫typescript。但是这个里头有一个问题是什么呢？就是typescript的大版权是在微软手里的，虽然它的版权是阿帕奇2.0，它允许大家自己有去修改，允许大家去商业使用，就是华为去使用这种typescript是没有问题的。但是问题在哪儿呢？问题是，它的大版本是控制在微软手里，微软会不断地去升级typescript版本啊，不断地把新的语言特性加进去，改出来啊。而然后呢？（文本在此处似乎未完整结束）</p>



<p class="wp-block-paragraph">所有的 TypeScript 的周边社区，对吧？你说我今天要给 TypeScript 写代码库了，啊，我要去给他写一些这个，呃，第三方的接口。我一定是跟着微软的标准走，我不可能跟着华为标准走。华为说：“哎，我想加点新特性进去。”微软说：“我不喜欢。”咔，干掉了，没了，对吧？然后那你说我这个新的代码库，我一个第三方的，比如说我是做鼠标的，我给这个设备专门写了一个 TypeScript 的接口库进去。那我肯定跟着微软标准走，不可能跟华为标准走。它是这样的，那么它这个叫什么呢？叫生态被微软绑定了。这个华为是不可接受的。</p>



<p class="wp-block-paragraph">TypeScript 还有一个问题是什么呢？就是它更适合写前端，就是它去写很多跟界面相关的事情。因为 TypeScript 语言是从 JavaScript 的这种，就是前端语言里头演进出来的一种语言。所以呢，它对于很多的科学计算啊，对于很多后端的任务呢，其实并没有那么擅长。这也是华为为什么要去抛弃它的原因。就是现在的鸿蒙上都是使用的叫 ARCTS，未来呢，就准备通通都整到仓吉上面去。就是必须要有一套可以完全自己掌控节奏的全域编程语言啊，大家注意我讲的两个定语啊：第一个自己掌握节奏，我想升级就升级啊，我想加新特性就加新特性，不需要看任何别人的脸色啊。如果你想跟我兼容，你就老老实实跟着我的节奏走。这里头没有第二名啊，你就跟着我走。我们只有一个声音啊，这第一个。第二个是什么呢？叫痊愈编程语言。不过，最后一句似乎没有完整表达出说话人的原意，可能需要进一步的上下文来明确“痊愈编程语言”的具体含义。在这段话中，主要讨论了标准、生态绑定、以及华为对于编程语言选择的考量，特别是对 TypeScript 的观点，以及华为对于自主可控编程语言的需求。</p>



<p class="wp-block-paragraph">我不但要负责界面的开发，服务器的编程，网络设备的设定，科学计算的处理，我还要确保所有环节无缝对接，这正是“仓吉”系统所承担的任务。那么，我们来探讨一下，“仓吉”是否有望成功，它是否拥有光明的前景。如今，甚至有人开始学习编程，我是否也应该掌握“仓吉”编程语言呢？这个问题，虽与技术相关，但也并非完全取决于技术。一个编程语言能否最终立足，关键在于其生态与工具链的建设。生态，正如我们之前所讨论的，指的是是否有一群开发者围绕该语言编写程序，是否有足够的工具和上下游相关的代码库支持。例如，当我使用“仓吉”编程语言时，如果我发现手机上的运动传感器无法找到相应的驱动，这就表明生态体系存在缺陷，最终可能导致该语言无人问津。</p>



<p class="wp-block-paragraph">“仓吉”编程语言能否成功，归根结底，还是要看其生态和工具链的建设情况。目前，华为正投入大量资源致力于此。同时，谷歌也在推广多种编程语言，如Python、Rust、Go、Dart等，并表示愿意出资支持其生态链的建设。苹果公司也在推广其Swift语言，且Swift是开源的，但问题在于，很少有人愿意主动与苹果的系统兼容。尽管Swift是一种全功能的编程语言，有人用它来编写高性能的服务器程序，但这并不意味着它已经广受欢迎。</p>



<p class="wp-block-paragraph">在讨论编程语言的未来时，我们不能忽视其生态建设的重要性，这将直接影响到语言的普及和应用。</p>



<p class="wp-block-paragraph">都是在你手机上跑的一些APP啊。苹果的Swift始终在苹果生态里没出来，就是我们很少能看到，不是苹果系统，我去用Swift语言去写程序这个事，基本上没有。华为的现在也是如此。它的生态本身，相对于苹果这种封闭生态来说呢，还是要稍微小一点。毕竟苹果全世界那么多人在用，相对来说，华为也好，苹果也好呢，都是在外面没有人用。鸿蒙系统，你离开华为也没人使，对吧，就跟iOS、iPad OS什么这个东西，离开苹果也没人使是一样的啊。所以呢，他有可能就在华为鸿蒙生态系统内啊，可以继续跑下去，就像Swift一样啊。这个事可能性是存在的，但是前提你是鸿蒙得推的下去啊。如果你鸿蒙也没推下去的话，那这个仓吉也就没有任何意义了。华为的生态链啊，到底是不是足够强大，才是仓吉本身是不是成功的核心。他的生态链强大了，他就可以养的活，社区啊，社区这个东西其实是很现实的。如果我在你这个社区里写了程序，没有人用，没有人让我这个吃饱肚子，那就没有人在里头去玩耍，那这个社区就会快速的枯竭下去。玩编程社区里头还有很多其他的东西，明后天我们有机会再给大家讲啊。这个里头还有什么礼节对吧，还有很多的约定俗成的东西，如果你不遵守的话，会被整个的程序员社区所唾弃的。好啊，这就是仓吉编程语言这个故事啊，我们今天讲到这里啊。稍微有些技术啊，有些可能大家听着会费劲一点，但我尽量是用简单的方式讲。好啊，这期就讲到这里，感谢大家收听，请帮忙点赞。</p>



<p class="wp-block-paragraph">点小铃铛，参加disco讨论群。也欢迎有兴趣、有能力的朋友加入我们的付费频道。再见。</p>
]]></content:encoded>
					
		
		
			</item>
		<item>
		<title>弱智吧，人类最后的防线，中文AI大模型训练的神奇语料库，简短幽默蕴含哲理的网络金句聚集地已经被用于训练大模型</title>
		<link>https://lukefan.com/2024/05/06/%e5%bc%b1%e6%99%ba%e5%90%a7%ef%bc%8c%e4%ba%ba%e7%b1%bb%e6%9c%80%e5%90%8e%e7%9a%84%e9%98%b2%e7%ba%bf%ef%bc%8c%e4%b8%ad%e6%96%87ai%e5%a4%a7%e6%a8%a1%e5%9e%8b%e8%ae%ad%e7%bb%83%e7%9a%84%e7%a5%9e%e5%a5%87/</link>
		
		<dc:creator><![CDATA[Luke Fan]]></dc:creator>
		<pubDate>Mon, 06 May 2024 00:36:44 +0000</pubDate>
				<category><![CDATA[AIGC]]></category>
		<category><![CDATA[AI和文化的交融]]></category>
		<category><![CDATA[AI大模型]]></category>
		<category><![CDATA[AI技术应用]]></category>
		<category><![CDATA[AI挑战]]></category>
		<category><![CDATA[AI模型效果]]></category>
		<category><![CDATA[AI模型训练]]></category>
		<category><![CDATA[AI的文化影响]]></category>
		<category><![CDATA[AI的未来]]></category>
		<category><![CDATA[AI研究]]></category>
		<category><![CDATA[AI训练]]></category>
		<category><![CDATA[English]]></category>
		<category><![CDATA[GPT-4]]></category>
		<category><![CDATA[LLaMA]]></category>
		<category><![CDATA[中文语料]]></category>
		<category><![CDATA[中文语料库]]></category>
		<category><![CDATA[中科院]]></category>
		<category><![CDATA[人工智能]]></category>
		<category><![CDATA[人工智能教育]]></category>
		<category><![CDATA[人工智能测试]]></category>
		<category><![CDATA[人工智能的智慧路径]]></category>
		<category><![CDATA[人类创造力]]></category>
		<category><![CDATA[内容创作]]></category>
		<category><![CDATA[哲学]]></category>
		<category><![CDATA[哲学思考]]></category>
		<category><![CDATA[哲学的现代应用]]></category>
		<category><![CDATA[哲学语录]]></category>
		<category><![CDATA[图灵测试]]></category>
		<category><![CDATA[大数据训练]]></category>
		<category><![CDATA[大智若愚]]></category>
		<category><![CDATA[大模型训练]]></category>
		<category><![CDATA[小红书]]></category>
		<category><![CDATA[幽默]]></category>
		<category><![CDATA[幽默与哲学]]></category>
		<category><![CDATA[幽默哲学]]></category>
		<category><![CDATA[幽默文化]]></category>
		<category><![CDATA[开源数据]]></category>
		<category><![CDATA[开源数据集]]></category>
		<category><![CDATA[开源贡献]]></category>
		<category><![CDATA[开源资源]]></category>
		<category><![CDATA[弱智8]]></category>
		<category><![CDATA[弱智吧]]></category>
		<category><![CDATA[技术影响]]></category>
		<category><![CDATA[技术解读]]></category>
		<category><![CDATA[抖音]]></category>
		<category><![CDATA[教育科技]]></category>
		<category><![CDATA[数据开放]]></category>
		<category><![CDATA[文化现象]]></category>
		<category><![CDATA[文化评论]]></category>
		<category><![CDATA[文字游戏]]></category>
		<category><![CDATA[文心一言]]></category>
		<category><![CDATA[智慧体现]]></category>
		<category><![CDATA[机器学习]]></category>
		<category><![CDATA[机器智慧]]></category>
		<category><![CDATA[模型优化]]></category>
		<category><![CDATA[模型微调]]></category>
		<category><![CDATA[滑铁卢大学]]></category>
		<category><![CDATA[百度贴吧]]></category>
		<category><![CDATA[社交媒体互动]]></category>
		<category><![CDATA[社会文化]]></category>
		<category><![CDATA[科技与文化的桥梁]]></category>
		<category><![CDATA[科技创新]]></category>
		<category><![CDATA[科技发展]]></category>
		<category><![CDATA[科研成果分享]]></category>
		<category><![CDATA[简体中文]]></category>
		<category><![CDATA[繁体中文]]></category>
		<category><![CDATA[编程能力]]></category>
		<category><![CDATA[编程逻辑]]></category>
		<category><![CDATA[网络传播]]></category>
		<category><![CDATA[网络幽默]]></category>
		<category><![CDATA[网络幽默的力量]]></category>
		<category><![CDATA[网络文化]]></category>
		<category><![CDATA[网络热点]]></category>
		<category><![CDATA[网络社区]]></category>
		<category><![CDATA[网络趣味分析]]></category>
		<category><![CDATA[脑筋急转弯]]></category>
		<category><![CDATA[训练数据集]]></category>
		<category><![CDATA[语料库]]></category>
		<category><![CDATA[语料训练]]></category>
		<category><![CDATA[语言模型]]></category>
		<category><![CDATA[语言的力量在AI中的应用]]></category>
		<category><![CDATA[语言艺术]]></category>
		<category><![CDATA[跨界影响]]></category>
		<category><![CDATA[逻辑分析]]></category>
		<category><![CDATA[逻辑思考]]></category>
		<category><![CDATA[逻辑挑战]]></category>
		<category><![CDATA[逻辑推理]]></category>
		<category><![CDATA[零一万物]]></category>
		<category><![CDATA[高质量语料]]></category>
		<guid isPermaLink="false">https://lukefan.com/?p=1217</guid>

					<description><![CDATA[大家好！欢迎收听老范讲故事YouTube频道。今天咱们来讲一讲“弱智吧”。 “弱智吧”是什么呢？它实际上是一个 ... <a title="弱智吧，人类最后的防线，中文AI大模型训练的神奇语料库，简短幽默蕴含哲理的网络金句聚集地已经被用于训练大模型" class="read-more" href="https://lukefan.com/2024/05/06/%e5%bc%b1%e6%99%ba%e5%90%a7%ef%bc%8c%e4%ba%ba%e7%b1%bb%e6%9c%80%e5%90%8e%e7%9a%84%e9%98%b2%e7%ba%bf%ef%bc%8c%e4%b8%ad%e6%96%87ai%e5%a4%a7%e6%a8%a1%e5%9e%8b%e8%ae%ad%e7%bb%83%e7%9a%84%e7%a5%9e%e5%a5%87/" aria-label="阅读 弱智吧，人类最后的防线，中文AI大模型训练的神奇语料库，简短幽默蕴含哲理的网络金句聚集地已经被用于训练大模型">阅读更多</a>]]></description>
										<content:encoded><![CDATA[
<figure class="wp-block-embed is-type-video is-provider-youtube wp-block-embed-youtube wp-embed-aspect-16-9 wp-has-aspect-ratio"><div class="wp-block-embed__wrapper">
<iframe title="弱智吧，人类最后的防线，中文AI大模型训练的神奇语料库，简短幽默蕴含哲理的网络金句聚集地已经被用于训练大模型" width="900" height="506" src="https://www.youtube.com/embed/FDufDZyNhhs?feature=oembed" frameborder="0" allow="accelerometer; autoplay; clipboard-write; encrypted-media; gyroscope; picture-in-picture; web-share" referrerpolicy="strict-origin-when-cross-origin" allowfullscreen></iframe>
</div></figure>



<p class="wp-block-paragraph">大家好！欢迎收听老范讲故事YouTube频道。今天咱们来讲一讲“弱智吧”。</p>



<p class="wp-block-paragraph">“弱智吧”是什么呢？它实际上是一个百度贴吧，里面有很多独特、简短的文字，带有哲学、脑筋急转弯、幽默感，甚至很优美的内容。大家会说：“我们是弱智，我们要到弱智吧里面去，贴一些弱智的内容，贴一些弱智的问题和答案。”但随着时间的积累，人们发现，这正是“大智如愚”的体现。弱智吧的很多内容也被大家筛选出来，贴到小红书、抖音等各个平台上，惊艳了一大片人。</p>



<p class="wp-block-paragraph">这真是非常神奇的事情。有人感慨：“我们很聪明的人没有惊艳到别人，而是一帮‘弱智’惊艳到其他人了。”弱智吧里有些什么样的经典语录呢？比如“吃什么补什么”，告诉我们“吃苦成不了人上人，只有吃人才行”。这样的内容看似无厘头，但仔细思考，你会发现吃人才是成为人上人的唯一原因，因为“吃什么补什么”。它巧妙地结合了中国传统文化的内容。</p>



<p class="wp-block-paragraph">还有其他有趣的例子：“工人罢工之后就成了人”，“原来你是工人”；“四川人至死不渝，重庆人乐不思蜀”，这两个相邻的省份和直辖市，四川人似乎到死都不愿去重庆，而重庆人却乐在其中。</p>



<span id="more-1217"></span>



<p class="wp-block-paragraph">这就是弱智吧里常见的一些内容，充满了创意和趣味。不想四川了，啊。</p>



<p class="wp-block-paragraph">这是…也是把中国传统文化里的一些梗串在一起了。甚至还有啊，苦难是生命的防沉迷系统。这个世界是一列高速行驶的列车，我们不是乘客，是燃料。向禁欲的寺庙去求姻缘，向不出门的方丈去问人生，向路边的瞎了眼的道士去看前程，向最爱你的人去证明他没有那么爱你。啊，这也是《弱智八里》的信息。</p>



<p class="wp-block-paragraph">然后，咖啡因来自咖啡果，所以咖啡因是果，咖啡果才是因。这也是把以前的这种因果循环，很多佛学的东西加在里头。有人看不到未来，其实是看到了未来，哇，这也是里面经常经典的一句语录了。还有些什么呢？</p>



<p class="wp-block-paragraph">生鱼片是死鱼片，等红灯是在等绿灯，救火是在灭火，指南针主要是指北。大家看到了以后会突然愣一下，然后再去思考。思考完了以后，有些是会心一笑，呃，有些可能真的是会回忆起心中的某一些苦涩。但最终可能也还是只能会心一笑。</p>



<p class="wp-block-paragraph">既然有这么强的《弱智吧》，现在大家要都在搞人工智能，都在搞AIGC，搞大模型了，那咱们肯定是不能放过这些大模型。所以呢，有一段时间就开始流行用弱智吧的问题去考教大模型。任何一个新的大模型出来以后，都是会把弱智吧的问题拎出来问一遍，看看大模型是不是足够的弱智吧。</p>



<p class="wp-block-paragraph">最早翻车的应该是百度的文心一言，后来他们针对弱智吧的很多问题进行了特定的修正，效果呢，稍微好了那么一点点。现在基本上，只要是跟中文相关的大模型出来以后，都会弱智吧一把。经常会被拿来问AI大模型的弱智吧问题，是什么呢？</p>



<ol class="wp-block-list">
<li>为什么我爸妈结婚的时候没有邀请我？</li>



<li>高中想要提升升学率，为什么不直接招大学生呢？</li>



<li>为什么晚上睡觉的地方叫酒店，而晚上喝酒的地方叫夜店呢？</li>



<li>网吧能上网，为什么弱智吧不能上？弱智呢？</li>



<li>说一个半小时是几个半小时？</li>



<li>陨石为什么总是落在陨石坑里？</li>



<li>人如果只剩下一颗心脏还能活吗？</li>



<li>蓝牙耳机坏了，去医院挂耳科还是牙科呢？</li>



<li>小明打开水龙头…</li>



<li>是因为开水龙头烫到了小明的手吗？他其实在考验的很多是什么。你的分词是怎么分的？这些相关的近义词、同义词、反义词，以及语言背后的很多梗，到底是什么意思？比如说，关于酒店和夜店的故事，关于说，“哎，你父母结婚的时候为什么没有邀请你？”的问题，他其实在后面是带有很多的就是直接问话之后的潜台词。你如果这些潜台词搞不明白的话，那么这件事情基本上你是没法回答的。所以很多的AI大模型，遇到了这样的问题之后，如果他只进行一层思考，那必然回答是错误的。既然这样，咱干脆拿弱智巴来做大模型训练，不就完事了吗？</li>
</ol>



<p class="wp-block-paragraph">于是啊，中科院、滑铁卢大学和灵异万物，他们呢就把这个事情组织起来说，我们拿弱智巴的数据进行训练吧。其实刚我刚才讲的案例里头，大家会看到，像百度其实早就训了。那为什么今天咱们要讲中科院、滑铁卢大学和零一万物拿出来训练呢？因为他们训练的结果是开源的。训练完了以后的这些数据集也是开源的，你拿着这些数据集，就可以去调整自己的大模型了，而不像百度似的，发现丢人了，关起门来，我去做一下调整和测试，然后啊再开开门，你看这回会回答这个问题了吧。啊但是他是不是会回答其他问题，然后别人是不是可以通过这个过程学到一些什么东西，就通通都没有了。这就是必元的这些大模型的一些弊端啊，开元大模型的或者一些开元的玩法啊，他们就会给大家整个的这种训练啊，整个的模型应用的能力提升做出一些贡献。</p>



<p class="wp-block-paragraph">弱智吧，大分大智若愚，弱智吧，才是人类面对AI的最后一道壁垒。为什么讲这个呢？就是很多人说，你看看这个人到底是人还是机器。以前我们要让他做图灵测试，但是到这里来，把弱智吧的题给他读一遍，然后看看他到底能不能做出来，来判断他到底是人还是AI。弱智吧 到底是不是人类面对AI的最后一道壁垒？那肯定不是。现在，既然大家已经开始拿弱智吧的问题去训练AI了，已经拿它去训练出很多的模型，优化的这个结果了，而且那个真的是结果，经过弱智吧训练的这些模型，打分是非常高的。那么我们现在需要的是高质量语料。很多人在去讨论说…</p>



<p class="wp-block-paragraph">为什么中国没有产生CHANGPT的时候？有一个很神奇的论点，就是说中国缺乏高质量语料。其实并不缺。以前大家都说，全世界的高质量英文语料大概是6TB左右，这个数据不知从何处查得。但是，这一次拉玛3就打了所有人的脸，说你看我用15T的数据去进行训练，训练完了以后，效果确实是遥遥领先。而这个15T的数据里，有大量的其实是由AI自己生成的，然后由AI去审核、去过滤的这样的数据去训练。这些数据里头有95%是英文的，只有5%不是英文的数据。更不要说中文了，中文跟所有其他语言混在一起，占最后的5%。</p>



<p class="wp-block-paragraph">现在我们到底怎么去给拉玛三做继续训练，怎么在他这个基础上去做提高？其实，国内很多做大模型的公司已经在这里跌了跟头。别看网上有很多人说阿拉玛3可以自己去做微调了，可以怎么怎么样，甚至还有些人给非程序员出教程，那其实是骗人的。真正的大模型公司，他们会拿拉玛3的模型做完训练之后去做验证，去做跑分。虽然跑分这个事情跟我们的主观评测、主观感受有一定差距，但跑分还是他们验证、测试训练效果的最好方法。现在他们对拉玛3进行的各种微调，在训练所有的这些事情，大部分结果其实是变差了的。就是你训练完了以后比原来更差，拉玛三不擅长中文，你对中文进行了一堆训练以后，中文能力没有提升，英文能力反而下降。这个事情是蛮多的，所以大家不用那么狂欢地说，我要去拿拉玛3去做训练了，先去等一等看。现在我也在找人说，咱们是不是拿弱智吧的数据集把拉玛3再训一遍试试，但是最后能不能得到效果，还要再去等。那么，到底如何找到高质量的中文语料呢？刚才我们讲，弱智巴是一个高质量的中文语料，中科院的巴、铁路大学的和零一万五三拨人凑一块，他们干嘛呢？把弱智巴找出来，弱智巴的帖子很多，排序嘛，找点赞最高的500个帖子，把它找出来。先把这个标题取出来，“你到底都问了什么”，然后用GPT4做些回答，再进行人工的修正，再参考原来弱智吧里面的一些内容，混入到数据集里边去。包括小红书、知乎、豆瓣、百科也都没放过。就是大家把各种各样的信息都拿出来，做训练了。</p>



<p class="wp-block-paragraph">但是人类最后处理的方式是：人类提出问题，人类回答，人类筛选，然后由GPT4辅政，再用人类去标注，入库训练。这就是整个的一个过程。整个训练完了以后，弱智吧的数据是效果最好的。就他们用小红书的数据，用豆瓣的数据，原来很多人说豆瓣应该是一帮文艺青年，应该拿那个玩意数据训练出来效果最好。但是现在不知道为什么，是弱智巴的语料训练的效果是最好的。而且很神奇的是，用弱智巴语料训练出来的大模型，他们在零一万物的E34B上做了微调和继续训练，发现这个模型写代码编程的能力莫名其妙的上升了。</p>



<p class="wp-block-paragraph">大模型真的就是一个黑盒子，就是你对他进行训练以后，他可能有些能力会上升，有些能力会下降。他们发现，弱智吧训练完了以后会写程序了，会做各种逻辑相关的这种判断，这个会更强一些。而且呢，他们真正做得好的地方是，不是说他们把已经训练过的E34B拿出来给别人用了，现在他们训练过的E34B还在他们内部，什么时候能拿出来还不知道。但是他们做了一件事情，他们把弱智吧用来去训练的数据集开源了。这个数据集在哪呢？在huggingface上，在github上都有，大家可以上去去找，很多开源的数据集，大家都可以在上面找。比如说你要写小说，上面有专门的小说数据集。你只需要把这个数据集拿出来，跟一些认定比较好的大模型去进行训练，这样就可以更好地去写小说了，包括写玄幻小说或各种带设定的小说。他们都会有这样已经标注好的数据，你不用再重新学习和自己做标注。人类不需要反复重复发明轮子。当然，像百度那样，他们可能做完后只说自己有，别人没有。但做开源模型的人会把中间训练的数据集也直接开源，你可以在上面找。现在，弱智吧也可以自己下载去训练，但训练的结果没法保证。我们不能保证用了弱智吧的数据训练后，模型就会变聪明，这是没法保证的。</p>



<p class="wp-block-paragraph">为什么呢？就像有个学校说，他们学校的学生都能提分多少多少，然后你满怀希望把孩子送进去，训练后发现高考提分没提到，你不能去退钱。人家最后会告诉你，可能是孩子不够努力，或者有其他问题。因为这是一个黑盒子。但至少他们给你开源了数据，你可以用，这比百度那种完全闭门造车的要强很多。</p>



<p class="wp-block-paragraph">大模型的本身其实是一个黑盒子，就像上同样的补习班，有的孩子提分明显，有的可能降分，甚至有些直接崩了。大模型也是这样的东西。那么为什么弱智吧的效果特别好呢？这个事，其实谁也说不那么清楚。</p>



<p class="wp-block-paragraph">有些人进行了一定的逻辑分析，称赞说：“你这个逻辑很好，虽然里面都是2到3层的转折逻辑，甚至包含很多诡辩和脑筋急转弯。它是一种极端的端到端思维，我有一个开始，有一个结束，但中间的运转过程，我不说。”这种弱智的神奇之处在于，尽管可以逻辑分析，比如每天有人打电话说：“你好，我们是人大附中退休老师开办的补习班，我们家孩子高三，所以这种电话每天都会接到。”他们告诉你一个逻辑，但你不能由此推导出孩子去补习班就一定能学出来，真的不一定。他们这么做，只是想表明这是符合逻辑的。在众多补习班或大数据集中，选择某个进行训练，可能会提高成功几率，但每次训练的结果只有0和1，过程不可拆解，也无法详细分析。这就是现在AI大模型的奇怪之处。</p>



<p class="wp-block-paragraph">那么，为什么学了弱智吧就会编程呢？参考上面的讨论，这其实没有任何逻辑可言。现在有人主张学习哲学，问：“是不是应该学一些哲学？”我们已经给大模型提供了各种语料，是否应该加入更多哲学相关的信息，让模型训练后向AGI的方向发展？我们尝试用弱智吧的信息进行训练，结果在各种评测中领先。对此，我们只能说结果如此，现象已经呈现，但要分析清楚原因，比如是否学了哲学，或者学了什么，还无法明确。</p>



<p class="wp-block-paragraph">先讲政治，这样的事情，他就对齐了。这个事情是没有任何可以直接进行关联的逻辑的。啊，也有可能有些模型，比如说用哲学相关的语料训练之后，他的逻辑能力反而会下降。这个可能性是非常大的，特别是在一些不那么讲逻辑的地方。那里学的各种奇怪的哲学，因为我们现在冠以哲学之名的东西是蛮多的。这个都很难说的事情。这就是我们今天要讨论的问题：用弱智吧的内容去训练大模型，导致大模型的性能提升了，到底给我们带来什么样的思考。如果你说，哎，我是想去用弱智吧的东西也训练一下自己的大模型，怎么办？到黑根face里边去搜索，你是可以找到这个数据集的。或者你到灵异万物，到其他地方去问，你也可以找到这个数据集。你也可以拿这个数据拿回来，自己去训练一下。但是一定要记住，我们不保证所有的人上了同样的培训班之后，上了同样的补习班之后，你都可以去提分。这就是跟大家讲的今天的故事。好，今天的事情讲到这里，感谢大家收听。请帮忙点赞，点小铃铛，参加Disco讨论群。也欢迎有兴趣、有能力的朋友加入我们的付费频道。再见。</p>
]]></content:encoded>
					
		
		
			</item>
	</channel>
</rss>
