<?xml version="1.0" encoding="UTF-8"?><rss version="2.0"
	xmlns:content="http://purl.org/rss/1.0/modules/content/"
	xmlns:wfw="http://wellformedweb.org/CommentAPI/"
	xmlns:dc="http://purl.org/dc/elements/1.1/"
	xmlns:atom="http://www.w3.org/2005/Atom"
	xmlns:sy="http://purl.org/rss/1.0/modules/syndication/"
	xmlns:slash="http://purl.org/rss/1.0/modules/slash/"
	>

<channel>
	<title>代码安全 &#8211; 老范讲故事｜AI、大模型与商业世界的故事</title>
	<atom:link href="https://lukefan.com/tag/%E4%BB%A3%E7%A0%81%E5%AE%89%E5%85%A8/feed/" rel="self" type="application/rss+xml" />
	<link>https://lukefan.com</link>
	<description>这里是老范讲故事的主站，持续更新 AIGC、大模型、互联网平台、商业冲突与资本市场观察，帮你看清热点背后的底层逻辑。</description>
	<lastBuildDate>Tue, 02 Sep 2025 00:41:38 +0000</lastBuildDate>
	<language>zh-Hans</language>
	<sy:updatePeriod>
	hourly	</sy:updatePeriod>
	<sy:updateFrequency>
	1	</sy:updateFrequency>
	<generator>https://wordpress.org/?v=6.9.4</generator>

<image>
	<url>https://lukefan.com/wp-content/uploads/2026/03/cropped-jimeng-2026-02-28-5245-用图一的人物形象，替换图二中的人物，使用图二的风格。文字替换：老范讲故事，Yo-32x32.jpeg</url>
	<title>代码安全 &#8211; 老范讲故事｜AI、大模型与商业世界的故事</title>
	<link>https://lukefan.com</link>
	<width>32</width>
	<height>32</height>
</image> 
	<item>
		<title>华人天才程序员，从xAI跳槽OpenAI，盗取机密代码，被Elon Musk起诉</title>
		<link>https://lukefan.com/2025/09/02/chinese-engineer-xai-code-theft-lawsuit/</link>
		
		<dc:creator><![CDATA[Luke Fan]]></dc:creator>
		<pubDate>Tue, 02 Sep 2025 00:41:37 +0000</pubDate>
				<category><![CDATA[AIGC]]></category>
		<category><![CDATA[Musk传奇]]></category>
		<category><![CDATA[AI人才战]]></category>
		<category><![CDATA[AI工程师]]></category>
		<category><![CDATA[Grok]]></category>
		<category><![CDATA[OpenAI]]></category>
		<category><![CDATA[XAI]]></category>
		<category><![CDATA[中美科技战]]></category>
		<category><![CDATA[代码安全]]></category>
		<category><![CDATA[代码盗窃]]></category>
		<category><![CDATA[华人工程师]]></category>
		<category><![CDATA[商业间谍]]></category>
		<category><![CDATA[小鹏汽车]]></category>
		<category><![CDATA[工程师文化]]></category>
		<category><![CDATA[技术泄密]]></category>
		<category><![CDATA[法律诉讼]]></category>
		<category><![CDATA[特斯拉]]></category>
		<category><![CDATA[知识产权]]></category>
		<category><![CDATA[硅谷挖人]]></category>
		<category><![CDATA[离职跳槽]]></category>
		<category><![CDATA[窃取商业机密]]></category>
		<category><![CDATA[自动驾驶]]></category>
		<category><![CDATA[访问日志]]></category>
		<category><![CDATA[谷歌]]></category>
		<category><![CDATA[马斯克]]></category>
		<guid isPermaLink="false">https://lukefan.com/?p=2504</guid>

					<description><![CDATA[💥震惊！马斯克把一中国工程师告到哭！就因他偷XAI代码跳槽OpenAI，结果骚操作翻车实录🔥

兄弟们！这哥们儿离职前疯狂下载代码，压缩改名+删日志一条龙，以为能瞒天过海？🤯 马斯克冷笑：日志修改也有日志啊！你当硅谷是菜市场？🤣 更绝的是——他交出设备账号"和解"，转头就改密码藏猫猫！XAI：这届工程师太会演，我直接起诉！

为啥总有人偷代码？真相笑死：工程师干久了变"艺术家"！代码像初恋，重写一遍？大脑：我忘了！😂 但兄弟，离职前突击下载全库？纯属"不打勤的不打懒，专打不长眼的"！💥 偷了也不直接用——OpenAI可不敢贴脸开大，但马斯克急眼：怕被翻出自己代码"黑历史"啊！

中美AI大战，华人工程师成香饽饽。挖人像抢Facebook食堂（腾讯真去面试！），但代码雷区别乱踩！点赞收藏，下期爆更多硅谷骚操作👇 #职场神操作 #AI江湖 #男生血泪史

华人天才程序员，从xAI跳槽OpenAI，盗取机密代码，被Elon Musk起诉

埃隆·马斯克旗下xAI公司对一名前华人工程师提起法律诉讼，指控其在跳槽至竞争对手OpenAI前夕窃取公司商业机密。本文深度解析这起“代码盗窃”事件的始末，探讨工程师为何“带走”代码，企业如何通过访问日志等技术手段追踪窃密行为，并揭示了事件背后激烈的人工智能人才战与中美技术竞争的真相。]]></description>
										<content:encoded><![CDATA[
<figure class="wp-block-embed is-type-video is-provider-youtube wp-block-embed-youtube wp-embed-aspect-16-9 wp-has-aspect-ratio"><div class="wp-block-embed__wrapper">
<iframe title="华人天才程序员，从xAI跳槽OpenAI，盗取机密代码，被Elon Musk起诉" width="900" height="506" src="https://www.youtube.com/embed/9lJrCbK7-JA?feature=oembed" frameborder="0" allow="accelerometer; autoplay; clipboard-write; encrypted-media; gyroscope; picture-in-picture; web-share" referrerpolicy="strict-origin-when-cross-origin" allowfullscreen></iframe>
</div></figure>



<p>有一位从XAI离职、准备投奔OpenAI的中国工程师，被马斯克起诉了，说他盗取了XAI的机密。</p>



<p>大家好，欢迎收听<a href="https://youtube.com/@StoryTellerFan" target="_blank" rel="noopener">老范讲故事的YouTube频道</a>，今天咱们来讲一讲这位被XAI起诉的中国小伙子。</p>



<p>他呢，是快速地卖掉了XAI的股票，从XAI离职准备加入OpenAI，但是就是在这样的一个时间点里，他大量地下载了XAI的代码，压缩、改名、上传并且删除了日志。因为他下载代码的时候是有日志的，他把这个日志还删了，做了一个自作聪明的小动作，这样的事情就被XAI发现了。</p>



<p>XAI找到这小伙子说：“你这样干不对，咱们是不是商量商量？”小伙子呢就当时跟XAI达成了一个和解。和解的方式是什么呢？第一个，还是要给一些赔偿的了；第二个呢，是交出自己个人设备的账号，让XAI的工程师去进行检查。但是呢，XAI后来发现说，他给出的账号并不完整，而且有一些设备的账号呢，已经被修改了密码，无法进行登录了。XAI没有办法，只能把这小伙子给告了。</p>



<p>首先我们要说一下，马斯克为什么着急呢？很多人觉得XAI，你这个产品好像也没有OpenAI做的好，也没有人家用户量多，你还怕被人偷吗？这个事是这样，每一家公司呢，第一个是自己都会有一些不传之秘吧，或者说有一些自己做的更好的地方，这些呢马斯克肯定是不希望让OpenAI知道的。另外一个呢，就是你以为马斯克的代码就都干净吗？如果马斯克的代码里头，也有一些是从OpenAI来的，或者从其他什么地方来的，这些代码如果落到OpenAI手里边的话，是有可能会出现一些别的问题的。所以任何公司都不希望说公司里边的代码，整个让别人拿去检查一下，除非迫不得已，是很少有公司愿意交出自己的代码让别人去检查的。所以马斯克很不乐意，说你要么把代码给我还回来，要不然咱就起诉。这小伙子现在起诉要求也是说，他现在不能到OpenAI去上班，你必须把这事说清楚，要把所有的代码也好，你窃取我的机密也好，都要删干净，再说后面的事情。</p>



<span id="more-2504"></span>



<p>那你说这小伙子为什么出尔反尔，隐藏账号呢？经常从公司离职的朋友呢，大概都有这样的经验，公司呢会喜欢拿着你的电脑去翻来翻去，想去看一下你里边有什么样的聊天记录。因为像我们上班的时候，都会拿公司电脑当个人电脑去使用，里头有聊天记录，甚至还有很多银行账户，有很多的个人的信息，并不希望别人知道。原来呢，大家你好我好大家好，是一个相对比较平和的状态，现在呢大家闹得不愉快了，人家要求检查你的所有账号的时候，这个小伙子肯定是不愿意的。所以这种出尔反尔，说谈好了我交出账号你去检查，最后反悔，这个是大概率的事件，大家都会这么干的。</p>



<p>那你说挖人了，为什么还要偷代码呢？这个人在马斯克这儿干了可能一年多一点点吧，然后跳槽去OpenAI，他要带着这代码到底干嘛使呢？你说到底是OpenAI要求他带着代码走呢，还是这小伙子自己说，就是要带着这些代码走，不带着这个代码我就心里不舒服？通常这样的案件呢，都是起诉个人，不起诉公司的。因为起诉公司就变成势均力敌的两个大的公司，就算一公司大一公司小吧，也算是两个公司法务之间在打官司，而你起诉个人的话，可能相对来说事情更容易解决一些。马斯克前面也遇到过几次类似的事情，都是起诉个人，后边我们再去讲马斯克起诉其他工程师的事情。在行业里边，大家都是这么约定俗成的，这谁偷的代码，就怪这一个人，不能怪未来这公司。</p>



<p>你说这代码是我写的，那我从这离职了，到另外一公司上班去，那为什么一定要把这代码带着走呢？这个说了一个特别有意思的事情：虽然是工程师，但是干多了以后就都是艺术家的活了。有没有人听懂这话什么意思？就是我们去进行创作的时候，工程师也是在做创作吧，一般分三个层次。第一个层次叫艺术家，第二个层次叫工程师，第三个层次呢叫科学家。他们三个层次是什么样的差异呢？艺术家呢是激情创作，你不可重复的；工程师呢是可重复、可迭代，但是呢你是不知道里头具体的一些底层原因的，所以我没有办法把我的这些技术呢应用到其他领域里头去；科学家的话就是他了解底层原理了，他可以把一个科技从一个领域应用到另外一个领域里去。这就是三个层次。</p>



<p>工程师呢，按道理说应该是干中间这块的事情，可重复、可迭代。那我既然在这个公司干过了，我上别的公司再干一遍没毛病，而且还能干的更好。但是呢，如果你干的活比较大，你就可能就会下跌到艺术家的层次了，所以我说干的活多了就回干的都是艺术的活，就是不可重复了。你说我在这写了两年的代码，写了很多很多代码出来，说来再给我写一次，发现原来我到底咋写的我想不起来了。所以呢，工程师喜欢带着自己的代码走，这是一个很大的原因。另外一个原因是什么呢？还有别人的代码了。一个系统里头不是光你自己的代码，大部分工程师，就算是要重现原来的过程，也都是会去重新写，没有人会去默写这个东西。你就算把自己的代码都写明白了，你没有其他人代码的配合，你跑不起来。在这个时候你就需要整个系统的代码，需要把别人的代码一起带走，这个才是偷代码的一个核心原因。</p>



<p>被偷的代码通常也不会被直接使用。不是说我把这代码拿回来，到那边往上一怼就开始用了，一般没有人干这个事。为什么？因为你的代码一旦开始对外服务以后，就会被抓住，说你那个代码跟我那个代码是一样的，我去起诉这个公司。其实后边偷代码，或者应用这些代码的公司，很少有被起诉的，因为他们都会要求说，你在我的公司里写代码，你必须要能够说明白这代码是哪来的，或者要重新写，或者是要有出处。你不能说随便找一个没有出处的代码给我搁上。在国内是发生过类似的案件的，有人把系统发布了，结果发现里头有一些代码是抄别人的，这个代码已经是被别人申请了著作权的，然后被起诉。那起诉了以后，公司也没什么好说的，直接把这个写代码的人告了，说我要求你重写，我要求你去用可靠的代码，我从来没有让你去把别人的有版权的代码给我拿到这来直接使。那这个责任一般公司是不担的。所以这些代码就算被拿走了，也不会被直接使用。</p>



<p>下一个问题，偷代码是如何被发现的呢？这帮程序员自己就是写代码的，自己想偷点代码，难道还会被发现吗？</p>



<p>偷代码被发现的过程呢，通常是跟代码访问日志有关的。代码这个东西呢，并不是说在我电脑上存一份就完事了，我们通常都会有代码管理工具。他呢，负责几件事情。第一个呢，代码版本管理。我这次加了两行，下次改了两行，再下次我删了两行，我再多写了一个新文件，删了一个文件，把文件改了个名字，这些东西它是有过程的，你需要记这个日志，说我为什么加了两行，为什么删了两行，我每一次到底差在哪，这个是要去进行管理的。</p>



<p>下一个问题是什么呢？代码的一些权限管理。我可以读哪些代码，我可以改哪些代码，我可以删哪些代码，这个是要进行权限分配的。你不能说所有人都可以读所有代码，这个事是很危险的。谷歌早期的风格就是每一个人都可以读所有代码，但是后来因为发生了景德镇的事情，就是景德镇一个小的学校里头，应该也是服务器被人当成肉鸡了，做成跳板偷了谷歌的代码。谷歌以后就是说，我们不能让大家去访问所有代码了，这个太危险了。</p>



<p>我们所有人去check in代码和checkout代码的时候，它是有日志的。你每天上班，你正常工作，你应该checkout多少代码，这个事儿是有一定的规律可循的。通常呢，我们会把别人跟我相关的代码，更新的部分会把它checkout出来，我们很少会把整个的项目都checkout出来。一个是很大，第二个的话，就是你真的把这么多代码弄回来以后，你去编译，或者去处理这个系统是很麻烦的，非常非常耗时间。所以大部分情况就是，我写中间的某一个模块，我只把跟我相关的模块checkout出来，再去进行编译。而且我们checkout出来的别人的代码呢，通常也不是源代码，有时候我们会去把源代码拎回来，有的时候我们就是把一些别人编译好的结果拎回来，因为我们没有权利去改别人的代码。</p>



<p>还有些人说，我就是有权利可以得到所有代码。他们是什么人？测试。你这边把代码传上去了，那边有一个岗位叫测试岗，他需要把每天的代码拎回来去进行编译、检查呀，或者做这种测试流程。所以不同的角色，负责不同的模块的这些程序员呀、测试或者是架构师什么的，他们会有各自的权限，大家会去形成一个默契。一旦是超出了代码使用的权限范围，比如说这代码原来你不该用的，现在你把它checkout出来了，这些呢就会被记录下来，就容易被发现。</p>



<p>前几天呢，台积电发生过一次泄密事件，台积电两纳米技术泄密。其实本身做的非常隐蔽，他们干嘛呢？就是在这个笔记本上把代码显示出来，然后拿手机拍照，拍完照以后拿手机把这东西传走了。因为手机呢，你连接的是蜂窝网络或者5G网络，你再传任何东西出去的时候是没有日志的。你拿手机拍照的时候呢，这个电脑也不会有任何日志说我被人拍照了，我把它记下来。但是依然被发现了，原因就是有三个工程师，大量地访问了不在权限范围内，或者平时他不该访问的这些代码，这个事就可疑了。然后直接把人抓住，说你们到底干嘛了？说我们把代码checkout出来拍照，拍照完了传出去了。这个事情，通常是靠代码访问日志能够抓住。</p>



<p>那么除了代码访问日志之外，还有什么呢？就是文件访问日志。这个事呢，对于程序员来说未必有效。什么意思呢？比如说office文档、word文档、Excel文档、Powerpoint文档，它呢其实是有权限的。有些文档在打开的时候会记录谁可以打开，谁不可以打开，或者你在什么样的网络环境下可以打开，不在什么样的网络环境下不可以打开。还有一些文件呢，必须要使用特殊的软件进行解读，每一次这个软件解读这个文件的时候呢，都会在服务器上有日志会存下来，一旦发现你做了一些不该做的事情，也是很容易被发现的。</p>



<p>再往后呢，就是电脑访问日志。最简单的就是插U盘，你是不是把U盘插到这个电脑上去了？插上去以后到底拷贝什么文件没有？这个也是可以被发现的。还有呢，就是叫内部网关。公司里头呢，大家都是连Wifi，在公司里头都是有网关的。谁在公司内部把大量的数据拷出去了，它是会有记录的。刚才我们讲的这位XAI的华人小哥，他是把代码压缩了，压缩的过程呢，它就可以绕过网关的内容检测。比如说这个里头有大量的什么XAI、Grok什么代码，这些东西一旦压缩了以后就看不出来了，但是你的数量一定是不对的。你正常比如写个邮件出去，或者是我登录的什么网站去购物了，刷两条视频，这个都不是什么大问题。但是发现，你突然往外传了好几个G的文件出去，压缩的文件，我还不知道里边是什么，因为压缩的过程还可以加密码嘛，这哥们好像还加了个密码。这个事情也是很容易报警的。</p>



<p>除了这些之外还有是什么？就是可疑动作。就是你做了一些平时你不该干的事情。像这位华人小哥他干了一什么呢？他去修改日志去了。他知道说我去checkout了我平时不应该用的这些代码，它是有日志的，然后他就把日志去改掉了。但是你要知道，你修改日志这件事情，它也是有日志的，这个也很容易被发现。这个肯定很聪明的小伙子嘛，斯坦福的博士，这些人他对于真正安全上的事情呢，并没有那么了解，术业有专攻嘛。</p>



<p>但是大家要知道，绝大部分的工程师在离职的时候，都会带走自己的或者不是自己的代码，其实大家都干。那为什么他被抓住了呢？咱们原来讲，叫不打勤的，不打懒的，专打那不长眼的。被抓住呢，通常都是在离职前突击访问代码库，调取权限以外的代码，这些人是容易被抓住的。那个XAI这华人小哥也是干了这么个事情。如果你平时注意日积月累的话，这种通常是抓不住的。</p>



<p>近些年来呢，涉及中国人的窃密案件其实还是蛮多的。这也没办法，中国程序员多嘛，特别是AI领域里头，咱们的人确实是稍微的多了那么一点点。特斯拉在2019年呢，曾经起诉过一个中国小伙子，盗取了他们的自动驾驶的代码。当时被起诉的时候呢，这个小伙子是小鹏汽车美国研发中心负责自动驾驶的负责人。2019年起诉，大概到2020年和解掉。在这个过程中，小鹏也真的是把自己的代码拿出来给法院去检查去了，证明了小鹏的代码里头并没有使用特斯拉的代码。刚才我也讲了，这些代码拿出来了，通常不会直接使用的，而是会重新再去编写，但是你有了原来那个样板，特别是能够跑通的样板，对于你去写一个新的来说，是非常非常有帮助的。</p>



<p>苹果大概也是在2019年、2020年左右，也是起诉了两个中国工程师，窃取他们苹果的自动驾驶相关的代码，这两个工程师好像也是去小鹏了，后来应该也是和解掉了。谷歌呢，曾经起诉过一个中国工程师，他呢是窃取了谷歌的TPU芯片设计相关的代码，小伙子呢是跑去国内创业了，他是准备创业做一个自己的芯片公司。近些年来中国人干的这种事情还是蛮多的。</p>



<p>代码跟人的边界，有时候并没有那么清晰。搞到技术机密最简单的方式就是挖人。我们看谷歌这东西做的不错，我们也想做怎么办？上去挖人。其实像我原来很多的工作就是干这个事，上去找关系，这个人原来谁是他老师，谁是他同学，谁跟他共事过，哪块能够找到这个人，冲上去找。去找完了以后，坐下来跟人聊，聊完了觉得这一块行，你到我这应该能够搞定，我们就会去把人挖回来。</p>



<p>但是挖人的时候，你说我们会不会暗示或者明示对方要去拷贝代码呢？不会，绝对不会。但是我们会问他说，你过来了以后，你觉得怎么能够复现这个东西？或者说能不能够把这东西做的更好？其实通常我们把人挖回来，复现这个系统的时候，都会比原来做的更好一些，因为原来踩过的坑，他不用再踩一遍了嘛，而且还有一些新的技术，以前那些包袱就可以扔掉了，所以通常还会再提升一点点。但是当我们去跟他沟通说，你怎么去复现这个系统的时候，被挖的人呢也就知道该怎么去做这个事。但是我们不会去明示或者暗示对方，如果我们遇到有些人跟我讲说，我有原来那个代码，我可以再搞一遍，我们还会专门地提醒他说：“不行，我们是不能承担这种法律风险的。你到这必须要保证所有代码是干净的，要么你重写，要么你使用开源代码，你一定要遵守原来的开源协议，你不能偷人家代码。”这个事我们一定要讲清楚。</p>



<p>这种挖人呢，当时我们其实还是进行的非常的轰轰烈烈的。有一段时间各大厂在美国呢，都还是有研发中心的，可以就近挖人。而且挖完人以后呢，也不用说你还要回国呀，还要怎么样。而且他们在美国这些研发中心，也给人发H1B，也给人去整绿卡去，都是一样的。</p>



<p>挖人挖的最猛的时候，有一个故事就是Facebook的食堂故事。当时我们到美国硅谷去，都是跑到各个公司去吃人食堂，吃谷歌食堂、吃微软食堂、吃LinkedIn的食堂、吃Facebook食堂。他们这些人其实本来也在各个食堂之间串来串去的，他们食堂都是免费吃的，不用给钱，没有饭票，也没有说你进来先要看一个工卡，没有工卡不让吃，没有这事，访客一样吃。但是访客也是有证，你身上挂一访客证，你可以到人食堂里吃饭去。谷歌一开始因为食堂做的特别好，很多Facebook的人在谷歌吃两顿饭以后，就被人挖走了。后来Facebook痛定思痛，说不行，我一定要自己整一食堂，我要做的比谷歌好吃。然后Facebook挖了很多谷歌的人过去。但后来呢，出了一个什么大事呢？就是腾讯的人跑到Facebook的食堂里去吃饭，当然肯定也是有Facebook内部的员工带着进去，你不能说大街上人就直接进去，这是肯定不行的。进去了以后，这些腾讯的人就开始在Facebook的园区里头面试了，面试完了以后，就把很多Facebook的人直接挖到腾讯的办公室里边去了。这个对于Facebook来说是完全无法忍受的，说你带人进来吃个饭没问题，这点钱我们还是花得起的，但是你带着竞争对手进来，然后挖人，这个有点太过分了。当时是开除了好几个人，这个也是比较有名的一个案件。</p>



<p>下一件事就是这个代码的问题了。代码呢，就是把人挖回来从头再来，通常还是要有一定成本的。有些人比较着急，所以就会有这种偷代码的事情不断地被发现。而且其实很多偷代码的事情都是怎么发现的？就是一些比较高层的这些人被抓的。这些高层的人其实是比较容易被发现，为什么呢？因为他们已经脱离实际工作了，对于底层的很多安全手段也不是那么了解，而且平时你说作为一个管理者，自己又不是那么懂代码，也没有那么多代码是平时他每天要用的，他可能每天看个这个报告就完了。这些人如果突然跑去下载了一堆代码的话，是更容易被抓住。像我们以前挖人，其实是比较喜欢挖这种人的，我们管他们叫“技术官僚”。为什么挖他们呢？他又不能直接上手干活，这可能跟普通人的想法不太一样。原因很简单，就是我们一旦把这个人挖回来了，他就可以快速地把以前的手下、各种亲朋故旧全都带回来，他是有自我组建团队能力的。但是有一些这样的人呢，就一拍脑袋说，我是不是把代码也弄回来？这种人就容易被抓。</p>



<p>中国跟美国的竞争，其实现在大家看到AI领域里头，就是在做这件事情。他呢跟冷战时代其实已经完全不一样了。冷战时代呢，美苏之间隔离的还是很严格的，没有那么多的人员进行交流。虽然也确实有很多俄罗斯科学家或者苏联科学家在美国上班，但是这个量要比今天在AI公司里头打工的中国人要少太多太多了。即使这样的话，奥本海默在扔完原子弹以后，也是被调查了很久嘛，看看他是不是亲共、亲俄嘛。我记得去看奥本海默的电影，从头到尾就是奥本海默坐在那接受调查的一个过程。</p>



<p>AI领域里头想要离开华人做事情，即使在美国其实也不太现实了。二战的时候做曼哈顿计划，你离开俄罗斯科学家，离开苏联科学家，你把这事做成了还是比较可能的。但是你估计离开德国科学家，离开犹太科学家，你这个原子弹就做不出来了。现在在AI领域里头，你离开中国科学家，这事可能也不太容易搞定了。所以在这种偷代码，或者是一些闹得不愉快的事情里头，遇到中国工程师或者科学家的概率还是很高的，甚至会远超过50%。为什么呢？虽然现在很多公司里头看人员名单，说中国工程师好像也就是占到一半，或者是一半上下的一个水平，但其实大家要想清楚，这一半上下的中国工程师，他们主要都是工程师。你这不废话吗？这个说的另外的是什么呢？就是其他的那一半的人，可能主要的不是工程师了，他们可能有一些人是什么财务、HR或者是法务。真正前头加班加点攻坚的这些工程师，大部分都是中国人。另外一点是，中国公司在这一块也有巨大的投入，中国大厂站在旁边，虎视眈眈地准备挖人。所以呢，以后出现这种不愉快事件里头，中国人在里边占的比例应该会不低的。</p>



<p>总结一下吧。马斯克的代码被偷了，愤然起诉了中国工程师。这个工程师应该还是中国籍，大概是加拿大的枫叶卡和美国的H1B。中美之间其实很难通过法律、竞业或者其他的任何手段，真正进行技术隔离。AI这个领域里头，美国人希望靠各种禁运，靠各种的法律手段，让这些技术在某些公司内部去运转，这个事儿可能性不大，必然会在AI领域里头，两个国家齐头并进。</p>



<p>好，这个故事就跟大家讲到这里，如果有后边进一步的瓜，咱们再继续分享。好，感谢大家收听，请帮忙点赞、点小铃铛，参加<a href="https://discord.gg/ppKsNkttTv" target="_blank" rel="noopener">DISCORD讨论群</a>，也欢迎有兴趣、有能力的朋友加入我们的<a href="https://www.youtube.com/channel/UCUGLhcs3-3y_yhZZsgRzrzw/join" target="_blank" rel="noopener">付费频道</a>，再见。</p>
]]></content:encoded>
					
		
		
			</item>
		<item>
		<title>极狐GitLab间谍案揭秘：外资控股与中美制裁的背后真相</title>
		<link>https://lukefan.com/2024/12/03/%e6%9e%81%e7%8b%90gitlab%e9%97%b4%e8%b0%8d%e6%a1%88%e6%8f%ad%e7%a7%98%ef%bc%9a%e5%a4%96%e8%b5%84%e6%8e%a7%e8%82%a1%e4%b8%8e%e4%b8%ad%e7%be%8e%e5%88%b6%e8%a3%81%e7%9a%84%e8%83%8c%e5%90%8e%e7%9c%9f/</link>
		
		<dc:creator><![CDATA[老范 讲故事]]></dc:creator>
		<pubDate>Tue, 03 Dec 2024 00:46:34 +0000</pubDate>
				<category><![CDATA[OpenSource]]></category>
		<category><![CDATA[GitHub]]></category>
		<category><![CDATA[GitLab]]></category>
		<category><![CDATA[Gitlab功能]]></category>
		<category><![CDATA[Gitlab安全]]></category>
		<category><![CDATA[Gitlab开源版本]]></category>
		<category><![CDATA[Gitlab总部]]></category>
		<category><![CDATA[Gitlab数据]]></category>
		<category><![CDATA[Gitlab服务器]]></category>
		<category><![CDATA[Gitlab用户]]></category>
		<category><![CDATA[Gitlab财报]]></category>
		<category><![CDATA[Gitlab部署]]></category>
		<category><![CDATA[Gitlab项目]]></category>
		<category><![CDATA[GTLB]]></category>
		<category><![CDATA[PostgreSQL]]></category>
		<category><![CDATA[VIE企业]]></category>
		<category><![CDATA[VIE架构]]></category>
		<category><![CDATA[中科星图]]></category>
		<category><![CDATA[中美制裁]]></category>
		<category><![CDATA[互联网企业]]></category>
		<category><![CDATA[交付]]></category>
		<category><![CDATA[代码传输]]></category>
		<category><![CDATA[代码发布]]></category>
		<category><![CDATA[代码安全]]></category>
		<category><![CDATA[代码审核]]></category>
		<category><![CDATA[代码版本]]></category>
		<category><![CDATA[企业代码管理]]></category>
		<category><![CDATA[低税制国家]]></category>
		<category><![CDATA[俄罗斯入侵乌克兰]]></category>
		<category><![CDATA[信创]]></category>
		<category><![CDATA[信创活动]]></category>
		<category><![CDATA[内资公司]]></category>
		<category><![CDATA[内部纠纷]]></category>
		<category><![CDATA[卫星控制]]></category>
		<category><![CDATA[合规认证]]></category>
		<category><![CDATA[团队协作]]></category>
		<category><![CDATA[国产操作系统]]></category>
		<category><![CDATA[国产数据库]]></category>
		<category><![CDATA[国产替代]]></category>
		<category><![CDATA[国产芯片]]></category>
		<category><![CDATA[国防特种地理信息系统]]></category>
		<category><![CDATA[外汇管控]]></category>
		<category><![CDATA[外资企业]]></category>
		<category><![CDATA[外资控股]]></category>
		<category><![CDATA[安全管理]]></category>
		<category><![CDATA[实体数汇报]]></category>
		<category><![CDATA[客户敏感信息]]></category>
		<category><![CDATA[开源版本]]></category>
		<category><![CDATA[开源软件]]></category>
		<category><![CDATA[律师]]></category>
		<category><![CDATA[微软]]></category>
		<category><![CDATA[敏感信息]]></category>
		<category><![CDATA[文档管理]]></category>
		<category><![CDATA[新加坡GitLab]]></category>
		<category><![CDATA[服务器部署]]></category>
		<category><![CDATA[本地化服务]]></category>
		<category><![CDATA[权限管理]]></category>
		<category><![CDATA[极狐GitLab]]></category>
		<category><![CDATA[气象生态]]></category>
		<category><![CDATA[爱尔兰]]></category>
		<category><![CDATA[版本控制]]></category>
		<category><![CDATA[用户代码]]></category>
		<category><![CDATA[监控系统]]></category>
		<category><![CDATA[研发团队]]></category>
		<category><![CDATA[程序员]]></category>
		<category><![CDATA[空间地理信息系统]]></category>
		<category><![CDATA[红杉基金]]></category>
		<category><![CDATA[纯内资公司]]></category>
		<category><![CDATA[纳斯达克上市公司]]></category>
		<category><![CDATA[美国技术]]></category>
		<category><![CDATA[美国政府]]></category>
		<category><![CDATA[联想基金]]></category>
		<category><![CDATA[航天测绘]]></category>
		<category><![CDATA[裁员]]></category>
		<category><![CDATA[认证考核]]></category>
		<category><![CDATA[财报]]></category>
		<category><![CDATA[软件工程]]></category>
		<category><![CDATA[软件开发管理]]></category>
		<category><![CDATA[违规合作]]></category>
		<category><![CDATA[间谍案]]></category>
		<category><![CDATA[集成构建]]></category>
		<category><![CDATA[韩国]]></category>
		<category><![CDATA[项目管理]]></category>
		<guid isPermaLink="false">https://lukefan.com/?p=1742</guid>

					<description><![CDATA[家人们！你们听说了吗？！最近爆火的极狐GitLab间谍案！😱😱😱

作为一个资深打工人，我必须得来跟大家说道说道！

事情是这样的，极狐GitLab的一个架构师，直接把自己公司给举报了！说公司有外资背景，还偷偷收集客户信息传回美国！还接了中科星图的单子，这可是被美国列入实体名单的公司啊！这瓜吃的我是一愣一愣的！😨😨😨

极狐GitLab到底是干嘛的？其实就是一个软件开发管理平台，很多程序员小哥哥都在用！但是！它背后的公司GitLab，可是在美国上市的！极狐GitLab是它在中国的合资企业，大股东是新加坡GitLab，所以说到底还是外资控股！

那问题来了，它一边说自己是国产替代，一边又有外资背景，还偷偷传数据，这操作属实是有点迷惑！🤔🤔🤔

现在好了，事情闹大了，很多公司都开始删除跟极狐GitLab的合作信息了，这地雷谁敢踩啊！

唉，说到底，咱们程序员也是打工人，只想好好写代码，怎么就被卷进这种国际事件里了呢？！😭😭😭

最后，我还是想说，谨慎使用极狐GitLab吧！毕竟代码安全无小事啊！家人们，你们怎么看？评论区告诉我！👇👇👇

极狐GitLab间谍案揭秘：外资控股与中美制裁的背后真相

极狐GitLab间谍案在11月28号被曝光，揭露了公司外资控股比例超过50%，并涉嫌与被美国列入实体名单的中科星图违规合作。举报者指出，极狐GitLab涉嫌秘密搜集客户敏感信息并向美国汇报，可能导致中美两国对其制裁。GitLab是一家提供软件开发过程管理系统的公司，允许用户自部署以避免代码泄密。极狐GitLab自称国产替代，但实际上是通过VIE架构运作的外资企业。事件本质可能是公司内部纠纷引发的举报，但也反映了外资企业在中国运营的复杂性和敏感性。]]></description>
										<content:encoded><![CDATA[
<figure class="wp-block-embed is-type-video is-provider-youtube wp-block-embed-youtube wp-embed-aspect-16-9 wp-has-aspect-ratio"><div class="wp-block-embed__wrapper">
<iframe title="极狐GitLab间谍案揭秘：外资控股与中美制裁的背后真相" width="900" height="506" src="https://www.youtube.com/embed/UKirNGLpmYU?feature=oembed" frameborder="0" allow="accelerometer; autoplay; clipboard-write; encrypted-media; gyroscope; picture-in-picture; web-share" referrerpolicy="strict-origin-when-cross-origin" allowfullscreen></iframe>
</div></figure>



<p>极狐Gitlab间谍案到底是怎么一回事？大家好，欢迎收听老范讲故事的YouTube频道。今天咱们来讲一讲极狐的故事。事情呢是在11月28号曝光的，曝光人呢就是极狐Gitlab自己家的架构师，名字叫扬州。他呢主要曝光了几件事情。</p>



<p>第一个说公司是有外资背景的，而且外资控股比例超过50%。第一大股东是GitLab新加坡分公司，占股46%。而极狐GitLab呢一直宣传自己是国产软件，还去参加各种信创，也就是国产替代的活动，这肯定是欺诈。这个里边存在叫违规合作的问题，因为极狐接了一个叫中科星图的20万的单子，做了合作。中科星图干嘛的呢？做航天测绘以及卫星控制和运维、空间地理信息系统，包括国防特种地理信息系统，以及一些气象生态这样的业务。在这样的一个情况下，你一个外资公司去跟他合作，这事合适吗？</p>



<p>还有什么呢？中科星图是被美国列到实体名单里的，因为他肯定是做大量军用的东西嘛。你一个美国公司下边的子公司，向中科星图这样的一个被美国放到实体名单里的公司去提供这种技术合适吗？是不是应该受到处罚呢？他做了这样的一个举报。而且举报的时候呢还讲了说，这个Gitlab的后台有一套监控系统，它呢会秘密地搜集客户的敏感信息，包括你有多少个员工、开发了多少个项目、做了多少次编译、做了几次发布，这些呢都会向美国的服务器进行汇报。而且公司的负责人也会每个月或者每个季度向美国总部进行汇报，涉嫌泄密。</p>



<span id="more-1742"></span>



<p>最终的结论是什么呢？就是中美两国，你们都应该对他进行制裁。他冒充式国产软件，参加各种信创活动，进行国产替代，你们应该去把这个人民内部的敌人揪出来。美国政府说，你看，你明明把这个中科星图列为实体名单了，他还在为我们提供服务，你也得该制裁他。</p>



<p>在这样的一个举报信息出来以后，咱们首先要知道Gitlab是干嘛的。大家注意啊，Gitlab叫GitLab，跟我们平时经常使用的这个GitHub是两个不同的东西。GitHub是全世界最大的开源软件的存储仓库，是由微软100%收购的一个项目。这个GitHub上呢其实也提供很多的软件工程管理相关的功能。而Gitlab呢就是我给你提供一个类似于GitHub的这样的一个平台，但是呢它是允许你单独部署的，你可以把整个的系统部署到你自己的服务器上去，这样它就不会再存在各种泄密或者是一些代码安全的问题。<br>因为很多人不希望说：“我的代码都存到像GitHub这样的在美国的服务器上去。”这样你就可以自己部署一套。GitLab主要干这个事的。它是软件开发过程管理的一个系统，主要的功能第一个叫版本控制，就是呃，你这个是哪个版本的，每个版本之间到底有什么差异。第二个呢是集成构建和交付，这个在软件工程里是一个特殊的名词，这个意思是什么？就是啊，当你去更新了代码以后，它会自动的帮你去做软件构件，就是该编译的去编译，然后呢自动的去进行部署，你的用户就可以使用到新版本了。这个是不需要程序员也好，或者是工程维护人员也好，做特别多的手工工作的啊，但是可以自动完成的，这个叫集成构建和交付。</p>



<p>然后呢，还有项目管理的功能啊，就是任务跟踪、进度管理啊，这个就是老板们用的功能。还有呢是代码审核啊，所有的这种代码版本控制系统都是会有代码审核的，你上交上来以后，我允不允许你并入啊，你的代码的质量怎么样啊，它会有一些这样的功能。然后啊，安全跟权限管理，所有的企业用的代码管理系统都会有这样的功能，在里头谁可以看到哪些代码，可以读哪些代码，可以改哪些代码，这个是要有权限管理的，要不然的话，整个的工程管理就会混乱掉，所以这块也是很重要的啊。</p>



<p>以及文档管理，项目里头只有代码肯定是不行的，还有大量的文档啊，然后有团队协作，它里头比如说有论坛啊，还有一些内部的这种通信系统。还有开源版本，我以前的公司也用这东西啊，只是呢，这个开源版本的系统是由程序员部署上去的。就程序员都很喜欢用这样的系统啊，但是其他岗位的人基本上是不怎么用的。</p>



<p>这个GitLab呢，是一家纳斯达克上市公司，它的股票代码是GTLB。应该到目前为止，它的市值是102.27亿美金。创始人呢是两个人，一个是乌克兰人，一个荷兰人。在俄罗斯入侵乌克兰之后，力挺乌克兰啊，他当时就停止了俄罗斯和白俄罗斯的业务，然后组织捐款，还公开发现谴责俄罗斯的入侵。</p>



<p>极狐GitLab到底是一个什么样的公司呢？它呢其实是一家合资企业，GitLab在全世界有很多的这种分支机构，特别是在新加坡、爱尔兰这种低税制的国家，一定会有一些分支机构。像新加坡、爱尔兰这种低税制国家的公司呢，就会去这种像中国、韩国或者是其他的一些对外汇有管控或者税制比较严苛的这种国家里边去设置分子公司，他不会直接从美国去给你设分子公司进去。所以啊，极狐GitLab的上面的母公司。<br>是新加坡的GitLab啊，不是美国GitLab。在中国，因为它有外汇管控嘛，挣到的钱是不可以直接拿走的。他可以通过一些VIE的方式，让美国的GitLab的这个上市公司可以享受到你所有的利润，让他的所有买GitLab股票的人都可以享受到，包括中国在内的GitLab的这种收益。</p>



<p>极狐GitLab呢，除了新加坡GitLab这个股东之外，剩下的股东基本上都是基金，诸如红杉、联想等各种各样的基金。那么这些基金里头，应该还有一些是美元基金。GitLab新加坡占46%，再加上一些美元基金进来，所以它这个里面的外资占比超过50%是非常正常的。</p>



<p>但是呢，极狐GitLab同时也在喊自己是国产替代，我们是信创。他怎么能够做成国产替代呢？明明是一家外资公司。第一个呢，他承诺说，我们是独立运营和国产化研发，就是他国内有整个的研发团队。第二个呢，他支持和适配国产的各种环境和系统，所有这些国产芯片、国产操作系统、国产数据库我们都支持，不需要再使用美国芯片或者是美国的这种操作系统，也不需要使用PostgreSQL这样的美国数据库，我们都使用国产的就完事了。</p>



<p>而且它的功能也贴合国内的需求，因为国内肯定在这块的需求是比较高的。它也有很多这样的改造、本地化的服务和支持。你有任何问题，我们这有人说中文的人给你提供服务。而且呢，做了大量的合规和安全方面的认证。说你作为一个软件企业，使用极狐GitLab，你不要直接使用美国那个GitLab，使用极狐GitLab，我们是通过合规认证的。这是一家这样的企业。</p>



<p>那么这种公司呢，它肯定是有非常多的实体，也就是非常非常多的子公司在下面。但是说子公司呢，不是那么科学。因为很多的这种公司跟最上面的极狐或者是跟新加坡的GitLab是没有股权关系的，就跟我们做VIE架构那个是一样的。它里头一定是有一些纯内资公司，在里面你去拿各种的认证的时候，各种合规考核的时候，一定是用这个纯内资公司去做的。</p>



<p>中国的在美国上市的这些互联网企业，实际上都是这么工作的。他们也是可以靠纯内资企业去拿到所有互联网企业所需要运营的这种牌照，然后再保证美国的所有股民可以通过买他们家的股票来享受在中国产生的所有利润。所以呢，极狐GitLab应该也是如此，它是一个VIE的企业。<br>它上面有新加坡Gitlab的这种大股东，一定也有纯内资，就是一点外资股份都没有的公司，握有所有的牌照。具体做的事情就是，他前面讲了，他拿美国的Gitlab回来去改造，适配国产操作系统、国产芯片、国产数据库、国产的研发需求，以及适配本地的服务和支持。那么到底是一个什么样的事呢？这个事情的本质其实很简单，就是公司内部纠纷。大概率呢，就是裁员了，估计是把这位兄弟给裁掉了。</p>



<p>一位软件工程师，对于VIE架构，对于国内的很多的系统，或对于很多的这种外资企业在中国运营的方式，不是那么了解的。兄弟就义愤填膺地跑出来举报了。Gitlab代码会不会定期向美国做汇报呢？这件事其实是这样，Gitlab大量是部署在本地的，而部署Gitlab的这个环境呢，很多压根就不连外网。就是你想去向美国汇报，你也没有这个能力，这个是比较普遍的一个情况。</p>



<p>当然也有很多公司，像我们以前公司，Gitlab那个服务器是连外网的，甚至我们的Gitlab的服务器还是在公网上，还根本就不在内网里头。在这样的情况下呢，这个服务器确确实实是会向Gitlab的总部去报东西的。当然报的是什么呢？实际上主要是Gitlab下面的一些版本数，他们叫实体数汇报，但是呢，他只记个数，算是满足Gitlab的一种虚荣心吧。具体的代码他其实是不会往回传的。如果你真的把这个用户的代码传回去的话，那么Gitlab的名声就算废了，就再也不会有任何人使用他，甭管中国人还是美国人都不会使用他。</p>



<p>所以呢，他不会往回去传具体的任何代码，但是他会把你的各种实体数，像刚才他讲的是你有多少个员工，你有多少个项目，你有多少个版本，你做了多少次发布，他把这些玩意会传回去。传完了以后呢，等下一次Gitlab去写财报的时候，他就写，我们一共有这么多用户用上了，这些用户里头涵盖多少个程序员，涵盖多少个项目，涵盖多少个版本，这个东西可以写在财报里。虽然统计不完整，但是我们也有，因为你一旦是开源版本，你部署了，或者特别是部署到一些内网里边去了，这个东西是没法往回报的。</p>



<p>像我现在可以把Gitlab直接部署到我们家NARS上，这个他没法往那个美国服务器上去汇报。下一次Gitlab发这个财报的时候，就不会包含我们家的数据。它就是这样的一个系统。所以，这里头你说有没有定期的向美国服务器传东西。<br>有一些情况是传了的。但是呢，你说有没有传代码，哎，他概率是没有。至于说公司的老板是不是定期要向美国的总部汇报，你是人家的分子公司，你凭什么不向人汇报？当然，你说我在汇报的过程中是不是泄密了，这个咱就不知道了。而且人家关着门开会的。</p>



<p>至于美国政府是不是应该给GitLab进行制裁呢，我觉得这件事呢，律师又有事干了。美国就是律师国家嘛，律师可以挣一些钱重新去证明说我们仅仅是授权给了一个中国的子公司，极狐GitLab下边的某一个子公司。这个公司呢，使用我们的代码，使用完了以后，他们再去向别人提供服务，这事跟我就没关系了，应该是可以进行隔离的。这不是什么特别大的问题。</p>



<p>但是这个事呢，叫癞蛤蟆蹦脚面上，他就恶心你。因为你一旦说了，就很多人说，哎呀，看，有间谍了，又怎么样了？现在呢，跟极狐GitLab进行合作的很多企业，都已经把这个页面删掉了。特别是刚才咱们讲这个中科星图，已经把这个合作的事情删掉了。极狐GitLab自己的网站上，也把一些不太适合出现的公司给删掉了。这是非常不好的风气，本来大大方方能说的事情，现在不能说了。</p>



<p>这个事情呢，很像什么呢？很像现在很多人去举报什么，退役体操运动员、击剑运动员、游泳运动员在短视频里跳舞，进行擦边表演，跟这个事非常像。为什么呢？你想想，这帮体操运动员，他参加比赛的时候穿那个衣服，他擦边不？游泳运动员能穿着棉袄下去游泳不？击剑运动员去击剑的时候，那身衣服显身材不？这个事情你说他是不是有擦边的？有人看了以后，是不是会有一些不好的联想？至少是举报的人自己，会不会有一些不好的联想？你也不能说他完全没道理，也就是如此。</p>



<p>但如果真的照这个方向发展下去的话，那以后我们是不是应该像穆斯林国家那样，大家都穿上黑袍呢？至于说使用美国技术，有美国资本的公司所提供的技术，这件事情你真的摘得干净吗？你摘不干净的，实际上在圈里头的人，大家就这么使吧。只有一些别有用心的人，可能像这位朋友，是被裁员了，还是出现什么样问题了，他就要跳出来恶心你一下。这个事情的本质大概也就是如此了。</p>



<p>好，这个故事就跟大家讲到这里，也借此呢，跟大家稍微普及一下GitLab到底是干嘛的。好，感谢大家收听，请帮忙点赞，点小铃铛，参加Discord讨论群，也欢迎有兴趣、有能力的朋友加入我们的付费频道，再见。</p>
]]></content:encoded>
					
		
		
			</item>
		<item>
		<title>实习生代码投毒事件震惊ByteDance：恶意攻击如何利用AI大模型漏洞颠覆数千万美元的损失</title>
		<link>https://lukefan.com/2024/10/22/%e5%ae%9e%e4%b9%a0%e7%94%9f%e4%bb%a3%e7%a0%81%e6%8a%95%e6%af%92%e4%ba%8b%e4%bb%b6%e9%9c%87%e6%83%8abytedance%ef%bc%9a%e6%81%b6%e6%84%8f%e6%94%bb%e5%87%bb%e5%a6%82%e4%bd%95%e5%88%a9%e7%94%a8ai%e5%a4%a7/</link>
		
		<dc:creator><![CDATA[Luke Fan]]></dc:creator>
		<pubDate>Tue, 22 Oct 2024 01:10:48 +0000</pubDate>
				<category><![CDATA[AIGC]]></category>
		<category><![CDATA[字节跳动，故事多]]></category>
		<category><![CDATA[AIGC可信度]]></category>
		<category><![CDATA[AI协作]]></category>
		<category><![CDATA[AI可信性]]></category>
		<category><![CDATA[AI大模型]]></category>
		<category><![CDATA[AI安全]]></category>
		<category><![CDATA[AI工程风险]]></category>
		<category><![CDATA[AI技术挑战]]></category>
		<category><![CDATA[AI系统]]></category>
		<category><![CDATA[ByteDance]]></category>
		<category><![CDATA[Huggingface平台]]></category>
		<category><![CDATA[Huggingface漏洞]]></category>
		<category><![CDATA[IT业界新闻]]></category>
		<category><![CDATA[IT内鬼]]></category>
		<category><![CDATA[IT安全]]></category>
		<category><![CDATA[IT安全策略]]></category>
		<category><![CDATA[IT工程]]></category>
		<category><![CDATA[IT灾难恢复]]></category>
		<category><![CDATA[PyTorch修改]]></category>
		<category><![CDATA[Pytorch集群]]></category>
		<category><![CDATA[人员管理挑战]]></category>
		<category><![CDATA[人工智能实习生]]></category>
		<category><![CDATA[人工智能未来]]></category>
		<category><![CDATA[人工智能治理]]></category>
		<category><![CDATA[人工智能管理]]></category>
		<category><![CDATA[人工智能风险]]></category>
		<category><![CDATA[人机协作]]></category>
		<category><![CDATA[代码安全]]></category>
		<category><![CDATA[代码漏洞]]></category>
		<category><![CDATA[代码管理]]></category>
		<category><![CDATA[代码隐患]]></category>
		<category><![CDATA[企业损失]]></category>
		<category><![CDATA[企业数据]]></category>
		<category><![CDATA[企业风险管理]]></category>
		<category><![CDATA[信任危机]]></category>
		<category><![CDATA[前沿科技]]></category>
		<category><![CDATA[大数据安全]]></category>
		<category><![CDATA[大模型开发]]></category>
		<category><![CDATA[安全事件]]></category>
		<category><![CDATA[安全漏洞]]></category>
		<category><![CDATA[安全管理]]></category>
		<category><![CDATA[安全评估]]></category>
		<category><![CDATA[实习事故]]></category>
		<category><![CDATA[实习生]]></category>
		<category><![CDATA[实习生影响]]></category>
		<category><![CDATA[实习生投毒]]></category>
		<category><![CDATA[工程信任]]></category>
		<category><![CDATA[工程漏洞]]></category>
		<category><![CDATA[工程管理]]></category>
		<category><![CDATA[开发者风险]]></category>
		<category><![CDATA[开源开放]]></category>
		<category><![CDATA[开源系统]]></category>
		<category><![CDATA[恶意代码]]></category>
		<category><![CDATA[技术创新]]></category>
		<category><![CDATA[技术应用]]></category>
		<category><![CDATA[技术治理]]></category>
		<category><![CDATA[投毒事件]]></category>
		<category><![CDATA[操作风险]]></category>
		<category><![CDATA[故障排除]]></category>
		<category><![CDATA[数千万美元]]></category>
		<category><![CDATA[数字化管理]]></category>
		<category><![CDATA[数字时代]]></category>
		<category><![CDATA[数据保密]]></category>
		<category><![CDATA[数据分析]]></category>
		<category><![CDATA[数据攻击]]></category>
		<category><![CDATA[数据污染]]></category>
		<category><![CDATA[数据泄露]]></category>
		<category><![CDATA[数据隐患]]></category>
		<category><![CDATA[未来合作挑战]]></category>
		<category><![CDATA[模型参数扰动]]></category>
		<category><![CDATA[渗透测试]]></category>
		<category><![CDATA[现代技术治理]]></category>
		<category><![CDATA[系统攻击]]></category>
		<category><![CDATA[系统漏洞]]></category>
		<category><![CDATA[系统脆弱性]]></category>
		<category><![CDATA[网络安全]]></category>
		<category><![CDATA[训练模型]]></category>
		<category><![CDATA[黑客攻击]]></category>
		<category><![CDATA[黑客风险]]></category>
		<guid isPermaLink="false">https://lukefan.com/?p=1648</guid>

					<description><![CDATA[大家好！今天我来聊一个令人发指的事件——ByteDance的实习生投毒事件！啊啊啊啊啊啊啊！你能想象吗？一个博士生，原本应该学习和创造，却阴差阳错成为了黑客，给整家公司带来了数千万美元的损失！😱

事情发生在6月份，一位姓田的博士生因为对公司待遇的不满，竟然在代码里藏下了恶意代码！一开始，他的代码看似只是调试用的，但其实暗藏杀机，等到上传到服务器时，就像插上了定时炸弹！💣

这位实习生利用了Huggingface的漏洞，随意修改了Pytorch的代码，导致整个训练集群崩溃、实验进程被随机杀死，结果可想而知——数据评测结果杂乱不堪，前期辛苦付出全部泡汤！😩

想象一下，这就像你在试密码时，突然有人来给你调乱了所有的数值，难以招架啊！这样的“投毒”手段是黑客界的常用伎俩，如今却出现在了一名实习生身上，真是让人匪夷所思！

而且，最恐怖的是，他还悄悄参加了故障排除会议，看着同事们一边忙乱，一边调试代码！而他心里却在暗自窃喜，继续完善他的攻击手段。🤯

最终，这位实习生被辞退并通报了学校，前途一片黯淡。但这事件告诉我们：在高压和怨怼的环境下，团队合作显得多么脆弱！🔒

这次事件不仅让人感叹，也引发了我们对未来AI与人类协作的思考。今后，我们如何跟AIGC合作，才能确保不再犯错？这是一个值得深思的问题，未来还会有更多挑战等着我们去面对！💡

希望大家点赞、关注我的频道，感谢你们的支持，一起探讨更多有趣的话题！再见！👋✨

实习生代码投毒事件震惊ByteDance：恶意攻击如何利用AI大模型漏洞颠覆数千万美元的损失

在ByteDance，一位不满的实习生通过恶意代码投毒，大规模攻击AI大模型训练集群，造成数千万美元的损失。这起事件揭示了AI安全管理中的脆弱性：他巧妙地隐匿在Huggingface漏洞中操控Pytorch集群，随机打乱训练进程，篡改模型参数。事件迫使多名员工的数月努力付诸东流，凸显出工程管理中信任和开放系统的风险。此外，随着AI的广泛应用，如何平衡安全与创新开放成为现代技术治理的重要议题。这不仅涉及AI模型的可信度，还有未来AITG在协作中的角色及其可信性。]]></description>
										<content:encoded><![CDATA[
<figure class="wp-block-embed is-type-video is-provider-youtube wp-block-embed-youtube wp-embed-aspect-16-9 wp-has-aspect-ratio"><div class="wp-block-embed__wrapper">
<iframe title="实习生代码投毒事件震惊ByteDance：恶意攻击如何利用AI大模型漏洞颠覆数千万美元的损失" width="900" height="506" src="https://www.youtube.com/embed/axtgRvOKOjc?feature=oembed" frameborder="0" allow="accelerometer; autoplay; clipboard-write; encrypted-media; gyroscope; picture-in-picture; web-share" referrerpolicy="strict-origin-when-cross-origin" allowfullscreen></iframe>
</div></figure>



<p>ByteDance的AI大模型被他们自己家的实习生投毒。这是一个什么故事？大家好，这里是老范讲故事的YouTube频道。今天咱们来讲一讲这起投毒事件。不是说举个小药瓶去投毒，而是恶意代码投毒。</p>



<p>事情发生在6月份，一位姓田的博士生在ByteDance实习。因为某些待遇或者资源分配问题，他对ByteDance感觉不满，于是就在代码里面进行了投毒。投毒的方式是他自己进行了一些代码维护，但这些代码是安全的，主要是一些调试用的代码。这些代码去读取一些上传文件之后，就具备了攻击性。</p>



<p>什么意思呢？就是我们去训练大模型的时候，需要把大量的信息数据上传到大模型进行训练。他的这种调试代码上传到服务器上以后，这个时候还是安全的，然后把一些恶意代码隐藏在训练数据里边。他把这些数据读出来以后，就对整个ByteDance的一些训练集群进行了攻击。这其实是黑客普遍采用的一些手段。</p>



<span id="more-1648"></span>



<p>谷歌就曾经将所有含有root代码的应用全部下架。什么叫root代码？就是安卓应用里头有一些代码，它可以帮助这些安卓程序获得root权限，也就是我们俗称的越狱。以前这些代码会被藏在安卓应用的各种数据文件里。大家知道，我们上传的一个应用里头，有一部分是执行代码，还有一部分是数据文件，比如图片呀或者是一些其他的应用需要的一些数据。他们把一些root代码存在这些数据里头，谷歌扫描发现了以后，就会把所有这些应用全下架。</p>



<p>苹果其实也干过这种事。苹果是把所有带有热更新的应用都下架了。这什么意思呢？就是你上传到苹果的时候，这里边是安全的，没有任何问题。但是，你会在这个应用运作的过程中，通过热更新的插件，从远端去下载一部分代码到苹果手机的本地去运行。实际上，这些代码就是躲过了苹果的代码检测。这位田姓博士也是如此，他自己签名上传的代码，其实这种代码上传都是要自己写名字的。</p>



<p>就知道是谁传的这些代码的，都是安全的。他呢，通过读取数据文件里边的一些攻击代码，然后去执行各种攻击操作。它呢，利用了Huggingface的一个漏洞。Huggingface应该是大模型时代最大的开源服务平台了，大量的开源模型、开源数据及开源数据包，都是在这个平台上去运作的。Huggingface相当于是大模型时代的GitHub。但是呢，这里面也是有一些漏洞了。他利用其中一个漏洞，修改了Pytorch的这个集群里边的一些代码。Pytorch是梅塔开源的，现在应用非常广泛的大模型底层支持的框架。</p>



<p>他这种修改呢，会随机的杀死很多的实验进程。因为像大模型训练就是这样，就是说我们现在开始训练了啊，它不是说这边一一命令开始，那边就结束了。它需要很长时间。在这么长的时间里头，可能就会有一些进程就失败了。他的这个程序上去以后呢，就随便点杀几个，说你们就直接死机吧，你们就不用干活了。所以导致呢，这些训练整个就没有完成。而且呢，还会去故意修改其他同事模型上的一些参数。</p>



<p>其实我们现在讲的开源大模型，这个词语不准确啊，应该叫开放权重或者开放一些参数的这些大模型。他去把里头的一些权重、一部分参数给改了，那么导致这些模型最后训练、评测的各种结果就完全不可控了。他就做了很多这样的事情。而且还干嘛，还去参加各种故障排除会议，然后根据故障排除会议的各种结果，再去修改自己的攻击代码，和纯纯的卧底。</p>



<p>那么我们讲到这了，大家是不是没听明白他到底怎么干的呢？我们讲一个普通人非程序员能够听懂的案例吧。一个什么样的案例呢？比如说我们今天用穷举法去破解密码。什么意思呢？比如说你现在有一个四位的密码，是从4个0到4个9，一共呢，是一万种状态啊，从0000到9999。什么叫穷举法呢？就是一个一个试，首先是0000，不对，再是0001，再是0002，它等于是这样的一个过程。现在有人进去攻击了。</p>



<p>攻击的方式是什么呢？就是在每一次从000到0001这样的跳转过程中，他给你随机多跳几个，或者少跳几个，或者倒着往回跳几个。这种攻击一旦发生，前面所有的测试就都失败了。比如说，我应该测完0001，然后测0002，再测0003，应该是这样一个一个挨着测，我才能保证我的穷举，把所有中间过程的数值都试过了。</p>



<p>但是，有一个人给你投毒了，恶意攻击你了。0000完了以后，我就直接测试了0008，啊，然后测试了0007，再然后测试了020几，什么的，就这样了。他等于随机跳了，那你说，我这不是都测了吗？问题在哪呢？就是你测试的过程，其实是没法去一个一个记录的，到底测了哪些，记了哪些，哪些没测，你这个事你不知道了。</p>



<p>穷举法的最大价值就是我挨着个儿的把所有的数都测一遍，但是你在测的过程中来回跳，这就是最简单的投毒方式。据说，这一次投毒造成了几千万美元的损失，因为他的模型评估结果忽高忽低。前面的所有测试数据，实际上都被污染了，必须重新来过。因为做这种大模型测试的话，第一个，这帮人就很贵。据说是因为这位田姓博士生的投毒，导致30多位各层级的员工，他们的工作都被浪费了。</p>



<p>大家要知道，能够干这件事情的人，本身的薪资是非常高的。就算是这种实习生，他们的薪水也不低。你想，他是个博士嘛。这些人啊，准备了大量的数据，可能还有很多人去帮着他们一块准备数据。再加上什么呢？烧显卡呀，你需要用大量的显卡算力来进行模型训练。训练完了以后再去进行评估，现在等于所有的这些评估数据都不可信了，只能把它们都扔掉。</p>



<p>就跟刚才我们讲的这个穷举法破密码似的，你现在告诉你说：“哎，我现在已经从0000破到9999了，没有找出密码来。”那咋办呢？只能从头开始啊，因为你搞不清楚到底哪些数测了，哪些数没测呀。他实际上干了这么一个事情，所以这个是非常严重的损失。前几天李开复还讲了，他说我们训练一次模型，需要三四百万美金的这种成本。</p>



<p>那么，这么长时间被他投毒，也就是数据污染的模型训练过程，现在都不知道有多少。所以，他这个事情到底有没有亏掉几千万美金，真不好说。外界传是有这么多，但是ByteDance自己的人说，应该没这么多。确实有损失，但是没有那么夸张。这个数据呢，我觉得，我们大家自己心里稍微有个数就可以了。</p>



<p>现在呢，对于这位实习生的处理，就是把他辞退了，然后呢，也对行业内的协会以及他所在的学校进行了通报。也就是这哥们再去什么地方上班，你们就别要他了。学校你自己看着办，是不是给一个处分，或者是如何去处理， let不让他毕业啊，你们自己看着办就行了。</p>



<p>目前呢，还没有进一步的诉讼或者追偿的措施。其实怎么说呢，这种学生未来未必不会成才啊。因为前面我们看奥本海默的这个电影的时候，我们知道奥本海默在上学的时候，是曾经尝试往他的导师吃的苹果里边打过毒药的。这种人最后也把原子弹操出来了。所以，这位实习的田姓博士生，反正不算是个笨人啊，未来到底能做什么不好说。当然，在中国这样的一个环境下，可能他也就没有什么未来了。</p>



<p>这个事情告诉我们一个什么样的道理呢？就是在工程管理里头，必然要面对一个人员管理的问题。这个事情呢，其实是谁都绕不过去的。人呢，并不是螺丝钉。很多的工程管理里边，都希望把人变成螺丝钉，变成没有感情的机器，这件事其实是有问题的。我记得以前经常讲说，怎么能够放心地把后背交给队友，这个就是大家在进行协作的时候，必须要思考的问题。</p>



<p>很多人都去参加过那种破冰团建。什么叫破冰团建？就是大家谁都不认识谁，为了能够组建一个团队，要把这个冰层敲开，叫破冰。这个里边都有一个项目，我参加过几次，每次都有这个项目。什么？背摔。就是两个手这么抱起来，站在一个台子上往后倒，就是你看不到后边。后边呢，是你所有的队友伸手接着你。这个过程就是培养对队友的这种信任。你说，我可以把我的后背交给大家，因为人向后摔的时候，特别是不看人的时候，你还站那么老高。</p>



<p>这是很危险的。反正我每次往后摔的时候，都心怀忐忑啊。因为为什么？胖啊，万一下去了以后大家没接住，这事不是很危险吗？当然，我现在还可以活蹦乱跳，在这跟大家讲故事啊，所以我的队友们每次都接住我了。</p>



<p>我记得原来看美剧，有一个美剧叫《梅林》，讲的是大法师梅林的故事。里边呢，就有这样的一个桥段，讲的是什么呢？一个平民冒充贵族成为骑士，在亚瑟王的这个团队里边去征战。而且呢，他的战功还非常的卓越。这个人在继续晋升的时候呢，他的身份就被揭穿了，说你不是一个贵族，你不可以成为骑士，你不可以在这里继续战斗下去，就把他赶走了。其他人就觉得很不公平，去问啊，为什么这样的一个人就不能够跟我们一起战斗呢？</p>



<p>给出的解释是这样的：之所以只有贵族才可以成为骑士，是因为我们必须知道他的父亲是谁，也必须知道他的家族是什么，必须知道他为什么事情感到荣耀。只有在这种情况下，我们才可以把后背交给他。</p>



<p>所以呢，自古以来，如何把后背交给别人这件事情，一直是团队管理、工程项目管理里头一个比较难以逾越的鸿沟，或者一个重大的难题吧。在古代，奴隶呢，可以在鞭子下面去修建金字塔，也可以修建长城。但是呢，奴隶是不太可能带着镣铐去实现现代科技创新的，因为这个需要脑力劳动的。而且这些脑力劳动最终的结果，是非常难以进行解读的。他不像是去修金字塔似的，你把这个石头搬上去了，就是搬上去了，奴隶主也好，或者监工也好，拎着鞭子在旁边是可以看到的。</p>



<p>而现在，你想，这家伙上去写代码，然后这个代码还有一定的隐藏性。我上传的时候，这代码没毛病，等传上去以后，他在里头做了一个变身，开始进行攻击，这种事情，你是一个人拎着鞭子在后边盯着，就可以盯明白了吗？这个事是不行的。</p>



<p>如何让高级打工人在工程允许的范围内，输出可控的结果，这件事呢，是现代很多大型软件工程里边都很头疼的事情。而且是不是可以在整个的工作过程中超越预期，这个也是大家需要去思考的事情。什么叫超越预期？</p>



<p>你想预期吗？一定是有不达到的、有达到的、超过的。现在工程上面说我们能够达到就行了，我们要求你给我做到80分，你给我最后做到80分了就OK了。但是最后做到90分、做到95分，那些产品呢，就叫超越预期的。人是可以输出很多不可解释的结果的，工程管理一般是要求你所有的结果、所有过程可以解释的，但是人经常会输出很多这种不可解释的结果。比如说那种充满了爱的寿司，那个寿司之王，他做出的那个寿司绝对没有标准化啊。工程处理的方式就是标准化，你们必须是多少力量，然后抓多少米、多少克，精确到多少，然后呢，捏几下力量到多少。这是工程用的方式。但是你想，寿司之王他有这个水平吗？人家是靠爱来做这个事情的，充满了对寿司的爱，然后做出了很好的寿司。所以人有时候会做出一些你完全无法想象的东西。</p>



<p>另外一面的话，在996高压工作、心怀怨怼的情况下，需要进行大型协作的工作是非常非常危险的。你说我一个人把这事搞定，那你就算心里再不满意，没准都是有可能能够做出来的。你想以前的铸剑，实在不行就把这个老婆孩子往那个炉子里扔，最后他也能把那个剑铸出来。但是现在不行啊，因为这么多人协作在一起。你说：“哎，有什么事我就扣你钱啊，有什么事你就必须加班啊。”而且要进行很严厉的处罚，每天从早骂到晚。这些人在一起协作，他是不可能做出一个好的产品来的。</p>



<p>其实咱们讲到前面，奴隶们在鞭子的驱赶下去修长城这个事，长城的质量真的好吗？孟姜女哭长城，你以为那个长城真的是她哭倒的吗？那个工程质量一定是有问题的。这一次犯错的是一个博士生，是一个实习生。当然在这个里边我要讲的是什么呢？就是我们不要去怪罪这个个人啊。出了问题一定是整个的工程项目管理有问题，而不是这一个人有问题。就任何人都有可能出问题，你不能说：“哎，别人都是好好的，怎么就你错了？”一定是你个人的问题，千万不要这么想这个事情啊。如果是这样去思考这个问题的话……</p>



<p>那么这一次出问题是一个偶发事件。下面继续出问题，继续是偶发事件。那么就永远不可能有任何改进了。需要改进的，只能是工程系统的这种管理过程，不可能是说我保证每一个人都怎么怎么样，这事是不现实的。</p>



<p>下一个问题是什么呢？就是开放跟封闭到底哪个更安全？其实这一次ByteDance的问题也暴露了一个新的问题。是什么呢？就是它是利用Huggingface上面的一些漏洞来去进行攻击的。那么你说这种开放的系统经常会被攻击， 经常会有问题暴露出来。而自古以来那些，比如中国传男不传女的那些工艺，包括像意大利威尼斯穆拉诺岛上的这些玻璃工艺，就坚决不允许外传，任何外传的人直接被杀头。</p>



<p>那么到底我们是应该使用中国或者是古代威尼斯这种封闭的技术管理方式，还是应该用Huggingface、GitHub这样的开放的技术管理方式呢？现在看，应该还是要开放。为什么呢？就是现代整个的互联网发展、移动互联网发展，包括现在的大模型的发展，都是建立在开放的技术平台上，都是建立在开源的基础上的。</p>



<p>虽然我们看到了很多问题，这一次Huggingface出问题了，前面比如说Linux哪儿出问题了，都是开源系统。但是你要相信，那些被封闭起来的系统里边儿问题更多，你只是不知道而已。开放的系统里边，我们有问题就可以发现，发现了以后就可以去改，这才是不断改进、不断完善的一个过程。越开放的地方，问题就越容易被发现，就越容易被改正，这才是开放真正的意义，而不是说你看出错了吧，下回赶快封起来，咱们再搞这个传男不传女，不能这么干。</p>



<p>开源呢，就是新时代的松藕河的合作模式，全世界陌生人都可以合作在一起，共同在开源项目中去贡献代码，去提升开源项目的这种进度与品质。时代的进步本身就是分工不断细化，以及合作更加广泛的一个代表。我们就是要继续向开放的路上接着走。所以呢，千万不要因为说开源系统出错了，我们以后就封闭。最后我们还要讲一个问题。</p>



<p>未来犯错的可能就不再是人了。这一次犯错的是这位姓田的博士生实习生。以后更多会犯错的是什么？是AITC大模型啊。这可能是我们需要思考的另外一个问题。AIGC也要参与到跟人的协作过程中来。那么，AIGC是否值得信任？</p>



<p>我记得在早期大模型出来以后，很多人就是说：“哎呀，这个大模型就像是一个刚刚走出校门的本科生，具备各种知识，但是呢，进到各种行业里边去，都会有一些水土不服的感觉。”现在我们就要面临这个问题了：我们需要跟这些AIGC大模型合作的时候，它到底是不是可信？</p>



<p>而AIGC的结果呢，其实是非常难以验证的，就跟这位田姓博士生给出的代码是一样的。为什么难以验证呢？第一个是量很大，很多的人可能没有AIGC的知识面全面，反应速度肯定更没有它快。但是呢，AIGC产生了大量的内容，产生了大量的结果，这些东西是没有人可以去一条一条去验证到底是不是正确的，人没有这个能力。而且呢，这些内容非常分散。</p>



<p>为什么要讲到分散这件事呢？就是刚才我们刚讲过，开源系统或者开放系统，它更容易发现问题。但是呢，有一个前提：这个系统有很多人用。有人开源了一个系统，从来没有人用，它的问题就很难被发现。一定是很多人都用过了以后，才更容易发现问题。</p>



<p>但是呢，AIGC生成的内容量非常大，分散在各个角落里头。有些内容会有人认真去看，有些内容可能没有人认真去看。那么，这些分散的内容，你要再想把它所有的错误都找出来，基本上是不可能的。而且呢，AIGC的工作过程基本上是不可解释的，并不是说AIGC整个的工作底层原理都不可解释。现在已经有很多人去尝试理解和分析AIGC到底是怎么工作的，每一次为什么给我们这样的结果。</p>



<p>但是大家要注意一个问题：它是有成本的。你要去确认AIGC这一次为什么这样给我结果，它是有成本的。如果每一次都要进行这样的确认的话，这个成本是没法接受的。</p>



<p>所以呢，AIGC所产生的大量工作过程都是不可解释的。而且，AIGC未来会有更多的端到端的这种结果输出。在这个过程中，他们整个输出的过程，人类是没法参与的。人类想要去参与这种协作，比如说我们几个人凑在一起去写程序，那我们要干嘛呢？首先要商量半天，哎呀，这个我们怎么写，怎么规定啊，这个代码应该怎么放，怎么去命名啊，如何去做架构，这要不停的商量，还要写大量的文档，大量的规范文件，写很多的注释，大家才可以一起去协作。</p>



<p>你一旦AIGC端到端了，我这边输入要求，那边出结果。上帝说要有光，于是就有了光，中间的过程完全都不知道，他也不需要写注释，因为他不需要跟自己解释任何事情。那么这种内容的话，人是没法读懂的。</p>



<p>所以呢，我觉得这一次ByteDance的这位博士实习生造成的投毒事件，其实会告诉我们说，未来我们去跟AIGC合作的时候，他就像这个实习生一样，他到底做了什么，到底怎么做的，为什么这么做，其实我们这些使用者也是不知道的。而且，你是完全没有办法去对过程和结果进行追踪和验证的。</p>



<p>所以可能未来如何去跟更多的人去合作，如何去跟更多的机器进行合作，如何去跟更多的人与机器结合的实体进行合作，可能是我们未来需要面临的新的挑战。好，这个故事就跟大家讲到这里，感谢大家收听。请帮忙点赞，点小铃铛，参加Discord讨论群，也欢迎有兴趣有能力的朋友加入我们的付费频道。再见。</p>
]]></content:encoded>
					
		
		
			</item>
	</channel>
</rss>
