DeepSeek - 老范讲故事｜AI、大模型与商业世界的故事

AI IDE 带来了真正的 AI 平权！AIGC最后一公里，每一个人都有权获得AI的福利，不管你是不是程序员。

2025-02-21 作者 Luke Fan

AI IDE，这就是AI平权的开始了。大家好，欢迎收听老范讲故事的YouTube频道。首先，什么是AI IDE？IDE叫集成开发环境，就是我们把编辑代码、编译代码、调试代码、部署代码，所有这些东西集成在一起的时候，它就叫集成开发环境了。由AI进行辅助工作的代码集成开发环境就是AI IDE。

那么，为什么AI IDE就可以讲到AI平权了呢？首先，在这里跟大家讲一个当年做抢票软件的故事吧。以前在猎豹移动的时候，我们去做了一个抢票软件。很多人就去说你这个不公平，为什么不公平呢？因为只有程序员可以搞定这件事情。如果你不是程序员，或者说你对于电脑没有什么了解，或者我是个老人，我就没有办法去使用这些工具去抢到火车票，那么这个事情就不公平了。后来我们说，这个我们已经是做了最大的平权了，因为我们做了抢票软件，至少有一部分年轻人是可以抢到票了，而原来这些票可能是被黄牛或者其他的一些有关系的人拿走了，这是一个更不公平的事情。而现在的话，你只要稍微的去学习一下浏览器怎么用，去使用这个网站，你就可以抢到票，这个已经是在平权的基础上迈出了一步了。

Grok 3发布：Elon Musk称其为“宇宙最聪明”大模型，暴力出奇迹的xAI，是否可以成为AI时代的世界工厂？

2025-02-20 作者 Luke Fan

马斯克的Grok 3到底是不是世界上最聪明的大模型？暴力真的能出奇迹吗？大家好，欢迎收听老范讲故事的YouTube频道。世界上最聪明的大模型，这是马斯克对他自己家的Grok 3给的定义。如果有人不同意的话，那么会被开除的。因为XAI某一位员工在X上发帖说，Grok 3好像并没有那么聪明，然后就被XAI找到说，你要么删帖要么开除。后来这哥们想了想说，我得捍卫一下自己的言论自由，于是这哥们就被开除了。

在说所有细节之前，咱们先说说Grok 3到底怎么用。在2月18号北京时间中午12点的时候，马斯克跟另外三位小伙伴，一共四个人坐着开了场直播，把这个Grok 3发布了。我就四处去找，首先我是X每个月交8美金的Premium用户，我在X上使不了。X上你必须是40美元的Premium+用户，才可以去使用。在Grok的这个网站上呢，你也需要30美元一个月的账号才可以用。免费用户只能用Grok 2，API不充钱已经不让用了。如果是团队的话，至少花了5美元以上，每个月他会赠送你150美金，但前提呢是要跟XAI共享你的数据。

目前Grok 3的版本还没有上，你就算交钱了，你在XAI的网站上，也只能得到Grok 2的API，还要再等几周才会上线。Grok的苹果APP上面，是可以使用Grok 3 Beta这个版本的，即使是免费用户也可以去用。因为我呢对于XAI来说是一个免费用户，我就通过iOS，也就是iPhone和iPad这个版本上去，好好儿的测试了一下。后边儿呢咱们再去讲具体效果怎么样。

鲶鱼效应搅翻AI江湖：DeepSeek 671B开源来袭，GPT-5和百度文心一言迎巨大挑战！

2025-02-18 作者 Luke Fan

大家好，欢迎收听老范讲故事的YouTube频道。今天咱们来讲一讲DeepSeek。这条鲶鱼搅浑了水，GPT5要来了，百度也要免费开源了，到底是一个什么样的情况？大模型这个赛道未来会怎么去发展？

DeepSeek呢，算是彻底改变了游戏规则。OpenAI给整个行业挖的坑，到现在呢，还有一些公司没查出来呢。什么坑？就是客户端这个订阅20美金一个月这个坑。这个其实是一个非常失败的商业模式。谷歌到现在还在往外爬，因为谷歌他其实自己不太想爬出来。为什么？因为他一旦爬出来以后的话，谷歌搜索的广告收入就没了，只能在那里头装聋作哑了。Perplexity到现在也还在思考，到底是不是要爬出来。

大家有没有想过一个问题？开源模型，因为DeepSeek是满血版671B的开源模型，它对于OpenAI的伤害，到底是ToB的伤害大，还是ToC的伤害大？这是一个大家值得去思考的事情。虽然现在DeepSeek在很多的C端有非常大的影响力，就是很多的个人去下载这个东西去用去，但其实真正的开源模型影响最大的是B端。我这是一个自己的公司，我是一个政府项目，或者是一个什么样的商业相关的事情，我要去使用大模型的时候，一定是会优先去选择这种完全可控的开源模型，而不是说我去用人家的闭源的，买人家API。因为你一旦是有开源模型的话，你就可以选择完全私有部署，我自己买台服务器往里装就完了。

深度求索满血版DeepSeek全攻略｜教你快速上手火山方舟与Cherry Studio部署方法，没有搜索的DeepSeek，不是完整的DeepSeek。

2025-02-16 作者 Luke Fan

真正满血版的DeepSeek到底应该怎么用？在官网基本趴菜的情况下，我们是不是还可以使用到真正满血版的DeepSeek？有什么简单一点的方式可以让普通人用吗？这就是今天要讲的事情。

大家好，欢迎收听老范讲故事的YouTube频道。今天我们会先介绍一下什么是满血版DeepSeek，为什么要放弃本地部署，以及官网现状替代方案。今天的替代方案是火山方舟平台的替代方案。这个是字节跳动下面的，这个是目前为止相对来说比较均衡的一个方案。为什么？你比如像硅基流动，配置是相对来说比较简单的，但是实在是很慢。你使用的时候非常的不流畅，而且经常没有办法得到完整的答案。所以我现在基本上放弃了硅基流动这个平台，现在主要是使用方舟平台。方舟平台跟其他的像什么阿里云、腾讯云比起来，虽然都是云计算平台，但是配置起来相对还没有那么复杂。因为越是云计算平台的配置越麻烦。

讲完了这个方舟平台之后，我们要讲一下Cherry Studio啊。这个是目前普通人可以使用的比较简单的AI辅助工具。因为现在绝大部分的AI辅助工具都是网页。你让一个没有学过电脑的人去部署网页，去部署一个网站，还是挺麻烦的。有这个客户端，Cherry Studio就是Windows和Mac OS的一个客户端，下载下来就直接可以用。这个要相对来说简单很多。

DeepSeek掀起全球AI军备竞赛，OpenAI、Anthropic、SSI、都宣布新融资，从投资人角度给大家解析其中的投资圈儿黑话。

2025-02-13 作者 Luke Fan

DeepSeek掀起了全球AI军备竞赛。大家好，欢迎收听老范讲故事的YouTube频道。DeepSeek真的算是擦枪走火，带来了全球点燃的一个效果。其实，2023年和2024年，AI相关的融资就已经算是村里最靓的仔了。其他行业都没有AI投融资这么火爆，但是DeepSeek直接点燃了，带来了这种链式反应。一般讲链式反应，都是原子弹那个玩意儿才玩呢。2025年初直接燃爆了，各种AI融资事件快速爆发。我们现在能够知道的大型AI公司都在融资，都在加大投入。

今天，从投资人的角度，帮大家稍微盘点一下目前比较热的几个投资案例，也把一些投资人行业里边的黑话用大家能够尽量搞明白的方式讲一遍。首先讲的第一个案例就是百度风投没有投中DeepSeek这个事。很多人说，你看百度风投就在DeepSeek北京的楼上，这么近他都没投上，百度不行了。结果百度风投的人就跑出来说，他说我们是风投，不是投资部门。

这个里头要跟大家讲一下，大型的像BAT这些，它下边的投资机构是非常多的。它有公司的内部投资部，有外边挂名的风投。差异在哪？外边挂名的风投，你虽然挂在百度名，百度可能也出钱了，但是相对来说会更独立一些。他们赚了赔了，对于百度整个的财报影响并没有那么重要。他们当然也不会像百度内部的投资部那样，直接冲上去把一个项目收购下来。他们更多的是要去赚这个基金的钱。

法国AI登顶效率榜！Le Chat挑战ChatGPT，欧洲人工智能崛起还是昙花一现？受美国星际之门和中国DeepSeek刺激，法国发力AI，中国行，法国也行吗？

2025-02-12 作者 Luke Fan

法国AI聊天工具Le Chat在法国登到了排行榜第一名。法国AI是不是有戏了？大家好，欢迎收听老范讲故事YouTube频道。今天咱们来讲一讲这个叫Le Chat。我在讲这个故事之前，专门去向我学过法语的太太请教过了，说这个东西应该那么去念啊，最后这个t是不发音的。这个产品到底怎么样？咱们先说一说它的公司呢，其实原来我们介绍过啊，叫Mistral公司，应该算是整个欧洲拿到投资最多的一家AI公司了。

然后他们的创始人呢，原来是Deepmind的员工。他在法国受的教育，到Deepmind混了两年以后，回到法国去创业。他们大量的创始团队都是从Deepmind回来的。Deepmind被Google收购了以后，他大量的团队依然是在英国上班。所以，这帮人有可能是在美国混了一段时间，当然也有可能是在英国混了一段时间，现在在法国创业。然后他们拿到了像微软啊，英伟达等很多公司的这种投资。但是法国还有一个很有钱的人，特别喜欢投资AI啊，谁啊？就是那个LV的那个老板，也会去投资很多的AI公司。

那么这个公司呢，他们出的很多的模型，特别是开源模型，在AI圈子里头还是有很大响度的。比如说Mistral的7B啊，特别早就出来，很多人会去使用。他们出的很多这种MoE模型，也是很流行的。最早被大家所接受的MoE模型就是他们家的，比如说8X7B啊，或者是8X22B这些啊。MoE模型啊，很广泛的被使用。所以这一次呢，去问他们的创始人，说你看DeepSeek怎么样？他说哎呀，Deepseek用到的很多模型组织方式是原来我们开源出来的啊。当然最早的MoE不是他们发明的，但是Mistral在MoE整个的演化过程中还是做了非常多的贡献的。

中国AI力量崛起：DeepSeek如何成为国运级创新的代表，搅动全球AI格局？

2025-02-11 作者 Luke Fan

第二个故事：DeepSeek到底是不是国运级的创新呢？国运级创新这个事呢，是游戏科学的创始人兼CEO冯骥他去讲的。DeepSeek是一个国运级的创新。游戏科学，就是黑神话悟空的这个开发商。DeepSeek呢，也确实让美股市值蒸发了很多很多钱。而且还有一位美国的参议员说：“我们要下最严格的法令来禁止DeepSeek。谁敢下载DeepSeek判20年，哪个企业敢去用DeepSeek罚1亿美金。”

这个是个共和党参议员叫Josh Holy，写了一个法案，叫2025年美国人工智能能力与中国脱钩法案。禁止技术交流与使用，禁止美国公民、企业与中国开展任何AI技术合作，包括研发、投资、数据共享等。非美国公民若涉及技术转移，可以驱逐出境。然后切断资本与人才流动，禁止美国资本对中国AI企业投资，并限制美籍科研人员参与中国AI项目。任何与中国高效实验室合作的美国机构将面临重罚。违反本法案的个人将被视为严重犯罪分子，可能影响其移民身份、绿卡申请和入籍资格。美国公司不能直接或间接向中国企业提供AI技术支持或者服务。但是这个法案呢，因为太过极端已经被搁置了。

先讲一下使用DeepSeek的方式到底是什么样的。如果你在美国使用DeepSeek，那千万千万不要去DeepSeek网去挂，那是根本得不到服务的。最好是什么呢？就是去在美国的云主机上去使用。现在DeepSeek自己的网站基本上是半瘫痪状态，聊两句就趴菜。我基本上是第一句能聊，第二句能聊，第三句你再怎么跟他聊都趴。他是这样的一个状态。你可能明天再跟他聊，还可以聊两句。API调用的话非常非常慢。而且呢，现在禁止充值了。整个春节期间，API调用的这个页面就打不开了，把整个API后台给你封掉了。现在的话是后台重新有了，但是不允许充值。现在呢，国内是各种云上都有，国内的是阿里云、腾讯云、华为云。华为云的DeepSeek呢。

Figure AI与OpenAI分道扬镳，难道是因为DeepSeek吗？深挖背后原因：具身智能的端到端大模型、机器人自主创新赛道如何博弈？

2025-02-07 作者 Luke Fan

Figure突然官宣放弃跟OpenAI的合作，这到底是一个什么样的事情？大家好，欢迎收听老范讲故事的YouTube频道。Figure的老板突然发了一条推特，他的老板叫布雷特·阿德柯克，后边我们就不再重复他老板的名字了。这公司干嘛呢？这公司做机器人的。去年，Figure 01和Figure 02的演示还是引起了很大的轰动的。现在他就讲了自己要去研发端到端的大模型了。机器人公司必须要拥有自己的端到端大模型，说我们的模型一定不是外包的，就像我们的硬件不是外包的一样，我们一定要自己做，要自力更生了。

这个也是别人一开源，他就自主创新，自主知识产权去了。谁开源了？DeepSeek V3开源了，DeepSeek R1开源了。除了说我不再去跟OpenAI合作之外，还讲了什么呢？我现在已经开始去做自主的知识产权的端到端大模型了，30天之后就可以给大家看成果了，绝对吓到你们。然后开始招聘，现在还需要什么什么样的人，具身智能的工程师，快来上班吧。未来4年准备要交付10万台机器人，这个呢，应该是对着马斯克去的。马斯克说2025年要造1万台擎天柱，到特斯拉的工厂里去打工。他说我今年造1万台有点费劲，但是我未来4年造10万台，气势上不能输给你。

未来的机器人呢，他是准备用在商业和家庭两个方面的。马斯克的擎天柱目前应该主要还是在工厂里打螺丝的，但是Figure的机器人呢，商业上第一个制造业也是工厂里打螺丝，他要去的。然后仓储物流，就是可以到仓库里去搬东西，以及零售导购，这个其实已经接近于家用了，就是他已经跟人很近了。他可以在商场里头卖东西。家用呢，Figure 01第一个演示的就是煮咖啡，给你演示一下这个咖啡是怎么用的，应该是用的一个胶囊咖啡机吧。他就跟着你去学，学完了以后就会煮咖啡了。然后呢，还要学会洗衣服、整理房间以及遛狗。遛狗我觉得应该不是一个特别难的事情吧。

软银OpenAI日本公司背后的资本阳谋——5,000亿星际之门是如何影响全球AI格局的？

2025-02-05 作者 Luke Fan

SB OpenAI日本公司宣布成立，这怎么听怎么像是在骂人呢？大家好，欢迎收听老范讲故事的YouTube频道。今天咱们来讲一讲SB OpenAI日本公司到底是一个什么样的情况。

孙正义上台宣布Softbank OpenAI Japan这个公司成立了，所以这个SB不是骂人，它是软银Softbank的意思。今年我们发现OpenAI的声音连续不断，这是为什么呢？原因也很简单，老大的位置不是很稳固了。你要想在这一个行业里面当老大，要么你技术特别好大家都服气，比如像谷歌这样的，各个行业里头，只要跟计算机技术有关的，大家都知道谷歌的技术最好；要不然你垄断，比如像苹果这样，或者像Meta这样的，在社交媒体里我直接垄断了，大家知道你是老大。

如果技术也被人质疑了，花了好多钱训练出一堆模型来，别人也都可以达到了Claude 3.5、Sonnet、Gemini 2.0、Flash这样的模型，其实现在已经跟GPT-4相差仿佛了。你新发布了一大堆乱七八糟的模型呢，都是很小众的高端产品，对于大众来说无感。在这种情况下，你的技术就会被人质疑。

DeepSeek现象引发中文圈狂热：开源的胜利还是遥遥领先的争议?

2025-01-28 作者老范讲故事

DeepSeek突然出圈，引发了中文圈的争吵。大家好，欢迎收听老范讲故事的YouTube频道。

DeepSeek在前面，我们已经出了一期视频，去讲它到底是怎么回事了。那么，DeepSeek最近肯定是更加的出圈。首先，DeepSeek V3，据说训练成本只有557万美金，震惊了扎克伯格，震惊了Meta。Meta说：“我们有好多的老大，他们的年薪都超过557万美金了。人家训练了个模型才用了557万美金，那我花了这么多钱去组建AI团队，花了这么多钱去囤显卡，是不是亏了？”现在就有这样的声音出来。

而且，最新的DeepSeek R1，也就是它的推理模型，推理能力已经接近o1了。蒸馏微调出来的这些小模型，已经在很多领域里头超越了o1 Mini。在这儿多补充一句，什么叫蒸馏微调的小模型？像我的电脑上，也是跑了一个DeepSeek R1-32B的模型。这个模型是怎么来的？它实际上是由DeepSeek R1去输出数据，然后拿输出的数据再去调通义千问2.5-32B的这个模型，最后得到的结果。这就是DeepSeek R1-32B，他在我的电脑上做各种推理，效果相当不错。