DeepSeek大模型 - 老范讲故事｜AI、大模型与商业世界的故事

深度求索满血版DeepSeek全攻略｜教你快速上手火山方舟与Cherry Studio部署方法，没有搜索的DeepSeek，不是完整的DeepSeek。

2025-02-16 作者 Luke Fan

真正满血版的DeepSeek到底应该怎么用？在官网基本趴菜的情况下，我们是不是还可以使用到真正满血版的DeepSeek？有什么简单一点的方式可以让普通人用吗？这就是今天要讲的事情。

大家好，欢迎收听老范讲故事的YouTube频道。今天我们会先介绍一下什么是满血版DeepSeek，为什么要放弃本地部署，以及官网现状替代方案。今天的替代方案是火山方舟平台的替代方案。这个是字节跳动下面的，这个是目前为止相对来说比较均衡的一个方案。为什么？你比如像硅基流动，配置是相对来说比较简单的，但是实在是很慢。你使用的时候非常的不流畅，而且经常没有办法得到完整的答案。所以我现在基本上放弃了硅基流动这个平台，现在主要是使用方舟平台。方舟平台跟其他的像什么阿里云、腾讯云比起来，虽然都是云计算平台，但是配置起来相对还没有那么复杂。因为越是云计算平台的配置越麻烦。

讲完了这个方舟平台之后，我们要讲一下Cherry Studio啊。这个是目前普通人可以使用的比较简单的AI辅助工具。因为现在绝大部分的AI辅助工具都是网页。你让一个没有学过电脑的人去部署网页，去部署一个网站，还是挺麻烦的。有这个客户端，Cherry Studio就是Windows和Mac OS的一个客户端，下载下来就直接可以用。这个要相对来说简单很多。

中国AI力量崛起：DeepSeek如何成为国运级创新的代表，搅动全球AI格局？

2025-02-11 作者 Luke Fan

第二个故事：DeepSeek到底是不是国运级的创新呢？国运级创新这个事呢，是游戏科学的创始人兼CEO冯骥他去讲的。DeepSeek是一个国运级的创新。游戏科学，就是黑神话悟空的这个开发商。DeepSeek呢，也确实让美股市值蒸发了很多很多钱。而且还有一位美国的参议员说：“我们要下最严格的法令来禁止DeepSeek。谁敢下载DeepSeek判20年，哪个企业敢去用DeepSeek罚1亿美金。”

这个是个共和党参议员叫Josh Holy，写了一个法案，叫2025年美国人工智能能力与中国脱钩法案。禁止技术交流与使用，禁止美国公民、企业与中国开展任何AI技术合作，包括研发、投资、数据共享等。非美国公民若涉及技术转移，可以驱逐出境。然后切断资本与人才流动，禁止美国资本对中国AI企业投资，并限制美籍科研人员参与中国AI项目。任何与中国高效实验室合作的美国机构将面临重罚。违反本法案的个人将被视为严重犯罪分子，可能影响其移民身份、绿卡申请和入籍资格。美国公司不能直接或间接向中国企业提供AI技术支持或者服务。但是这个法案呢，因为太过极端已经被搁置了。

先讲一下使用DeepSeek的方式到底是什么样的。如果你在美国使用DeepSeek，那千万千万不要去DeepSeek网去挂，那是根本得不到服务的。最好是什么呢？就是去在美国的云主机上去使用。现在DeepSeek自己的网站基本上是半瘫痪状态，聊两句就趴菜。我基本上是第一句能聊，第二句能聊，第三句你再怎么跟他聊都趴。他是这样的一个状态。你可能明天再跟他聊，还可以聊两句。API调用的话非常非常慢。而且呢，现在禁止充值了。整个春节期间，API调用的这个页面就打不开了，把整个API后台给你封掉了。现在的话是后台重新有了，但是不允许充值。现在呢，国内是各种云上都有，国内的是阿里云、腾讯云、华为云。华为云的DeepSeek呢。

李飞飞S1K模型引爆AI界：仅50美金成本完胜DeepSeek R1与ChatGPT o1！

2025-02-11 作者 Luke Fan

大家好！欢迎收听老范讲故事YouTube频道。今天咱们来讲一讲李飞飞的S1K模型。50美金成本超越DeepSeek R1和ChatGPT O1。

首先呢，DeepSeek到底是怎么震惊全球的？就是因为训练成本低。他的训练成本是OpenAI的3%，所以震惊了全球。

那么现在李飞飞的S1K模型，16张H100的显卡，跑了26分钟跑完了，拿到了一个32B的模型。多项测试超越了DeepSeek R1和GPTO1。

大家要注意，评测大模型呢，它有很多很多测试项。一般我们说基本上达到什么什么水平，就属于叫互有伯仲。有些你强点，有些他强点。原来大家都超不过GPT 4O，是因为只能接近它，距离它的全项指标都有差距。现在的话，大家就已经基本上可以达到GPT 4o的水平了。

深度揭秘！普通人如何应对DeepSeek真假信息浪潮？教你识破骗局！

2025-02-10 作者 Luke Fan

清华大学《DeepSeek深入浅出》.PDF

满血DeepSeek的硅基流动邀请链接

普通人面对铺天盖地的DeepSeek信息，应该如何防骗呢？

大家好，欢迎收听老范讲故事的YouTube频道。今天咱们来讲一讲韭菜的基本素养。现在DeepSeek相关的信息铺天盖地，很多普通人都说：“哎呀，我也要去试一下，这东西到底能对我的生活带来什么样的改变呢？”大部分的网上流传的DeepSeek信息，其实都是有欺骗性的。他们呢，主要是卖课的——付费课程。当然，还有一些是骗点击、骗插件、骗用户、骗关注。

这个有什么区别？比如说，我一个标题叫“DeepSeek说了什么什么什么东西”，这个呢叫骗点击。如果他不写DeepSeek说了什么，你会点进去吗？你不会点进去。对于他来说，就已经挣到钱了。骗人买插件是什么呢？你比如说，有些人讲了说：“office怎么样，WPS怎么样，去用DeepSeek了。”这些呢都实际上是卖插件的，因为官方不支持，要求你自己去安装一个特殊的第三方插件，你才可以使用DeepSeek。

深度解析DeepSeek：股权结构揭秘，真的有一盘大棋吗？0.1%里面隐藏的巨大陷阱。

2025-02-03 作者 Luke Fan

DeepSeek的股权结构真的是一盘大棋吗？大家好，欢迎收听老范讲故事的YouTube频道。DeepSeek最近实在是火出圈来了，大家都在很努力地去解读DeepSeek各种各样的问题，特别是很多金融圈的人也冲进来了。为什么？让股市动荡了吗？但是这些金融圈的人呢，又说不太清楚这个大模型到底是怎么回事。但是股权结构他们是能解释得清楚的，这里面就有各种各样的阴谋论了。

一切呢都是从这张图开始的。首先要尊重一下知识产权，这个是由杰克船长宏观策略提供的。这个朋友呢，应该是雪球上面的一位自媒体博主吧，解读各种各样的宏观策略的。更多的人是在这个上面进行解读。但是我要讲的是什么？就这张图呢，应该仅仅是冰山一角。为什么呢？因为后边是幻方量化，一个做量化的公司，它上面的实体数可能几百个是正常的。千万不要觉得DeepSeek只有这么简单的一个图像，甚至有很多可能平时对于公司结构不是那么熟悉的朋友，一看到说，哇这么多方块，这么多颜色花花绿绿的，这个结构好复杂，这是一盘大棋，设计得好厉害，真的不是这样的。

DeepSeek现象引发中文圈狂热：开源的胜利还是遥遥领先的争议?

2025-01-28 作者老范讲故事

DeepSeek突然出圈，引发了中文圈的争吵。大家好，欢迎收听老范讲故事的YouTube频道。

DeepSeek在前面，我们已经出了一期视频，去讲它到底是怎么回事了。那么，DeepSeek最近肯定是更加的出圈。首先，DeepSeek V3，据说训练成本只有557万美金，震惊了扎克伯格，震惊了Meta。Meta说：“我们有好多的老大，他们的年薪都超过557万美金了。人家训练了个模型才用了557万美金，那我花了这么多钱去组建AI团队，花了这么多钱去囤显卡，是不是亏了？”现在就有这样的声音出来。

而且，最新的DeepSeek R1，也就是它的推理模型，推理能力已经接近o1了。蒸馏微调出来的这些小模型，已经在很多领域里头超越了o1 Mini。在这儿多补充一句，什么叫蒸馏微调的小模型？像我的电脑上，也是跑了一个DeepSeek R1-32B的模型。这个模型是怎么来的？它实际上是由DeepSeek R1去输出数据，然后拿输出的数据再去调通义千问2.5-32B的这个模型，最后得到的结果。这就是DeepSeek R1-32B，他在我的电脑上做各种推理，效果相当不错。