3 月 04
Luke Fan AIGC , DeepSeek大模型 545%利润 , 557.6万美金 , AI优化 , AI优化技术 , AI公关策略 , AI公司争斗 , AI利润计算 , AI商业模式 , AI商战 , AI基准价格 , AI市场格局 , AI开源项目 , AI成本分析 , AI投资策略 , AI推理市场 , AI推理未来 , AI数据中心 , AI服务器管理 , AI生态小厂 , AI硬件 , AI自由市场 , AI行业内幕 , AI行业梗 , AI行业盈利 , AI话题营销 , AI资源分配 , AI量化交易 , AI量化模型 , AI高峰时段 , API定价 , CUDA , DeepSeek , Deepseek V3 , DeepSeek开源库 , DeepSeek计算精度 , GPU全天运营 , GPU租赁成本 , GPU负载均衡 , H100芯片 , H800 , MAAS厂商 , MAAS盈利模式 , MAAS竞争 , R1价格 , 中国AI企业 , 中美AI价格差 , 中美AI市场对比 , 云服务厂商 , 云计算 , 华为云 , 商业逻辑 , 大模型服务 , 大模型训练 , 字节跳动DeepSeek , 并行计算 , 开源协议 , 推理利润 , 推理效率 , 推理系统 , 数据参考价值 , 数据水分 , 数据逻辑 , 模型优化策略 , 模型即服务 , 深度学习 , 硅基流动 , 腾讯DeepSeek , 腾讯IMA , 芯片性能 , 训练成本 , 路深科技 , 达芬奇架构 , 阿里云投资
VIDEO
DeepSeek也玩“one more thing”,突然公布了它的推理利润达到545%,就像当初557.6万美金的训练成本那样,再次震惊了行业。大家好,欢迎收听老范讲故事的YouTube频道。今天咱们来讲一讲,DeepSeek结束了连续5天的开园周之后,到礼拜六玩了一次“one more thing”。这个“one more thing”呢,应该是当年乔布斯的梗。他每一次开发布会到最后的时候呢,都要说“还有一件事,等一等”,而且这一件事呢,往往是特别重要、特别颠覆性的事情。那么这一次又来了,DeepSeek公布了它的V1和R3推理系统相关内容,及大规模部署的成本和收益数据。就是说我部署了这东西以后,到底是挣了多少钱?非常非常让人震惊,因为所有人做这个东西都说我不挣钱,我亏钱,结果等到他这好,545%的利润,所有人都傻了,说你到底咋干的?
具体的实现方法呢,就不再跟大家详细分析了。简单来说,第一个负载均衡,你想他有这么多的GPU,这么多的核心,在他这种MOE的架构下,他把每一层的模型里边每一个专家,分配到不同的设备上面去进行运算。这个呢,就是一个负载均衡,尽量让所有的芯片都动起来,不要说有的芯片闲着呢,有的芯片在那排队。第二个,并行计算。并行处理是什么呢?所有的芯片一起来干活,这个速度肯定会变快。另外呢,一边干活的时候,另外一边呢,再同时进行数据的读写。你不能说我这需要数据了,你给我读,然后处理完了以后你再去写,这样就变慢了嘛。所以基本上在做这样的事情,负载均衡和并行处理。
另外还有一个什么样的事情在做呢?就是有一点点叫“驴粪蛋表面光”。这个也算是老北京的一个俏皮话,什么意思呢?就是这个驴粪球外边是很光滑的,但是里边呢,就是一堆的没有消化好的碎草。DeepSeek也是如此,他把很多的计算精度呢进行了调整,他尽可能的能够达到大家的要求,但是很多细节上的这些你看不到的环节呢,就给你忽略掉了。
More
2 月 20
Luke Fan AIGC , Musk传奇 20万GPU , AI API , AI参数 , AI商业化 , AI大模型 , AI安全性 , AI对比 , AI幻觉 , AI开源 , AI快速迭代 , AI排行榜 , AI架构 , AI模型评测 , AI模型选择 , AI流量大战 , AI测试策略 , AI用户体验 , AI直播发布 , AI订阅 , AI训练 , AI语音识别 , AI迭代 , Deep Research功能 , Deep Search功能 , DeepSeek , DeepSeek R1 , Deepseek V3 , DeepSeek对比 , DeepSeek开源 , DeepSeek模型 , DeepSeek训练 , DeepSeek论文 , Grok 2 , Grok 3 , Grok 3发布会 , Grok 3对齐 , Grok 3费用 , Grok APP , OpenAI对比 , Think与Deep Search对比 , Think功能 , XAI , XAI发展 , XAI发布会 , XAI合伙人 , XAI商业方向 , XAI测试 , x平台 , X平台订阅 , 世界工厂 , 人工智能 , 合成数据 , 大模型 , 大模型幻觉 , 幻觉问题 , 推理功能 , 数据清洗问题 , 智能模型 , 暴力迭代 , 最聪明模型 , 深度学习 , 深度研究功能 , 马斯克 , 马斯克AI , 马斯克的大模型
VIDEO
马斯克的Grok 3到底是不是世界上最聪明的大模型?暴力真的能出奇迹吗?大家好,欢迎收听老范讲故事的YouTube频道。世界上最聪明的大模型,这是马斯克对他自己家的Grok 3给的定义。如果有人不同意的话,那么会被开除的。因为XAI某一位员工在X上发帖说,Grok 3好像并没有那么聪明,然后就被XAI找到说,你要么删帖要么开除。后来这哥们想了想说,我得捍卫一下自己的言论自由,于是这哥们就被开除了。
在说所有细节之前,咱们先说说Grok 3到底怎么用。在2月18号北京时间中午12点的时候,马斯克跟另外三位小伙伴,一共四个人坐着开了场直播,把这个Grok 3发布了。我就四处去找,首先我是X每个月交8美金的Premium用户,我在X上使不了。X上你必须是40美元的Premium+用户,才可以去使用。在Grok的这个网站上呢,你也需要30美元一个月的账号才可以用。免费用户只能用Grok 2,API不充钱已经不让用了。如果是团队的话,至少花了5美元以上,每个月他会赠送你150美金,但前提呢是要跟XAI共享你的数据。
目前Grok 3的版本还没有上,你就算交钱了,你在XAI的网站上,也只能得到Grok 2的API,还要再等几周才会上线。Grok的苹果APP上面,是可以使用Grok 3 Beta这个版本的,即使是免费用户也可以去用。因为我呢对于XAI来说是一个免费用户,我就通过iOS,也就是iPhone和iPad这个版本上去,好好儿的测试了一下。后边儿呢咱们再去讲具体效果怎么样。
More
2 月 16
Luke Fan AIGC , DeepSeek大模型 671B参数 , AI工具推荐 , AI模型整合 , AI辅助工具 , AI辅助工具使用 , Cherry Studio , Cherry Studio功能 , Cherry Studio操作指南 , Cloud AI , DeepSeek , DeepSeek API Key获取 , DeepSeek R1 , DeepSeek R1搭建 , Deepseek V3 , DeepSeek V3搭建 , DeepSeek使用教程 , DeepSeek大模型应用 , DeepSeek实时搜索 , DeepSeek应用广场 , DeepSeek接入点创建 , DeepSeek推理模型 , DeepSeek替代方案 , DeepSeek模型参数 , DeepSeek模型广场 , DeepSeek满血版 , DeepSeek联网搜索 , 云计算AI模型 , 云计算大模型部署 , 云计算平台 , 云计算教程 , 人工智能部署 , 大模型使用 , 如何配置DeepSeek , 字节跳动 , 方舟平台 , 本地部署DeepSeek , 深度求索 , 满血版DeepSeek , 火山引擎 , 火山引擎操作 , 火山方舟 , 火山方舟优势 , 火山方舟模型设置 , 火山方舟部署 , 火山方舟配置 , 联网搜索功能 , 联网搜索设置
VIDEO
真正满血版的DeepSeek到底应该怎么用?在官网基本趴菜的情况下,我们是不是还可以使用到真正满血版的DeepSeek?有什么简单一点的方式可以让普通人用吗?这就是今天要讲的事情。
大家好,欢迎收听老范讲故事的YouTube频道。今天我们会先介绍一下什么是满血版DeepSeek,为什么要放弃本地部署,以及官网现状替代方案。今天的替代方案是火山方舟平台的替代方案。这个是字节跳动下面的,这个是目前为止相对来说比较均衡的一个方案。为什么?你比如像硅基流动,配置是相对来说比较简单的,但是实在是很慢。你使用的时候非常的不流畅,而且经常没有办法得到完整的答案。所以我现在基本上放弃了硅基流动这个平台,现在主要是使用方舟平台。方舟平台跟其他的像什么阿里云、腾讯云比起来,虽然都是云计算平台,但是配置起来相对还没有那么复杂。因为越是云计算平台的配置越麻烦。
讲完了这个方舟平台之后,我们要讲一下Cherry Studio啊。这个是目前普通人可以使用的比较简单的AI辅助工具。因为现在绝大部分的AI辅助工具都是网页。你让一个没有学过电脑的人去部署网页,去部署一个网站,还是挺麻烦的。有这个客户端,Cherry Studio就是Windows和Mac OS的一个客户端,下载下来就直接可以用。这个要相对来说简单很多。
More
2 月 11
Luke Fan AIGC , DeepSeek大模型 2025美中脱钩法案 , 360智能云 , AI与股市 , AI云服务 , AI产业链 , AI产业革命 , AI公司估值 , AI公司分析 , AI发展趋势 , AI国际化 , AI大模型 , AI开源技术 , AI开源模型 , AI技术划时代 , AI技术合作 , AI技术壁垒 , AI投资趋势 , AI推理芯片 , AI核心技术 , AI概念股 , AI模型免费 , AI模型统一 , AI生态统一 , AI股票涨停 , AI行业投资 , AI革命 , ASIC芯片 , DeepSeek , DeepSeek R1 , Deepseek V3 , DeepSeek与英伟达 , DeepSeek国运创新 , DeepSeek影响力 , DeepSeek技术解析 , DeepSeek股票影响 , DeepSeek部署 , GPU , Josh Holy , LLaMA , TPU , 东升西降 , 中国AI , 中国AI崛起 , 中国AI未来 , 中国移动 , 京东云 , 人工智能禁令 , 全球AI竞争 , 全球AI部署 , 六小虎 , 华为盘古 , 博通 , 国运级创新 , 国运级创新意义 , 国际AI格局 , 大模型微调 , 字节豆包 , 开源大模型 , 概念股 , 游戏科学 , 火山引擎 , 百度 , 百度智能云 , 硅基流动 , 科技公司涨停 , 美股蒸发 , 腾讯 , 腾讯浑元 , 英伟达 , 金山云 , 阿里云 , 阿里千问 , 黑神话悟空
VIDEO
第二个故事:DeepSeek到底是不是国运级的创新呢?国运级创新这个事呢,是游戏科学的创始人兼CEO冯骥他去讲的。DeepSeek是一个国运级的创新。游戏科学,就是黑神话悟空的这个开发商。DeepSeek呢,也确实让美股市值蒸发了很多很多钱。而且还有一位美国的参议员说:“我们要下最严格的法令来禁止DeepSeek。谁敢下载DeepSeek判20年,哪个企业敢去用DeepSeek罚1亿美金。”
这个是个共和党参议员叫Josh Holy,写了一个法案,叫2025年美国人工智能能力与中国脱钩法案。禁止技术交流与使用,禁止美国公民、企业与中国开展任何AI技术合作,包括研发、投资、数据共享等。非美国公民若涉及技术转移,可以驱逐出境。然后切断资本与人才流动,禁止美国资本对中国AI企业投资,并限制美籍科研人员参与中国AI项目。任何与中国高效实验室合作的美国机构将面临重罚。违反本法案的个人将被视为严重犯罪分子,可能影响其移民身份、绿卡申请和入籍资格。美国公司不能直接或间接向中国企业提供AI技术支持或者服务。但是这个法案呢,因为太过极端已经被搁置了。
先讲一下使用DeepSeek的方式到底是什么样的。如果你在美国使用DeepSeek,那千万千万不要去DeepSeek网去挂,那是根本得不到服务的。最好是什么呢?就是去在美国的云主机上去使用。现在DeepSeek自己的网站基本上是半瘫痪状态,聊两句就趴菜。我基本上是第一句能聊,第二句能聊,第三句你再怎么跟他聊都趴。他是这样的一个状态。你可能明天再跟他聊,还可以聊两句。API调用的话非常非常慢。而且呢,现在禁止充值了。整个春节期间,API调用的这个页面就打不开了,把整个API后台给你封掉了。现在的话是后台重新有了,但是不允许充值。现在呢,国内是各种云上都有,国内的是阿里云、腾讯云、华为云。华为云的DeepSeek呢。
More
1 月 28
范, 路 AIGC , DeepSeek大模型 AI Agent公司 , AI Agent生态 , AIGC领域 , AI云计算 , AI产业标准 , AI协作方式 , AI大模型 , AI开源 , AI开源项目 , AI推理能力 , AI数据偏见 , AI显卡优化 , AI显卡禁令 , AI研发成本 , AI蒸馏微调 , AI闭源模型 , AMD MI 300 , AMD显卡兼容 , Anthropic压力 , Claude模型 , DeepSeek , DeepSeek R1 , Deepseek V3 , DeepSeek代码 , DeepSeek原创性 , DeepSeek影响 , DeepSeek成果 , DeepSeek数据来源 , DeepSeek美国市场 , DeepSeek英文论文 , Deepseek训练成本 , DeepSeek论文 , Huggingface , Kimi 1.5 , Meta AI发展计划 , Meta震惊 , Minimax 01 , OpenAI竞争 , Oracle云计算 , PyTorch开源工具 , 中文社交媒体 , 中美AI竞争 , 中美科技博弈 , 亚马逊AI , 人工智能创新 , 华为AI标准 , 大模型训练路径 , 字节跳动AI , 开源模式 , 开源胜利 , 微软AI , 英伟达显卡 , 谷歌AI , 谷歌AI研究 , 豆包1.5 , 通义千问 , 闭源与开源
VIDEO
DeepSeek突然出圈,引发了中文圈的争吵。大家好,欢迎收听老范讲故事的YouTube频道。
DeepSeek在前面,我们已经出了一期视频,去讲它到底是怎么回事了。那么,DeepSeek最近肯定是更加的出圈。首先,DeepSeek V3,据说训练成本只有557万美金,震惊了扎克伯格,震惊了Meta。Meta说:“我们有好多的老大,他们的年薪都超过557万美金了。人家训练了个模型才用了557万美金,那我花了这么多钱去组建AI团队,花了这么多钱去囤显卡,是不是亏了?”现在就有这样的声音出来。
而且,最新的DeepSeek R1,也就是它的推理模型,推理能力已经接近o1了。蒸馏微调出来的这些小模型,已经在很多领域里头超越了o1 Mini。在这儿多补充一句,什么叫蒸馏微调的小模型?像我的电脑上,也是跑了一个DeepSeek R1-32B的模型。这个模型是怎么来的?它实际上是由DeepSeek R1去输出数据,然后拿输出的数据再去调通义千问2.5-32B的这个模型,最后得到的结果。这就是DeepSeek R1-32B,他在我的电脑上做各种推理,效果相当不错。
More
1 月 07
Luke Fan AIGC AI开源模型 , AI技术解析 , Deepseek AI发展 , Deepseek MoE模型解析 , Deepseek V3 , Deepseek V3技术优势 , Deepseek V3技术难点 , Deepseek V3效率 , Deepseek V3特点 , Deepseek V3解析 , Deepseek VS密集模型 , Deepseek与Claude , Deepseek与GPT-4对比 , Deepseek与Llama , Deepseek与李开复 , Deepseek与零一万物 , Deepseek国内模型 , Deepseek国际关注 , Deepseek学术价值 , Deepseek应用场景 , Deepseek开源代码 , Deepseek开源项目 , Deepseek微调难点 , Deepseek性能优化 , Deepseek技术革新 , Deepseek推理成本 , Deepseek训练成本 , Deepseek通信开销 , MoE架构创新 , MoE模型 , 中国AI模型 , 医院分诊模型 , 地址邮编模型 , 多任务AI学习 , 多头潜在注意力机制 , 密集模型对比 , 混合专家模型 , 细颗粒度专家模型 , 细颗粒度模型解析
VIDEO
大家好,欢迎收听老范讲故事的YouTube频道。今天咱们来讲一讲Deepseek V3搅动风云的事情。Deepseek V3到底先进在什么地方?我在这一段时间呢,也看了一些人的介绍,甚至也看了一些人的视频,尝试用人话来讲清楚,还是很困难的。有一些人很扑克脸,上来就把论文念了一遍,底下一堆人在那评论说有听没有懂。咱们呢尽量避免看这个事情,想办法呢,用举例子和讲故事的方式,让大家能够稍微的了解一下Deepseek V3到底干了点什么。
但是呢,这个里头就会有一个问题,就是例子跟故事呢,有时候不一定准确。所以呢,我们尽量的传递,让大家可以对相关的概念有一个感性的认知。跟大家先讲一个故事吧,这样的话,你们就可以理解待会我要讲的故事大概在什么层面上了。
说爱因斯坦在晚年,有一次去参加美国的一个慈善晚会,来了位盲人。说:“您看,这是个盲人,您能给他解释一下什么是相对论吗?”从来也没见过任何的光,也就没见过任何东西。你告诉我怎么叫相对论。爱因斯坦想了想,说:“这个相对论呢,就是相对的,就是黑的跟白的,你能理解吗?”这个盲人说:“我生下来就是盲人,我没法理解什么是黑的跟白的。”爱因斯坦说:“那你想想有一只大鹅,大鹅你知道吗?这个鹅是白的。”盲人说:“我从小就是盲人,我没见过鹅。”爱因斯坦继续说:“鹅有一个长长的脖子,你能想象吗?”盲人说:“哎呀,我从小是盲人,我没见过鹅,也没见过什么叫长长的脖子。”爱因斯坦说:“这个鹅的长长的脖子是可以弯的。”盲人问:“怎么弯呢?”爱因斯坦说:“来,我给你比划一下。你把这个手伸出来,这个手伸出来,然后呢,这是直的,这是弯的,你懂了吧?”盲人说:“哎呀,我好像已经懂了,什么是脖子是直的是弯的,也能够想象一下什么是鹅了,甚至呢,我都觉得我理解了什么是相对论了。”
More
1 月 06
Luke Fan AIGC , 雷军、小米 , 雷军与小米 ACL大会 , AI人才 , AI人才评估 , AI公司招聘 , AI大模型 , AI天才少女 , AI实验室 , AI小模型 , AI工程团队 , AI工程师 , AI应用 , AI技术 , AI技术圈 , AI新闻 , AI模型 , AI炒作 , AI炒作价值 , AI热点 , AI研究 , AI科技企业 , AI科研 , AI竞争 , AI自然语言处理 , AI萝莉 , AI语音技术 , AI趋势 , AMR解析 , DeepSeek , Deepseek V3 , Model训练 , NLP , 万卡集群 , 北京大学 , 北大 , 北师大 , 千万年薪 , 国际计算语言学年会 , 学术圈 , 学术履历 , 小米 , 小米AI , 小米AI实验室 , 小米AI生态 , 小米AI计划 , 小米万卡集群 , 小米发展 , 小米市值 , 小米战略 , 小米手机 , 小米新动向 , 小米模式 , 小米科技 , 小米股价 , 小米股市 , 小米高端手机 , 小米高薪 , 工程技术人才 , 工程技术能力 , 市值管理 , 幻方量化 , 技术IP , 技术储备 , 技术创新 , 有向无环图 , 深度学习 , 深度求索 , 清北校友 , 清北班 , 清北精英 , 清华 , 热点事件 , 科技人才争夺 , 科技圈 , 科技大牛 , 科研能力 , 端测模型 , 米粉 , 罗福莉 , 自然语言处理 , 计算语言学 , 论文发表 , 语言学 , 语言学研究 , 超级小爱 , 达摩院 , 雷军 , 雷军AI战略 , 雷军亲自招人
VIDEO
雷军千万年薪挖回来的AI萝莉,到底值不值呢?大家好,欢迎收听老范讲故事的YouTube频道。今天咱们来讲一讲,雷军花了千万年薪挖回来的天才少女,到底价值几何的故事。
首先,这个消息并不是小米官方放出来的,而是证券时报等一大堆媒体报道出来的。报道出了这样的一个故事之后,肯定就会被舆论热炒。第一个,AI现在肯定是全村最靓的仔,跟AI相关的事情更容易被媒体所报道。第二个,小米跟雷军本身就是顶流,任何事情只要沾着小米,沾着雷军了,都会被过度的炒作。
现在这位AI天才少女叫罗福莉,号称是雷军亲自下场捞的人。这个事情到底有多亲自呢?不好说。很多记者也去找小米核实,问有没有这么个事情,是不是有千万年薪,雷军到底是怎么谈的这个事情呢?目前为止,小米没有给出官方确认。但是,如果千万年薪是真的,那这个事雷军必须是要签字确认的。如果不签字的话,这样高的薪水是开不出来的。
More