2 月 27
Luke FanAIGC, DeepSeek大模型, 机器人与具身智能 AI与硅胶结合, AI变现, AI变现方式, AI市场, AI情感, AI成人应用, AI成人模式, AI成人版, AI成人用品, AI成人领域, AI技术, DeepSeek, DeepSeek产品, DeepSeek技术, DeepSeek赋能, Grok, Grok性感语音, TPE材料, WM DOLL, 中国出口, 中国硅胶出口, 人工智能, 人形机器人, 人形机器人表情, 全球销量, 具身技术, 具身智能, 具身智能进展, 具身机器人, 医用硅胶, 塑料骨骼, 广东硅胶材料, 性感语音模块, 恐怖谷效应, 情感寄托, 情感智能, 成人AI互动, 成人AI技术, 成人产业, 成人内容AI, 成人化趋势, 成人机器人, 成人版GPT, 日本Orient industry, 智能硅胶娃娃, 智能音箱功能, 硅胶供应链, 硅胶和TPE, 硅胶娃娃, 硅胶娃娃价格, 硅胶娃娃全球销售, 硅胶娃娃制造, 硅胶娃娃厂家, 硅胶娃娃发展, 硅胶娃娃品牌, 硅胶娃娃市场, 硅胶娃娃情感记忆, 硅胶娃娃的历史, 硅胶娃娃的未来, 硅胶娃娃维护, 硅胶娃娃销量, 硅胶娃娃骨骼, 硅胶材料, 美国Real Doll, 语音模块, 金三WM DOLL, 金三完美, 金三完美DeepSeek, 金三硅胶娃娃
DeepSeek推动了硅胶娃娃的大卖。大家好,欢迎收听老范讲故事的YouTube频道。DeepSeek确确实实改变了很多的行业与渠道,甚至DeepSeek之后,整个AIGC领域进行了一次大的洗牌,或者进行了一次方向调整。那么,这一次轮到了谁呢?轮到了硅胶娃娃。
这里讲到的硅胶娃娃是一种成人用品,跟儿童玩具是没有关系的。那么,这一次接入DeepSeik大卖的硅胶娃娃是谁家的呢?是广东中山金三完美这样的一个公司,他们做的这个品牌叫WM DOLL。一般好像硅胶娃娃都是这个词。他们呢,把这个DeepSeek加上语音模块,直接集成到了硅胶娃娃里面去,还加上了一些内部的存储单元。就是它可以记住一些主人与硅胶娃娃之间沟通交流的细节,然后下一次你再跟他沟通交流的时候,他可能还记住一部分,所以可以形成非常好的这种情感寄托。
这个娃娃呢,现在在海外大卖,第一批200个扔出去以后秒光。你说200个这玩意有多少?大家注意,硅胶娃娃这个东西,全世界每年也就卖个几千个,已经算是非常非常高的销量了。那么,国内做硅胶材料的各种上市公司呢,股票都大涨。这个金三完美他们是没有上市的,但是给他们供材料的,都已经借上这波东风了。DeepSeek来了,我股票涨了,为什么?没想明白,原来有人做了硅胶娃娃,套了DeepSeek的壳了。这个也真的是破天的富贵就到头上了。
More
2 月 26
Luke FanAIGC, DeepSeek大模型, OpenSource BF16精度, Blackwell架构, CPU超频对比, CUDA-LESS, CUDA优化, CUDA优化应用, DeepSeek, Flash Attention 2, Flash Attention 3, Flash MLA, Flash MLA核心功能, FP16, FP32, GB200芯片, GPU优化技术, GPU内存带宽优化, GPU内存架构, GPU带宽提升, GPU性能优化, GPU技术分析, GPU架构设计, GPU禁运, GPU超频, H100芯片, H800芯片, HBM内存, Hopper系列芯片, Huggingface优化, H系列GPU性能, Llama CPP优化, MIT协议, MIT开源协议介绍, Transformers架构, 中国GPU限制, 中国芯片制造, 分块调度, 分页式间值缓存, 大模型推理, 大模型推理优化, 并行计算, 开源创新, 开源解决方案, 开源项目, 显卡市场格局, 显卡性能提速, 显存碎片管理, 美国出口限制, 英伟达, 英伟达GPU市场, 英伟达H100提速, 英伟达H800带宽, 英伟达Hopper架构, 英伟达商业策略, 英伟达市场竞争, 英伟达新架构, 高性能计算, 高效多层注意力解码内核
DeepSeek开源周第一炮打响,这次英伟达可真的有的愁了。大家好,欢迎收听老范讲故事的YouTube频道。DeepSeek号称要做开源周,也就是在这一周里边,连续5天发布5个开源项目。那么第一炮打的是什么呢?这个产品叫Flash MLA,这是一个MIT协议的开源项目。待会我们再去讲什么是MIT协议。一天上来就直接获得了几千个星星,就是你把项目发布到GitHub上以后,如果有人喜欢的话会打一个星星。打了星星以后的话,这个项目未来有各种的更新和迭代,我们是会收到通知的。所以很多的开源项目,是用星星的数字来衡量自己项目的受欢迎程度的。
这个项目呢,其实对于绝大多数的使用者来说,短期之内是不会有影响的。什么叫短期?可能就是几个月的时间之内,不会有特别大的变化。但是,可能过了这几个月,这个变化就会逐渐的显现出来。英伟达这次到底能不能挺得住,是会变得好还是会变得坏?这就是我们今天要讲的故事。
英伟达面对Flash MLA这样的一个项目呢,应该有点哭笑不得。为什么呢?这个是必须在英伟达Hopper系列芯片上使用的一个技术,也就是离开英伟达芯片你跑不了。所以这玩意是给英伟达芯片再去做优化。但是呢,这里有个问题,英伟达的H100是被美国禁运的,中国是不可以购买的。中国只可以购买H800,也就是英伟达经过精准的刀法裁切以后的这个版本。它在H800的这个基础上呢进行了提速,这就是这一次的Flash MLA真正给出来的东西。
More
2 月 24
Luke FanAIGC, DeepSeek大模型 AI企业融资, AI估值模型, AI商业模式, AI大模型, AI市场分析, AI市场竞争, AI应用场景, AI应用端竞争, AI开源模式, AI投资传闻, AI投资策略, AI投资风险, AI生态系统, AI盈利与研发, AI盈利模式, AI盈利计划, AI研发压力, AI研究机构, AI行业巨头, AI行业转型, AI资本运作, AI转型策略, DeepSeek, DeepSeek与OpenAI, DeepSeek免费模式, DeepSeek全球封禁, DeepSeek商业化, DeepSeek模型, DeepSeek现状, DeepSeek盈利转型, DeepSeek研发方向, OpenAI转型, The Information报道, 云服务商认证, 人工智能融资, 估值谈判, 商业型AI公司, 国内AI发展, 国内AI竞争, 国内AI行业动态, 国内大模型, 国家主权财富基金, 国运级AI企业, 大模型开放策略, 技术研发成本, 服务认证收费, 深度求索API, 深度求索发展方向, 深度求索战略, 深度求索融资, 盈利压力, 盈利型AI公司, 研究型机构盈利, 社保基金投资, 科技企业独立性, 科技企业转型, 科技创新融资, 科技研发方向, 科研机构盈利模式, 资本施压, 阿里巴巴投资
大家好,欢迎收听老范讲故事YouTube频道。今天咱们来讲一讲DeepSeek的母公司——深度求索,是不是正在融资?消息是什么时候出来的?是2月19号传出来的。而且这个消息呢,并不是某人突然发了一条推特,或者发了一个其他的社交媒体,而是有一份报道。这个是The Information这样的一个媒体,做了独家的报道。据说有人参加谈判了,那么是参加这种融资谈判的人出来报的料。
据说参加谈判的有哪些家?第一个是阿里巴巴,然后呢是一些国有资金,包括中投公司、国家主权财富基金、国家社会保障基金,也就是社保基金。在The Information发了邮件去质询DeepSeek,阿里巴巴、中投公司没有回复质询,两位直接了解会谈的人回复了信息。
看到这里,咱们先看看这个到底是在说什么。一共是几家来谈判?DeepSeek自己可能要去参加谈判的,阿里巴巴要去参加谈判的,中投、国家主权财富基金、国家社会保障基金,这些都要去参加谈判呢。现在没有评论的是DeepSeek、阿里巴巴和中投,剩下有两位直接了解会谈信息的人士回复信息。这两个人应该是国家主权财富基金和国家社会保障基金的。那你说是一边一个,还是说这两个人都是属于其中某一个基金的呢?这个就没有办法去判断了。
More
2 月 18
Luke FanAIGC, DeepSeek大模型 671B开源模型, AI免费服务, AI发展趋势, AI商业模式创新, AI垄断, AI安全性, AI对话模型, AI幻觉问题, AI广告收入, AI开源, AI推理模型, AI未来发展, AI模型对齐, AI流量焦虑, AI用户忠诚度, AI盈利困局, AI系统集成, AI行业竞争, AI语音功能, AI黑箱子, B端市场, Claude 4发布时间, Claude4, C端市场, DeepSeek, DeepSeek API, DeepSeek R1一体机, DeepSeek安全性, DeepSeek对OpenAI影响, Gemini 2.0, Google AI Studio, GPT-4.5, GPT-5, GPT-5功能, Llama4, OpenAI, OpenAI盈利, OpenAI订阅, ToB市场, ToB部署, ToC市场, ToC用户体验, 多模态生成, 大模型, 大模型商业模式, 大模型统一接口, 大模型计算成本, 山姆·奥特曼, 开放源代码, 开源大模型, 推广成本, 推理成本, 推理模型O系, 文心一言4.0, 文心一言4.5, 文心一言Turbo, 文心一言免费, 李彦宏, 百度AI, 百度搜索广告, 百度文心一言, 谷歌AI策略, 谷歌Gemini
大家好,欢迎收听老范讲故事的YouTube频道。今天咱们来讲一讲DeepSeek。这条鲶鱼搅浑了水,GPT5要来了,百度也要免费开源了,到底是一个什么样的情况?大模型这个赛道未来会怎么去发展?
DeepSeek呢,算是彻底改变了游戏规则。OpenAI给整个行业挖的坑,到现在呢,还有一些公司没查出来呢。什么坑?就是客户端这个订阅20美金一个月这个坑。这个其实是一个非常失败的商业模式。谷歌到现在还在往外爬,因为谷歌他其实自己不太想爬出来。为什么?因为他一旦爬出来以后的话,谷歌搜索的广告收入就没了,只能在那里头装聋作哑了。Perplexity到现在也还在思考,到底是不是要爬出来。
大家有没有想过一个问题?开源模型,因为DeepSeek是满血版671B的开源模型,它对于OpenAI的伤害,到底是ToB的伤害大,还是ToC的伤害大?这是一个大家值得去思考的事情。虽然现在DeepSeek在很多的C端有非常大的影响力,就是很多的个人去下载这个东西去用去,但其实真正的开源模型影响最大的是B端。我这是一个自己的公司,我是一个政府项目,或者是一个什么样的商业相关的事情,我要去使用大模型的时候,一定是会优先去选择这种完全可控的开源模型,而不是说我去用人家的闭源的,买人家API。因为你一旦是有开源模型的话,你就可以选择完全私有部署,我自己买台服务器往里装就完了。
More
2 月 16
Luke FanAIGC, DeepSeek大模型 671B参数, AI工具推荐, AI模型整合, AI辅助工具, AI辅助工具使用, Cherry Studio, Cherry Studio功能, Cherry Studio操作指南, Cloud AI, DeepSeek, DeepSeek API Key获取, DeepSeek R1, DeepSeek R1搭建, Deepseek V3, DeepSeek V3搭建, DeepSeek使用教程, DeepSeek大模型应用, DeepSeek实时搜索, DeepSeek应用广场, DeepSeek接入点创建, DeepSeek推理模型, DeepSeek替代方案, DeepSeek模型参数, DeepSeek模型广场, DeepSeek满血版, DeepSeek联网搜索, 云计算AI模型, 云计算大模型部署, 云计算平台, 云计算教程, 人工智能部署, 大模型使用, 如何配置DeepSeek, 字节跳动, 方舟平台, 本地部署DeepSeek, 深度求索, 满血版DeepSeek, 火山引擎, 火山引擎操作, 火山方舟, 火山方舟优势, 火山方舟模型设置, 火山方舟部署, 火山方舟配置, 联网搜索功能, 联网搜索设置
真正满血版的DeepSeek到底应该怎么用?在官网基本趴菜的情况下,我们是不是还可以使用到真正满血版的DeepSeek?有什么简单一点的方式可以让普通人用吗?这就是今天要讲的事情。
大家好,欢迎收听老范讲故事的YouTube频道。今天我们会先介绍一下什么是满血版DeepSeek,为什么要放弃本地部署,以及官网现状替代方案。今天的替代方案是火山方舟平台的替代方案。这个是字节跳动下面的,这个是目前为止相对来说比较均衡的一个方案。为什么?你比如像硅基流动,配置是相对来说比较简单的,但是实在是很慢。你使用的时候非常的不流畅,而且经常没有办法得到完整的答案。所以我现在基本上放弃了硅基流动这个平台,现在主要是使用方舟平台。方舟平台跟其他的像什么阿里云、腾讯云比起来,虽然都是云计算平台,但是配置起来相对还没有那么复杂。因为越是云计算平台的配置越麻烦。
讲完了这个方舟平台之后,我们要讲一下Cherry Studio啊。这个是目前普通人可以使用的比较简单的AI辅助工具。因为现在绝大部分的AI辅助工具都是网页。你让一个没有学过电脑的人去部署网页,去部署一个网站,还是挺麻烦的。有这个客户端,Cherry Studio就是Windows和Mac OS的一个客户端,下载下来就直接可以用。这个要相对来说简单很多。
More
2 月 11
Luke FanAIGC, DeepSeek大模型 2025美中脱钩法案, 360智能云, AI与股市, AI云服务, AI产业链, AI产业革命, AI公司估值, AI公司分析, AI发展趋势, AI国际化, AI大模型, AI开源技术, AI开源模型, AI技术划时代, AI技术合作, AI技术壁垒, AI投资趋势, AI推理芯片, AI核心技术, AI概念股, AI模型免费, AI模型统一, AI生态统一, AI股票涨停, AI行业投资, AI革命, ASIC芯片, DeepSeek, DeepSeek R1, Deepseek V3, DeepSeek与英伟达, DeepSeek国运创新, DeepSeek影响力, DeepSeek技术解析, DeepSeek股票影响, DeepSeek部署, GPU, Josh Holy, LLaMA, TPU, 东升西降, 中国AI, 中国AI崛起, 中国AI未来, 中国移动, 京东云, 人工智能禁令, 全球AI竞争, 全球AI部署, 六小虎, 华为盘古, 博通, 国运级创新, 国运级创新意义, 国际AI格局, 大模型微调, 字节豆包, 开源大模型, 概念股, 游戏科学, 火山引擎, 百度, 百度智能云, 硅基流动, 科技公司涨停, 美股蒸发, 腾讯, 腾讯浑元, 英伟达, 金山云, 阿里云, 阿里千问, 黑神话悟空
第二个故事:DeepSeek到底是不是国运级的创新呢?国运级创新这个事呢,是游戏科学的创始人兼CEO冯骥他去讲的。DeepSeek是一个国运级的创新。游戏科学,就是黑神话悟空的这个开发商。DeepSeek呢,也确实让美股市值蒸发了很多很多钱。而且还有一位美国的参议员说:“我们要下最严格的法令来禁止DeepSeek。谁敢下载DeepSeek判20年,哪个企业敢去用DeepSeek罚1亿美金。”
这个是个共和党参议员叫Josh Holy,写了一个法案,叫2025年美国人工智能能力与中国脱钩法案。禁止技术交流与使用,禁止美国公民、企业与中国开展任何AI技术合作,包括研发、投资、数据共享等。非美国公民若涉及技术转移,可以驱逐出境。然后切断资本与人才流动,禁止美国资本对中国AI企业投资,并限制美籍科研人员参与中国AI项目。任何与中国高效实验室合作的美国机构将面临重罚。违反本法案的个人将被视为严重犯罪分子,可能影响其移民身份、绿卡申请和入籍资格。美国公司不能直接或间接向中国企业提供AI技术支持或者服务。但是这个法案呢,因为太过极端已经被搁置了。
先讲一下使用DeepSeek的方式到底是什么样的。如果你在美国使用DeepSeek,那千万千万不要去DeepSeek网去挂,那是根本得不到服务的。最好是什么呢?就是去在美国的云主机上去使用。现在DeepSeek自己的网站基本上是半瘫痪状态,聊两句就趴菜。我基本上是第一句能聊,第二句能聊,第三句你再怎么跟他聊都趴。他是这样的一个状态。你可能明天再跟他聊,还可以聊两句。API调用的话非常非常慢。而且呢,现在禁止充值了。整个春节期间,API调用的这个页面就打不开了,把整个API后台给你封掉了。现在的话是后台重新有了,但是不允许充值。现在呢,国内是各种云上都有,国内的是阿里云、腾讯云、华为云。华为云的DeepSeek呢。
More
2 月 11
Luke FanAIGC, DeepSeek大模型 029筛选, 16张H100显卡, 32B模型, 50美金AI训练, 59, AI公司裁员, AI商业化, AI小公司机会, AI开发路径, AI成本控制, AI技术突破, AI推理模型, AI教母, AI模型蒸馏, AI测试标准, AI用户粘度, AI科学方法, AI筛选问题, AI行业未来, AI行业竞争, AI行业落地, AI领域定制, AI领域案例, ChatGPT O1, ChatGPT对比, DeepSeek R1, Gemini 2.0 Flash thinking, Gemini数据, S1K模型, Together平台, Together平台训练, 中国AI创新, 人工智能创新, 低成本AI, 可感知AI效果, 大模型与小模型, 大模型优化, 大模型应用, 小型模型训练, 小模型训练, 开源微调模型, 微调模型, 推理效率提升, 推理时间优化, 推理步数评估, 收敛性评估, 教育AI模型, 数据训练优化, 斯坦福大学, 普林斯顿大学, 李飞飞, 法律AI模型, 用户定制化AI, 电子工程博士, 硅基流动, 硅基流动平台, 置信度评估, 蒸馏模型方法, 蒸馏训练技术, 蒸馏问题技术, 财务AI模型, 通义千问, 问题筛选技术, 预算强制法, 高效AI解决方案, 高效AI训练
大家好!欢迎收听老范讲故事YouTube频道。今天咱们来讲一讲李飞飞的S1K模型。50美金成本超越DeepSeek R1和ChatGPT O1。
首先呢,DeepSeek到底是怎么震惊全球的?就是因为训练成本低。他的训练成本是OpenAI的3%,所以震惊了全球。
那么现在李飞飞的S1K模型,16张H100的显卡,跑了26分钟跑完了,拿到了一个32B的模型。多项测试超越了DeepSeek R1和GPTO1。
大家要注意,评测大模型呢,它有很多很多测试项。一般我们说基本上达到什么什么水平,就属于叫互有伯仲。有些你强点,有些他强点。原来大家都超不过GPT 4O,是因为只能接近它,距离它的全项指标都有差距。现在的话,大家就已经基本上可以达到GPT 4o的水平了。
More
2 月 10
Luke FanAIGC, DeepSeek大模型 AI大模型生成内容, AI提示词工程, DeepSeek R1模型, DeepSeek与ChatGPT对比, DeepSeek与头孢, DeepSeek与本地模型, DeepSeek与豆包, DeepSeek伪满血版, DeepSeek使用建议, DeepSeek免费书骗局, DeepSeek公众号陷阱, DeepSeek国内模型对比, DeepSeek培训骗局, DeepSeek平替工具, DeepSeek怎么用, DeepSeek推理效果, DeepSeek推理模型, DeepSeek提示词技巧, DeepSeek插件推荐, DeepSeek插件骗局, DeepSeek搜索功能, DeepSeek是什么, DeepSeek智商税, DeepSeek服务器卡顿, DeepSeek本地部署, DeepSeek标题党, DeepSeek正式版, DeepSeek点击陷阱, DeepSeek生成内容, DeepSeek的核心功能, DeepSeek真实效果, DeepSeek算力问题, DeepSeek课程分析, DeepSeek防骗指南, DeepSeek韭菜素养, DeepSeek骗局, 如何应对AI骗局, 清华DeepSeek书骗局
清华大学《DeepSeek深入浅出》.PDF
满血DeepSeek的硅基流动邀请链接
普通人面对铺天盖地的DeepSeek信息,应该如何防骗呢?
大家好,欢迎收听老范讲故事的YouTube频道。今天咱们来讲一讲韭菜的基本素养。现在DeepSeek相关的信息铺天盖地,很多普通人都说:“哎呀,我也要去试一下,这东西到底能对我的生活带来什么样的改变呢?”大部分的网上流传的DeepSeek信息,其实都是有欺骗性的。他们呢,主要是卖课的——付费课程。当然,还有一些是骗点击、骗插件、骗用户、骗关注。
这个有什么区别?比如说,我一个标题叫“DeepSeek说了什么什么什么东西”,这个呢叫骗点击。如果他不写DeepSeek说了什么,你会点进去吗?你不会点进去。对于他来说,就已经挣到钱了。骗人买插件是什么呢?你比如说,有些人讲了说:“office怎么样,WPS怎么样,去用DeepSeek了。”这些呢都实际上是卖插件的,因为官方不支持,要求你自己去安装一个特殊的第三方插件,你才可以使用DeepSeek。
More
2 月 03
Luke FanAIGC, DeepSeek大模型 DeepSeekGP风险, DeepSeek企业架构揭秘, DeepSeek企业治理, DeepSeek企业责任, DeepSeek利润分配, DeepSeek利益分配, DeepSeek合伙协议, DeepSeek基金架构, DeepSeek实控人, DeepSeek投资指南, DeepSeek投资避坑, DeepSeek有限合伙人, DeepSeek有限责任公司, DeepSeek真假一盘大棋, DeepSeek税收机制, DeepSeek股东结构, DeepSeek股权架构, DeepSeek股权穿透计算, DeepSeek背责机制, DeepSeek背责风险, DeepSeek自然人股东, DeepSeek责任分配, DeepSeek资金流, GP与LP区别, 幻方量化DeepSeek, 幻方量化GP布局, 幻方量化GP机制, 幻方量化GP风险, 幻方量化投资深度, 幻方量化控制权, 幻方量化深度求索关系, 有限合伙企业税收, 有限合伙企业解读, 有限责任公司股东, 有限责任公司解析, 杭州深度求索结构, 杭州深度求索股权, 梁文峰DeepSeek, 深度求索资金分配, 股东权益分配, 股权结构冰山一角, 股权结构分析, 股权设计阴谋, 股权责任归属
DeepSeek的股权结构真的是一盘大棋吗?大家好,欢迎收听老范讲故事的YouTube频道。DeepSeek最近实在是火出圈来了,大家都在很努力地去解读DeepSeek各种各样的问题,特别是很多金融圈的人也冲进来了。为什么?让股市动荡了吗?但是这些金融圈的人呢,又说不太清楚这个大模型到底是怎么回事。但是股权结构他们是能解释得清楚的,这里面就有各种各样的阴谋论了。
一切呢都是从这张图开始的。首先要尊重一下知识产权,这个是由杰克船长宏观策略提供的。这个朋友呢,应该是雪球上面的一位自媒体博主吧,解读各种各样的宏观策略的。更多的人是在这个上面进行解读。但是我要讲的是什么?就这张图呢,应该仅仅是冰山一角。为什么呢?因为后边是幻方量化,一个做量化的公司,它上面的实体数可能几百个是正常的。千万不要觉得DeepSeek只有这么简单的一个图像,甚至有很多可能平时对于公司结构不是那么熟悉的朋友,一看到说,哇这么多方块,这么多颜色花花绿绿的,这个结构好复杂,这是一盘大棋,设计得好厉害,真的不是这样的。
More
1 月 28
范, 路AIGC, DeepSeek大模型 AI Agent公司, AI Agent生态, AIGC领域, AI云计算, AI产业标准, AI协作方式, AI大模型, AI开源, AI开源项目, AI推理能力, AI数据偏见, AI显卡优化, AI显卡禁令, AI研发成本, AI蒸馏微调, AI闭源模型, AMD MI 300, AMD显卡兼容, Anthropic压力, Claude模型, DeepSeek, DeepSeek R1, Deepseek V3, DeepSeek代码, DeepSeek原创性, DeepSeek影响, DeepSeek成果, DeepSeek数据来源, DeepSeek美国市场, DeepSeek英文论文, Deepseek训练成本, DeepSeek论文, Huggingface, Kimi 1.5, Meta AI发展计划, Meta震惊, Minimax 01, OpenAI竞争, Oracle云计算, PyTorch开源工具, 中文社交媒体, 中美AI竞争, 中美科技博弈, 亚马逊AI, 人工智能创新, 华为AI标准, 大模型训练路径, 字节跳动AI, 开源模式, 开源胜利, 微软AI, 英伟达显卡, 谷歌AI, 谷歌AI研究, 豆包1.5, 通义千问, 闭源与开源
DeepSeek突然出圈,引发了中文圈的争吵。大家好,欢迎收听老范讲故事的YouTube频道。
DeepSeek在前面,我们已经出了一期视频,去讲它到底是怎么回事了。那么,DeepSeek最近肯定是更加的出圈。首先,DeepSeek V3,据说训练成本只有557万美金,震惊了扎克伯格,震惊了Meta。Meta说:“我们有好多的老大,他们的年薪都超过557万美金了。人家训练了个模型才用了557万美金,那我花了这么多钱去组建AI团队,花了这么多钱去囤显卡,是不是亏了?”现在就有这样的声音出来。
而且,最新的DeepSeek R1,也就是它的推理模型,推理能力已经接近o1了。蒸馏微调出来的这些小模型,已经在很多领域里头超越了o1 Mini。在这儿多补充一句,什么叫蒸馏微调的小模型?像我的电脑上,也是跑了一个DeepSeek R1-32B的模型。这个模型是怎么来的?它实际上是由DeepSeek R1去输出数据,然后拿输出的数据再去调通义千问2.5-32B的这个模型,最后得到的结果。这就是DeepSeek R1-32B,他在我的电脑上做各种推理,效果相当不错。
More