12 月 05
Luke Fan AIGC , DeepSeek大模型 AI Agent , AI应用成本 , AI模型评测 , API降价 , DeepSeek V3.2 , DeepSeek V3.2 Special , DeepSeek V3.2技术解析 , DeepSeek稀疏注意力 , DSA算法 , Gemini 3 Pro , GPT-5.1 , SGLANG , VLLM , 国产大模型 , 国产算力 , 大模型发展趋势 , 大语言模型 , 开源AI模型 , 推理效率优化 , 数学推理模型 , 深度求索 , 稀疏注意力 , 长上下文处理
VIDEO
Deepseek V3.2,12月1号发布了。是不是又遥遥领先了呢?
大家好,欢迎收听老范讲故事的YouTube频道 。
Deepseek V3.2的发布应该是12月1日。我们始终没有等来心心念念的Deepseek R2。在今年春节的时候,深度求索突然发布了Deepseek R1,算是扔下了一颗深水炸弹,把整个AI圈都震动了,甚至还造成了英伟达股价的闪崩——一段时间内闪崩吧。甚至老黄都跑出来喊,说:“Deepseek发布对我是利好,你们不要卖英伟达的股票。”大家就一直等着这个R1,既然这么厉害,咱们上R2。但是等了这么久,都没有等来R2。
Deepseek V系列版本回顾
下面呢,我们来捋一下Deepseek V系列的版本到底是怎么样的一个发布过程。
Deepseek V3 (去年12月26日发布): 这是非常非常重要的一个版本。实际上我们后面看到的所有版本,包括R1,都是在Deepseek V3的基础上进行微调、进行蒸馏、进行强化学习。今天发布的Deepseek V3.2,也依然是在这个版本的基础上做出来的。
Deepseek V3-0324 (3月24日发布): 主要是在专项能力上做了一些增强,比如说编代码或者写文章。
Deepseek V3.1 (8月21日发布): 主要是工程化和智能体方面做了增强。因为当时大家都要去做AI agent,而之前的版本在AI agent这一块都比较弱。
Deepseek V3.1 Terminals (9月22日发布): 这个版本叫V3.1的终极版,实际上是对V3.1做了一些修复和精调,并告知这是V3.1的最终版本。
V3.2 EXP (9月29日发布): 一个实验版本,在V3.1终极版的基础上加入了DSA技术。最主要的变化是降价,直接把API调用的价格砍了一半。
Deepseek OCR (10月20日发布): 一个很小的模型(约6G),用于图片解释,效果很好。
maths VR (11月27日发布): 专门做数学推理和数学证明的一个版本,在各种数学题测试中评分非常高。
Deepseek V3.2 正式版 & V3.2 special 特别版 (12月1号发布): 本次发布的主角。
More
11 月 26
Luke Fan DeepSeek大模型 AI量化交易 , China stock market , DeepSeek AI , Deepseek老鼠仓 , financial regulation , 中国股市 , 交易策略 , 内幕交易 , 刑事责任 , 利用未公开信息交易罪 , 同频交易 , 巨额罚款 , 幻方量化 , 林艺平 , 程序员炒股 , 老鼠仓 , 职业操守 , 证券市场禁入 , 证券监管 , 证监会处罚 , 量化交易 , 金融犯罪 , 金融科技 , 非法所得 , 风险控制
VIDEO
Deepseek背后的老鼠仓,被罚了1.77亿人民币,这到底是个什么神奇的故事?
大家好,欢迎收听老范讲故事的YouTube频道 。
天价罚单:1.77亿的老鼠仓
2025年11月11日发了一个公告,这是浙江证监局行政处罚决定书,处罚一个叫林艺平的人,艺术的艺,平衡的平。这个人呢,是在幻方量化里边做老鼠仓。罚多少钱呢?没一罚一,就是把他的非法所得没收掉,再罚以同样的钱。非法所得8,857.69万元,这哥们还是很能挣钱的。你把这个8,000多万要交出来,再罚8,000多万,加一块1.77亿人民币。
处罚算重还是算轻?
是不是付钱了?没有进一步的消息。付不出来就强制执行呗,上你们家卖房卖车去。如果转移资产,就是要判刑。如果实在付不了的话,估计是会挂失信人员的。然后还处以了5年证券市场禁入,这五年里头不能给人当CFO了。你说一程序员是给谁当CFO去?但是他也不能到股市里边去开户。
那你说这对于他来说,处罚是不是太轻了一点?大概率呢,还会移交公安机关起诉判刑,但是这个呢,并没有在这一次的信息里头披露出来。
其实这还不是中国最大的老鼠仓,但基本上已经算是第一梯队了,绝对是战绩彪炳。最大的呢,应该是华宝基金原基金经理蒋宁的一个案子,用了9个亲友账号,盈利1.14亿,最后呢是有期徒刑5年。所以林艺平大概率最后还是要去坐牢的,只是目前呢,是浙江证监局行政处罚决定书公布出来了,应该是后边还有法院再去判决,所以当前并不确定后续的处理方式。
主角登场:幻方量化与“外包程序员”林艺平
Deepseek背后就是幻方量化。那你说他们家确实炒股是有两把刷子。犯事的这段时间呢,是2022年11月16日至2023年9月6号。如果大家有记忆的话,当时应该是中国股市震荡下行期。但是即使在这样的一个阶段里头,幻方量化还是挣到钱了,就是他们通过量化的交易方式挣钱了。
More
10 月 22
Luke Fan AIGC , DeepSeek大模型 , 区块链很疯狂 AI trading competition , AI实盘交易 , AI投资 , AI盈利能力 , Alpha Arena , Autonomous trading , Claude , Crypto trading , DeepSeek , Gemini , GPT-5 , Grok , LLM benchmark , nof1.ai , Real money trading , 交易策略 , 加密货币投资 , 去中心化交易所 , 大模型炒币 , 投资机器人 , 数字货币 , 模型性能对比 , 永续合约 , 量化交易 , 金融科技
VIDEO
在炒币这件事上,DeepSeek完胜GPT和Gemini。
大家好,欢迎收听老范讲故事的YouTube频道 。
最近有一件事闹得沸沸扬扬,也就是Alpha竞技场。有一个叫NOFE.AI的实验组织,他们组织了一场由大模型炒币的一个实验。这个实验室的组织者呢,是纽约大学机器学习领域的一位博士候选人,应该算是一个学术组织,并不是一个炒币的机构。他呢,想要让大模型使用真金白银,直接在币市里边去进行竞技,而不是去做什么模拟题,做各种什么模拟盘,直接真金白银开干。
比赛呢,是从10月17日开始,每一个大模型给1万美金的启动资金,到现在呢,胜负已经非常明显了。DeepSeek V3.1完胜,他挣的钱最多。Grok-4紧随其后,也是盈利的。盈利的曲线呢,跟DeepSeek V3.1很像,但是这里呢,并不是因为Grok-4抄了V3.1,或者在DeepSeek的基础上去训练出来的,而是什么呢?就是你市场本身是有一个波动曲线的,他们只要采用相近的策略,他们盈亏的曲线就会比较接近。
再往后呢,是Claude sonnet 4.5,它表现得呢要稍微差一些,但也是盈利的。Qwen3 MAX也参加了,稍微地赚了一点点,大概是挣了几百美金吧,基本没赔。有一个对照组,对照组是什么呢?就是买入比特币直接持有,因为你总要跟市场的大势去进行比较嘛。这个组呢,是挣得要更少一些,大概挣了300多美金。Qwen3 MAX大概挣了700多美金,所以Qwen3 MAX还是跑赢了持币观望组的。
More
8 月 24
Luke Fan DeepSeek大模型 AI Agent , AI大模型 , AI科普 , AMD , A股 , Deepseek V3.1 , FP8 , H100 , H800 , MindSpore , MXFP4 , UE8M0 , 九九乘法表比喻 , 二级市场 , 人工智能 , 华为升腾 , 国产算力芯片 , 国运级产品 , 寒武纪 , 工具调用 , 技术脱钩 , 技术路线之争 , 摩尔线程 , 概念股 , 模型量化 , 混合精度训练 , 矩阵乘法 , 科技评论 , 老范讲故事 , 股票投资 , 英伟达 , 裹小脚比喻 , 计算精度 , 谷歌TPU , 资本市场 , 马赛克比喻
VIDEO
Deepseek V3.1发布,很多人应该都有疑问,UE8M0到底是个什么东西?这个国运级的大模型,到底有没有翻车呢?
大家好,欢迎收听老范讲故事的YouTube频道 。
DeepSeek V3.1发布,为什么会墙内开花墙外香呢?大家说这东西在国外也没多火。咱们讲的墙内开花墙外香,并不是说国外火,而是在圈外火。什么意思呢?就是在真正大模型圈里,其实大家并不怎么说这个事,但是在炒股票的这帮人面前,一下就火了,国产算力芯片一把就飞了。
到底是一个什么样的情况?首先呢,Deepseek V3.1在性能上其实并没有特别显著的提升,所以一帮真正去研究大模型的人,或者去研究AI的人,只能在那尬吹,说这个好像强了一点,那个好像强了一点,但其实都并不明显。它的编程能力呢,确实应该有所上升吧,但是你说现在就可以吊打Claude Sonic 4,这个我觉得有些言过其实了。上下文现在是128K了,在Deepseek去年12月份发布的V3版本以及1月份发布的R1版本的时候呢,它的上下文都是64K的。到V30324和R10528这两个版本呢,就已经升级到128K了,所以这一次的V3.1依然是128K。工具调用上应该是真的增强了,比原来的V3增强了,也更加符合AI agent的一个需求,这个就是他的一个主要的优势。
More
7 月 01
Luke Fan DeepSeek大模型 “墙”反着修 , AI , AI伦理 , AI禁令 , API , ChatGPT , Coze , DeepSeek , DeepSeek封禁 , LLM , Minimax , OpenAI , TikTok , YouTube , 中国 , 中美科技竞争 , 人工智能 , 人工智能监管 , 信息安全 , 全境封锁 , 加拿大 , 千问 , 印度 , 可灵 , 合规 , 国际关系 , 大语言模型 , 字节跳动 , 应用商店下架 , 开源模型 , 德国 , 德国禁用DeepSeek , 快手 , 意大利 , 技术封锁 , 政府禁令 , 政府设备禁用 , 数据主权 , 数据出境 , 数据安全 , 数据本地化 , 数据渗透 , 数据隔离 , 智谱AI , 欧盟 , 澳大利亚 , 科技战 , 科技评论 , 网络安全 , 美国 , 美国实体清单 , 老范讲故事 , 苹果 , 谷歌 , 通义 , 防火墙 , 阿里巴巴 , 隐私保护 , 韩国
VIDEO
德国全境禁用DeepSeek,以后这墙要反着修了吗?
大家好,欢迎收听老范讲故事的YouTube频道 。2025年6月27日,德国数据保护专员梅克坎普宣布,已经要求苹果和谷歌从德国应用商店下架DeepSeek应用程序了。德国不是第一个,估计应该也不是最后一个。第一个是谁?意大利。意大利在每一次反对AI这件事情上,都是占第一个。原来他还反过OpenAI的ChatGPT。2025年初,也就是R1刚出来的时候,就直接给封了。
欧盟的其他国家现在是一个什么状态呢?他们比较纠结。荷兰是禁止政府手机安装DeepSeek的APP;比利时是建议公务员的手机不要安装,但是不强制;西班牙是有消费者权益组织在呼吁,政府到目前为止没有采取任何的措施;英国表示说他们在持续的监测,目前还没有做出反应。
其他的一些国家对DeepSeek是什么样的一个态度呢?加拿大所有的政府设备禁止使用DeepSeek;丹麦政府设备禁止使用,但是丹麦有5个大区里头,只有3个在执行,剩下两个还在看。
More
3 月 04
Luke Fan AIGC , DeepSeek大模型 545%利润 , 557.6万美金 , AI优化 , AI优化技术 , AI公关策略 , AI公司争斗 , AI利润计算 , AI商业模式 , AI商战 , AI基准价格 , AI市场格局 , AI开源项目 , AI成本分析 , AI投资策略 , AI推理市场 , AI推理未来 , AI数据中心 , AI服务器管理 , AI生态小厂 , AI硬件 , AI自由市场 , AI行业内幕 , AI行业梗 , AI行业盈利 , AI话题营销 , AI资源分配 , AI量化交易 , AI量化模型 , AI高峰时段 , API定价 , CUDA , DeepSeek , Deepseek V3 , DeepSeek开源库 , DeepSeek计算精度 , GPU全天运营 , GPU租赁成本 , GPU负载均衡 , H100芯片 , H800 , MAAS厂商 , MAAS盈利模式 , MAAS竞争 , R1价格 , 中国AI企业 , 中美AI价格差 , 中美AI市场对比 , 云服务厂商 , 云计算 , 华为云 , 商业逻辑 , 大模型服务 , 大模型训练 , 字节跳动DeepSeek , 并行计算 , 开源协议 , 推理利润 , 推理效率 , 推理系统 , 数据参考价值 , 数据水分 , 数据逻辑 , 模型优化策略 , 模型即服务 , 深度学习 , 硅基流动 , 腾讯DeepSeek , 腾讯IMA , 芯片性能 , 训练成本 , 路深科技 , 达芬奇架构 , 阿里云投资
VIDEO
DeepSeek也玩“one more thing”,突然公布了它的推理利润达到545%,就像当初557.6万美金的训练成本那样,再次震惊了行业。大家好,欢迎收听老范讲故事的YouTube频道。今天咱们来讲一讲,DeepSeek结束了连续5天的开园周之后,到礼拜六玩了一次“one more thing”。这个“one more thing”呢,应该是当年乔布斯的梗。他每一次开发布会到最后的时候呢,都要说“还有一件事,等一等”,而且这一件事呢,往往是特别重要、特别颠覆性的事情。那么这一次又来了,DeepSeek公布了它的V1和R3推理系统相关内容,及大规模部署的成本和收益数据。就是说我部署了这东西以后,到底是挣了多少钱?非常非常让人震惊,因为所有人做这个东西都说我不挣钱,我亏钱,结果等到他这好,545%的利润,所有人都傻了,说你到底咋干的?
具体的实现方法呢,就不再跟大家详细分析了。简单来说,第一个负载均衡,你想他有这么多的GPU,这么多的核心,在他这种MOE的架构下,他把每一层的模型里边每一个专家,分配到不同的设备上面去进行运算。这个呢,就是一个负载均衡,尽量让所有的芯片都动起来,不要说有的芯片闲着呢,有的芯片在那排队。第二个,并行计算。并行处理是什么呢?所有的芯片一起来干活,这个速度肯定会变快。另外呢,一边干活的时候,另外一边呢,再同时进行数据的读写。你不能说我这需要数据了,你给我读,然后处理完了以后你再去写,这样就变慢了嘛。所以基本上在做这样的事情,负载均衡和并行处理。
另外还有一个什么样的事情在做呢?就是有一点点叫“驴粪蛋表面光”。这个也算是老北京的一个俏皮话,什么意思呢?就是这个驴粪球外边是很光滑的,但是里边呢,就是一堆的没有消化好的碎草。DeepSeek也是如此,他把很多的计算精度呢进行了调整,他尽可能的能够达到大家的要求,但是很多细节上的这些你看不到的环节呢,就给你忽略掉了。
More
2 月 27
Luke Fan AIGC , DeepSeek大模型 , 机器人与具身智能 AI与硅胶结合 , AI变现 , AI变现方式 , AI市场 , AI情感 , AI成人应用 , AI成人模式 , AI成人版 , AI成人用品 , AI成人领域 , AI技术 , DeepSeek , DeepSeek产品 , DeepSeek技术 , DeepSeek赋能 , Grok , Grok性感语音 , TPE材料 , WM DOLL , 中国出口 , 中国硅胶出口 , 人工智能 , 人形机器人 , 人形机器人表情 , 全球销量 , 具身技术 , 具身智能 , 具身智能进展 , 具身机器人 , 医用硅胶 , 塑料骨骼 , 广东硅胶材料 , 性感语音模块 , 恐怖谷效应 , 情感寄托 , 情感智能 , 成人AI互动 , 成人AI技术 , 成人产业 , 成人内容AI , 成人化趋势 , 成人机器人 , 成人版GPT , 日本Orient industry , 智能硅胶娃娃 , 智能音箱功能 , 硅胶供应链 , 硅胶和TPE , 硅胶娃娃 , 硅胶娃娃价格 , 硅胶娃娃全球销售 , 硅胶娃娃制造 , 硅胶娃娃厂家 , 硅胶娃娃发展 , 硅胶娃娃品牌 , 硅胶娃娃市场 , 硅胶娃娃情感记忆 , 硅胶娃娃的历史 , 硅胶娃娃的未来 , 硅胶娃娃维护 , 硅胶娃娃销量 , 硅胶娃娃骨骼 , 硅胶材料 , 美国Real Doll , 语音模块 , 金三WM DOLL , 金三完美 , 金三完美DeepSeek , 金三硅胶娃娃
VIDEO
DeepSeek推动了硅胶娃娃的大卖。大家好,欢迎收听老范讲故事的YouTube频道。DeepSeek确确实实改变了很多的行业与渠道,甚至DeepSeek之后,整个AIGC领域进行了一次大的洗牌,或者进行了一次方向调整。那么,这一次轮到了谁呢?轮到了硅胶娃娃。
这里讲到的硅胶娃娃是一种成人用品,跟儿童玩具是没有关系的。那么,这一次接入DeepSeik大卖的硅胶娃娃是谁家的呢?是广东中山金三完美这样的一个公司,他们做的这个品牌叫WM DOLL。一般好像硅胶娃娃都是这个词。他们呢,把这个DeepSeek加上语音模块,直接集成到了硅胶娃娃里面去,还加上了一些内部的存储单元。就是它可以记住一些主人与硅胶娃娃之间沟通交流的细节,然后下一次你再跟他沟通交流的时候,他可能还记住一部分,所以可以形成非常好的这种情感寄托。
这个娃娃呢,现在在海外大卖,第一批200个扔出去以后秒光。你说200个这玩意有多少?大家注意,硅胶娃娃这个东西,全世界每年也就卖个几千个,已经算是非常非常高的销量了。那么,国内做硅胶材料的各种上市公司呢,股票都大涨。这个金三完美他们是没有上市的,但是给他们供材料的,都已经借上这波东风了。DeepSeek来了,我股票涨了,为什么?没想明白,原来有人做了硅胶娃娃,套了DeepSeek的壳了。这个也真的是破天的富贵就到头上了。
More
2 月 26
Luke Fan AIGC , DeepSeek大模型 , OpenSource BF16精度 , Blackwell架构 , CPU超频对比 , CUDA-LESS , CUDA优化 , CUDA优化应用 , DeepSeek , Flash Attention 2 , Flash Attention 3 , Flash MLA , Flash MLA核心功能 , FP16 , FP32 , GB200芯片 , GPU优化技术 , GPU内存带宽优化 , GPU内存架构 , GPU带宽提升 , GPU性能优化 , GPU技术分析 , GPU架构设计 , GPU禁运 , GPU超频 , H100芯片 , H800芯片 , HBM内存 , Hopper系列芯片 , Huggingface优化 , H系列GPU性能 , Llama CPP优化 , MIT协议 , MIT开源协议介绍 , Transformers架构 , 中国GPU限制 , 中国芯片制造 , 分块调度 , 分页式间值缓存 , 大模型推理 , 大模型推理优化 , 并行计算 , 开源创新 , 开源解决方案 , 开源项目 , 显卡市场格局 , 显卡性能提速 , 显存碎片管理 , 美国出口限制 , 英伟达 , 英伟达GPU市场 , 英伟达H100提速 , 英伟达H800带宽 , 英伟达Hopper架构 , 英伟达商业策略 , 英伟达市场竞争 , 英伟达新架构 , 高性能计算 , 高效多层注意力解码内核
VIDEO
DeepSeek开源周第一炮打响,这次英伟达可真的有的愁了。大家好,欢迎收听老范讲故事的YouTube频道。DeepSeek号称要做开源周,也就是在这一周里边,连续5天发布5个开源项目。那么第一炮打的是什么呢?这个产品叫Flash MLA,这是一个MIT协议的开源项目。待会我们再去讲什么是MIT协议。一天上来就直接获得了几千个星星,就是你把项目发布到GitHub上以后,如果有人喜欢的话会打一个星星。打了星星以后的话,这个项目未来有各种的更新和迭代,我们是会收到通知的。所以很多的开源项目,是用星星的数字来衡量自己项目的受欢迎程度的。
这个项目呢,其实对于绝大多数的使用者来说,短期之内是不会有影响的。什么叫短期?可能就是几个月的时间之内,不会有特别大的变化。但是,可能过了这几个月,这个变化就会逐渐的显现出来。英伟达这次到底能不能挺得住,是会变得好还是会变得坏?这就是我们今天要讲的故事。
英伟达面对Flash MLA这样的一个项目呢,应该有点哭笑不得。为什么呢?这个是必须在英伟达Hopper系列芯片上使用的一个技术,也就是离开英伟达芯片你跑不了。所以这玩意是给英伟达芯片再去做优化。但是呢,这里有个问题,英伟达的H100是被美国禁运的,中国是不可以购买的。中国只可以购买H800,也就是英伟达经过精准的刀法裁切以后的这个版本。它在H800的这个基础上呢进行了提速,这就是这一次的Flash MLA真正给出来的东西。
More
2 月 24
Luke Fan AIGC , DeepSeek大模型 AI企业融资 , AI估值模型 , AI商业模式 , AI大模型 , AI市场分析 , AI市场竞争 , AI应用场景 , AI应用端竞争 , AI开源模式 , AI投资传闻 , AI投资策略 , AI投资风险 , AI生态系统 , AI盈利与研发 , AI盈利模式 , AI盈利计划 , AI研发压力 , AI研究机构 , AI行业巨头 , AI行业转型 , AI资本运作 , AI转型策略 , DeepSeek , DeepSeek与OpenAI , DeepSeek免费模式 , DeepSeek全球封禁 , DeepSeek商业化 , DeepSeek模型 , DeepSeek现状 , DeepSeek盈利转型 , DeepSeek研发方向 , OpenAI转型 , The Information报道 , 云服务商认证 , 人工智能融资 , 估值谈判 , 商业型AI公司 , 国内AI发展 , 国内AI竞争 , 国内AI行业动态 , 国内大模型 , 国家主权财富基金 , 国运级AI企业 , 大模型开放策略 , 技术研发成本 , 服务认证收费 , 深度求索API , 深度求索发展方向 , 深度求索战略 , 深度求索融资 , 盈利压力 , 盈利型AI公司 , 研究型机构盈利 , 社保基金投资 , 科技企业独立性 , 科技企业转型 , 科技创新融资 , 科技研发方向 , 科研机构盈利模式 , 资本施压 , 阿里巴巴投资
VIDEO
大家好,欢迎收听老范讲故事YouTube频道。今天咱们来讲一讲DeepSeek的母公司——深度求索,是不是正在融资?消息是什么时候出来的?是2月19号传出来的。而且这个消息呢,并不是某人突然发了一条推特,或者发了一个其他的社交媒体,而是有一份报道。这个是The Information这样的一个媒体,做了独家的报道。据说有人参加谈判了,那么是参加这种融资谈判的人出来报的料。
据说参加谈判的有哪些家?第一个是阿里巴巴,然后呢是一些国有资金,包括中投公司、国家主权财富基金、国家社会保障基金,也就是社保基金。在The Information发了邮件去质询DeepSeek,阿里巴巴、中投公司没有回复质询,两位直接了解会谈的人回复了信息。
看到这里,咱们先看看这个到底是在说什么。一共是几家来谈判?DeepSeek自己可能要去参加谈判的,阿里巴巴要去参加谈判的,中投、国家主权财富基金、国家社会保障基金,这些都要去参加谈判呢。现在没有评论的是DeepSeek、阿里巴巴和中投,剩下有两位直接了解会谈信息的人士回复信息。这两个人应该是国家主权财富基金和国家社会保障基金的。那你说是一边一个,还是说这两个人都是属于其中某一个基金的呢?这个就没有办法去判断了。
More
2 月 18
Luke Fan AIGC , DeepSeek大模型 671B开源模型 , AI免费服务 , AI发展趋势 , AI商业模式创新 , AI垄断 , AI安全性 , AI对话模型 , AI幻觉问题 , AI广告收入 , AI开源 , AI推理模型 , AI未来发展 , AI模型对齐 , AI流量焦虑 , AI用户忠诚度 , AI盈利困局 , AI系统集成 , AI行业竞争 , AI语音功能 , AI黑箱子 , B端市场 , Claude 4发布时间 , Claude4 , C端市场 , DeepSeek , DeepSeek API , DeepSeek R1一体机 , DeepSeek安全性 , DeepSeek对OpenAI影响 , Gemini 2.0 , Google AI Studio , GPT-4.5 , GPT-5 , GPT-5功能 , Llama4 , OpenAI , OpenAI盈利 , OpenAI订阅 , ToB市场 , ToB部署 , ToC市场 , ToC用户体验 , 多模态生成 , 大模型 , 大模型商业模式 , 大模型统一接口 , 大模型计算成本 , 山姆·奥特曼 , 开放源代码 , 开源大模型 , 推广成本 , 推理成本 , 推理模型O系 , 文心一言4.0 , 文心一言4.5 , 文心一言Turbo , 文心一言免费 , 李彦宏 , 百度AI , 百度搜索广告 , 百度文心一言 , 谷歌AI策略 , 谷歌Gemini
VIDEO
大家好,欢迎收听老范讲故事的YouTube频道。今天咱们来讲一讲DeepSeek。这条鲶鱼搅浑了水,GPT5要来了,百度也要免费开源了,到底是一个什么样的情况?大模型这个赛道未来会怎么去发展?
DeepSeek呢,算是彻底改变了游戏规则。OpenAI给整个行业挖的坑,到现在呢,还有一些公司没查出来呢。什么坑?就是客户端这个订阅20美金一个月这个坑。这个其实是一个非常失败的商业模式。谷歌到现在还在往外爬,因为谷歌他其实自己不太想爬出来。为什么?因为他一旦爬出来以后的话,谷歌搜索的广告收入就没了,只能在那里头装聋作哑了。Perplexity到现在也还在思考,到底是不是要爬出来。
大家有没有想过一个问题?开源模型,因为DeepSeek是满血版671B的开源模型,它对于OpenAI的伤害,到底是ToB的伤害大,还是ToC的伤害大?这是一个大家值得去思考的事情。虽然现在DeepSeek在很多的C端有非常大的影响力,就是很多的个人去下载这个东西去用去,但其实真正的开源模型影响最大的是B端。我这是一个自己的公司,我是一个政府项目,或者是一个什么样的商业相关的事情,我要去使用大模型的时候,一定是会优先去选择这种完全可控的开源模型,而不是说我去用人家的闭源的,买人家API。因为你一旦是有开源模型的话,你就可以选择完全私有部署,我自己买台服务器往里装就完了。
More
Older Entries