DeepSeek开创的风俗,春节中国模型大爆发?

中国春节的热闹街景,舞狮队伍中的狮子由精密的电路板和发光芯片组成,象征科技与传统的融合,羊皮纸,钢笔彩色手绘的统一风格。

春节临近,中国各大模型厂商都憋着劲要刷屏,要上大分。

大家好,欢迎收听老范讲故事的YouTube频道。还记得去年春节吗?Deepseek给大家留下了极其深刻的印象,干崩了英伟达的股价,这个真的是非常非常不容易的。而且Deepseek发布之后,整个大模型的竞争就进入了下一个阶段。在Deepseek发布之前,大家还在看着OpenAI在这里优雅的表演各种的杂技;Deepseek发布以后,那大家就直接疯掉了。可以说是一石激起千层浪,所有人都在快速的迭代,快速的去推进各种各样的新模型。去年Deepseek R1的发布,不是说给了大家一个多么强的模型,而是把英伟达和OpenAI彻底拉下了神坛。

今天的故事分几块来讲:

  • 第一个,Kimi 2.5的爆火;
  • 第二个,字节跳动准备了大餐;
  • 第三个,阿里千问3.5已经箭在弦上了;
  • 再往后,Pony阿尔法到底是谁家的还不知道,但是智谱的股票已经涨疯了;
  • 然后,Deepseek江湖上永远的传说;
  • 海外模型厂商也都没闲着,他们也在努力准备应接我们的突袭。
一个深海潜水员手持发光的探照灯,照亮了海底巨大的沉船,沉船上散落着英伟达显卡和OpenAI的标志,羊皮纸,钢笔彩色手绘的统一风格。

阅读更多

Deepseek V3.2高分真相:我们被“遥遥领先”忽悠了?Special版跑分超GPT-5,但API成本砍半才是真杀招|DeepSeek-V3.2、DSA

Deepseek V3.2,12月1号发布了。是不是又遥遥领先了呢?

大家好,欢迎收听老范讲故事的YouTube频道

Deepseek V3.2的发布应该是12月1日。我们始终没有等来心心念念的Deepseek R2。在今年春节的时候,深度求索突然发布了Deepseek R1,算是扔下了一颗深水炸弹,把整个AI圈都震动了,甚至还造成了英伟达股价的闪崩——一段时间内闪崩吧。甚至老黄都跑出来喊,说:“Deepseek发布对我是利好,你们不要卖英伟达的股票。”大家就一直等着这个R1,既然这么厉害,咱们上R2。但是等了这么久,都没有等来R2。

Deepseek V系列版本回顾

下面呢,我们来捋一下Deepseek V系列的版本到底是怎么样的一个发布过程。

  • Deepseek V3 (去年12月26日发布): 这是非常非常重要的一个版本。实际上我们后面看到的所有版本,包括R1,都是在Deepseek V3的基础上进行微调、进行蒸馏、进行强化学习。今天发布的Deepseek V3.2,也依然是在这个版本的基础上做出来的。
  • Deepseek V3-0324 (3月24日发布): 主要是在专项能力上做了一些增强,比如说编代码或者写文章。
  • Deepseek V3.1 (8月21日发布): 主要是工程化和智能体方面做了增强。因为当时大家都要去做AI agent,而之前的版本在AI agent这一块都比较弱。
  • Deepseek V3.1 Terminals (9月22日发布): 这个版本叫V3.1的终极版,实际上是对V3.1做了一些修复和精调,并告知这是V3.1的最终版本。
  • V3.2 EXP (9月29日发布): 一个实验版本,在V3.1终极版的基础上加入了DSA技术。最主要的变化是降价,直接把API调用的价格砍了一半。
  • Deepseek OCR (10月20日发布): 一个很小的模型(约6G),用于图片解释,效果很好。
  • maths VR (11月27日发布): 专门做数学推理和数学证明的一个版本,在各种数学题测试中评分非常高。
  • Deepseek V3.2 正式版 & V3.2 special 特别版 (12月1号发布): 本次发布的主角。

阅读更多