12 月 05
Luke FanAIGC, DeepSeek大模型 AI Agent, AI应用成本, AI模型评测, API降价, DeepSeek V3.2, DeepSeek V3.2 Special, DeepSeek V3.2技术解析, DeepSeek稀疏注意力, DSA算法, Gemini 3 Pro, GPT-5.1, SGLANG, VLLM, 国产大模型, 国产算力, 大模型发展趋势, 大语言模型, 开源AI模型, 推理效率优化, 数学推理模型, 深度求索, 稀疏注意力, 长上下文处理
Deepseek V3.2,12月1号发布了。是不是又遥遥领先了呢?
大家好,欢迎收听老范讲故事的YouTube频道。
Deepseek V3.2的发布应该是12月1日。我们始终没有等来心心念念的Deepseek R2。在今年春节的时候,深度求索突然发布了Deepseek R1,算是扔下了一颗深水炸弹,把整个AI圈都震动了,甚至还造成了英伟达股价的闪崩——一段时间内闪崩吧。甚至老黄都跑出来喊,说:“Deepseek发布对我是利好,你们不要卖英伟达的股票。”大家就一直等着这个R1,既然这么厉害,咱们上R2。但是等了这么久,都没有等来R2。
Deepseek V系列版本回顾
下面呢,我们来捋一下Deepseek V系列的版本到底是怎么样的一个发布过程。
- Deepseek V3 (去年12月26日发布): 这是非常非常重要的一个版本。实际上我们后面看到的所有版本,包括R1,都是在Deepseek V3的基础上进行微调、进行蒸馏、进行强化学习。今天发布的Deepseek V3.2,也依然是在这个版本的基础上做出来的。
- Deepseek V3-0324 (3月24日发布): 主要是在专项能力上做了一些增强,比如说编代码或者写文章。
- Deepseek V3.1 (8月21日发布): 主要是工程化和智能体方面做了增强。因为当时大家都要去做AI agent,而之前的版本在AI agent这一块都比较弱。
- Deepseek V3.1 Terminals (9月22日发布): 这个版本叫V3.1的终极版,实际上是对V3.1做了一些修复和精调,并告知这是V3.1的最终版本。
- V3.2 EXP (9月29日发布): 一个实验版本,在V3.1终极版的基础上加入了DSA技术。最主要的变化是降价,直接把API调用的价格砍了一半。
- Deepseek OCR (10月20日发布): 一个很小的模型(约6G),用于图片解释,效果很好。
- maths VR (11月27日发布): 专门做数学推理和数学证明的一个版本,在各种数学题测试中评分非常高。
- Deepseek V3.2 正式版 & V3.2 special 特别版 (12月1号发布): 本次发布的主角。
More
8 月 18
Luke FanAIGC, 华为很厉害, 英伟达,NVIDIA,黄教主,GPU AI Agent, AI芯片, AI训练, AMD, Anthropic, B100, Claude 4, CUDA, DeepSeek, Deepseek R2, Function Call, Gemini, Google, GPT-5, Grok 4, H100, H20, H800, Kimi, Llama 4, Meta, NVIDIA, OpenAI, TPU, XAI, 中美科技战, 人工智能, 传闻, 千问, 升腾910C, 华为, 华为升腾, 国产替代, 国产芯片, 大模型, 大模型训练, 字节跳动, 开源, 技术瓶颈, 推理, 散热问题, 浸没式液冷, 液冷, 深度求索, 百度, 算力, 腾讯, 芯片战争, 英伟达, 辟谣, 金融时报报道, 难产
8月14号,英国金融时报发了一篇报道,说Deepseek R2模型之所以难产,是因为在使用华为升腾芯片训练的时候,持续遇到了技术问题,最后被迫改用了英伟达芯片。甚至透露华为曾经派出一支救火队,常驻在Deepseek,手把手帮忙调教升腾服务器,但仍然无法完成训练。无奈之下,Deepseek只能退回老路训练,重新切换回性能更加可靠的Nvidia的GPU,升腾芯片仅退居辅助,用于模型推理环节。
虽然没有华为和Deepseek官方的回应,也没有他们的辟谣,但是呢,据说是援引了三位知情人士的一些说法,也进行了很多交叉验证,所以这个事情呢,大概率是真的。
国运跟国运相碰撞的时候,升腾也号称是国运级产品,Deepseek肯定是国运级产品,为什么是升腾不灵呢?升腾芯片是可以替代的,也还有一堆竞争对手,所以出现问题以后,他的竞争对手会帮他去宣传。而Deepseek虽然在国内也有模型在追赶,但是地位是不一样的。升腾和国内的其他算力芯片,以及其他那些大模型,从来没有像Deepseek那样震动过世界。所以呢发生碰撞的时候,必须是升腾不行了,不可能是Deepseek不行了。
More
2 月 18
Luke Fan互联网商业故事 3D设计, AIGC, AI与房地产, AI公司上市, AI大模型, AI机器人, AI行业数据隐私, AI行业转型, AI隐私问题, AR家居设计, AR空间认知, SaaS平台, SaaS软件盈利模式, 上市公司亏损, 上市申请, 云服务, 云设计软件, 人工智能家装, 国产家装软件, 国产科技公司, 在线家装SaaS, 在线渲染平台, 大模型数据训练, 家居AI设计, 家居AR工具, 家居渲染, 家居设计市场, 家居设计软件, 家庭3D设计, 家庭智能化, 家装产业趋势, 家装大数据, 家装科技发展, 家装科技应用, 家装行业, 家装行业低迷, 家装行业数字化, 家装设计SaaS, 巨深智能, 巨深智能数据, 房地产低迷, 房地产未来, 房屋装修趋势, 数据卖点, 智能家居设计, 未来科技趋势, 机器学习家居, 杭州AI公司, 杭州上市公司, 杭州六小龙, 杭州六小龙上市, 杭州初创公司, 杭州科技公司, 杭州科技圈, 杭州经济, 杭州群核上市, 深度学习家居, 深度求索, 渲染技术, 游戏科学, 科技与家居, 科技创业公司, 科技资本运作, 空间智能, 群核科技, 群核科技上市, 群核融资, 英伟达显卡, 装修公司SaaS, 装修数据, 装修设计工具, 酷家乐, 酷家乐平台盈利, 隐私数据问题, 高科技领域, 黑神话悟空
杭州六小龙里边,已经有人要去上市了。大家好,欢迎收听老范讲故事的YouTube频道。咱们今天来讲一讲,最近正热的杭州六小龙里边,已经有一家公司要上市了。这个公司呢,叫做杭州群核科技。现在呢,他已经正式向香港提交了上市申请。
上市这个东西,首先你要去申请,申请通过了以后才能够上市。申请提交了,最后能不能上去还不好说。那你说还没能上的,你怎么就上来说了呢?大家注意,提交申请后边这个过程是很贵的,所以,没有特别大把握的人,也不会随随便便去提交申请。通常提交申请离上市就已经很近了。
那么这个杭州群核科技呢,是杭州六小龙中的一个。咱们现在所说的杭州六小龙,第一个是深度求索,也就是做Deepseak这个公司。第二个是游戏科学,做黑神话悟空的这个公司。然后宇数科技,在春晚上转手绢机器人的那个。然后强脑科技,这个呢,是智能仿生手,点燃了杭州亚残运会圣火,在脑机接口领域与Nerolink并肩,在国际医学和科技领域引起关注。第五个呢,叫云深处科技,他们做什么呢?觉影系列机器人,在复杂地形作业展示出强大性能,在国际上有一定的知名度。第五个也是一个做机器人的。第六个,就是今天我们要讲这个,叫群核科技。
More
2 月 16
Luke FanAIGC, DeepSeek大模型 671B参数, AI工具推荐, AI模型整合, AI辅助工具, AI辅助工具使用, Cherry Studio, Cherry Studio功能, Cherry Studio操作指南, Cloud AI, DeepSeek, DeepSeek API Key获取, DeepSeek R1, DeepSeek R1搭建, Deepseek V3, DeepSeek V3搭建, DeepSeek使用教程, DeepSeek大模型应用, DeepSeek实时搜索, DeepSeek应用广场, DeepSeek接入点创建, DeepSeek推理模型, DeepSeek替代方案, DeepSeek模型参数, DeepSeek模型广场, DeepSeek满血版, DeepSeek联网搜索, 云计算AI模型, 云计算大模型部署, 云计算平台, 云计算教程, 人工智能部署, 大模型使用, 如何配置DeepSeek, 字节跳动, 方舟平台, 本地部署DeepSeek, 深度求索, 满血版DeepSeek, 火山引擎, 火山引擎操作, 火山方舟, 火山方舟优势, 火山方舟模型设置, 火山方舟部署, 火山方舟配置, 联网搜索功能, 联网搜索设置
真正满血版的DeepSeek到底应该怎么用?在官网基本趴菜的情况下,我们是不是还可以使用到真正满血版的DeepSeek?有什么简单一点的方式可以让普通人用吗?这就是今天要讲的事情。
大家好,欢迎收听老范讲故事的YouTube频道。今天我们会先介绍一下什么是满血版DeepSeek,为什么要放弃本地部署,以及官网现状替代方案。今天的替代方案是火山方舟平台的替代方案。这个是字节跳动下面的,这个是目前为止相对来说比较均衡的一个方案。为什么?你比如像硅基流动,配置是相对来说比较简单的,但是实在是很慢。你使用的时候非常的不流畅,而且经常没有办法得到完整的答案。所以我现在基本上放弃了硅基流动这个平台,现在主要是使用方舟平台。方舟平台跟其他的像什么阿里云、腾讯云比起来,虽然都是云计算平台,但是配置起来相对还没有那么复杂。因为越是云计算平台的配置越麻烦。
讲完了这个方舟平台之后,我们要讲一下Cherry Studio啊。这个是目前普通人可以使用的比较简单的AI辅助工具。因为现在绝大部分的AI辅助工具都是网页。你让一个没有学过电脑的人去部署网页,去部署一个网站,还是挺麻烦的。有这个客户端,Cherry Studio就是Windows和Mac OS的一个客户端,下载下来就直接可以用。这个要相对来说简单很多。
More
1 月 07
Luke FanAIGC, 中国故事 A100显卡, AIGC, AI人才招聘, AI人才流动, AI价格战, AI价格敏感, AI企业挖人, AI六角龙, AI创业决策, AI创业团队, AI创业投资策略, AI创新比较, AI商业模式, AI基础研究, AI工具, AI工程师, AI市场竞争, AI开源, AI开源社区, AI开源竞争, AI技术趋势, AI拼多多, AI模型架构, AI生态发展, AI研究团队, AI算力资源, AI算法突破, AI行业内卷, AI行业案例, AI行业现状, AI资源调动, AI领域创新比较, ChatGPT, DeepSeek, Deepseek V2, Minimax, 个人开发者, 中国AI六小龙, 中国AI基础保障, 中国AI技术力量, 中国AI教育压力, 中国AI未来, 中国人工智能, 中小盘股, 五斗米奔波, 创新投资风险, 创新模式, 团队管理模式, 大厂AI整合, 大模型研发, 幻方量化, 快速迭代, 技术研发, 月之案面, 未来AI趋势, 李开复, 梁文峰, 模型创新, 模型开源, 浙大算法天才, 深度求索, 清华北大, 百川智能, 百度文心一言, 盛大创新院, 罗福莉, 自下而上创新, 融资机制, 豆包AI, 质谱AI, 通义千问, 量化交易, 量化基金, 隐士大侠, 零一万物, 黄埔军校, 黑客文化
深度求索的创新模式可以复制吗?既然他能做出来,而且也让美国人愿意接受我们的这种智慧,这个事是不是可以再来一次?这个事能复制吗?
首先呢,咱们要从幻方量化开始讲起。幻方量化呢,我其实跟他还稍微打过一点点交道。我自己个人的经历是,2009年到2012年之间,就职于盛大创新院。后来大概到11年、12年这两年呢,就开始分拆,分了很多的这个子院。其中有一个院呢叫多媒体院,多媒体院的院长呢叫陆坚。他呢是浙大的本科,后来到美国去读的博士,然后去了苹果公司。就是如果你现在用Final Cut,用QuickTime,这些东西就是他写的。后来呢,他在我们那里当了两年的院长,离开盛大创新院以后呢,是LinkedIn中国的总经理,现在应该已经进入半退休状态了。
他呢是浙大的,浙大呢其实在杭州,培养了大量的图形图像相关的这种人才。当时呢,做媒体院的时候,陆坚就带进了一大批浙大的学生,做各种的图形图像处理的事情。在15年还是16年的时候,有一次跑去杭州,找很多原来盛大的老同事去吃饭,因为好多人去阿里了嘛。吃饭的时候呢,就有一位老同事约了我,说你来了我也吃个饭呗。这位老同事呢就跟我讲,说咱们做个量化交易,说我们现在干这个事。但当时他们这种量化交易呢,还是私下里边做,自己有一些钱在做一些,挣一些小钱,并没有公开对外去募资。
More
1 月 06
Luke FanAIGC, 雷军、小米, 雷军与小米 ACL大会, AI人才, AI人才评估, AI公司招聘, AI大模型, AI天才少女, AI实验室, AI小模型, AI工程团队, AI工程师, AI应用, AI技术, AI技术圈, AI新闻, AI模型, AI炒作, AI炒作价值, AI热点, AI研究, AI科技企业, AI科研, AI竞争, AI自然语言处理, AI萝莉, AI语音技术, AI趋势, AMR解析, DeepSeek, Deepseek V3, Model训练, NLP, 万卡集群, 北京大学, 北大, 北师大, 千万年薪, 国际计算语言学年会, 学术圈, 学术履历, 小米, 小米AI, 小米AI实验室, 小米AI生态, 小米AI计划, 小米万卡集群, 小米发展, 小米市值, 小米战略, 小米手机, 小米新动向, 小米模式, 小米科技, 小米股价, 小米股市, 小米高端手机, 小米高薪, 工程技术人才, 工程技术能力, 市值管理, 幻方量化, 技术IP, 技术储备, 技术创新, 有向无环图, 深度学习, 深度求索, 清北校友, 清北班, 清北精英, 清华, 热点事件, 科技人才争夺, 科技圈, 科技大牛, 科研能力, 端测模型, 米粉, 罗福莉, 自然语言处理, 计算语言学, 论文发表, 语言学, 语言学研究, 超级小爱, 达摩院, 雷军, 雷军AI战略, 雷军亲自招人
雷军千万年薪挖回来的AI萝莉,到底值不值呢?大家好,欢迎收听老范讲故事的YouTube频道。今天咱们来讲一讲,雷军花了千万年薪挖回来的天才少女,到底价值几何的故事。
首先,这个消息并不是小米官方放出来的,而是证券时报等一大堆媒体报道出来的。报道出了这样的一个故事之后,肯定就会被舆论热炒。第一个,AI现在肯定是全村最靓的仔,跟AI相关的事情更容易被媒体所报道。第二个,小米跟雷军本身就是顶流,任何事情只要沾着小米,沾着雷军了,都会被过度的炒作。
现在这位AI天才少女叫罗福莉,号称是雷军亲自下场捞的人。这个事情到底有多亲自呢?不好说。很多记者也去找小米核实,问有没有这么个事情,是不是有千万年薪,雷军到底是怎么谈的这个事情呢?目前为止,小米没有给出官方确认。但是,如果千万年薪是真的,那这个事雷军必须是要签字确认的。如果不签字的话,这样高的薪水是开不出来的。
More