2 月 20
Luke FanAIGC, Musk传奇 20万GPU, AI API, AI参数, AI商业化, AI大模型, AI安全性, AI对比, AI幻觉, AI开源, AI快速迭代, AI排行榜, AI架构, AI模型评测, AI模型选择, AI流量大战, AI测试策略, AI用户体验, AI直播发布, AI订阅, AI训练, AI语音识别, AI迭代, Deep Research功能, Deep Search功能, DeepSeek, DeepSeek R1, Deepseek V3, DeepSeek对比, DeepSeek开源, DeepSeek模型, DeepSeek训练, DeepSeek论文, Grok 2, Grok 3, Grok 3发布会, Grok 3对齐, Grok 3费用, Grok APP, OpenAI对比, Think与Deep Search对比, Think功能, XAI, XAI发展, XAI发布会, XAI合伙人, XAI商业方向, XAI测试, x平台, X平台订阅, 世界工厂, 人工智能, 合成数据, 大模型, 大模型幻觉, 幻觉问题, 推理功能, 数据清洗问题, 智能模型, 暴力迭代, 最聪明模型, 深度学习, 深度研究功能, 马斯克, 马斯克AI, 马斯克的大模型
马斯克的Grok 3到底是不是世界上最聪明的大模型?暴力真的能出奇迹吗?大家好,欢迎收听老范讲故事的YouTube频道。世界上最聪明的大模型,这是马斯克对他自己家的Grok 3给的定义。如果有人不同意的话,那么会被开除的。因为XAI某一位员工在X上发帖说,Grok 3好像并没有那么聪明,然后就被XAI找到说,你要么删帖要么开除。后来这哥们想了想说,我得捍卫一下自己的言论自由,于是这哥们就被开除了。
在说所有细节之前,咱们先说说Grok 3到底怎么用。在2月18号北京时间中午12点的时候,马斯克跟另外三位小伙伴,一共四个人坐着开了场直播,把这个Grok 3发布了。我就四处去找,首先我是X每个月交8美金的Premium用户,我在X上使不了。X上你必须是40美元的Premium+用户,才可以去使用。在Grok的这个网站上呢,你也需要30美元一个月的账号才可以用。免费用户只能用Grok 2,API不充钱已经不让用了。如果是团队的话,至少花了5美元以上,每个月他会赠送你150美金,但前提呢是要跟XAI共享你的数据。
目前Grok 3的版本还没有上,你就算交钱了,你在XAI的网站上,也只能得到Grok 2的API,还要再等几周才会上线。Grok的苹果APP上面,是可以使用Grok 3 Beta这个版本的,即使是免费用户也可以去用。因为我呢对于XAI来说是一个免费用户,我就通过iOS,也就是iPhone和iPad这个版本上去,好好儿的测试了一下。后边儿呢咱们再去讲具体效果怎么样。
More
2 月 16
Luke FanAIGC, DeepSeek大模型 671B参数, AI工具推荐, AI模型整合, AI辅助工具, AI辅助工具使用, Cherry Studio, Cherry Studio功能, Cherry Studio操作指南, Cloud AI, DeepSeek, DeepSeek API Key获取, DeepSeek R1, DeepSeek R1搭建, Deepseek V3, DeepSeek V3搭建, DeepSeek使用教程, DeepSeek大模型应用, DeepSeek实时搜索, DeepSeek应用广场, DeepSeek接入点创建, DeepSeek推理模型, DeepSeek替代方案, DeepSeek模型参数, DeepSeek模型广场, DeepSeek满血版, DeepSeek联网搜索, 云计算AI模型, 云计算大模型部署, 云计算平台, 云计算教程, 人工智能部署, 大模型使用, 如何配置DeepSeek, 字节跳动, 方舟平台, 本地部署DeepSeek, 深度求索, 满血版DeepSeek, 火山引擎, 火山引擎操作, 火山方舟, 火山方舟优势, 火山方舟模型设置, 火山方舟部署, 火山方舟配置, 联网搜索功能, 联网搜索设置
真正满血版的DeepSeek到底应该怎么用?在官网基本趴菜的情况下,我们是不是还可以使用到真正满血版的DeepSeek?有什么简单一点的方式可以让普通人用吗?这就是今天要讲的事情。
大家好,欢迎收听老范讲故事的YouTube频道。今天我们会先介绍一下什么是满血版DeepSeek,为什么要放弃本地部署,以及官网现状替代方案。今天的替代方案是火山方舟平台的替代方案。这个是字节跳动下面的,这个是目前为止相对来说比较均衡的一个方案。为什么?你比如像硅基流动,配置是相对来说比较简单的,但是实在是很慢。你使用的时候非常的不流畅,而且经常没有办法得到完整的答案。所以我现在基本上放弃了硅基流动这个平台,现在主要是使用方舟平台。方舟平台跟其他的像什么阿里云、腾讯云比起来,虽然都是云计算平台,但是配置起来相对还没有那么复杂。因为越是云计算平台的配置越麻烦。
讲完了这个方舟平台之后,我们要讲一下Cherry Studio啊。这个是目前普通人可以使用的比较简单的AI辅助工具。因为现在绝大部分的AI辅助工具都是网页。你让一个没有学过电脑的人去部署网页,去部署一个网站,还是挺麻烦的。有这个客户端,Cherry Studio就是Windows和Mac OS的一个客户端,下载下来就直接可以用。这个要相对来说简单很多。
More
2 月 11
Luke FanAIGC, DeepSeek大模型 2025美中脱钩法案, 360智能云, AI与股市, AI云服务, AI产业链, AI产业革命, AI公司估值, AI公司分析, AI发展趋势, AI国际化, AI大模型, AI开源技术, AI开源模型, AI技术划时代, AI技术合作, AI技术壁垒, AI投资趋势, AI推理芯片, AI核心技术, AI概念股, AI模型免费, AI模型统一, AI生态统一, AI股票涨停, AI行业投资, AI革命, ASIC芯片, DeepSeek, DeepSeek R1, Deepseek V3, DeepSeek与英伟达, DeepSeek国运创新, DeepSeek影响力, DeepSeek技术解析, DeepSeek股票影响, DeepSeek部署, GPU, Josh Holy, LLaMA, TPU, 东升西降, 中国AI, 中国AI崛起, 中国AI未来, 中国移动, 京东云, 人工智能禁令, 全球AI竞争, 全球AI部署, 六小虎, 华为盘古, 博通, 国运级创新, 国运级创新意义, 国际AI格局, 大模型微调, 字节豆包, 开源大模型, 概念股, 游戏科学, 火山引擎, 百度, 百度智能云, 硅基流动, 科技公司涨停, 美股蒸发, 腾讯, 腾讯浑元, 英伟达, 金山云, 阿里云, 阿里千问, 黑神话悟空
第二个故事:DeepSeek到底是不是国运级的创新呢?国运级创新这个事呢,是游戏科学的创始人兼CEO冯骥他去讲的。DeepSeek是一个国运级的创新。游戏科学,就是黑神话悟空的这个开发商。DeepSeek呢,也确实让美股市值蒸发了很多很多钱。而且还有一位美国的参议员说:“我们要下最严格的法令来禁止DeepSeek。谁敢下载DeepSeek判20年,哪个企业敢去用DeepSeek罚1亿美金。”
这个是个共和党参议员叫Josh Holy,写了一个法案,叫2025年美国人工智能能力与中国脱钩法案。禁止技术交流与使用,禁止美国公民、企业与中国开展任何AI技术合作,包括研发、投资、数据共享等。非美国公民若涉及技术转移,可以驱逐出境。然后切断资本与人才流动,禁止美国资本对中国AI企业投资,并限制美籍科研人员参与中国AI项目。任何与中国高效实验室合作的美国机构将面临重罚。违反本法案的个人将被视为严重犯罪分子,可能影响其移民身份、绿卡申请和入籍资格。美国公司不能直接或间接向中国企业提供AI技术支持或者服务。但是这个法案呢,因为太过极端已经被搁置了。
先讲一下使用DeepSeek的方式到底是什么样的。如果你在美国使用DeepSeek,那千万千万不要去DeepSeek网去挂,那是根本得不到服务的。最好是什么呢?就是去在美国的云主机上去使用。现在DeepSeek自己的网站基本上是半瘫痪状态,聊两句就趴菜。我基本上是第一句能聊,第二句能聊,第三句你再怎么跟他聊都趴。他是这样的一个状态。你可能明天再跟他聊,还可以聊两句。API调用的话非常非常慢。而且呢,现在禁止充值了。整个春节期间,API调用的这个页面就打不开了,把整个API后台给你封掉了。现在的话是后台重新有了,但是不允许充值。现在呢,国内是各种云上都有,国内的是阿里云、腾讯云、华为云。华为云的DeepSeek呢。
More
2 月 11
Luke FanAIGC, DeepSeek大模型 029筛选, 16张H100显卡, 32B模型, 50美金AI训练, 59, AI公司裁员, AI商业化, AI小公司机会, AI开发路径, AI成本控制, AI技术突破, AI推理模型, AI教母, AI模型蒸馏, AI测试标准, AI用户粘度, AI科学方法, AI筛选问题, AI行业未来, AI行业竞争, AI行业落地, AI领域定制, AI领域案例, ChatGPT O1, ChatGPT对比, DeepSeek R1, Gemini 2.0 Flash thinking, Gemini数据, S1K模型, Together平台, Together平台训练, 中国AI创新, 人工智能创新, 低成本AI, 可感知AI效果, 大模型与小模型, 大模型优化, 大模型应用, 小型模型训练, 小模型训练, 开源微调模型, 微调模型, 推理效率提升, 推理时间优化, 推理步数评估, 收敛性评估, 教育AI模型, 数据训练优化, 斯坦福大学, 普林斯顿大学, 李飞飞, 法律AI模型, 用户定制化AI, 电子工程博士, 硅基流动, 硅基流动平台, 置信度评估, 蒸馏模型方法, 蒸馏训练技术, 蒸馏问题技术, 财务AI模型, 通义千问, 问题筛选技术, 预算强制法, 高效AI解决方案, 高效AI训练
大家好!欢迎收听老范讲故事YouTube频道。今天咱们来讲一讲李飞飞的S1K模型。50美金成本超越DeepSeek R1和ChatGPT O1。
首先呢,DeepSeek到底是怎么震惊全球的?就是因为训练成本低。他的训练成本是OpenAI的3%,所以震惊了全球。
那么现在李飞飞的S1K模型,16张H100的显卡,跑了26分钟跑完了,拿到了一个32B的模型。多项测试超越了DeepSeek R1和GPTO1。
大家要注意,评测大模型呢,它有很多很多测试项。一般我们说基本上达到什么什么水平,就属于叫互有伯仲。有些你强点,有些他强点。原来大家都超不过GPT 4O,是因为只能接近它,距离它的全项指标都有差距。现在的话,大家就已经基本上可以达到GPT 4o的水平了。
More
2 月 04
Luke FanAIGC AI云计算, AI伦理问题, AI创新产品, AI市场定价, AI开源, AI未来社会, AI模型蒸馏, AI用户体验, AI研发进展, AI竞争, AI闭源, AMA活动, ChatGPT O3 mini, ChatGPT中文思维, ChatGPT成本, ChatGPT推理, ChatGPT高级语音, Dalle图像模型, DeepSeek R1, DeepSeek R1速度, DeepSeek中文版, DeepSeek全球部署, DeepSeek创新, DeepSeek定价策略, DeepSeek模型性能, GPT-5发展, GPT大模型, O3 mini价格, O3 mini使用限制, O3 mini免费功能, OpenAI, OpenAI与微软博弈, OpenAI估值, OpenAI微软冲突, OpenAI盈利模式, OpenAI融资, OpenAI软银融资, Reddit与OpenAI, 全球AI竞争, 大模型开源, 大模型思维过程, 大模型权重, 山姆奥特曼认错, 微软Azure, 微软GitHub Copilot, 微软与OpenAI合作, 微软独家转售权, 推理模型, 无用阶级, 精英社会, 英伟达HGX H200, 软银投资OpenAI
ChatGPT O3mini正式发布的时候,山姆奥特曼到底算不算是认错了呢?大家好,欢迎收听老范讲故事的YouTube频道。今天咱们来讲一讲O3mini的发布,以及奥特曼到底在说些什么。
过年的时候,基本上是被DeepSeek刷屏了。全世界各地跟AI相关的,或者不相关的人,都在尝试去理解和阐述DeepSeek到底干了点什么,到底对于他们有什么样的影响。风口浪尖上的这些闭源大模型公司,特别是OpenAI,肯定也是坐不住的,把它的王炸级产品ChatGPT O3 mini给炸出来了。发布了以后,马上还去做了一个访谈,回答了很多相关的问题。在其中,承认了说在开源领域里头好像站错队了。
那么先说一下O3 mini到底是一个什么样的情况。O3 mini的速度还是非常快的,跟O1 mini的速度相近。它的性能应该是接近原来的O1性能。大家看到很多很多的评测,这个分高点,那个分低一点,也有很多人在那扑克脸,念这些评测的结果。但其实这些评测到底哪一个是什么意思,差异在什么地方,绝大部分人很难理解。我也不在这费劲跟大家讲到底是什么情况了。我只能说O3 mini也好,O1也好,包括DeepSeek R1也好,这些模型它们的能力差异其实已经脱离了普通人的认知范围,总之都很强就可以了。
More
1 月 28
范, 路AIGC, DeepSeek大模型 AI Agent公司, AI Agent生态, AIGC领域, AI云计算, AI产业标准, AI协作方式, AI大模型, AI开源, AI开源项目, AI推理能力, AI数据偏见, AI显卡优化, AI显卡禁令, AI研发成本, AI蒸馏微调, AI闭源模型, AMD MI 300, AMD显卡兼容, Anthropic压力, Claude模型, DeepSeek, DeepSeek R1, Deepseek V3, DeepSeek代码, DeepSeek原创性, DeepSeek影响, DeepSeek成果, DeepSeek数据来源, DeepSeek美国市场, DeepSeek英文论文, Deepseek训练成本, DeepSeek论文, Huggingface, Kimi 1.5, Meta AI发展计划, Meta震惊, Minimax 01, OpenAI竞争, Oracle云计算, PyTorch开源工具, 中文社交媒体, 中美AI竞争, 中美科技博弈, 亚马逊AI, 人工智能创新, 华为AI标准, 大模型训练路径, 字节跳动AI, 开源模式, 开源胜利, 微软AI, 英伟达显卡, 谷歌AI, 谷歌AI研究, 豆包1.5, 通义千问, 闭源与开源
DeepSeek突然出圈,引发了中文圈的争吵。大家好,欢迎收听老范讲故事的YouTube频道。
DeepSeek在前面,我们已经出了一期视频,去讲它到底是怎么回事了。那么,DeepSeek最近肯定是更加的出圈。首先,DeepSeek V3,据说训练成本只有557万美金,震惊了扎克伯格,震惊了Meta。Meta说:“我们有好多的老大,他们的年薪都超过557万美金了。人家训练了个模型才用了557万美金,那我花了这么多钱去组建AI团队,花了这么多钱去囤显卡,是不是亏了?”现在就有这样的声音出来。
而且,最新的DeepSeek R1,也就是它的推理模型,推理能力已经接近o1了。蒸馏微调出来的这些小模型,已经在很多领域里头超越了o1 Mini。在这儿多补充一句,什么叫蒸馏微调的小模型?像我的电脑上,也是跑了一个DeepSeek R1-32B的模型。这个模型是怎么来的?它实际上是由DeepSeek R1去输出数据,然后拿输出的数据再去调通义千问2.5-32B的这个模型,最后得到的结果。这就是DeepSeek R1-32B,他在我的电脑上做各种推理,效果相当不错。
More