2 月 16
Luke FanAIGC, DeepSeek大模型 671B参数, AI工具推荐, AI模型整合, AI辅助工具, AI辅助工具使用, Cherry Studio, Cherry Studio功能, Cherry Studio操作指南, Cloud AI, DeepSeek, DeepSeek API Key获取, DeepSeek R1, DeepSeek R1搭建, Deepseek V3, DeepSeek V3搭建, DeepSeek使用教程, DeepSeek大模型应用, DeepSeek实时搜索, DeepSeek应用广场, DeepSeek接入点创建, DeepSeek推理模型, DeepSeek替代方案, DeepSeek模型参数, DeepSeek模型广场, DeepSeek满血版, DeepSeek联网搜索, 云计算AI模型, 云计算大模型部署, 云计算平台, 云计算教程, 人工智能部署, 大模型使用, 如何配置DeepSeek, 字节跳动, 方舟平台, 本地部署DeepSeek, 深度求索, 满血版DeepSeek, 火山引擎, 火山引擎操作, 火山方舟, 火山方舟优势, 火山方舟模型设置, 火山方舟部署, 火山方舟配置, 联网搜索功能, 联网搜索设置
真正满血版的DeepSeek到底应该怎么用?在官网基本趴菜的情况下,我们是不是还可以使用到真正满血版的DeepSeek?有什么简单一点的方式可以让普通人用吗?这就是今天要讲的事情。
大家好,欢迎收听老范讲故事的YouTube频道。今天我们会先介绍一下什么是满血版DeepSeek,为什么要放弃本地部署,以及官网现状替代方案。今天的替代方案是火山方舟平台的替代方案。这个是字节跳动下面的,这个是目前为止相对来说比较均衡的一个方案。为什么?你比如像硅基流动,配置是相对来说比较简单的,但是实在是很慢。你使用的时候非常的不流畅,而且经常没有办法得到完整的答案。所以我现在基本上放弃了硅基流动这个平台,现在主要是使用方舟平台。方舟平台跟其他的像什么阿里云、腾讯云比起来,虽然都是云计算平台,但是配置起来相对还没有那么复杂。因为越是云计算平台的配置越麻烦。
讲完了这个方舟平台之后,我们要讲一下Cherry Studio啊。这个是目前普通人可以使用的比较简单的AI辅助工具。因为现在绝大部分的AI辅助工具都是网页。你让一个没有学过电脑的人去部署网页,去部署一个网站,还是挺麻烦的。有这个客户端,Cherry Studio就是Windows和Mac OS的一个客户端,下载下来就直接可以用。这个要相对来说简单很多。
More
2 月 11
Luke FanAIGC, DeepSeek大模型 2025美中脱钩法案, 360智能云, AI与股市, AI云服务, AI产业链, AI产业革命, AI公司估值, AI公司分析, AI发展趋势, AI国际化, AI大模型, AI开源技术, AI开源模型, AI技术划时代, AI技术合作, AI技术壁垒, AI投资趋势, AI推理芯片, AI核心技术, AI概念股, AI模型免费, AI模型统一, AI生态统一, AI股票涨停, AI行业投资, AI革命, ASIC芯片, DeepSeek, DeepSeek R1, Deepseek V3, DeepSeek与英伟达, DeepSeek国运创新, DeepSeek影响力, DeepSeek技术解析, DeepSeek股票影响, DeepSeek部署, GPU, Josh Holy, LLaMA, TPU, 东升西降, 中国AI, 中国AI崛起, 中国AI未来, 中国移动, 京东云, 人工智能禁令, 全球AI竞争, 全球AI部署, 六小虎, 华为盘古, 博通, 国运级创新, 国运级创新意义, 国际AI格局, 大模型微调, 字节豆包, 开源大模型, 概念股, 游戏科学, 火山引擎, 百度, 百度智能云, 硅基流动, 科技公司涨停, 美股蒸发, 腾讯, 腾讯浑元, 英伟达, 金山云, 阿里云, 阿里千问, 黑神话悟空
第二个故事:DeepSeek到底是不是国运级的创新呢?国运级创新这个事呢,是游戏科学的创始人兼CEO冯骥他去讲的。DeepSeek是一个国运级的创新。游戏科学,就是黑神话悟空的这个开发商。DeepSeek呢,也确实让美股市值蒸发了很多很多钱。而且还有一位美国的参议员说:“我们要下最严格的法令来禁止DeepSeek。谁敢下载DeepSeek判20年,哪个企业敢去用DeepSeek罚1亿美金。”
这个是个共和党参议员叫Josh Holy,写了一个法案,叫2025年美国人工智能能力与中国脱钩法案。禁止技术交流与使用,禁止美国公民、企业与中国开展任何AI技术合作,包括研发、投资、数据共享等。非美国公民若涉及技术转移,可以驱逐出境。然后切断资本与人才流动,禁止美国资本对中国AI企业投资,并限制美籍科研人员参与中国AI项目。任何与中国高效实验室合作的美国机构将面临重罚。违反本法案的个人将被视为严重犯罪分子,可能影响其移民身份、绿卡申请和入籍资格。美国公司不能直接或间接向中国企业提供AI技术支持或者服务。但是这个法案呢,因为太过极端已经被搁置了。
先讲一下使用DeepSeek的方式到底是什么样的。如果你在美国使用DeepSeek,那千万千万不要去DeepSeek网去挂,那是根本得不到服务的。最好是什么呢?就是去在美国的云主机上去使用。现在DeepSeek自己的网站基本上是半瘫痪状态,聊两句就趴菜。我基本上是第一句能聊,第二句能聊,第三句你再怎么跟他聊都趴。他是这样的一个状态。你可能明天再跟他聊,还可以聊两句。API调用的话非常非常慢。而且呢,现在禁止充值了。整个春节期间,API调用的这个页面就打不开了,把整个API后台给你封掉了。现在的话是后台重新有了,但是不允许充值。现在呢,国内是各种云上都有,国内的是阿里云、腾讯云、华为云。华为云的DeepSeek呢。
More
2 月 11
Luke FanAIGC, DeepSeek大模型 029筛选, 16张H100显卡, 32B模型, 50美金AI训练, 59, AI公司裁员, AI商业化, AI小公司机会, AI开发路径, AI成本控制, AI技术突破, AI推理模型, AI教母, AI模型蒸馏, AI测试标准, AI用户粘度, AI科学方法, AI筛选问题, AI行业未来, AI行业竞争, AI行业落地, AI领域定制, AI领域案例, ChatGPT O1, ChatGPT对比, DeepSeek R1, Gemini 2.0 Flash thinking, Gemini数据, S1K模型, Together平台, Together平台训练, 中国AI创新, 人工智能创新, 低成本AI, 可感知AI效果, 大模型与小模型, 大模型优化, 大模型应用, 小型模型训练, 小模型训练, 开源微调模型, 微调模型, 推理效率提升, 推理时间优化, 推理步数评估, 收敛性评估, 教育AI模型, 数据训练优化, 斯坦福大学, 普林斯顿大学, 李飞飞, 法律AI模型, 用户定制化AI, 电子工程博士, 硅基流动, 硅基流动平台, 置信度评估, 蒸馏模型方法, 蒸馏训练技术, 蒸馏问题技术, 财务AI模型, 通义千问, 问题筛选技术, 预算强制法, 高效AI解决方案, 高效AI训练
大家好!欢迎收听老范讲故事YouTube频道。今天咱们来讲一讲李飞飞的S1K模型。50美金成本超越DeepSeek R1和ChatGPT O1。
首先呢,DeepSeek到底是怎么震惊全球的?就是因为训练成本低。他的训练成本是OpenAI的3%,所以震惊了全球。
那么现在李飞飞的S1K模型,16张H100的显卡,跑了26分钟跑完了,拿到了一个32B的模型。多项测试超越了DeepSeek R1和GPTO1。
大家要注意,评测大模型呢,它有很多很多测试项。一般我们说基本上达到什么什么水平,就属于叫互有伯仲。有些你强点,有些他强点。原来大家都超不过GPT 4O,是因为只能接近它,距离它的全项指标都有差距。现在的话,大家就已经基本上可以达到GPT 4o的水平了。
More
2 月 10
Luke FanAIGC, DeepSeek大模型 AI大模型生成内容, AI提示词工程, DeepSeek R1模型, DeepSeek与ChatGPT对比, DeepSeek与头孢, DeepSeek与本地模型, DeepSeek与豆包, DeepSeek伪满血版, DeepSeek使用建议, DeepSeek免费书骗局, DeepSeek公众号陷阱, DeepSeek国内模型对比, DeepSeek培训骗局, DeepSeek平替工具, DeepSeek怎么用, DeepSeek推理效果, DeepSeek推理模型, DeepSeek提示词技巧, DeepSeek插件推荐, DeepSeek插件骗局, DeepSeek搜索功能, DeepSeek是什么, DeepSeek智商税, DeepSeek服务器卡顿, DeepSeek本地部署, DeepSeek标题党, DeepSeek正式版, DeepSeek点击陷阱, DeepSeek生成内容, DeepSeek的核心功能, DeepSeek真实效果, DeepSeek算力问题, DeepSeek课程分析, DeepSeek防骗指南, DeepSeek韭菜素养, DeepSeek骗局, 如何应对AI骗局, 清华DeepSeek书骗局
清华大学《DeepSeek深入浅出》.PDF
满血DeepSeek的硅基流动邀请链接
普通人面对铺天盖地的DeepSeek信息,应该如何防骗呢?
大家好,欢迎收听老范讲故事的YouTube频道。今天咱们来讲一讲韭菜的基本素养。现在DeepSeek相关的信息铺天盖地,很多普通人都说:“哎呀,我也要去试一下,这东西到底能对我的生活带来什么样的改变呢?”大部分的网上流传的DeepSeek信息,其实都是有欺骗性的。他们呢,主要是卖课的——付费课程。当然,还有一些是骗点击、骗插件、骗用户、骗关注。
这个有什么区别?比如说,我一个标题叫“DeepSeek说了什么什么什么东西”,这个呢叫骗点击。如果他不写DeepSeek说了什么,你会点进去吗?你不会点进去。对于他来说,就已经挣到钱了。骗人买插件是什么呢?你比如说,有些人讲了说:“office怎么样,WPS怎么样,去用DeepSeek了。”这些呢都实际上是卖插件的,因为官方不支持,要求你自己去安装一个特殊的第三方插件,你才可以使用DeepSeek。
More
2 月 03
Luke FanAIGC, DeepSeek大模型 DeepSeekGP风险, DeepSeek企业架构揭秘, DeepSeek企业治理, DeepSeek企业责任, DeepSeek利润分配, DeepSeek利益分配, DeepSeek合伙协议, DeepSeek基金架构, DeepSeek实控人, DeepSeek投资指南, DeepSeek投资避坑, DeepSeek有限合伙人, DeepSeek有限责任公司, DeepSeek真假一盘大棋, DeepSeek税收机制, DeepSeek股东结构, DeepSeek股权架构, DeepSeek股权穿透计算, DeepSeek背责机制, DeepSeek背责风险, DeepSeek自然人股东, DeepSeek责任分配, DeepSeek资金流, GP与LP区别, 幻方量化DeepSeek, 幻方量化GP布局, 幻方量化GP机制, 幻方量化GP风险, 幻方量化投资深度, 幻方量化控制权, 幻方量化深度求索关系, 有限合伙企业税收, 有限合伙企业解读, 有限责任公司股东, 有限责任公司解析, 杭州深度求索结构, 杭州深度求索股权, 梁文峰DeepSeek, 深度求索资金分配, 股东权益分配, 股权结构冰山一角, 股权结构分析, 股权设计阴谋, 股权责任归属
DeepSeek的股权结构真的是一盘大棋吗?大家好,欢迎收听老范讲故事的YouTube频道。DeepSeek最近实在是火出圈来了,大家都在很努力地去解读DeepSeek各种各样的问题,特别是很多金融圈的人也冲进来了。为什么?让股市动荡了吗?但是这些金融圈的人呢,又说不太清楚这个大模型到底是怎么回事。但是股权结构他们是能解释得清楚的,这里面就有各种各样的阴谋论了。
一切呢都是从这张图开始的。首先要尊重一下知识产权,这个是由杰克船长宏观策略提供的。这个朋友呢,应该是雪球上面的一位自媒体博主吧,解读各种各样的宏观策略的。更多的人是在这个上面进行解读。但是我要讲的是什么?就这张图呢,应该仅仅是冰山一角。为什么呢?因为后边是幻方量化,一个做量化的公司,它上面的实体数可能几百个是正常的。千万不要觉得DeepSeek只有这么简单的一个图像,甚至有很多可能平时对于公司结构不是那么熟悉的朋友,一看到说,哇这么多方块,这么多颜色花花绿绿的,这个结构好复杂,这是一盘大棋,设计得好厉害,真的不是这样的。
More
1 月 28
范, 路AIGC, DeepSeek大模型 AI Agent公司, AI Agent生态, AIGC领域, AI云计算, AI产业标准, AI协作方式, AI大模型, AI开源, AI开源项目, AI推理能力, AI数据偏见, AI显卡优化, AI显卡禁令, AI研发成本, AI蒸馏微调, AI闭源模型, AMD MI 300, AMD显卡兼容, Anthropic压力, Claude模型, DeepSeek, DeepSeek R1, Deepseek V3, DeepSeek代码, DeepSeek原创性, DeepSeek影响, DeepSeek成果, DeepSeek数据来源, DeepSeek美国市场, DeepSeek英文论文, Deepseek训练成本, DeepSeek论文, Huggingface, Kimi 1.5, Meta AI发展计划, Meta震惊, Minimax 01, OpenAI竞争, Oracle云计算, PyTorch开源工具, 中文社交媒体, 中美AI竞争, 中美科技博弈, 亚马逊AI, 人工智能创新, 华为AI标准, 大模型训练路径, 字节跳动AI, 开源模式, 开源胜利, 微软AI, 英伟达显卡, 谷歌AI, 谷歌AI研究, 豆包1.5, 通义千问, 闭源与开源
DeepSeek突然出圈,引发了中文圈的争吵。大家好,欢迎收听老范讲故事的YouTube频道。
DeepSeek在前面,我们已经出了一期视频,去讲它到底是怎么回事了。那么,DeepSeek最近肯定是更加的出圈。首先,DeepSeek V3,据说训练成本只有557万美金,震惊了扎克伯格,震惊了Meta。Meta说:“我们有好多的老大,他们的年薪都超过557万美金了。人家训练了个模型才用了557万美金,那我花了这么多钱去组建AI团队,花了这么多钱去囤显卡,是不是亏了?”现在就有这样的声音出来。
而且,最新的DeepSeek R1,也就是它的推理模型,推理能力已经接近o1了。蒸馏微调出来的这些小模型,已经在很多领域里头超越了o1 Mini。在这儿多补充一句,什么叫蒸馏微调的小模型?像我的电脑上,也是跑了一个DeepSeek R1-32B的模型。这个模型是怎么来的?它实际上是由DeepSeek R1去输出数据,然后拿输出的数据再去调通义千问2.5-32B的这个模型,最后得到的结果。这就是DeepSeek R1-32B,他在我的电脑上做各种推理,效果相当不错。
More
Newer Entries