从557万美金训练成本到545%利润,DeepSeek如何用惊悚的数字,震撼AI行业的?这些数字,靠谱吗?

从557万美金训练成本到545%利润,DeepSeek如何用惊悚的数字,震撼AI行业的?这些数字,靠谱吗?已关闭评论

DeepSeek也玩“one more thing”,突然公布了它的推理利润达到545%,就像当初557.6万美金的训练成本那样,再次震惊了行业。大家好,欢迎收听老范讲故事的YouTube频道。今天咱们来讲一讲,DeepSeek结束了连续5天的开园周之后,到礼拜六玩了一次“one more thing”。这个“one more thing”呢,应该是当年乔布斯的梗。他每一次开发布会到最后的时候呢,都要说“还有一件事,等一等”,而且这一件事呢,往往是特别重要、特别颠覆性的事情。那么这一次又来了,DeepSeek公布了它的V1和R3推理系统相关内容,及大规模部署的成本和收益数据。就是说我部署了这东西以后,到底是挣了多少钱?非常非常让人震惊,因为所有人做这个东西都说我不挣钱,我亏钱,结果等到他这好,545%的利润,所有人都傻了,说你到底咋干的?

具体的实现方法呢,就不再跟大家详细分析了。简单来说,第一个负载均衡,你想他有这么多的GPU,这么多的核心,在他这种MOE的架构下,他把每一层的模型里边每一个专家,分配到不同的设备上面去进行运算。这个呢,就是一个负载均衡,尽量让所有的芯片都动起来,不要说有的芯片闲着呢,有的芯片在那排队。第二个,并行计算。并行处理是什么呢?所有的芯片一起来干活,这个速度肯定会变快。另外呢,一边干活的时候,另外一边呢,再同时进行数据的读写。你不能说我这需要数据了,你给我读,然后处理完了以后你再去写,这样就变慢了嘛。所以基本上在做这样的事情,负载均衡和并行处理。

另外还有一个什么样的事情在做呢?就是有一点点叫“驴粪蛋表面光”。这个也算是老北京的一个俏皮话,什么意思呢?就是这个驴粪球外边是很光滑的,但是里边呢,就是一堆的没有消化好的碎草。DeepSeek也是如此,他把很多的计算精度呢进行了调整,他尽可能的能够达到大家的要求,但是很多细节上的这些你看不到的环节呢,就给你忽略掉了。

More

DeepSeek是否融资迷雾重重——国家资本、阿里巴巴、社保基金都参与了吗?

DeepSeek是否融资迷雾重重——国家资本、阿里巴巴、社保基金都参与了吗?已关闭评论

大家好,欢迎收听老范讲故事YouTube频道。今天咱们来讲一讲DeepSeek的母公司——深度求索,是不是正在融资?消息是什么时候出来的?是2月19号传出来的。而且这个消息呢,并不是某人突然发了一条推特,或者发了一个其他的社交媒体,而是有一份报道。这个是The Information这样的一个媒体,做了独家的报道。据说有人参加谈判了,那么是参加这种融资谈判的人出来报的料。

据说参加谈判的有哪些家?第一个是阿里巴巴,然后呢是一些国有资金,包括中投公司、国家主权财富基金、国家社会保障基金,也就是社保基金。在The Information发了邮件去质询DeepSeek,阿里巴巴、中投公司没有回复质询,两位直接了解会谈的人回复了信息。

看到这里,咱们先看看这个到底是在说什么。一共是几家来谈判?DeepSeek自己可能要去参加谈判的,阿里巴巴要去参加谈判的,中投、国家主权财富基金、国家社会保障基金,这些都要去参加谈判呢。现在没有评论的是DeepSeek、阿里巴巴和中投,剩下有两位直接了解会谈信息的人士回复信息。这两个人应该是国家主权财富基金和国家社会保障基金的。那你说是一边一个,还是说这两个人都是属于其中某一个基金的呢?这个就没有办法去判断了。

More

软银OpenAI日本公司背后的资本阳谋——5,000亿星际之门是如何影响全球AI格局的?

软银OpenAI日本公司背后的资本阳谋——5,000亿星际之门是如何影响全球AI格局的?已关闭评论

SB OpenAI日本公司宣布成立,这怎么听怎么像是在骂人呢?大家好,欢迎收听老范讲故事的YouTube频道。今天咱们来讲一讲SB OpenAI日本公司到底是一个什么样的情况。

孙正义上台宣布Softbank OpenAI Japan这个公司成立了,所以这个SB不是骂人,它是软银Softbank的意思。今年我们发现OpenAI的声音连续不断,这是为什么呢?原因也很简单,老大的位置不是很稳固了。你要想在这一个行业里面当老大,要么你技术特别好大家都服气,比如像谷歌这样的,各个行业里头,只要跟计算机技术有关的,大家都知道谷歌的技术最好;要不然你垄断,比如像苹果这样,或者像Meta这样的,在社交媒体里我直接垄断了,大家知道你是老大。

如果技术也被人质疑了,花了好多钱训练出一堆模型来,别人也都可以达到了Claude 3.5、Sonnet、Gemini 2.0、Flash这样的模型,其实现在已经跟GPT-4相差仿佛了。你新发布了一大堆乱七八糟的模型呢,都是很小众的高端产品,对于大众来说无感。在这种情况下,你的技术就会被人质疑。

More

OpenAI Operator揭秘:从AI Agent 3.0到完成交易的“眼睛、脑子、手脚”全景解析!2025年AI行业新趋势:OpenAI如何用Operator撼动Google与微软的未来格局?

OpenAI Operator揭秘:从AI Agent 3.0到完成交易的“眼睛、脑子、手脚”全景解析!2025年AI行业新趋势:OpenAI如何用Operator撼动Google与微软的未来格局?已关闭评论

大家好,欢迎收听老范讲故事。OpenAI的operator为AI agent指明了方向,这是一个新鲜热辣的事情。2025年1月24号凌晨2点做的直播,四个人在那尬聊了20多分钟。为什么尬聊呢?不停的翻车,这个AI agent翻车还是很正常的一个事情。

山姆奥特曼,好像是一个印度人加上两个中国人,也在那里,满脸尴尬而不失礼貌的微笑。因为他做的事情确实跨的这个步数有一点点大,导致有一些翻车吧。每年开始的时候,OpenAI都会出来指明一下方向。今年指明的方向就是AI Agent的方向。

咱们还记得2024年吗?2024年是2月15号,OpenAI指明了方向。当时,是做了Sora的演示,只是后来这个Sora没有特别成功。全世界非常多的公司围绕着视频大模型,烧了很多很多算力。今年,他就是为AI agent指明了方向。那么operator到底能干点啥呢?它里边有一个引擎,叫computer using agent(CUA),它们念叫“哭啊哭啊”,是这么来念这个词的。

More

深度求索背后的创新力量︱隐士天才如何重塑中国AI未来?揭露神秘Deepseek模式!

深度求索背后的创新力量︱隐士天才如何重塑中国AI未来?揭露神秘Deepseek模式!已关闭评论

深度求索的创新模式可以复制吗?既然他能做出来,而且也让美国人愿意接受我们的这种智慧,这个事是不是可以再来一次?这个事能复制吗?

首先呢,咱们要从幻方量化开始讲起。幻方量化呢,我其实跟他还稍微打过一点点交道。我自己个人的经历是,2009年到2012年之间,就职于盛大创新院。后来大概到11年、12年这两年呢,就开始分拆,分了很多的这个子院。其中有一个院呢叫多媒体院,多媒体院的院长呢叫陆坚。他呢是浙大的本科,后来到美国去读的博士,然后去了苹果公司。就是如果你现在用Final Cut,用QuickTime,这些东西就是他写的。后来呢,他在我们那里当了两年的院长,离开盛大创新院以后呢,是LinkedIn中国的总经理,现在应该已经进入半退休状态了。

他呢是浙大的,浙大呢其实在杭州,培养了大量的图形图像相关的这种人才。当时呢,做媒体院的时候,陆坚就带进了一大批浙大的学生,做各种的图形图像处理的事情。在15年还是16年的时候,有一次跑去杭州,找很多原来盛大的老同事去吃饭,因为好多人去阿里了嘛。吃饭的时候呢,就有一位老同事约了我,说你来了我也吃个饭呗。这位老同事呢就跟我讲,说咱们做个量化交易,说我们现在干这个事。但当时他们这种量化交易呢,还是私下里边做,自己有一些钱在做一些,挣一些小钱,并没有公开对外去募资。

More

xAI拿下60亿美金融资PK OpenAI,Elon Musk的AI帝国能否改变游戏规则?

xAI拿下60亿美金融资PK OpenAI,Elon Musk的AI帝国能否改变游戏规则?已关闭评论

埃隆·马斯克的 xAI 拿了 60 亿美金的投资,估值达到 500 亿美金,准备去追赶 OpenAI 了。他还追得上吗?

大家好,欢迎收听老范讲故事的 YouTube 频道。咱们今天来讲一讲 xAI 拿了 60 亿美金投资,追赶 OpenAI 的故事。这一轮的投资里面,英伟达、AMD 都在,还有一些上一轮的投资者。

大家注意,不是说谁想投资他谁就可以的,只有上一轮的投资者,才有资格去投资 xAI。还有哪些人呢?就是协助埃隆·马斯克去收购 Twitter 的这些人,他们是有资格去投资 xAI 的。但是有限制,协助埃隆·马斯克收购 Twitter 的这些人呢,占股不超过 25%。其他的说我是上一轮投资人,他是可以无限制地在里面去进行投资的。你说我这两个都没沾边,那对不起,这个事跟你没关系。

More

OpenAI要推月薪2000美元的博士级AI助手,引起舆论大华。2,000美金月薪博士级AI助手VS真人博士:效率与成本的PK,未来工作场景大揭密!

OpenAI要推月薪2000美元的博士级AI助手,引起舆论大华。2,000美金月薪博士级AI助手VS真人博士:效率与成本的PK,未来工作场景大揭密!已关闭评论

2,000美金一个月的博士水平的AI助手,真的会有人去雇佣吗?大家好,欢迎收听老范讲故事的YouTube频道。这是谁说的呢?OpenAI的CFO,应该叫Sarah Friar。他提出来的,说我们已经准备了更强大的AI助手了,准备收更多的钱。

大家注意,OpenAI原来的ChatGPT是20美金一个月。我现在就是这样,20美金一个月的Plus用户。最近又推出了200美金一个月的O1 Pro用户,主要是在上面使用O1的这种更强的推理模型的。当然,我并没有去订阅这个,只是我的会员频道里,好像有一些朋友准备去做这块的订阅了,因为他们在写论文,确实是有用的。

O1 Pro用不到的话,200美金的Sora还是有用的。就是你如果订了200美金,Sora是允许你画更多的视频出来的。还有一个很重要的事情,我今天上Sora去画视频的时候被拒绝了,因为我提的提示词里边要求有人。我的账号是不能够画有人的视频的,必须是200美金以上的账号才可以生成带有人物的视频。今天又被人歧视了一下。

More

OpenAI的SearchGPT发布在即,Perplexity被迫广告变现:AI搜索唯一独角兽的艰难抉择。从拒绝广告到高价广告,Perplexity的转变背后:AI搜索面临巨大挑战。

OpenAI的SearchGPT发布在即,Perplexity被迫广告变现:AI搜索唯一独角兽的艰难抉择。从拒绝广告到高价广告,Perplexity的转变背后:AI搜索面临巨大挑战。已关闭评论

OpenAI的SearchGPT还没来,已经把AI搜索里边的唯一独角兽直接吓崩了。Perplexity已经要开始做广告了。大家好,这里是老范讲故事的YouTube频道。今天咱们来讲一讲Perplexity突然宣布要开始做广告,到底是一个什么样的情况。

OpenAI已经证实说他一定会去做SearchGPT的,甚至已经开了SearchGPT的wait list。我也跑去排队,到现在也没排上,只是收到了一封邮件说对不起,你还没排到。他把wait list给关了,这个其实挺奇怪的。通常情况下,wait list都是可以开着的,大家还可以继续排队。现在说不许排队了,好像有部分人排到了。

那么在这种情况下,一定会对整个的搜索以及智能搜索行业造成一定的影响。现在我们看到的第一个大的影响,就是Perplexity原来承诺说我不做广告的,现在说我要去做广告了,发文说今年四季度开始提供广告服务。

More

Meta Llama3.1——405b大模型震撼发布——性能全面超越GPT-4o,中国AI厂商是否迎来春天?新的时代到来了,历史的车轮滚滚向前。

Meta Llama3.1——405b大模型震撼发布——性能全面超越GPT-4o,中国AI厂商是否迎来春天?新的时代到来了,历史的车轮滚滚向前。已关闭评论

Llama3.1 405b突然开放,指标上全面超越GPT-4。中国厂商们是不是又可以充了呢?大家好,这里是老范讲故事的YouTube频道。今天咱们来讲一讲Llama3.1 405b 开放的事情。

Llama的开放,每一次都比较有戏剧性,都会有偷跑。什么叫偷跑?就不是由官方开了发布会,说我今天发布了一个什么产品,而是一般都是在Reddit这样的论坛里,突然就有人放出磁力链来,大家可以去BT下载Llama3.1 405B,包括Llama3.1 405B相关的各种测试数据,都是这么被发现的。头一天偷跑了以后,第二天梅塔说那算了,我开了吧。当时好像Llama2也是这么开出来的,现在Llama3.1 也是这么偷跑,完了以后就正式开放了。

他在跑分上已经全面地超越了GPT-4,基本上在各个指标上都超越了。这是非常非常难的,因为以前大家推出的各种模型里头,都是在个别指标里面超越GPT-4O或者超越GPT-4。那么在各项指标上全都超越的,这应该是第一次。当然了,它也是分很多版本的,分为8B、70B以及405B这三个版本。405B已经完全超越了,下面小一点的8B,应该比原来的Llama370B的效果还要再好一些。它的70B基本上针对前两天发布的GBT4OMINI,属于碾压状态。

More

退出移动版