3 月 04
Luke Fan AIGC , DeepSeek大模型 545%利润 , 557.6万美金 , AI优化 , AI优化技术 , AI公关策略 , AI公司争斗 , AI利润计算 , AI商业模式 , AI商战 , AI基准价格 , AI市场格局 , AI开源项目 , AI成本分析 , AI投资策略 , AI推理市场 , AI推理未来 , AI数据中心 , AI服务器管理 , AI生态小厂 , AI硬件 , AI自由市场 , AI行业内幕 , AI行业梗 , AI行业盈利 , AI话题营销 , AI资源分配 , AI量化交易 , AI量化模型 , AI高峰时段 , API定价 , CUDA , DeepSeek , Deepseek V3 , DeepSeek开源库 , DeepSeek计算精度 , GPU全天运营 , GPU租赁成本 , GPU负载均衡 , H100芯片 , H800 , MAAS厂商 , MAAS盈利模式 , MAAS竞争 , R1价格 , 中国AI企业 , 中美AI价格差 , 中美AI市场对比 , 云服务厂商 , 云计算 , 华为云 , 商业逻辑 , 大模型服务 , 大模型训练 , 字节跳动DeepSeek , 并行计算 , 开源协议 , 推理利润 , 推理效率 , 推理系统 , 数据参考价值 , 数据水分 , 数据逻辑 , 模型优化策略 , 模型即服务 , 深度学习 , 硅基流动 , 腾讯DeepSeek , 腾讯IMA , 芯片性能 , 训练成本 , 路深科技 , 达芬奇架构 , 阿里云投资
DeepSeek也玩“one more thing”,突然公布了它的推理利润达到545%,就像当初557.6万美金的训练成本那样,再次震惊了行业。大家好,欢迎收听老范讲故事的YouTube频道。今天咱们来讲一讲,DeepSeek结束了连续5天的开园周之后,到礼拜六玩了一次“one more thing”。这个“one more thing”呢,应该是当年乔布斯的梗。他每一次开发布会到最后的时候呢,都要说“还有一件事,等一等”,而且这一件事呢,往往是特别重要、特别颠覆性的事情。那么这一次又来了,DeepSeek公布了它的V1和R3推理系统相关内容,及大规模部署的成本和收益数据。就是说我部署了这东西以后,到底是挣了多少钱?非常非常让人震惊,因为所有人做这个东西都说我不挣钱,我亏钱,结果等到他这好,545%的利润,所有人都傻了,说你到底咋干的?
具体的实现方法呢,就不再跟大家详细分析了。简单来说,第一个负载均衡,你想他有这么多的GPU,这么多的核心,在他这种MOE的架构下,他把每一层的模型里边每一个专家,分配到不同的设备上面去进行运算。这个呢,就是一个负载均衡,尽量让所有的芯片都动起来,不要说有的芯片闲着呢,有的芯片在那排队。第二个,并行计算。并行处理是什么呢?所有的芯片一起来干活,这个速度肯定会变快。另外呢,一边干活的时候,另外一边呢,再同时进行数据的读写。你不能说我这需要数据了,你给我读,然后处理完了以后你再去写,这样就变慢了嘛。所以基本上在做这样的事情,负载均衡和并行处理。
另外还有一个什么样的事情在做呢?就是有一点点叫“驴粪蛋表面光”。这个也算是老北京的一个俏皮话,什么意思呢?就是这个驴粪球外边是很光滑的,但是里边呢,就是一堆的没有消化好的碎草。DeepSeek也是如此,他把很多的计算精度呢进行了调整,他尽可能的能够达到大家的要求,但是很多细节上的这些你看不到的环节呢,就给你忽略掉了。
More
12 月 16
范, 路 AIGC AGI , AIGC行业 , AI技术 , AI硬件 , AI行业趋势 , Apple Intelligence , Canvas , ChatGPT , Dalle更新 , Gemini 2.0 , GPT4.5 , Her语音功能 , LLaMA 3.3 , Meta , O1订阅 , OpenAI发布会 , Project功能 , Siri集成 , Sora , 产品发布 , 产品总结 , 创新产品 , 创新科技 , 强化微调 , 技术革新 , 新功能 , 新科技产品 , 智能体框架 , 未来科技 , 用户交互 , 用户交互界面 , 用户体验 , 用户体验提升 , 科学家工具 , 科技产品 , 科技产品创新 , 科技产品创新趋势 , 科技产品发展 , 科技产品发布 , 科技产品趋势 , 科技公司 , 科技公司产品 , 科技公司产品创新 , 科技公司产品创新趋势 , 科技公司产品发展 , 科技公司产品发布 , 科技公司创新 , 科技公司发展 , 科技公司发展趋势 , 科技公司发布 , 科技公司发布会 , 科技公司行业趋势 , 科技公司趋势 , 科技创新 , 科技创新趋势 , 科技发展方向 , 科技发布 , 科技发布会 , 科技巨头 , 科技行业发展 , 科技行业趋势 , 科技趋势 , 行业领军 , 视频交互 , 视频模型 , 视频生成 , 视频生成模型 , 语音功能 , 语音识别 , 谷歌 , 项目管理 , 项目管理工具 , 高级语音 , 高级语音功能
OpenAI的连续12天发布会现在已经过半,发布了些什么东西呢?咱们来总结一下。
大家好,欢迎收听老范讲故事的YouTube频道。12天开12场发布会,算是前无古人了。人家以前的发布会都是在集中一两天的时间里,聚集尽可能多的人把它开掉。但是,OpenAI就是要不走寻常路,选择连续发布12天,每天发布一点新东西出来。而且他们的发布会是在网上开了个直播间,有时候山姆·奥特曼在,有时候他不在,大家就一起来讲讲这段时间又做了点什么新东西。这还是非常有趣的一种发布方式,算是把年底这一段时间所有人的注意力又都拉回了OpenAI以及AIGC这个赛道上。
那么到年底了,大家都得卷,大伙有没有?有。但是,肯定没有12个。如果真的说年底有12个重磅级产品发布的话,他们也不会用这种方式。应该还是会有很多零七八碎的小功能在这12天发布出来,但也会有一些比较激动人心的东西。而且要卷,大家一起卷嘛。OpenAI作为AIGC行业的领军人物,既然开始卷了,其他人必然会跟进。
More
5 月 19
Luke Fan AIGC , Google的故事 AI Infra , AI交互 , AI市场 , AI平台竞争 , AI应用 , AI技术变革 , AI硬件 , ChatGPT , Gemini , Google cloud , Google I/O , GPT-4 , GPT-4o , Ilya , iPhone , OpenAI , Project Astra , RAG图像生成 , Sam Altman , TPU , Workspace , 任天堂 , 企业用户 , 创新战略 , 多模态训练 , 大模型 , 技术发展 , 搜索引擎 , 政府用户 , 智能体 , 智能设备 , 未来趋势 , 杰米莱 , 游戏 , 用户体验创新 , 电商 , 算力 , 语音交互 , 谷歌IO
大家好,欢迎收听老范讲故事的YouTube频道。今天我们又请到了老朋友尹迪狗,给我们介绍一下刚刚召开完的谷歌艾欧。这一次到底发布了什么。而在谷歌艾欧之前的一天,OpenAI我觉得算是故意捣乱截胡,发了个GP4欧出来。我们就正好趁这个时机呢,把这两个发布会或者两两个产品吧,一起来总结一下。首先呢,我想先问一下,GBT4O到底算不算是划时代的产品。嗯,至少模型啊,分成两部分,它发的是PPT是o是模型混合模态嘛,他把语音视频和文字一块训练的嘛,可以同时输入和输出嘛。这个相当于是,嗯,也不叫划时代吧,就是他之前所有的工程技术的沉淀。嗯然后呢,做了一个特别好的一个交互形式,就是语音交互。而且那个语音交互的很大一个特点,发完之后不是马上就有人升级吗,一搜我的这个APP上面的模型以及GPT,搜了然后大家都想打开。那那个耳机,点上去之后呢,可以跟他聊聊天。实际上,那个聊天并不是他发布会上的那种APP,那个还是回合制的,用那个rest接口聊天。我,发出去然后回来,这个回合制的,但是呢,他在发布会上演示的是完全stream的,就是像就像我们现在一样,我们录节目,我们用的是Web RTC协议嘛,streaming,就是你的Server端,它的那个TOKEN,它就不停的接收是吧,做实时处理。这个特别耗流量,耗TOKEN,耗算力的。嗯现在还没用到这个模型,所以大家感受不到,所以我记得第二天还第三天的时候m奥特曼还是他们官方账号,发了一个说明嘛,说哎你们大家用的现在还不是,发布会上也是这个,哈哈哈,一堆人说说这一直完完全不对,这么慢的响应,我觉得借手报了一下,就是他是非常natural,非常自然。可能就是大家第一次用起来 GPT 的感觉,一样哎。哇哦,是他没这样回答问题。就是他确实是有那个时候的一个感觉。
More