2 月 12
Luke FanAIGC AI产品封闭市场, AI人才密度, AI企业收购, AI创业环境, AI大模型竞争, AI市场单一化, AI市场对比, AI市场规模, AI开源闭源之争, AI技术输出, AI效率榜, AI模型部署, AI法律法规, AI生态系统, AI算力中心, AI语言适配, AI跨国竞争, AI隐私保护, ChatGPT竞争, Claude AI, Deepmind团队, DeepSeek, Gemini模型, Google Deepmind, GPU算力, H100显卡, H200显卡, iOS效率榜第一, Le Chat, Mistral公司, MoE模型, OpenAI封锁, 中国六小虎AI, 中欧AI技术差距, 中法AI对比, 中美AI竞争, 全球AI发展, 开源AI模型, 微软AI投资, 文心一言, 欧洲AI人才流失, 欧洲AI政策, 欧洲AI计划, 欧洲人工智能, 法国AI, 法国AI创新, 法国AI创新瓶颈, 法国AI发展, 法国AI团队, 法国AI未来, 法国AI短板, 法国AI算力, 法国云计算, 法国人工智能融资, 法国创新监管, 法国政府AI扶植, 法国版星际之门计划, 法国科技创业, 法国科技政策, 法语AI模型, 英伟达AI投资, 英伟达显卡销售, 豆包AI, 通义千问
法国AI聊天工具Le Chat在法国登到了排行榜第一名。法国AI是不是有戏了?大家好,欢迎收听老范讲故事YouTube频道。今天咱们来讲一讲这个叫Le Chat。我在讲这个故事之前,专门去向我学过法语的太太请教过了,说这个东西应该那么去念啊,最后这个t是不发音的。这个产品到底怎么样?咱们先说一说它的公司呢,其实原来我们介绍过啊,叫Mistral公司,应该算是整个欧洲拿到投资最多的一家AI公司了。
然后他们的创始人呢,原来是Deepmind的员工。他在法国受的教育,到Deepmind混了两年以后,回到法国去创业。他们大量的创始团队都是从Deepmind回来的。Deepmind被Google收购了以后,他大量的团队依然是在英国上班。所以,这帮人有可能是在美国混了一段时间,当然也有可能是在英国混了一段时间,现在在法国创业。然后他们拿到了像微软啊,英伟达等很多公司的这种投资。但是法国还有一个很有钱的人,特别喜欢投资AI啊,谁啊?就是那个LV的那个老板,也会去投资很多的AI公司。
那么这个公司呢,他们出的很多的模型,特别是开源模型,在AI圈子里头还是有很大响度的。比如说Mistral的7B啊,特别早就出来,很多人会去使用。他们出的很多这种MoE模型,也是很流行的。最早被大家所接受的MoE模型就是他们家的,比如说8X7B啊,或者是8X22B这些啊。MoE模型啊,很广泛的被使用。所以这一次呢,去问他们的创始人,说你看DeepSeek怎么样?他说哎呀,Deepseek用到的很多模型组织方式是原来我们开源出来的啊。当然最早的MoE不是他们发明的,但是Mistral在MoE整个的演化过程中还是做了非常多的贡献的。
More
2 月 11
Luke FanAIGC, DeepSeek大模型 029筛选, 16张H100显卡, 32B模型, 50美金AI训练, 59, AI公司裁员, AI商业化, AI小公司机会, AI开发路径, AI成本控制, AI技术突破, AI推理模型, AI教母, AI模型蒸馏, AI测试标准, AI用户粘度, AI科学方法, AI筛选问题, AI行业未来, AI行业竞争, AI行业落地, AI领域定制, AI领域案例, ChatGPT O1, ChatGPT对比, DeepSeek R1, Gemini 2.0 Flash thinking, Gemini数据, S1K模型, Together平台, Together平台训练, 中国AI创新, 人工智能创新, 低成本AI, 可感知AI效果, 大模型与小模型, 大模型优化, 大模型应用, 小型模型训练, 小模型训练, 开源微调模型, 微调模型, 推理效率提升, 推理时间优化, 推理步数评估, 收敛性评估, 教育AI模型, 数据训练优化, 斯坦福大学, 普林斯顿大学, 李飞飞, 法律AI模型, 用户定制化AI, 电子工程博士, 硅基流动, 硅基流动平台, 置信度评估, 蒸馏模型方法, 蒸馏训练技术, 蒸馏问题技术, 财务AI模型, 通义千问, 问题筛选技术, 预算强制法, 高效AI解决方案, 高效AI训练
大家好!欢迎收听老范讲故事YouTube频道。今天咱们来讲一讲李飞飞的S1K模型。50美金成本超越DeepSeek R1和ChatGPT O1。
首先呢,DeepSeek到底是怎么震惊全球的?就是因为训练成本低。他的训练成本是OpenAI的3%,所以震惊了全球。
那么现在李飞飞的S1K模型,16张H100的显卡,跑了26分钟跑完了,拿到了一个32B的模型。多项测试超越了DeepSeek R1和GPTO1。
大家要注意,评测大模型呢,它有很多很多测试项。一般我们说基本上达到什么什么水平,就属于叫互有伯仲。有些你强点,有些他强点。原来大家都超不过GPT 4O,是因为只能接近它,距离它的全项指标都有差距。现在的话,大家就已经基本上可以达到GPT 4o的水平了。
More
1 月 28
范, 路AIGC, DeepSeek大模型 AI Agent公司, AI Agent生态, AIGC领域, AI云计算, AI产业标准, AI协作方式, AI大模型, AI开源, AI开源项目, AI推理能力, AI数据偏见, AI显卡优化, AI显卡禁令, AI研发成本, AI蒸馏微调, AI闭源模型, AMD MI 300, AMD显卡兼容, Anthropic压力, Claude模型, DeepSeek, DeepSeek R1, Deepseek V3, DeepSeek代码, DeepSeek原创性, DeepSeek影响, DeepSeek成果, DeepSeek数据来源, DeepSeek美国市场, DeepSeek英文论文, Deepseek训练成本, DeepSeek论文, Huggingface, Kimi 1.5, Meta AI发展计划, Meta震惊, Minimax 01, OpenAI竞争, Oracle云计算, PyTorch开源工具, 中文社交媒体, 中美AI竞争, 中美科技博弈, 亚马逊AI, 人工智能创新, 华为AI标准, 大模型训练路径, 字节跳动AI, 开源模式, 开源胜利, 微软AI, 英伟达显卡, 谷歌AI, 谷歌AI研究, 豆包1.5, 通义千问, 闭源与开源
DeepSeek突然出圈,引发了中文圈的争吵。大家好,欢迎收听老范讲故事的YouTube频道。
DeepSeek在前面,我们已经出了一期视频,去讲它到底是怎么回事了。那么,DeepSeek最近肯定是更加的出圈。首先,DeepSeek V3,据说训练成本只有557万美金,震惊了扎克伯格,震惊了Meta。Meta说:“我们有好多的老大,他们的年薪都超过557万美金了。人家训练了个模型才用了557万美金,那我花了这么多钱去组建AI团队,花了这么多钱去囤显卡,是不是亏了?”现在就有这样的声音出来。
而且,最新的DeepSeek R1,也就是它的推理模型,推理能力已经接近o1了。蒸馏微调出来的这些小模型,已经在很多领域里头超越了o1 Mini。在这儿多补充一句,什么叫蒸馏微调的小模型?像我的电脑上,也是跑了一个DeepSeek R1-32B的模型。这个模型是怎么来的?它实际上是由DeepSeek R1去输出数据,然后拿输出的数据再去调通义千问2.5-32B的这个模型,最后得到的结果。这就是DeepSeek R1-32B,他在我的电脑上做各种推理,效果相当不错。
More
1 月 07
Luke FanAIGC, 中国故事 A100显卡, AIGC, AI人才招聘, AI人才流动, AI价格战, AI价格敏感, AI企业挖人, AI六角龙, AI创业决策, AI创业团队, AI创业投资策略, AI创新比较, AI商业模式, AI基础研究, AI工具, AI工程师, AI市场竞争, AI开源, AI开源社区, AI开源竞争, AI技术趋势, AI拼多多, AI模型架构, AI生态发展, AI研究团队, AI算力资源, AI算法突破, AI行业内卷, AI行业案例, AI行业现状, AI资源调动, AI领域创新比较, ChatGPT, DeepSeek, Deepseek V2, Minimax, 个人开发者, 中国AI六小龙, 中国AI基础保障, 中国AI技术力量, 中国AI教育压力, 中国AI未来, 中国人工智能, 中小盘股, 五斗米奔波, 创新投资风险, 创新模式, 团队管理模式, 大厂AI整合, 大模型研发, 幻方量化, 快速迭代, 技术研发, 月之案面, 未来AI趋势, 李开复, 梁文峰, 模型创新, 模型开源, 浙大算法天才, 深度求索, 清华北大, 百川智能, 百度文心一言, 盛大创新院, 罗福莉, 自下而上创新, 融资机制, 豆包AI, 质谱AI, 通义千问, 量化交易, 量化基金, 隐士大侠, 零一万物, 黄埔军校, 黑客文化
深度求索的创新模式可以复制吗?既然他能做出来,而且也让美国人愿意接受我们的这种智慧,这个事是不是可以再来一次?这个事能复制吗?
首先呢,咱们要从幻方量化开始讲起。幻方量化呢,我其实跟他还稍微打过一点点交道。我自己个人的经历是,2009年到2012年之间,就职于盛大创新院。后来大概到11年、12年这两年呢,就开始分拆,分了很多的这个子院。其中有一个院呢叫多媒体院,多媒体院的院长呢叫陆坚。他呢是浙大的本科,后来到美国去读的博士,然后去了苹果公司。就是如果你现在用Final Cut,用QuickTime,这些东西就是他写的。后来呢,他在我们那里当了两年的院长,离开盛大创新院以后呢,是LinkedIn中国的总经理,现在应该已经进入半退休状态了。
他呢是浙大的,浙大呢其实在杭州,培养了大量的图形图像相关的这种人才。当时呢,做媒体院的时候,陆坚就带进了一大批浙大的学生,做各种的图形图像处理的事情。在15年还是16年的时候,有一次跑去杭州,找很多原来盛大的老同事去吃饭,因为好多人去阿里了嘛。吃饭的时候呢,就有一位老同事约了我,说你来了我也吃个饭呗。这位老同事呢就跟我讲,说咱们做个量化交易,说我们现在干这个事。但当时他们这种量化交易呢,还是私下里边做,自己有一些钱在做一些,挣一些小钱,并没有公开对外去募资。
More
12 月 30
Luke Fan罗永浩的创业故事 2025AI产品趋势, 2025新品, 2025春节, 2025科技趋势, AI交互, AI交互硬件, AI产品, AI产品前景, AI产品经理, AI作品发布, AI场景应用, AI多模态技术, AI工程师招聘, AI应用开发, AI新技术, AI眼镜, AI硬件价格, AI硬件探索, AI耳机, AI音箱, AI音箱选购, All in AI, AR眼镜, AR转AI, ChatGPT, Gemini, 中小企业产品, 中文分词, 交个朋友, 创业失败案例, 创业融资, 多模态, 大模型微调, 大模型研发, 大模型训练, 宠物摄像头, 小米超级小爱, 技术团队, 智能可穿戴硬件, 智能家居控制, 智能玩偶, 智能玩具市场, 智能眼镜, 智能硬件, 智能穿戴设备, 智能语音助手, 智能语音识别, 暴力裁员, 未来科技产品, 用户交互设计, 用户需求分析, 科技创业, 科技创新, 科技媒体分析, 细红线公司, 细红线创业历程, 细红线动态, 罗永浩, 罗永浩AI, 罗永浩直播, 老罗新动态, 老罗美国动态, 耳机和音箱, 耳机新品, 聊天工具, 脑机接口, 行业冥灯, 行业尾声, 行业竞争, 行业赛道选择, 语音API, 语音识别优势, 豆包耳机, 轻量级AI产品, 通义千问, 锤子手机, 高估值初创, 高级用户体验, 高级语音功能
老罗,罗永浩这个行业冥灯又转向了,这一次号称要 All in AI,那么他能够为我们带来一些什么呢?
大家好,欢迎收听老范讲故事的 YouTube 频道。罗永浩的细红线呢,其实已经有很长一段时间没有什么声音出来了吧?他又跑回去参加什么婚丧嫁娶,去给人直播带货去了。那么最近呢,传出消息,终于要有产品跟大家见面了。 据说呢是在 2025 年春节前后,准备发布新产品。2025 年的春节的话应该是 1 月 29 号,所以呢,他有可能会在 2 月初拿出产品出来。这一次呢,就是一个 AI 产品,不再是 AR 产品了。他这个公司叫细红线,当时创建的时候号称是要去做 AR 产品和 AR 操作系统的,现在转向了。
那么这个产品的价格呢,现在不太确定, 只是说不太便宜。2024 年 4 月份,在交个朋友四周年专场直播中呢,罗永浩提到过,让粉丝们准备 199 美金跟 299 美金,这两个价格。所以呢,有可能是两款产品,一个 199 美金,一个 299 美金。 当然也有可能这一次发布的新产品跟当时他拍脑的这个价格就已经没有关系了,但是他依然表示,这一次要发布的产品呢,并不便宜。
More
12 月 27
Luke FanAIGC, Musk传奇 AIGC, AI企业合作, AI公司估值, AI公司估值增长, AI公司动态, AI公司发展, AI公司战略, AI公司扩张, AI公司收入, AI公司目标, AI公司融资, AI内容审核, AI内容对齐, AI创新, AI发展方向, AI商业应用, AI商业模式, AI图像生成工具, AI市场份额, AI市场投资, AI市场机遇, AI市场竞争, AI市场竞争力, AI市场趋势, AI市场需求, AI平台, AI应用开发, AI开放API, AI技术创新, AI技术发展, AI技术合作, AI技术壁垒, AI技术应用, AI技术突破, AI投资, AI数据支持, AI模型性能, AI流量池, AI盈利模式, AI算力集群, AI融资, AI行业, AI行业分析, AI行业前景, AI行业动态, AI行业发展, AI行业影响, AI行业挑战, AI行业排名, AI行业潜力, AI行业现状, AI行业竞争, AI行业趋势, AI行业领先者, AMD, Anthropic, Arura图像生成, GPT Search, Grok模型, NVIDIA, OpenAI, SpaceX, XAI, x平台, 商业化, 场景拓展, 埃隆·马斯克, 字节跳动, 客户获取, 模型训练, 特斯拉, 谷歌Gemini, 通义千问
埃隆·马斯克的 xAI 拿了 60 亿美金的投资,估值达到 500 亿美金,准备去追赶 OpenAI 了。他还追得上吗?
大家好,欢迎收听老范讲故事的 YouTube 频道。咱们今天来讲一讲 xAI 拿了 60 亿美金投资,追赶 OpenAI 的故事。这一轮的投资里面,英伟达、AMD 都在,还有一些上一轮的投资者。
大家注意,不是说谁想投资他谁就可以的,只有上一轮的投资者,才有资格去投资 xAI。还有哪些人呢?就是协助埃隆·马斯克去收购 Twitter 的这些人,他们是有资格去投资 xAI 的。但是有限制,协助埃隆·马斯克收购 Twitter 的这些人呢,占股不超过 25%。其他的说我是上一轮投资人,他是可以无限制地在里面去进行投资的。你说我这两个都没沾边,那对不起,这个事跟你没关系。
More
10 月 20
Luke FanAIGC, 芯片的故事 AI Now, AI PC, AIPC, AI与PC结合, AI接口封闭, AMD, ARM芯片, Copilot, Cyrix芯片, Linux内核, Llama 3.1, Meta, Oracle, PC产业标准, PC市场, Tech World 2024, Windows for ARM, Wintel战略, X86生态系统, 中国产替代, 云AI接口, 兆芯, 克里斯蒂亚诺·安盟, 全球PC市场, 全球化竞争, 全球市场, 创新技术, 博通, 合规, 响应时代需求, 地缘政治, 基辛格博士, 威胜电子, 小扎, 市场变革, 市场开拓, 市场竞争, 微软, 惠普, 战略布局, 戴尔, 技术世界大会, 技术创新, 技术生态布局, 招投标, 指令集, 服务设计, 未来科技发展, 杨元庆, 汇宇科技, 百度文心一言, 硬件兼容, 离线版本, 科技前沿, 科技协作, 科技发展趋势, 科技行业动态, 红帽子, 联想, 联想发展策略, 联想市场份额, 自主创新, 自主知识产权, 苏妈, 苏姿丰, 英伟达, 英特尔, 苹果M系列, 萨提亚·纳德拉, 行业挑战, 行业整合, 行业领导者, 谷歌, 软件开发, 通义千问, 高通, 黄仁勋, 黄教主, 龙芯
联想技术世界大会上看江湖恩怨情仇。大家好,这里是老范讲故事的YouTube频道。今天咱们来讲一讲10月15号刚刚在西雅图召开的联想技术世界大会,它叫Tech World 2024。
在这场会上,上台演讲的人呢,第一个是杨元庆,联想的老大;然后是英特尔的CEO基辛格博士;再往后是AMD的CEO苏兹风博士;再往后是英伟达的老大黄仁勋,他不是博士啊。这些人是在现场演讲的,还有一些嘉宾呢,就显得亲疏有别了,他们并没有到现场来演讲,而是发送了视频演讲,就是在现场播放了他们演讲的视频。第一个是微软的萨提亚·纳德拉,微软CEO;然后是高通的CEO克里斯蒂亚诺·安盟;最后是Meta的小扎,也在里边发表了演讲。这个是一开始没太想到的,因为Meta的小扎跟前面咱们讲的所有这些人其实没啥关系。
那么在整个的大会上呢,发表了哪些东西呢?第一个是联想自己的AI PC,以及联想自己的AI Now。AI Now是一个什么东西呢?就是联想自己的一个基于PC的AI助手。这种东西呢,其实有点像,比如说三星应用市场啊,或者是索尼应用市场,有点像类似这种东西。为什么要提到这两个产品呢?因为你想,他们三星也好,索尼也好,出的都是安卓手机,你安卓手机在海外的话,按道理说你用Google Play就完事了。但是不行,我们一定要做一个自己的应用市场,在上边去。到底有没有人用我不管了,反正我得做。
More
5 月 17
Luke FanAIGC, 华为很厉害 AI, Bolan, bug, contranite, DOS攻击, e latch, HUAWEI, image list, in bedding, inviting, LLM, MindSpore, MindX, Python, RAG, Retry, rpm限制, sleep 6, stable diffusion, stream输出, time.sleep, YouTube, 人工智能, 代码, 企业用户, 升腾大模型, 华为, 华为大模型, 史量化, 后台进程, 图像生成, 图片 RAG, 大模型, 字节跳动, 安卓, 客观中立, 嵌入, 拉玛, 拉玛3, 提示搜工程, 提示词, 政府用户, 昇腾, 欺骗, 流式输出, 游戏, 演示, 状态监控, 电商, 真相, 矢量空间, 翻车, 老范, 老范讲故事, 职业编程, 萝卜急了不稀泥, 解读, 谷歌, 谷歌IO, 豆包, 通义千问, 锁定状态, 零一万物, 骑士
大家好,
欢迎收听老范讲故事的YouTube频道。今天咱们来讲一讲华为大模型演示翻车现场。
近期呢,非常多的AI相关的项目都在进行演示和发布,特别是国内。为什么它?因为时间到了。通常每年在这个时候也会有很多发布,因为每年在这个时候会开谷歌IO,大家喜欢在谷歌IO的前后进行信息的发布啊。因为谷歌IO算是全世界程序员或者开发者的一个盛会吧。那这个前后进行信息发布的话,如果它被安卓采用了,或者再跟谷歌搭上一点关系的这种技术会有更好的发展空间。
那今年呢,还有另外一个事情,就是拉玛3发布。前面其实国产很多大模型都是跟拉玛2有千丝万缕的联系。其实当时就已经预言过,我说拉玛3出来看多长时间之后,国内的大模型会争先恐后的再更新换代一波。现在呢,这个时间点就到了。前面阿里的通1,000问2.5发布,这两天还有几个,一个是零一万物的啊,叫e latch大模型发布,然后字节跳动的豆包大模型前两天也发布了啊。这豆包大模型主打的一个便宜,对别人的价格都便宜非常多,因为大模型的价格一般是按TOKEN算的啊,一般一个汉字是一个TOKEN,大概四个字母,还是几个字母的英文单词,是一个TOKEN啊,它这个算法比较奇怪。
More
4 月 23
Luke FanAIGC, OpenSource 70 billion parameters, 70B模型, AI Security, AI多语言处理, AI安全性, AI技术, Artificial Intelligence, Baidu, ChatGPT, Claude, Facebook, GPT3.5, GPT4, Instagram, Li Yanhong, LLama2, LLama3, Meta, Multilingual AI, OpenAI, Tech Innovation, Technology Breakthrough, WhatsApp, 业界影响, 人工智能, 大语言模型, 开源AI, 扎克伯格, 技术突破, 技术讨论, 文心一言, 李彦宏, 百度, 科技创新, 通义千问
大家好,欢迎收听老范讲故事YouTube频道。今天咱们来讲第一个故事。
Llama3发布了,李彦宏是不是被打脸了呢?Llama3突然发布,又是一个遥遥领先。它呢,发布了8B和70B的两个版本。8B就是80亿参数,70B呢就是700亿参数。8B的,我其实已经试过了,就在本地已经装上了。这个某些方面,接近了原来,或者超过了原来的Llama2的70B。包括一些咱们在本地跑的这种30多B的,这种就是300多亿参数的模型,它已经都超过了。而且速度还飞快。
啊,70B呢,据说已经超越了cloud 3的中量级模型。Note 3是有三个模型的:一个是特别微小的,就是可以在手机上跑;一个是中等量级的,是可以在PC本地跑的;然后还有一个是那种特别大的,特别大的,是可以对标GPT4的。70B的基本上已经超过这个中等量级了,也超越了GMINI 1.5 Pro。现在大家想去试GMINI 1.5 Pro的,可以到AI studio.google.com上去试,那个是可以免费用的。也超越了现在70B发布出来的版本。普遍他们自己讲的是超越了GPT3.5,但是呢,还达不到GPT4。这在所有测试数据上都是这样。我相信梅塔应该不会像咱们似的,专门做一些调优以后去跑分,不像咱们这么无聊。
More