8 月 27
Luke FanAIGC, Musk传奇, OpenSource 5090D), AI Agent, AI大模型, DeepSeek, Grok-2, H20, JAX, Kimi, LLaMA, Meta, MIT协议, MOE架构, NVlink, OpenAI, SGLANG, UC伯克利, XAI, YouTube频道, 上海交通大学, 中美科技, 人工智能, 全球协作, 华为 (盘古大模型), 商业许可, 尹良生, 巨硬 (Gigabrain), 开源, 开源生态, 开源许可 (License), 微软 (Microsoft), 技术借鉴, 技术科普, 抄袭争议, 显卡要求 (H800, 智谱, 深度解析, 百度, 科技评论, 算力, 老范讲故事, 自主研发, 苹果 (Apple), 行业内幕, 谷歌 (Google), 郑连敏, 部署难度, 阿帕奇2.0, 马斯克, 高性能计算
马斯克终于开源了他的Grok-2。虽迟但到,这背后隐藏着哪些不为人知的秘密呢?
大家好,欢迎收听老范讲故事的YouTube频道。
马斯克最终还是开源了他的Grok-2。原来我们还嘲笑过他,Grok-1开源完了,往那一扔就再也不管它了,有任何人提问题,你也不说什么。Grok 4都出来了,现在Grok 2都没开源出来。马斯克说:“那我们下周开源。”当时是这么讲的。然而下周完了以后,好像还是又等了那么一段时间,稍微晚了这么几天吧,Grok 2最终还是开源出来了。而且承诺呢,6个月之内,或者说在年底之前吧,有可能会去开源Grok 3。但是马斯克的话嘛,大家相信,就是他说了的事会做,但是未必按时间做。
马斯克的开源呢,只能算是符合非常广义的开源。这话什么意思呢?开源也是分原教旨主义者的,他们是肯定不会认可马斯克在开源的。第一个,马斯克不是当时发布产品马上开源,而是要过一段时间,甚至是过了一年多才去开源。而且现在他开源出来的这个版本,远远落后于当前主流模型。当然Grok 2呢也不算特别落后,它在当时刚推出的时候,应该是跟GPT-4不相上下的一个水平,但是跟后边4O,以及后边O1、O2这些东西就没法比了。跟当前的主流模型,像什么GPT-5、Grok-4、Claude 4或者是Gemini 2.5这些,它是比不过的。
More
4 月 07
Luke FanAIGC 1000万Token上下文, 400B, AI Agent, AI应用场景, AI新闻, AI未来发展, AI模型发布, AI竞赛, AI算力, Claude 3.7, DeepSeek, FP8精度, Function Call, Gemini 2.5 Pro, GPT-4o, Grok (XAI), H100 GPU, INT4量化, Llama 3, Llama 4, Llama 4 Behemoth, Llama 4 MARVELIC, Llama 4 Scout, Llama 4发布反响平淡原因, LLM, Meta AI, Meta战略, Mixture of Experts, MOE架构, 专家模块, 中文能力提升, 人工智能, 全模态AI进展, 千问 (Qwen), 卡估值, 多模态输入, 大语言模型, 字节AI, 小模型竞争, 开源LLM对比, 开源模型, 开源模型内卷, 开源社区, 推理速度, 文本输出, 模型微调, 模型性能比较, 模型测评, 模型训练, 活跃参数, 流量入口, 知识蒸馏, 硬件要求, 端到端模型, 腾讯AI, 谷歌AI, 超级APP趋势, 长上下文, 阿里AI
Llama4发布了。这里的黎明静悄悄,没有什么响动。这是怎么回事?
大家好,欢迎收听老范讲故事的YouTube频道。一觉醒来,Llama4就发布了。扎克伯格亲自在Facebook的REELS(也就是Facebook的短视频里面)发了一条视频,说Llama4发布了,今天是Llama4日。
Llama4呢,一共是有三个版本:
第一个叫Scout(侦察兵版本),总参数1,090亿(也就是109B),活跃参数是170亿,包含16个专家模块。对的,Llama终于也放弃抵抗了,从Llama4开始变成Moe了。在Llama4之前的版本都是单一体的模型,Llama3.3还给了一个400多B的单一模型,到Llama4彻底放弃抵抗了。
现在呢,支持1,000万TOKEN这种上下文,这个是Llama4最大的一个特点。DeepSeek是64K(也就是64,000个TOKEN上下文),现在上下文比较大的Gemini大概是能到2兆(200万),Llama4直接给了一个10兆(1,000万TOKEN),这是它做的一个很创新的点。
More
8 月 20
Luke FanAIGC, Musk传奇 AIGC爆发, AI产品, AI大模型, AI市场策略, AI应用, AI竞争, AI绘画, Anthropic, API集成, Chat GPT, Copilot, DALL·E 3, Elon Musk, Flux 1, Gemini, GitHub项目, GPT-4, Grok 1开源, Grok 2, IP保护, MidJourney, MOE架构, Open Cloud, OpenAI, RAG架构, trump, Twitter Premium, Twitter互动, X AI估值, XAI, 互联网互动, 会员收入, 使用政策, 偏右AI, 八美元订阅, 内容审查, 名人肖像, 商业模式, 商标侵权, 图片生成, 多模态理解, 大模型比较, 实时回复, 广告展示, 广告收入模式, 广告收益, 开源项目, 微调功能, 微软创新, 性能测试, 推特, 推特内容, 推特活跃度, 数据处理政策, 数据收集, 数据透明, 数据隐私, 文档支持, 梗图, 法务部, 涨粉, 版权问题, 特斯拉, 社交产品开发, 社交媒体, 社交应用, 社区支持, 社区活跃, 算力中心, 美塔, 苹果, 订阅费, 诉讼, 话题热点, 谷歌, 谷歌Gemini更新, 谷歌Jax, 贺锦丽, 跨平台集成, 风格独特, 马斯克
Grok 2出来了,老板马斯克就是拿来开涮。马斯克各种梗图突然开始满天飞了,这是什么东西呢?就是XAI做的Grok大模型的第二版,Grok 2发布了,包括特朗普跟贺锦利的各种梗图也在飞了。其中有一张是特朗普去抚摸贺锦利怀孕的肚子呀。但其实玩的呢,并不是Grok 2,而是什么叫Flux 1。
首先分析下时间点,为什么在这个时间要去出Grok 2呢?第一个,3月份我开始测试了,Grok 2已经开始测试了,测试到8月份呢,也差不多开始出了。而且3月份,Grok一开源了,然而开源之后就再也没有更新过任何的代码,也没有去回答过任何的issues或者是Pull request,这个都再也没有动过,完全死水一潭。马斯克的开源就是这么开的,我开了,用不用是你的事,我反正不理你,我也不会再更新任何代码。
包括推特,原来开源的推荐算法,包括Grok 1都是这样的,开了就挂在这了,爱使不使。而且它开出来以后,你自己到底能不能部署得上去,能不能把他们这个用起来去测试,他就完全不管了。你提任何问题,他也不理你啊,这就是马斯克开源。
More