7 月 15
Luke FanAIGC, Musk传奇 20万H100显卡, 256K上下文, AI大模型, AI安全中心, AI融资, AI进程改变, API调用, Claude, DeepSeek, Elon Musk, Gemini, Grok Heavy, Grok2, GROK3, GROK4, LLaMA, OpenAI, Oracle云, Scale AI, XAI, 三体小说, 中美AI差距, 人类终极测试, 企业私有部署, 众包题库, 动态任务池, 华为盘古, 南京大屠杀, 南非白人种族屠杀, 多智能体合作, 多模态AI, 川建国, 工具支持, 市场占有率, 开源承诺, 强化学习, 意识形态投毒, 技术爆炸, 推理能力, 日本烟花事件, 昇腾芯片, 模型蒸馏, 模型迭代, 理工男模型, 电力消耗, 科研提速, 算力竞争, 编程工具, 视频生成, 越狱提示词, 过拟合预防, 预训练模型, 马斯克发布会, 黄仁勋访华, 黄色小说生成, 黑暗森林法则, 黑色幽默
史上最聪明的AI大模型GROK4诞生了。马斯克亲自坐镇开发布会。视频发布会呢,并不是特别的顺畅。第一个呢,是他晚了一个小时,也没说为什么。反正马斯克的直播经常会晚。然后呢,太多的东西需要集中发布,上下衔接的呢比较仓促一点。
最早期很多的互联网公司开发布会也是这样的,两三个小时七差咔嚓发一大堆东西。后来OpenAI这些公司习惯了在网上开直播以后呢,就慢慢把这风格改了。改成什么呢?就是每次发一个功能,发个十分钟二十分钟就完事了。然后呢,不停的发,每个月发每个月发。Xai呢,现在还没有彻底学会这件事情,还是一股脑给大家扔了一大堆东西出来。
我们以前在面对创业者的时候,每次都会苦口婆心的去做一种劝告。大家可能不知道会劝什么。作为投资人来说,我们每次看到任何一个创业者,都会上去劝一件事,叫不要憋大招。你一次要惦记着做一个大的东西,就很容易失败。你应该是做一些小的东西,一点一点放出来。OXAI现在还是憋了一个大招。当然了,XAI后面呢,也会每个月发布一个新的工具出来,它也慢慢的向这样的一个方向去前进。
More
7 月 08
Luke FanAIGC AI Agent, AIGC, AI产业, AI幻觉, AI应用开发, AI趋势, Claude 3, DeepSeek, Few-shot (少样例提示), Gemini 2.5 Pro, GPT-4o, Grok, JSON输出, LangChain, LLaMA, LLMOS (大模型操作系统), MISTRAL, OpenAI, RAG (检索增强生成), Shopify, Simon Wilkinson, 上下文工程 (Context Engineering), 上下文窗口 (Context Window), 上下文隔离, 信息压缩, 函数调用 (Function Calling), 大语言模型 (LLM), 安德烈·卡帕西 (Andrej Karpathy), 工具调用 (Tool Calling), 技术解读, 提示词工程 (Prompt Engineering), 模型稳定性, 特斯拉, 程序员, 系统提示词, 英伟达 (Nvidia), 豆包大模型, 软件2.0 (Software 2.0), 通义千问, 长期记忆
上下文工程又有新词了。AIGC不怎么赚钱,造词的速度还是非常非常快的。大家好,欢迎收听老范讲故事的YouTube频道。
提示词工程已经稍微有点过时了,现在的新词叫上下文工程。提示词工程长什么样,大家还记得吗?就是上来先说你是谁,谁先给大模型定一个位置。比如说你是一个资深翻译,你是个语文老师。然后呢,说我现在想要干一点什么事情了,给我出个题,给我做个翻译,再给他一个简单的例子,说你照这样给我把东西做出来。
光有提示词呢,肯定是不够的。除了刚才我们讲的完整的、结构化的提示词之外,你还是需要很多相关的上下文,才能够让大模型稳定的输出结果。那你说我们继续把提示词写长不就行了吗?我还见过那种直接写出几百字或者是上千字小作文的提示词。这个是不是可以继续往前走呢?不行了。因为你如果继续叫提示词工程呢,会容易引起误解。大家觉得只要不断的把提示词写长,就可以把这事解决掉。但其实除了提示词之外,还有非常非常多的上下文数据需要一起写进去,才能够让大模型稳定的输出我们所预期的、有价值的结果出来。
所以呢,就不能继续叫提示词工程了,一定要起个新词。而且呢,AI时代呢,起新词是非常重要的,因为可以吸引眼球。只有足够吸引眼球的东西,才有发展的前景。所以在这个时候,上下文工程就来了,一个新词诞生了。
More
7 月 02
Luke FanAIGC, Meta的故事 1亿美金签字费, AI Agent, AIGC, AI人才战争, AI团队重组, Anthropic, DeepSeek, Facebook, Kimi, Llama 4失败, Meta, Meta与OpenAI, MiniMax * 其他公司: 谷歌 (Google), OpenAI, XAI, 人力资源 (HR), 人工智能 (AI), 企业文化, 元宇宙 (Metaverse), 创新工厂 (Innovation Works), 华为 (Huawei), 员工挽留, 商业故事, 团队管理, 大语言模型 (LLM), 山姆·奥特曼 (Sam Altman) AI模型: Llama 4, 开源模型, 战略方向, 扎克伯格 (Mark Zuckerberg), 扎克伯格亲自下场, 招聘策略, 推理能力, 文心一言, 模型刷榜, 盛大 (Shanda), 盛大故事, 硅谷文化, 科技巨头挖人, 科技评论, 算力竞争, 职场八卦, 股票期权, 腾讯 (Tencent), 腾讯挖华为HR, 薪酬体系, 行业内幕, 行业分析, 谷歌Gemini, 金山 (Kingsoft), 金山喝酒留人, 闭源模型, 阿里千问 (Qwen)
Meta急了,扎克伯格亲自下场疯狂挖人,重新组建AI团队。
大家好,欢迎收听老范讲故事的YouTube频道。Meta的1亿美金签字费最近成为了一个新梗。签字费什么意思?就是说我去挖人,你只要过来签个字,说我同意上班来了,1亿美金到手。这个又算是创造历史了吧。
现在AI呢,确实是资本最密集,和整个行业都在关注的一个点。所以Meta这样的一家美股七姐妹的公司,突然发现自己落后了,那就一定要赶快出来补救。而补救的方式的话,一亿美金签字费。
Meta呢,在Llama4上栽了一个大跟头,而且摔得非常非常惨。这个产品呢本来是寄以厚望的,因为Llama1、Llama2、Llama3,大家都是觉得非常成功。而且呢,Meta算是建立了一个自己的品牌。甭管是谷歌呀,Anthropic呀,OpenAI,你都是闭源,只有我是开源,而且我是开源圈的领军人物。其他的人只要是愿意用开源模型,必须以Llama为基础去干活去。至少在Llama2的这个阶段呢,它这个目标是实现了。就像当年的iOS跟安卓一样,iOS是闭源的,安卓是我开源,你只要惦记自己做手机,想要一操作系统,你就使我的。
More
7 月 01
Luke FanDeepSeek大模型 “墙”反着修, AI, AI伦理, AI禁令, API, ChatGPT, Coze, DeepSeek, DeepSeek封禁, LLM, Minimax, OpenAI, TikTok, YouTube, 中国, 中美科技竞争, 人工智能, 人工智能监管, 信息安全, 全境封锁, 加拿大, 千问, 印度, 可灵, 合规, 国际关系, 大语言模型, 字节跳动, 应用商店下架, 开源模型, 德国, 德国禁用DeepSeek, 快手, 意大利, 技术封锁, 政府禁令, 政府设备禁用, 数据主权, 数据出境, 数据安全, 数据本地化, 数据渗透, 数据隔离, 智谱AI, 欧盟, 澳大利亚, 科技战, 科技评论, 网络安全, 美国, 美国实体清单, 老范讲故事, 苹果, 谷歌, 通义, 防火墙, 阿里巴巴, 隐私保护, 韩国
德国全境禁用DeepSeek,以后这墙要反着修了吗?
大家好,欢迎收听老范讲故事的YouTube频道。2025年6月27日,德国数据保护专员梅克坎普宣布,已经要求苹果和谷歌从德国应用商店下架DeepSeek应用程序了。德国不是第一个,估计应该也不是最后一个。第一个是谁?意大利。意大利在每一次反对AI这件事情上,都是占第一个。原来他还反过OpenAI的ChatGPT。2025年初,也就是R1刚出来的时候,就直接给封了。
欧盟的其他国家现在是一个什么状态呢?他们比较纠结。荷兰是禁止政府手机安装DeepSeek的APP;比利时是建议公务员的手机不要安装,但是不强制;西班牙是有消费者权益组织在呼吁,政府到目前为止没有采取任何的措施;英国表示说他们在持续的监测,目前还没有做出反应。
其他的一些国家对DeepSeek是什么样的一个态度呢?加拿大所有的政府设备禁止使用DeepSeek;丹麦政府设备禁止使用,但是丹麦有5个大区里头,只有3个在执行,剩下两个还在看。
More
6 月 23
Luke FanAIGC AI vs 人工服务, AI幻觉, AI志愿填报, AI能否替代张雪峰, DeepSeek, 专业选择, 专家经验蒸馏, 个性化规划, 人工智能, 优劣势分析, 信息差, 免费与付费对比, 土木工程, 大学选择, 大模型应用, 大语言模型, 夸克, 张雪峰, 情绪价值, 教育科技, 数据迭代, 文心一言, 新闻专业, 流量入口, 用户建档, 百度, 社会影响, 老范讲故事, 考研指导, 职业规划, 腾讯, 苏州实习, 通义千问, 长期跟踪, 隐藏信息, 高考咨询, 高考家庭, 高考志愿填报
AI是不是已经可以替代张雪峰的高考志愿填报服务了呢?
大家好,欢迎收听老范讲故事的YouTube频道。最近几年,AI都在尝试帮大家填报高考志愿。现在高考志愿确实比较难以填报,2,900多所高校,1,600多个专业,未来职业到底应该怎么样去发展,这些都是需要去考量的东西。到底是选专业还是选学校,也是很多人在争论。你不强调选专业的话,填报志愿服务就没有价值了。
现在很多人看到这么多专业、这么多学校,特别是搞不清楚未来哪块云彩会下雨,也搞不清楚自己家孩子到底喜欢什么。在这种情况下,高考志愿到底怎么填?有AI这样的一个大杀器,全村最后的希望,那是不是他就可以来干这个事情?其实最近两三年都在干这个事,只是到了今年会更加的厉害一些,或者说更多的大厂冲进来。今年是阿里、百度、腾讯都冲进来帮大家去做AI志愿填报去了。
为什么今年都冲进来了呢?而且这些大厂都冲进来了,原因也很简单。第一个,AI特别是有了推理模型以后,比较擅长做这个事情,至少表面上是这样的。他为什么擅长干这个事呢?他可以快速的把信息都同步起来。你别说几千个学校、1,000多个专业了,你就算再翻10倍,他也可以快速的去进行排序和选择。而且各种有条件的筛选和推理的话,就是现在这些推理模型擅长干的。
More
6 月 11
Luke FanAIGC, Meta的故事 AI产业链, AI伦理, AI大模型, AI技术, AI投资, AI数据, AI算力, DeepSeek, FTC, H100, H800, LLaMA, Llama 4, Meta, OpenAI, Sam Altman, Scale AI, YC, 亚历山大王, 亚马逊, 华人创业, 合成数据, 商业分析, 微软, 扎克伯格, 数据垄断, 数据标注, 模型微调, 科技巨头并购, 科技行业动态, 科技评论, 美国国防部, 老范讲故事, 自动驾驶数据, 英伟达, 谷歌
Scale AI得到了Meta超过百亿美金的投资,AI圈又热闹起来了。大家好,欢迎收听老范讲故事的YouTube频道。
Scale AI这个名字怎么好像在哪听说过呢?好像有点耳熟,对吧?他呢,有一位特别传奇的CEO,或者叫创始人吧,叫华人天才少年CEO亚历山大王。当时呢,跳出来指责DeepSeek用H100的就是他。
DeepSeek R1到底是怎么训练的?引起了广泛的关注。DeepSeek自己讲呢,我使用了2,000多块的H800就完成了训练。但是亚历山大王呢,在一次接受采访的时候就出来说了,中国实验室里边拥有的H100的数量远超大家的想象,DeepSeek自己至少有5万块H100。但是这个话呢,没有实际证据,讲完了也就完了。DeepSeek跟亚历山大王之间呢,并没有就这个事情进行认真的探讨,所以这个我们把它当成一种谣传吧。
3月份呢,DeepSeek自己再次发了声明,说他们训练的都是使用的合规的GPU,也就是允许向中国出口的这些GPU。因为如果不说这个的话,美国就有可能要求说禁止使用这玩意儿。DeepSeek就讲了说,甭管是R1也好,V3也好,训练呢都是使用的H800,或者是后面的H20这些GPU训练的。
More
5 月 21
Luke FanAIGC, Apple的故事, 阿里巴巴的故事, 马云和阿里的故事 AI合作, Apple Intelligence, DeepSeek, Gemini, iPhone, Meta (LLAMA3), Momenta, OpenAI, YouTube频道, 中国市场, 中美关系, 中美科技战, 云计算, 人工智能 (AI), 众议院中国事务特别委员会, 供应链风险, 内容审查, 军民融合, 出口管制, 千问 (阿里AI), 华为, 国家安全, 地缘政治, 大语言模型 (LLM), 实体名单, 微软 (Microsoft), 情报委员会, 技术转让, 数字主权, 数据安全, 时事评论, 滴滴自动驾驶, 白宫, 百度AI, 科技分析, 科技脱钩, 美国严选, 美国制裁, 美国国会, 美国审查, 老范讲故事, 聊天机器人, 英伟达 (Nvidia), 苹果, 苹果AI中国落地, 谷歌 (Google), 财经观察, 贸易管制, 阿里巴巴
美国还在审核阿里跟苹果之间的AI合作,准备将阿里放入实体名单。这到底是怎么回事?
大家好,欢迎收听老范讲故事的YouTube频道。今天咱们来讲一讲,媒体爆料苹果跟阿里的合作一直都在接受审查,到现在也没过关。阿里传出跟苹果进行AI方面的合作之后,算是正式转换赛道,从电商转到了AI和云计算。股价呢,也有所体现。国内呢,也一直在等待可以在国内使用Apple Intelligence的那个版本,结果发现这事儿想简单了。
5月17号,《纽约时报》就出来报道了。到5月19号,彭博社再次确认,美国政府一直在审查苹果跟阿里之间的合作,认为可能是有问题的。那么到底是谁在审查呢?这个事实际上美国政府真的是从头就操碎了心。
2月份宣布的阿里巴巴宣布跟苹果进行AI合作以后,美国白宫和国会多个机构就在持续关注此事。因为美国国会甭管是参院还是众院呢,它里边是一大堆的委员会。有好几个委员会说,这事我们要关注一下,尤其是众议院中国事务特别委员会。在2025年3月的会议上,直接询问苹果的高管:“你们到底咋合作的呀?你跟我讲一讲,别被黄毛骗了呀。”国防部和情报官员呢,也对合作涉及的技术风险展开了审查。
More
5 月 14
Luke FanAIGC AGI, AI伦理, AI全球化, AI公共服务, AI医疗, AI地缘政治, AI基础设施, AI应用, AI投资, AI教育, AI本地化, AI模型定制, AI治理, AI生态, AI监管, AI竞争, AI算力, ChatGPT, DeepSeek, GPU, MGX, OpenAI, OpenAI国家计划, Oracle, Qwen通义千问, 一带一路, 专制AI, 中国AI, 中美科技战, 主权AI, 云计算, 价值观输出, 华为云, 国家AI战略, 大语言模型, 字节跳动, 山姆·奥特曼, 巨额投资, 开源AI, 数据隐私, 星际之门, 民主AI, 盟友国家, 科技霸权, 算力中心, 老范讲故事, 腾讯云, 英伟达GB200, 软银, 闭源AI, 阿里云, 霸权AI, 黄仁勋
OpenAI的星际之门和民主AI,到底要对抗谁呢?
大家好,欢迎收听老范讲故事的YouTube频道。山姆·奥特曼亲临德州星际之门工地,现场指导工作去了。他在德州阿比林市星际之门工地现场做了一些现场指示,这就是他们星际之门的第一期工程。项目花费呢,首期投入是1,000亿美金,未来四年共计消耗5,000亿美金。但后边的事大家就别太当真了,因为后面还有很多钱可能需要各国政府去掏,待会我们再去讲。
第一期建设呢,主要是软银掏钱。Oracle负责设计、施工和建造,所以现场拍到的照片,大家穿的小背心、安全帽上面都是写的Oracle的字样。计划部署6.4万台英伟达GB 200 GPU,首期的1.6万台英伟达GB 200 GPU应该是在今年夏天就可以完成安装,就可以投入使用了。
More
5 月 05
Luke FanAIGC, Meta的故事 2023年, 2024年, 2025年预测, AI Agent, AIGC (AI Generated Content), AI发展, AI战略, Anthropic, API服务, ChatGPT, DeepSeek, Facebook, Gemini, Google, GPT-4o, Grok, Groq, LLaMA, LLAMA API, LLAMA Con, LLAMA发布历史, Meta, Meta AI APP, OpenAI, Qwen (通义千问), XAI (马斯克), 云计算, 亚马逊云, 产品体验, 人工智能, 元宇宙战略影响, 免费策略, 商业模式, 大语言模型 (LLM), 字节, 应用程序 (APP), 开发者大会, 开源模型, 微软云, 战略失误, 战略惯性, 扎克伯格, 扎克伯格 (Mark Zuckerberg), 技术社区, 播客内容, 智能眼镜, 杨乐坤 (Yann LeCun), 杨乐坤观点, 模型对比, 流量入口争夺, 深度学习, 百度, 社交优势, 科技评论, 竞品分析, 老范讲故事, 腾讯, 腾讯元宝, 行业分析, 起了个大早赶了个晚集, 追赶者, 阿里, 马斯克 (Elon Musk)
Meta召开LLAMA Con开发者大会。他原来丢的这些课程,现在补还来得及吗?
大家好,欢迎收听老范讲故事的YouTube频道。4月29号,Meta召开了首届的LLAMA CON开发者大会。Meta原来是开open大会,他反正每年都会开一到两次的这种开发者大会,这是开了第二次开发者大会了。这一次呢,主要就是对LLAMA进行了一些发布。前面LLAMA4已经发布过了,而且发完了以后还翻车了。现在呢,Meta说我也要去补课了。
补什么课呢?第一个是我要出一个独立的APP智能助手,叫MetaAI APP,对标ChatGPT。另外呢,我要开始面向开发者直接提供官方的LLAMA API服务了。这块呢,还准备去跟Groq这些芯片厂商去合作去,我帮他们去部署。现在呢,LLAMA的这些服务都是免费给大家使用的,LLAMA API未来有可能会收费。
你说人家OpenAI一出ChatGPT就开始给大家提供服务,APP也出了这么长时间了。这Meta真的是起了个大早赶了个晚集,到今天才想起来说我的这些API也要为大家服务了,我的APP也要为大家服务了,还来得及来不及?
More
4 月 07
Luke FanAIGC 1000万Token上下文, 400B, AI Agent, AI应用场景, AI新闻, AI未来发展, AI模型发布, AI竞赛, AI算力, Claude 3.7, DeepSeek, FP8精度, Function Call, Gemini 2.5 Pro, GPT-4o, Grok (XAI), H100 GPU, INT4量化, Llama 3, Llama 4, Llama 4 Behemoth, Llama 4 MARVELIC, Llama 4 Scout, Llama 4发布反响平淡原因, LLM, Meta AI, Meta战略, Mixture of Experts, MOE架构, 专家模块, 中文能力提升, 人工智能, 全模态AI进展, 千问 (Qwen), 卡估值, 多模态输入, 大语言模型, 字节AI, 小模型竞争, 开源LLM对比, 开源模型, 开源模型内卷, 开源社区, 推理速度, 文本输出, 模型微调, 模型性能比较, 模型测评, 模型训练, 活跃参数, 流量入口, 知识蒸馏, 硬件要求, 端到端模型, 腾讯AI, 谷歌AI, 超级APP趋势, 长上下文, 阿里AI
Llama4发布了。这里的黎明静悄悄,没有什么响动。这是怎么回事?
大家好,欢迎收听老范讲故事的YouTube频道。一觉醒来,Llama4就发布了。扎克伯格亲自在Facebook的REELS(也就是Facebook的短视频里面)发了一条视频,说Llama4发布了,今天是Llama4日。
Llama4呢,一共是有三个版本:
第一个叫Scout(侦察兵版本),总参数1,090亿(也就是109B),活跃参数是170亿,包含16个专家模块。对的,Llama终于也放弃抵抗了,从Llama4开始变成Moe了。在Llama4之前的版本都是单一体的模型,Llama3.3还给了一个400多B的单一模型,到Llama4彻底放弃抵抗了。
现在呢,支持1,000万TOKEN这种上下文,这个是Llama4最大的一个特点。DeepSeek是64K(也就是64,000个TOKEN上下文),现在上下文比较大的Gemini大概是能到2兆(200万),Llama4直接给了一个10兆(1,000万TOKEN),这是它做的一个很创新的点。
More
Older Entries