4 月 07
Luke FanAIGC 1000万Token上下文, 400B, AI Agent, AI应用场景, AI新闻, AI未来发展, AI模型发布, AI竞赛, AI算力, Claude 3.7, DeepSeek, FP8精度, Function Call, Gemini 2.5 Pro, GPT-4o, Grok (XAI), H100 GPU, INT4量化, Llama 3, Llama 4, Llama 4 Behemoth, Llama 4 MARVELIC, Llama 4 Scout, Llama 4发布反响平淡原因, LLM, Meta AI, Meta战略, Mixture of Experts, MOE架构, 专家模块, 中文能力提升, 人工智能, 全模态AI进展, 千问 (Qwen), 卡估值, 多模态输入, 大语言模型, 字节AI, 小模型竞争, 开源LLM对比, 开源模型, 开源模型内卷, 开源社区, 推理速度, 文本输出, 模型微调, 模型性能比较, 模型测评, 模型训练, 活跃参数, 流量入口, 知识蒸馏, 硬件要求, 端到端模型, 腾讯AI, 谷歌AI, 超级APP趋势, 长上下文, 阿里AI
Llama4发布了。这里的黎明静悄悄,没有什么响动。这是怎么回事?
大家好,欢迎收听老范讲故事的YouTube频道。一觉醒来,Llama4就发布了。扎克伯格亲自在Facebook的REELS(也就是Facebook的短视频里面)发了一条视频,说Llama4发布了,今天是Llama4日。
Llama4呢,一共是有三个版本:
第一个叫Scout(侦察兵版本),总参数1,090亿(也就是109B),活跃参数是170亿,包含16个专家模块。对的,Llama终于也放弃抵抗了,从Llama4开始变成Moe了。在Llama4之前的版本都是单一体的模型,Llama3.3还给了一个400多B的单一模型,到Llama4彻底放弃抵抗了。
现在呢,支持1,000万TOKEN这种上下文,这个是Llama4最大的一个特点。DeepSeek是64K(也就是64,000个TOKEN上下文),现在上下文比较大的Gemini大概是能到2兆(200万),Llama4直接给了一个10兆(1,000万TOKEN),这是它做的一个很创新的点。
More
3 月 16
Luke FanAIGC 32B模型, AI产业生态, AI产业补贴, AI供应链安全, AI军备竞赛, AI创作边界, AI反欺诈, AI合理使用范围, AI商业化路径, AI国家安全评估, AI应用场景, AI开发工具包, AI战略优势, AI技术出口管制, AI技术封锁, AI推理性能, AI政策, AI模型部署, AI版权法规, AI监管政策, AI竞争格局, AI舆论战, AI芯片禁运, AI订阅服务, AI训练数据, AI霸权, API安全, B端市场竞争, ChatGPT 4O, Claude 3.7, C端用户增长, DeepSeek, Huggingface, Llama模型, OpenAI, 中美科技战, 中美贸易战, 云计算市场, 云计算服务商, 人工智能伦理, 人工智能模型, 企业级AI, 全球数据采集, 内容生成风险, 千问模型, 参数规模, 国家安全, 多语言模型, 大语言模型, 宪法AI, 开源模型, 开源社区, 开源许可证, 技术冷战, 技术去全球化, 技术民族主义, 政府科技政策, 数字主权, 数据安全, 数据殖民主义, 模型对齐, 模型微调, 模型蒸馏, 模型透明度, 欧盟GDPR, 版权争议, 特斯拉中国, 甲骨文收购, 知识产权保护, 科技公司游说, 算法战争, 美国白宫科技政策办公室, 隐私保护
OpenAI哭诉被DeepSeek霸凌了,要求美国政府主持公道。大家好,欢迎收听老潘讲故事的YouTube频道。今天咱们来讲一讲OpenAI最近给美国政府发的这份文件里都写了点啥。OpenAI苦要去告状,他2025年3月13号向美国白宫科学技术政策办公室发了一封文件,这个文件15页,叫做《确保美国人工智能领导地位与国家安全的政策提案》。
OpenAI的政策建议呢,也不是说我今儿想起来就发了一个,这个事儿还是一个回应。它呢是对美国白宫科技政策办公室(叫OSTP)在2025年2月份发出的公众意见征询的一个回应。至于其他人是不是回应了,有可能回应了,大家没有太注意,也有可能有些大厂还没有回应。所以呢,我们可以在未来一段时间看看,是不是其他大厂也会进行回应。
它里边主要讲的是什么呢?中国AI企业主要讲的是DeepSeek,将其类比为另外一个华为,声称其存在国家控制、国家补贴、数据安全风险以及知识产权盗窃等问题。上面的一个是豆包给出的结果。然后我用OpenAI的SearchGPT,它里边呢提到了DeepSeek可能受到国家控制和国家补贴,但是呢,并没有提到华为的名字。而在Grok上面的查询结果,主要控诉的是DeepSeek蒸馏它的数据。有人用OpenAI的API开发了识别中国在海外反贼言论的一个应用,被他发现了。中国账户用OpenAI生成了西班牙语的骂美国的文章,到美国报纸上去发表。还有人用OpenAI生成简历去欺诈美国公司。这个是呃Grok查到的一些结果。
More
4 月 23
Luke FanAIGC, OpenSource 70 billion parameters, 70B模型, AI Security, AI多语言处理, AI安全性, AI技术, Artificial Intelligence, Baidu, ChatGPT, Claude, Facebook, GPT3.5, GPT4, Instagram, Li Yanhong, LLama2, LLama3, Meta, Multilingual AI, OpenAI, Tech Innovation, Technology Breakthrough, WhatsApp, 业界影响, 人工智能, 大语言模型, 开源AI, 扎克伯格, 技术突破, 技术讨论, 文心一言, 李彦宏, 百度, 科技创新, 通义千问
大家好,欢迎收听老范讲故事YouTube频道。今天咱们来讲第一个故事。
Llama3发布了,李彦宏是不是被打脸了呢?Llama3突然发布,又是一个遥遥领先。它呢,发布了8B和70B的两个版本。8B就是80亿参数,70B呢就是700亿参数。8B的,我其实已经试过了,就在本地已经装上了。这个某些方面,接近了原来,或者超过了原来的Llama2的70B。包括一些咱们在本地跑的这种30多B的,这种就是300多亿参数的模型,它已经都超过了。而且速度还飞快。
啊,70B呢,据说已经超越了cloud 3的中量级模型。Note 3是有三个模型的:一个是特别微小的,就是可以在手机上跑;一个是中等量级的,是可以在PC本地跑的;然后还有一个是那种特别大的,特别大的,是可以对标GPT4的。70B的基本上已经超过这个中等量级了,也超越了GMINI 1.5 Pro。现在大家想去试GMINI 1.5 Pro的,可以到AI studio.google.com上去试,那个是可以免费用的。也超越了现在70B发布出来的版本。普遍他们自己讲的是超越了GPT3.5,但是呢,还达不到GPT4。这在所有测试数据上都是这样。我相信梅塔应该不会像咱们似的,专门做一些调优以后去跑分,不像咱们这么无聊。
More
Newer Entries