4 月 09
Luke FanAIGC, Meta的故事 AI伦理, AI生成, AI评测, AI负责人辟谣, Benchmark作弊, DLIU DLIU, Llama 4, LLM, Meta, Meta AI, Meta回应, 人工智能, 作弊指控, 内部爆料, 基准测试, 大语言模型, 学术不端, 实际使用效果, 开源模型, 开源社区, 快速发布后果, 性能评估, 技术报告缺失, 数据污染, 模型蒸馏, 沃顿商学院教授, 测试集污染 (背真题), 版本不一致 (开源vs测试), 科技争议, 科技新闻, 稳定性问题, 编程能力差, 自然语言处理, 跑分作弊, 过度优化, 验证方法
Meta的Llama4发布之后,深陷作弊风潮。大家好,欢迎收听老范讲故事的YouTube频道。今天咱们来讲一讲Meta的Llama4被人怀疑作弊,他到底是不是真的作弊了。
前面我们做过一期视频,说Llama4发布的时候没有太大的响动,因为它出来以后发现,虽然评测还不错,但是使用起来并没有感觉比现在主流的模型强到哪去。现在不行了,负面消息传出来了,说你大模型出来的时候跑分的成绩很高,但是我们使起来不是这么回事,有点名不副实的样子,特别是编程的效果极差。
为什么大家去比较编程呢?两个原因:
第一个,去玩这些开源大模型的,一般都是程序员。
第二个,编程是一个相对来说标准比较统一的评测。你编得出来编不出来,编完了效果怎么样,这个一眼就能看出来,没法作假。你说我写个诗或者写个小说,这个玩意还有仁者见仁、智者见智的时候。这编程这个东西,对就是对,不对就是不对,或者你做完了以后它的效果有问题,一眼就能看出来。所以现在被人质疑了。
More
3 月 16
Luke FanAIGC 32B模型, AI产业生态, AI产业补贴, AI供应链安全, AI军备竞赛, AI创作边界, AI反欺诈, AI合理使用范围, AI商业化路径, AI国家安全评估, AI应用场景, AI开发工具包, AI战略优势, AI技术出口管制, AI技术封锁, AI推理性能, AI政策, AI模型部署, AI版权法规, AI监管政策, AI竞争格局, AI舆论战, AI芯片禁运, AI订阅服务, AI训练数据, AI霸权, API安全, B端市场竞争, ChatGPT 4O, Claude 3.7, C端用户增长, DeepSeek, Huggingface, Llama模型, OpenAI, 中美科技战, 中美贸易战, 云计算市场, 云计算服务商, 人工智能伦理, 人工智能模型, 企业级AI, 全球数据采集, 内容生成风险, 千问模型, 参数规模, 国家安全, 多语言模型, 大语言模型, 宪法AI, 开源模型, 开源社区, 开源许可证, 技术冷战, 技术去全球化, 技术民族主义, 政府科技政策, 数字主权, 数据安全, 数据殖民主义, 模型对齐, 模型微调, 模型蒸馏, 模型透明度, 欧盟GDPR, 版权争议, 特斯拉中国, 甲骨文收购, 知识产权保护, 科技公司游说, 算法战争, 美国白宫科技政策办公室, 隐私保护
OpenAI哭诉被DeepSeek霸凌了,要求美国政府主持公道。大家好,欢迎收听老潘讲故事的YouTube频道。今天咱们来讲一讲OpenAI最近给美国政府发的这份文件里都写了点啥。OpenAI苦要去告状,他2025年3月13号向美国白宫科学技术政策办公室发了一封文件,这个文件15页,叫做《确保美国人工智能领导地位与国家安全的政策提案》。
OpenAI的政策建议呢,也不是说我今儿想起来就发了一个,这个事儿还是一个回应。它呢是对美国白宫科技政策办公室(叫OSTP)在2025年2月份发出的公众意见征询的一个回应。至于其他人是不是回应了,有可能回应了,大家没有太注意,也有可能有些大厂还没有回应。所以呢,我们可以在未来一段时间看看,是不是其他大厂也会进行回应。
它里边主要讲的是什么呢?中国AI企业主要讲的是DeepSeek,将其类比为另外一个华为,声称其存在国家控制、国家补贴、数据安全风险以及知识产权盗窃等问题。上面的一个是豆包给出的结果。然后我用OpenAI的SearchGPT,它里边呢提到了DeepSeek可能受到国家控制和国家补贴,但是呢,并没有提到华为的名字。而在Grok上面的查询结果,主要控诉的是DeepSeek蒸馏它的数据。有人用OpenAI的API开发了识别中国在海外反贼言论的一个应用,被他发现了。中国账户用OpenAI生成了西班牙语的骂美国的文章,到美国报纸上去发表。还有人用OpenAI生成简历去欺诈美国公司。这个是呃Grok查到的一些结果。
More
10 月 15
Luke FanAIGC AI Agent, AIGC泡沫, AI技术发展, Anthropic, API价格, API开发, Apple Intelligence, Canvas, Cloud Artifacts, GPT-4o, iPhone 16, OpenAI融资, Real Time API, Sora世界模型, 不竞争条款, 亏损, 交通标识识别, 付费用户, 代码编辑, 使用案例, 兴盛资本, 创新停滞, 商业战略, 商业模式, 多人协作, 多人协作平台, 客服应用, 小模型, 市场竞争, 开发者日, 微软, 技术发布, 投后估值, 投资分配, 投资退出, 提示词缓存, 收入增长, 政府合作, 数据增长, 文档处理, 月活用户, 期权池, 未来预测, 机器学习, 模型蒸馏, 涨价策略, 特殊目的载体, 用户体验, 盈利模式, 红杉, 编程开发, 股权激励, 苹果, 行业创新, 行业前景, 行业影响, 行业挑战, 行业衰退, 视觉微调, 认股权证, 语言学习, 语音识别, 财务预测, 超募, 软银, 领投方特权, 马斯克XAI
我们开始第二个故事。OpenAI完成融资,开始摆烂了吗?Day Dev Day都发了些什么奇怪的东西呢?
首先,官宣已经完成这轮融资了,是在9月底这几天官宣的。现在呢,他是实现了超募。什么叫超募?就是我原来说要募多少钱,但实际上得到的钱比这个多,就叫超募啊。他原来说我要募65亿美金,现在实际上是66亿美金,就是多1亿。也是募投后的估值,原来说的是1,500亿,但其实我相信那个数是错的。原来那1,500亿美金应该是投前估值。他现在结束这一轮投资以后的投后估值是1,570亿,所以呢,实际上多了70亿。
那你说怎么会多出70亿出来呢?这个很奇怪,你明明投了66亿,那多出4亿是什么来呢?这个呢大概率是期权池。做这种投资案的时候啊,如果你投前估值是1,500亿,那么投了66亿美金进去以后呢,他的投后估值一般应该是1,566亿。多出4亿来是会做一些其他处理。
More