开源巨头Meta深陷Llama 4作弊风波:高分低能引爆质疑,测试数据竟混入训练集,AI圈还能信任谁?

开源巨头Meta深陷Llama 4作弊风波:高分低能引爆质疑,测试数据竟混入训练集,AI圈还能信任谁?已关闭评论

Meta的Llama4发布之后,深陷作弊风潮。大家好,欢迎收听老范讲故事的YouTube频道。今天咱们来讲一讲Meta的Llama4被人怀疑作弊,他到底是不是真的作弊了。

前面我们做过一期视频,说Llama4发布的时候没有太大的响动,因为它出来以后发现,虽然评测还不错,但是使用起来并没有感觉比现在主流的模型强到哪去。现在不行了,负面消息传出来了,说你大模型出来的时候跑分的成绩很高,但是我们使起来不是这么回事,有点名不副实的样子,特别是编程的效果极差。

为什么大家去比较编程呢?两个原因:
第一个,去玩这些开源大模型的,一般都是程序员。
第二个,编程是一个相对来说标准比较统一的评测。你编得出来编不出来,编完了效果怎么样,这个一眼就能看出来,没法作假。你说我写个诗或者写个小说,这个玩意还有仁者见仁、智者见智的时候。这编程这个东西,对就是对,不对就是不对,或者你做完了以后它的效果有问题,一眼就能看出来。所以现在被人质疑了。

More

OpenAI绝地反击!向美国政府控诉中国AI公司DeepSeek像华为那样获得政府补贴、被政府操控,希望可以禁止美国和他们的盟友们禁用中国大模型,打不过就报告老师。

OpenAI绝地反击!向美国政府控诉中国AI公司DeepSeek像华为那样获得政府补贴、被政府操控,希望可以禁止美国和他们的盟友们禁用中国大模型,打不过就报告老师。已关闭评论

OpenAI哭诉被DeepSeek霸凌了,要求美国政府主持公道。大家好,欢迎收听老潘讲故事的YouTube频道。今天咱们来讲一讲OpenAI最近给美国政府发的这份文件里都写了点啥。OpenAI苦要去告状,他2025年3月13号向美国白宫科学技术政策办公室发了一封文件,这个文件15页,叫做《确保美国人工智能领导地位与国家安全的政策提案》。

OpenAI的政策建议呢,也不是说我今儿想起来就发了一个,这个事儿还是一个回应。它呢是对美国白宫科技政策办公室(叫OSTP)在2025年2月份发出的公众意见征询的一个回应。至于其他人是不是回应了,有可能回应了,大家没有太注意,也有可能有些大厂还没有回应。所以呢,我们可以在未来一段时间看看,是不是其他大厂也会进行回应。

它里边主要讲的是什么呢?中国AI企业主要讲的是DeepSeek,将其类比为另外一个华为,声称其存在国家控制、国家补贴、数据安全风险以及知识产权盗窃等问题。上面的一个是豆包给出的结果。然后我用OpenAI的SearchGPT,它里边呢提到了DeepSeek可能受到国家控制和国家补贴,但是呢,并没有提到华为的名字。而在Grok上面的查询结果,主要控诉的是DeepSeek蒸馏它的数据。有人用OpenAI的API开发了识别中国在海外反贼言论的一个应用,被他发现了。中国账户用OpenAI生成了西班牙语的骂美国的文章,到美国报纸上去发表。还有人用OpenAI生成简历去欺诈美国公司。这个是呃Grok查到的一些结果。

More

OpenAI完成超募融资,未来发展方向是否陷入停滞?

OpenAI完成超募融资,未来发展方向是否陷入停滞?已关闭评论

我们开始第二个故事。OpenAI完成融资,开始摆烂了吗?Day Dev Day都发了些什么奇怪的东西呢?

首先,官宣已经完成这轮融资了,是在9月底这几天官宣的。现在呢,他是实现了超募。什么叫超募?就是我原来说要募多少钱,但实际上得到的钱比这个多,就叫超募啊。他原来说我要募65亿美金,现在实际上是66亿美金,就是多1亿。也是募投后的估值,原来说的是1,500亿,但其实我相信那个数是错的。原来那1,500亿美金应该是投前估值。他现在结束这一轮投资以后的投后估值是1,570亿,所以呢,实际上多了70亿。

那你说怎么会多出70亿出来呢?这个很奇怪,你明明投了66亿,那多出4亿是什么来呢?这个呢大概率是期权池。做这种投资案的时候啊,如果你投前估值是1,500亿,那么投了66亿美金进去以后呢,他的投后估值一般应该是1,566亿。多出4亿来是会做一些其他处理。

More