开源巨头Meta深陷Llama 4作弊风波:高分低能引爆质疑,测试数据竟混入训练集,AI圈还能信任谁?

Meta的Llama4发布之后,深陷作弊风潮。大家好,欢迎收听老范讲故事的YouTube频道。今天咱们来讲一讲Meta的Llama4被人怀疑作弊,他到底是不是真的作弊了。

前面我们做过一期视频,说Llama4发布的时候没有太大的响动,因为它出来以后发现,虽然评测还不错,但是使用起来并没有感觉比现在主流的模型强到哪去。现在不行了,负面消息传出来了,说你大模型出来的时候跑分的成绩很高,但是我们使起来不是这么回事,有点名不副实的样子,特别是编程的效果极差。

为什么大家去比较编程呢?两个原因:
第一个,去玩这些开源大模型的,一般都是程序员。
第二个,编程是一个相对来说标准比较统一的评测。你编得出来编不出来,编完了效果怎么样,这个一眼就能看出来,没法作假。你说我写个诗或者写个小说,这个玩意还有仁者见仁、智者见智的时候。这编程这个东西,对就是对,不对就是不对,或者你做完了以后它的效果有问题,一眼就能看出来。所以现在被人质疑了。

阅读更多

Llama 4悄然发布震撼不足?对比DeepSeek与千问,Meta的MOE架构和千万级上下文能否挽回开源领导地位,避免被超级APP浪潮抛弃?

Llama4发布了。这里的黎明静悄悄,没有什么响动。这是怎么回事?

大家好,欢迎收听老范讲故事的YouTube频道。一觉醒来,Llama4就发布了。扎克伯格亲自在Facebook的REELS(也就是Facebook的短视频里面)发了一条视频,说Llama4发布了,今天是Llama4日。

Llama4呢,一共是有三个版本:
第一个叫Scout(侦察兵版本),总参数1,090亿(也就是109B),活跃参数是170亿,包含16个专家模块。对的,Llama终于也放弃抵抗了,从Llama4开始变成Moe了。在Llama4之前的版本都是单一体的模型,Llama3.3还给了一个400多B的单一模型,到Llama4彻底放弃抵抗了。

现在呢,支持1,000万TOKEN这种上下文,这个是Llama4最大的一个特点。DeepSeek是64K(也就是64,000个TOKEN上下文),现在上下文比较大的Gemini大概是能到2兆(200万),Llama4直接给了一个10兆(1,000万TOKEN),这是它做的一个很创新的点。

阅读更多

Midjourney V7震撼发布:艺术巅峰细节狂魔强势回归,但面对GPT-4o的一致性与定价策略,它还是AI绘图的唯一真神吗?

MidJourney V7终于发布了,是不是王者归来了呢?

大家好,欢迎收听老范讲故事的YouTube频道。2025年,大模型进入了快速内卷期。从春节的时候,DeepSeek R1发布,打响了第一枪。前面DeepSeek V3大家还没觉得怎么样,R1一出来,第一枪打响了,大家开始卷推理、卷开源、卷免费、卷基础模型。

基础模型是什么?GPT-4.5、Claude 3.7、Gemini 2.5 Pro以及DeepSeek V30324版,这是在卷基础模型。然后大家去卷AI agent,各种deep search、deeper search或者是deep research,Manus,各种的AI agent开始卷起来。最后卷绘图,绘图应该是从GROK3开始卷起。GROK3说:“我可以不设限的让大家去画图。”算是给了大家一点点小惊喜。

Gemini 2.0 Flash直接说:“天塌了,这个以后做Photoshop的人要没饭吃了。”他对语言文字的理解和执行能力非常非常的强。你给他一个美女,给他一个包,说让美女拎着包,一致性很好。这个美女拎着这个包没有任何问题。当时大家就讲说Photoshop这帮人要失业,但是并没有引起特别大的风潮。为什么?因为Gemini 2.0 Flash画太复杂的东西是画不了的。

阅读更多

Musk下令,xAI全资收购X,左手倒右手:800亿AI巨头鲸吞330亿社交帝国,泡沫破裂前夜的疯狂操作

马斯克下令xAI收购x,终于等到了这一天。大家好,欢迎收听老范讲故事的YouTube频道。

3月29号,马斯克命令终于下达,xAI以全股票的形式收购x。现在,xAI的估值是800亿美金,x的估值是330亿美金,另外还有120亿美金的债务,等于把这个交易就做掉了。xAI以330亿美金全股票的形式收购了x。

从x到马斯克手上进行私有化之后,其实大家就在等着这一天。当时马斯克全资把Twitter收下来,后来改名为x,我们就在讲说,马斯克收购了以后做了私有化,它不再是一家上市公司。那么,马斯克就会通过各种各样的资本游戏,把它装到这个壳里,跟那个壳合并,然后包装出一个新的项目来。至于说这个项目最终是不是可以上市,那是以后的事情。

所以现在其实是马斯克左手倒右手。实际上,甭管是x还是xAI,最大的股东都是马斯克自己,他只要自己乐意,就可以来做这件事情。马斯克手上的未上市资源是很多的,而且都非常值钱,比如说像SpaceX、Neuralink脑机接口,对吧?包括今天我们讲到的x和xAI,这都是非常值钱的,应该还不是最值钱的。Neuralink值多少钱,现在不确定,但是SpaceX应该比他们两个都值钱。

阅读更多

CoreWeave上市,金融人城会玩——AI泡沫终极推手?CoreWeave上市前夕OpenAI紧急救场,英伟达的显卡租赁竟是自导自演?

CoreWeave要上市了。金融人搞AI,城会玩。大家好,欢迎收听老范讲故事的YouTube频道。什么叫城会玩呢?这实际上是个梗,叫“你们城里人真会玩”,就是使用一些非常奇葩的手段,来达到一些让大家意想不到的效果,这个叫城会玩。

首先,我们来讲一下CoreWeave的传奇创业过程。三个金融人,前华尔街对冲基金的经理,在2017年创立了Atlantic Crypto(大西洋加密货币),创建了这么一家公司。他们主要干嘛?主要是挖以太坊的,整了一大堆的显卡去挖以太坊去了。到2018年,加密货币市场崩盘后,CoreWeave于2019年收购了大量矿场破产后低价出售的GPU。他买了一堆的,这东西到手里头,还是以挖矿为主。到2019年,开始做一些其他方向的AI尝试。当然,那个时候还不是AI了,当时使用这些显卡主要是做渲染,拿它去做一些动画渲染,或者电影特效渲染。

CoreWeave转向了提供AI裸金属这样的一个服务。什么叫裸金属?我给你机房搭好了,里头什么都没有,你自己去部署系统,自己去做,想干嘛干嘛,我就不管了。他做这样的服务。其实很多挖矿的人,在这一段时间都在提供裸金属服务。他们据说是参与了《权力的游戏》的一些制作,但是去认真核实一下,《权力的游戏》的最后一季应该是2019年,所以他们应该没赶上。应该是CoreWeave在2023年,9,900万美金收购了一家叫Conductor Technology的,这是一家提供影视渲染技术的公司,有可能参与过权游项目。所以现在,CoreWeave也在讲,说我参与过权游项目。这个Conductor公司,是Autodesk公司投资的一个项目啊。这个Autodesk就是什么AutoCAD啊,什么3DS,做这些软件的老牌软件公司。

阅读更多

苹果智能Siri跳票,Apple Intelligence最大的泡泡吹破了!为iPhone16画的饼,也许要等到iPhone17才能吃上了,研发团队闭门会议泄露,承认跳票”既难看又尴尬”!

苹果智能Siri跳票,内部会议曝光,被评价为既难看又令人尴尬。这到底是怎么回事?大家好,欢迎收听老范讲故事的YouTube频道。今天咱们来跟大家讲一讲,苹果的智能Siri估计要跳票了。

从去年的WWDC上,苹果宣布说我要跟OpenAI合作,推出智能版的Siri,而不是像现在似的,你问它一下,就是我帮你查,还经常查不出来。这种Siri原来说是我计划好了,iOS 18就开始逐步的放功能出来。18出来的时候呢,这个功能其实就没怎么放出来。然后说那我放18.1,18.2,18.3吧。最后说哎算了,我们18.4吧。iOS 18.4的时候,我把这个智能Siri放出来。现在说好像也不行,我们是不是放到iOS 18.5上去。最后可能还要再跳票。

现在呢,国内的Apple Intelligence还完全没有影子呢。国外呢,也在跳票。目前的Apple Intelligence呢,有一些零散的功能已经在国外上线了,包括文字生成、语法更正、智能翻译、图片识别以及照相增强等等。但是在国内的话,我们还要稍微等一等。真正被寄予厚望的其实是AI版Siri。你问它各种问题的时候,就像是GPT-4高级语音功能这样,可以直接去聊天了。但是目前为止,这一块估计是做不出来了。

阅读更多

OpenAI与Anthropic终极对决:揭秘Responses API如何颠覆AI Agent标准之争

第二个故事:OpenAI最新发布的AI agent,是不是应该感谢Manus呢?现在大家都在讲这个事情。OpenAI又被中国人挤牙膏了,突然就宣布自己的AI agent开发套件上线了。有人在下边回复感谢Manus,好像还是一个英语回复的。

去年连续12天的无聊发布会之后,春节又赶上了DeepSeek的暴击,明显加快了发布的进程。像什么GPT4.5、GPT5的新方向,AI agent的各种工具,它当时发布的还不是开发者工具,当时发布的是使用者工具,给它的200美元一个月的Pro账号用的这些工具,包括operator、deep research和task。到目前为止,我应该还不能用operator,其他的都可以用了。这些呢,都是今年OpenAI发出来的东西。他也在思考到底是不是要开源,目前还在纠结。

现在呢,又被Manus给输出了一把。Manus到底怎么样咱们不去管呢,但是呢Manus肯定对他还是有压力的。如果没有前面Deepsick R1的输出的话,OpenAI大概压根就不会看Manus一眼。但是现在有了Deepsick了,中国人到底干什么,他还是要稍微认真看一下了。Manus的发布让业界看到了AI agent的另外一种可能性。真正对OpenAI agent的领导地位所造成威胁的并不是Manus,而是另外一个东西,是Anthropic的MCP协议。这个东西已经快要成为事实标准了。因为在这儿呢,不可能真的谁说咱们坐下来定个标准吧。在这么快速发展的行业里头,一定是谁跑得最前头,谁用得最多,谁成为事实标准。现在Anthropic的MCP,随着Manus的爆火快速地,在成为事实标准的这条路上狂奔。OpenAI说这个事是不能忍的,我必须得把这个东西抢回来,我是行业老大,标准必须我说了算。所以这是他这次发布AI agent开发工具包的一个核心原因。这个是标准之争,是agent SDK和MCP之间的竞争。Manus在里边算是一个催化剂,也起作用了,但是呢,起到的并不是根本作用。

阅读更多

AI生成内容戴上紧箍咒:四部门新规如何从雷军骂人视频到全网追责?

国家发文件了,以后AI生成的内容再也不可以“裸奔”了,必须要进行标注。这到底是一个什么样的事情?大家好,欢迎收听老范讲故事的YouTube频道。

今年两会期间,雷军讲了个冷笑话。什么样的冷笑话呢?说去年十一放假7天,大家在家里头被雷军骂了8天。什么意思呢?很多人用雷军的形象和声音,生成了数字人的骂人视频。十一期间,法务部都放假了,但是大家又在家里没事干,刷短视频刷到的都是雷军四处骂人,骂了友商,社会事情全都骂了一遍。

雷军呢,一开始说:“我觉得骂就骂吧,我也贡献出形象来,让大家去娱乐一下也没什么。”骂了几天以后呢,觉得不对劲了:“你天天拿我的脸,拿我的声音出去骂人,这个受不了,所以还是要管一管。”

雷军呢,有两个很重要的提案。一个呢是改这绿牌儿,他觉得这个新能源车的绿牌儿实在太难看了:“我造了50多万的小米速汽Ultra,这么漂亮的车,你给我挂这么恶心的牌子上去,实在太难看了,咱们能不能改一改?”另外一个呢就是要管理AI生成内容,不能再发生这种国庆放7天假,被雷军骂8天这种事情。

阅读更多

OpenAI绝地反击!向美国政府控诉中国AI公司DeepSeek像华为那样获得政府补贴、被政府操控,希望可以禁止美国和他们的盟友们禁用中国大模型,打不过就报告老师。

OpenAI哭诉被DeepSeek霸凌了,要求美国政府主持公道。大家好,欢迎收听老潘讲故事的YouTube频道。今天咱们来讲一讲OpenAI最近给美国政府发的这份文件里都写了点啥。OpenAI苦要去告状,他2025年3月13号向美国白宫科学技术政策办公室发了一封文件,这个文件15页,叫做《确保美国人工智能领导地位与国家安全的政策提案》。

OpenAI的政策建议呢,也不是说我今儿想起来就发了一个,这个事儿还是一个回应。它呢是对美国白宫科技政策办公室(叫OSTP)在2025年2月份发出的公众意见征询的一个回应。至于其他人是不是回应了,有可能回应了,大家没有太注意,也有可能有些大厂还没有回应。所以呢,我们可以在未来一段时间看看,是不是其他大厂也会进行回应。

它里边主要讲的是什么呢?中国AI企业主要讲的是DeepSeek,将其类比为另外一个华为,声称其存在国家控制、国家补贴、数据安全风险以及知识产权盗窃等问题。上面的一个是豆包给出的结果。然后我用OpenAI的SearchGPT,它里边呢提到了DeepSeek可能受到国家控制和国家补贴,但是呢,并没有提到华为的名字。而在Grok上面的查询结果,主要控诉的是DeepSeek蒸馏它的数据。有人用OpenAI的API开发了识别中国在海外反贼言论的一个应用,被他发现了。中国账户用OpenAI生成了西班牙语的骂美国的文章,到美国报纸上去发表。还有人用OpenAI生成简历去欺诈美国公司。这个是呃Grok查到的一些结果。

阅读更多