法国AI登顶效率榜!Le Chat挑战ChatGPT,欧洲人工智能崛起还是昙花一现?受美国星际之门和中国DeepSeek刺激,法国发力AI,中国行,法国也行吗?

法国AI登顶效率榜!Le Chat挑战ChatGPT,欧洲人工智能崛起还是昙花一现?受美国星际之门和中国DeepSeek刺激,法国发力AI,中国行,法国也行吗?已关闭评论

法国AI聊天工具Le Chat在法国登到了排行榜第一名。法国AI是不是有戏了?大家好,欢迎收听老范讲故事YouTube频道。今天咱们来讲一讲这个叫Le Chat。我在讲这个故事之前,专门去向我学过法语的太太请教过了,说这个东西应该那么去念啊,最后这个t是不发音的。这个产品到底怎么样?咱们先说一说它的公司呢,其实原来我们介绍过啊,叫Mistral公司,应该算是整个欧洲拿到投资最多的一家AI公司了。

然后他们的创始人呢,原来是Deepmind的员工。他在法国受的教育,到Deepmind混了两年以后,回到法国去创业。他们大量的创始团队都是从Deepmind回来的。Deepmind被Google收购了以后,他大量的团队依然是在英国上班。所以,这帮人有可能是在美国混了一段时间,当然也有可能是在英国混了一段时间,现在在法国创业。然后他们拿到了像微软啊,英伟达等很多公司的这种投资。但是法国还有一个很有钱的人,特别喜欢投资AI啊,谁啊?就是那个LV的那个老板,也会去投资很多的AI公司。

那么这个公司呢,他们出的很多的模型,特别是开源模型,在AI圈子里头还是有很大响度的。比如说Mistral的7B啊,特别早就出来,很多人会去使用。他们出的很多这种MoE模型,也是很流行的。最早被大家所接受的MoE模型就是他们家的,比如说8X7B啊,或者是8X22B这些啊。MoE模型啊,很广泛的被使用。所以这一次呢,去问他们的创始人,说你看DeepSeek怎么样?他说哎呀,Deepseek用到的很多模型组织方式是原来我们开源出来的啊。当然最早的MoE不是他们发明的,但是Mistral在MoE整个的演化过程中还是做了非常多的贡献的。

More

李飞飞S1K模型引爆AI界:仅50美金成本完胜DeepSeek R1与ChatGPT o1!

李飞飞S1K模型引爆AI界:仅50美金成本完胜DeepSeek R1与ChatGPT o1!已关闭评论

大家好!欢迎收听老范讲故事YouTube频道。今天咱们来讲一讲李飞飞的S1K模型。50美金成本超越DeepSeek R1和ChatGPT O1。

首先呢,DeepSeek到底是怎么震惊全球的?就是因为训练成本低。他的训练成本是OpenAI的3%,所以震惊了全球。

那么现在李飞飞的S1K模型,16张H100的显卡,跑了26分钟跑完了,拿到了一个32B的模型。多项测试超越了DeepSeek R1和GPTO1。

大家要注意,评测大模型呢,它有很多很多测试项。一般我们说基本上达到什么什么水平,就属于叫互有伯仲。有些你强点,有些他强点。原来大家都超不过GPT 4O,是因为只能接近它,距离它的全项指标都有差距。现在的话,大家就已经基本上可以达到GPT 4o的水平了。

More

DeepSeek现象引发中文圈狂热:开源的胜利还是遥遥领先的争议?

DeepSeek现象引发中文圈狂热:开源的胜利还是遥遥领先的争议?已关闭评论

DeepSeek突然出圈,引发了中文圈的争吵。大家好,欢迎收听老范讲故事的YouTube频道。

DeepSeek在前面,我们已经出了一期视频,去讲它到底是怎么回事了。那么,DeepSeek最近肯定是更加的出圈。首先,DeepSeek V3,据说训练成本只有557万美金,震惊了扎克伯格,震惊了Meta。Meta说:“我们有好多的老大,他们的年薪都超过557万美金了。人家训练了个模型才用了557万美金,那我花了这么多钱去组建AI团队,花了这么多钱去囤显卡,是不是亏了?”现在就有这样的声音出来。

而且,最新的DeepSeek R1,也就是它的推理模型,推理能力已经接近o1了。蒸馏微调出来的这些小模型,已经在很多领域里头超越了o1 Mini。在这儿多补充一句,什么叫蒸馏微调的小模型?像我的电脑上,也是跑了一个DeepSeek R1-32B的模型。这个模型是怎么来的?它实际上是由DeepSeek R1去输出数据,然后拿输出的数据再去调通义千问2.5-32B的这个模型,最后得到的结果。这就是DeepSeek R1-32B,他在我的电脑上做各种推理,效果相当不错。

More

深度求索背后的创新力量︱隐士天才如何重塑中国AI未来?揭露神秘Deepseek模式!

深度求索背后的创新力量︱隐士天才如何重塑中国AI未来?揭露神秘Deepseek模式!已关闭评论

深度求索的创新模式可以复制吗?既然他能做出来,而且也让美国人愿意接受我们的这种智慧,这个事是不是可以再来一次?这个事能复制吗?

首先呢,咱们要从幻方量化开始讲起。幻方量化呢,我其实跟他还稍微打过一点点交道。我自己个人的经历是,2009年到2012年之间,就职于盛大创新院。后来大概到11年、12年这两年呢,就开始分拆,分了很多的这个子院。其中有一个院呢叫多媒体院,多媒体院的院长呢叫陆坚。他呢是浙大的本科,后来到美国去读的博士,然后去了苹果公司。就是如果你现在用Final Cut,用QuickTime,这些东西就是他写的。后来呢,他在我们那里当了两年的院长,离开盛大创新院以后呢,是LinkedIn中国的总经理,现在应该已经进入半退休状态了。

他呢是浙大的,浙大呢其实在杭州,培养了大量的图形图像相关的这种人才。当时呢,做媒体院的时候,陆坚就带进了一大批浙大的学生,做各种的图形图像处理的事情。在15年还是16年的时候,有一次跑去杭州,找很多原来盛大的老同事去吃饭,因为好多人去阿里了嘛。吃饭的时候呢,就有一位老同事约了我,说你来了我也吃个饭呗。这位老同事呢就跟我讲,说咱们做个量化交易,说我们现在干这个事。但当时他们这种量化交易呢,还是私下里边做,自己有一些钱在做一些,挣一些小钱,并没有公开对外去募资。

More

细红线转向All in AI!罗永浩春节将发布新产品,行业冥灯再临!

细红线转向All in AI!罗永浩春节将发布新产品,行业冥灯再临!已关闭评论

老罗,罗永浩这个行业冥灯又转向了,这一次号称要 All in AI,那么他能够为我们带来一些什么呢?

大家好,欢迎收听老范讲故事的 YouTube 频道。罗永浩的细红线呢,其实已经有很长一段时间没有什么声音出来了吧?他又跑回去参加什么婚丧嫁娶,去给人直播带货去了。那么最近呢,传出消息,终于要有产品跟大家见面了。 据说呢是在 2025 年春节前后,准备发布新产品。2025 年的春节的话应该是 1 月 29 号,所以呢,他有可能会在 2 月初拿出产品出来。这一次呢,就是一个 AI 产品,不再是 AR 产品了。他这个公司叫细红线,当时创建的时候号称是要去做 AR 产品和 AR 操作系统的,现在转向了。

那么这个产品的价格呢,现在不太确定, 只是说不太便宜。2024 年 4 月份,在交个朋友四周年专场直播中呢,罗永浩提到过,让粉丝们准备 199 美金跟 299 美金,这两个价格。所以呢,有可能是两款产品,一个 199 美金,一个 299 美金。 当然也有可能这一次发布的新产品跟当时他拍脑的这个价格就已经没有关系了,但是他依然表示,这一次要发布的产品呢,并不便宜。

More

xAI拿下60亿美金融资PK OpenAI,Elon Musk的AI帝国能否改变游戏规则?

xAI拿下60亿美金融资PK OpenAI,Elon Musk的AI帝国能否改变游戏规则?已关闭评论

埃隆·马斯克的 xAI 拿了 60 亿美金的投资,估值达到 500 亿美金,准备去追赶 OpenAI 了。他还追得上吗?

大家好,欢迎收听老范讲故事的 YouTube 频道。咱们今天来讲一讲 xAI 拿了 60 亿美金投资,追赶 OpenAI 的故事。这一轮的投资里面,英伟达、AMD 都在,还有一些上一轮的投资者。

大家注意,不是说谁想投资他谁就可以的,只有上一轮的投资者,才有资格去投资 xAI。还有哪些人呢?就是协助埃隆·马斯克去收购 Twitter 的这些人,他们是有资格去投资 xAI 的。但是有限制,协助埃隆·马斯克收购 Twitter 的这些人呢,占股不超过 25%。其他的说我是上一轮投资人,他是可以无限制地在里面去进行投资的。你说我这两个都没沾边,那对不起,这个事跟你没关系。

More

联想技术世界大会揭幕:全球科技巨头聚首,共话X86生态命运及AI PC演变前景。Intel与AMD握手言和,英伟达、微软、Meta、高通也都参与,很多恩怨纠结在一起

联想技术世界大会揭幕:全球科技巨头聚首,共话X86生态命运及AI PC演变前景。Intel与AMD握手言和,英伟达、微软、Meta、高通也都参与,很多恩怨纠结在一起已关闭评论

联想技术世界大会上看江湖恩怨情仇。大家好,这里是老范讲故事的YouTube频道。今天咱们来讲一讲10月15号刚刚在西雅图召开的联想技术世界大会,它叫Tech World 2024。

在这场会上,上台演讲的人呢,第一个是杨元庆,联想的老大;然后是英特尔的CEO基辛格博士;再往后是AMD的CEO苏兹风博士;再往后是英伟达的老大黄仁勋,他不是博士啊。这些人是在现场演讲的,还有一些嘉宾呢,就显得亲疏有别了,他们并没有到现场来演讲,而是发送了视频演讲,就是在现场播放了他们演讲的视频。第一个是微软的萨提亚·纳德拉,微软CEO;然后是高通的CEO克里斯蒂亚诺·安盟;最后是Meta的小扎,也在里边发表了演讲。这个是一开始没太想到的,因为Meta的小扎跟前面咱们讲的所有这些人其实没啥关系。

那么在整个的大会上呢,发表了哪些东西呢?第一个是联想自己的AI PC,以及联想自己的AI Now。AI Now是一个什么东西呢?就是联想自己的一个基于PC的AI助手。这种东西呢,其实有点像,比如说三星应用市场啊,或者是索尼应用市场,有点像类似这种东西。为什么要提到这两个产品呢?因为你想,他们三星也好,索尼也好,出的都是安卓手机,你安卓手机在海外的话,按道理说你用Google Play就完事了。但是不行,我们一定要做一个自己的应用市场,在上边去。到底有没有人用我不管了,反正我得做。

More

华为大模型演示翻车现场:time.sleep(6)真的值得大惊小怪吗?老程序员深度解析代码背后的真相!睡6秒不是什么大问题,不过图像RAG,到底是个什么坑?

华为大模型演示翻车现场:time.sleep(6)真的值得大惊小怪吗?老程序员深度解析代码背后的真相!睡6秒不是什么大问题,不过图像RAG,到底是个什么坑?已关闭评论

大家好,

欢迎收听老范讲故事的YouTube频道。今天咱们来讲一讲华为大模型演示翻车现场。

近期呢,非常多的AI相关的项目都在进行演示和发布,特别是国内。为什么它?因为时间到了。通常每年在这个时候也会有很多发布,因为每年在这个时候会开谷歌IO,大家喜欢在谷歌IO的前后进行信息的发布啊。因为谷歌IO算是全世界程序员或者开发者的一个盛会吧。那这个前后进行信息发布的话,如果它被安卓采用了,或者再跟谷歌搭上一点关系的这种技术会有更好的发展空间。

那今年呢,还有另外一个事情,就是拉玛3发布。前面其实国产很多大模型都是跟拉玛2有千丝万缕的联系。其实当时就已经预言过,我说拉玛3出来看多长时间之后,国内的大模型会争先恐后的再更新换代一波。现在呢,这个时间点就到了。前面阿里的通1,000问2.5发布,这两天还有几个,一个是零一万物的啊,叫e latch大模型发布,然后字节跳动的豆包大模型前两天也发布了啊。这豆包大模型主打的一个便宜,对别人的价格都便宜非常多,因为大模型的价格一般是按TOKEN算的啊,一般一个汉字是一个TOKEN,大概四个字母,还是几个字母的英文单词,是一个TOKEN啊,它这个算法比较奇怪。

More

Meta的开源LLama3再度颠覆AI技术,鼓吹闭源的李彦宏是否真的打脸了?全新70B模型震撼发布,全方位超越GPT3.5,会给整个行业带来哪些改变?

Meta的开源LLama3再度颠覆AI技术,鼓吹闭源的李彦宏是否真的打脸了?全新70B模型震撼发布,全方位超越GPT3.5,会给整个行业带来哪些改变?已关闭评论

大家好,欢迎收听老范讲故事YouTube频道。今天咱们来讲第一个故事。

Llama3发布了,李彦宏是不是被打脸了呢?Llama3突然发布,又是一个遥遥领先。它呢,发布了8B和70B的两个版本。8B就是80亿参数,70B呢就是700亿参数。8B的,我其实已经试过了,就在本地已经装上了。这个某些方面,接近了原来,或者超过了原来的Llama2的70B。包括一些咱们在本地跑的这种30多B的,这种就是300多亿参数的模型,它已经都超过了。而且速度还飞快。

啊,70B呢,据说已经超越了cloud 3的中量级模型。Note 3是有三个模型的:一个是特别微小的,就是可以在手机上跑;一个是中等量级的,是可以在PC本地跑的;然后还有一个是那种特别大的,特别大的,是可以对标GPT4的。70B的基本上已经超过这个中等量级了,也超越了GMINI 1.5 Pro。现在大家想去试GMINI 1.5 Pro的,可以到AI studio.google.com上去试,那个是可以免费用的。也超越了现在70B发布出来的版本。普遍他们自己讲的是超越了GPT3.5,但是呢,还达不到GPT4。这在所有测试数据上都是这样。我相信梅塔应该不会像咱们似的,专门做一些调优以后去跑分,不像咱们这么无聊。

More