法国AI登顶效率榜!Le Chat挑战ChatGPT,欧洲人工智能崛起还是昙花一现?受美国星际之门和中国DeepSeek刺激,法国发力AI,中国行,法国也行吗?

法国AI登顶效率榜!Le Chat挑战ChatGPT,欧洲人工智能崛起还是昙花一现?受美国星际之门和中国DeepSeek刺激,法国发力AI,中国行,法国也行吗?已关闭评论

法国AI聊天工具Le Chat在法国登到了排行榜第一名。法国AI是不是有戏了?大家好,欢迎收听老范讲故事YouTube频道。今天咱们来讲一讲这个叫Le Chat。我在讲这个故事之前,专门去向我学过法语的太太请教过了,说这个东西应该那么去念啊,最后这个t是不发音的。这个产品到底怎么样?咱们先说一说它的公司呢,其实原来我们介绍过啊,叫Mistral公司,应该算是整个欧洲拿到投资最多的一家AI公司了。

然后他们的创始人呢,原来是Deepmind的员工。他在法国受的教育,到Deepmind混了两年以后,回到法国去创业。他们大量的创始团队都是从Deepmind回来的。Deepmind被Google收购了以后,他大量的团队依然是在英国上班。所以,这帮人有可能是在美国混了一段时间,当然也有可能是在英国混了一段时间,现在在法国创业。然后他们拿到了像微软啊,英伟达等很多公司的这种投资。但是法国还有一个很有钱的人,特别喜欢投资AI啊,谁啊?就是那个LV的那个老板,也会去投资很多的AI公司。

那么这个公司呢,他们出的很多的模型,特别是开源模型,在AI圈子里头还是有很大响度的。比如说Mistral的7B啊,特别早就出来,很多人会去使用。他们出的很多这种MoE模型,也是很流行的。最早被大家所接受的MoE模型就是他们家的,比如说8X7B啊,或者是8X22B这些啊。MoE模型啊,很广泛的被使用。所以这一次呢,去问他们的创始人,说你看DeepSeek怎么样?他说哎呀,Deepseek用到的很多模型组织方式是原来我们开源出来的啊。当然最早的MoE不是他们发明的,但是Mistral在MoE整个的演化过程中还是做了非常多的贡献的。

More

中国AI力量崛起:DeepSeek如何成为国运级创新的代表,搅动全球AI格局?

中国AI力量崛起:DeepSeek如何成为国运级创新的代表,搅动全球AI格局?已关闭评论

第二个故事:DeepSeek到底是不是国运级的创新呢?国运级创新这个事呢,是游戏科学的创始人兼CEO冯骥他去讲的。DeepSeek是一个国运级的创新。游戏科学,就是黑神话悟空的这个开发商。DeepSeek呢,也确实让美股市值蒸发了很多很多钱。而且还有一位美国的参议员说:“我们要下最严格的法令来禁止DeepSeek。谁敢下载DeepSeek判20年,哪个企业敢去用DeepSeek罚1亿美金。”

这个是个共和党参议员叫Josh Holy,写了一个法案,叫2025年美国人工智能能力与中国脱钩法案。禁止技术交流与使用,禁止美国公民、企业与中国开展任何AI技术合作,包括研发、投资、数据共享等。非美国公民若涉及技术转移,可以驱逐出境。然后切断资本与人才流动,禁止美国资本对中国AI企业投资,并限制美籍科研人员参与中国AI项目。任何与中国高效实验室合作的美国机构将面临重罚。违反本法案的个人将被视为严重犯罪分子,可能影响其移民身份、绿卡申请和入籍资格。美国公司不能直接或间接向中国企业提供AI技术支持或者服务。但是这个法案呢,因为太过极端已经被搁置了。

先讲一下使用DeepSeek的方式到底是什么样的。如果你在美国使用DeepSeek,那千万千万不要去DeepSeek网去挂,那是根本得不到服务的。最好是什么呢?就是去在美国的云主机上去使用。现在DeepSeek自己的网站基本上是半瘫痪状态,聊两句就趴菜。我基本上是第一句能聊,第二句能聊,第三句你再怎么跟他聊都趴。他是这样的一个状态。你可能明天再跟他聊,还可以聊两句。API调用的话非常非常慢。而且呢,现在禁止充值了。整个春节期间,API调用的这个页面就打不开了,把整个API后台给你封掉了。现在的话是后台重新有了,但是不允许充值。现在呢,国内是各种云上都有,国内的是阿里云、腾讯云、华为云。华为云的DeepSeek呢。

More

Figure AI与OpenAI分道扬镳,难道是因为DeepSeek吗?深挖背后原因:具身智能的端到端大模型、机器人自主创新赛道如何博弈?

Figure AI与OpenAI分道扬镳,难道是因为DeepSeek吗?深挖背后原因:具身智能的端到端大模型、机器人自主创新赛道如何博弈?已关闭评论

Figure突然官宣放弃跟OpenAI的合作,这到底是一个什么样的事情?大家好,欢迎收听老范讲故事的YouTube频道。Figure的老板突然发了一条推特,他的老板叫布雷特·阿德柯克,后边我们就不再重复他老板的名字了。这公司干嘛呢?这公司做机器人的。去年,Figure 01和Figure 02的演示还是引起了很大的轰动的。现在他就讲了自己要去研发端到端的大模型了。机器人公司必须要拥有自己的端到端大模型,说我们的模型一定不是外包的,就像我们的硬件不是外包的一样,我们一定要自己做,要自力更生了。

这个也是别人一开源,他就自主创新,自主知识产权去了。谁开源了?DeepSeek V3开源了,DeepSeek R1开源了。除了说我不再去跟OpenAI合作之外,还讲了什么呢?我现在已经开始去做自主的知识产权的端到端大模型了,30天之后就可以给大家看成果了,绝对吓到你们。然后开始招聘,现在还需要什么什么样的人,具身智能的工程师,快来上班吧。未来4年准备要交付10万台机器人,这个呢,应该是对着马斯克去的。马斯克说2025年要造1万台擎天柱,到特斯拉的工厂里去打工。他说我今年造1万台有点费劲,但是我未来4年造10万台,气势上不能输给你。

未来的机器人呢,他是准备用在商业和家庭两个方面的。马斯克的擎天柱目前应该主要还是在工厂里打螺丝的,但是Figure的机器人呢,商业上第一个制造业也是工厂里打螺丝,他要去的。然后仓储物流,就是可以到仓库里去搬东西,以及零售导购,这个其实已经接近于家用了,就是他已经跟人很近了。他可以在商场里头卖东西。家用呢,Figure 01第一个演示的就是煮咖啡,给你演示一下这个咖啡是怎么用的,应该是用的一个胶囊咖啡机吧。他就跟着你去学,学完了以后就会煮咖啡了。然后呢,还要学会洗衣服、整理房间以及遛狗。遛狗我觉得应该不是一个特别难的事情吧。

More

软银OpenAI日本公司背后的资本阳谋——5,000亿星际之门是如何影响全球AI格局的?

软银OpenAI日本公司背后的资本阳谋——5,000亿星际之门是如何影响全球AI格局的?已关闭评论

SB OpenAI日本公司宣布成立,这怎么听怎么像是在骂人呢?大家好,欢迎收听老范讲故事的YouTube频道。今天咱们来讲一讲SB OpenAI日本公司到底是一个什么样的情况。

孙正义上台宣布Softbank OpenAI Japan这个公司成立了,所以这个SB不是骂人,它是软银Softbank的意思。今年我们发现OpenAI的声音连续不断,这是为什么呢?原因也很简单,老大的位置不是很稳固了。你要想在这一个行业里面当老大,要么你技术特别好大家都服气,比如像谷歌这样的,各个行业里头,只要跟计算机技术有关的,大家都知道谷歌的技术最好;要不然你垄断,比如像苹果这样,或者像Meta这样的,在社交媒体里我直接垄断了,大家知道你是老大。

如果技术也被人质疑了,花了好多钱训练出一堆模型来,别人也都可以达到了Claude 3.5、Sonnet、Gemini 2.0、Flash这样的模型,其实现在已经跟GPT-4相差仿佛了。你新发布了一大堆乱七八糟的模型呢,都是很小众的高端产品,对于大众来说无感。在这种情况下,你的技术就会被人质疑。

More

DeepSeek现象引发中文圈狂热:开源的胜利还是遥遥领先的争议?

DeepSeek现象引发中文圈狂热:开源的胜利还是遥遥领先的争议?已关闭评论

DeepSeek突然出圈,引发了中文圈的争吵。大家好,欢迎收听老范讲故事的YouTube频道。

DeepSeek在前面,我们已经出了一期视频,去讲它到底是怎么回事了。那么,DeepSeek最近肯定是更加的出圈。首先,DeepSeek V3,据说训练成本只有557万美金,震惊了扎克伯格,震惊了Meta。Meta说:“我们有好多的老大,他们的年薪都超过557万美金了。人家训练了个模型才用了557万美金,那我花了这么多钱去组建AI团队,花了这么多钱去囤显卡,是不是亏了?”现在就有这样的声音出来。

而且,最新的DeepSeek R1,也就是它的推理模型,推理能力已经接近o1了。蒸馏微调出来的这些小模型,已经在很多领域里头超越了o1 Mini。在这儿多补充一句,什么叫蒸馏微调的小模型?像我的电脑上,也是跑了一个DeepSeek R1-32B的模型。这个模型是怎么来的?它实际上是由DeepSeek R1去输出数据,然后拿输出的数据再去调通义千问2.5-32B的这个模型,最后得到的结果。这就是DeepSeek R1-32B,他在我的电脑上做各种推理,效果相当不错。

More

字节跳动全面进军AI编程 | Trae抢占AI IDE市场,质量与免费就是杀手锏!剑指AI落地的最后一公里,仅限字节跳动在AI领域的野心

字节跳动全面进军AI编程 | Trae抢占AI IDE市场,质量与免费就是杀手锏!剑指AI落地的最后一公里,仅限字节跳动在AI领域的野心已关闭评论

字节跳动正式加入了AI编程大战,野心尽显。大家好,欢迎收听老范讲故事的YouTube频道。今天咱们来讲一讲AI编程的故事。

一直有人在跟我讲一个话题,叫什么呢?就是“我有一个idea,就差一个程序员了”。非常非常多有想法的人,他们被写程序这件事情拦截了,无法实现他们的想法。AI来了以后,这个问题得到了一部分的解决,但并没有彻底解决。

AIGC,也就是我们这一波的AI,是从哪里开始的呢?就是从写程序开始的,不是从ChatGPT开始的,也不是从MidJourney画图开始的。最早的AIGC项目,或者说被广泛传播和使用的项目,叫GitHub Copilot,就是帮助程序员写程序的。当然,这个项目并不能让那些真正的程序小白,或者说完全没有学过程序的人写出程序来,它只能帮助这些会写程序的人,或者对程序还相对比较了解的人提高编程效率。它是这样的一个工具。

More

深度求索背后的创新力量︱隐士天才如何重塑中国AI未来?揭露神秘Deepseek模式!

深度求索背后的创新力量︱隐士天才如何重塑中国AI未来?揭露神秘Deepseek模式!已关闭评论

深度求索的创新模式可以复制吗?既然他能做出来,而且也让美国人愿意接受我们的这种智慧,这个事是不是可以再来一次?这个事能复制吗?

首先呢,咱们要从幻方量化开始讲起。幻方量化呢,我其实跟他还稍微打过一点点交道。我自己个人的经历是,2009年到2012年之间,就职于盛大创新院。后来大概到11年、12年这两年呢,就开始分拆,分了很多的这个子院。其中有一个院呢叫多媒体院,多媒体院的院长呢叫陆坚。他呢是浙大的本科,后来到美国去读的博士,然后去了苹果公司。就是如果你现在用Final Cut,用QuickTime,这些东西就是他写的。后来呢,他在我们那里当了两年的院长,离开盛大创新院以后呢,是LinkedIn中国的总经理,现在应该已经进入半退休状态了。

他呢是浙大的,浙大呢其实在杭州,培养了大量的图形图像相关的这种人才。当时呢,做媒体院的时候,陆坚就带进了一大批浙大的学生,做各种的图形图像处理的事情。在15年还是16年的时候,有一次跑去杭州,找很多原来盛大的老同事去吃饭,因为好多人去阿里了嘛。吃饭的时候呢,就有一位老同事约了我,说你来了我也吃个饭呗。这位老同事呢就跟我讲,说咱们做个量化交易,说我们现在干这个事。但当时他们这种量化交易呢,还是私下里边做,自己有一些钱在做一些,挣一些小钱,并没有公开对外去募资。

More

雷军千万年薪挖AI天才少女,到底值不值?

雷军千万年薪挖AI天才少女,到底值不值?已关闭评论

雷军千万年薪挖回来的AI萝莉,到底值不值呢?大家好,欢迎收听老范讲故事的YouTube频道。今天咱们来讲一讲,雷军花了千万年薪挖回来的天才少女,到底价值几何的故事。

首先,这个消息并不是小米官方放出来的,而是证券时报等一大堆媒体报道出来的。报道出了这样的一个故事之后,肯定就会被舆论热炒。第一个,AI现在肯定是全村最靓的仔,跟AI相关的事情更容易被媒体所报道。第二个,小米跟雷军本身就是顶流,任何事情只要沾着小米,沾着雷军了,都会被过度的炒作。

现在这位AI天才少女叫罗福莉,号称是雷军亲自下场捞的人。这个事情到底有多亲自呢?不好说。很多记者也去找小米核实,问有没有这么个事情,是不是有千万年薪,雷军到底是怎么谈的这个事情呢?目前为止,小米没有给出官方确认。但是,如果千万年薪是真的,那这个事雷军必须是要签字确认的。如果不签字的话,这样高的薪水是开不出来的。

More

国内大模型价格战已打响,DeepSeek率先推出超低价服务,字节跳动的豆包大模型跟进、阿里的通义千问全线降价、百度文心一言、讯飞星火、腾讯混元等巨头纷纷跟进,新的时代开始了。

国内大模型价格战已打响,DeepSeek率先推出超低价服务,字节跳动的豆包大模型跟进、阿里的通义千问全线降价、百度文心一言、讯飞星火、腾讯混元等巨头纷纷跟进,新的时代开始了。已关闭评论

大家好,

欢迎收听老范讲故事YouTube频道。今天咱们来讲一讲国内大模型厂商,突然就变脸了,开始打价格战,而且是价格生死战。这个战争是从哪开始的?首先是有一个大模型叫deep sick,他先开始干的。原来我们使用100万TOKEN,大概也得十几二十块钱,甚至贵的也能有五六十块钱。国外的大模型经常是要到十几美金。他呢,直接来了一个啊,100万TOKEN一块钱人民币。DPC大家可能不是那么熟悉,因为他后边不是一个互联网巨头,也不是原来从互联网大厂出来的人,他后边是一个私募巨头,换方量化直接不讲武德啊,100万TOKEN一块钱人民币。

那紧随其后的呢,是豆包啊,这是字节跳动下边的大模型,直接降价到100万TOKEN 0.8元人民币。你不是一块吗,我8毛啊。然后通1,000问说那你们都降,我也来呗。我后边反正是阿里云,谁怕谁啊,最多的显卡都在我手里头,那降价啊,把通1,000问最新的千问Max千问浪什么,全都降到了一个白菜价。当然同1,000问降价的时候呢,还是用了一些小花招的啊,他把输入TOKEN跟输出TOKEN的价格分开了。什么意思?就是当你往里梳的时候,你也是算TOKEN的,当它往外吐的时候,也是算TOKEN的。就是它把往里梳的这个TOKEN的价格,降低了更多啊,往外吐的这个TOKEN呢,也在降,但是降的并没有那么多。大家能够理解,就是你往里输的内容,比如说现在有很多的大模型号称是可以输入100万字,200万字,但是他每一次输出,可能也就输出个1,000字,2,000字,他不会输出那么多的。你说一大模型坐在那,吭哧吭哧给你吐100万字出来,有人看没有?一个人坐在那阅读,读100万字也得会功夫吧。所以呢,从大模型输出的这个TOKEN稍微贵些啊。然后百度特别逗啊,百度先强调了一下,说不要关注价格,要看这个大模型的特性,以及大模型的性质,是不是适合你的场景。讲完了以后呢,左右一看说哎,你们都跑了,等等我等等我,对吧?直接把手里头两个最常用的模型,一个叫快速模型,一个是轻量级模型免费,对吧你们还要收钱吗?咱不要钱了。

More

Newer Entries