鲶鱼效应搅翻AI江湖:DeepSeek 671B开源来袭,GPT-5和百度文心一言迎巨大挑战!

鲶鱼效应搅翻AI江湖:DeepSeek 671B开源来袭,GPT-5和百度文心一言迎巨大挑战!已关闭评论

大家好,欢迎收听老范讲故事的YouTube频道。今天咱们来讲一讲DeepSeek。这条鲶鱼搅浑了水,GPT5要来了,百度也要免费开源了,到底是一个什么样的情况?大模型这个赛道未来会怎么去发展?

DeepSeek呢,算是彻底改变了游戏规则。OpenAI给整个行业挖的坑,到现在呢,还有一些公司没查出来呢。什么坑?就是客户端这个订阅20美金一个月这个坑。这个其实是一个非常失败的商业模式。谷歌到现在还在往外爬,因为谷歌他其实自己不太想爬出来。为什么?因为他一旦爬出来以后的话,谷歌搜索的广告收入就没了,只能在那里头装聋作哑了。Perplexity到现在也还在思考,到底是不是要爬出来。

大家有没有想过一个问题?开源模型,因为DeepSeek是满血版671B的开源模型,它对于OpenAI的伤害,到底是ToB的伤害大,还是ToC的伤害大?这是一个大家值得去思考的事情。虽然现在DeepSeek在很多的C端有非常大的影响力,就是很多的个人去下载这个东西去用去,但其实真正的开源模型影响最大的是B端。我这是一个自己的公司,我是一个政府项目,或者是一个什么样的商业相关的事情,我要去使用大模型的时候,一定是会优先去选择这种完全可控的开源模型,而不是说我去用人家的闭源的,买人家API。因为你一旦是有开源模型的话,你就可以选择完全私有部署,我自己买台服务器往里装就完了。

More

深度求索满血版DeepSeek全攻略|教你快速上手火山方舟与Cherry Studio部署方法,没有搜索的DeepSeek,不是完整的DeepSeek。

深度求索满血版DeepSeek全攻略|教你快速上手火山方舟与Cherry Studio部署方法,没有搜索的DeepSeek,不是完整的DeepSeek。已关闭评论

真正满血版的DeepSeek到底应该怎么用?在官网基本趴菜的情况下,我们是不是还可以使用到真正满血版的DeepSeek?有什么简单一点的方式可以让普通人用吗?这就是今天要讲的事情。

大家好,欢迎收听老范讲故事的YouTube频道。今天我们会先介绍一下什么是满血版DeepSeek,为什么要放弃本地部署,以及官网现状替代方案。今天的替代方案是火山方舟平台的替代方案。这个是字节跳动下面的,这个是目前为止相对来说比较均衡的一个方案。为什么?你比如像硅基流动,配置是相对来说比较简单的,但是实在是很慢。你使用的时候非常的不流畅,而且经常没有办法得到完整的答案。所以我现在基本上放弃了硅基流动这个平台,现在主要是使用方舟平台。方舟平台跟其他的像什么阿里云、腾讯云比起来,虽然都是云计算平台,但是配置起来相对还没有那么复杂。因为越是云计算平台的配置越麻烦。

讲完了这个方舟平台之后,我们要讲一下Cherry Studio啊。这个是目前普通人可以使用的比较简单的AI辅助工具。因为现在绝大部分的AI辅助工具都是网页。你让一个没有学过电脑的人去部署网页,去部署一个网站,还是挺麻烦的。有这个客户端,Cherry Studio就是Windows和Mac OS的一个客户端,下载下来就直接可以用。这个要相对来说简单很多。

More

DeepSeek掀起全球AI军备竞赛,OpenAI、Anthropic、SSI、都宣布新融资,从投资人角度给大家解析其中的投资圈儿黑话。

DeepSeek掀起全球AI军备竞赛,OpenAI、Anthropic、SSI、都宣布新融资,从投资人角度给大家解析其中的投资圈儿黑话。已关闭评论

DeepSeek掀起了全球AI军备竞赛。大家好,欢迎收听老范讲故事的YouTube频道。DeepSeek真的算是擦枪走火,带来了全球点燃的一个效果。其实,2023年和2024年,AI相关的融资就已经算是村里最靓的仔了。其他行业都没有AI投融资这么火爆,但是DeepSeek直接点燃了,带来了这种链式反应。一般讲链式反应,都是原子弹那个玩意儿才玩呢。2025年初直接燃爆了,各种AI融资事件快速爆发。我们现在能够知道的大型AI公司都在融资,都在加大投入。

今天,从投资人的角度,帮大家稍微盘点一下目前比较热的几个投资案例,也把一些投资人行业里边的黑话用大家能够尽量搞明白的方式讲一遍。首先讲的第一个案例就是百度风投没有投中DeepSeek这个事。很多人说,你看百度风投就在DeepSeek北京的楼上,这么近他都没投上,百度不行了。结果百度风投的人就跑出来说,他说我们是风投,不是投资部门。

这个里头要跟大家讲一下,大型的像BAT这些,它下边的投资机构是非常多的。它有公司的内部投资部,有外边挂名的风投。差异在哪?外边挂名的风投,你虽然挂在百度名,百度可能也出钱了,但是相对来说会更独立一些。他们赚了赔了,对于百度整个的财报影响并没有那么重要。他们当然也不会像百度内部的投资部那样,直接冲上去把一个项目收购下来。他们更多的是要去赚这个基金的钱。

More

法国AI登顶效率榜!Le Chat挑战ChatGPT,欧洲人工智能崛起还是昙花一现?受美国星际之门和中国DeepSeek刺激,法国发力AI,中国行,法国也行吗?

法国AI登顶效率榜!Le Chat挑战ChatGPT,欧洲人工智能崛起还是昙花一现?受美国星际之门和中国DeepSeek刺激,法国发力AI,中国行,法国也行吗?已关闭评论

法国AI聊天工具Le Chat在法国登到了排行榜第一名。法国AI是不是有戏了?大家好,欢迎收听老范讲故事YouTube频道。今天咱们来讲一讲这个叫Le Chat。我在讲这个故事之前,专门去向我学过法语的太太请教过了,说这个东西应该那么去念啊,最后这个t是不发音的。这个产品到底怎么样?咱们先说一说它的公司呢,其实原来我们介绍过啊,叫Mistral公司,应该算是整个欧洲拿到投资最多的一家AI公司了。

然后他们的创始人呢,原来是Deepmind的员工。他在法国受的教育,到Deepmind混了两年以后,回到法国去创业。他们大量的创始团队都是从Deepmind回来的。Deepmind被Google收购了以后,他大量的团队依然是在英国上班。所以,这帮人有可能是在美国混了一段时间,当然也有可能是在英国混了一段时间,现在在法国创业。然后他们拿到了像微软啊,英伟达等很多公司的这种投资。但是法国还有一个很有钱的人,特别喜欢投资AI啊,谁啊?就是那个LV的那个老板,也会去投资很多的AI公司。

那么这个公司呢,他们出的很多的模型,特别是开源模型,在AI圈子里头还是有很大响度的。比如说Mistral的7B啊,特别早就出来,很多人会去使用。他们出的很多这种MoE模型,也是很流行的。最早被大家所接受的MoE模型就是他们家的,比如说8X7B啊,或者是8X22B这些啊。MoE模型啊,很广泛的被使用。所以这一次呢,去问他们的创始人,说你看DeepSeek怎么样?他说哎呀,Deepseek用到的很多模型组织方式是原来我们开源出来的啊。当然最早的MoE不是他们发明的,但是Mistral在MoE整个的演化过程中还是做了非常多的贡献的。

More

中国AI力量崛起:DeepSeek如何成为国运级创新的代表,搅动全球AI格局?

中国AI力量崛起:DeepSeek如何成为国运级创新的代表,搅动全球AI格局?已关闭评论

第二个故事:DeepSeek到底是不是国运级的创新呢?国运级创新这个事呢,是游戏科学的创始人兼CEO冯骥他去讲的。DeepSeek是一个国运级的创新。游戏科学,就是黑神话悟空的这个开发商。DeepSeek呢,也确实让美股市值蒸发了很多很多钱。而且还有一位美国的参议员说:“我们要下最严格的法令来禁止DeepSeek。谁敢下载DeepSeek判20年,哪个企业敢去用DeepSeek罚1亿美金。”

这个是个共和党参议员叫Josh Holy,写了一个法案,叫2025年美国人工智能能力与中国脱钩法案。禁止技术交流与使用,禁止美国公民、企业与中国开展任何AI技术合作,包括研发、投资、数据共享等。非美国公民若涉及技术转移,可以驱逐出境。然后切断资本与人才流动,禁止美国资本对中国AI企业投资,并限制美籍科研人员参与中国AI项目。任何与中国高效实验室合作的美国机构将面临重罚。违反本法案的个人将被视为严重犯罪分子,可能影响其移民身份、绿卡申请和入籍资格。美国公司不能直接或间接向中国企业提供AI技术支持或者服务。但是这个法案呢,因为太过极端已经被搁置了。

先讲一下使用DeepSeek的方式到底是什么样的。如果你在美国使用DeepSeek,那千万千万不要去DeepSeek网去挂,那是根本得不到服务的。最好是什么呢?就是去在美国的云主机上去使用。现在DeepSeek自己的网站基本上是半瘫痪状态,聊两句就趴菜。我基本上是第一句能聊,第二句能聊,第三句你再怎么跟他聊都趴。他是这样的一个状态。你可能明天再跟他聊,还可以聊两句。API调用的话非常非常慢。而且呢,现在禁止充值了。整个春节期间,API调用的这个页面就打不开了,把整个API后台给你封掉了。现在的话是后台重新有了,但是不允许充值。现在呢,国内是各种云上都有,国内的是阿里云、腾讯云、华为云。华为云的DeepSeek呢。

More

Figure AI与OpenAI分道扬镳,难道是因为DeepSeek吗?深挖背后原因:具身智能的端到端大模型、机器人自主创新赛道如何博弈?

Figure AI与OpenAI分道扬镳,难道是因为DeepSeek吗?深挖背后原因:具身智能的端到端大模型、机器人自主创新赛道如何博弈?已关闭评论

Figure突然官宣放弃跟OpenAI的合作,这到底是一个什么样的事情?大家好,欢迎收听老范讲故事的YouTube频道。Figure的老板突然发了一条推特,他的老板叫布雷特·阿德柯克,后边我们就不再重复他老板的名字了。这公司干嘛呢?这公司做机器人的。去年,Figure 01和Figure 02的演示还是引起了很大的轰动的。现在他就讲了自己要去研发端到端的大模型了。机器人公司必须要拥有自己的端到端大模型,说我们的模型一定不是外包的,就像我们的硬件不是外包的一样,我们一定要自己做,要自力更生了。

这个也是别人一开源,他就自主创新,自主知识产权去了。谁开源了?DeepSeek V3开源了,DeepSeek R1开源了。除了说我不再去跟OpenAI合作之外,还讲了什么呢?我现在已经开始去做自主的知识产权的端到端大模型了,30天之后就可以给大家看成果了,绝对吓到你们。然后开始招聘,现在还需要什么什么样的人,具身智能的工程师,快来上班吧。未来4年准备要交付10万台机器人,这个呢,应该是对着马斯克去的。马斯克说2025年要造1万台擎天柱,到特斯拉的工厂里去打工。他说我今年造1万台有点费劲,但是我未来4年造10万台,气势上不能输给你。

未来的机器人呢,他是准备用在商业和家庭两个方面的。马斯克的擎天柱目前应该主要还是在工厂里打螺丝的,但是Figure的机器人呢,商业上第一个制造业也是工厂里打螺丝,他要去的。然后仓储物流,就是可以到仓库里去搬东西,以及零售导购,这个其实已经接近于家用了,就是他已经跟人很近了。他可以在商场里头卖东西。家用呢,Figure 01第一个演示的就是煮咖啡,给你演示一下这个咖啡是怎么用的,应该是用的一个胶囊咖啡机吧。他就跟着你去学,学完了以后就会煮咖啡了。然后呢,还要学会洗衣服、整理房间以及遛狗。遛狗我觉得应该不是一个特别难的事情吧。

More

软银OpenAI日本公司背后的资本阳谋——5,000亿星际之门是如何影响全球AI格局的?

软银OpenAI日本公司背后的资本阳谋——5,000亿星际之门是如何影响全球AI格局的?已关闭评论

SB OpenAI日本公司宣布成立,这怎么听怎么像是在骂人呢?大家好,欢迎收听老范讲故事的YouTube频道。今天咱们来讲一讲SB OpenAI日本公司到底是一个什么样的情况。

孙正义上台宣布Softbank OpenAI Japan这个公司成立了,所以这个SB不是骂人,它是软银Softbank的意思。今年我们发现OpenAI的声音连续不断,这是为什么呢?原因也很简单,老大的位置不是很稳固了。你要想在这一个行业里面当老大,要么你技术特别好大家都服气,比如像谷歌这样的,各个行业里头,只要跟计算机技术有关的,大家都知道谷歌的技术最好;要不然你垄断,比如像苹果这样,或者像Meta这样的,在社交媒体里我直接垄断了,大家知道你是老大。

如果技术也被人质疑了,花了好多钱训练出一堆模型来,别人也都可以达到了Claude 3.5、Sonnet、Gemini 2.0、Flash这样的模型,其实现在已经跟GPT-4相差仿佛了。你新发布了一大堆乱七八糟的模型呢,都是很小众的高端产品,对于大众来说无感。在这种情况下,你的技术就会被人质疑。

More

DeepSeek现象引发中文圈狂热:开源的胜利还是遥遥领先的争议?

DeepSeek现象引发中文圈狂热:开源的胜利还是遥遥领先的争议?已关闭评论

DeepSeek突然出圈,引发了中文圈的争吵。大家好,欢迎收听老范讲故事的YouTube频道。

DeepSeek在前面,我们已经出了一期视频,去讲它到底是怎么回事了。那么,DeepSeek最近肯定是更加的出圈。首先,DeepSeek V3,据说训练成本只有557万美金,震惊了扎克伯格,震惊了Meta。Meta说:“我们有好多的老大,他们的年薪都超过557万美金了。人家训练了个模型才用了557万美金,那我花了这么多钱去组建AI团队,花了这么多钱去囤显卡,是不是亏了?”现在就有这样的声音出来。

而且,最新的DeepSeek R1,也就是它的推理模型,推理能力已经接近o1了。蒸馏微调出来的这些小模型,已经在很多领域里头超越了o1 Mini。在这儿多补充一句,什么叫蒸馏微调的小模型?像我的电脑上,也是跑了一个DeepSeek R1-32B的模型。这个模型是怎么来的?它实际上是由DeepSeek R1去输出数据,然后拿输出的数据再去调通义千问2.5-32B的这个模型,最后得到的结果。这就是DeepSeek R1-32B,他在我的电脑上做各种推理,效果相当不错。

More

字节跳动全面进军AI编程 | Trae抢占AI IDE市场,质量与免费就是杀手锏!剑指AI落地的最后一公里,仅限字节跳动在AI领域的野心

字节跳动全面进军AI编程 | Trae抢占AI IDE市场,质量与免费就是杀手锏!剑指AI落地的最后一公里,仅限字节跳动在AI领域的野心已关闭评论

字节跳动正式加入了AI编程大战,野心尽显。大家好,欢迎收听老范讲故事的YouTube频道。今天咱们来讲一讲AI编程的故事。

一直有人在跟我讲一个话题,叫什么呢?就是“我有一个idea,就差一个程序员了”。非常非常多有想法的人,他们被写程序这件事情拦截了,无法实现他们的想法。AI来了以后,这个问题得到了一部分的解决,但并没有彻底解决。

AIGC,也就是我们这一波的AI,是从哪里开始的呢?就是从写程序开始的,不是从ChatGPT开始的,也不是从MidJourney画图开始的。最早的AIGC项目,或者说被广泛传播和使用的项目,叫GitHub Copilot,就是帮助程序员写程序的。当然,这个项目并不能让那些真正的程序小白,或者说完全没有学过程序的人写出程序来,它只能帮助这些会写程序的人,或者对程序还相对比较了解的人提高编程效率。它是这样的一个工具。

More

深度求索背后的创新力量︱隐士天才如何重塑中国AI未来?揭露神秘Deepseek模式!

深度求索背后的创新力量︱隐士天才如何重塑中国AI未来?揭露神秘Deepseek模式!已关闭评论

深度求索的创新模式可以复制吗?既然他能做出来,而且也让美国人愿意接受我们的这种智慧,这个事是不是可以再来一次?这个事能复制吗?

首先呢,咱们要从幻方量化开始讲起。幻方量化呢,我其实跟他还稍微打过一点点交道。我自己个人的经历是,2009年到2012年之间,就职于盛大创新院。后来大概到11年、12年这两年呢,就开始分拆,分了很多的这个子院。其中有一个院呢叫多媒体院,多媒体院的院长呢叫陆坚。他呢是浙大的本科,后来到美国去读的博士,然后去了苹果公司。就是如果你现在用Final Cut,用QuickTime,这些东西就是他写的。后来呢,他在我们那里当了两年的院长,离开盛大创新院以后呢,是LinkedIn中国的总经理,现在应该已经进入半退休状态了。

他呢是浙大的,浙大呢其实在杭州,培养了大量的图形图像相关的这种人才。当时呢,做媒体院的时候,陆坚就带进了一大批浙大的学生,做各种的图形图像处理的事情。在15年还是16年的时候,有一次跑去杭州,找很多原来盛大的老同事去吃饭,因为好多人去阿里了嘛。吃饭的时候呢,就有一位老同事约了我,说你来了我也吃个饭呗。这位老同事呢就跟我讲,说咱们做个量化交易,说我们现在干这个事。但当时他们这种量化交易呢,还是私下里边做,自己有一些钱在做一些,挣一些小钱,并没有公开对外去募资。

More

Older Entries Newer Entries