别只盯着股价了,阿里真正的翻盘点在这里:全栈布局+开源大旗,它正在复制英伟达“左手倒右手”的高明玩法|阿里巴巴 AI 大模型 阿里云 战略 通义千问 云计算

别只盯着股价了,阿里真正的翻盘点在这里:全栈布局+开源大旗,它正在复制英伟达“左手倒右手”的高明玩法|阿里巴巴 AI 大模型 阿里云 战略 通义千问 云计算已关闭评论

大家好,欢迎收听老范讲故事的YouTube频道。今天咱们来讲一讲,阿里到底是不是中国的AI之光所在呢?

这几天正在开阿里的云溪大会,9月24号到9月26号开。这一次的口号呢,叫“云智一体,碳硅共生”,提的口号很神奇。当然,最神奇的还不在这,咱们待会往后看神奇在什么地方。4万平米的展厅,500多家企业参与,6万多人到现场,这个是一个非常大规模的会。

那么还宣布了什么呢?与英伟达合作做物理AI。现在呢,谁也不敢宣布说与英伟达合作,买人家的这个RTX6000,现在只能说我们做一个别的合作吧。什么是物理AI呢?就是做机器人相关的AI,做机器人的仿真训练、量化强化学习和仿真测试,做这玩意的。英伟达在这块也确实是很强。阿里呢,也会去投资很多的这种机器人公司,所以这个宣布了以后也是一个重大利好。

而且呢,阿里现在绝对是全世界开源AI领域的扛把子。原来最早的扛把子是Meta,出了Llama,出了这么多模型以后,现在阿里接过了这一面大旗。阿里开源的模型,在Hugging Face上基本上是站到最前面的一批了。以阿里开源模型为基础再微调出来的其他的各种模型有几万个,现在基本上属于事实标准的一个状态。所以只要说开源的大模型,大概率是拿阿里通义千问的这个模型去调出来的。那这点呢,其实也很符合阿里的调性,就阿里的这些模型都属于他没有那种很强的这种个性,或者很强的这种能力,但是指令依存度、逻辑推理能力这块都是达标的,这个还是一个很好的底座。

More

DeepSeek现象引发中文圈狂热:开源的胜利还是遥遥领先的争议?

DeepSeek现象引发中文圈狂热:开源的胜利还是遥遥领先的争议?已关闭评论

DeepSeek突然出圈,引发了中文圈的争吵。大家好,欢迎收听老范讲故事的YouTube频道。

DeepSeek在前面,我们已经出了一期视频,去讲它到底是怎么回事了。那么,DeepSeek最近肯定是更加的出圈。首先,DeepSeek V3,据说训练成本只有557万美金,震惊了扎克伯格,震惊了Meta。Meta说:“我们有好多的老大,他们的年薪都超过557万美金了。人家训练了个模型才用了557万美金,那我花了这么多钱去组建AI团队,花了这么多钱去囤显卡,是不是亏了?”现在就有这样的声音出来。

而且,最新的DeepSeek R1,也就是它的推理模型,推理能力已经接近o1了。蒸馏微调出来的这些小模型,已经在很多领域里头超越了o1 Mini。在这儿多补充一句,什么叫蒸馏微调的小模型?像我的电脑上,也是跑了一个DeepSeek R1-32B的模型。这个模型是怎么来的?它实际上是由DeepSeek R1去输出数据,然后拿输出的数据再去调通义千问2.5-32B的这个模型,最后得到的结果。这就是DeepSeek R1-32B,他在我的电脑上做各种推理,效果相当不错。

More