深度求索的创新模式可以复制吗?既然他能做出来,而且也让美国人愿意接受我们的这种智慧,这个事是不是可以再来一次?这个事能复制吗?
首先呢,咱们要从幻方量化开始讲起。幻方量化呢,我其实跟他还稍微打过一点点交道。我自己个人的经历是,2009年到2012年之间,就职于盛大创新院。后来大概到11年、12年这两年呢,就开始分拆,分了很多的这个子院。其中有一个院呢叫多媒体院,多媒体院的院长呢叫陆坚。他呢是浙大的本科,后来到美国去读的博士,然后去了苹果公司。就是如果你现在用Final Cut,用QuickTime,这些东西就是他写的。后来呢,他在我们那里当了两年的院长,离开盛大创新院以后呢,是LinkedIn中国的总经理,现在应该已经进入半退休状态了。
他呢是浙大的,浙大呢其实在杭州,培养了大量的图形图像相关的这种人才。当时呢,做媒体院的时候,陆坚就带进了一大批浙大的学生,做各种的图形图像处理的事情。在15年还是16年的时候,有一次跑去杭州,找很多原来盛大的老同事去吃饭,因为好多人去阿里了嘛。吃饭的时候呢,就有一位老同事约了我,说你来了我也吃个饭呗。这位老同事呢就跟我讲,说咱们做个量化交易,说我们现在干这个事。但当时他们这种量化交易呢,还是私下里边做,自己有一些钱在做一些,挣一些小钱,并没有公开对外去募资。
我印象里是在18年、19年的时候,他们就开始公开的亮相,说哎,我们开始做AI选股了,用AI来进行交易决策了。这个公司实际上就是幻方量化。幻方量化里头最大的那个创始人,就是占85%股份的那个创始人,我没见过,但下边有一个占7.5%的,这个创始人是我以前的同事。他们呢是从私下里头几个人去做,逐渐正规化,开始向外销售产品,实际上也就是募资嘛。
他整个的幻方量化的团队呢,也是由一群浙大的算法天才凑一块干。幻方量化的发展呢,他算是中国首支达到1,000亿规模的量化基金,早期的业绩还是相当不错的。
有几只产品达到了400%的收益率,就是你给他一块钱,最后出四块钱出来,这个还是非常非常不错的。到2024年的日子就没有那么好过了,因为幻方量化里头有很多的这种基金,或者有很多的产品,是以中小盘股为基础方案的。因为你做大盘股,你是做不动的嘛,只有在中小盘股里边去做涨做跌,你才有这种盈利的机会。
所以呢,他们到2024年的有几只产品有10%的收益,但是呢,也有几只产品是以中小盘股为基础的,就直接亏掉了,大概亏了5%到6%左右的吧。我觉得以中小盘股的2024年A股的一个状态,只亏这一点点,他们已经很努力了。
现在呢,幻方量化已经不是国内最大的这种量化基金了,现在国内最大的量化基金都是玩大盘股的,就是已经是跟这个国家要一起往前走的这些基金,他们才可以长得更大一些。现在幻方量化下的应该有几只500亿或者几百亿这样的产品还在跑着,没有任何问题。
幻方量化下面的这个老大对整个的这个技术非常非常感兴趣的,2023年成立了叫深度求索的这样的一个新公司。他们这个公司呢,没有什么资金的压力,因为幻方就是投资方。这帮炒股票的人,做过量化交易的人,手里反正有的是现金,说我们投入就完事了,你也不用再去出去找钱了,也没有短期内的盈利目标。我也不是说做到哪天必须要挣到多少钱,也不需要出去跟人家显摆。
因为很多的创业公司,你不断的要拿出业绩出来,是为了融下一轮的钱,他们没有这个压力,说我们就是为了爱好,为了梦想,为了荣誉,去干一点自己喜欢的事情吧,就是这么一行的一帮人。所以呢,他们只做基础研究。那种既要又要不可取,什么叫既要又要呢?就是我又要做大模型,我又要去做行业应用,我又要去做ToC的产品。国内其实有几家公司是这么干的,但是对于这个深度求索,就是Deepseek这个公司来说,他们就做大模型,其他啥也不管,做开源,也没有ToC的产品。他们倒是有一些ToB的产品,北京有一个深度求索的公司。
是在去接一些ToB的这种集成单子,还是在做的?然后大模型开源了以后,开放API,大家就上那上面去用就完了,而且很便宜。他们呢是不做APP的,坚决不做APP。目前呢也没有多模态,未来应该会做,所以是一个很单纯的公司。咱们对比一下其他的公司,既要又要,比如说李开复的零一万物,一开始做开源,然后呢说不,这个开源不挣钱,我们要去做ToB系统集成去。说这个ToB系统集成,好像打不过别人,很简单,你一个台湾人,在中国现在这样的一个状态下,你想去接一些政府单,多费劲,这个就没法整。
说那咱们去做ToC吧,做了一个叫万知,一万两万的万,知识的知,做了这么一个产品。这种东西呢,你又没有流量,你跟这个豆包打,你根本打不过人家。别说他了,什么通义千问、文新一言、文小言,这些东西都打不过豆包,因为人家有流量,你没有。后面的开源也懒得做了,反正就在这一点点往前蹭,又号称拿了一笔钱,看他后面在做什么吧。
这是李开复的零一万物。Minimax呢,ToB的业务在做,ToC呢有一个叫Toky的产品,就是这种陪伴型产品,还做了海螺,就是可以做这个文生图、文生视频,这样的产品都做出来了。这个Minimax呢,就是ToB、ToC,他自己也有做API的,都在做。就是所有既要又要,还要也要的,这个就是他们。但是呢,他这几块做的还可以,不像这个李开复那个似的,哪块好像都没开出花来。
然后百川智能他们呢,是没有这个ToC的产品,除了模型研发之外,剩下就是行业解决方案了,什么银行、医疗什么开始做这玩意了。然后质谱呢,是模型研发订阅和授权,剩下也是行业解决方案了,也是没有ToC产品的。接月星辰呢,是模型订阅行业解决方案,也有ToC的产品。月之案面也是全活,什么都干。
以上咱们讲这个呢,就是号称的中国AI六角龙,就这六个。然后大厂呢,你做一些全活,这是合理的,小公司何必呢?哪个都不想放过,我ToC我也要做,ToB我也要做,模型我也要开发。
开发完了以后,我还要立个什么出去跑分什么的,都要去干。所以跟他们比起来,Deepseek就要单纯纯粹的多。我就去做模型,而后我还在模型的基础上做各种的改进。改进完了以后呢,跟全世界的大模型的圈子里头一起去建立新的方向,建立新的标准,一起往前走。
咱们回来讲这个Deepseek,他的领导跟这个领头人是很重要的。这个人呢叫梁文峰,这个人我没见过。我那个以前的老同事是下面的一个小股东,早期的三个人应该都是技术,主要就是做这种研发的。实际上,他们早期就是自己做,自己去炒这个股票,完全是自用的一个东西,所以早期并没有那么商业化。而且呢,做量化这种人呢,是隐士大侠,他也不愿意出来跟你见面,也不希望去跟你谈很多事情,所以这个人在外边露面的机会也不多。
我后来找了找,在网上找了两篇梁文峰的访谈。今天这个后边的故事呢,有很多是来自于访谈里边的信息。做量化的时候,一开始确实是比较隐蔽,而且呢,没有这个海外大厂经理。就是大家要知道,像国内的这些做AI的,这个六小龙里头,有很多是由海外大厂经理或者海外名校经历的。即使没有的话,可能还有清华呀,还有很多的什么百度或者是格林深瞳这样的国内AI大厂经历也是有的。
但是呢,梁文峰就没有,浙大毕业了以后,中间这段的生活就不太确定了,因为他也没有什么对外的披露出来。后边呢,就开始做幻方量化,炒了股票挣了钱以后,就去做Deepseek了,就是这样的一个情况。这个人呢,每天像极客一样去干活,或者像黑客一样去干活吧,也不怎么说话,每天就是看论文,写代码,参加小组讨论,也没有那么多的管理的事情。
肯定的天才是必然的,这种黑客型的天才呢,在中国各个角落里头还是隐藏了不少。这个愿意为理想荣耀去努力的人还是有的,有能力做自己想做的事情,还没有钱方面的限制。这个呢,就相对来说要难一些,因为我见过很多的黑客型人才,但是呢,他们都是在为五斗米奔波。
又有能力,又有想法,还有钱,他就会做出像Deepseek这样的奇怪的东西出来。他在前面讲过一个很有趣的话,是“务必要疯狂的拥抱雄心,且还要疯狂的真诚”。他是这样去要求的,而这个话呢,是2023年4月11号,幻方在发布大模型的时候,他们说:“哎,我今天要开始做大模型了。”做公告的时候,引用的法国新浪潮导演克里弗曾经告诫年轻导演的一句话,那咱们再说一遍:“务必要疯狂的拥抱雄心,且还要疯狂的真诚。”这种人,他们能够在钱财无忧的情况下,做出一些让人大吃一惊的东西出来。
因为幻方前面也是在做AI的大模型,就是在ChatGPT出来之前他们就在做,所以早早的呢,囤了1万张的A100。幻方他们应该是全国除了大厂之外,唯一的一家手里有一万张A100的公司。你想,A100这个东西刚出来的时候,一万美金一块,一万张A100,他就是一亿美金。他手里能够有这样的一个资产,还是非常非常吓人的。
那么招聘方面呢,因为老板自己并没有海外留学大厂工作,所以呢,他在招聘这块也对这块要求的没有那么重,因此招了很多的应届生回来。要求的是什么?第一个要感兴趣,你要喜欢这事;你要不喜欢就别费这劲了。第二个,除了喜欢之外还要什么呢?要有基本功,基本功一定要扎实。因此,他要求的第一个叫热爱,第二个要有能力完成项目。你不能说我光喜欢,但是我做不出来这事不行。
所以他们基本上是以这个标准去招聘的。当然,现在也有很多的清华北大的人被招进去了,原来呢,可能主要是浙大的人稍微多一些。他们的创新呢,是一种自下而上的创新,不是一种自上而下的创新。每一个人呢都可以提出自己的想法,而且他们不需要去提前分工,比如你去做数据标注,他去做哪块,谁去跟什么东西,没有这个。每个人呢都可以按照自己的爱好和路径去做事情。
像前面我们讲的那个MLA,叫多头潜在注意力机制,这个东西呢,就是一个很年轻的研究员提出来,提出来完了以后说:“那试一下。”谁都可以提出要求来,那试一下。
然后,试的时候呢,发现哎,有点效果。 有了效果之后,分配算力资源就开始继续往下做。 就是当大家初步验证成功了以后,就会从上而下的再投入资源。 这个呢,其实很像美军搞的那套东西。 美军说,司令部里边这些长官,他是不了解前线情况的。 所以怎么办呢?让这个小团队出去,你们现场侦查,然后向后边要各种支援:我要导弹、我要空投、我要撤退。 后边人只管给支持就完了,或者给他们各种信息,让他们到前头去。 打仗的人来决定这个仗怎么打。 这个是在美军海外战争以后决定的一种工作方式吧。 Deepseek也是使用的这样的一种创新模式。 像其他的都是老板是老大,他有经验,他一定说了算,下边人你就只管干活就完了,你们都是螺丝。 Deepseek在这块是有很大差异的。
Deepseek还干了一个什么事呢?就是很意外的挑起了价格战。 在Deepseek V2发布以后,他们就进行了大规模的降价,100万TOKEN一块钱人民币。 这当时的想法是什么呢?就是这事呢,不能赔钱。 当大家来去用我们的这个和算力的时候,不能赔钱,但是呢,也不要求赚很多的钱,不用求暴利,稍微赚一点就可以了。 所以呢,这帮人核算了一个成本,就直接把价格扔出来了。 也没想到整个的行业会对于这个价格这么敏感,没想着会有人跟进。 智谱马上就开始跟,将一个很小的模型降价了。 大模型呢,还是比较贵的,因为质谱其实还是小龙嘛,6小龙的小龙,就是他还是融资干活的,钱没有那么丰富。 但是后边字节的豆包,大模型就直接跟进了,全线降价,包括后面的百度的文新、阿里的通义千问,都在大规模降价,直接就把价格拉下来了。
所以呢,Deepseek就由此得名,叫AI领域里的拼多多,砍一刀嘛。 但是呢,Deepseek就说了,价格我是挣钱的,我虽然挣得不多,但是我是有利润的。 但是其他的这些大厂呢,就是赔本赚吆喝的一个状态了。 那你说,中国是不是有很多的聪明人可以来做这件事情? 很多人说呀,有大智慧的,也有的是小聪明的。
我们现在讲Deepseek这帮人,他们算大智慧吗?在我当时看他们去做量化交易的时候,我想这些人就是一帮小聪明。这个说个实话,就是如果当时他们在做量化的时候找我去要投资的话,我应该不会投他们。即使现在可能有一些这样的人找我的时候,我应该也不会投。
这种大智慧跟小聪明是跟性格有关系吗?其实我觉得有一定的关系,但是没有那么大。这个东西更多的是跟环境有关系。在大的这个环境要求你必须要为五斗米去思考的时候,这些人就会去变成小聪明。当他们衣食无忧的时候,就可以去追求自己的大智慧。而且中国人还很多,在这么大的基数下面,总会有一些大智慧的人获得合适的环境,或者说有一些聪明人,在获得了合适的环境下可以去展现他们的大智慧。这是我觉得中国在这块比较强的地方。
没有说中国人就只会从1到100,不会从0到1,没有什么原创性的创新。这个事我是从来不信的,只要做出有价值的贡献,别人根本就不会因为你是中国人就歧视你或者怎么样,没这事。在海外做出最大贡献的很多人,其实都是华人,很多也是从国内培养出去的人。
所以智慧本身是不要想高低贵贱的一个事了。中国人的聪明人比例是不是比较高呢?首先这个说法呢,政治不正确,种族之间是不应该有这个差异的。但是呢,中国因为文化传承跟生存压力的问题,会更加的重视教育。所以更多的中国孩子在很小的时候承受了非常非常严酷的,或者残酷的非人的教育压力,这个是没有办法的。
中国的文化传承是什么?自古以来叫“万般皆下品,唯有读书高”,或者是“士农工商”。一旦成为士了,你连税都不用交。咱们接受了几千年这样的文化教育,所以我们知道说任何人,只要是稍微家里有口吃的,一定要送孩子去上学,不能耽误他。
另外一方面,就是我们的生存压力非常非常大,动不动就是输在起跑线上。所以我们的孩子自小接受的这种教育,可能对于老外来说,他们就直接告你虐待了。最终产生聪明人的比例自然就高一些。
可能大家生下来没有那么大差异,但是呢,我们每一个人,甭管你能不能成才,甭管你有多聪明,我们都去用巨大的教育压力把它压一遍。可能很多国外的人也很聪明,但是呢,人就快乐教育,开开心心的吃喝玩乐,混了一辈子也就出来了。
但是中国可能稍微有点能念书能力的人,都被我们的教育体系给塑造成了一个可造之材吧。那么这几十年,这个生活环境、信息流动肯定还是发生了巨大改变的。可以做自己喜欢事情的中国聪明人,肯定会变得更多一些。
咱们甭管怎么说,这几十年的改革开放,我们能够获得的资金资源数据,从来没有像今天这样多过。这个事大家还是要去承认的,也不是每个人都活得那么苦大仇深。像Deepseek这帮人做量化的时候,我挣着钱了,那我就可以去追求一些自己喜欢的事情。
其实我是见过很多聪明的中国人的。原来我们去做盛大创新院的时候,是聚集了很多很多的聪明人在一起。那这个里头跟幻方又有一点相像,幻方是炒股票,自己手里有一堆钱,盛大创新院是做游戏,公司手里有一堆钱,说来我们去追求一下梦想吧,也是如此一个状态。
而且很多公司里边,还窝藏了一堆的扫地僧,就是他会解决很多的很细节的、很具体的问题。那你说这些问题,为什么大家老觉得这就是一个工程上的改进,不是一个从0到1的改进?原因很简单,因为这些人没有聚集在一起,没有让他们自由的去追求他们自己想干的事情,所以他们就只能成为扫地僧,而不能成为像Deepseek这样一鸣惊人的东西。
社区里边也有很多为爱好和梦想而努力的人。有些人呢,没有那么好的环境,但是也在努力,比如说那些独立游戏的开发者,那些开源软件的创作跟维护者。我们是见过很多的,说我喜欢这个事情,我就是愿意做这个事情,我真的是吃了上顿没下顿,这种人挺多的。
我曾经有一个以前公司投的项目,那是一个游戏公司的CEO,那也是一个很强的geek,自己的这个游戏做的不怎么样,每天在UDT社区里头揪着人家CTO扯淡。
讨论最新的物理引擎该怎么做。那个CTO还经常跟他之间相互的启发,相互的促进,做这样的一个事情。我呢,很尊重这种天才,但是这种人不是一个好CEO。那个案子原来不是我投的,虽然是我们项目里边的案子,但不是我投的,所以我也不会去投向Deepseek这样的公司。
当社会有一个基础保障的时候,这些人呢就会更大范围的存在,而且呢,有可能会创造出璀璨的成就出来。他是有一定的偶然性在里边。对于不同的环境呢,就应该有不同的应对方式。有些人说我想挣个快钱,有些人说我现在钱挣够了,我想追求点梦想,这个呢都无可厚非。
总有人问我说:“哎,我现在想投资,我有笔钱,我应该投什么好?”因为我原来做个投资人嘛,所以有人来问我这个问题,或者说:“哎,我有一个朋友,他们需要投资,让我来投,你看看这项目行不行。”也有人给我做这样的咨询。我给的答案一般都是一样的。
什么呢?第一个,你准备投多少钱?你对于回报的预期是什么?多长时间回报?挣回多少钱回来?这是你对回报的预期。再回报第三个是什么呢?你对于风险的承受能力是怎么样?这个钱如果就没了,或者是如果就亏进去了,你是不是愿意承担这件事情?绝大部分人回答了这三个问题以后呢,这个投资就黄掉了。他们压根就想不清楚,我到底对这个投资的预期是什么,或者说我到底能够承受什么样的风险,这个其实是很难回答的。
离钱近的人,或者说我要挣快钱的人做工程,找到清晰明确的路径,定好目标,直接冲上去,寻找可以融资或者让公司价值上升的人和团队。为什么很多人说:“我一定要谷歌挖个人回来,我要到百度挖个人回来,我要到自己挖个人回来。”因为这样的话,你相对来说比较好忽悠投资人嘛。投资人绝大部分是不懂的,一看到这个人的履历,这个好厉害,我要给钱,就变成这样。
然后把这些团队凑起来以后呢,拼执行力,实际上也就是内卷了。然后寻找漏洞,细节不断的完善,卷死其他所有人,这就是快速挣钱的这个团队要干的事情。还有些人说,我钱挣够了。
或者说钱一时半会不用太担心,我只需要追求梦想就可以了。这些人呢,心思就会更单纯一些。在小说里边,有一个名词叫做“剑心通明”。我这个心里头只有剑,没有任何其他东西,那他就可以去做一些不一样的事情。
当然,不同的人呢,有不同的追求,这个里头没有谁对谁错,也没有谁高谁低。我们也不要去笑话中国AI、六小龙这些企业。你说既要又要,没做任何创新,模型架构就直接抄人家的,别笑话人家。大家只要自己的逻辑自洽了,说我就是要去做一个公司,我要把公司做上去,我要对投资人负责,我要在这个过程中做出一些有趣的东西出来,就可以了。这个事并没有什么问题。
那么,深度求索的未来会怎么样?人怕出名,猪怕壮,因为呢,资本已经盯上他们了。大厂呢,会快速的抄袭迭代他们的架构和模型。不用等美国人开源,中国人开源了以后,其他中国人也会自主创新、自主研发的,挖人是必然的。小米刚刚千万年薪,挖的这个叫罗福莉的人,就是Deepseek V2的一个主要贡献者。至于小米千万年薪把它挖回来以后,是否能给小米带来什么,这个我们拭目以待,不一定。
然后,中国呢,有一个特别有趣的名字,叫什么叫“黄埔军校”。百度就是推荐算法、自动驾驶这块的黄埔军校。盛大呢,原来是盛产大量的游戏人才,而金山呢,是早期大量的软件人才都从这出来的。路径清晰,想要做同样的事情,最简单的方式是干嘛?去挖人,把这个做过的人挖回来,这事不就搞定了吗?
所以,深度求索的技术呢,一定会快速的随着原代码的开放以及人才的流动,普惠到中国各大AI厂商里边去。而深度求索自己呢,未必最后能够挣到钱,这个我要跟大家讲清楚。跟大家讲一个故事吧,就是李开复早年做这个创新工厂的故事。当年,李开复招聘了大量的,他们叫“娃娃兵”,也就是没有毕业的这些硕士,因为他当时在中关村附近那边嘛,所以有什么北航的呀、清华北大的呀,很多这样的硕士或者是本科生,就在那干活。其实,创新工厂实际上最开始的两拨人,一拨是李开复从谷歌里边带出来的人。
然后,另外一拨干活的人,就是这帮娃娃兵。后来等李开复开始有一定名声之后,他们的整个办公室就被各大互联网公司进去疯狂的洗,慢慢的就分崩离析了。当时我们就干过这个事,坐在那个创新工厂楼下的咖啡馆里,挨着个给上门打电话来,一个一个叫下来面试。而且是分几摊,同时上四五个面试官在咖啡馆的不同的角落里坐着。只要聊着还可以的人,3倍薪水你来不来吧?当时盛大干了一次,后边的各大厂都去干这个事情。因为呢,我们发现李开复把这帮娃娃兵训练得非常好,每一个人都是心中有火,眼中有光,而且呢,执行力还很强。当时挖了好多那种回来,效果非常好。
希望呢,这个深度求索可以在资金充裕的情况下,继续进行探索和尝试。也只能这样的希望,我没法期望说深度求索这公司未来成长成一家非常巨大的这种大厂,最后能够挣到很多的钱。这个事呢,我是不抱期望的。希望经历各种风风雨雨的过程之后,不要把心态搞崩,这个是最重要的。因为呢,很多的时候人员离职或者是项目失败,有很多这样的事情出来以后的话,创始人的心态会崩的。那么,是不是还会有很多深度求索这样的公司,隐藏在水面之下呢?会有的,而且会越来越多。
AIGC时代大公司的优势其实没有那么大,更多的个人和小团队可以调用更多的资源、数据以及算力,做出大家意想不到的事情出来。像我现在也可以自己坐在家里头,使用各种搜索引擎,使用各种的大模型去进行工作。我交的钱实际上也就是一个月20美金给了OpenAI了,豆包还是免费的。我现在可能真的是一个人,相当于一个团队在干活了,我也可以做出一些可能别人意想不到的事情出来。
有了基础的社会保障之后,从小接受残酷学习训练的中国人,做出各种奇奇怪怪东西的概率肯定要比其他地方的人大得多。这是我的一个结论。而且,中国人本来就多。最终呢,咱们要给这个故事下一个结论,就是会不会有深度求索这样的创新模式被不断的复刻?而我的结论是这样:深度求索的创新模式。
复是不能复刻和模仿的。因为你一旦要去刻意学习什么东西,你就是有目的的。而这种目的的话,跟刚才我们讲的深度求索的这种研发方式,它是相互矛盾的。目标很明确,就应该像AI六小龙他们干活,什么都沾一点点。但是呢,会有很多很多类似的团队,还是潜龙在渊。就是大厂你学这东西你是学不了的,但可能会有一些小团队,在不定在哪个角落里,哪个旮旯里头,在做一些大家意想不到的事情。突然哪一天就冒出来了。这个事情我觉得还是可以去期待的。好,这就是今天的第二个故事。
Both comments and pings are currently closed.