AI炒币一周战报:DeepSeek凭低频策略狂赚36%,GPT-5惨亏28%,Gemini更是亏掉30%!|Alpha Arena、AI trading、LLM、Crypto trading
10 月 22
AIGC, DeepSeek大模型, 区块链很疯狂 AI trading competition, AI实盘交易, AI投资, AI盈利能力, Alpha Arena, Autonomous trading, Claude, Crypto trading, DeepSeek, Gemini, GPT-5, Grok, LLM benchmark, nof1.ai, Real money trading, 交易策略, 加密货币投资, 去中心化交易所, 大模型炒币, 投资机器人, 数字货币, 模型性能对比, 永续合约, 量化交易, 金融科技 AI炒币一周战报:DeepSeek凭低频策略狂赚36%,GPT-5惨亏28%,Gemini更是亏掉30%!|Alpha Arena、AI trading、LLM、Crypto trading已关闭评论
在炒币这件事上,DeepSeek完胜GPT和Gemini。
大家好,欢迎收听老范讲故事的YouTube频道。
最近有一件事闹得沸沸扬扬,也就是Alpha竞技场。有一个叫NOFE.AI的实验组织,他们组织了一场由大模型炒币的一个实验。这个实验室的组织者呢,是纽约大学机器学习领域的一位博士候选人,应该算是一个学术组织,并不是一个炒币的机构。他呢,想要让大模型使用真金白银,直接在币市里边去进行竞技,而不是去做什么模拟题,做各种什么模拟盘,直接真金白银开干。
比赛呢,是从10月17日开始,每一个大模型给1万美金的启动资金,到现在呢,胜负已经非常明显了。DeepSeek V3.1完胜,他挣的钱最多。Grok-4紧随其后,也是盈利的。盈利的曲线呢,跟DeepSeek V3.1很像,但是这里呢,并不是因为Grok-4抄了V3.1,或者在DeepSeek的基础上去训练出来的,而是什么呢?就是你市场本身是有一个波动曲线的,他们只要采用相近的策略,他们盈亏的曲线就会比较接近。
再往后呢,是Claude sonnet 4.5,它表现得呢要稍微差一些,但也是盈利的。Qwen3 MAX也参加了,稍微地赚了一点点,大概是挣了几百美金吧,基本没赔。有一个对照组,对照组是什么呢?就是买入比特币直接持有,因为你总要跟市场的大势去进行比较嘛。这个组呢,是挣得要更少一些,大概挣了300多美金。Qwen3 MAX大概挣了700多美金,所以Qwen3 MAX还是跑赢了持币观望组的。
剩下的就是亏损组了。GPT-5亏损极其严重,没多长时间,不到一个礼拜,大概亏了百分之二十几的钱出去。当然还有比它更惨的,Gemini 2.5 Pro,直接亏得连他妈都认不出来了,直接亏了30%多进去。
那么这个实验是怎么设计的呢?大家都比较关心吧。他首先是给每一个大模型1万美金的启动资金,这些大模型可以自己去决定,在这个去中心化交易所里边,自由地用这种杠杆去交易6支加密货币的永续合约。
这里头有几个关键词,咱们要稍微解释一下。首先6只加密货币:比特币、以太坊、索拉纳、币安币、狗狗币和瑞波币。这6只币相对来说,还是比较大众一点的吧。然后呢,它是在去中心化的交易所里边去交易的。你比如像币安,像其他的一些大的这种交易所,都是中心化交易所。中心化交易所等于是在一个中心化交易所自己内部的服务器上去进行交易撮合、去进行配对,它的交易速度是很快的。而在去中心化交易所里头,你需要在链上直接去做交易,它的交易速度还有交易过程中的费用,这个都是不一样的。所以呢,为了公平起见,专门找了一个去中心化交易所,直接在链上开跑。
至于永续合约呢,大家知道这种期货合约,它一般是有一个截止日期的。比如说我买大豆,你到了那一天,你就必须要去把这个大豆拿回来,或者说你必须要在期权到期日之前,你要把它平仓掉或者处理掉。但是呢,比特币也好,以太坊也好,它并没有一个必定要到期的日子,他也没有哪天说大豆要成熟了,或者石油要真的开采出来,我要用这个东西。所以他就有这种永续合约,你可以一直看涨,一直看跌。所以他用了这样的一个交易工具,这些大模型呢,就可以在去中心化的交易所里头,用这6个币的永续化合约去进行交易,自己决定看涨还是看跌,或者是加几倍的杠杆。
所有的大模型呢,都是公开的大模型,没有进行过微调。你说GPT-5我想微调一下,没有那么容易。但是呢,DeepSeek因为它是开源的,这个东西是相对来说比较容易进行微调的。但实验说了,我们没有去进行任何微调,就是大家可以拿到的公开版本,我们直接就用了,然后进行统一的提示词,我们要求你干活去,要给我盈利。但是现在呢,提示词并没有公开出来,希望他们以后可以公开出这个提示词来。
信息输入,这个是非常大的差异。这里头呢,有两部分信息。一部分呢是相同的,就是统一地进行市场行情的结构化数据的输入。涨了、跌了,有多少买盘、多少卖盘,现在是一个什么样的行情,这个呢会有结构化数据统一地发给所有这些大模型。另外一块有差异的部分是什么呢?就是各自可以搜索非结构化的社会信息。现在有什么小道消息,市场的情绪怎么样,自己搜索去。这个就是整个的实验设计。
实验的过程是什么样的呢?咱们先说DeepSeek V3.1。它呢是交易很少,最主要的盈利呢,是15倍杠杆做多了以太坊,做多了索拉纳,以及做多了瑞波币,靠了这个挣了36%。一个礼拜挣了36%,真的不愧是做量化基金幻方量化出来的这个大模型,做这玩意儿绝对强。
第二名呢是Grok-4。他呢一开始他也认为有可能会空,但是这就是Grok-4比较强的地方,它后边是Twitter,后边是X。你在比特币市场上,或者在币圈里头有任何风吹草动,X肯定是第一个知道的,而且可以快速地知道发生了什么事情。所以呢,它非常非常精准地知道在什么时候应该转单,从空单转多单。它在发生反转的时候,快速地20倍做多了瑞波币,15倍做多了索兰娜,挣了很多钱。但是呢,他前面有一个交易时机稍微有点差距,所以他有一个做空瑞波币的这个交易呢,是给他赔了一些钱。DeepSeek和Grok都是极少交易,就是他很少做决策,很少做交易,但是呢真的很挣钱。DeepSeek V3.1挣了36%嘛,然后Grok-4挣了30%。这是一个礼拜,在这一个礼拜里头,整个的行情是有一个V型的反转,一开始暴跌,然后开始转回来。DeepSeek呢就属于是我一直相信会涨,Grok-4呢就属于很精准地通过X上面的信息,找到了这个反转的底部,非常非常精准。这个也是输入信息差异带来的这种差异。
再往后一个呢,Claude sonnet 4.5,它呢挣了23%,其实也还可以。一个礼拜你挣23%,你还要什么呢?他做的交易呢,就要稍微多了一点,他做了3到5次交易。他呢主要是靠杠杆做多ETH和瑞波币,靠这个来去挣的钱。
再往下一个,挣的钱更少一些的呢,就是Qwen3 Max。他呢挣了大概700多美金吧,他做的交易就要多一些了,他做了八次交易。这个里头就比较乱了,逻辑不是很清晰。
再往后一个,就是比特币买入持有的这哥们,他呢挣了383美金,也只做了一次交易,因为它就是一个对照组嘛,上来你就是把所有的1万美金都买成比特币,在整个的实验过程中跟其他人去比较。
下一个呢就是GPT-5了。它是1万美金进去,亏了2800美金,亏了28%。他主要的亏损交易是做空瑞波币和索拉纳,就是他在反转的时候没有发现,反转了就一直在做空,所以亏了很多钱。
当然亏得更多的呢,是Gemini 2.5 Pro。为什么呢?就是它反复地交易,它交易的规则非常混乱。你像前面我们讲DeepSeek V3.1、Grok-4,都属于交易很少很少的。Claude sonnet 4.5做了3到5次交易,就已经多了。像这个Qwen3 Max做了8次交易,我们就已经在说它的交易逻辑有点混乱了。这个Gemini 2.5 Pro做了44次交易,因为你在这种去中心化的交易所里边做交易的时候,你是需要去付gas费的,就是你要求别人给你打包这个交易,你是要给矿工钱的。所以你做了44次交易,就造成了巨额的亏损。他呢也还有一个盈利单,他做空狗狗币有一定的盈利,但是呢他做多瑞波币的一个交易呢,造成了巨大的亏损。他很多的亏损是由于他交易实在太频繁了。你到这个币市里头,是不能这样去交易的。
那么这些大模型,他们显示出来的性格上的差异是什么样的呢?刚才咱们讲是什么怎么挣钱、怎么亏钱,性格上是不一样的。
DeepSeek是纪律严明的量化执行者。因为它是有这个COT,也就是思考过程输出的,它告诉你我是怎么想的。上来就告诉你说,我是所有东西都做多,我认为现在的市场还可以,这个市场上没有达到我的盈亏平衡点,或者没有达到我的止损点,所以我就继续做多。他非常非常严格地在做这个量化交易的玩法,因为只有他是原来做量化交易的,所以他很熟悉量化交易到底怎么玩,他也很熟悉这种去中心化交易所交易速度比较慢、交易成本比较高的这样的一个特性。所以呢,他就很稳定地去执行这些策略,挣的钱挣得最多。所以他叫“纪律严明的量化执行者”,而且强烈看涨,就是我就认为会涨。平均是10-15倍的杠杆,交易频率是比较低的,严格的止损止盈驱动。就是它没有那么复杂的交易策略,我就是止损止盈,全市场看涨,而且很看好瑞波币,这就是它的整个交易逻辑。
Grok-4呢,它是敏锐的时机反转交易员。因为后边有X,这个绝对是优势,你认为它作弊都没有任何问题。它呢可以很动态地进行调整,这个是10到20倍,它比DeepSeek还要胆大。DeepSeek就是10到15倍,它是10到20倍的杠杆直接做进去。这个仓位呢可以进行动态反转,可以非常好地捕捉到市场拐点,所以更适合干这个活的可能是它。只是他可能对于量化交易,特别是在这种去中心化市场上的量化交易呢,没有DeepSeek那么熟练。
然后Claude sonnet,他属于谨慎的价值投资者。整个的方向上呢也是看涨,他呢是8-20倍,他也挺胆大的,加了8-20倍的杠杆。他的交易的这个频率也是比较低的,属于长线持有、交易次数较少的,集中地做以太坊和瑞波币。
Qwen呢,属于平衡的机会主义者。就是他乱搞,也没有什么逻辑。在这他做了8次交易,都是较短的持仓周期。所以我觉得他能够挣钱,算是一个运气吧。
而GPT-5呢,属于困惑的逆势交易员,就是属于没有搞清状态,始终看跌,维持了这种亏损的头寸,看空瑞波币和索兰娜,最后亏了很多钱。
而Gemini呢,属于叫焦虑的日内交易员。他疯狂地在那做交易,做了44次交易,做得很混乱,而且也是普遍看跌。15-25倍,也是非常胆大的一个交易者。做了44次,他是做的最高的交易次数。你看一个礼拜做这么多次交易,缺乏风控,他压根就不知道什么叫风控在里头。看空这个狗狗币,看多瑞波币,这是他的一个交易策略,或者说他的一个性格吧。
这是几个大模型之间的这种差异。很多人说:“这不就量化交易吗?”这不一样。大模型交易跟量化交易是有本质区别的。量化交易呢,使用的结构化数据,现在的整个的市场的交易的数据是什么样的,价格什么样的,有多少买、多少卖,过去的历史数据是什么样。他把这些东西塞到一个量化交易的系统里边去,然后呢,是由人去看新闻,给他制定量化交易的一些规则,他去按照规则去在止亏线、止盈线之间去进行操作,这个是量化交易干的活。
大模型交易的话,是大规模地使用非结构化的社会信息。什么叫结构化的?就是有一个表格,今天第一笔交易什么、第二笔交易什么、报价什么,这样的数据叫结构化数据。而非结构化数据,就是我们搜索回来的,直接从网页上扒回来的这个数据,或者说像Grok这样,我从X平台上直接拎回来的数据,这个就是一条一条的,可能这一条数据叫怎么跌了、怎么涨了,可能是这样的这种数据。他把这样的数据拿回来,由大模型自己去决定到底做什么样的策略,是涨是跌,它是这样来去做的,所以有非常大的区别。
今天呢,就是做了第一次直接由大模型真金白银地去做交易。以前没有人敢干这个事,以前大家都是做模拟盘,就是我模拟买、模拟卖,最后看一下谁赚了、谁亏了,这次就是直接上真金白银。
那未来会变成什么样呢?就这一次的实验对未来会有什么样的影响呢?第一个呢,是不要太担心,由大模型完全主导的交易不会马上就到来。虽然现在看到说有人能挣钱了,但是这个大模型对于整个的交易还并没有那么熟悉,未来可能还需要几个月,甚至可能需要一两年的时间,这些大模型会更加适应这种交易的动作。
未来人类的角色呢,会继续上行。什么意思呢?最早的时候咱们是做交易,我决定买、决定卖。再往后呢,就是制定量化的一些策略。我们有一个量化工具,由人呢,或者说叫量化分析师,去看新闻、去分析数据、去分析大家的这种情绪,去制定量化策略,然后而让量化机器人去执行。未来呢,就是人类要去为大模型制定策略。当发生什么事的时候,你应该如何去做;当发生什么样的新闻的时候,你应该如何去反应。以后可能人类会在量化交易的基础上继续向上走。
大模型交易呢,也会带来很多的风险。就大模型交易这个事一定会到来,谁也拦不住他,因为挣钱嘛,这个事你是拦不住他的。它会带来什么样的风险呢?第一个就是算法趋同。这个事其实在量化交易的时候就已经产生了。算法趋同什么意思?就是我发现有一个要涨的这个趋势了,或者有一个要跌的趋势了,所有的量化机器人,包括以后的大模型,可能都会产生相同的这种认知,那他们就会把这个趋势进行放大。涨还行,你要跌的话就会闪崩,直接“咔嚓”一下就崩掉了,很多人就会爆仓在里面,这个是非常非常危险的。还有什么呢?就是责任不清晰。原来我们即使使用量化交易,也是有量化交易员他来承担责任。而未来的话,你是由大模型来去确定要去买还是要去卖,那你挣了、亏了,这个到底算谁的?这块呢,也还需要再去明晰一下。所以监管部门又有得头疼了。
好,最后总结一下。这是第一次真金白银的大模型对抗,而且呢我们发现专才还是有用的。其实这个实验呢,颠覆了我的一个认知,我原来一直认为,只要模型变得越来越大,这种通才才是未来的一个方向。但是这一次的比赛让我们知道了,专才是有效果的。像DeepSeek这样的专才,他就是做量化出身的嘛,所以他对于整个的量化交易规则,对于整个量化的这种执行过程和这种去中心化交易所这种低效率、高成本的这种交易的节奏把握得非常好,他就胜出了,超过了所有的其他大模型。所以专才依然是有效的,即使大家以后没有专才大模型,你也完全可以用这种开源模型去进行微调,这件事还是有效的。
下一个告诉我们的事情是什么?特定的信息源是非常有效果的。下一个胜出者是Grok-4,它靠X上这种非常敏感的信息波动,比这个DeepSeek挣得虽然稍微少一点点,但是也是非常挣钱的。
最后提醒大家,炒币有风险,入市需谨慎。大模型是别人的,炒币的真金白银是自己的。
好,这个故事就跟大家讲到这里,感谢大家收听,请帮忙点赞、点小铃铛、参加DISCORD讨论群,也欢迎有兴趣、有能力的朋友加入我们的付费频道,再见。
RSS