全球六大顶级AI实盘厮杀 『DeepSeek』第一 真金白银交易比拼(世界六大)

全球六大顶级AI实盘厮杀 『DeepSeek』第一 真金白银交易比拼(世界六大)

全球六大主流『大语言模型』各自获得一万美元💵,在同一真实市场中进行实盘交易。上周六,美国人工智能研究实验室nof1.ai在其“阿尔法竞技场”平台上举办了一场活动,给六个顶级模型一万美元💵的真金白银,让它们下场交易。

这六大模型包括Anthropic的Claude 4.5 Sonnet、深度求索的『DeepSeek』 V3.1 Chat、谷歌的Gemini 2.5 Pro、OpenAI的GPT 5、xAI的Grok 4和阿里通义的Qwen 3 Max。每个模型获得10,000美元💵的真实资本,在交易所Hyperliquid上,以相同提示词与输入数据条件下,交易加密货币的永续合约。比赛的目标是将风险调整后的收益最大化,每个模型需自行产生超额收益、确定仓位、择时交易并管理风险。

系统会提供当前时间、账户信息、持仓情况以及实时价格和指标等数据,要求模型做出决策:如果持有仓位,是继续持有还是平仓;如果空仓,是买入还是继续观望。经过近60小时的激战后,截至北京时间周一17:18,『DeepSeek』的持仓总市值接近1.4万美元💵,收益率约40%,最高时一度接近1.5万美元💵,表现最佳。Grok 4次之,目前持仓总市值在1.33万美元💵附近。这两个模型主要通过做多比特币和以太坊获利。Claude主要交易瑞波币和以太坊,Qwen则专注于以太坊,两者收益位列三四,但也整体跑赢比特币现货走势。相比之下,GPT 5和Gemini出现了明显亏损,目前持仓总市值分别为7300美元💵和6900美元💵,意味着两个模型已亏损约2700和3100美元💵,表现最差。

nof1.ai表示,进行这一竞赛是为了让基准测试更贴近真实世界,金融市场是最理想的试炼场,因为这类市场具有动态性、对抗性、开放性与高度不可预测性。这些特质能以静态测试无法企及的方式真正挑战人工智能。nof1.ai未提到本次竞赛的具体结束时间,只表示第一季将运行数周,随后推出重大更新的第二季。有分析认为,市场早已期待在DeFAI方向上出现杀手级应用,让LLM参与链上博弈有很大的想象空间。

特别声明:[全球六大顶级AI实盘厮杀 『DeepSeek』第一 真金白银交易比拼(世界六大)] 该文观点仅代表作者本人,今日霍州系信息发布平台,霍州网仅提供信息存储空间服务。

猜你喜欢

拉布拉多开车上路?交管局回应 网红狗学车引热议(拉布拉多可以拉车吗)

18日,四川眉山一位网友拍到一只黑色拉布拉多独自驾驶电动车在公路上行驶,笑称自己出现了幻觉,看到狗子开车。视频中,这只黑色拉布拉多前爪握着方向盘,缓慢行驶在车辆来往的公路上,一边开车一边狂吠

拉布拉多开车上路?交管局回应 网红狗学车引热议(拉布拉多可以拉车吗)

卷扬启闭机:水利工程的得力助手(卷扬式启闭机维护保养)

新河县荣程水利机械厂的服务能力与产品优势新河县荣程水利机械厂是一家专业的水利工程机械生产企业,在卷扬启闭机等水利设备的制造、销售和安装方面拥有强大的服务能力。新河县荣程水利机械厂的产品严格按照质量标准生产,…

卷扬启闭机:水利工程的得力助手(卷扬式启闭机维护保养)

邓婕:和张国立结婚33年,她看到了丈夫的白发和心痛(邓婕和张国立现在怎么样了)

1994年,张国立接拍了宰相刘罗锅和混在北京这两部剧,他的事业也因此开始有所起色。 你看,张默40岁的人了,可他爹张国立却还在一直为他操心。这让张国立十分着急,他对邓婕说:“现在我最放心不下的,就是儿子的婚事…

邓婕:和张国立结婚33年,她看到了丈夫的白发和心痛(邓婕和张国立现在怎么样了)

本来以为『白鹿』在玩抽象,了解以后才发现她对朋友好真诚呀!

然而,深入了解后才发现,『白鹿』参与的过往作品多是在其他平台播出,而这次她想要支持好友常华森的作品《暗河传》,却是在她不太熟悉的平台上线,因此她才会一时不知道如何操作。 她的支持也引发了不少观众的关注,许多人因…

本来以为『白鹿』在玩抽象,了解以后才发现她对朋友好真诚呀!

相声乱像,姜昆于谦同桌,何沄伟李菁破镜重圆,『郭德纲』俩喜讯回应(相声杂谈)

何沄伟与李菁曾是『德云社』的黄金搭档,但在退出『德云社』后,两人分别换了搭档,且不再同台演出。 这几件看似不相关的事件,实际上与『德云社』的影响力息息相关,折射出了『郭德纲』在相声行业中的绝对地位。『郭德纲』看到演出全售罄,心中…

相声乱像,姜昆于谦同桌,何沄伟李菁破镜重圆,『郭德纲』俩喜讯回应(相声杂谈)