火星财经消息,10 月 20 日,专注于金融市场的人工智能研究实验室 nof1 于 18 日开始一项大模型交易测试 Alpha Arena。该测试使用 6 个主流 AI 大模型(GPT-5、Gemini 2.5 Pro、Grok-4、Claude Sonnet 4.5、DeepSeek V3.1、Qwen3 Max),每个模型都在 Hyperliquid 上获得 10,000 美元的真实资金,并具有相同的提示和输入数据。 截至发稿,DeepSeek、Grok、Claude 分别以 40.14%、35.49%、24.54% 收益率位列前三,Gemini 2.5 Pro 则已浮亏 30.46%。
发表评论 取消回复