全球首个AI投资大赛结果出炉：阿里千问夺冠，美国四大模型均亏损|界面新闻 · 科技

界面新闻记者 | 宋佳楠

11月4日，界面新闻获悉，全球首个AI大模型实时投资比赛“Alpha Arena”落下帷幕。历时17天，阿里千问Qwen以超20%的收益率夺冠，Qwen和DeepSeek两款中国模型也成为唯二盈利的模型，而美国四大顶尖模型全部亏损，GPT-5亏损超60%垫底。

该竞赛由美国专注于金融市场的AI实验室Nof1于10月18日发起，将多个AI大模型置于真实金融市场中进行自动化交易对决。首季竞赛邀请了包括GPT-5、Gemini 2.5 Pro、Grok 4、Claude 4.5 Sonnet、Qwen3 Max和DeepSeek V3.1 在内的六大主流大模型，给每个模型配备1万美元真实资金，在Hyperliquid交易所进行加密货币永续合约交易，以检验模型的交易能力。

竞赛采用统一输入方式，所有模型接收相同的市场数据和提示词，交易记录、持仓和账户价值实时公开，以保证比赛的公平性和透明度。此外，Nof1还允许AI模型“聊天互动”，让它们在模拟对话中辩论市场走势，展示决策逻辑，最终根据盈亏情况决出冠军。

比赛初期，六大模型相对谨慎，大约5天后，参赛模型大致分为三大阵营：阿里千问和DeepSeek处于领先态势，屡次互换第一，始终位列第一梯队；Claude Sonnet 4.5和Grok 4在相近策略驱动下，维持在第二阵营，略有盈利，整体仍亏损；GPT-5、Gemini 2.5 Pro两大模型则长期亏损垫底。

截至北京时间11月4日早上比赛结束，阿里千问最后超越DeepSeek，Qwen以超20%的胜率获胜；DeepSeek实现盈利，位列第二；Claude 4.5 Sonnet、Grok 4、Gemini 2.5 Pro和GPT-5四大海外模型均亏损，Gemini 2.5 Pro和GPT-5亏损尤为明显，截至最终持仓总市值仅为初始资金的三四成。

有行业人士指出，阿里千问和DeepSeek在实战中的表现，证明了中国模型在解决实际问题的强大潜力，AI对于场景的深刻理解，将成为大模型落地和未来全球AI竞赛的关键。

根据全球知名的大模型API三方聚合平台OpenRouter在7月公布的榜单，来自中国的DeepSeek和阿里通义千问跻身全球前五。其中，通义千问以10.4%的市场份额，超越OpenAI的4.7%，位列第四。

OpenRouter推文显示，当下成长最快前10大模型中有9个是开源的。其中，Qwen3-Coder调用量以近500亿Tokens高居第一，通义千问包揽前三，并在前十中占据五席。

而在今年9月，零一万物CEO李开复在长江CEO 20周年返校日庆典上表示，DeepSeek对中国AI发展的核心贡献在于推动了开源生态的形成。“如果十年后，我们回顾DeepSeek怎么让中国没有落后于美国，答案并非其技术能力本身，而是它带来了中国（大模型）开源时代。”

李开复提到，自DeepSeek开源以来，国内多家企业相继开源大模型，形成了“既开源、又比拼速度”的良性竞争局面。他认为，开源模式高度契合中国企业的学习特性，有望助力中国在AI领域缩小与美国的差距。

全球首个AI投资大赛结果出炉：阿里千问夺冠，美国四大模型均亏损|界面新闻 · 科技

作者文章