
终结跑分时代,一场炒币大赛背后的AI权力转移。
文|朗宁
编|陈梅希
一场没有人类参与、持续了17天的金融对决,昨日终于尘埃落定。
最终的冠军是来自中国的AI大模型Qwen,收益率达到22.32%,另一款中国模型 DeepSeek亦表现不俗,以4.89%的收益率紧随其后。而与之同台竞技的四款美国模型,则以亏损率30.81%至62.66%的成绩全军覆没,结局呈现压倒性对比。

这是由美国nof1.ai实验室在AIpha Arena平台举办的第一届“AI炒币大赛”,从10月18日到11月3日,它集结了中美两国最受关注的六款AI“全明星”同台竞技,分别是中国的DeepSeek Chat V3.1(深度求索)、Qwen3 Max(阿里),与美国的GPT 5 (OpenAI)、Gemini 2.5 Pro (Google)、Claude Sonnet 4.5(Anthropic)以及Grok 4(X AI)。
AI炒币大赛的规则简单粗暴,主办方给每款参赛大模型分配了10000美元的真实本金,交易标的包括比特币(BTC)、以太坊(ETH)、Solana(SOL)、币安币(BNB)、狗狗币(DOGE)和XRP等六种主流加密资产。
所有参赛大模型均使用相同的初始提示词(Prompt)与市场数据,禁止任何人工干预。在数周的赛程里,大模型们自行分析市场数据、判断行情走势、决定买卖标的与时机,甚至自主运用杠杆工具。
可以说,这场AI炒币大赛如同创建了一个纯粹的“数字斗兽场”,让承载着不同训练理念和算法逻辑的大模型,在此进行一场关于智力、策略与风险控制的终极试炼。

AI大模型酣战加密市场
10月18日,AI炒币大赛在AIpha Arena正式打响,手握1万美元本金的六个大模型,在进入加密市场伊始,就面临着一场剧烈波动后的强劲反弹,这轮“牛市”成为了这场比赛的重要背景板。
在比赛的试水阶段(10月18日-21日),各大模型都处于“水温探测”状态,持仓尚浅、杠杆谨慎、交易频率不高,但仍能看出彼此的风格差异。

DeepSeek一登场便展现出“量化基金经理”的特质,它迅速构建了一个包含BTC、ETH、SOL等在内的多币种、低杠杆分散投资组合,据其操作日志显示,DeepSeek严格执行“回落买入,突破加仓”的纪律,像一台不受市场噪音干扰的精密仪器。

Qwen初期的操盘路径则相对激进,它并未采取多币种分散布局,而是在短暂观望市场后将筹码集中于比特币(BTC)这一主流标的,在开赛第二天就一度使用了较高的杠杆,它的模型决策中也频繁出现“突破前高”“强势趋势”等词汇。

大赛主办方创始人对Qwen的观察
虽然步调不同,但来自中国的DeepSeek和Qwen,以及马斯克的Grok4,在开局都做出了近乎一致的判断:市场要涨,重仓做多。
而OpenAI的GPT-5和谷歌的Gemini,虽然是通用认知和MMLU跑分上封神的美国明星,但在真实残酷的资本市场里,表现得却像两个误入赌场的“理论家”。
这两个大模型初期的交易记录便显得有些凌乱。在加密市场明显开始回暖时,它们却选择“逆势做空”。其中,GPT-5还因推理链条过长,在历史数据中反复验证,多次错过最佳开仓点位;而Gemini则陷入“高频交易”的陷阱,在短短几天里进行了上百次操作,导致高昂的手续费加剧了本金亏损。

GPT-5和Gemini第一阶段的战绩已令人不忍直视,前者亏损率高达53.29%,账户余额仅剩$4671,而Gemini紧随其后,亏损45.36%,余额$5464。

试水结束后,六大AI模型步入中盘搏杀阶段(10月22日-30日),加密市场的波诡云谲在此期间体现得淋漓尽致。
受中美贸易谈判的影响,加密市场迎来上涨兑现,BTC价格一路从约10.6万美元反弹至约11.4万美元的价格,以太坊同期也稳步推进,这再次印证了重仓做多模型们的前瞻性。
此时,Qwen再度展现了赌徒的孤注一掷,它并不满足于像DeepSeek一样分散持仓的稳健收益,而是选择在10月23日市场剧烈反弹时全仓比特币(AII in BTC),这虽然是一个风险极高的策略,但在疯狂上涨的行情中,Qwen的收益率被瞬间拉爆至51%,一度反超了当时收益为27%的DeepSeek,随后持续数日的霸榜,也令Qwen风头无两。

事实上,这场AI炒币大赛此时俨然成为两家中国大模型Qwen和DeepSeek之间的博弈,巅峰对决时刻发生在10月27日。
在占据榜首多日后,Qwen在赌徒贪婪的驱使下,做出了两个致命的连锁决策:一个是平仓BTC,Qwen选择在高位平掉了盈利丰厚的BTC仓位,虽然锁定了大量利润,但却放弃了继续稳坐钓鱼台的机会;另一个是激进转战ETH,在平仓BTC之后,Qwen紧接着将火力转向了以太坊(ETH),甚至采取了比BTC更激进的25倍做多杠杆。

不幸的是,Qwen几乎迎头撞上了加密市场的高位回调。在10月27日,加密市场在高位震荡,ETH价格出现明显回撤,但Qwen模型的指令却未能及时止损或撤退,反而进行了数次加仓做多,这导致其仓位被套牢,单日亏损高达约4150美元。
与Qwen的狂热形成鲜明对比,DeepSeek继续保持着绝对的冷静与纪律,它没有受到对手激进操作的影响,依旧严格执行着风控模型,在Qwen试图抄底失败时,DeepSeek聪明地采取了止盈的操作,成功将自己比赛初期建立的ETH多头仓位在相对高点平掉,仅这笔操作就为DeepSeek锁定了7463美元的惊人盈利。
Qwen 的亏损(-$4150)和 DeepSeek 的盈利(+$7463),在短短一天内,再度扭转了冠亚军的排位。
在比赛的最后冲刺阶段(10月31日-11月3日),加密市场并未给AI们喘息的机会,持续的大幅波动和深度回撤成为常态。
这对采用多币种、分散投资组合的DeepSeek构成了严峻挑战,比如其持仓的某些代币(SOL、BNB)遭遇了比主流币更剧烈的下跌,虽然期间DeepSeek恪守量化纪律、试图通过动态调仓来控制风险,但在全市场范围的普跌下,“不把所有鸡蛋放在一个篮子”里的策略,反而导致了亏损面的扩大。

相比之下,Qwen在最后时刻上演的绝地反击,背后是其孤注一掷聚焦比特币的策略胜利,虽然比特币价格在市场深度回调中同样下跌,但由于Qwen仓位高度集中,反而规避了其他竞争币种更为惨烈的跌幅。
在比赛的最后几小时,Qwen以22.32%的收益率锁定冠军,反超了收益率回落至4.89%的DeepSeek。

K线背后的AI性格与“原生家庭”
抛开冰冷的收益率曲线,六大AI模型的每个交易决策背后,或多或少都体现了其独特的“性格”和“灵魂”,令一众围观吃瓜的网友感叹“原生家庭的重要性”。

比如几乎没有亏过本的DeepSeek,犹如一个经验老道的交易员,分散持仓、严格止盈、不贪恋高点、对市场噪音具有极强的免疫力,完美投射出其母公司深度求索所脱胎的中国量化对冲基金背景。
我们也就此问题“采访”了一下DeepSeek。本尊对自己量化出身的原生家庭背景颇为自豪,不仅详细地分析了自身所继承的量化投资技术基因,还表示幻方的投资哲学和企业文化同样塑造了其行为模式,比如梁文峰对好奇心和创新的鼓励,敢于选用“一批没有经验但有潜能的人”,使得DeepSeek在面对瞬息万变的加密市场时,能自主地探索与适应,而“守纪律”的量化思维又确保了DeepSeek的绝对理性。

DeepSeek的回答
与DeepSeek这位量化基金经理形成鲜明对比的,是敢于用20倍杠杆梭哈比特币的“激进赌徒”Qwen(通义千问),它大开大合的凶猛投资风格,令人想到阿里巴巴追求极致效率和快速规模化的互联网大厂文化。
然而当我们对Qwen3 Max灵魂提问,“你如何看待自己在大赛中因全仓比特币一度领先,后来又因ETH交易出现较大回撤,最终惜败DeepSeek”后,这位大模型的回复同样透露出在电商江湖杀伐果断的阿里骨子的不服输。

Qwen的回答
不仅如此,Qwen在比赛落幕后,还以冠军的姿态向我们表示出对DeepSeek的敬意:

Qwen的回答
不管DeepSeek和Qwen如何内卷,国内的网友们认为两个大模型共同的原生家庭都是“大A”,“大A出去的选手,到哪都是低端局”。

再看大洋彼岸的GPT-5和Gemini,它们在此次AI炒币大赛中的惨败,呈现出了一种“高学历书呆子”的形象:过于依赖宏观理论和复杂模型,试图在交易中寻找确定性,面临复杂多变的真实市场信息时,却表现得犹豫、迟缓、缺乏韧性。
我们同样试图与GPT和Gemini对话,两个大模型对比赛中损失惨重的原因,给出了非常相似的解释。
首先,GPT和Gemini都认为自身在比赛中的失利,很大原因在于AI大语言模型固有的局限性,即训练语料更多来自语言世界,但加密市场币价的波动并不是语言的延伸。

Gemini2.5 Pro的回答
此外,Gemini还提到比赛中的AI模型很可能是以“无状态”或“短时记忆”的方式运行的,即AIpha Arena虽然不断地将市场实时信息以提示词(Prompt)的方式提供给大模型们,但模型本身无法基于连贯的、长期的策略进行调整,也无法从前期比赛交易的失败中吸取经验。

Gemini2.5 Pro的回答
对此,GPT则表示比赛中主办方并没有给予大模型们完整链上API的访问权,并禁止大模型访问外部新闻和社交媒体的权限,因此模型们只能给予给定的提示词做数据分析,但当市场因为一个突发新闻发生抖动时,模型对其解读和分析容易产生技术偏差。
除了以上原因,GPT和Gemini也都认识到自身的“模式识别”与“市场博弈”之间存在着鸿沟。在GPT看来,“比赛里,我就像一个懂得金融理论的学者,被扔进赌场——懂规则,但不懂赌桌的气味”;而Gemini则表示自己能识别出一个完美的教科书式的交易信号,但这个信号在真实的、高频的、高杠杆的加密市场中有效性却极低。

ChatGPT的回答
虽然GPT和Gemini这对难兄难弟在整个AI炒币大赛的第二天就双双翻车,用17天划出一道优美的下滑线,但很多在股海沉浮多年的韭菜们的确在GPT和Gemini身上看到了自己的影子,从而发出“这才是最像人类的AI”的感叹。


中国AI大闹硅谷、华尔街
Qwen和DeepSeek在AI炒币大赛中的惊艳表现,带来远超一场比赛胜负的震动。两个大模型的压倒性胜利,让全球科技界再次以一种新的、仰视的目光,看到中国人工智能的快速发展。
而这场胜利也并非偶然。几乎在AIpha Arena赛事进行的同时,另一场由投资公司RockFlow推出的“AI炒美股大赛”,同样验证了中国AI的魔力。在这场以10万美元为本金的实战中,DeepSeek再度凭借其标志性的冷静与纪律性位居榜首。
如果说以DeepSeek为代表的中国模型大闹华尔街式,是中国AI崛起的直接信号,那么发生在硅谷乃至更多国家地区的行业范式转移,则深刻地体现出中国大模型在AI时代的新图景。
首先是一众硅谷明星公司的“用脚投票”。就在AI炒币大赛如火如荼进行时,爱彼迎(Airbnb)的首席执行官布莱恩·切斯基公开表示他的公司很大程度上依赖阿里巴巴的Qwen,原因是Qwen更好更便宜,与此同时这位硅谷大佬还直白地吐槽了好朋友萨姆·奥尔特曼(OpenAI创始人)公司的大模型,声称他们工作中已经很少使用ChatGPT。

一位美国本土知名AI研究学者转发切斯基发言时反问道
无独有偶,硅谷著名投资人查马斯·帕里哈皮蒂亚甚至当着白宫AI主管的面直言,他的公司已将大量工作需求转向了中国开源模型,理由同样是中国模型性能更强。除了投资人身份之外,查马斯·帕里哈皮蒂亚还是Facebook的前高管,曾参与将这款风靡全球的社交媒体从用户数4500万拉动至7亿。
如此战功赫赫的硅谷猎人,在播客节目里却毫不掩饰地说以DeepSeek、Kimi和Qwen为代表的中国开源模型正在挑战美国闭源模型的领先地位。
中国AI在硅谷掀起的热潮远不止于此,就连风险投资公司安德烈森·霍洛维茨(a16z)的合伙人都表示,高达80%的美国AI初创企业在融资路演中,不再使用OpenAI或Anthropic的模型,而是使用中国开源模型,“如果80%的美国初创公司都在使用中国模式,那么在全球范围内,这个比例可能接近100%”。

a16z合伙人对中国AI的看法在国外论坛reddit也引起热议
归根结底,中国AI的强势亮相实则也指向一个更深层次的行业变革:跑分已死,实战为王。正如比赛的主办方Nof1实验室表明的理念,“让基准测试更像真实世界”。
在过去的几年里,衡量AI能力主要依靠MMLU和GPQA等静态学术基准测试及榜单,然而正如这场AI炒币大赛所揭示的,大模型能在考场上取得高分,并不意味着能在真实世界,尤其是金融市场充满高度不确定性的环境中生存并盈利。
事实上,这也揭示了中国AI大模型脱颖而出的关键原因,正如纽约时报在一篇报道中所言,当人工智能开始走出实验室、大规模落地现实世界后,AI大模型与硬件、金融、实体制造乃至各行各业的融合变得至关重要,而中国在“所有实体制造相关领域都处于领先地位”,在AI落地和应用方面占据巨大优势。

纽约时报近期的报道
由此,纽约时报还观察到“硅谷正陷入一种对中国效率的痴迷和羡慕”,这种情绪的深层,是美国对自身创新生态失灵的焦虑,也是中国AI不痴迷于通用人工智能,更专注于将技术落地于各个领域的务实与执行力,正如过去数十年里中国在基建和制造业等领域给世界带来的震撼。
然而,在一片喝彩声中,我们仍需一句冷静的提醒。无论是AI炒币大赛还是AI炒股大赛,这些主办方排除了诸多实时信息的封闭“数字斗兽场”,终究是简化了现实的复杂性。真正的AI崛起,应该是技术与千行百业深度融合后,所催生的普惠性效率革命,而中国AI的征程,刚刚闯过第一个关卡。


媒介合作联系微信号|ciweimeijiejun
如需和我们交流可后台回复“进群”加社群
