GPT에 코인 거래 시켰더니 ‘-60%’...똑똑할수록 투자 못했다 [1]
Minerals : 116,952,791 / Level :

준장
2025-11-05 21:32:26 (3일 전) / READ : 102
인공지능(AI) 모델 6종에 약 2주간 가상 화폐 투자를 시켰더니, 중국산 AI 2종만 수익을 냈다. 오픈AI의 GPT, 구글의 제미나이 등 빅테크의 유명 모델들은 모두 큰 손실을 기록했다.
AI 트레이딩 업체 ‘Nof1′은 지난달 18일부터 이달 3일까지 주요 거대언어모델(LLM) 6종에 1만달러(약 1445만원)를 지급하고, 가상 화폐 거래소인 하이퍼리퀴드에서 인간의 개입 없이 자동으로 투자하도록 했다. 실제 시장에서 AI의 투자 능력을 겨루는 이 플랫폼은 ‘알파 아레나’라는 이름이 붙었다. 이번 첫 테스트에서는 비트코인, 이더리움, 솔라나, BNB, 도지, 리플 등 6개 인기 가상 화폐로 거래가 제한됐다. 거래 행동은 롱(매수 포지션), 숏(매도 포지션), 홀드(유지), 클로즈(포지션 정리)로 나뉘었다.
3일 종료된 첫 테스트에서, 중국 알리바바의 ‘큐원3-맥스’는 22.32% 수익률을 기록했다. 중국 딥시크의 ‘챗 V3.1’은 4.89% 수익률로 2위였다. 반면 미국의 대표 AI 모델들은 형편없는 투자 실력을 보였다. 클로드의 소넷 4.5는 -30.81%, xAI의 그록 4는 -45.3%, 구글의 제미나이 2.5 프로는 -56.71%의 수익률로 큰 손실을 봤다. 특히 GPT-5는 -62.66% 수익률로 최악의 성적을 기록했다.
이번 테스트에 참여한 AI 모델 중 유일하게 알리바바 큐원 모델은 사람처럼 생각하는 ‘추론’ 기능이 없었다. 가상 화폐를 살지 팔지에 대해 깊게 시뮬레이션하지 않고 결론을 내렸다는 것이다. 큐원은 또 손절이나 익절 목표 폭도 보수적으로 유지해, 큰 손실 없이 작은 이익을 지속적으로 쌓았다. 한 번 걸 때 무리하게 크게 베팅하지 않고, 거래 횟수도 많지 않았다. 시장이 흔들리는 구간에서 안정적으로 수익을 보전한 것이다. 딥시크 모델 역시 변동성이 커지면 포지션을 줄이고, 목표에 가까워지면 망설이지 않고 이익을 확정지었다.
반면 주요 모델들은 생각을 너무 많이 한 것이 독이 됐다. GPT-5는 오랫동안 고민하느라 이익 실현이 느렸다. 소넷은 상승에만 치우쳐 가격 하락 포지션을 거의 취하지 않았다. 제미나이는 거래를 너무 자주 해 수수료 비용을 많이 냈다. 그록은 한 포지션을 너무 오랜 기간 유지했다.
Nof1은 “한 번의 결과로 최상의 거래 모델이 결정됐다는 것은 아니다”라며 “시즌 2에서는 더 많은 기능을 도입하고, 프롬프트를 개선해 통계적 엄격성을 더 강화할 계획”이라고 했다.
보러가기