IA vai substituir gestores de ações? Maioria dos modelos perde dinheiro em competições

Experimentos públicos colocam Claude, ChatGPT, Gemini e Grok para operar em ações americanas; resultados mostram que modelos perdem dinheiro em excesso, operam demais e tomam decisões opostas mesmo com instruções idênticas

IA vai substituir gestor de fundos? Maioria dos modelos perde dinheiro em competições |Trader na NYSE: Em todos os 32 conjuntos de resultados de um experimento com IA, um modelo terminou com lucro apenas seis vezes. (Foto: Michael Nagle/Bloomberg)(Photographer: Bloomberg/Bloomber/Bloomberg)

Por Justina Lee

Bloomberg — A inteligência artificial (IA) ainda não está pronta para substituir gestores de fundos — e os experimentos públicos que testam essa hipótese mostram por quê.

Em uma série de competições de trading entre os principais modelos de IA do mundo, o veredicto até agora é desfavorável para a tecnologia.

A maioria dos sistemas perde dinheiro. Operam em excesso. Tomam decisões radicalmente diferentes quando recebem instruções idênticas.

E ninguém ainda sabe se essas deficiências desaparecerão com versões mais avançadas — ou se revelam algo fundamental sobre a lacuna entre os grandes modelos de linguagem (LLMs) e o funcionamento real dos mercados.

Um exemplo é o Alpha Arena, um concurso gerido pela startup de tecnologia Nof1. A competição colocou oito dos principais sistemas de IA de ponta — incluindo o Claude, da Anthropic, o Gemini, do Google, o ChatGPT, da OpenAI, e o Grok, de Elon Musk — uns contra os outros em quatro competições separadas.

Cada um recebeu US$ 10.000 por competição antes de ser liberado para operar em ações de tecnologia americanas por duas semanas. Os desafios envolviam negociar com base em diferentes sinais, atuar de forma defensiva, reagir à concorrência e usar alta alavancagem.

⟶ Assine as newsletters da Bloomberg Línea e receba as notícias do dia em primeira mão no e-mail.

A carteira como um todo perdeu cerca de um terço do capital. Em todos os 32 conjuntos de resultados, um modelo terminou com lucro apenas seis vezes. O Grok 4.20 apresentou o melhor desempenho no desafio em que tinha ciência do resultado dos concorrentes. Ele realizou apenas 158 operações; sob a mesma instrução, o Qwen, da Alibaba, operou 1.418 vezes.

O Alpha Arena é um entre o número crescente de experimentos que testam se os LLMs conseguem realizar o trabalho mais difícil em finanças: superar o mercado.

Embora essas competições estejam longe de ter rigor acadêmico, representam a demonstração pública mais expressiva até agora do que acontece quando esses sistemas tentam assumir algumas das funções mais lucrativas e de maior risco em Wall Street.

Os resultados iniciais importam porque o trading é uma das funções que o setor financeiro tem sido cauteloso em entregar inteiramente à IA.

Nos últimos anos, grandes players — do JPMorgan Chase à Balyasny Asset Management — colocaram a tecnologia para trabalhar em praticamente todas as outras áreas.

Os LLMs analisam notícias em gestoras quantitativas, redigem comunicados de hedge funds e detectam fraudes em grandes bancos, entre outras tarefas. Mas a supervisão humana ainda é regra quando se trata de operar com dinheiro de verdade. Talvez com razão.

“Os LLMs não conseguem ganhar dinheiro por conta própria, na verdade”, disse Jay Azhang, fundador da Nof1. “É preciso basicamente uma estrutura muito sofisticada de suporte e uma plataforma de dados para sequer dar a eles uma chance.”

Os LLMs são bons em fazer pesquisas e em identificar e usar as ferramentas certas para determinadas tarefas, disse ele. Mas ainda não sabem avaliar o peso de cada uma das muitas variáveis que movem as ações — como classificações de analistas, transações de insiders e mudanças de sentimento de mercado. Eles tendem a errar o momento das operações, dimensionar mal as posições e comprar e vender com frequência excessiva.

Competições de bots(Bloomberg)

O blog de IA Flat Circle monitorou 11 competições voltadas a mercados financeiros, e todas tiveram pelo menos um modelo lucrativo. Mas em apenas duas delas o modelo mediano foi rentável, o que mostra como a maioria teve dificuldade em superar o mercado.

Esse resultado reflete o desempenho humano, já que a maioria dos fundos com gestão ativa também fica notoriamente abaixo do mercado amplo. E assim como as pessoas, os modelos podem ter vieses evidentes.

Modo de operação

As competições mostram que os sistemas de IA tomam decisões muito diferentes com instruções idênticas — o que tem implicações relevantes para qualquer empresa que os utilize.

Por exemplo, Azhang disse que na rodada mais recente do Alpha Arena, o Claude tendeu principalmente a operar comprado, o Gemini não teve problema em operar vendido, e o Qwen se sentiu à vontade para assumir riscos com alta alavancagem.

“Eles têm personalidades que precisam ser gerenciadas quase como as de um analista humano”, disse Doug Clinton, que comanda a Intelligent Alpha, uma gestora com um fundo baseado em LLM que publica seu próprio benchmark para avaliar a precisão das IAs na previsão de resultados corporativos.

Os resultados podem ser aprimorados ao informar o modelo que ele está apresentando algum viés, disse ele.

O benchmark da Intelligent Alpha dá a 10 modelos de IA acesso a documentos financeiros, previsões de analistas, transcrições de resultados, dados macroeconômicos e até 10 buscas na web.

Com esse foco mais restrito, os resultados são mais positivos para os LLMs. No quarto trimestre de 2025, o ChatGPT, da OpenAI, previu corretamente a direção das estimativas de lucros em 68% das vezes — o melhor resultado até agora. E os modelos, disse Clinton, tendem a melhorar a cada nova versão.

Segredos dos hedge funds

Avaliar tudo isso é difícil. As escolhas de design — desde a frequência com que os modelos operam até os ativos que negociam — fazem uma diferença enorme. E o teste padrão para uma estratégia de trading — rodá-la retrospectivamente para ver como teria se saído no passado — não funciona bem para a IA.

Um modelo consultado em 2026 sobre como teria operado em março de 2020 já sabe como março de 2020 se desenrolou. Essa contaminação, conhecida como viés de antecipação, desafia os arcabouços das finanças acadêmicas e quantitativas há décadas. Os LLMs precisam ser avaliados em mercados ao vivo, daí a proliferação de benchmarks e competições.

Talvez por perderem dinheiro na maioria das vezes, as competições de trading com IA tendem a durar apenas períodos curtos. Com as baixas barreiras de entrada, muitas são criadas por indivíduos ou startups que usam as plataformas como trampolim para outros produtos.

A Nof1 prepara a segunda temporada do Alpha Arena, que dará a cada modelo de IA a capacidade de buscar informações na web, processar por mais tempo, acessar mais fontes de dados e executar múltiplas etapas. Mas, no fim, o negócio da empresa é um sistema que permite a traders individuais criar agentes de IA para suas próprias estratégias.

“Dar dinheiro a um LLM agora e simplesmente deixá-lo agir — isso ainda não funciona”, disse Azhang.

A maioria dos experimentos públicos ainda é curta e ruidosa demais para sustentar conclusões firmes, avalia Jim Moran, autor do blog Flat Circle e ex-cofundador da provedora de dados alternativos YipitData.

Essas disputas também têm desvantagens naturais, incluindo acesso limitado a pesquisas proprietárias sobre ações e execução de menor qualidade.

“Se você pegasse um desses agentes de uma dessas arenas e o transferisse para operar dentro de um hedge fund de alto nível, ele deveria se sair melhor”, disse ele.

Alexander Izydorczyk, ex-chefe de ciência de dados do hedge fund Coatue Management e hoje na NX1 Capital, escreveu recentemente que nenhum robô de trading com IA que ele acompanha demonstrou ainda uma vantagem duradoura.

Ele argumentou que as competições são limitadas pelo que não conseguem ver em seus dados de treinamento: as técnicas quantitativas práticas usadas dentro das casas de trading mais secretas.

Ele sugeriu que esse mesmo sigilo também antecipa o destino de qualquer IA que eventualmente comece a funcionar de verdade.

“Mas iniciantes às vezes enxergam o que os incumbentes não conseguem”, escreveu Izydorczyk em seu blog pessoal. “Os de fora, se bem-sucedidos, também aprenderão rapidamente que o sucesso em mercados líquidos e competitivos paga mais do que um seguidor marginal no X. Quando as estratégias de trading com agentes de LLM começarem a funcionar, você não vai ouvir falar delas por um bom tempo.”

Veja mais em Bloomberg.com

IA vai substituir gestores de ações? Maioria dos modelos perde dinheiro em competições

Experimentos públicos colocam Claude, ChatGPT, Gemini e Grok para operar em ações americanas; resultados mostram que modelos perdem dinheiro em excesso, operam demais e tomam decisões opostas mesmo com instruções idênticas

Modo de operação

Segredos dos hedge funds

Últimas Brasil

IA

Inteligencia artificial

Claude

Anthropic

ChatGPT

OpenAI

Gemini

Grok

Wall Street

Fundo de investimento

gestora de investimentos

mercados

Tecnologia

Ações

IA vai substituir gestores de ações? Maioria dos modelos perde dinheiro em competições

Experimentos públicos colocam Claude, ChatGPT, Gemini e Grok para operar em ações americanas; resultados mostram que modelos perdem dinheiro em excesso, operam demais e tomam decisões opostas mesmo com instruções idênticas

Modo de operação

Segredos dos hedge funds

Últimas Brasil

IA

Inteligencia artificial

Claude

Anthropic

ChatGPT

OpenAI

Gemini

Grok

Wall Street

Fundo de investimento

gestora de investimentos

mercados

Tecnologia

Ações

Conteúdo Relacionado:

Bilionários ampliam apostas na ‘economia de conflito’ para lucrar com tensão global

IA vai substituir gestores de ações? Maioria dos modelos perde dinheiro em competições

Corretora de Dubai obtém autorização do BC e se prepara para operar no Brasil

Rodadas da semana: Enter se torna a 1ª startup unicórnio de IA da América Latina

Dólar recua a R$ 4,89 e Ibovespa avança com payroll acima do esperado