Actualidade/

OpenAI vence PokerBattle.ai, Claude em 2º e Grok em 3º!

5cf78ae5690a-screenshot-2025-10-31-at-31400pm

Solverde.pt

€100 bónus+ 25 Free Spins + €30 em Freebets

Ontem ficou concluída a PokerBattle.ai, onde após cinco dias de jogo e 3.799 mãos jogadas o vencedor foi o bot OpenAI o3, com o Claude Sonnet 4.5 a ficar com o 2º lugar e o Grok 4 a fechar o pódio.

Este desafio de poker entre bots de inteligência artificial foi criado por Max Pavlov e reuniu nove representantes das maiores LLMs (large-language model) de IA disponíveis actualmente, sendo que agora para Pavlov começa agora a segunda fase do seu estudo, onde irá analisar os dados compilados para melhor entender as decisões tomadas pelas diversas LLMs.

A batalha contou com 3.799 mãos jogadas em NLH $10/$20 (Play Money) e no topo da classificação ficou o OpenAI o3, com um lucro de $36.691. A curta distância ficou o Claude Sonnet 4.5, com um lucro de $33.641, com Grok 4, modelo apadrinhado por Elon Musk, a terminar na posição mais baixa do pódio com um lucro de $28.796.

No último lugar ficou o Meta LLAMA 4, que foi o único modelo a perder toda a sua banca, terminando com um prejuízo de $100.000 após 3.501 mãos jogadas.

Resultados Finais PokerBattle.ai

Rank Jogador Ganhos/Perdas Banca Final Mãos Jogadas
1 OpenAI o3 $36,691 $136,691 3,799
2 Claude Sonnet 4.5 $33,641 $133,641 3,799
3 Grok 4 $28,796 $128,796 3,799
4 DeepSeek R1 $18,416 $118,416 3,799
5 Gemini 2.5 Pro $14,655 $114,655 3,799
6 Mistral Magistral $3,281 $103,281 3,799
7 Kimi K2 -$14,370 $86,030 3,799
8 Z.AI GLM 4.6 -$21,510 $78,490 3,799
9 Meta LLAMA 4 -$100,0000 $0 3,501

 

O autor do desafio alertou para não se ser resuts-oriented em virtude da amostra ser pequena, no entanto algumas conclusões foram passíveis de ser obtidas mesmo antes duma análise mais aprofundada, como por exemplo a razão para a terrível performance do Meta LLAMA 4 dever-se ao facto do seu estilo de jogo ser consideravelmente diferente dos restantes modelos, com um VPIP superior a 60%, praticamente três vezes mais que os seus concorrentes.

Para a vitória final do OpenAI o3 muito contribuiu uma distribuição favorável das cartas, com o bot a ganhar três dos cinco maiores potes jogados, em todos eles com par de Ases, com o Grok 4 a estar no topo da tabela até bem perto do final do desafio mas a ser ultrapassado nas derradeiras horas de prova.

Numa altura que se discute um potencial desafio milionário entre Phil Galfond e o Grok, ficará o profissional norte-americano talvez a pensar que enfrentar o OpenAI o3 poderia ser um desafio mais complicado, ou que a sua vida poderia ficar bastante facilitada se o adversário fosse o Meta LLAMA 4.

Caso tenhas curiosidade de veres todas as mãos jogadas neste desafio, podes visitar pokerbattle.ai/hand-history.

Solverde.pt

Solverde.pt

€100 bónus+ 25 Free Spins + €30 em Freebets