OpenAI vence PokerBattle.ai, Claude em 2º e Grok em 3º!


Solverde.pt
Solverde.pt
€100 bónus+ 25 Free Spins + €30 em Freebets
Ontem ficou concluída a PokerBattle.ai, onde após cinco dias de jogo e 3.799 mãos jogadas o vencedor foi o bot OpenAI o3, com o Claude Sonnet 4.5 a ficar com o 2º lugar e o Grok 4 a fechar o pódio.
Este desafio de poker entre bots de inteligência artificial foi criado por Max Pavlov e reuniu nove representantes das maiores LLMs (large-language model) de IA disponíveis actualmente, sendo que agora para Pavlov começa agora a segunda fase do seu estudo, onde irá analisar os dados compilados para melhor entender as decisões tomadas pelas diversas LLMs.
A batalha contou com 3.799 mãos jogadas em NLH $10/$20 (Play Money) e no topo da classificação ficou o OpenAI o3, com um lucro de $36.691. A curta distância ficou o Claude Sonnet 4.5, com um lucro de $33.641, com Grok 4, modelo apadrinhado por Elon Musk, a terminar na posição mais baixa do pódio com um lucro de $28.796.
No último lugar ficou o Meta LLAMA 4, que foi o único modelo a perder toda a sua banca, terminando com um prejuízo de $100.000 após 3.501 mãos jogadas.
Resultados Finais PokerBattle.ai
| Rank | Jogador | Ganhos/Perdas | Banca Final | Mãos Jogadas |
|---|---|---|---|---|
| 1 | OpenAI o3 | $36,691 | $136,691 | 3,799 |
| 2 | Claude Sonnet 4.5 | $33,641 | $133,641 | 3,799 |
| 3 | Grok 4 | $28,796 | $128,796 | 3,799 |
| 4 | DeepSeek R1 | $18,416 | $118,416 | 3,799 |
| 5 | Gemini 2.5 Pro | $14,655 | $114,655 | 3,799 |
| 6 | Mistral Magistral | $3,281 | $103,281 | 3,799 |
| 7 | Kimi K2 | -$14,370 | $86,030 | 3,799 |
| 8 | Z.AI GLM 4.6 | -$21,510 | $78,490 | 3,799 |
| 9 | Meta LLAMA 4 | -$100,0000 | $0 | 3,501 |
O autor do desafio alertou para não se ser resuts-oriented em virtude da amostra ser pequena, no entanto algumas conclusões foram passíveis de ser obtidas mesmo antes duma análise mais aprofundada, como por exemplo a razão para a terrível performance do Meta LLAMA 4 dever-se ao facto do seu estilo de jogo ser consideravelmente diferente dos restantes modelos, com um VPIP superior a 60%, praticamente três vezes mais que os seus concorrentes.
Para a vitória final do OpenAI o3 muito contribuiu uma distribuição favorável das cartas, com o bot a ganhar três dos cinco maiores potes jogados, em todos eles com par de Ases, com o Grok 4 a estar no topo da tabela até bem perto do final do desafio mas a ser ultrapassado nas derradeiras horas de prova.
Numa altura que se discute um potencial desafio milionário entre Phil Galfond e o Grok, ficará o profissional norte-americano talvez a pensar que enfrentar o OpenAI o3 poderia ser um desafio mais complicado, ou que a sua vida poderia ficar bastante facilitada se o adversário fosse o Meta LLAMA 4.
Caso tenhas curiosidade de veres todas as mãos jogadas neste desafio, podes visitar pokerbattle.ai/hand-history.









