PokerPT.com

Jogadores/

Claudico, o poker bot, pelos olhos de Jason Les

Jason Les é uma das estrelas de cash game das mesas de high-stakes, mas recentemente brilhou nas mesas das World Series Of Poker 2015 - duas final tables, um 2º lugar no $3.000 NLHE Shootout e um 3º lugar no $10.000 Pot-Limit Hold'em Championship - elevando o jogo de torneio do jovem de 29 anos que já este ano defrontou Claudico.
 
Claudico, o poker bot da Universidade de Carnegie Mellon, digladiou-se frente a Douglas Polk, Bjorn Li, Dong Kim e Jason Les, com o último a ser o único com saldo negativo perante a máquina de $80.000 nas 20 mil mãos que jogou individualmente. Les falou desta experiência, dos resultados nas WSOP, das mesas de high-stakes e mais em entrevista à CardPlayer.
 
P: Como foi o verão nas WSOP? Como sentes que jogaste?
 
R: Tradicionalmente eu não me considero um jogador de torneios, mas no último ano tenho jogado mais. Assim este foi o primeiro verão em que joguei muitos eventos. Como só jogo no-limit, joguei bastantes desses. Estava preparado para o pior cenário em termos de resultados, mas estou feliz de como as coisas resultaram. O 2º lugar logo ao segundo torneio e o 3º lugar uma semana depois deram-me algum descanso, visto que estava a freerolling o resto do verão. O lucro estava garantido, só faltava saber quanto seria. Ter resultados logo à partida entusiasmou-me para voltar e tentar alcançar mais mesas finais. Não dava grande importância às braceletes, mas quando chegas perto queres tentar outra vez. Não joguei muito cash este verão porque passei muitas horas nos torneios. As horas que estive fora dos torneios passei a estudar (o jogo) ou a conviver com amigos. Contente por já ter chegado ao fim e poder relaxar por um pouco.
 
P: Podes falar das estratégias aplicadas por ti e pela equipa dos "humanos" para derrotar o poker bot Claudico este ano?
 
R: Como o Claudico não faz ajustes, o seu jogo é seguir o equilíbrio de Nash o mais próximo possível e esperar que não o consigamos bater. Exploramos todas as fraquezas que encontramos, de forma repetida. Não precisávamos de nos preocupar com sermos "detectados" por estarmos a fazer algo de forma consecutiva. Como tal o nosso estilo soltou-se bastante. Diferentes e estranhos tamanhos de apostas é um exemplo de algo que o confundia. Tirámos partido do facto do Claudico não ter blockers em consideração quando fazia ou quando estava do outro lado do bluff. Por exemplo, tentava representar o nut-flush, sendo que eu é que teria o nut-flush blocker na mão. Eu reconheceria que ele estava a fazer bluff e podia fazer call com um range maior de mãos. Por outro lado também podia usar os blockers da minha mão em bluff e conseguir grandes folds. Mas a maior parte do jogo dos blockers foi agarra-lo em bluff. Foi dos aspectos mais importantes. Jogou-se alguns potes mesmo grandes. O Claudico metia bem a pressão no river com apostas grandes de all-in, o que era bom na generalidade dos casos. A sua estratégia no river era muito difícil de jogar contra, mesmo tendo nós agarrado muitos dos bluffs. Outro aspecto que nos deu vantagem foi o facto de o Claudico não reconhecer alguns tamanhos de apostas, porque há um limite para a quantidade de informação e computação que está disponível. Não é possível programar uma resposta para todos os valores de aposta. Eles programam 1/4, 1/2, 3/4, pote ou 1.25, por exemplo. Se apostares um valor intermédio o computador irá arredondar para cima ou para baixo. O que isto faz é ele começar a lidar com os tamanhos das apostas de forma diferente do que eles na realidade são.
 
P: Então essas grandes over-bets no river eram muito polarizadas?
 
R: Sim. Eu dou muito crédito na criação dessa componente no river. Era polarizada. Podia ser "ar" ou "nuts" ou perto disso, tudo ao mesmo tempo. Tinhas que ter um bom entendimento da teoria e no que se estava a passar para jogares apropriadamente. Não podes largar sempre. Era muito complicado. Estão $500 no pot e o Claudico faz all-in de $19.750. Tens que pensar bem no teu range e com o quê é que queres igualar. Os blockers entravam muito em jogo aqui. A equipa da CMU está atenta aos blockers e ao que se passou na mesa. Embora tenhamos sacado vantagem até agora, penso que eles estarão a reprogramar e ter isso em consideração. Não será não fácil de explorar.
 
P: Essa estratégia de over-betting no river é algo que se vê nas mesas de high-stakes HU entre humanos, porquê?
 
R: Contra o Claudico estávamos a jogar 200 BBs, enquanto que online começamos com 100 BBs. Os humanos raramente têm uma estratégia como a do Claudicos, no river, porque é muito complicado de a balancear apropriadamente. O computador conseguia fazer coisas com o equilíbrio perfeito. As apostas grandes são sempre complicadas para os humanos devido ao duelo bluff ou valor. Por vezes o Claudico fazia slow play de algumas mãos, por vezes apostava, noutras fazia check. Não era possível adivinhar a mão do Claudico só porque ele fez "aquilo". Houve casos em que se fosse um humano seria impossível ter o nuts ali, porque nunca fariam slow play naquela board, ao contrário do Claudico, pois podia ter decidido jogar assim aquela mão. Ele fazia check a board toda e fazia all in no river com nuts. A maioria dos humanos não o faz porque não é a melhor forma de conseguir valor da mão. É muito difícil para um humano aplicar esta estratégia com a frequência e mãos apropriadas.
 
P: Qual achas ser o futuro para estes bots e quando se diz que é "imbatível" o que tal quer mesmo dizer?
 
R: Penso que o futuro é forte para os poker bots. A malta da CMU é extremamente inteligente e competente no que faz. É fascinante sentar e falar com eles e ouvir o que aprenderam sobre o jogo. Não são jogadores profissionais. São cientistas dos computadores que enveredaram por este projecto e fizeram um bot que, mesmo que tenha perdido 9/100 BBs, se bateu com os melhores do mundo. Num ano ou dois espero que esta equipa faça muito e bom progresso. Podemos ver um bot the HU no-limit imbatível. O que significa, o que estão a tentar fazer, é um bot que jogue o equilíbrio de Nash em que a pior win-rate seja de 0/100 BBs. Ou seja, não é possível perder. O objectivo não é ganhar mais. Não é um bot que tenta explorar o adversário. O objectivo é que jogue o Game Theory Optimal de forma a que não possa perder. O que quer dizer que a win-rate do bot é a que o adversário permitir. Não me parece difícil fazer este teste daqui a dois anos e os resultados serem um "empate estatístico". Quem sair com dinheiro será por muito, muito pouco.
*foto cortesia PokerListings
 
Clica aqui para leres outras respostas de Les.