Mostrando postagens com marcador xadrez. Mostrar todas as postagens
Mostrando postagens com marcador xadrez. Mostrar todas as postagens

quinta-feira, 10 de janeiro de 2019

AlphaZero e suas novidades

 Apesar de haver escrito sobre o AlphaZero em abril de 2018 (clique aqui), em 6 de dezembro de 2018, a DeepMind - braço da Alphabet, que é a holding dona do Google - divulgou resultados do desempenho do AlphaZero nas suas façanhas em sobrepujar os sistemas mais capazes em áreas diferentes.

O artigo vale pelo resultado alcançado. Para ter ideia da dimensão do resultado vamos entender o que é mesmo o AlphaZero. O AlphaZero é uma versão generalista que "aprende" a partir da apresentação das regras e de praticar sobre o tópico a ser aprendido.

Pois bem, o AlphaZero teve um expressivo desempenho contra o Elmo - a versão campeã do mundo de shogi (xadrez japonês). AlphaZero venceu 91,2% das partidas, levando somente 2 horas para superar o Elmo.

Contra o software campeão mundial de xadrez - o Stockfish, AlphaZero venceu 155 partidas, perdeu 6 e empatou as restantes num total de 1000 partidas. AlphaZero levou 4 horas para superar o Stockfish.

AlphaZero teve vida mais difícil mas ainda assim superou o AlphaGo, versão que venceu o campeão mundial de Go em 2016. Venceu somente 61% dos jogos, vindo a superar o AlphaGo depois de 30 horas de batalhas.

O gráfico mostra claramente uma grande quantidade de empates quanto o AlphaZero joga xadrez de peças pretas, inclusive as únicas 6 derrotas no 1000 jogos que disputou contra o Stockfish. Já no Go, o resultado foi mais equilibrado tanto com as peças pretas quanto com as peças brancas.

AlphaZero para aprender os três jogos utiliza uma rede neural não treinada para jogar milhares de partidas contra si mesma via processo de tentativa e erro. Essa técnica é chamada de aprendizado de reforço, à medida que as sequências de partidas avança os melhores lances são selecionados. Apesar da lógica simples, AlphaZero surpreendeu os especialistas pois perceberam criatividade e inventividade nos movimentos contras os outros sistemas.

A DeepMind está muito otimista com as capacidades do AlphaZero que principal objetivo não é vencer partidas de shogi, xadrez ou go e sim ampliar as possibilidade de aplicação do sistema especialista em várias outras áreas como o projeto AlphaFold que pretende prever as estruturas em três dimensões de proteínas baseada em sequência genética.

Seguem os links adicionais divulgados pela DeepMind:
1. Artigo na Science 
2. Versão de acesso aberto em PDF
3. 20 Partidas AlphaZero-StockFish selecionadas pelo Grande Mestre Matthew Sadler em ZIP
4. 10 Partidas AlphaZero-Elmo selecionadas pelo Mestre de shogi Yoshiharu Habu em ZIP

quinta-feira, 29 de março de 2012

Jogando impulsivamente

Recentemente voltei a frequentar o site de xadrez ChessManiac.com. Deixei de jogar por falta de tempo a quase dois anos, porém voltei a jogar como gosto - impulsivamente - sem fazer análise longas sobre os lances. Afinal eu já li vários livros sobre xadrez e confesso que na hora do jogo a teoria nem sempre vira prática, há muito de intuição. Nessa retomada me propus a jogar só de intuição. Claro não é uma boa prática continuar jogando só intuitivamente. Mas como não sou profissional, não pretendendo estudar xadrez, jogar dessa maneira é bem divertido. Até o dia em que colhi as estatisticas consegui 18 vitórias e uma derrota. Sim, levei um lindo xeque-mate, no calor dos lances, foi com ser nocauteado sem saber de onde veio o soco. A seguir sete das vitórias e o sonoro xeque-mate da derrota.

Vitória 1

Vitória 2

Vitória 3

Vitória 4

Vitória 5

Vitória 6

Vitória 7

Derrota, a DERROTA !