GitHub - NiMouh/AI-ChessBot: Small Python Chess Game App & Chess Bot with heuristic search using Minimax Algorithm

NiMouh / AI-ChessBot Public

Notifications You must be signed in to change notification settings
Fork 0
Star 0

Small Python Chess Game App & Chess Bot with heuristic search using Minimax Algorithm

Notifications

Name		Name	Last commit message	Last commit date
Latest commit History 41 Commits
.idea		.idea
README.txt		README.txt
Relatório.pdf		Relatório.pdf
chessboard.png		chessboard.png
client.py		client.py
client_a_bit_smart.py		client_a_bit_smart.py
client_random_moves.py		client_random_moves.py
main.py		main.py
server.py		server.py
tiago_simao_2022_11_21_19_22_46_log.txt		tiago_simao_2022_11_21_19_22_46_log.txt
tiago_simao_2022_11_21_19_26_17_log.txt		tiago_simao_2022_11_21_19_26_17_log.txt
tiago_simao_2022_11_21_19_29_13_log.txt		tiago_simao_2022_11_21_19_29_13_log.txt

Repository files navigation

Objetivo principal

Neste trabalho prático tem como finalidade entender a representação do estado do jogo, pesquisa em árvore, algoritmos de busca e o desenvolvimento a melhor heurística para ajudar a determinar qual a melhor jogada a fazer.
Para atingir o desenvolvimento da heurística é importante considerar que, devido à quantidade imensa de jogadas possíveis no xadrez, vamos apenas fazer uma pesquisa de profundidade 3 a cada decisão de jogada feita, ou seja,
vamos apenas prever para as 3 jogadas seguintes que irão ser feitas no jogo (incluindo as do adversário) e determinar aquela onde o nosso jogador tem a melhor pontuação possível (maximizador) e o seu adversário tem a pior pontuação possível (minimizador), isto é possível usando o algoritmo "minimax".
Mesmo fazendo a pesquisa de apenas 3 de profundidade, continuam a ser avaliados milhares de casos onde já existe uma melhor jogada possível, para evitar isto vamos usar o algoritmo "alpha-beta prunning" e permitir que as avaliações futuras na heurística sejam de maior complexidade sem comprometer o desempenho do programa.

#1 Abordagem

Inicialmente, foi usado como inspiração o código fornecido na página da cadeira denominado "client_a_bit_smart.py". Nele continha parte das funções para auxiliar o desenvolvimento deste trabalho e permitir um foco maior na função objetivo, sendo ela a maior diferenciação na complexidade dos trabalhos.
A função objetivo recebe o estado atual, recebe o estado atual e o qual jogador é que esta a ser jogado com (1 para as brancas, 0 para as pretas) e devolve uma pontuação que irá ser atribuída para esse estado. A função contida no código seguinte tinha a seguinte ordem de ideias:

— Dar peso às jogadas para avisar que as peças se mantenham na defensiva durante muitas jogadas

— Declaração das peças brancas e pretas em modo ‘string’ (a, h = torres; b, g = cavalos; c, f =bispo; d= rainha; e = rei; restantes = peões)

— Declaração da valoração de cada uma das peças comidas (50 = torres; 30 = cavalos; 30 = bispos; 90 = rainha; 900 = rei; 10 = peões)

— Percorrer todas as peças contidas na 'string'

— Procura se o tabuleiro a analisar contêm essa peça

- Caso contenha, aumenta a pontuação tendo em conta a valoração da peça dada na lista 'pts.'

— Aumentar ou diminuir a pontuação da posição dentro em conta o peso e a posição dela (eixo) dos x (do lado dos brancos)

— Repetir o mesmo processo para as peças pretas

— Devolver a diferença entre as duas pontuações e devolver um valor positivo ou negativo dependendo da peça com que jogamos.

A escolha dos valores foi feita para atingir os seguintes resultados:
	1. Evitar trocas entre uma peça menor (bispo e cavalo) por três peões
	2. Encoragar possuir um par de bispos
	3. Evitar troca de duas peças menores (bispo e cavalo)

Atingimos o ponto um com as seguintes inequações:
	- B > 3P
	- N > 3P

Ponto dois é atingido com a seguinte inequação:
	- B > N

Logo podemos chegar á seguinte conclusão:
	- B > N > 3P

Podemos chegar ao ponto 3 através de:
	- B + N > R + P
	- Q + P = 2R
	- B + N = R + 1.5P
	- Q + P = 2R

Logo considerando o P = 10, temos:
P = 10
B = 35
N = 30
R = 50
Q = 90


https://www.chessprogramming.org/Simplified_Evaluation_Function
https://www.quora.com/What-are-some-heuristics-for-quickly-evaluating-chess-positions
https://www.chessprogramming.org/PeSTO%27s_Evaluation_Function
https://www.chess.com/terms/chess-piece-value

#2 Abordagem

Nesta abordagem, adaptaremos o código já feito e teremos em conta uma avaliação de posições, além da preservação das nossas peças. Aqui será dado uma estrutura para cada peça representado numa lista com 64 valores (um para cada quadrado no tabuleiro), e a sua posição no tabuleiro terá uma valoração associada ao mesmo, determinando assim a jogada ideal para aquela peça por padrões de jogo.
Também será tomado que as estruturas irão mudar a depender do estado atual do jogo (aberturas, meio-do-jogo, fim-de-jogo) priorizando situações diferentes em cada um dos estados, onde num vai ser priorizado manter uma estrutura entre os peões e noutro será mais focado na preservação do rei e possíveis fugas.


#3 Abordagem

Na seguinte abordagem, foi implementada uma função dado uma peça, irá determinar quais peças ela ameaça (seja acabada).
A função irá receber o tabuleiro e a peça a analisar e irá devolver uma lista com as peças ameaçadas em formato 'string'.

Contêm o seguinte processo de análise:
    — Obtem a peça a analisar e a sua posição no tabuleiro em 2D
    — Verifica qual a peça em questão e qual o jogador que a tem
    — Percorre num ciclo for, todos os quadrados que essa peça pode legalmente mover-se
    — Caso encontre um quadrado ocupado por uma peça adversári, adiciona essa peça à lista de peças ameaçadas
    — No final retorna a lista de peças ameaçadas
    — Na função objetivo, irá ser declarado a variavel que guarda as peças ameaçadas e irá verificar qual a peça em questão.
    — Após determinar qual a peça em questão, irá ser dado uma valoração á variavel 'score_w_threats' ou 'score_b_threats', dependendo do jogador que a tem, relativamente á importância dessa peça no jogo.

# Tentativa de abordagem
Nesta abordagem, temos como objetivo diminuir o número de estados analisados a poder assim eventualmente aumentar a profundidade do nosso programa. Para isso pretendemos melhor o algoritmo "minimax" através do "move ordering",
onde o algoritmo irá analisar os filhos do estado atual e reordena-los pela sua heuristica, assim evitando que o algoritmo analise estados que não são bons para o jogador.

- Exemplo:
[Tirar imagem daqui](https://www.youtube.com/watch?v=b-MLVSUiFW0)
    — Não foi possivel cortar nenhum nodo de 'D', pois o pior estado já foi analisado primeiro.
    — Se o terceiro estado (folha 2), tivesse sido analisado primeiro, o algoritmo iria cortar os outros nodos (14 e 5).

O código foi implementado e testado, mas não foi possível obter resultados positivos, pois o algoritmo chegava a cortar nodos com boas heuristicas, o que pode ser devido a uma má implementação do mesmo.

O "Move ordering" pode ser implementado de duas maneiras:
    — Dar sugestões sobre o que é melhor fazer. Por exemplo, na promoção de um peão no xadrez, capturar peças de alto valor com peças de menor valor são, em média, bons movimentos.
    — A função de geração de jogadas ("sucessor_states") devolve melhores jogadas antes de obtém-se a heurística de quão bom é o movimento de avaliar a posição ao nível 1 de profundidade menor (a sua busca rasa / aprofundamento iterativo). Calculou a avaliação na profundidade n-1, ordenou os movimentos e depois avaliou na profundidade n.


https://www.chessprogramming.org/PV-Move
https://www.chessprogramming.org/Guard_Heuristic


# COISAS A TENTAR FAZER

- FAZER TABELA PARA O REI NO ENDGAME
- DETERMINAR QUANDO ESTAMOS NO ENDGAME E QUANDO ESTAMOS NO MIDDLE GAME