This repository has been archived on 2022-12-11. You can view files and clone it, but cannot push or open issues or pull requests.
Othello/report/document.tex

347 lines
13 KiB
TeX
Raw Normal View History

2022-11-28 09:08:35 +01:00
\documentclass{article}
\usepackage[T1]{fontenc} % encodage
2022-12-01 16:33:24 +01:00
\renewcommand{\familydefault}{\sfdefault} % police en sans-serif
2022-11-28 09:08:35 +01:00
2022-12-01 16:33:24 +01:00
\usepackage[french]{babel} % langue
\frenchsetup{SmallCapsFigTabCaptions=false}
2022-11-28 09:08:35 +01:00
2022-12-01 16:33:24 +01:00
\usepackage[hidelinks]{hyperref} % liens cliquable dans la table des matières
2022-11-28 09:08:35 +01:00
2022-12-01 16:33:24 +01:00
\usepackage{graphicx} % images
\usepackage{caption}
2022-11-28 09:08:35 +01:00
2022-12-01 16:33:24 +01:00
\usepackage[a4paper, left=20mm, top=20mm]{geometry} % dimensions de la page
2022-11-28 09:08:35 +01:00
\usepackage{minted} % intégration code
\usemintedstyle{emacs}
2022-12-01 16:33:24 +01:00
\title{Projet - IA pour le jeu d'Othello
\thanks{\href{https://jj.up8.site/AA/ProjetsAA.pdf}{Sujet 35}}}
\author{\href{mailto:anri.kennel@etud.univ-paris8.fr}{Anri Kennel}
\thanks{Numéro d'étudiant : 20010664}\, (L3-A)
\\Algorithmique avancée $\cdot$ Université Paris 8}
2022-11-28 09:08:35 +01:00
\date{Année universitaire 2022-2023}
\begin{document}
\maketitle
\tableofcontents
\clearpage
2022-12-01 16:33:24 +01:00
\section{Projet}
Ce projet présente une implémentation d'un jeu dOthello ainsi que deux
intelligences artificielles jouant; l'une selon un algorithme minimax et l'autre
via élagage alpha-bêta. Il y a aussi une comparaison d'efficacité des IA à
différentes profondeurs de jeu.
2022-11-28 09:08:35 +01:00
2022-11-30 19:39:49 +01:00
\section{Implémentation}
\subsection{Othello}
2022-12-01 16:33:24 +01:00
\subsubsection{Règles du jeu}
L'Othello est un jeu qui se joue sur un plateau de 8x8 où deux couleurs, les noirs
et les blancs s'affrontent. Les noirs commencent la partie. Quand aucun joueur
ne peut jouer, la partie s'arrête.
Au début d'une partie le plateau ressemble à la \autoref{fig:init}.
\begin{figure}[h]
\centering
\includegraphics[width=0.35\textwidth]{imgs/othello_init.png}
\caption{Début d'une partie}
\label{fig:init}
\end{figure}
\subsubsection{Exemple d'une partie}
Chaque joueur doit poser un pion de sa couleur sur une case vide de lothellier,
il faut prendre en sandwich les pions ennemis, peu importe la direction. Une fois
posé, les pions prient en sandwich sont récupérés par le joueur qui vient de jouer.
Dans la configuration du début, les cases pouvant être joué par les noirs sont
indiqués en rouge dans la \autoref{fig:prem}.
\begin{figure}[h]
\centering
\includegraphics[width=0.35\textwidth]{imgs/othello_premiercoup.png}
\caption{Possibilités au premier coup}
\label{fig:prem}
\end{figure}
Mon implémentation du jeu indique au joueur les coups possibles (c'est-à-dire les
cases rouges). Le joueur doit indiquer les coordonnées où il veut poser son jeton
et les changements se font automatiquement. Chaque joueur joue chacun son tour et
passe son tour si aucun coup lui est possible. La partie s'arrête si le plateau
est plein ou si aucun joueur ne peut jouer, cf. \autoref{fig:human}. Les jetons
blancs sont notés \texttt{B} et les jetons noirs \texttt{N}.
\begin{figure}[h]
\centering
\includegraphics[width=0.35\textwidth]{imgs/othello_impl_player.jpg}
\caption{Demande au joueur de jouer}
\label{fig:human}
\end{figure}
Si un coup illégale est joué, le jeu refuse le coup et demande au joueur de
choisir un autre coup.
2022-11-30 19:39:49 +01:00
\subsubsection{Problèmes rencontrés}
2022-12-01 16:33:24 +01:00
Mon enjeu numéro 1 était d'éviter tout problème de mémoire. Pour cela dans le
2022-12-01 18:54:33 +01:00
\texttt{Makefile} il y a un label \texttt{dev} qui permet d'ajouter plein de flags
pour \texttt{gcc}, notamment \texttt{fanalyzer} et \texttt{fsanitize=undefined} qui
2022-12-01 16:33:24 +01:00
permettent de trouver plein de problèmes relatifs à la mémoire. Aussi j'ai utilisé
\texttt{Valgrind} (avec les flags \texttt{g} et \texttt{Og} pour \texttt{gcc} et
2022-12-01 18:54:33 +01:00
les flags \texttt{leak-check=full}, \texttt{show-leak-kinds=all},
\texttt{track-origins=yes} et \texttt{s} pour \texttt{Valgrind}) me permettant
2022-12-01 16:33:24 +01:00
d'avoir un maximum d'avertissements et d'informations me permettant de débugger
tous les problèmes.
2022-12-01 18:54:33 +01:00
\\\\
Aussi, je voulais rendre mon code modulable, pour tester plus facilement. Ainsi
la taille du plateau est complètement modulable, aussi les couleurs des joueurs
(cf. \autoref{cod:plateau}).
2022-12-01 16:33:24 +01:00
2022-12-01 18:54:33 +01:00
\begin{figure}[h]
\centering
\begin{minipage}{0.8\textwidth}
\begin{minted}[autogobble,linenos]{c}
/* Une case est soit vide, soit occupé par un des joueurs, noir ou blanc */
enum CASE { VIDE = ' ', BLANC = 'B', NOIR = 'N' };
\end{minted}
\begin{minted}[autogobble,linenos,firstnumber=last]{c}
/* Propriété globale du jeu */
enum PLATEAU { LONGEUR = 8, LARGEUR = 8 };
\end{minted}
\end{minipage}
\caption{Début de \texttt{jeu.h}}
\label{cod:plateau}
\end{figure}
Enfin, sachant qu'il faut aussi implémenter des IAs, j'ai fait en sorte que le jeu
du joueur humain ne soit pas complètement lié au fonctionnement du jeu. Le projet
est donc séparé en plusieurs fichiers/fonctions (cf. \autoref{tree:project}).
2022-12-01 19:56:31 +01:00
\\\\
Grâce à ça, les fonctions relatives au jeu sont indifférentes par rapport à quelle
fonction "joueur" est appelée. Autrement dit, tout ce qui est relatif à un joueur
humain est dans \texttt{humain.h}. Le fichier \texttt{joueur.h} ne contient rien
spécifique à un joueur humain.
2022-12-01 18:54:33 +01:00
2022-12-01 19:56:31 +01:00
\begin{figure}[ht]
2022-12-01 18:54:33 +01:00
\centering
\begin{minipage}{0.15\textwidth}
\begin{minted}[autogobble,frame=lines,rulecolor=gray]{mcf}
- includes
|-- humain.h
|-- jeu.h
|-- joueur.h
|-- liste.h
|-- plateau.h
\-- utils.h
- src
|-- humain.c
|-- jeu.c
|-- joueur.c
|-- liste.c
|-- main.c
|-- plateau.c
\-- utils.c
\end{minted}
\end{minipage}
\caption{Arborescence du projet sans l'implémentation des IA}
\label{tree:project}
\end{figure}
\newpage
2022-12-01 16:33:24 +01:00
\subsection[Minimax]{Algorithme minimax}
\subsubsection{Algorithme}
2022-12-01 18:54:33 +01:00
L'idée de l'algorithme minimax est de calculer tous les coups possibles pour
chaque coup possible et d'aller le plus loin possible dans les "et si" pour faire
le coup qui nous rapportera le plus de points dans le futur.
Le problème de cet algorithme c'est qu'il est difficilement réalisable. En mémoire,
on doit copier le plateau plusieurs fois (pour chaque "et si"). La complexité est
de $\Theta(c^{n})$ avec $c$ les coups légaux et $n$ la profondeur de jeu, donc
lorsque l'on utilise cet algorithme on doit garder notre profondeur de test
relativement basse.
Aussi, l'algorithme est dépendant d'une fonction d'évaluation, c'est elle qui
décide si le coup est bien ou non, plus elle est précise plus le coup décidé sera
meilleur.
2022-11-30 19:39:49 +01:00
\subsubsection{Exemple d'utilisation}
2022-12-01 19:56:31 +01:00
L'utilisation de l'algorithme est simple. Il suffit d'appeler une seule fonction
2022-12-01 18:54:33 +01:00
et elle jouera un coup (cf. \autoref{cod:minimax_def}).
\begin{figure}[h]
\centering
\begin{minipage}{0.8\textwidth}
\begin{minted}[autogobble,linenos]{c}
/* Joue le tour d'après l'algorithme minimax */
void action_joueur_minimax(Jeu *jeu, const int couleur);
\end{minted}
2022-12-01 19:56:31 +01:00
\begin{minted}[autogobble,linenos,firstnumber=last]{c}
/* Auxiliaire : Décide d'une case à jouer via l'algorithme minimax */
void _action_joueur_minimax(Jeu *jeu, int profondeur, const int couleur,
const int gagnant, int *ligne, int *colonne,
int *score);
\end{minted}
2022-12-01 18:54:33 +01:00
\end{minipage}
\caption{Déclaration de minimax, dans \texttt{minimax.h}}
\label{cod:minimax_def}
\end{figure}
2022-12-01 19:56:31 +01:00
Pour l'utiliser, il faut l'appeler dans la fonction qui s'occupe du déroulement
du jeu (cf. \autoref{cod:minimax_play}).
2022-11-30 19:39:49 +01:00
2022-12-01 19:56:31 +01:00
\begin{figure}[ht]
\centering
\begin{minipage}{0.8\textwidth}
\begin{minted}[autogobble,linenos]{c}
while (!partie_finie(jeu)) {
Coups *possibilites =
action_possible_joueur(jeu->plateau, tour->couleur);
if (possibilites->taille_liste > 0) {
// Si le joueur peut jouer
if (tour->couleur == NOIR) {
// Tour du joueur minimax
action_joueur_minimax(jeu, tour->couleur);
} else {
// Tour du joueur humain
action_joueur_humain(jeu, tour->couleur);
}
}
// On passe la main à l'autre joueur
tour = jeu->j1->couleur == tour->couleur ? jeu->j2 : jeu->j1;
}
\end{minted}
\end{minipage}
\caption{Extrait modifié de \texttt{jeu.c}, avec minimax jouant les noirs et un humain les blancs}
\label{cod:minimax_play}
\end{figure}
\newpage
2022-11-30 19:39:49 +01:00
\subsubsection{Problèmes rencontrés}
2022-12-01 19:56:31 +01:00
Le plus dur était l'implémentation en elle-même et de pas s'emmêler entre les copies
de plateau. La fonction \texttt{action\_joueur\_minimax} appelle une fonction auxiliaire
\texttt{\_action\_joueur\_minimax} (cf. \autoref{cod:minimax_def}) qui fait implémente directement minimax. Elle se passe
en paramètre récursivement :
\begin{itemize}
\item la ligne choisie
\item la colonne choisie
\item le meilleur score
\item la profondeur actuellement évaluée
\item la couleur du joueur (soit MIN, soit MAX)
\end{itemize}
2022-11-28 09:08:35 +01:00
2022-12-01 16:33:24 +01:00
\subsection[Alpha-Bêta]{Élagage alpha-bêta}
\subsubsection{Algorithme}
2022-12-01 19:56:31 +01:00
Les coupures $\alpha - \beta$ permettent de réduire la taille en mémoire de minimax
2022-12-01 20:56:58 +01:00
en ne calculant pas certains scénarios en retirant ceux inutiles basé sur
les calculs précédents.
2022-11-28 09:08:35 +01:00
2022-11-30 19:39:49 +01:00
\subsubsection{Exemple d'utilisation}
2022-12-01 20:56:58 +01:00
L'utilisation est identique à celle de Minimax (cf. \autoref{cod:alphabeta_def}).
\begin{figure}[h]
\centering
\begin{minipage}{0.8\textwidth}
\begin{minted}[autogobble,linenos]{c}
/* Joue le tour d'après l'algorithme alpha-beta */
void action_joueur_alphabeta(Jeu *jeu, const int couleur);
\end{minted}
\begin{minted}[autogobble,linenos,firstnumber=last]{c}
/* Auxiliaire : Décide d'une case à jouer via l'algorithme alpha-beta */
void _action_joueur_alphabeta(Jeu *jeu, int profondeur, int couleur,
const int gagnant, int *ligne, int *colonne,
int *score, const int note, const int qui);
// qui => couleur associée
\end{minted}
\end{minipage}
\caption{Déclaration d'alphabeta, dans \texttt{alphabeta.h}}
\label{cod:alphabeta_def}
\end{figure}
2022-11-28 09:08:35 +01:00
2022-11-30 19:39:49 +01:00
\subsubsection{Problèmes rencontrés}
2022-12-01 20:56:58 +01:00
Pour l'implémentation je me passe en argument, en plus de ceux de minimax, le
meilleur score et sa couleur associée.
L'avantage avec cet algorithme est qu'il ressemble beaucoup à minimax vu que c'est
une amélioration de ce dernier, alors j'ai pu réutiliser le même code. En revanche
l'élagage était compliqué à placer dans le code.
Je fais l'élagage en passant des possibilités pour alpha (cf. \autoref{cod:elagage_alpha}),
même technique pour bêta (cf. \autoref{cod:elagage_beta}).
\begin{figure}[h]
\centering
\begin{minipage}{0.8\textwidth}
\begin{minted}[autogobble,linenos]{c}
while (i->suivant) {
if (i->suivant->suivant) {
i = i->suivant;
} else {
break;
}
}
*score = INT_MAX;
\end{minted}
\dots\, et \dots
\begin{minted}[autogobble,linenos,firstnumber=last]{c}
if (*score == INT_MAX) {
while (i->suivant) {
if (i->suivant->suivant) {
i = i->suivant;
} else {
break;
}
}
}
\end{minted}
\end{minipage}
\caption{Élagage $\alpha$, dans \texttt{alphabeta.h}}
\label{cod:elagage_alpha}
\end{figure}
\begin{figure}[h]
\centering
\begin{minipage}{0.8\textwidth}
\begin{minted}[autogobble,linenos]{c}
while (i->suivant) {
if (i->suivant->suivant) {
i = i->suivant;
} else {
break;
}
}
*score = INT_MIN;
\end{minted}
\dots\, et \dots
\begin{minted}[autogobble,linenos,firstnumber=last]{c}
if (*score == INT_MIN) {
while (i->suivant) {
if (i->suivant->suivant) {
i = i->suivant;
} else {
break;
}
}
}
\end{minted}
\end{minipage}
\caption{Élagage $\beta$, dans \texttt{alphabeta.h}}
\label{cod:elagage_beta}
\end{figure}
2022-11-28 09:08:35 +01:00
2022-11-30 19:39:49 +01:00
\section{Comparaison d'efficacité}
2022-12-01 20:56:58 +01:00
TODO!
2022-11-28 09:08:35 +01:00
\section{Discussion}
2022-12-01 20:56:58 +01:00
Le problème de mon implémentation est la fonction d'évaluation qui regarde juste
le nombre de points gagnés/perdus. En ne prenant pas en compte par exemple si le
pion placé est sur un coin ou non (le coin étant une position avantageuse).
2022-11-28 09:08:35 +01:00
2022-12-01 18:54:33 +01:00
\newpage
\appendix
\listoffigures
2022-11-28 09:08:35 +01:00
\end{document}