Implementiamo un Algoritmo di Intelligenza Artificiale con semplici Scatole di Fiammiferi
Come Costruire l'Intelligenza Artificiale del MENACE
Con MENACE possiamo addestrare un Intelligenza Artificiale senza utilizzare il computer o nozioni specifiche di informatica. Il gioco che affrontiamo è Tris che ha poche semplici regole.
- Giochiamo su 9 cellette disposte in una griglia 3×3
- I giocatori si alternano: chi è di turno occupa una delle cellette rimaste libere con il suo segno (un cerchio O oppure una crocetta X)
- Vince il giocatore che per primo riesce a creare una fila di tre simboli uguali in verticale, orizzontale o diagonale.
E’ un gioco semplice ed esiste una strategia dominante (sempre vincente) per il giocatore che inizia per primo: per vincere dobbiamo mettere il nostro simbolo in un angolo; poi aggiungerlo sull’angolo opposto; infine occupiamo uno qualunque degli angoli rimanenti e ci godiamo la disperazione del nostro avversario ma sempre con fair play.
Ora che conosciamo il gioco, passiamo a creare il MENACE. E’ meglio affrontare questo progetto in gruppo per renderlo più divertente e veloce. Utilizziamo dei bicchieri di plastica (340) come contenitori e delle perline colorate di plastica come marcatori. Greta Thunberg ci odia per questo ma stiamo operando in nome del progresso scientifico. Ogni contenitore rappresenta una situazione di gioco quindi disegniamo su ciascun bicchiere l’aspetto che ha la griglia in quella situazione. Ad esempio il bicchiere 0 ha la griglia completamente vuota. Il numero dei bicchieri necessari diminuisce se ne utilizziamo uno solo per le configurazioni simmetriche o le rotazioni della plancia di gioco. Dentro ogni bicchiere mettiamo delle perline di colori differenti. Ne utilizziamo 9 ed associamo un colore ad ogni casella di gioco. In questo caso il bicchiere 0 contiene tutti i colori dato che ogni casella è vuota. In fine togliamo dai bicchieri le caselle che risultano già occupate da un simbolo o che presentano una mossa simmetrica.
Il nostro primo bicchiere dovrebbe contenere solo 3 colori: uno per la casella d’angolo, uno per quella sul lato e l’ultimo per il centro. Di fatto sono le uniche tre mosse possibili per iniziare.
Ora MENACE è pronto per giocare ed imparare.
Addestriamo il MENACE
Iniziano i giochi. Per semplificarci la vita lasciamo che sia l’intelligenza artificiale a fare la prima mossa. Prendiamo il primo bicchiere e ne estriamo a caso una perlina colorata che indica dove MENACE vuole mettere il suo simbolo. Poi scegliemo noi dove piazzare la nostra crocetta e passiamo al bicchiere successivo che rappresenta fedelmente la situazione in cui siamo arrivati. Andiamo avanti così fino a vincere o perdere. Se perdiamo noi (umani) allora aggiungiamo in ogni bicchiere utilizzato due perline dello stesso colore scelto da MENACE; se perde MENACE allora togliamo da ciascun bicchiere la perlina scelta dall’Intelligenza Artificiale. In pratica togliamo le opzioni che si mostrano perdenti e aumentiamo la possibilità che MENACE faccia la scelta vincente. Alla fine otteniamo un sistema imbattibile.Il MENACE impara tramite un meccanismo di rinforzo sia negativo che positivo. Partita dopo partita rimuoviamo le mosse perdenti e rafforziamo la possibilità di ripetere quelle vincenti. Dopo qualche giocata il sistema trova la strategia dominante per il primo giocatore e si prepara a umiliarci ogni volta. Battuti da semplici amenicoli di plastica.
Invece i dati dell'autore li trovi a questo link.