AlphaGo
e un software per il
gioco del go
sviluppato da
Google DeepMind
. E stato il primo software in grado di sconfiggere un maestro umano nel gioco senza handicap e su un
goban
di dimensioni standard (19×19).
Sotto il nome di ≪AlphaGo≫ si intendono diverse versioni del software, in particolare:
- la versione che
ha sconfitto 5-0 il campione europeo Fan Hui
;
- la versione che
ha sconfitto 4-1 Lee Se-dol
;
- ≪
Master
≫, la versione che ha vinto 60 partite online contro professionisti e
ha sconfitto 3-0 Ke Jie
;
- ≪
AlphaGo Zero
≫, la versione del software basata completamente sull'auto-apprendimento;
- ≪
AlphaZero
≫, una versione che e in grado di giocare a go, scacchi e shogi.
Secondo quanto affermato da David Silver, ricercatore di DeepMind, il progetto AlphaGo venne avviato nel 2014 per studiare quanto le
reti neurali
profonde
potessero essere applicabili al gioco del go.
[1]
AlphaGo rappresento un notevole avanzamento rispetto ai programmi per il gioco del go preesistenti. Su 500 partite disputate contro altri software, tra i quali Crazy Stone e Zen,
[2]
AlphaGo (in esecuzione su un singolo computer) ha vinto tutte le partite tranne una,
[3]
ed eseguendo una serie di incontri analoga ma girando su un cluster AlphaGo ha vinto tutte le 500 partite e ha vinto il 77% delle partite contro se stesso eseguito su una singola macchina. La versione distribuita impiegava 1202
CPU
e 176
GPU
, circa 25 volte in piu rispetto all'hardware del computer singolo.
[4]
Una versione preliminare di AlphaGo e stata testata su diverse configurazioni hardware, in modalita asincrona o distribuita, con un tempo di due secondi per mossa, generando i seguenti valori
Elo
.
[4]
Configurazione
|
Thread di
ricerca
|
n. CPU
|
n. GPU
|
Elo
|
Singola
[4]
p.10-11
|
40
|
48
|
1
|
2,151
|
Singola
|
40
|
48
|
2
|
2738
|
Singola
|
40
|
48
|
4
|
2850
|
Singola
|
40
|
48
|
8
|
2890
|
Distribuita
|
12
|
428
|
64
|
2937
|
Distribuita
|
24
|
764
|
112
|
3079
|
Distribuita
|
40
|
1,202
|
176
|
3140
|
Distribuita
|
64
|
1,920
|
280
|
3168
|
Nell'ottobre del 2015
AlphaGo sconfisse 5-0
il campione europeo
Fan Hui
(2 dan),
[5]
diventando il primo software in grado di sconfiggere un maestro umano nel gioco senza handicap e su un goban di dimensioni standard.
[6]
L'annuncio pubblico venne fatto solo il 27 gennaio 2016, in coincidenza con la pubblicazione di un articolo su
Nature
[7]
che descrive l'algoritmo impiegato dal software.
[5]
Tra il 9 e il 15 marzo 2016
AlphaGo disputo un incontro
con il giocatore sudcoreano
Lee Se-dol
(9-dan), uno tra i piu forti giocatori di go al mondo.
[8]
L'incontro in cinque partite, giocate rispettivamente il 9, 10, 12, 13 e 15 marzo, si tenne al
Four Seasons Hotel
di
Seul
[9]
[10]
e venne trasmesso in diretta in
streaming
.
[11]
AlphaGo girava sulla piattaforma cloud di Google, i cui server si trovano negli
Stati Uniti
, e le mosse elaborate dal software vennero riportate sul goban da Aja Huang, membro del team DeepMind e giocatore amatoriale di go (6-dan).
[12]
L'incontro adottava le regole cinesi, con un
komi
di 7,5 punti e un tempo di riflessione di due ore e un
byoyomi
di 60 secondi.
[13]
La potenza di calcolo impiegata era simile a quella usata nell'incontro con Fan Hui.
[14]
Al tempo dell'incontro, Lee Se-dol deteneva il secondo numero piu alto al mondo di vittorie nei campionati internazionali di Go.
[15]
Pur non esistendo un ranking ufficiale a livello internazionale, alcune fonti consideravano Lee Se-dol come il quarto miglior giocatore al mondo in quel periodo.
[16]
[17]
AlphaGo non era stato configurato in maniera particolare per affrontare lo stile di gioco di Lee.
[18]
AlphaGo si e aggiudicato le prime tre partite per abbandono da parte di Lee Se-dol.
[19]
[20]
Questi ha vinto la quarta partita, nella quale AlphaGo ha abbandonato alla centottantesima mossa. Il software ha infine vinto l'ultima partita per abbandono.
[21]
Il premio per il vincitore dell'incontro era pari a un milione di
USD
. Essendo stato aggiudicato da AlphaGo, l'importo e stato devoluto ad organizzazioni per il gioco del go e ad organizzazioni di beneficenza, tra le quali l'
UNICEF
.
[22]
Lee Se-dol ha ricevuto un compenso di 150 000 USD per la partecipazione a tutte e cinque le partite e un compenso addizionale di 20 000 USD per la vittoria nella quarta partita.
[13]
L'algoritmo impiegato da AlphaGo usa una combinazione di
machine learning
e tecniche di ricerca su
alberi
, insieme ad un'estensiva fase di apprendimento da gioco sia umano sia artificiale. Utilizza la
ricerca ad albero Monte Carlo
(MCTS) per la selezione delle mosse, guidata da due
reti neurali
profonde
(
value network
e
policy network
).
[23]
[4]
Prima di essere inviato alle reti neurali, l'input e analizzato in una fase di pre-processing per estrarre alcune feature (ad esempio l'aderenza delle mosse a una serie di pattern comuni).
[4]
Nella prima fase del training le reti neurali effettuano un
apprendimento supervisionato
basato sul gioco umano, tentando di imitarlo usando un database di circa 30 milioni di mosse da partite storiche.
[24]
Una volta raggiunta una certa forza di gioco, l'apprendimento prosegue
per rinforzo
giocando contro altre istanze di se stesso.
[23]
Il software e programmato per abbandonare la partita se la probabilita di vittoria scende al di sotto di una certa soglia, che ad esempio nell'incontro del marzo 2016 con Lee Se-dol era fissata al 20%.
[25]
Come riferimento, i punteggi Elo di alcuni giocatori umani affrontati da AlphaGo sono:
Il giocatore umano con punteggio Elo piu alto tra quelli registrati e
Shin Jin-seo
, che ha raggiunto 3827 punti nel 2020.
[33]
AlphaGo e considerato una pietra miliare nella ricerca sull'
intelligenza artificiale
, in quanto il go era considerato in precedenza un gioco fuori dalla portata delle tecniche di
apprendimento automatico
sviluppate all'epoca.
[34]
[35]
Toby Manning (arbitro del match con Fan Hui) e Haijin Lee (segretario generale della
International Go Federation
) ipotizzano che in futuro i giocatori di go potranno contare sull'aiuto del computer per l'analisi di gioco.
[36]
Myungwan Kim
(9 dan) ha descritto lo stile di gioco di AlphaGo "come quello di un umano" nell'incontro con Fan Hui.
[37]
Toby Manning, arbitro dell'incontro, ha descritto lo stile di gioco del software come "conservativo".
[38]
AlphaGo (nero) v.
Fan Hui
, quarto turno (8 ottobre 2015), AlphaGo vince per abbandono.
[4]
|
|
Mosse da 1 a 99
|
Mosse da 100 a 165
|
- ^
(
EN
) John Riberio,
AlphaGo’s unusual moves prove its AI prowess, experts say
, in
PC World
, 14 marzo 2016.
URL consultato il 18 marzo 2016
.
- ^
(
EN
)
Artificial intelligence breakthrough as Google's software beats grandmaster of Go, the 'most complex game ever devised'
, in
Daily Mail
, 27 gennaio 2016.
URL consultato il 29 gennaio 2016
.
- ^
(
EN
)
Google AlphaGo AI clean sweeps European Go champion
, su
zdnet.com
,
ZDNet
, 28 gennaio 2016.
URL consultato il 28 gennaio 2016
.
- ^
a
b
c
d
e
f
(
EN
) David Silver, Aja Huang, Chris J. Maddison, Arthur Guez, Laurent Sifre, George van den Driessche, Julian Schrittwieser, Ioannis Antonoglou e Veda Panneershelvam,
Mastering the game of Go with deep neural networks and tree search
, in
Nature
, vol. 529, n. 7587, pp. 484?489,
DOI
:
10.1038/nature16961
.
- ^
a
b
(
EN
)
Google achieves AI 'breakthrough' by beating Go champion
, su
BBC News
, 27 gennaio 2016.
- ^
(
FR
)
Premiere defaite d’un professionnel du go contre une intelligence artificielle
, su
Le Monde
, 27 gennaio 2016.
- ^
(
EN
) David Silver e Demis Hassabis,
Mastering the game of Go with deep neural networks and tree search
, in
Nature
, vol. 529, n. 7587, 28 gennaio 2016, pp. 484?489,
DOI
:
10.1038/nature16961
.
URL consultato il 28 gennaio 2016
.
- ^
(
EN
)
Computer scores big win against humans in ancient game of Go
, su
money.cnn.com
,
CNN
, 28 gennaio 2016.
URL consultato il 28 gennaio 2016
.
- ^
(
EN
)
Google’s AI AlphaGo to take on world No 1 Lee Sedol in live broadcast
, su
theguardian.com
,
The Guardian
, 5 febbraio 2016.
URL consultato il 15 febbraio 2016
.
- ^
(
EN
)
Google DeepMind is going to take on the world's best Go player in a luxury 5-star hotel in South Korea
, su
businessinsider.com
,
Business Insider
, 22 febbraio 2016.
URL consultato il 23 febbraio 2016
.
- ^
Jordan Novet,
YouTube will livestream Google’s AI playing Go superstar Lee Sedol in March
, su
VentureBeat
, 4 febbraio 2016.
URL consultato il 7 febbraio 2016
.
- ^
(
ZH
)
李世乭:?使Alpha Go得到升?也一?能?
, su
chinese.joins.com
,
JoongAng Ilbo
, 23 febbraio 2016.
URL consultato il 24 febbraio 2016
.
- ^
a
b
(
KO
)
李世乭 vs 알파고, ‘구글 딥마인드 챌린지 매치’ 記者會見 열려
, su
baduk.or.kr
,
Korea Baduk Association
, 22 febbraio 2016.
URL consultato il 5 aprile 2016
(archiviato dall'
url originale
il 3 marzo 2016)
.
- ^
(
EN
) Demis Hassabis [demishassabis],
We are using roughly same amount of compute power as in Fan Hui match: distributing search over further machines has diminishing returns
(Tweet), su
Twitter
,
X
, 11 marzo 2016.
- ^
(
EN
) Steven Borowiec,
Google's AI machine v world champion of 'Go': everything you need to know
, in
The Guardian
, 9 marzo 2016.
URL consultato il 15 marzo 2016
.
- ^
(
EN
)
Remi Coulom
,
Rating List of 2016-01-01
, su
goratings.org
.
URL consultato il 18 marzo 2016
(archiviato dall'
url originale
il 18 marzo 2016)
.
- ^
(
EN
)
Korean Go master proves human intuition still powerful in Go
, in
The Korea Herald
/
ANN
, 14 marzo 2016.
URL consultato il 5 aprile 2016
(archiviato dall'
url originale
il 12 aprile 2016)
.
- ^
(
EN
) Yoon Sung-won,
Lee Se-dol shows AlphaGo beatable
, in
The Korea Times
, 14 marzo 2016.
URL consultato il 15 marzo 2016
.
- ^
(
EN
)
Google’s AI beats world Go champion in first of five matches - BBC News
, in
BBC Online
.
URL consultato il 9 marzo 2016
.
- ^
(
EN
)
Google AI wins second Go game against world champion - BBC News
, in
BBC Online
.
URL consultato il 10 marzo 2016
.
- ^
(
EN
)
Google DeepMind AI wins final Go match for 4-1 series win
, su
Engadget
.
URL consultato il 15 marzo 2016
.
- ^
(
EN
)
Human champion certain he'll beat AI at ancient Chinese game
, su
hosted.ap.org
,
AP News
, 22 febbraio 2016.
URL consultato il 29 aprile 2019
(archiviato dall'
url originale
il 22 dicembre 2018)
.
- ^
a
b
(
EN
)
Research Blog: AlphaGo: Mastering the ancient game of Go with Machine Learning
, su
Google Research Blog
, 27 gennaio 2016.
- ^
(
EN
) Cade Metz,
In Major AI Breakthrough, Google System Secretly Beats Top Player at the Ancient Game of Go
, su
WIRED
, 27 gennaio 2016.
URL consultato il 1º febbraio 2016
.
- ^
(
EN
) Cade Metz,
Go Grandmaster Lee Sedol Grabs Consolation Win Against Google’s AI
, in
Wired News
, 13 marzo 2016.
URL consultato il 29 marzo 2016
.
- ^
(
ZH
)
sohu.com
,
http://www.sohu.com/a/143092581_473283
.
- ^
L'hardware utilizzato durante l'addestramento potrebbe essere sostanzialmente piu potente
- ^
(
EN
) David Silver, Julian Schrittwieser e Karen Simonyan,
Mastering the game of Go without human knowledge
(
PDF
), in
Nature
, vol. 550, n. 7676, 19 ottobre 2017, pp. 354?359,
Bibcode
:
2017Natur.550..354S
,
DOI
:
10.1038/nature24270
,
ISSN
0028-0836
(
WC
·
ACNP
)
,
PMID
29052630
.
- ^
(
EN
) David Silver,
Demis Hassabis
,
AlphaGo Zero: Starting from scratch
, su
deepmind.com
, 18 ottobre 2017.
URL consultato il 4 dicembre 2020
(archiviato dall'
url originale
il 19 ottobre 2017)
.
- ^
(
EN
)
Hui Fan
, su
European Go Database
.
URL consultato il 4 dicembre 2020
.
- ^
(
EN
)
Lee Sedol
, su
Go Ratings
.
URL consultato il 4 dicembre 2020
.
- ^
(
EN
)
Ke Jie
, su
Go Ratings
.
URL consultato il 4 dicembre 2020
.
- ^
(
EN
)
Shin Jinseo
, su
Go Ratings
.
URL consultato il 4 dicembre 2020
.
- ^
(
EN
) Steve Connor,
A computer has beaten a professional at the world's most complex board game
, in
The Independent
, 27 gennaio 2016.
URL consultato il 28 gennaio 2016
.
- ^
(
EN
)
Google's AI beats human champion at Go
, in
CBC News
, 27 gennaio 2016.
URL consultato il 28 gennaio 2016
.
- ^
(
EN
) Elizabeth Gibney,
Go players react to computer defeat
, in
Nature
, 2016,
DOI
:
10.1038/nature.2016.19255
.
- ^
(
EN
) Eric David,
Google’s AlphaGo “plays just like a human,” says top ranked Go player
, su
SiliconANGLE
, 1º febbraio 2016.
URL consultato il 3 febbraio 2016
.
- ^
(
EN
) Elizabeth Gibney,
Google AI algorithm masters ancient game of Go
, su
Nature News & Comment
, 27 gennaio 2016.
URL consultato il 3 febbraio 2016
.