Jeu de Go: Topic des coeurs de pierre

**FMP-thE_mAd** · 12/03/2016, 21h37

Le GO pour une machine comapré aux échecs parait plus dur: position difficile à évaluer, et plus de possibilité. Mais on ne voit pas la difficulté qu'aurait les échecs que ne possèdent pas le Go(pouru ne machine).

Argument intéressant. Effectivement finalement le Go, c'est les Echecs mais énormément plus de possibilités, et chaque possibilité est plus difficile à conceptualiser qu'aux échecs. D'où la difficulté d'être efficace si on fait un programme de force brute. D'où le fait qu'il fallait "faire autrement".

De ce que j'ai lu et de ce que j'ai compris, AlphaGo se caractérise quand même par une immense base de donnée aussi. L'efficacité de l'algorithme, c'est en partie l'efficacité du tri et de l'exploitation de cette base de donnée. C'est là que de gros progrès ont été fait non ?

On rappele que battre un professionnel est un défi à 1 million depuis 20 ans.

C'était le cas aussi pour les échecs je crois. C'était aussi le cas pour le th de Fermat en maths

(l'un des exemples dont la démonstration "à la Grec" s'est révélé un obstacle plutôt qu'un atout). Et ça ça a tenu 300 ans

**Awake** · 12/03/2016, 22h00

Envoyé par FMP-thE_mAd

Ah je veux bien croire un spécialiste.

Donc il faut montrer ses diplômes et ses feuilles de paie maintenant pour pouvoir discuter avec toi

Moi aussi j'ai bossé dans l'IA hein..

Ce que tu as du mal à comprendre, c'est que ce n'est pas les échecs ou le go qui influencent les recherches en IA, c'est très majoritairement l'inverse.

**Thufir** · 12/03/2016, 22h16

Ben justement pour le Go on ne fait pas autrement ,on fait la même chose mais comme ça suffit pas, on fait des choses supplémentaires en plus.

**Snakeshit** · 13/03/2016, 00h56

Envoyé par Thufir

Oui,c'est un des raffinements de la recherche par arbe(monte carlo) qui est aussi utilisé pour le Go,justement...

Je rebondis juste la dessus. Je connais la méthode de Monte Carlo en physique nucléaire, et c'est de la brute force pure quand même (simuler un nombre aléatoire de particules et avoir une connaissance d'un problème avec une précision donnée).
C'est différent en algorithmique ?

**Enyss** · 13/03/2016, 01h31

Non, l'idée est la même : pour évaluer un coup, on joue un grand nombre de parties pseudo-aléatoires à partir de cette position, et ça donne un % de victoire. Ça marche plutôt pas mal au go cette approche

**Awake** · 13/03/2016, 09h45

Victoire de Lee Sedol sur la 4em partie

**Bah** · 13/03/2016, 10h47

Ca veut simplement dire qu'AlphaGo a encore passé un autre stade de développement. Maintenant il est même capable de se relâcher après la victoire

**Snakeshit** · 13/03/2016, 10h56

Envoyé par Enyss

Non, l'idée est la même : pour évaluer un coup, on joue un grand nombre de parties pseudo-aléatoires à partir de cette position, et ça donne un % de victoire. Ça marche plutôt pas mal au go cette approche

Ok. Mais cette technique marche à peu près pour tout, si on a la puissance calcul nécessaire

.

**FMP-thE_mAd** · 13/03/2016, 11h36

Envoyé par Thufir

Ben justement pour le Go on ne fait pas autrement ,on fait la même chose mais comme ça suffit pas, on fait des choses supplémentaires en plus.

C'est là du coup que je me trompais.

Je pensais vraiment que les algos étaient de deux types différents dans leur fondement même entre AlphaGo et Deep Blue... D'où le fait que je pensais que finalement les recherches auraient pu être inversée, que c'était qu'une question historique.

Or visiblement non.
En gros les deux algos font "pareil" mais comme le Go avait énormément plus de possibilités, ça marchait pas avec le Go. Et ça marche aujourd'hui parce qu'on a amélioré cette technique-là (en plus d'avoir plus de puissance de calcul).

**Thufir** · 13/03/2016, 14h39

Monte Carlo permet de ne parcourir qu'une partie de l'arbe.
Là avec le Deep LEarning , il apprend quelles sont les branches de l'arbre les plus souventes,donc ce n'est plus uniquement de l'aléa et on n'est plus dans le bruteforcepur.
Mais derrière ça on parcourt quand même un arbre des coups possibles.
Cette idée d'apprendre quelles sont les branches de l'arbre qu'il faut regarder font penser à ce que fait l'humain:capable de se focaliser sur une situation locale et non pas tout le plateau, l'intuition qui lui fait regarder certains coups plus que d'autres,etc.

**FMP-thE_mAd** · 14/03/2016, 12h46

Hop je reviens pour linker un très long post de Nilsou, dont apparemment l'IA est la spécialité, et qui dit en gros que, ok, battre un humain au Go c'est sympa, mais ça ne fait pas tellement avancer le domaine de l'IA et que, grosso modo, faire un Deep Blue "en mieux", ça ne sert pas à grand chose :

http://forum.canardpc.com/threads/10...=1#post9769902

D'un point de vue extérieur je serai plutôt de son avis.

Perso je pensais que justement le vrai progrès avec AlphaGo c'était qu'on avait cherché différemment de Deep Blue (d'où mes remarques précédentes sur l'historique des recherches).

Il se trouve qu'en fait non. La "base" de l'IA est la même, et que c'est "juste" de l'optimisation et de la puissance de calcul (noter les guillemets quand même). Du coup fatalement battre un joueur humain au Go en faisant comme ça n'était qu'une question de temps.
D'ailleurs lui aussi dit bien à un moment que finalement, si personne n'avait encore battu un joueur de Go, c'est aussi parce que peu de gens avaient essayé puisque ça ne revenait "qu'à" essayer d'améliorer Deep Blue. Ce qui en terme de progrès n'était pas forcément très intéressant.

Donc, qu'AlphaGo grosso modo ne fait pas avancer le schmilblick.

A voir si vous serez d'accord avec lui ou pas

---
Et du coup pour répondre à la pique de Hijopr : au moins ce genre de message de spécialistes éclaire un peu plus la question que simplement quand on me répondait "nan mais tu as tord".

**Enyss** · 14/03/2016, 15h00

Oui, battre les humains au go ne fait pas avancer le bouzin. C'est parce que l'IA a fait de gros progrès que l'on peut battre l'humain au go.

Il se trouve qu'en fait non. La "base" de l'IA est la même, et que c'est "juste" de l'optimisation et de la puissance de calcul (noter les guillemets quand même). Du coup fatalement battre un joueur humain au Go en faisant comme ça n'était qu'une question de temps.

Et je suis désolé, mais AlphaGo est extrêmement différent de Deepblue (ne serrait ce que par l'utilisation du Deep learning). A peu près la différence entre une voiture et une charrette : oui, ils ont tout les deux quatres roues et roulent, mais la ressemblance s'arrête là

.

**Aulren** · 14/03/2016, 17h51

**FMP-thE_mAd** · 14/03/2016, 18h36

Envoyé par Enyss

C'est parce que l'IA a fait de gros progrès que l'on peut battre l'humain au go.

De ce que je comprends, j'ai plutôt l'impression qu'on a fait de gros progrès en probabilité et en statistiques. Mais pas tellement en IA

Après, évidemment, tout dépend de ce qu'on appelle IA...

Et je suis désolé, mais AlphaGo est extrêmement différent de Deepblue (ne serrait ce que par l'utilisation du Deep learning). A peu près la différence entre une voiture et une charrette : oui, ils ont tout les deux quatres roues et roulent, mais la ressemblance s'arrête là .

Exactement

Alors que moi je pensais au départ qu'AlphaGo était un avion

Envoyé par Aulren

Très intéressant !

Au final c'est bien ça : une "optimisation", certes hyper pointue, d'une lecture d'arbre.
Et je comprends maintenant quel est le progrès par rapport aux échecs : finalement aux échecs tout analyser était faisable du fait du nombre de coup "limité". Donc avec une bonne puissance de calcul, on a donc un algorithme optimal avec DeepBlue (puisqu'il analyse TOUT l'arbre à chaque coup).

Imaginons qu'on ait une puissance de calcul infinie, alors AlphaGo serait amélioré en enlevant toutes les stratégie d'optimisation de lecture de l'arbre, et serait plus performant en analysant TOUT l'arbre !

C'est rigolo de penser ça non ?

Après je suis pas vraiment d'accord avec la conclusion du gars de la vidéo cela dit : AlphaGo ne fait pas "comme un humain" parce que son optimisation, il l'a fait à partir d'exemples d'une base de donnée. En gros, il calcule et fait des stats hyper pointues pour choisir et décider quelle aprtie de l'arbre lui semble la meilleure. Mais il simule quand même derrière toute la partie (ou la compare avec une partie déjà existante).
Plus la base de donnée est grande, plus AlphaGo peut donc affiner ses calculs et avoir, statistiquement, une position favorable.
Mais sans sa base de donnée, AlphaGo n'est rien.

La différence fondamentale avec un humain c'est qu'un humain fait ça "naturellement" : même sans exemple, même dès sa première partie de Go (donc sans aucune base de donnée), un humain saura intuitivement quelle position lui semble la meilleure, et choisira intuitivement quelle partie de l'arbre il peut continuer à explorer (qu'il se trompe ou pas, c'est ce qu'il fera).
L'expérience ensuite lui dira "bon la dernière fois j'ai tenté ça et ça a foiré, je vais faire autre chose" donc il construira sa propre base à partir de ses critères.
Et c'est ça qui serait intéressant à simuler.

**Thufir** · 14/03/2016, 19h26

Justement si, Alpha Go sans sa base de donnée est très puissant.
DeepMind a fait le choix de la base de données pro, mais c'est une vraie question ouverte de savoir ce qu'il se passerait sans cette base de données.

On parle d'une IA qui en jouant uniquement contre elle-même , en tire des leçons sur sa façon de rechercher dans l'arbre, et donc améliorerait sa façon de jouer sans aucune modification de sa base de données.

la question est sans base de données, l'apprentissage contre-lui même serait-il trop lent, incomplet, ou au contraire dégagé d'un biais humain?

Après, en soi,ça ne fait pas avancer le domaine de l'IA parce qu'aucun des algorithmes utilisés n'est inédit.
mais c'est quand même une combinaison d'algorithmes (dont l'un de la branche 2 de Nilsou )qui résouds un problème qui était jusqu'ici insoluble pour les IA.
Ce n'est pas donc en soi un progrès, mais c'est la manifestation d'un progrès.

Pareil, quand tu dis qu'un humain fait ça naturellement, c'est non, l'humain se forge sa propre intuition de Go à partir de son expérience et des parties qu'il observe, ce n'est pas pour rien que reposer des parties professionnelles est considéré comme un élément important pour atteindre le haut niveau.

Voir des débutants tenter de lire des séquences à un endroit du plateau où il n'y a rien d'urgent, ça arrive tout le temps.

Après: je suis d'accord avec Nilsou que ce n'est qu'une forme d’intelligence, et que dans la partie 4 que Lee Sedol a gagné on en a vu tout de suite les limites: L'IA ne sait pas jouer quand elle tombe derrière(ou qu'elle s'estime derrière).
Enfin c'est une supposition, il faudra attendre la fin des 5 matchs et que les mecs de Deepmind étudient ce qui s'est passé, parce que honnêtement,ça faisait de la peine de voir ALphago faire n'importe quoi.

**Snakeshit** · 14/03/2016, 20h19

Envoyé par Thufir

Pareil, quand tu dis qu'un humain fait ça naturellement, c'est non, l'humain se forge sa propre intuition de Go à partir de son expérience et des parties qu'il observe, ce n'est pas pour rien que reposer des parties professionnelles est considéré comme un élément important pour atteindre le haut niveau.

Voir des débutants tenter de lire des séquences à un endroit du plateau où il n'y a rien d'urgent, ça arrive tout le temps.

C'est le cas pour tout ça en fait (finalement, notre mémoire est juste une base de donnée imparfaite). Bon certes, au morpion ou au jeu de Dames, même un humain peut calculer rapidement tous les résultats.

**FMP-thE_mAd** · 14/03/2016, 20h53

Envoyé par Thufir

Justement si, Alpha Go sans sa base de donnée est très puissant.
DeepMind a fait le choix de la base de données pro, mais c'est une vraie question ouverte de savoir ce qu'il se passerait sans cette base de données.

On parle d'une IA qui en jouant uniquement contre elle-même , en tire des leçons sur sa façon de rechercher dans l'arbre, et donc améliorerait sa façon de jouer sans aucune modification de sa base de données.

Oui elle améliorerait ses stats et ses probas, donc.
Mais au final c'est un peu comme rajouter des échantillons quand tu fais une étude stats. Plus tu as d'échantillon, plus tu es précis.

Après, en soi,ça ne fait pas avancer le domaine de l'IA parce qu'aucun des algorithmes utilisés n'est inédit.
mais c'est quand même une combinaison d'algorithmes (dont l'un de la branche 2 de Nilsou )qui résouds un problème qui était jusqu'ici insoluble pour les IA.
Ce n'est pas donc en soi un progrès, mais c'est la manifestation d'un progrès.

On est bien d'accord du coup.
Mais perso j'appellerai ça plus un progrès mathématiques (ou algorithmique) qu'un progrès d'IA (au sens où finalement ce n'est pas beaucoup plus "intelligent").

Pareil, quand tu dis qu'un humain fait ça naturellement, c'est non, l'humain se forge sa propre intuition de Go à partir de son expérience et des parties qu'il observe, ce n'est pas pour rien que reposer des parties professionnelles est considéré comme un élément important pour atteindre le haut niveau.

C'est vrai, mais à la simple lecture des règles un humain va de suite analyser des situations inutiles. Par exemple, je n'ai pas pratiqué le Go trop longtemps, mais dès la première partie je savais que jouer dans un coin était une connerie.
Ce qui différencie l'humain des IAs qu'on sait faire, c'est que justement il travaille avec une base de donnée bien plus réduite.

Comment Lee Sedol arrive-t-il aux mêmes résultats statistiques qu'Alpha Go, en ayant une base de donnée des millions de fois plus petite ?

Après: je suis d'accord avec Nilsou que ce n'est qu'une forme d’intelligence, et que dans la partie 4 que Lee Sedol a gagné on en a vu tout de suite les limites: L'IA ne sait pas jouer quand elle tombe derrière(ou qu'elle s'estime derrière).
Enfin c'est une supposition, il faudra attendre la fin des 5 matchs et que les mecs de Deepmind étudient ce qui s'est passé, parce que honnêtement,ça faisait de la peine de voir ALphago faire n'importe quoi.

Parce que ses stats ont amené à une aberration. Probablement que Lee Sedol le savait et a joué en conséquence.
Je ne serais pas étonné qu'une fois qu'on a compris comment Alpha Go fonctionne, on le bat bien plus facilement.
Je donne d'ailleurs Lee Sedol gagnant dans la 5eme aussi.

**Thufir** · 14/03/2016, 22h14

Envoyé par FMP-thE_mAd

C'est vrai, mais à la simple lecture des règles un humain va de suite analyser des situations inutiles. Par exemple, je n'ai pas pratiqué le Go trop longtemps, mais dès la première partie je savais que jouer dans un coin était une connerie.
Ce qui différencie l'humain des IAs qu'on sait faire, c'est que justement il travaille avec une base de donnée bien plus réduite.

Comment Lee Sedol arrive-t-il aux mêmes résultats statistiques qu'Alpha Go, en ayant une base de donnée des millions de fois plus petite ?

Lee Sedol s'est forgé son intuition à force d'experience et de travail,travail sur ses parties jouées et les parties qu'ils a étudiées.

Envoyé par FMP-thE_mAd

Parce que ses stats ont amené à une aberration. Probablement que Lee Sedol le savait et a joué en conséquence.
Je ne serais pas étonné qu'une fois qu'on a compris comment Alpha Go fonctionne, on le bat bien plus facilement.
Je donne d'ailleurs Lee Sedol gagnant dans la 5eme aussi.

Non,pour avoir vu la partie, on peut considérer que Sedol a cherché au début de partie une situation de "all-in" pour "contrer" l'évaluation précise de la machine, qui jouait très propre et très safe en gérant son avance.
Ce choix ne s'est pas avéré payant, la machine a réussi à sortir largement gagnant, justement en ne refusant pas le combat, et en faisant preuve d'une bonne vision globale(je parle d'un point de vue humain).

Lee Sedol sort au coup 78, un coup très surprenant pour tous les spectateurs. On n'est même pas sur qu'il marche. la machine répond en cédant,et à priori ne choisit pas la réponse optimale, mais MALGRE ça, elle semble toujours en avance, mais c'est là où il commence à mal jouer, donc on suppose qu'il se pensait derrière(ce qui n'avait rien d'évident pour les commentateurs pros) et il se saborde.

**FMP-thE_mAd** · 14/03/2016, 22h57

Envoyé par Thufir

Lee Sedol sort au coup 78, un coup très surprenant pour tous les spectateurs. On n'est même pas sur qu'il marche.

Je suis bien moins calé sur le sujet que toi.

Mais mon idée c'est que c'est là que Lee Sedol met la machine "statistique" d'AlphaGo en déroute.
Comme tu le dis même pour les commentateurs humains c'est un coup surprenant.
Ca l'est donc d'autant plus pour la machine, qui n'a pour 99% de ses références que des parties "classiques". Ainsi, Lee Sedol l'a obligé à faire des stats sur un échantillon plus réduit (les parties "aberrantes" on va dire), d'où les "erreurs" de stats ensuite.

Bon c'est évidemment une explication très basique, mais je ne serai pas étonné que Sedol réédite le truc dans la partie n°5. A voir à quel coup il va le faire maintenant qu'il a vu que ça marchait (bon, pis j'imagine que les ingénieurs de Google vont corriger le tir aussi).

Mon questionnement c'est pourquoi il a attendu le coup 78 et pas avant. Peut-être qu'avant il pensait encore gagner de manière "traditionnelle". Ou sans doute parce qu'avant c'était trop "dangereux" pour lui aussi. Peut-être aussi parce que plus il le fait tard, moins la machine aura "d'échantillon" pour réagir à un coup inhabituel. Ou peut-être tout simplement que c'était un coup de la dernière chance pour lui.

**Thufir** · 15/03/2016, 08h17

Non,là encore tu résumes AlphaGo à sa base de données, c'est complètement faux, il s'est servi de sa base de données pour améliorer sa méthode d'exploration de l'arbre, mais c'est tout, il ne l'utilise pas pendant le match.
Si tu regardes les parties d'Alphago tu vois qu'il joue dès le début de partie des coups très originaux.
Qui sortent de tout ce qu'on a vu, alors qu'on est encore à un moment où on est dans une partie classique qui doit correspondre à sa base de données.
C'est AlphaGo dans la partie 2 et 3 qui sort du classique pour aller dans l'original.(un professionnel parle même de "possible 3ème révolution du début de partie")
Encore une fois, tu ne peux certainement pas réduire à ALphaGo à des stats sur une base de données.

Le coup 78 est brillant, parce que contre-intuitif pour un humain: une pierre au milieu de la formation adverse,dans ce qu'il trouve être son point faible.
C'est un coup extrêmement difficile à voir, mais ce n'est pas un coup relevant d'une stratégie particulière.
Son choix de stratégie du all-in, il le fait bien avant ce coup,et ça n'a pas fonctionné.

le coup 78 lui-même n'est pas un pari ni même un choix,c'est un coup brillant qui est apparu dans le combat en cours. un choix.
Et je le répète,si la réponse de la machine à ce coup est discutable,d'après tous les commentateurs,elle reste ensuite en avance.

Lee Sedol a essayé de jouer original pour piéger la machine dans la partie 1(dès le début) et la fin de la partie 3(quand c'était perdu) et ça n'a pas marché, ça a même été plutôt l'inverse.

Et comme dit précédemment, les ingénieurs ont verrouillé la machine pour le match. C'est le même algorithme dans les 5 manches.

**Bah** · 15/03/2016, 10h52

Envoyé par FMP-thE_mAd

Je donne d'ailleurs Lee Sedol gagnant dans la 5eme aussi.

D'après le wiki il a perdu, mais j'ai pas encore trouvé d'article.

Et un autre article intéressant
http://www.wired.com/2016/03/sadness...es-ai-play-go/

**Anonyme221030** · 15/03/2016, 11h41

Envoyé par Bah

Et un autre article intéressant
http://www.wired.com/2016/03/sadness...es-ai-play-go/

Bon article effectivement. La question en filigrane, l'IA va-t-elle supplanter l'homme ou lui faire franchir un nouveau cap dans l'évolution, est intéressante.

C'est juste dommage qu'on soit le sujet de l'expérience

**FMP-thE_mAd** · 15/03/2016, 12h26

Envoyé par Bah

D'après le wiki il a perdu, mais j'ai pas encore trouvé d'article.

Ah flute

@Thufir : effectivement c'est moins simpliste que ce que je décris plus haut.
Mais globalement l'idée doit être celle-là . Il faudrait des analyses plus poussées du truc, mais a priori seul Google sait "pourquoi" AlphaGo a joué comme ça.

Envoyé par Thufir

Non,là encore tu résumes AlphaGo à sa base de données, c'est complètement faux, il s'est servi de sa base de données pour améliorer sa méthode d'exploration de l'arbre, mais c'est tout, il ne l'utilise pas pendant le match.

Euh tu es certain de ça ?
Me semblait que si. La base de données fait parti de son adn, en quelque sorte.

**ZenZ** · 15/03/2016, 13h29

Apparemment la prochaine étape est de mettre face à face cette machine (ou une autre je sais pas) face à un joueur humain sur un jeu de stratégie en temps réel cette fois : Starcraft.

Vu que ce n'est pas le topic ici on va pas partir en HS, mais vous pouvez venir en discuter sur le forum du jeu ici : http://forum.canardpc.com/forums/104-Starcraft-2

**FMP-thE_mAd** · 15/03/2016, 21h09

Un article du Monde sur la retour de Lee Sedol après ses 5 parties :

http://www.lemonde.fr/pixels/article...6_4408996.html

Intéressant comme il analyse le truc. Je ne suis pas certain de partager ses conclusions. Pour moi de toute façon plus la puissance de calcul va augmenter, plus AlphaGo sera performant. Donc il est difficile de conclure que l'humain réfléchira toujours "mieux" que l'ordinateur.
A moins qu'il ait voulu dire ça parce que malgré sa puissance de calcul limité, l'humain parvient à rivaliser, ce qui prouve sa supériorité intellectuelle.

En revanche sur l'aspect psychologique je le suis totalement. Un humain qui joue un match contre un autre humain va essayer de jauger son adversaire. Regards, attentes, gestes même inconscients font que l'adversaire va constamment essayer de savoir à quoi il pense pour essayer d'anticiper les coups. Ce qui est impossible à faire avec un ordinateur, qui ne donne aucun signe de "à quoi pense-t-il" .

Dans l'article, un passage d'un ingénieur de Google :

AlphaGo « surpris » par un coup

A son crédit, le joueur coréen a remporté une partie, prouvant qu’AlphaGo n’était pas infaillible. Quelle a été la raison de cette victoire dans la quatrième manche ? Demis Hassabis, fondateur de Deepmind, a levé le voile sur la manière dont l’intelligence artificielle avait « vécu » le soixante-dix-huitième coup du Coréen, considéré comme décisif. Celui-ci a littéralement surpris l’arbre décisionnel de l’intelligence artificielle.

Taken a quick look at the logs: AlphaGo gave a probability of <1 in 10000 for Lee's brilliant move 78, so AG found this move very surprising
— demishassabis (@Demis Hassabis)

« J’ai jeté un œil rapide aux registres internes : AlphaGo estimait à moins de 1 sur 10 000 la probabilité du brillant 78e coup de Lee, donc AlphaGo a trouvé celui-ci vraiment surprenant. »

Ce qui confirme ce que je dis plus haut : c'est bien la probabilité de ce coup qui a foutu dedans les "prévisions" d'AlphaGo et donc perturbé son cheminement dans l'arbre décisionnel.
Bien sûr il n'y a pas que ça.

**Thufir** · 15/03/2016, 21h46

Envoyé par FMP-thE_mAd

Euh tu es certain de ça ?
Me semblait que si. La base de données fait parti de son adn, en quelque sorte.

Mais il est capable de s'en éloigner très tôt,du coup,en quoi est-ce différent d'un joueur qui étudie le go,apprend de sa propre expérience?

**FMP-thE_mAd** · 15/03/2016, 23h09

Envoyé par Thufir

Mais il est capable de s'en éloigner très tôt,du coup,en quoi est-ce différent d'un joueur qui étudie le go,apprend de sa propre expérience?

De ce que j'ai compris même quand il parcourt son arbre, AlphaGo peut revenir à tout moment à une comparaison avec sa base de données aussi (pour voir si une partie ressemble à la aprtie en cours). Donc il peut s'éloigner de sa base de donéne, mais il peut y retourner aussi (pour faire des comparaisons simplement). Je me trompe peut-être sur ce point hein. Mais c'est ce que j'ai déduit des quelques articles linké ici.

Après oui tu as raison le processus humain est similaire finalement. L'humain parcourt son arbre, tout en se remémorant les parties qu'il a déjà vues ou jouées pour en tirer des conséquences.

Mais c'est très différent du point de vue probabiliste.
La base de donnée humaine est très petite comparée à celle d'AlphaGo. Et ça change fondamentalement la donne à mon sens d'un point de vue mathématique (même si au final, on sait mathématiquement parlant qu'au delà d'une certaine quantité, on gagne très peu à rajouter encore des échantillons).
Pareil pour le parcours de l'arbre. AlphaGo a un arbre énorme qu'il parcourt. Certes il ne tient pas compte de branches entières mais quand même. L'humain aussi parcourt un arbre, mais son arbre est très limité. Aussi bien dans le temps (i.e. le nombre de coup qu'il va envisager à l'avance) que dans l'espace (le nombre de branche qu'il est capable d'envisager à partir d'un cran donné).

C'est donc d'un point de vue statistique et probabilité une énigme : comment l'humain arrive à peu près aux mêmes résultats qu'un ordi, alors que son échantillon est beaucoup plus restreint ?
Deux hypothèses à mon avis :
1) soit finalement l'échantillon d'AlphaGo est gros "pour rien" (i.e au final il arriverait aux mêmes résultats avec un échantillon plus restreint).
2) soit l'humain fait "autre chose" dans son cerveau que le processus de construction de l'arbre et de parcourt de l'arbre qui lui fait choisir des options "autrement".

Inutile de dire que je ne pense pas que ce soit l'hypothèse 1) puisque justement on n'avait pas encore réussi à battre un humain au Go jusqu'à présent parce que les ordis avaient des échantillons trop petits et / ou avaient des gros échantillons mais qu'ils mettaient trop de temps à parcourir par manque de puissance.

Après, je serai bien incapable de développer plus l'idée 2).

**Thufir** · 15/03/2016, 23h15

Oui,dans ce cas là ,je te suis complètement, qu'on n'est pas en face d'une intelligence au niveau de celle de l'humain, même pour ce qui est de la "compréhension" du jeu, on l'a bien vu à certains moments.
Mais ça reste quand même la manifestation d'une avancée en terme d'intelligence artificielle, même si le chemin reste très long.

par contre non justement avant c'est pas les ordis qui avaient un échantillon trop petit ou pas assez de puissance de calcul, mais bien des algorithmes pas assez fin qui ne leur disaient pas quelles parties de l'arbre explorer. Cette sélection des parties de l'arbre est déjà une des bases de l’intelligence, ou une imitation de celle-ci.

**FMP-thE_mAd** · 15/03/2016, 23h38

Envoyé par Thufir

par contre non justement avant c'est pas les ordis qui avaient un échantillon trop petit ou pas assez de puissance de calcul, mais bien des algorithmes pas assez fin qui ne leur disaient pas quelles parties de l'arbre explorer. Cette sélection des parties de l'arbre est déjà une des bases de l’intelligence, ou une imitation de celle-ci.

Oui c'est pas faux.
Mais avec la méthode Monte-Carlo on enlevait une partie de l'arbre aussi. Sauf qu'on le faisait plus ou moins au hasard. Est-ce de l'intelligence ?
Si ça se trouve l'humain fait pareil

**Enyss** · 16/03/2016, 00h06

De ce que j'ai compris même quand il parcourt son arbre, AlphaGo peut revenir à tout moment à une comparaison avec sa base de données aussi (pour voir si une partie ressemble à la aprtie en cours). Donc il peut s'éloigner de sa base de donéne, mais il peut y retourner aussi (pour faire des comparaisons simplement). Je me trompe peut-être sur ce point hein. Mais c'est ce que j'ai déduit des quelques articles linké ici.

AlphaGo n'utilise pas de base de donnée...

Il utilise des réseaux de neurones qui ont été entrainés sur des milliers/millions de parties, mais n'utilise pas la mémoire exacte de ces parties en phase de jeu.

Discussion: Jeu de Go: Topic des coeurs de pierre

Outils de la discussion

Règles de messages