Nieuws

AI verslaat mens nu ook met poker

Na schaken en Go heeft nu ook met poker een zelflerende computer de beste menselijke spelers verslagen. Onderzoekers van Carnegie Mellon en Facebook onthullen hun pokerrobot ‘Pluribus’ in het artikel 'Superhuman AI for multiplayer poker' in Science.

De winst van Pluribus in een serie van 5.000 potjes  ‘no limit’ Texas Hold’Em tegen vijf van de beste menselijke pokerspelers ter wereld betekent een grote stap vooruit in de ontwikkeling van kunstmatige intelligentie. ‘Het is verbijsterend. Ik dacht dat we er op geen stukken na waren. Pas een jaar geleden begon ik te geloven, dat dit mogelijk was, zegt onderzoeker Tuomas Sandholm in MIT Technology Review.

Het feit dat bij poker de kaarten in de hand van tegenstanders verborgen informatie zijn maakt poker voor een computer lastiger te automatiseren dan volledig transparante spellen als schaken of Go. Bovendien bestaat er in een toernooisetting met zes spelers geen heldere unieke optimale strategie (Nash evenwicht).

In 2017 waren de onderzoekers Sandholm en Brown er al wel in geslaagd om een bovenmenselijke pokkerrobot te bouwen mensen versloeg bij één-tegen-één toernooien. Partijen met meer spelers leken toen nog veel te hoog gegrepen. Brown: ‘Dit is echt cruciaal om AI in de echte wereld te laten werken, want zoveel echte-wereld-situaties bevatten verborgen informatie.’ Dit soort algoritmes zou volgens de onderzoekers nuttig kunnen zijn voor onder meer onlineveilingen en navigatiesystemen.

‘We beschouwen bluffen als een menselijke eigenschap. Maar wat we zien is dat bluffen eigenlijk mathematisch gedrag is, wiskunde. Als Pluribus bluft, ziet het dat niet als misleiding of bedrog, maar gewoon als een manier om het meeste geld te kunnen winnen,’ zegt Noam Brown.

Brown en Sandholm lieten hun zelflerende systeem eerst een biljoen partijen tegen zichzelf spelen. Na acht dagen was Pluribus klaar voor de eerste dag van een twaalf daags toernooi tegen vijf menselijke opponenten, waaronder Darren Elias, de man met de meeste ‘World Poker Tour titels op zijn naam en Chris ‘Jesus’ Ferguson, die zes maal de beste van de wereld was. Pluribus won structureel meer chips dan zijn tegenstanders. Het paste daarmee onder meer de slecht aangeschreven strategie van ‘donk betting’ (afgeleid van het Engelse ‘ezel’) toe en bleek voor zijn tegenstanders volledig onvoorspelbaar.

Onderstaand filmpje geeft enkele mooie voorbeelden van gedurfde en geslepen speelwijzen van Pluribus.

Ontvang de nieuwsbrief, binnenkort 2 keer per week

Meld je nu aan!

Gratis proefabonnement TW

Bestel nu 2 gratis proefnummers TW