Dette Computerprogram Kan Slå Nogen På Poker

{h1}

Et nyt computerprogram kan udvise mennesker på et to-spiller pokerspil.

Computere har fundet ud af, hvordan man vinder på skak, tjekker og tic-tac-toe, og nu har et computerprogram erobret spillet poker.

Et forskergruppe ledet af Michael Bowling, professor i computervidenskab ved University of Alberta i Canada, udviklede et computerprogram, der kan udvise mennesker på et to-spiller pokerspil - specielt heads-up limit hold dem. Resultaterne kunne have vidtrækkende konsekvenser for andre situationer, der kræver komplekse beslutninger, som f.eks. Udenrigspolitik eller medicinsk behandling.

I modsætning til skak eller checkers, ved poker, kender en spiller ikke altid de andre bevægelsers tidligere bevægelser. Plus kan en spiller vinde en hånd, når de andre spillere foldes. Derfor har spillet i matematiske termer ufuldstændige oplysninger. [Top 10 revolutionære computere]

"Chess har en perfekt spilløsning - svaret for en given position er en vinder for sort, en vinder for hvid eller en uafgjort," sagde Bowling. "Poker er mere sandsynligt." Med andre ord er der ingen absolut perfekt hånd eller strategi.

Hvordan det virker

I den version af hold poker, som computeren spillede, er væddemålene mellem to spillere løst, og antallet af rejser er begrænset. Forhandleren giver hver spiller to kort, kaldet hulkort. En satsningsrunde følger, kendt som "pre-flop". Herefter lægges der tre kort på bordet, kaldet en "flop". Flop er et sæt community cards, der håndteres med forsiden op, så begge spillere ved, hvad de er. En anden runde af væddemål følger, og derefter sætter et fjerde kort på bordet, kaldet "turn". Efter en tredje runde af væddemål uddeles det sidste fællesskabskort (det såkaldte "floden"), og på det tidspunkt skal spillerne vise deres hulkort, forudsat at en spiller ikke har foldet endnu.

Computeren beregner ikke enhver mulig hånd, mens den spiller. I stedet opbygger den en tabel med resultater, før spillet starter. Ved hjælp af ca. 4.000 centralbehandlingsenheder i to måneder - svarende til omkring 1000 års beregningstid - simulerer det milliarder pokerhænder. Tabellen med resultater alene tog op omkring 15 terabyte computerlager, sagde Bowling. Til sammenligning er et typisk backupdrev til et skrivebord en terabyte. [10 teknologier, der vil transformere dit liv]

Algoritmen går igennem alle mulige hænder, som en modspiller kan have, og dernæst opgør resultaterne for hver taktik - for eksempel hæve, folde eller kalde væddemålet (dvs. matchende modstanderen). For at få en ide om, hvor stor opgaven er, er der 13,8 billioner forskellige situationer, der kan komme op i spillet. For at komme der skal hvert menneske på Jorden spille næsten 4.000 pokerhænder.

Dette adskiller sig fra skak, hvor en computer kan brute-force beregne bevæger sig, når spillet skrider frem for at få et resultat, som er godt nok til at vinde. (I modsætning til hvad mange tror, ​​går få computerprogrammer faktisk igennem hver eneste permutation, bare dem der producerer de bedste resultater). Forestil dig i stedet, hvis skakspil-computere skulle se resultaterne af milliarder af tidligere spil med en specifik konfiguration af stykker på tavlen.

Da der spilles milliarder hænder, kommer programmet op med en optimal strategi - det vil sige det konvergerer på, hvad det bedste træk er for en given hånd. "Sådan fungerer det... det har allerede spillet en milliard milliard hænder poker," sagde Bowling.

Mastering spillet

Fordi poker ikke er løsbar, hvordan skak eller checkers er, kom Bowling og hans team med et andet sæt krav til at kalde spillet "løst". I videnskabelige termer er spillet "i det væsentlige løst", hvilket betyder at der er en måde at udnytte den strategi, computeren bruger. Forskerne antog, at en person spillede computeren i 70 år, 365 dage om året, i 24 timer om dagen. Programmet de skrev spillede så godt, at hvis big blind - den faste indsats - er $ 1000, kan den mest perfekte spiller vinde være omkring $ 1 per hånd eller 1/1000 af big blind.

Andre eksperter har arbejdet på pokerspil computere, der bruges i kasinoer, og mindst et firma siger, at det har designet en maskinlæringsalgoritme, der justerer strategien ifølge den menneskelige spiller. Men ingen har påvist, at dets udnyttelsesevne - den perfekte menneskelige spilleres evne til at slå maskinen - er så lille som det program, der er designet af Bowlings team. Ligeledes har ingen løst spillet på samme matematisk strenge måde.

Men algoritmen har begrænsninger. For det ene fungerer det kun med tohånds spil. I et tre-spiller spil er det muligt, at en spiller kan have en forfærdelig strategi (for eksempel har spilleren tendens til at rejse hele tiden) og taber mindre end den anden spiller, der har en bedre strategi, der resulterer i i en sejr til den tredje spiller.

Et andet problem er at finde ud af, hvordan man kan teste tre-spiller-spil retfærdigt. Et eksperiment kunne få to mennesker til at spille maskinen, men Bowling sagde, at de menneskelige spillere kan samle sig imod maskinen, selvom det er utilsigtet. Lignende problemer kan opstå i forsøg med to maskinafspillere og et menneske: Selvom de to programmer ikke samles, kan det se sådan ud til et menneske. "Vi ved ikke, hvordan vi kører det retfærdigt," sagde han.

Bowling sagde, at denne teknologi kunne have forskelligartede anvendelser, lige fra national sikkerhed, til at spore fareunddragelse på transitsystemer, til at træffe beslutninger om medicinsk behandling.Programmet kan f.eks. Hjælpe en læge, der skal træffe beslutning om behandling, men er usikker på de mulige resultater. De metoder, der anvendes i pokerprogrammet, kunne hjælpe læger med at identificere behandlingsmuligheder med optimale resultater eller en med den bedste sandsynlighed for succes.

Forskningen blev beskrevet online i dag (8. jan) i tidsskriftet Science.

Følg WordsSideKick.com @wordssidekick, Facebook & Google+. Originalartikel på WordsSideKick.com.


Video Supplement: Real Life Trick Shots 2 | Dude Perfect.




DA.WordsSideKick.com
All Rights Reserved!
Reproduktion Af Materialer Tilladt Kun Prostanovkoy Aktivt Link Til Webstedet DA.WordsSideKick.com

© 2005–2019 DA.WordsSideKick.com