Παρασκευή, 29 Μαρτίου, 2024

Είναι επίσημο: Οι υπολογιστές κυριαρχούν στο πόκερ

Ο επενδυτής και βετεράνος του πόκερ Άλαν Ντου, αντιμετώπισε για πέντε ημέρες τον ψυχρό αντίπαλό του και κατέληξε να χάνει πολλά χρήματα.

Ο αντίπαλος του ήταν κυριολεκτικά απάνθρωπος. Και αυτό διότι ο Ντου τα έβαλε με τον «Lengpudashi»: Μια αναβαθμισμένη έκδοση του προγράμματος τεχνητής νοημοσύνης Libratus που κατάφερε να νικήσει τέσσερις από τους καλύτερους επαγγελματίες του πόκερ στον κόσμο τον περασμένο Ιανουάριο. Στεγασμένος σε ένα υπολογιστικό κέντρο κοντά στο Πανεπιστήμιο Carnegie Mellon στο Πίτσμπουργκ το όνομα του μεταφράζεται στα αγγλικά σε «ψυχρός άρχων του πόκερ».

Ο Ντου και μια ομάδα πέντε ατόμων έπαιξαν 36.000 χέρια πόκερ εναντίον της μηχανής κατά την διάρκεια πέντε ημερών. Και ο υπολογιστής κέρδισε με μεγάλη διαφορά.

Το πόκερ είναι εξαιρετικά διαδεδομένο σε venture capitalists όπως ο Ντου γιατί όπως δηλώνει ο ίδιος «κάθε χέρι στο πόκερ είναι σαν μια νέα επένδυση που πρέπει να υπολογίσεις το ρίσκο και τις πιθανές αποδόσεις». Πέρα από επενδυτής ο Ντου έγινε πέρσι και ο πρώτος Κινέζος που κέρδισε το «χρυσό βραχιόλι» του World Series of Poker.

Η περίπλοκη στρατηγική του πόκερ και τα στοιχεία της μπλόφας που διαθέτει είναι δύο χαρακτηριστικά που κάνουν το παιχνίδι πολύ ενδιαφέρον για τους επιστήμονες που ασχολούνται με την τεχνητή νοημοσύνη. Ένα παίχτης του πόκερ καλείται να ποντάρει, να μπλοφάρει ή να πάει πάσο χωρίς να έχει δει το χέρι του αντιπάλου του, γεγονός το οποίο αποτελεί μια διαφορετική πρόκληση από παιχνίδια όπως το σκάκι η το Go, όπου όλα τα κομμάτια είναι τοποθετημένα και ξεκάθαρα πάνω στο τραπέζι.

Ο Ντου προσπάθησε να επιτύχει εκεί που είχαν αποτύχει οι επαγγελματίες παίχτες του πόκερ χρησιμοποιώντας μια διαφορετική στρατηγική. Η ομάδα του αντί να διαθέτει επαγγελματίες παίχτες με μεγάλη εμπειρία στο παιχνίδι, αποτελούταν από μηχανικούς, επιστήμονες και επενδυτές που προσπάθησαν να εφαρμόσουν τις γνώσεις τους στην πληροφορική και τη θεωρία παιγνίων για να αντιμετωπίσουν τον υπολογιστή. Δεν τα κατάφεραν.

Ο Τουόμας Σάντχολμ, καθηγητής πληροφορικής στο Carnegie Mellon, δουλεύει πάνω στο λογισμικό του Libratus από το 2004 βελτιώνοντας συνεχώς την ικανότητα του να λαμβάνει αποφάσεις σε καταστάσεις με περιορισμένες πληροφορίες. Το νόημα του να εκπαιδεύει κανείς συστήματα τεχνητής νοημοσύνης να παίζει παιχνίδια όπως το σκάκι, το Go και το πόκερ  βρίσκεται στο να βελτιώνει την ικανότητά τους να παίρνουν στρατηγικές αποφάσεις σημειώνει ο ίδιος. Αυτές οι ικανότητες μπορούν να εφαρμοστούν με επιτυχία σε πραγματικά προβλήματα που έχουν να κάνουν με την λειτουργία των επιχειρήσεων, την οικονομία και την κυβερνοασφάλεια.

«Πολλοί πιστεύουν ότι το μπλοφάρισμα είναι κάτι πολύ ανθρώπινο που δεν μπορούν να κάνουν οι μηχανές. Κάνουν λάθος», αναφέρει ο Νόαμ Μπράουν, διδακτορικός φοιτητής του Σάντχολμ και συν-δημιουργός του Libratus. «Ένας υπολογιστής μαθαίνει από την εμπειρία του ότι αν έχει αδύναμο χέρι στο πόκερ και μπλοφάρει, μπορεί να βγάλει λεφτά».

O υπολογιστής δεν έμαθε να μπλοφάρει μιμούμενος πετυχημένους παίχτες του πόκερ, αλλά από την θεωρία παιγνίων. «Η στρατηγική διαμορφώθηκε μόνο από τους κανόνες του παιχνιδιού» και όχι από την ανάλυση ιστορικών δεδομένων, δηλώνει ο Σάντχολμ.

Ένα σημαντικό στοιχείο που φάνηκε στην συγκεκριμένη εκδήλωση είναι η πιθανή «δημοκρατικοποίηση» της τεχνητής νοημοσύνης. Ο Μπράουν δήλωσε πως η υπολογιστική ισχύς που απαιτήθηκε για τον διαγωνισμό μπορεί να αγοραστεί με λιγότερα από 20.000 δολάρια.

«Είναι απίστευτα οικονομικό», δήλωσε. «Μέσα σε πέντε χρόνια, το λογισμικό μας θα μπορούσε να τρέχει σε smartphone».

By