[ad_1]
Pluribus est une intelligence artificielle développée par Facebook et l’Université de Carnegie-Mellon de Pittsburgh. Il s’agit désormais de la première IA à réussir à battre des joueurs de Poker dans un jeu multijoueurs.
L’IA s’est forgé une stratégie globale en seulement 8 jours de calcul depuis un serveur de 64 coeurs et avec seulement 512 Go de RAM. Cela peut paraitre énorme, mais comparé aux IA officiants depuis des réseaux neuronaux gigantesques et des supercalculateurs surpuissants, cela ne représente qu’une puissance de calcul très modeste.
Pluribus ne s’est par ailleurs pas entrainée contre des humains, mais contre elle-même pendant tout ce temps afin d’apprendre de ses propres erreurs et d’adapter rapidement sa stratégie. L’entrainement a été baptisé “Monte Carlo counterfactual regret minimization”. Le principe du Monte Carlo correspond au fait de réfléchir en fonction de trois principales possibilités et de construire ainsi 3 schémas de jeux possibles en prévision des coups à venir. Regret Minimization consiste à prédire ce qui peut être joué et adapter ainsi des actions qui limitent au maximum les regrets.
D’autres IA se sont illustrées dans des parties de Poker en 1 contre 1 par le passé grâce au fait qu’il est relativement facile d’évaluer les probabilités et d’estimer la main de l’adversaire. Or, avec 5 adversaires, les choses sont beaucoup plus complexes.
Là où les IA s’échinent généralement à repérer des motifs dans le jeu de leurs adversaires pour l’exploiter à son avantage, Pluribus opère un travail de fond plus global en adaptant sa stratégie chaque minute ce qui lui permet par ailleurs de la rendre moins lisible pour les adversaires et d’orchestrer plus facilement son bluff.
On ne sait pas encore comment le développement d’une telle forme d’IA pourra servir les intérêts de Facebook, mais le réseau s’offre un joli coup de projecteur pour sa capacité dans le domaine.
[ad_2]
Source link
Have something to say? Leave a comment: