Partager cette page :

Bandits manchots : agir et apprendre en même temps

le 6 septembre 2023

13h15

Campus de Beaulieu Salle i-56 - bât. 12D

Intervention de Romaric Gaudel, enseignant-chercheur à l'université de Rennes dans l'équipe LACODAM, à l'IRISA, dans le cadre des séminaires du département Informatique.

/medias/photo/seminaire-di_1630676501273-jpg

Les bandits-manchots à bras multiples modélisent un grand nombre d'applications dans lesquelles un agent artificiel choisit une action à chaque pas de temps et reçoit une récompense aléatoire qui dépend de cette action. La distribution de ces récompenses n'est pas connue et l'agent doit l'apprendre uniquement  à partir des récompenses qu'il reçoit. Ce cadre couvre, par exemple, le choix des nouvelles à afficher sur une page web, ou la recommandation de vidéos.
Je présenterai dans ce séminaire les problématiques soulevées par les bandits-manchots, les grandes idées pour y répondre, ainsi que des problèmes toujours ouverts.

Thématique(s)
Formation, Recherche - Valorisation
Contact
Killian Barrere

Mise à jour le 14 septembre 2023