Séminaire DEVI – Sébastien Gerchinovitz

Date - Heure / Date - Hour
Date(s) - 12/01/2017 - 26/01/2017
11h00 - 12h00

Emplacement / Location
ENAC, Building Breguet, Amphi Bellonte


Bandits antagonistes à K bras : un problème d’apprentissage séquentiel avec garanties de robustesse.

Dans cet exposé, nous aborderons le problème de bandits à K bras dits « antagonistes », i.e., lorsque aucune hypothèse n’est faite sur la suite des gains délivrés. Ce point de vue « pire des cas » permet d’apporter des garanties de robustesse, ainsi que des techniques séquentielle de calibration des paramètres. Nous présenterons d’abord une introduction aux bandits classiques (stochastiques), nous décrirons ensuite en détail le problème de bandits antagonistes, et présenterons enfin quelques résultats récents publiés dans l’article Refined Lower Bounds for Adversarial Bandits.

Sébastien Gerchinovitz, Institut de Mathématiques de Toulouse, Université Paul Sabatier.