Partager cette page :

Apprentissage automatique et respect de la vie privée

le 9 avril 2019

15h30

ENS Rennes, Salle du conseil
Plan d'accès

Intervention de Marc Tommasi, Professeur, équipe Magnet, laboratoire CRIStAL, Lille, dans le cadre des séminaires du département Informatique et télécommunications.

Séminaire Informatique et télécommunications

/medias/photo/seminaire-dit_1626769502506-jpg

Le séminaire s'intéresse à la question de la centralisation des données et de ses risques. Le cadre méthodologique est celui de l'apprentissage supervisé. Nous aborderons particulièrement le principe de minimisation de risque empirique et nous présenterons les outils théoriques pour estimer formellement l'erreur en généralisation des méthodes. 

Les succès récents de l'apprentissage automatique reposent largement sur la mise à disposition de très gros volumes de données et l'augmentation des capacités de calcul. Cependant, le véritable défi scientifique est d'apprendre sans centralisation des données. Nous présenterons quelques méthodes pour faire collaborer des agents dans des tâches d'apprentissage automatique, puis de le faire tout en écartant la possibilité d'échange de données et enfin le faire en montrant formellement que les données d'apprentissage ne soient pas révélées. 

La "differential privacy" utilisée ici est un outil théorique puissant pour prouver ces garanties sur la vie privée, mais, en pratique, ce cadre formel se suffit sans doute pas. De nombreuses questions restent ouvertes et rendent ce domaine de l'apprentissage automatique respectueux de la vie privée très actif dans la communauté.


Thématique(s)
Formation, Recherche - Valorisation
Contact
Luc Bougé

Mise à jour le 22 mars 2019