Evaluation de vie privée des données synthétiques

Évaluer les risques résiduels de vie privée des données synthétiques

Dans le domaine de la recherche médicale et de manière plus générale pour le développement des connaissances, il est possible d’entraîner des modèles d’apprentissage à générer des profils de patients synthétiques à partir de vraies données. Cependant, comment caractériser les risques résiduels de vie privée de ces profils synthétiques?

Domaines du LATECE

Santé connectée

Valeurs du LATECE

Conscience sociale
Services aux populations
Avancement des connaissances

Nature du projet

Conception d’un modèle d’évaluation de vie privée des données synthétiques

Problème abordé

Comment caractériser les risques résiduels de vie privée des données synthétiques?

Solutions livrées

Participation à une compétition internationale visant à tester, par attaque par inférence d’appartenance, si les données synthétiques auraient retenu des informations sensibles sur les données réelles ayant servi d’entraînement pour la génération de profils synthétique. L’équipe UQAM-CHUM a pu démontrer que certaines précautions sont nécessaires pour mieux les protéger dans les modèles génératifs.

The UQAM-CHUM team demonstrated that certain safeguards are needed to better protect personal data used by generative models.

Création d’une librairie implémentant des modèles de création de données synthétiques assurant la confidentialité différentielle et permettant aussi de tester les attaques de vie privée pour évaluer les risques résiduels

Publics cibles

Grand public
Système de santé
Domaines de l’IA et de la recherche médicale

Démarrage

2023

Achèvement

2026

Leader

Sebastien Gambs, PhD

Personnel étudiant du LATECE

Hadrien Lautraite

Collaborateurs

Jean-François Rajotte, Lorrie Herbault, Yue Qi, Michaël Chassé, CHUM

Mots-clés

#Connected Health #AI #PersonaData #SyntheticData #Privacy

Partenaires et sources de financement

FRQS

Montant du financement

$30,000

Publications

CLOVER: A framework for benchmarking synthetic data generation methods balancing utility and privacy in healthcare. Yue Qi, Lorrie Herbault, Hadrien Lautraite, Michael Yu, Katleen Blanchet, Christian Vincelette, Louis Mullie, Guillaume Dumas, Jean-François Rajotte, Kamran Afzali, Sébastien Gambs, Michaël Chassé. Artificial Intelligence in the Life Sciences, 2026

Dans les médias

Faculté des sciences