Questionnaire sur l’application du RGPD aux modèles d’IA

  • Actuel Introduction
  • Remise en contexte
  • Questionnaire
  • Terminé

Comme cela est étayé par la littérature scientifique, la CNIL constate que les modèles d’IA mémorisent parfois une partie des données utilisées pour leur apprentissage. Lorsque celles-ci comportent des données personnelles, les modèles d’IA pourraient entrer dans le champ d’application du RGPD.

La CNIL invite les fournisseurs et utilisateurs de systèmes d’IA, ainsi que l’ensemble des acteurs concernés, à apporter leurs éclairages sur les conditions dans lesquelles les modèles d’IA peuvent être considérés comme anonymes ou doivent être encadrés par le RGPD.


Le développement d’un modèle d’IA est un traitement consistant à modéliser un ensemble de données d’apprentissage :  le modèle d’IA constitué est une représentation des caractéristiques de la base qui a servi à l’entraîner. Cette modélisation peut donner lieu à une mémorisation des données d’entraînement, induisant un risque que les données d’apprentissage puissent être reconstruites à partir du modèle entraîné.

La vraisemblance de ce risque dépend toutefois des situations :

  • Certains modèles d’IA génératifs entraînés sans précautions pourront régurgiter des données d’apprentissage à l’identique dans le cadre de leur utilisation courante.
     
  • Dans d’autres cas, il sera nécessaire de conduire des attaques poussées sans de plus avoir de garanties théoriques sur la véracité de l’information obtenue.

Les risques liés à la mémorisation de données personnelles varient donc de façon très importante en fonction des modèles, des données utilisées et des contextes d’utilisation. Il pourrait sembler inadapté d’exiger que la même analyse soit conduite afin de prouver le caractère anonyme des modèles dans les deux configurations décrites ci-dessus.

Par ailleurs, la charge de cette analyse pourrait en théorie revenir au fournisseur du modèle ou à son utilisateur, mais les informations dont dispose ce dernier ne pourront pas toujours lui permettre d’accomplir cette tâche. Ainsi, la CNIL s’interroge également sur l’acteur à qui pourrait revenir la responsabilité de cette analyse selon les configurations.

Avec ce questionnaire, la CNIL sollicite les parties prenantes du secteur pour adapter ses futures recommandations aux risques réels et aux capacités du secteur à les réduire.

La CNIL traite les données recueillies à partir de ce formulaire afin d'analyser les observations des participants en vue d'adopter les recommandations concernées. Les données sont également collectées pour réaliser des statistiques relatives aux contributions et, si nécessaire, pour contacter les contributeurs afin d'approfondir les échanges ou les tenir informés des suites de la consultation. La base légale du traitement est l'exercice de l'autorité publique. Les données sont communiquées aux services de la CNIL en charge de l'analyse des réponses fournies.

Vous pouvez accéder à vos données, vous opposer à leur traitement, demander leur rectification ou leur effacement. Vous pouvez également exercer votre droit à la limitation du traitement de vos données.

En savoir plus sur la gestion de vos données et vos droits.