


L’audit de la confidentialité différentielle (CD) est essentiel pour garantir que les mécanismes de protection des données fonctionnent comme prévu. Cependant, le développement de ces mécanismes est complexe et sujet aux erreurs. DP-Auditorium est une nouvelle bibliothèque open source qui permet d’auditer efficacement les garanties de CD avec uniquement un accès blackbox aux mécanismes.
**Garanties de la confidentialité différentielle**
La sortie d’un mécanisme de CD est un échantillon tiré d’une distribution de probabilités qui satisfait une propriété mathématique assurant la confidentialité des données utilisateur. Une garantie de CD est donc étroitement liée aux propriétés entre des paires de distributions de probabilités.
**DP-Auditorium**
DP-Auditorium comprend deux composants principaux : des testeurs de propriétés et des chercheurs de jeux de données. Les testeurs de propriétés prennent des échantillons à partir d’un mécanisme évalué sur des jeux de données spécifiques pour identifier les violations des garanties de confidentialité dans les jeux de données fournis. Les chercheurs de jeux de données suggèrent des jeux de données où la garantie de confidentialité peut échouer.
**Testeurs de propriétés**
Les testeurs de propriétés déterminent s’il existe des preuves pour rejeter l’hypothèse selon laquelle une divergence donnée entre deux distributions de probabilités, P et Q, est limitée par un budget prédéfini déterminé par la garantie de CD testée. Ils calculent une borne inférieure à partir d’échantillons de P et Q, rejetant la propriété si la valeur de la borne inférieure dépasse la divergence attendue.
**Chercheurs de jeux de données**
Les chercheurs de jeux de données utilisent des techniques d’optimisation blackbox pour trouver des jeux de données D et D’ qui maximisent la borne inférieure de la valeur de divergence δ. Ces techniques oscillent entre des phases d’exploration et d’exploitation pour estimer la forme de la fonction objective et prédire les zones où l’objectif peut avoir des valeurs optimales.
**Résultats clés**
DP-Auditorium a été évalué sur cinq mécanismes privés et neuf mécanismes non privés avec divers espaces de sortie. Les testeurs de propriété ont identifié les erreurs que les techniques précédentes auraient manquées. L’implémentation d’un algorithme de gradient de descente de CD dans TensorFlow présentait également des erreurs, qui ont été détectées efficacement par DP-Auditorium.
**Conclusion**
DP-Auditorium est un outil précieux pour garantir la confidentialité des mécanismes de CD. Il permet aux auditeurs, aux régulateurs et aux universitaires de s’assurer que les mécanismes sont effectivement privés. En open-sourcing DP-Auditorium, Google vise à établir une norme pour les tests de bout en bout des nouveaux algorithmes de confidentialité différentielle.
**Mots-clés :** Confidentialité différentielle, Audit, DP-Auditorium, Protection des données, Sécurité des données
