logo EDITE Sujets de doctorat

METHODE ET OUTIL POUR LE BROUILLAGE DE DONNEES SENSIBLES

Résumé rédigé par
Directeur de thèse:
Doctorant: Feten BEN FREDJ
Unité de recherche EA 1395 Centre d'Étude et de Recherche en Informatique et Communications

Projet

Le développement, la maintenance de bases de données ainsi que leur utilisation par des applications sont des activités communes et récurrentes dans diverses institutions. Le volume de données sensibles contenu dans ces bases de données ne cesse d’augmenter. Leur protection est indispensable à la fois pour des raisons légales mais aussi de compétitivité et de réputation pour les entreprises. Ces dernières ont de plus en plus de difficultés à protéger les informations confidentielles. La complexité et l'hétérogénéité des environnements informatiques rendent la protection des données particulièrement compliquée. Pour protéger les données sensibles ou confidentielles dont ils ont la responsabilité, les entreprises ont recours à plusieurs solutions dont la «réécriture». Cette réécriture de la donnée prend une des deux formes suivantes : la synthétisation ou l’aseptisation (masquage ou brouillage). La synthétisation consiste en une analyse complète des données à partir desquelles les informations pertinentes sont utilisées pour réaliser des statistiques. Dans cette technique, la donnée élémentaire n’est plus disponible pour les usagers. En revanche, dans l’aseptisation, la donnée élémentaire est disponible pour l’analyse. Cependant elle est transformée de façon à en enlever les informations dites «sensibles». Cette transformation n’affecte pas la sémantique des données, ni la sémantique globale de la base de données dans laquelle elles se trouvent. Cette thèse se focalise sur le brouillage des données sensibles. Son objectif est de proposer une méthode de brouillage de données sensibles et confidentielles qui servira de guide, pour l’ingénieur chargé de la sécurité, dans la détection des données sensibles et dans le choix de la «bonne» combinaison de techniques de brouillage des données.