logo EDITE Sujets de doctorat

Thèse sur les méthodes d'apprentissage artificiel pour l'annotation automatique de contenus audio-visuels

Sujet proposé par
Directeur de thèse:
Encadré par
Doctorant: Grigory ANTIPOV
Unité de recherche UMR 7102 Laboratoire de recherche d'EURECOM

Domaine: Sciences et technologies de l'information et de la communication

Projet

L'objectif de cette thèse est l'étude de techniques d'apprentissage qui permettent d'améliorer la génération automatique de métadonnées extraites de contenus multimédia. Bien que la littérature scientifique montre clairement le potentiel de techniques telles que le « co-training » le « deep-learning », plusieurs verrous restent à lever pour une utilisation réelle : - Le passage à l'échelle ou comment utiliser ces techniques sur des données massives ? - La réduction de la dimension des vecteurs de caractéristiques. Il existe un lien entre la dimension des vecteurs et la manière optimale de gérer l'apprentissage mais ce point n'est pas encore parfaitement maîtrisé dans la littérature. - La pérennité d'un apprentissage dans le temps. - L'annotation automatique ou comment utiliser des données non labélisées dans les étapes d'apprentissage : les données existent et sont disponibles mais le plus souvent ne sont pas annotées et donc non directement utilisables pour entrainer un système ou apprendre les caractéristiques discriminantes d'une application. Le doctorant s'intéressera à lever certains de ces verrous. Approche méthodologique planning Il est indispensable lors du premier semestre de thèse d'étudier les toutes dernières techniques d'apprentissage, d'évaluer la distance qu'il reste à franchir pour passer des concepts à des méthodes et outils présentant les performances requises. Lors du second semestre, il s'agira de mettre en oeuvre une sélection de techniques d'apprentissage et de les tester dans le cadre de plusieurs applications. La seconde année de thèse sera consacrée à lever les verrous en partie identifiés ci-dessus et précisés au cours de la première année de thèse. On attend des résultats d'une part théoriques qui feront l'objet de publications scientifiques et d'autre part plus pratiques qui feront l'objet de brevets. La troisième année sera classiquement davantage dédiée à la valorisation des résultats, rédaction et soutenance de la thèse dans les délais prévus de 3 ans

Enjeux

L'objectif de cette thèse est l'étude de techniques d'apprentissage qui permettent d'améliorer la génération automatique de métadonnées extraites de contenus multimédia. Bien que la littérature scientifique montre clairement le potentiel de techniques telles que le « co-training » le « deep-learning », plusieurs verrous restent à lever pour une utilisation réelle : - Le passage à l'échelle ou comment utiliser ces techniques sur des données massives ? - La réduction de la dimension des vecteurs de caractéristiques. Il existe un lien entre la dimension des vecteurs et la manière optimale de gérer l'apprentissage mais ce point n'est pas encore parfaitement maîtrisé dans la littérature. - La pérennité d'un apprentissage dans le temps. - L'annotation automatique ou comment utiliser des données non labélisées dans les étapes d'apprentissage : les données existent et sont disponibles mais le plus souvent ne sont pas annotées et donc non directement utilisables pour entrainer un système ou apprendre les caractéristiques discriminantes d'une application. Le doctorant s'intéressera à lever certains de ces verrous. Approche méthodologique planning Il est indispensable lors du premier semestre de thèse d'étudier les toutes dernières techniques d'apprentissage, d'évaluer la distance qu'il reste à franchir pour passer des concepts à des méthodes et outils présentant les performances requises. Lors du second semestre, il s'agira de mettre en oeuvre une sélection de techniques d'apprentissage et de les tester dans le cadre de plusieurs applications. La seconde année de thèse sera consacrée à lever les verrous en partie identifiés ci-dessus et précisés au cours de la première année de thèse. On attend des résultats d'une part théoriques qui feront l'objet de publications scientifiques et d'autre part plus pratiques qui feront l'objet de brevets. La troisième année sera classiquement davantage dédiée à la valorisation des résultats, rédaction et soutenance de la thèse dans les délais prévus de 3 ans