logo EDITE Sujets de doctorat

Apprentissage dans les réseaux de convolution

Sujet proposé par
Directeur de thèse:
Doctorant: Michael BLOT
Unité de recherche UMR 7606 Laboratoire d'informatique de Paris 6

Domaine: Sciences et technologies de l'information et de la communication

Projet

Les méthodes de classifications à base d’architecture profondes (deep learning), et en particulier les réseaux de neurones convolutifs (CNN), sont très utilisées pour la reconnaissance de données visuelles. Malgré leurs très bonnes performances, les CNN présentent des limitations intrinsèques concernant l’invariance aux transformations géométriques. La seule invariance effectivement représentée dans ces réseaux CNN est celle en translation (très localisée). Elle est codée via l’opération dite de pooling (agrégation) dans ces architectures deep. Pour le reste, la capacité à encoder de l’invariance provient essentiellement de la taille du réseau (l’architecture profonde standard pour ImageNet contient 100 millions de paramètres). L'objectif de cette thèse est d'étudier ce type d'architecture profonde. il s'agit d'une part d'analyser la structure du réseau, et d'autre part des modalités nouvelles d'apprentissage des paramètres d'un tel réseau.

Enjeux

Le premier objectif de la thèse est d’explorer des pistes permettant d’encoder et/ou d’apprendre différents types d’invariance directement dans l’architecture du réseau.

Le deuxième enjeux concerne le schéma d’apprentissage proprement dit. Outre le schéma classique d'apprentissage supervisé standard (entrée, label), de nombreuses variantes sont possibles sur ce type de réseau. En s’appuyant sur l’idée des réseaux Siamois, il s’agit ici d'explorer des schémas d’apprentissage de métriques sur triplets ou quadruplets (Law ICCV 2013) avec des contraintes de régularité nouvelles (Law CVPR 2014). Un défi supplémentaire à étudier porte sur la combinaison d'un schéma supervisé avec des schémas non-supervisés (Goh NIPS 2013). L’objectif visé est d’offrir des possibilités nouvelles d’application de ce type de réseaux dans des contextes où l’information supervisée à grande échelle n’est pas forcément disponible.

Ouverture à l'international

oui, USA, Singapour

Remarques additionnelles

Required skills and background:

  • Masters’ in Computer Science / Machine Learning / Computer Vision or related field
  • Excellent academic record.
  • A strong interest and good knowledge of machine learning algorithms for vision, deep learning.
  • Excellent implementation and experimentation skills.
  • The PhD will take place in the MLIA team, at Laboratoire d’Informatique de Paris 6 (LIP6), UPMC, Paris.

    To apply, contact Matthieu Cord , with the following information:

  • A Curriculum Vitæ.
  • A list of courses and grades of the last two years of study
  • (Optional) Names and contact details of two references (people who can recommend you) to contact.