logo EDITE Sujets de doctorat

Apprentissage interactif de représentations sensori-motrices

Sujet proposé par
Directeur de thèse:
Encadré par
Doctorant: Pierre LUCE-VAYRAC
Unité de recherche UMR 7222 Institut des Systèmes Intelligents et de Robotique

Domaine: Sciences et technologies de l'information et de la communication

Projet

Problématique générale

En robotique, l’analyse des scènes est traditionnellement traitée comme une observation de l’environnement, même si elle peut inclure un processus de perception active [Krotkov&Bajcsy] qui consiste en général à acquérir de l’information supplémentaire par exploration et sélection de points de vues, calculés pour augmenter l’information par exemple, en mettant en œuvre éventuellement des capteurs différents.

Cependant, aucun système de perception robotique n’est capable aujourd’hui de résoudre le problème d’interprétation de scène. De très nombreuses approches ont pourtant été proposées, incluant de l’apprentissage statistique, du raisonnement bayésien ou injectant des connaissances préalables [Ferreira&Dias]. Le problème fondamental de la perception et de l’interprétation reste posé. De plus l’intérêt pour de nombreuses applications, y compris la défense, d’un système capable d’interpréter son environnement est évident.

Le sujet de thèse propose d’explorer une démarche différente, inspirée en particulier des travaux en neurosciences et en psychologie [O'Regan, Gibson], qui se fonde sur une forte association entre la perception et l’action pour l’interprétation des scènes et des objets qui s’y trouvent. Le processus sensori-moteur associe le flux extéroceptif et le flux proprioceptif, ce qui permet la construction simultanée de représentations et de modalités d’action adaptées. L’interprétation de la scène est alors issue des actions que le robot peut effectuer. En d’autres termes, c’est l’action liée à la perception qui fournit le sens et non la seule perception. La description des objets et de l’espace sera ainsi non seulement basée sur des descripteurs perçus, mais aussi sur les actions potentielles.

D’autre part, ce travail s’intéressera également à la construction de représentations à travers l’interaction du robot avec d’autres agents présents dans son environnement, qui manipulent eux-mêmes des objets et peuvent aussi guider sont apprentissage des actions [Clodic et al., Ivaldi et al. - a]. L’hypothèse est que cette interaction et une projection des autres agents sur lui-même permettrait au robot d’apprendre plus facilement ses propres interactions possibles avec les objets et donc de bâtir les représentations de manière plus efficace. Les neurones miroir présents dans le cortex pré-moteur [Rizzolatti&Craighero] pourraient être une indication sur le fondement biologique de cette approche.

Programme et démarche

L’approche envisagée consistera globalement à construire des représentations d’une scène en associant perception et action. La perception de l’environnement (sensing) est associée dès le départ avec la proprioception des actions. Il s’agira alors d’extraire des éléments perceptuels, représentations de bas niveau associant le flux sensori-moteur (percepts externes et commandes motrices) [Ivaldi et al. - b]. Ces représentations sont associées avec les connaissances contextuelles déjà acquises et les objectifs du robot dont le rôle est de guider le processus d’exploration et d’interprétation. Ceci produit de nouvelles actions qui peuvent être plus ou moins complexes, et cette nouvelle interaction avec l’environnement produit à son tour des représentations qui viennent compléter les précédentes. Ainsi le processus construira à la fois des représentations symboliques de l’environnement porteuses de sens et des modalités d’action relatives à ces représentations qui seront utilisables pour agir sur les objets qu’elles représentent

Les mécanismes à développer s’appuieront en particulier sur des méthodes probabilistes d’association de données et de raisonnement bayésien pour intégrer les différentes informations de manière évolutive et inclure un processus de reconnaissance et d’apprentissage de nouvelles informations. L’association avec les actions se basera sur des méthodes d’apprentissage par renforcement [Sutton&Barto, Do Huu et al ., Caluwaerts et al.]. A partir des premières représentations simples issues des associations sensori-motrices, il faudra explorer comment des représentations plus complexes peuvent être élaborées pour aboutir à des connaissances sémantiques de la scène et des objets. Plusieurs pistes peuvent être envisagées pour faire émerger des représentations à différents niveaux de complexité, comme la catégorisation en ligne par réseaux de neurones hiérarchiques à différentes échelles temporelles [Peniak et al., Droniou et al.] ou des approches bayésiennes [Fereira&Dias, Wong].

D’autre part, la génération des actions nécessite de prévoir leurs effets potentiels. Il faudra donc élaborer une représentation des actions prédictive de la perception de leurs conséquences. Cette association perception-action induira une sémantique de l’environnement fondée sur les actes du robot.

Raisonner simultanément sur la perception et l’action exige aussi une capacité de localisation permanente par rapport à l’environnement. Il y a en effet une concomitance entre l’action et la perception ce qui rend la localisation du robot par rapport à son environnement centrale et qui situe le robot au centre du processus d’interprétation, non comme « observateur » mais comme « acteur ». Ceci amène à postuler qu’une notion de conscience de soi (self-awareness) liée à la mise en situation du robot doit coexister avec la notion de conscience de situation (situation awareness) issue de l’interprétation de la scène. Cette proposition repose par ailleurs sur l'hypothèse, venue des neurosciences, qu'un processus de binding dans un espace global de travail entre processus sensori-moteurs de bas niveau et analyse de la situation permet une interprétation consciente du comportement de l'agent dans son environnement [Dehaene et al.]. L’exploration de cette hypothèse dans le contexte robotique est ainsi l’un des objectifs scientifiques de cette thèse. Ceci permettra d’en produire un modèle computationnel et de tester sa validité.

Des scénarios expérimentaux seront élaborés pour mettre en œuvre les fonctions développées sur des robots au laboratoire (en particulier de type PR2 ou iCUB).

Références

[Caluwaerts et al.] Caluwaerts, K. and Staffa, M. and N'Guyen, S. and Grand, C. and Dollé, L. and Favre-Felix, A. and Girard, B. and Khamassi, M. (2012). A biologically inspired meta-control navigation system for the Psikharpax rat robot. Bioinspiration & Biomimetics. Vol 7(2):025009 . 2012.

[Clodic et al.] A. Clodic, Q. Cao, S. Alili, V. Montreuil, R. Alami, and R. Chatila. Shary: a supervision system adapted to human-robot interaction. In ISER’08 -11th International Symposium on Experimental Robotics, Athens, Greece, 2008.

[Dehaene et al.] S Dehaene, L Charles, JR King, S Marti. Toward a computational theory of conscious processing, Current opinion in neurobiology, Volume 25, Pages 76–84, 2014.

[Do Huu et al.] Do Huu N., W. Paquier, R. Chatila. Combining structural description and image-based representation for image, object, and scene recognition. 9th International Joint Conference on Artificial Intelligence (IJCAI'05), Edinburgh (UK), pp.1452-1457, 2005.

[Droniou et al.] Droniou, A.; Ivaldi, S.; Sigaud, O. (2014). Deep unsupervised network for multimodal perception, representation and classification. Robotics and Autonomous System

[Fereira&Dias] Ferreira J.F. and Dias J. Probabilistic Approaches for Robotic Perception. Springer Tracts in Advanced Robotics. No. 91, 2013. ISBN 978-3-319-02005-1.

[Gibson] James J. Gibson. The theory of affordances. In Robert Shaw and John Bransford, editors, Perceiving, Acting, and Knowing. 1977.

[Ivaldi et al. - a] Ivaldi, S.; Lyubova, N.; Gérardeaux-Viret, D.; Droniou, A.; Anzalone, S. M.; Chetouani, M.; Filliat, D.; Sigaud, O. (2012). Perception and human interaction for developmental learning of objects and affordances. Proc. of the 12th IEEE-RAS International Conference on Humanoid Robots - HUMANOIDS. Pages 1-8.

[Ivaldi et al. - b] Ivaldi, S.; Nguyen, S.M.; Lyubova, N.; Droniou, A.; Padois, V.; Filliat, D.; Oudeyer, P.-Y.; Sigaud, O. (2014) Object learning through active exploration. IEEE Transactions on Autonomous Mental Development, vol. 6, Pages 56-72, DOI: 10.1109/TAMD.2013.2280614

[Krotkov&Bajcsy] Eric Krotkov and Ruzena Bajcsy. Active vision for reliable ranging: Cooperating focus, stereo, and vergence. International Journal of Computer Vision, 11(2):187–203, 1993.

[O'Regan] O'Regan, J.K. Sensorimotor approach to (phenomenal) consciousness. In Baynes, T., Cleeremans, A. & Wilken, P. (Eds) Oxford Companion to Consciousness. (pp. 588-593). Oxford: Oxford University Press. 2009.

[Peniak et al.] M. Peniak, D. Marocco, J Tani, Y Yamashita, K Fischer, A Cangelosi. Multiple time scales recurrent neural network for complex action acquisition, IEEE ICDL-EPIROB, 2011.

[Renaudo et al.] Renaudo, E., Girard, B., Chatila, R. & Khamassi, M. (2014) Design of a Control Architecture for Habit Learning in Robots. In Biomimetic and Biohybrid Systems - Third International Conference, Living Machines 2014, Milan, Italy, July 30 - August 1, 2014. Proceedings, pp. 249-260.

[Rizzolatti&Craighero] G. Rizzolatti and L. Craighero. The mirror-neuron system. Annual Review of Neuroscience, 27:169–192, 2004.

[Sutton&Barto] Richard S. Sutton and Andrew G. Barto. Reinforcement Learning: An Introduction. MIT Press, Cam¬bridge, MA, 1998.

[Wong] Alexander Wong. A Bayesian Theoretic Approach to Multiscale Complex-Phase-Order Representations. IEEE Trans. on Image Processing, Vol. 21, No. 1, Jan. 2012.

Enjeux

L'analyse de scènes en IA et en robotique est un sujet ouvert. Aucun système de perception robotique n’est capable aujourd’hui de résoudre le problème d’interprétation de scène. De très nombreuses approches ont pourtant été proposées, incluant plusieurs méthodes de traitement d'images, de l’apprentissage statistique, du raisonnement bayésien ou injectant des connaissances préalables [Ferreira&Dias]. Le problème fondamental de la perception et de l’interprétation reste posé. Outre la question scientifique de fond, l'intérêt pour de nombreuses applications d’un système capable d’interpréter son environnement est évident.

Ce sujet s'inscrit dans le cadre de recherches sur l’apprentissage de la perception et de l’action menées à l’ISIR. Des travaux en cours financés par la DGA dans le cadre d’une thèse portent sur des techniques d’apprentissage pour transformer des comportements planifiés en comportements habituels et permettre une sélection plus efficace de l’action [Renaudo et al.]. Le sujet posé ici vient compléter et poursuivre ces travaux en focalisant sur l’interaction sensori-motrice du robot avec son environnement. Des projets nationaux et européens menés au laboratoire sont en lien avec ce sujet, en particulier le projet ANR « Roboergosum » (Robots conscients) http://roboergosum.isir.upmc.fr/ dont l’objectif est d’étudier la possibilité d’émergence d’un conscience artificielle chez un robot à travers ses interactions avec le monde et d’autres agents et de concevoir une architecture cognitive qui permette cette émergence.

Enfin, l’approche envisagée pour la compréhension de scènes et d’objets par un robot, inspirée en partie par des recherches en neurosciences, et basée sur l’apprentissage met l’interaction du robot avec son environnement au centre du processus d’interprétation et pourra montrer l’intérêt (voire la nécessité) de la notion de conscience de soi. Cette notion est étudiée en philosophie, en sciences cognitives et en neurosciences. Les questionnements majeurs autour d’elle peuvent s’appliquer aussi aux machines. Le sujet est ainsi multidisciplinaire et le candidat sera amené à interagir avec des chercheurs dans ces différentes disciplines.

Ouverture à l'international

Des interactions existent sur ce sujet avec des chercheurs de différents pays européens (Royaume-Uni, Allemagne, Suisse, Italie) ainsi qu'aux Etats-Unis, à Taïwan et au Japon.

Remarques additionnelles

Ce sujet s'inscrit dans le cadre d'un projet ANR en cours (ROBERGOSUM). Il est soumis pour un co-financement à la DGA.