logo EDITE Sujets de doctorat

Analyse de traces d'interactions et d'apprentissage de MOOCs pour une adaptation aux profils des apprenants

Sujet proposé par
Directeur de thèse:
Encadré par
Doctorant: Fatima HARRAK
Unité de recherche UMR 7606 Laboratoire d'informatique de Paris 6

Domaine: Sciences et technologies de l'information et de la communication

Projet

Les cours en ligne ouverts et massifs (ou massive open online course – MOOC) se sont fortement implantés dans le paysage pédagogique depuis leur apparition à la fin des années 2000, notamment grâce à l’appui à certains d’entre eux de plusieurs universités américaines prestigieuses à partir de 2012 : Udacity (Stanford), Coursera (Stanford, Princeton, University of Michigan, UPenn) et edX (MIT et Harvard). De nombreux travaux mettent en avant l'existence de catégories d'apprenants fondées sur différents critères : leur performance, leur risque de décrochage (un problème récurrent de la plupart des MOOCs, où environ 10 % seulement des inscrits valident [1] [2] ), leur degré d’interactions avec les autres [3] , leurs traits de personnalité, leur motivation [4] … Ces analyses, souvent réalisées a posteriori, ne sont donc pas directement utilisables autrement que pour des améliorations itératives des MOOCs. Pour aller au-delà, il est donc nécessaire de s’intéresser à : 1) l’identification de ces profils d’apprenants pendant une session de MOOC en cours, 2) l’utilisation de ces profils pour améliorer l’expérience des apprenants, la remontée des informations à l’équipe enseignante et la mise en place de stratégies d’aides automatiques ou semi-automatiques (validées par l’enseignant) adaptées à chaque profil.

A partir de l’analyse de données réelles recueillies au sein de MOOCs passés (logs de navigation, questionnaires, interactions langagières entre participants…), les objectifs de la thèse sont : (1) proposer et tester sur la base des données déjà existantes différents algorithmes permettant d’établir des profils d’apprenants selon différents critères (inclusion sociale, avancement, décrochage…), (2) implémenter différentes stratégies d’intervention aux moments opportuns pour optimiser l’expérience d’apprentissage (incitation à participer aux forums, travail en groupe, suggestion de ressources…), (3) tester et évaluer la performance de ces algorithmes en situation réelle au sein d’un MOOC pour mesurer leur impact, (4) répliquer l’approche développée sur un MOOC/une plate-forme dans un autre contexte pour tester sa généralisabilité.

Cette thèse s’inscrit dans le prolongement du projet GroupMOOC qui s’intéresse plus spécifiquement à des méthodes d’identification d’étudiants ayant des profils similaires ou complémentaires pour les associer au sein de petits groupes ou binômes [5] . Cette stratégie particulière fera partie des stratégies à étudier plus en profondeur dans le contexte de cette thèse. L’utilisation d’agents pédagogiques intervenant à des moments opportuns sera également envisagée.

Enjeux

Enjeux

Le programme de travail que nous proposons s’organise comme suit :

Etude de l’état de l’art des travaux sur les MOOCs et la motivation au sein d’environnements informatiques d’apprentissage humain (EIAH)

Analyse exploratoire de données issues d’un ou plusieurs MOOCs en vue d’identifier, a posteriori, un ensemble de facteurs mesurables permettant de déterminer des profils d’apprenants selon différents critères

Conception d’algorithmes combinant des techniques de fouilles de données, d’analyse de graphes d’interaction et d’analyse de texte

Formulation de recommandations relatives aux types de données à recueillir pour identifier d’autres types de profils

Formulation d’hypothèses quant aux stratégies d’intervention adaptées à chaque profil, en vue d’améliorer la performance des apprenants et de diminuer le taux d’attrition

Etude de la possibilité d’utilisation de l’ensemble de facteurs précédents sur des données partielles (en vue d’une intégration dans un MOOC en cours de déroulement)

Implémentation de ces algorithmes au sein d’une plate-forme de MOOC pour une utilisation en situation réelle (e.g. le MOOC « ABC Gestion de projets » de l’Ecole Centrale de Lille, déjà utilisé dans le contexte du projet GroupMOOC)

Analyse des données recueillies pour l’évaluation de l’impact des algorithmes proposés

Itération des deux dernières étapes sur la base des résultats obtenus, 1) dans le cadre du même MOOC, afin d’améliorer les performances, 2) dans le cadre d’un autre MOOC, afin d’évaluer la performance de l’approche proposée dans un contexte différent

Ouverture à l'international

Ce sujet de thèse fait suite à un projet LIP6 2014, impliquant des collaborations avec des membres issus de l’équipe ComplexNetworks du LIP6 (Bénédicte Le Grand, Jean-Loup Guillaume), des responsables de MOOC (UNow et Rémi Bachelet [6] ), et d’autres équipes de recherche au niveau international (Kalina Yacef, Université de Sydney). Il pourra également bénéficier de la dynamique engendrée par le projet ANR Hubble, auquel participe notamment OpenClassrooms.

La publication des résultats obtenus au sein de conférences internationales sera fortement encouragée.

Remarques additionnelles

Compétences du candidat

Les compétences requises du candidat sont un bon niveau en programmation (notamment web et orientée objet) pour la phase d’implémentation du système de diminution de l’attrition au sein de la plate-forme de UNow, des connaissances en Intelligence Artificielle (IA) en général, et plus spécifiquement en fouille de données et apprentissage automatique pour l’analyse des données collectées, ainsi évidemment qu’un bon niveau d'anglais pour la phase initiale d’analyse de l’état de l’art et la dissémination des résultats obtenus dans des conférences internationales. Les compétences préférables mais pas obligatoires car pouvant être acquises pendant la thèse,concernent les théories de l’apprentissage (e.g. apprentissage auto-régulé) et une expérience d’utilisation de plate-forme de type e-learning (Moodle, Claroline...) ou MOOC (EdX, Coursera...).

Références

[1] L. Breslow, D. E. Pritchard, J. DeBoer, G. S. Stump, A. D. Ho, and D. T. Seaton, “Studying learning in the worldwide classroom: Research into edX’s first MOOC,” Res. Pract. Assess., vol. 8, pp. 13–25, 2013.

[2] R. F. Kizilcec, C. Piech, and E. Schneider, “Deconstructing Disengagement: Analyzing Learner Subpopulations in Massive Open Online Courses,” in Proceedings of the Third International Conference on Learning Analytics and Knowledge, New York, NY, USA, 2013, pp. 170–179.

[3] M. Cisel and R. Bachelet, “Understanding engagement in the First French xMOOC,” in Proc. of the First European MOOCs Stakeholders Summit, 2014.

[4] Y. Wang, “Exploring Possible Reasons behind Low Student Retention Rates of Massive Online Open Courses: A Comparative Case Study from a Social Cognitive Perspective,” in Proc. of the 1st Workshop on Massive Open Online Courses (moocshop), 2013.

[5] D. Yang, M. Wen, and C. P. Rosé, “Peer Influence on Attrition in Massive Open Online Courses,” in Proceedings of the 7th International Conference on Educational Data Mining, London, UK, 2014, pp. 405– 406. [6] I. Bani, “Analyse des traces d’apprentissage et d’interactions inter-apprenants dans un MOOC,” Masters thesis, Université Pierre et Marie Curie, Paris, France, 2014.