logo EDITE Simon BOURIGAULT
Identité
Simon BOURIGAULT
État académique
Thèse soutenue le 2016-11-10
Sujet: Apprentissage de dynamique de propagation d'information dans les réseaux sociaux
Direction de thèse:
Encadrement de thèse:
Laboratoire:
Voisinage
Ellipse bleue: doctorant, ellipse jaune: docteur, rectangle vert: permanent, rectangle jaune: HDR. Trait vert: encadrant de thèse, trait bleu: directeur de thèse, pointillé: jury d'évaluation à mi-parcours ou jury de thèse.
Productions scientifiques
oai:hal.archives-ouvertes.fr:hal-01211783
Learning social network embeddings for predicting information diffusion
International audience
Analyzing and modeling the temporal diffusion of information on social media has mainly been treated as a diffusion process on known graphs or proximity structures. The underlying phenomenon results however from the interactions of several actors and media and is more complex than what these models can account for and cannot be explained using such limiting assumptions. We introduce here a new approach to this problem whose goal is to learn a mapping of the observed temporal dynamic onto a continuous space. Nodes participating to diffusion cascades are projected in a latent representation space in such a way that information diffusion can be modeled efficiently using a heat diffusion process. This amounts to learning a diffusion kernel for which the proximity of nodes in the projection space reflects the proximity of their infection time in cascades. The proposed approach possesses several unique characteristics compared to existing ones. Since its parameters are directly learned from cascade samples without requiring any additional information, it does not rely on any pre-existing diffusion structure. Because the solution to the diffusion equation can be expressed in a closed form in the projection space, the inference time for predicting the diffusion of a new piece of information is greatly reduced compared to discrete models. Experiments and comparisons with baselines and alternative models have been performed on both synthetic networks and real datasets. They show the effectiveness of the proposed method both in terms of prediction quality and of inference speed.
Proceedings of the 7th ACM international conference on Web search and data mining The 7th ACM international conference on Web search and data mining https://hal.archives-ouvertes.fr/hal-01211783 The 7th ACM international conference on Web search and data mining, Feb 2014, New York, United States. ACM, pp.393-402, <10.1145/2556195.2556216>ARRAY(0x7f5470ae83c8) 2014-02
oai:hal.archives-ouvertes.fr:hal-01211789
Apprentissage de représentation pour la diffusion d'Information dans les réseaux sociaux
National audience
Depuis l’ émergence des réseaux sociaux en ligne il y a une dizaine d’années, les problématiques liées à la diffusion d’information sur ces nouveaux medias ont quasiment toujours été traitées sur la base de la topologie sociale des réseaux considérés. Faisant le constat que le graphe social d’un réseau, s’il est connu, ne reflète que rarement les véritables canaux de communication entre utilisateurs, nous proposons ici de traiter la diffusion d’information comme un processus de propagation dans un espace de représentation continu, dans lequel les positions relatives des utilisateurs traduisent leur propension à échanger du contenu. Les résultats expérimentaux obtenus sur des jeux de données réelles démontrent l’intérêt de l’approche proposée, tant en terme de rapidité qu’en terme de qualité de la prédiction, et permettent d’envisager diverses directions de recherche dans le contexte de la diffusion d’information.
COnférence en Recherche d'Information et Applications 2014, CORIA 2014 COnférence en Recherche d'Information et Applications 2014, CORIA 2014 https://hal.archives-ouvertes.fr/hal-01211789 COnférence en Recherche d'Information et Applications 2014, CORIA 2014, Mar 2014, Nancy, France. pp.155-170ARRAY(0x7f54729b37d8) 2014-03
oai:hal.archives-ouvertes.fr:hal-01345751
Learning Distributed Representations of Users for Source Detection in Online Social Networks
International audience
In this paper, we study the problem of source detection in the contextof information diffusion through online social networks. We propose a representationlearning approach that leads to a robust model able to deal with the sparsityof the data. From learned continuous projections of the users, our approachis able to efficiently predict the source of any newly observed diffusion episode.Our model does not rely neither on a known diffusion graph nor on a hypotheticalprobabilistic diffusion law, but directly infers the source from diffusion episodes.It is also less complex than alternative state of the art models. It showed goodperformances on artificial and real-world datasets, compared with various stateof the art baselines.
European Conference on Machine Learning https://hal.archives-ouvertes.fr/hal-01345751 European Conference on Machine Learning, Sep 2016, Riva del Garda, ItalyARRAY(0x7f5471aa3c30) 2016-09-20
oai:hal.archives-ouvertes.fr:hal-01316795
Representation Learning for Information Diffusion through Social Networks: an Embedded Cascade Model
International audience
In this paper, we focus on information diffusion through social networks. Based on the well-known Independent Cascade model, we embed users of the social network in a latent space to extract more robust diffusion probabilities than those defined by classical graphical learning approaches. Better generalization abilities provided by the use of such a projection space allows our approach to present good performances on various real-world datasets, for both diffusion prediction and influence relationships inference tasks. Additionally, the use of a projection space enables our model to deal with larger social networks.
nternational Conference on Web Search and Data Mining https://hal.archives-ouvertes.fr/hal-01316795 nternational Conference on Web Search and Data Mining, Feb 2016, San Fransisco, United States. <10.1145/2835776.2835817>ARRAY(0x7f5471aaf2b8) 2016-02-22
oai:hal.archives-ouvertes.fr:hal-01316820
Extracting Diffusion Channels from Real-World Social Data: a Delay-Agnostic Learning of Transmission Probabilities
International audience
Probabilistic cascade models consider information diffusion as an iterative process in which information transits from users to others in a network. The problem of diffusion modeling then comes down to learning transmission probability distributions, depending on hidden influence relationships between users, in order to discover the main diffusion channels of the network. Various learning models have been proposed in the literature, but we argue that the diffusion mechanisms defined in most of these models are too complex for real social networks, where transmissions of content occur between human users. Classical models usually have some difficulties for extracting the main regularities in such real-world settings. In this paper, we propose a relaxed learning process of the well-known Independent Cascade model that, rather than attempting to explain exact timestamps of users' infections, focus on infection probabilities knowing sets of previously infected users. Experiments show the effectiveness of our proposals, by considering the learned models for real-world prediction tasks.
International Conference on Advances in Social Networks Analysis and Mining 2015 https://hal.archives-ouvertes.fr/hal-01316820 International Conference on Advances in Social Networks Analysis and Mining 2015, Aug 2015, Paris, France. <10.1145/2808797.2808865>ARRAY(0x7f54729c2aa0) 2015-08-25
oai:hal.archives-ouvertes.fr:hal-01316884
Apprentissage de Représentations Probabilistes pour la Prédiction de Diffusions d’Informations sur les Réseaux Sociaux
National audience
Le modèle Independent Cascades (IC) est un modèle central pour la capture des dynamiques de diffusion d’information sur les réseaux sociaux. Nous nous intéressons ici à l’apprentissage des probabilités de transmission utilisées par ce modèle.Plutôt que de directement travailler sur le graphe du réseau social considéré, ce qui implique un coût important dû au nombre de paramètres à apprendre pour les réseaux denses, nous proposons une approche basée sur des techniques d’apprentissage de représentations, afin d’alléger le processus et de gagner en généralisabilité. L’idée est de chercher une projection des utilisateurs du réseau dans un espace vectoriel, de manière à ce que les distances entre les individus représentent leurs probabilités de transmission d’information. Les expérimentations menées démontrent la pertinence de l’approche pour la modélisation des dynamiques de diffusion.
COnférence en Recherche d'Information et Applications 2016 (CORIA) https://hal.archives-ouvertes.fr/hal-01316884 COnférence en Recherche d'Information et Applications 2016 (CORIA), Mar 2016, Toulouse, FranceARRAY(0x7f54741187f0) 2016-03-08
Soutenance
Thèse: Apprentissage de dynamiques de propagation d'information dans les réseaux sociaux
Soutenance: 2016-11-10
Rapporteurs: Fabrice ROSSI    Julien VELCIN