L’influence sociale des utilisateurs sur le web

Influence utilisateurs reseaux sociaux

Les personnes et les informations sont deux dimensions essentielles d’un réseau social. Le partage des informations (blogs, actualités, albums, etc.) est le comportement de base. Dans cet article, nous nous concentrons sur la prédiction de l’influence sociale au niveau de l’article afin de répondre à la question de savoir qui doit partager quoi, qui peut être étendue à deux scénarios de récupération d’informations: 1) classement des utilisateurs: la portée peut être maximisée dans un réseau social; (2) Classement des publications sur le Web: à un utilisateur, que devrait-elle partager pour maximiser son influence auprès de ses amis. Nous formulons le problème de la prédiction d’influence sociale en tant qu’estimation d’une matrice de postes utilisateurs, dans laquelle chaque entrée représente la force d’influence d’un utilisateur qui reçoit une publication sur le Web. Nous proposons une approche de factorisation par matrice non-négative hybride (HF-NMF) pour la modélisation de l’influence sociale au niveau de l’article, et concevoir une méthode efficace de gradient projeté pour résoudre le problème HF-NMF. Des expériences intensives sont menées et démontrent les avantages et les caractéristiques de la méthode proposée.

Intervenants : 

  • Peng Cui (Université Tsinghua)
  • Fei Wang (Centre de recherche IBM TJ Watson)
  • Shaowei Liu (Université Tsinghua)
  • Mingdong Ou (Université Tsinghua)
  • Shiqiang Yang (Université Tsinghua)
  • Lifeng Sun (Université Tsinghua)

Balises utilisant des indicateurs de suivi sociaux

Les entités des systèmes sociaux, telles que les utilisateurs de Twitter et les images sur Flickr, sont au cœur de nombreuses applications intéressantes: elles peuvent être classées dans les résultats de recherche, recommandées aux utilisateurs ou utilisées dans la publicité contextuelle. De telles applications supposent la connaissance de la nature et des attributs caractéristiques d’une entité. Un moyen efficace d’encoder de telles connaissances est sous la forme de balises. Une entité non étiquetée est pratiquement inaccessible, car il est difficile de la récupérer ou d’interagir avec elle. Pour y remédier, certaines plates-formes permettent aux utilisateurs de marquer manuellement des entités. Cependant, si ces étiquettes peuvent être informatives, elles peuvent souvent être inadéquates, insignifiantes, ambiguës ou même fausses. De nombreuses méthodes de marquage automatisées ont été proposées pour résoudre ces problèmes. Cependant, la plupart d’entre eux requièrent des tags de haute qualité ou des textes descriptifs préexistants pour chaque entité devant être balisée. Dans notre travail, nous proposons une méthode basée sur des mentions sociales qui sont exemptes de telles contraintes. Pratiquement toutes les principales plates-formes de réseaux sociaux permettent aux utilisateurs d’approuver les entités qui les intéressent. Les exemples incluent « suivre » les utilisateurs de Twitter ou « favoriser » les photos Flickr. Ces mentions sont abondantes et capturent directement les préférences des utilisateurs. Dans cet article, nous posons et résolvons le problème de l’utilisation du réseau d’approbation sociale sous-jacent pour extraire des balises utiles pour les entités d’un système social. Notre travail tire parti des techniques de modélisation de sujets pour saisir les intérêts des utilisateurs, puis les utilise pour extraire des balises pertinentes et descriptives pour les entités qu’ils approuvent.

Intervenants :

  • Theodoros Lappas (Université de Californie, Riverside)
  • Kunal Punera (Yahoo! Research)
  • Tamas Sarlos (Yahoo! Research)

Impact de la conception HIT sur le classement des systèmes comparatifs

L’évaluation des systèmes de récupération d’informations (IR) sur des collections spéciales, telles que les référentiels de grands livres, est hors de portée des méthodes traditionnelles qui s’appuient sur des jugements de pertinence rédactionnelle. De plus en plus, le recours au crowdsourcing pour collecter des étiquettes de pertinence a été considéré comme une alternative viable à des coûts modestes. Cependant, le crowdsourcing souffre de pratiques de travail indésirables et de contributions de faible qualité. Dans cet article, nous étudions la conception et la mise en œuvre de tâches de crowdsourcing efficaces dans le cadre de l’évaluation de la recherche de livres. Nous observons l’impact des aspects de la conception de la tâche de renseignement humain (HIT) sur la qualité des étiquettes de pertinence fournies par la foule. Nous évaluons le résultat en termes d’accord d’étiquette avec un ensemble de données standard et observons l’effet des jugements de pertinence crowdsourcés sur le classement du système résultant. Cela nous permet d’observer les effets du crowdsourcing sur l’ensemble du processus d’évaluation des IR. En utilisant le jeu de tests et les tests expérimentaux de INEX 2010 Book Track, nous constatons que la variation de la conception de HIT et les stratégies de mise en commun et de classement des documents entraînent des différences considérables en accord avec les labels de référence. Nous observons ensuite l’impact des ensembles d’étiquettes de pertinence crowdsourcés sur les classements relatifs du système à l’aide de quatre mesures de performance IR. Les classements du système basés sur MAP et Bpref restent moins affectés par les différents jeux d’étiquettes, tandis que Precision @ 10 et nDCG @ 10 conduisent à des classements système radicalement différents. en particulier pour les étiquettes acquises auprès de HIT avec des contrôles de qualité plus faibles. Dans l’ensemble, nous constatons que le crowdsourcing peut être un outil efficace pour l’évaluation des systèmes IR, à condition que la conception des HIT soit effectuée avec soin.

Intervenants :

  • Gabriella Kazai (Microsoft Research)
  • Jaap Kamps (Université d’Amsterdam)
  • Marijn Koolen (Université d’Amsterdam)
  • Natasa Milic-Frayling (Microsoft Research)