Modélisation et analyse des tâches de recherche inter-sessions

Analyse des tâches de recherche

Les besoins en informations des utilisateurs des moteurs de recherche varient en complexité, en fonction de la tâche à accomplir. Certains besoins simples peuvent être satisfaits avec une seule requête, tandis que d’autres nécessitent une série de requêtes émises sur une période de temps plus longue. Alors que les moteurs de recherche répondent efficacement à de nombreux besoins simples, les chercheurs ne reçoivent que peu de support lorsque leurs besoins en informations couvrent les limites des sessions.

Au cours de cette conférence, nous proposons des méthodes pour modéliser et analyser le comportement de recherche des utilisateurs qui s’étend sur plusieurs sessions de recherche. Nous nous concentrons sur deux problèmes: (i) avec une requête utilisateur, identifier toutes les requêtes liées aux sessions précédentes que le même utilisateur a émises et (ii) attribuer une tâche multi-requête à un utilisateur, prédire si l’utilisateur va retourner à cette tâche à l’avenir. Nous modélisons les deux problèmes dans un cadre de classification qui utilise des fonctionnalités de requêtes individuelles et un comportement de recherche d’utilisateurs à long terme à différentes granularités. L’évaluation expérimentale des modèles proposés pour les deux tâches indique qu’il est possible de modéliser et d’analyser efficacement les comportements de recherche intersessions. Nos résultats ont des implications pour l’amélioration de la recherche de besoins d’informations complexes et la conception de fonctions de moteur de recherche pour prendre en charge les tâches de recherche intersession.

Intervenants :

  • Alexander Kotov (Université de l’Illinois à Urbana-Champaign)
  • Paul N. Bennett (Microsoft Research)
  • Ryen W. White (Recherche Microsoft)
  • Susan T. Dumais (Microsoft Research)
  • Jaime Teevan (Microsoft Research)

L’économie de la recherche d’information interactive

La recherche est intrinsèquement un processus interactif nécessitant généralement de nombreuses itérations d’interrogation et d’évaluation afin de trouver la quantité souhaitée d’informations pertinentes. Essentiellement, le processus de recherche peut être considéré comme une combinaison d’intrants (requêtes et évaluations) utilisés pour «produire» les résultats (pertinence). Dans cette optique, il est possible d’adapter la théorie microéconomique pour analyser et comprendre la dynamique de la recherche interactive d’informations.

Dans cet article, nous abordons le processus de recherche comme un problème économique et effectuons des simulations approfondies sur les collections de tests TREC en analysant diverses combinaisons d’entrées dans la «production» pertinente. L’analyse révèle que le gain cumulé total (résultat) obtenu au cours d’une session de recherche est fonctionnellement lié à l’interrogation et à l’évaluation (entrées), et cela peut être caractérisé mathématiquement par la fonction de production Cobbs-Douglas. Une analyse plus poussée utilisant des modèles de coûts, fondés sur le coût de la charge cognitive, révèle quelles stratégies de recherche minimisent le coût de l’interaction pour un niveau de production donné. Cet article montre comment l’économie peut être appliquée pour modéliser formellement le processus de recherche. Ce développement établit les fondements théoriques de la recherche interactive d’informations, fournissant de nombreuses directions pour l’expérimentation empirique qui sont directement motivées par la théorie. Cet article montre comment l’économie peut être appliquée pour modéliser formellement le processus de recherche. Ce développement établit les fondements théoriques de la recherche interactive d’informations, fournissant de nombreuses directions pour l’expérimentation empirique qui sont directement motivées par la théorie. Cet article montre comment l’économie peut être appliquée pour modéliser formellement le processus de recherche. Ce développement établit les fondements théoriques de la recherche interactive d’informations, fournissant de nombreuses directions pour l’expérimentation empirique qui sont directement motivées par la théorie.

Intervenants :

  • Leif Azzopardi (Université de Glasgow)

Classement des requêtes simulées pour l’évaluation de la recherche personnelle

Pour y aboutir, nous effectuons une étude en laboratoire (n = 21) du comportement de recherche de courrier électronique, en examinant comment les caractéristiques des requêtes soumises changent dans différentes situations. Un certain nombre de modèles de régression logistique sont développés sur les données d’interrogation pour explorer la relation entre les variables utilisateur et contextuelles et les caractéristiques des requêtes, notamment la longueur, le champ soumis et l’utilisation des entités nommées. Nous révélons plusieurs tendances intéressantes et utilisons les résultats pour créer une évaluation simulée de divers modèles de récupération. Ceci est non seulement une amélioration des méthodes d’évaluation existantes pour la recherche personnelle, mais les résultats montrent que différents modèles sont plus efficaces dans différentes situations, ce qui a des implications pour la conception des outils de recherche et pour la façon dont les algorithmes de recherche personnelle sont évalués.

Intervenants :

  • David Elsweiler (Université d’Erlangen)
  • David E. Losada (Université de Santiago de Compostela)
  • Jos C. Toucedo (Saint-Jacques-de-Compostelle, Espagne)
  • Ronald T. Fernandez (Université de Santiago de Compostela)

Comprendre le comportement de repérage dans les journaux d’interaction par courrier électronique

Ici, nous présentons une étude longitudinale et naturaliste du comportement du courrier électronique (n = 47) et décrivons nos efforts pour isoler le comportement de recherche dans les journaux grâce à diverses analyses qualitatives et quantitatives. Le travail présenté souligne les défis méthodologiques rencontrés avec ce type de recherche, mais démontre qu’il est possible d’isoler le comportement de recherche des journaux d’interaction par courrier électronique avec une précision raisonnable. En utilisant les approches développées, nous découvrons des aspects intéressants du comportement de re-recherche des e-mails, jusqu’ici impossibles à étudier, comme la manière dont les différentes fonctionnalités des clients de messagerie sont utilisées pour repérer et les difficultés rencontrées lors de leur utilisation. Nous expliquons comment nos résultats pourraient influencer la conception des clients de messagerie et exposer nos réflexions sur la manière dont les analyses futures, plus approfondies.

Intervenants :

  • David Elsweiler (Université d’Erlangen)
  • Morgan Harvey (Université de Strathclyde)
  • Martin Hacker (Université d’Erlangen)