Technologies d’apprentissage émergentes pour la recherche d’informations

recherche informations web

Ces dernières années, nous avons assisté à l’application réussie des techniques d’apprentissage automatique à un large éventail de problèmes de recherche d’informations, notamment les moteurs de recherche, les systèmes de recommandation, la publicité en ligne, etc. techniques d’apprentissage automatique. Afin d’accommoder les publics ayant différents niveaux de compréhension des techniques d’apprentissage automatique, nous divisons ce tutoriel en deux sessions: la première session portera sur les concepts et les outils de base de l’apprentissage automatique; lors de la deuxième session, nous présenterons des sujets plus avancés en apprentissage automatique et présenterons les développements récents en apprentissage automatique et leur application à la recherche d’informations. Chaque saison est autonome. On peut soit s’inscrire à une session, soit aux deux sessions.

Cette session du tutoriel portera sur les principales techniques d’apprentissage automatique, les techniques d’optimisation de base et les principales applications IR. En particulier, il comprend: 1).

  • Les concepts de base de l’apprentissage automatique, tels que l’apprentissage supervisé / l’apprentissage sans supervision, le compromis entre les écarts et la variance et les modèles probabilistes;
  • Concepts et algorithmes utiles dans l’optimisation, y compris les méthodes de gradient du premier et du second ordre, et les attentes et la maximisation;
  • L’application de méthodes d’apprentissage automatique aux principaux problèmes de récupération d’informations, notamment la classification des textes, le filtrage collaboratif, le regroupement et l’apprentissage du classement.

La deuxième session du tutoriel portera sur des techniques plus avancées d’apprentissage automatique qui ont commencé à être utilisées dans des applications de récupération d’informations. En particulier, il couvrira:

  • Techniques d’optimisation avancées incluant l’optimisation stochastique et la minimisation fluide;
  • Des techniques d’apprentissage émergentes telles que l’apprentissage à plusieurs instances, l’apprentissage actif et l’apprentissage semi-supervisé. « 

Présentateurs : M. Si et M. Jin

M. Si est professeur adjoint au département d’informatique et au département de statistique (par courtoisie) de l’Université Purdue. Les intérêts de recherche de M. Si comprennent la recherche d’informations, les techniques et applications d’apprentissage automatique et les techniques d’exploration de texte. Dr. Si est un éditeur associatif d’ACM Transactions on Information System et un membre du comité éditorial d’Information Processing and Management. Le Dr Si a reçu le prix de carrière NSF en 2008. Le Dr Si a obtenu son doctorat. Diplômé de l’Université Carnegie Mellon en 2006. Le Dr Si a collaboré avec des entreprises du secteur, notamment Yahoo! et Google.

M. Jin est professeur associé au Département d’informatique et de génie scientifique de l’Université d’État du Michigan. Il a travaillé dans les domaines de l’apprentissage automatique statistique et de son application à la recherche d’informations. Le Dr Jin possède une vaste expérience de recherche dans divers algorithmes d’apprentissage automatique tels que les modèles exponentiels conditionnels, les machines à vecteurs de support, le renforcement et l’optimisation pour différentes applications, y compris la récupération d’informations. Dr. Jin est un éditeur associatif de transactions ACM sur la découverte de connaissances à partir de données. Le Dr Jin a reçu le prix de carrière NSF en 2006. Le Dr Jin a obtenu son doctorat. Diplômé de l’Université Carnegie Mellon en 2003. Le Dr Jin a collaboré avec des entreprises du secteur, notamment Yahoo !, Intel et NEC.