LLF – Bât. ODG – 5e étage – Salle 531
Alexandre Roulois (LLF)
Machine learning : gérer des données catégorielles
Dans un monde idéal pour les machines, toutes les données récoltées lors d’une enquête le seraient sous forme numérique. Heureusement, le monde est idéal précisément parce qu’étant sans raison et sans but ; et comme il ne se fait pas leur complice, à notre volonté de les assister dans leur tâche. D’autant plus que, pour corser le tout, même une donnée numérique peut se révéler catégorielle : une échelle de satisfaction, codée de 0 à 5, laisse bien penser qu’il existe plusieurs catégories d’observations. Tout l’enjeu de la prise en charge des variables catégorielles, encore plus prégnant dans le domaine du TAL, réside dans les phases de pré-traitement, par des moyens d’encodage, en vue de les injecter dans les algorithmes d’apprentissage.
Laboratoire de Linguistique Formelle – UMR 7110 CNRS et Université Paris Cité – RNSR : 200112497J
Adresse géographique : Bât. Olympe de Gouges, 5ème étage. 8, Rue Albert Einstein 75013 Paris
Envoyer un courrier : Case Postale 7031 – 5, rue Thomas Mann – F-75205 Paris Cedex 13
Transports : Métro ligne 14 : arrêt "Bibliothèque François Mitterrand" – Tram T3A : arrêt "Avenue de France" – Bus n°89 et 62 : arrêt "Porte de France"
Téléphone : (+33) (0)1 57 27 57 64 – Télécopie : (+33) (0)1 57 27 57 81
Directeur de la publication : Heather Burnett – Dernière mise à jour : 2026-02-03