Soutenance de thèse : Antoine Simoulin

Jeudi 07 Juillet 2022, 14:00
Organisation: 
Antoine Simoulin (LLF)
Lieu: 

Université Paris Cité
Salle des thèses
580F bâtiment la Halle aux Farines

Antoine Simoulin (LLF)
Plongements de phrases et leurs relations avec les structures de phrases

Historiquement, la modélisation du langage humain suppose que les phrases ont une structure symbolique et que cette structure permet d’en calculer le sens par composition. Ces dernières années, les modèles d’apprentissage profond sont parvenus à traiter automatiquement des tâches sans s’appuyer sur une structure explicite du langage, remettant ainsi en question cette hypothèse fondamentale. Cette thèse cherche ainsi à mieux identifier le rôle de la structure lors de la modélisation du langage par des modèles d’apprentissage profonds. Elle se place dans le cadre spécifique de la construction de plongements de phrases—des représentations sémantiques basées sur des vecteurs—par des réseaux de neurones profonds. Dans un premier temps, on étudie l’intégration de biais linguistiques dans les architectures de réseaux neuronaux, pour contraindre leur séquence de composition selon une structure traditionnelle, en arbres. Dans un second temps, on relâche ces contraintes pour analyser les structures latentes induites par ces réseaux neuronaux. Dans les deux cas, on analyse les propriétés de composition des modèles ainsi que les propriétés sémantiques des plongements.

Jury

  • Claire Gardent, CNRS et Université de Lorraine, rapporteuse ;
  • Eric Gaussier, Université Grenoble Alpes, rapporteur ;
  • Rachel Bawden, Inria, examinatrice ;
  • Loïc Barrault, Le Mans Université, examinateur ;
  • Nicolas Brunel, ENSIIE et Laboratoire de Mathématiques et Modélisation d'Évry, membre invité du jury ;
  • Benoit Crabbé, Université Paris Cité, directeur.