
Université Paris Cité
Salle des thèses
580F bâtiment la Halle aux Farines
Antoine Simoulin (LLF)
Plongements de phrases et leurs relations avec les structures de phrases
Historiquement, la modélisation du langage humain suppose que les phrases ont une structure symbolique et que cette structure permet d’en calculer le sens par composition. Ces dernières années, les modèles d’apprentissage profond sont parvenus à traiter automatiquement des tâches sans s’appuyer sur une structure explicite du langage, remettant ainsi en question cette hypothèse fondamentale. Cette thèse cherche ainsi à mieux identifier le rôle de la structure lors de la modélisation du langage par des modèles d’apprentissage profonds. Elle se place dans le cadre spécifique de la construction de plongements de phrases—des représentations sémantiques basées sur des vecteurs—par des réseaux de neurones profonds. Dans un premier temps, on étudie l’intégration de biais linguistiques dans les architectures de réseaux neuronaux, pour contraindre leur séquence de composition selon une structure traditionnelle, en arbres. Dans un second temps, on relâche ces contraintes pour analyser les structures latentes induites par ces réseaux neuronaux. Dans les deux cas, on analyse les propriétés de composition des modèles ainsi que les propriétés sémantiques des plongements.
Laboratoire de Linguistique Formelle – UMR 7110 CNRS et Université Paris Cité – RNSR : 200112497J
Adresse géographique : Bât. Olympe de Gouges, 5ème étage. 8, Rue Albert Einstein 75013 Paris
Envoyer un courrier : Case Postale 7031 – 5, rue Thomas Mann – F-75205 Paris Cedex 13
Transports : Métro ligne 14 : arrêt "Bibliothèque François Mitterrand" – Tram T3A : arrêt "Avenue de France" – Bus n°89 et 62 : arrêt "Porte de France"
Téléphone : (+33) (0)1 57 27 57 64 – Télécopie : (+33) (0)1 57 27 57 81
Directeur de la publication : Heather Burnett – Dernière mise à jour : 2025-06-08