12e journée doctorale du LLF

Jeudi 21 Novembre 2019, 09:00 to 17:00
Organisation: 
Gabriel Thiberge, Suzanne Lesage, Maria Copot, Juliette Millet, Vincent Segonne
Lieu: 

LLF – Bât. ODG – 5e étage – Salle du conseil (533)

Programme

9h20-9h30 Accueil

9h30-10h ​Suzanne Lesage
Contraintes graduelles sur le possessif réfléchi en estonien

10h-10h30​ Beatrice-Andreea Pahontu
Les périphrases verbales du roumain : comportement syntaxique et sémantique​

10h30-10h45 Pause café

10h45-11h15 Eimear Maguire
​Conditional repair: if-clauses in communication management​

11h15-11h45 Angélique Jaber
​Le bilinguisme bimodal : un défi pour les théorie sur le bilinguisme

11h45-14h Linglunch, et déjeuner

14h-14h20 Antoine Simoulin
​Méthodes d'apprentissages comparatives pour la représentation des phrases

14h20-14h40 ​Nacim Amazouz
Apprentissage de l'alphabet phonétique international en licence d'anglais : théories, études et développement

14h40-15h10 Maria Copot
​The distribution and nature of gaps in inflection and derivation​

15h10-15h30 Pause café

15h30-15h50 Quentin Dénigot
​Sémantique distributionnelle et discours politiques​

15h50-16h20 Saida Loucif
​Les phénomènes de transfert en acquisition du genre grammatical en français langue seconde​

16h20-16h50 Sandro Capo Chichi
​Sur l'étymologie d'un théonyme ouest-africain​

Résumés

Suzanne Lesage
Contraintes graduelles sur le possessif réfléchi en estonien
We report on a corpus study of the use of reflexive vs. nonreflexive possessives in Estonian sen- tences headed by verbs taking an allative argument. We parsed the Estonian National Corpus using UDPipe trained with the Estonian Dependency Corpus, extracted relevant data automati- cally, eliminated false positives and annotated the data by hand. This allowed us to document effects of grammatical functions, word order and person on the choice of a reflexive vs. non- reflexive, using generalized linear mixed models. We hypothesize that the documented effects are due to the combined effects of grammatical relations, information structure, and ambiguity avoidance.

Beatrice-Andreea Pahontu
Les périphrases verbales du roumain : comportement syntaxique et sémantique​
On retrouve dans la littérature (notamment Haspelmath 2000, Ackerman et Stump 2004, Brown et al. 2012) des critères dans l'identification d'une périphrase verbale, comme par exemple le rapport forme synthétique/forme analytique, la non-compositionnalité sémantique, la présence des restrictions, l'intersectivité des traits etc. Ces critères nous permettent de distinguer les périphrases des syntagmes ordinaires d'un côté, et des autres constructions apparentées de l'autre côté (p.ex les verbes support ou les locutions verbales).
Dans cette présentation nous discuterons en particulier des périphrases catégorielles (cf. Haspelmath 2000), c.-à-d. des périphrases qui n'ont pas de formes synthétiques dans les paradigmes où elles apparaissent. L'inventaire des critères sera appliqué à trois types de constructions analytiques du roumain (le passé composé, le futur et le progressif), afin de montrer des arguments pour leur statut périphrastique.
Cependant, leur conférer le statut de périphrase ne garantit pas une structure syntaxique identique. Selon les travaux d'Abeillé et Godard (2003, 2010) et Bonami et Webelhuth (2013), on distingue trois types de structures, en fonction du type de relation syntaxique qui s’établit entre l’auxiliaire et le verbe principal : (i) structure hiérarchique; (ii) structure plate ; (iii) structure à complexe verbal. Sur la base de quelques tests : la montée du clitique, la topicalisation du verbe lexical, la portée sur une coordination, l’ellipse du verbe lexical, et enfin, l’insertion d’un constituant, on a observé que le passé composé et les deux formes de futur se combinant avec l’infinitif se prêtent facilement à une analyse en termes de complexe verbal. Les périphrases du futur qui se combinent avec le subjonctif se rapprochent beaucoup plus des structures à complexe verbal [[Aux V]VC NP]VP, alors que les périphrases progressives se prêtent plutôt à une structure hiérarchique [Aux [V NP]VP]VP.
Toute discussion sur les périphrases verbales impose la prise en compte de l'interface morphologie-syntaxe, mais les périphrases catégorielles nous obligent à étendre la notion de ‘périphrase’ à d’autres types d’informations linguistiques (Haspelmath 2000), par exemple à des informations sémantiques, comme c’est le cas de la catégorie sémantique du progressif : fr. être en train de, roum. a fi în curs, a fi pe cale, etc. À titre d'exemple, nous allons présenter la polysémie de la périphrase a fi pe cale (‘être en voie de’) qui peut exprimer plusieurs valeurs sémantiques : le progressif, le proximatif et l'avertif.

Antoine Simoulin
​Méthodes d'apprentissages comparatives pour la représentation des phrases
En traitement automatique du langage, les embeddings désignent des représentations mathématiques qui capturent le sens des mots ou des phrases. Ces représentations sont particulièrement efficaces pour représenter les mots. Dans l’hypothèse distributionnelle, deux mots qui partagent un contexte similaire, ont un sens proche et sont donc associés à des représentations proches.
Je cherche à étendre cette méthode d’apprentissage pour construire des embeddings de phrases. Je me place dans une hypothèse compositionnelle où le sens de la phrase pourrait ainsi être dérivé d’une composition des mots qui la composent. Dans ce cadre, je suppose que la phrase est associée à une représentation syntaxique latente. Par exemple une structure syntaxique en dépendance ou en constituants. La composition des mots de la phrase se fait alors selon cette structure.
La fonction de composition est apprise en cherchant à faire correspondre différentes « vues» de la phrase. Les différentes vues désignent un couple de structure syntaxique et de modèle d’apprentissage automatique ad-hoc. Dans le cas d’une structure de dépendances ou de constituants, je m’intéresse en particulier à des modèles récursifs.
Je présenterai les expérimentations que j’ai mis en place et les propriétés résultants de cette méthode d’apprentissage, notamment la possibilité d'identifier automatiquement des paraphrases.

Nacim Amazouz
Apprentissage de l'alphabet phonétique international en licence d'anglais : théories, études et développement
À la différence de l’écrit qui n’utilise qu’un seul support, l’oral se voit associer une représentation écrite, cette représentation peut prendre plusieurs formes : l’annotation, la transcription orthographique, la transcription phonétique, etc. En ce qui concerne l’apprentissage de la prononciation de l’anglais, la transcription étant la seule face accessible de l’oral, il est nécessaire de réfléchir à la forme qu’elle revêt. (Tyne et al. 2014). Ainsi, la constitution d’un corpus écrit de transcriptions phonémiques réalisées par des étudiants anglicistes nous a permis de rendre compte des différents types d’erreurs de transcription et ainsi de tracer une carte la plus complète possible de la méconnaissance de la phonologie de l’anglais des étudiants. En raison des fortes différences segmentales et suprasegmentales de l’anglais et du français, l’application des règles accentuelles et des règles de lecture ne se fait pas de manière systématique, les erreurs de transcription sont nombreuses et les étudiants ne maîtrisent pas les règles de lecture, l’accentuation et la transcription des phonèmes de l’anglais.

Maria Copot
​The distribution and nature of gaps in inflection and derivation​
During my PhD I am hoping to extend the concept of morphological defectiveness to derivation with the aim of providing a paradigmatic framework for gaps that applies to the whole lexicon, as well as gathering evidence on the psycholinguistic nature of defectiveness. After giving a brief overview of the project, I will relate findings from the first completed step: the ideation of quantitative methods to identify defective lexemes by relying on large corpora. Defective forms manifest as items that have a much lower attested frequency than expected: this study introduces the f-ratio, the ratio between a form's frequency within its paradigm (attested frequency) and the average relative frequency of its semantic neighbours(used as a proxy for expected frequency), and proposes that it is a useful measure to quantify and identifydefectiveness in both inflection and derivation, although the phenomenon has differing connotations in the two domains.

Saida Loucif
​Les phénomènes de transfert en acquisition du genre grammatical en français langue seconde​
La présente étude examine l’impact de la langue maternelle (LM) sur l’acquisition du genre grammatical en français langue seconde (FLS), ainsi que les différents facteurs qui peuvent interagir dans cette acquisition. Notre hypothèse principale repose sur la notion de transfert de la LM vers la LS (Franceschina, 2005). Dans cette optique, la grammaire de la LM peut avoir des effets facilitants l’acquisition de la grammaire de la LS (quand les systèmes du genre sont similaires en LM et en LS), mais peut aussi représenter un obstacle, quand ces deux systèmes sont différents. Nous supposons également que l’intensité et la qualité de l’input en FLS influe sur ce transfert (Cornips et Hulk 2008). Ces hypothèses sont testées par la comparaison entre nos différents groupes de LM par une tâche de description d’image à l’oral, en évaluant la compétence de nos participants à accorder le genre correctement aux syntagmes nominaux français.