12e journée doctorale du LLF

Jeudi 21 Novembre 2019, 09:00 to 17:00

Organisation:

Gabriel Thiberge, Suzanne Lesage, Maria Copot, Juliette Millet, Vincent Segonne

Lieu:

LLF – Bât. ODG – 5e étage – Salle du conseil (533)

Programme

9h20-9h30 Accueil

9h30-10h Suzanne Lesage
Contraintes graduelles sur le possessif réfléchi en estonien

10h-10h30 Beatrice-Andreea Pahontu
Les périphrases verbales du roumain : comportement syntaxique et sémantique

10h30-10h45 Pause café

10h45-11h15 Eimear Maguire
Conditional repair: if-clauses in communication management

11h15-11h45 Angélique Jaber
Le bilinguisme bimodal : un défi pour les théorie sur le bilinguisme

11h45-14h Linglunch, et déjeuner

14h-14h20 Antoine Simoulin
Méthodes d'apprentissages comparatives pour la représentation des phrases

14h20-14h40 Nacim Amazouz
Apprentissage de l'alphabet phonétique international en licence d'anglais : théories, études et développement

14h40-15h10 Maria Copot
The distribution and nature of gaps in inflection and derivation

15h10-15h30 Pause café

15h30-15h50 Quentin Dénigot
Sémantique distributionnelle et discours politiques

15h50-16h20 Saida Loucif
Les phénomènes de transfert en acquisition du genre grammatical en français langue seconde

16h20-16h50 Sandro Capo Chichi
Sur l'étymologie d'un théonyme ouest-africain

Résumés

Suzanne Lesage
Contraintes graduelles sur le possessif réfléchi en estonien
We report on a corpus study of the use of reflexive vs. nonreflexive possessives in Estonian sen- tences headed by verbs taking an allative argument. We parsed the Estonian National Corpus using UDPipe trained with the Estonian Dependency Corpus, extracted relevant data automati- cally, eliminated false positives and annotated the data by hand. This allowed us to document effects of grammatical functions, word order and person on the choice of a reflexive vs. non- reflexive, using generalized linear mixed models. We hypothesize that the documented effects are due to the combined effects of grammatical relations, information structure, and ambiguity avoidance.

Beatrice-Andreea Pahontu
Les périphrases verbales du roumain : comportement syntaxique et sémantique
On retrouve dans la littérature (notamment Haspelmath 2000, Ackerman et Stump 2004, Brown et al. 2012) des critères dans l'identification d'une périphrase verbale, comme par exemple le rapport forme synthétique/forme analytique, la non-compositionnalité sémantique, la présence des restrictions, l'intersectivité des traits etc. Ces critères nous permettent de distinguer les périphrases des syntagmes ordinaires d'un côté, et des autres constructions apparentées de l'autre côté (p.ex les verbes support ou les locutions verbales).
Dans cette présentation nous discuterons en particulier des périphrases catégorielles (cf. Haspelmath 2000), c.-à-d. des périphrases qui n'ont pas de formes synthétiques dans les paradigmes où elles apparaissent. L'inventaire des critères sera appliqué à trois types de constructions analytiques du roumain (le passé composé, le futur et le progressif), afin de montrer des arguments pour leur statut périphrastique.
Cependant, leur conférer le statut de périphrase ne garantit pas une structure syntaxique identique. Selon les travaux d'Abeillé et Godard (2003, 2010) et Bonami et Webelhuth (2013), on distingue trois types de structures, en fonction du type de relation syntaxique qui s’établit entre l’auxiliaire et le verbe principal : (i) structure hiérarchique; (ii) structure plate ; (iii) structure à complexe verbal. Sur la base de quelques tests : la montée du clitique, la topicalisation du verbe lexical, la portée sur une coordination, l’ellipse du verbe lexical, et enfin, l’insertion d’un constituant, on a observé que le passé composé et les deux formes de futur se combinant avec l’infinitif se prêtent facilement à une analyse en termes de complexe verbal. Les périphrases du futur qui se combinent avec le subjonctif se rapprochent beaucoup plus des structures à complexe verbal [[Aux V]VC NP]VP, alors que les périphrases progressives se prêtent plutôt à une structure hiérarchique [Aux [V NP]VP]VP.
Toute discussion sur les périphrases verbales impose la prise en compte de l'interface morphologie-syntaxe, mais les périphrases catégorielles nous obligent à étendre la notion de ‘périphrase’ à d’autres types d’informations linguistiques (Haspelmath 2000), par exemple à des informations sémantiques, comme c’est le cas de la catégorie sémantique du progressif : fr. être en train de, roum. a fi în curs, a fi pe cale, etc. À titre d'exemple, nous allons présenter la polysémie de la périphrase a fi pe cale (‘être en voie de’) qui peut exprimer plusieurs valeurs sémantiques : le progressif, le proximatif et l'avertif.

Antoine Simoulin
Méthodes d'apprentissages comparatives pour la représentation des phrases
En traitement automatique du langage, les embeddings désignent des représentations mathématiques qui capturent le sens des mots ou des phrases. Ces représentations sont particulièrement efficaces pour représenter les mots. Dans l’hypothèse distributionnelle, deux mots qui partagent un contexte similaire, ont un sens proche et sont donc associés à des représentations proches.
Je cherche à étendre cette méthode d’apprentissage pour construire des embeddings de phrases. Je me place dans une hypothèse compositionnelle où le sens de la phrase pourrait ainsi être dérivé d’une composition des mots qui la composent. Dans ce cadre, je suppose que la phrase est associée à une représentation syntaxique latente. Par exemple une structure syntaxique en dépendance ou en constituants. La composition des mots de la phrase se fait alors selon cette structure.
La fonction de composition est apprise en cherchant à faire correspondre différentes « vues» de la phrase. Les différentes vues désignent un couple de structure syntaxique et de modèle d’apprentissage automatique ad-hoc. Dans le cas d’une structure de dépendances ou de constituants, je m’intéresse en particulier à des modèles récursifs.
Je présenterai les expérimentations que j’ai mis en place et les propriétés résultants de cette méthode d’apprentissage, notamment la possibilité d'identifier automatiquement des paraphrases.

Nacim Amazouz
Apprentissage de l'alphabet phonétique international en licence d'anglais : théories, études et développement
À la différence de l’écrit qui n’utilise qu’un seul support, l’oral se voit associer une représentation écrite, cette représentation peut prendre plusieurs formes : l’annotation, la transcription orthographique, la transcription phonétique, etc. En ce qui concerne l’apprentissage de la prononciation de l’anglais, la transcription étant la seule face accessible de l’oral, il est nécessaire de réfléchir à la forme qu’elle revêt. (Tyne et al. 2014). Ainsi, la constitution d’un corpus écrit de transcriptions phonémiques réalisées par des étudiants anglicistes nous a permis de rendre compte des différents types d’erreurs de transcription et ainsi de tracer une carte la plus complète possible de la méconnaissance de la phonologie de l’anglais des étudiants. En raison des fortes différences segmentales et suprasegmentales de l’anglais et du français, l’application des règles accentuelles et des règles de lecture ne se fait pas de manière systématique, les erreurs de transcription sont nombreuses et les étudiants ne maîtrisent pas les règles de lecture, l’accentuation et la transcription des phonèmes de l’anglais.

Maria Copot
The distribution and nature of gaps in inflection and derivation
During my PhD I am hoping to extend the concept of morphological defectiveness to derivation with the aim of providing a paradigmatic framework for gaps that applies to the whole lexicon, as well as gathering evidence on the psycholinguistic nature of defectiveness. After giving a brief overview of the project, I will relate findings from the first completed step: the ideation of quantitative methods to identify defective lexemes by relying on large corpora. Defective forms manifest as items that have a much lower attested frequency than expected: this study introduces the f-ratio, the ratio between a form's frequency within its paradigm (attested frequency) and the average relative frequency of its semantic neighbours(used as a proxy for expected frequency), and proposes that it is a useful measure to quantify and identifydefectiveness in both inflection and derivation, although the phenomenon has differing connotations in the two domains.

Saida Loucif
Les phénomènes de transfert en acquisition du genre grammatical en français langue seconde
La présente étude examine l’impact de la langue maternelle (LM) sur l’acquisition du genre grammatical en français langue seconde (FLS), ainsi que les différents facteurs qui peuvent interagir dans cette acquisition. Notre hypothèse principale repose sur la notion de transfert de la LM vers la LS (Franceschina, 2005). Dans cette optique, la grammaire de la LM peut avoir des effets facilitants l’acquisition de la grammaire de la LS (quand les systèmes du genre sont similaires en LM et en LS), mais peut aussi représenter un obstacle, quand ces deux systèmes sont différents. Nous supposons également que l’intensité et la qualité de l’input en FLS influe sur ce transfert (Cornips et Hulk 2008). Ces hypothèses sont testées par la comparaison entre nos différents groupes de LM par une tâche de description d’image à l’oral, en évaluant la compétence de nos participants à accorder le genre correctement aux syntagmes nominaux français.

12e journée doctorale du LLF

Programme

Résumés

Décembre

Accès rapides

inIdEx EFL

Université Paris Cité

Graduate schools

Mentions légales

Vous êtes ici

12e journée doctorale du LLF

Programme

Résumés

Décembre

Accès rapides

inIdEx EFL

Université Paris Cité

Graduate schools

Mentions légales