Corpus annoté déterminants du français / ELICO

Responsable : Lucia M. Tovena

Site Web : elico.linguist.univ-paris-diderot.fr

Caractéristiques :

  • 1 million de mots, extraits de textes représentatifs de différents genres et couvrant six siècles (XIIIe-XVIIIe)
  • environ 20.000 déterminants/pronoms en contexte annoté

Partenaire : ANR projet ANR-06CORP-028-01

Diffusion : Interface d'interrogation en ligne

Description : La database ELICO est une collection d'occurrences de déterminants présentés dans un contexte de citation. L'annotation ne porte pas spécifiquement sur les déterminants, mais apporte plutôt des informations linguistiques sur leur contexte, de sorte que la database n'impose pas une analyse préalable des déterminants mais fournit un ensemble d'observables linguistiquement pertinents. L'annotation permet également de mettre en relation les propriétés globales des textes (leur type textuel) avec des observables linguistiques déjà enrichis. De ce fait, la database va permettre des recherches avancées qui se rapportent à des cadres théoriques différents et peut être utilisée pour tester des hypothèses linguistiques.