Les catégories grammaticales


Les textes ont tous été catégorisés (étiquetés en partie de discours, ou POS). Cela signifie que chaque mot a reçu une étiquette grammaticale.

Voici la liste des codes grammaticaux utilisés pour cet étiquetage :

CODENotion grammaticaleExemples
ADJadjectiftous, même, grand…
ADVadverbene, pas, plus…
CCconjonction de coordinationet, mais, ou…
CSconjonction de subordinationque, si, quand…
CLOclitique objetse, me, lui…
CLSclitique sujetil, je, elle…
DETdéterminantla, le, un…
ETmot étrangerthe, in, of…
Iinterjectionnon, oui, ah…
NCnom communvie, fois, propriété…
NPnom propreDieu, Fabrice, Paris…
P+Dpréposition + déterminantdu (de+le), des (de+les), au (à+le)…
PONCTponctuation, . ;
PROpronomce, moi, lui…
PRORELpronom relatifqui, que, qu'…
PROWHpronom interrogatifcomment, quoi, pourquoi…
Pprépositionde, à, d'…
Vverbe conjuguéest, a, était…
VINFverbe à l’infinitiffaire, être, avoir…
VPPverbe participe passéété, fait, dit…
VPRverbe participe présentayant, étant, faisant…
Xmot non traité–, –, ii…

Des étiquettes spécifiques aux textes médiévaux ont été ajoutées à Frantext en janvier 2019 :

CODENotion grammaticaleExemples
ADV+CLOadverbe + clitique objetnel, nes, sil…
ADV+DETadverbe + déterminantnel
CLS+CLOclitique sujet + clitique objetjol, jeol, jel…
CLS+Vclitique sujet + verbecestoit, javois
CS+CLOconjonction de subordination + clitique objetkes
CS+CLSconjonction de subordination + clitique sujetkil
V+CLSverbe + clitique sujetatil, estce

Du fait de la complexité du processus d'étiquetage pour certains textes, il est possible que d'autres combinaisons soient disponibles - notamment dans la recherche assistée pour les versions 1.2.x de l'application en ligne. Ces combinaisons vont disparaitre lors des mises à jour successives du corpus.

Pour aller plus loin, consultez la documentation dédiée aux jeux d'étiquettes.

Frantext - ATILF (CNRS/UL) - 2018-2025

Logo CNRS   Logo ATILF   Logo Université de Lorraine