Les catégories grammaticales
Les textes ont tous été catégorisés (étiquetés en partie de discours, ou POS). Cela signifie que chaque mot a reçu une étiquette grammaticale.
Voici la liste des codes grammaticaux utilisés pour cet étiquetage :
CODE | Notion grammaticale |
---|---|
ADJ | adjectif |
ADV | adverbe |
CC | conjonction de coordination |
CS | conjonction de subordination |
CLO | clitique objet |
CLS | clitique sujet |
DET | déterminant |
ET | mot étranger |
I | interjection |
NC | nom commun |
NP | nom propre |
P+D | préposition + déterminant |
PONCT | ponctuation |
PRO | pronom |
PROREL | pronom relatif |
PROWH | pronom interrogatif |
P | préposition |
V | verbe conjugué |
VINF | verbe à l’infinitif |
VPP | verbe participe passé |
VPR | verbe participe présent |
X | mot non traité |
Des étiquettes spécifiques aux textes médiévaux ont été ajoutées à Frantext en janvier 2019 :
CODE | Notion grammaticale |
---|---|
ADV+CLO | adverbe + clitique objet |
ADV+DET | adverbe + déterminant |
CLS+CLO | clitique sujet + clitique objet |
CLS+V | clitique sujet + verbe |
CS+CLO | conjonction de subordination + clitique objet |
CS+CLS | conjonction de subordination + clitique sujet |
V+CLS | verbe + clitique sujet |
Pour aller plus loin, consultez la documentation dédiée aux jeux d'étiquettes.