Les catégories grammaticales
Les textes ont tous été catégorisés (étiquetés en partie de discours, ou POS). Cela signifie que chaque mot a reçu une étiquette grammaticale.
Voici la liste des codes grammaticaux utilisés pour cet étiquetage :
| CODE | Notion grammaticale | Exemples |
|---|---|---|
| ADJ | adjectif | tous, même, grand… |
| ADV | adverbe | ne, pas, plus… |
| CC | conjonction de coordination | et, mais, ou… |
| CS | conjonction de subordination | que, si, quand… |
| CLO | clitique objet | se, me, lui… |
| CLS | clitique sujet | il, je, elle… |
| DET | déterminant | la, le, un… |
| ET | mot étranger | the, in, of… |
| I | interjection | non, oui, ah… |
| NC | nom commun | vie, fois, propriété… |
| NP | nom propre | Dieu, Fabrice, Paris… |
| P+D | préposition + déterminant | du (de+le), des (de+les), au (à+le)… |
| PONCT | ponctuation | , . ; |
| PRO | pronom | ce, moi, lui… |
| PROREL | pronom relatif | qui, que, qu'… |
| PROWH | pronom interrogatif | comment, quoi, pourquoi… |
| P | préposition | de, à, d'… |
| V | verbe conjugué | est, a, était… |
| VINF | verbe à l’infinitif | faire, être, avoir… |
| VPP | verbe participe passé | été, fait, dit… |
| VPR | verbe participe présent | ayant, étant, faisant… |
| X | mot non traité | –, –, ii… |
Des étiquettes spécifiques aux textes médiévaux ont été ajoutées à Frantext en janvier 2019 :
| CODE | Notion grammaticale | Exemples |
|---|---|---|
| ADV+CLO | adverbe + clitique objet | nel, nes, sil… |
| ADV+DET | adverbe + déterminant | nel |
| CLS+CLO | clitique sujet + clitique objet | jol, jeol, jel… |
| CLS+V | clitique sujet + verbe | cestoit, javois |
| CS+CLO | conjonction de subordination + clitique objet | kes |
| CS+CLS | conjonction de subordination + clitique sujet | kil |
| V+CLS | verbe + clitique sujet | atil, estce |
Pour aller plus loin, consultez la documentation dédiée aux jeux d'étiquettes.


