Masquer les derniers auteurs
Gilles Toubiana 1.1 1 (% class="lead" %)
2 L'ensemble des textes ont été catégorisés (étiquetés en partie de discours, ou POS). Cela signifie que chaque mot a reçu une étiquette grammaticale. Voici la liste des codes grammaticaux utilisés pour cet étiquetage.
3
Gilles Toubiana 2.1 4 (% class="doOddEven sortable table-bordered table-condensed table-striped" id="tableid" %)
Gilles Toubiana 1.1 5 (% class="sortHeader" %)|=(% style="background-color:#EEE;" %)CODE|=(% style="background-color:#EEE;" %)Notion grammaticale
6 |{{code}}ADJ{{/code}}|adjectif
7 |{{code}}ADV{{/code}}|adverbe
8 |{{code}}CC{{/code}}|conjonction de coordination
9 |{{code}}CS{{/code}}|conjonction de subordination
10 |{{code}}CLO{{/code}}|clitique objet
11 |{{code}}CLS{{/code}}|clitique sujet
12 |{{code}}DET{{/code}}|déterminant
13 |{{code}}ET{{/code}}|mot étranger
14 |{{code}}I{{/code}}|interjection
15 |{{code}}NC{{/code}}|nom commun
16 |{{code}}NP{{/code}}|nom propre
17 |{{code}}P+D{{/code}}|préposition + déterminant
18 |{{code}}PONCT{{/code}}|ponctuation
19 |{{code}}PRO{{/code}}|pronom
20 |{{code}}PROREL{{/code}}|pronom relatif
21 |{{code}}PROWH{{/code}}|pronom interrogatif
22 |{{code}}P{{/code}}|préposition
23 |{{code}}V{{/code}}|verbe conjugué
24 |{{code}}VINF{{/code}}|verbe à l’infinitif
25 |{{code}}VPP{{/code}}|verbe participe passé
26 |{{code}}VPR{{/code}}|verbe participe présent
27 |{{code}}X{{/code}}|mot non traité
Gilles Toubiana 3.2 28
Gilles Toubiana 7.1 29 Pour les textes postérieurs à 1850, le jeu d’étiquettes proposés par Crabbé et Candito{{footnote}}Benoît Crabbé and Marie Candito. Expériences d’analyse syntaxique statistique du français. In 5ème conférence sur le Traitement Automatique des Langues Naturelles - TALN’08, pages pp. 44–54, Avignon, France, June 2008.{{/footnote}} a été utilisé, et modifié à la marge.
Gilles Toubiana 3.2 30
Gilles Toubiana 6.1 31 * Une étiquette **X** a été ajoutée, pour les cas les plus problématiques.
Gilles Toubiana 3.2 32 * Sept étiquettes ont été supprimées. Il s’agit d’étiquettes qui étaient associées à peu de formes et d’étiquettes davantage bénéfiques pour l’analyse syntaxique que pour la seule catégorisation.
Gilles Toubiana 6.1 33 * Les étiquettes spécifiques aux clitiques sujets (//je, tu, il, elle, on, ça, nous, vous, ils, elles//) et objets (//le, la, les, lui, leur, y, en//) ont été conservées. Elles rendent compte d’un emploi particulier des pronoms personnels en tant que sujet ou objet de verbes.
Gilles Toubiana 3.2 34
Gilles Toubiana 7.1 35 {{putFootnotes/}}
Frantext - ATILF (CNRS/UL) - 2018-2025

Logo CNRS   Logo ATILF   Logo Université de Lorraine