Masquer les derniers auteurs
Gilles Toubiana 1.1 1 (% class="lead" %)
Gilles Toubiana 21.1 2 Les textes ont tous été catégorisés (étiquetés en partie de discours, ou POS). Cela signifie que chaque mot a reçu une étiquette grammaticale.
Gilles Toubiana 1.1 3
Gilles Toubiana 26.1 4 L'annotation morphosyntaxique permet de différencier des emplois. Par exemple, la forme "entre" peut être employée comme VERBE (entrer) et comme PRÉPOSITION (entre). C'est la position, l'accord et la combinaison des formes qui permettent de déterminer l'emploi, et de choisir la catégorie grammaticale la plus appropriée. Parfois, plusieurs catégories peuvent correspondre à un forme, on parle alors d'ambiguïtés. Dans Frantext, chaque forme est liée à une catégorie, c'est-à-dire une étiquette grammaticale unique.
5
Gilles Toubiana 14.1 6 **Voici la liste des codes grammaticaux utilisés pour cet étiquetage :**
Gilles Toubiana 11.1 7
Gilles Toubiana 2.1 8 (% class="doOddEven sortable table-bordered table-condensed table-striped" id="tableid" %)
Gilles Toubiana 30.1 9 (% class="sortHeader" %)|=(% style="background-color:#EEE;" %)CODES|=(% style="background-color:#EEE;" %)Notions grammaticales|=(% style="background-color:#EEE;" %)Exemples (en fonction du contexte)
Gilles Toubiana 26.1 10 |{{code}}ADJ{{/code}}|adjectif (épithète, attribut, comparatif, superlatif)|petit, grand…
11 |{{code}}ADV{{/code}}|adverbe|ne, pas, plus, qu', rien, jamais, personne…
12 |{{code}}CC{{/code}}|conjonction de coordination|mais, où, et, donc, or, ni, car
13 |{{code}}CS{{/code}}|conjonction de subordination|quand, si, lorsque, quoique…
14 |{{code}}CLO{{/code}}|Pronom clitique objet (pronoms toujours collés au verbe)|me, te, se, s', nous, vous, y, en…
15 |{{code}}CLS{{/code}}|Pronom clitique sujet (pronoms toujours collés au verbe)|je, j', tu, il, elle, on, nous, ça…
16 |{{code}}DET{{/code}}|déterminant (défini, indéfini, démonstratif, possessif, interrogatif)|la, le, un, certains, aucun, mon…
17 |{{code}}ET{{/code}}|mot étranger|//the//, //in//, //of//…
18 |{{code}}I{{/code}}|interjection|non, oui, ah, oh, si…
19 |{{code}}NC{{/code}}|nom commun (adjectifs sans majuscules, possessifs)|vie, fois, propriété, premier, mien…
20 |{{code}}NP{{/code}}|nom propre (noms de personnes, lieux, etc.)|Dieu, Fabrice, Paris…
Gilles Toubiana 29.1 21 |{{code}}P+D{{/code}}{{footnote}}Dans la recherche avancée, afin que le caractère {{code}}+{{/code}} ne soit pas interprété comme un quantificateur dans l'expression régulière, il convient d'utiliser un caractère d'échappement et d'écrire par exemple {{code}}[pos="P\+D"]{{/code}}.{{/footnote}}|préposition + déterminant|du (de+le), des (de+les), au (à+le)…
Gilles Toubiana 26.1 22 |{{code}}PONCT{{/code}}|ponctuation|, . ; : ! ?
23 |{{code}}PRO{{/code}}|pronom (tonique, indéfini, démonstratif)|tout, plusieurs, moi, lui, personne, rien…
24 |{{code}}PROREL{{/code}}|pronom relatif|qui, que, qu', quoi, dont, où, lequel…
25 |{{code}}PROWH{{/code}}|pronom interrogatif|comment, quoi, pourquoi, quand…
26 |{{code}}P{{/code}}|préposition|de, d', à, pour, par, vers, contre, avec…
27 |{{code}}V{{/code}}|verbe conjugué (ainsi que voilà et voici)|est, a, était, voilà…
Gilles Toubiana 23.1 28 |{{code}}VINF{{/code}}|verbe à l’infinitif|faire, être, avoir…
29 |{{code}}VPP{{/code}}|verbe participe passé|été, fait, dit…
30 |{{code}}VPR{{/code}}|verbe participe présent|ayant, étant, faisant…
Gilles Toubiana 26.1 31 |{{code}}X{{/code}}|mot non traité (numéros de chapitres ou de listes, (((
32 t et l épenthétiques, déterminants partitifs, etc.)
33 )))|–, –, ii…
Gilles Toubiana 17.1 34
Gilles Toubiana 26.1 35 (% class="box infomessage" %)
36 (((
37 Les nombres ont reçu une étiquette en fonction de leur position : DET, NC, ADJ ou PRO. Les dates ont été étiquetées : NC.
38 )))
39
Gilles Toubiana 22.1 40 **Des étiquettes spécifiques aux textes médiévaux ont été ajoutées à Frantext en janvier 2019 :**
41
42 (% class="doOddEven sortable table-bordered table-condensed table-striped" id="tableid" %)
Gilles Toubiana 26.1 43 (% class="sortHeader" %)|=(% style="background-color:#EEE;" %)CODES|=(% style="background-color:#EEE;" %)Notions grammaticales|=(% style="background-color:#EEE;" %)Exemples
Gilles Toubiana 23.1 44 |{{code}}ADV+CLO{{/code}}|adverbe + clitique objet|nel, nes, sil…
45 |{{code}}ADV+DET{{/code}}|adverbe + déterminant|nel
46 |{{code}}CLS+CLO{{/code}}|clitique sujet + clitique objet|jol, jeol, jel…
47 |{{code}}CLS+V{{/code}}|clitique sujet + verbe|cestoit, javois
48 |{{code}}CS+CLO{{/code}}|conjonction de subordination + clitique objet|kes
49 |{{code}}CS+CLS{{/code}}|conjonction de subordination + clitique sujet|kil
50 |{{code}}V+CLS{{/code}}|verbe + clitique sujet|atil, estce
Gilles Toubiana 22.1 51
Gilles Toubiana 20.1 52 (% class="box infomessage" %)
53 (((
Gilles Toubiana 24.1 54 Du fait de la complexité du processus d'étiquetage pour certains textes, il est possible que d'autres combinaisons soient disponibles - notamment dans la recherche assistée pour les versions 1.2.x de l'application en ligne. Ces combinaisons vont disparaitre lors des mises à jour successives du corpus.
Gilles Toubiana 20.1 55 )))
56
57 >Pour aller plus loin, consultez la documentation dédiée aux [[jeux d'étiquettes>>doc:Main.Manuel d'utilisation.Expressions.Les codes grammaticaux.Correspondance des codes grammaticaux.WebHome]].
Gilles Toubiana 26.1 58
59 {{putFootnotes/}}
Frantext - ATILF (CNRS/UL) - 2018-2025

Logo CNRS   Logo ATILF   Logo Université de Lorraine