Depuis la version 1.1 >
modifié par Gilles Toubiana
sur 2018/04/03 14:32
À la version < 28.1 >
modifié par Gilles Toubiana
sur 2020/03/10 15:28
>
Commentaire de modification : Il n'y a aucun commentaire pour cette version

Résumé

Détails

insert_drive_file Propriétés de la Page
Titre
... ... @@ -1,1 +1,1 @@
1 -Les codes grammaticaux
1 +Les catégories grammaticales
Parent
... ... @@ -1,1 +1,1 @@
1 -Main.Correspondances entre les versions.WebHome
1 +xwiki:Main.Manuel d'utilisation.Expressions.WebHome
Tags
... ... @@ -1,0 +1,1 @@
1 +manuel|v1.2.x|pos|ana|parties du discours|catégories|catégories grammaticales|codes grammaticaux|corpus|étiquetage|étiquettes|Frantext 19.4
Contenu
... ... @@ -1,28 +2,59 @@
1 -
2 2  (% class="lead" %)
3 -L'ensemble des textes ont été catégorisés (étiquetés en partie de discours, ou POS). Cela signifie que chaque mot a reçu une étiquette grammaticale. Voici la liste des codes grammaticaux utilisés pour cet étiquetage.
2 +Les textes ont tous été catégorisés (étiquetés en partie de discours, ou POS). Cela signifie que chaque mot a reçu une étiquette grammaticale.
4 4  
5 -(% id="tableid" class="doOddEven sortable table-bordered table-condensed table-striped" %)
6 -(% class="sortHeader" %)|=(% style="background-color:#EEE;" %)CODE|=(% style="background-color:#EEE;" %)Notion grammaticale
7 -|{{code}}ADJ{{/code}}|adjectif
8 -|{{code}}ADV{{/code}}|adverbe
9 -|{{code}}CC{{/code}}|conjonction de coordination
10 -|{{code}}CS{{/code}}|conjonction de subordination
11 -|{{code}}CLO{{/code}}|clitique objet
12 -|{{code}}CLS{{/code}}|clitique sujet
13 -|{{code}}DET{{/code}}|déterminant
14 -|{{code}}ET{{/code}}|mot étranger
15 -|{{code}}I{{/code}}|interjection
16 -|{{code}}NC{{/code}}|nom commun
17 -|{{code}}NP{{/code}}|nom propre
18 -|{{code}}P+D{{/code}}|préposition + déterminant
19 -|{{code}}PONCT{{/code}}|ponctuation
20 -|{{code}}PRO{{/code}}|pronom
21 -|{{code}}PROREL{{/code}}|pronom relatif
22 -|{{code}}PROWH{{/code}}|pronom interrogatif
23 -|{{code}}P{{/code}}|préposition
24 -|{{code}}V{{/code}}|verbe conjugué
25 -|{{code}}VINF{{/code}}|verbe à l’infinitif
26 -|{{code}}VPP{{/code}}|verbe participe passé
27 -|{{code}}VPR{{/code}}|verbe participe présent
28 -|{{code}}X{{/code}}|mot non traité
4 +L'annotation morphosyntaxique permet de différencier des emplois. Par exemple, la forme "entre" peut être employée comme VERBE (entrer) et comme PRÉPOSITION (entre). C'est la position, l'accord et la combinaison des formes qui permettent de déterminer l'emploi, et de choisir la catégorie grammaticale la plus appropriée. Parfois, plusieurs catégories peuvent correspondre à un forme, on parle alors d'ambiguïtés. Dans Frantext, chaque forme est liée à une catégorie, c'est-à-dire une étiquette grammaticale unique.
5 +
6 +**Voici la liste des codes grammaticaux utilisés pour cet étiquetage :**
7 +
8 +(% class="doOddEven sortable table-bordered table-condensed table-striped" id="tableid" %)
9 +(% class="sortHeader" %)|=(% style="background-color:#EEE;" %)CODES|=(% style="background-color:#EEE;" %)Notions grammaticales|=(% style="background-color:#EEE;" %)Exemples
10 +|{{code}}ADJ{{/code}}|adjectif (épithète, attribut, comparatif, superlatif)|petit, grand…
11 +|{{code}}ADV{{/code}}|adverbe|ne, pas, plus, qu', rien, jamais, personne…
12 +|{{code}}CC{{/code}}|conjonction de coordination|mais, où, et, donc, or, ni, car
13 +|{{code}}CS{{/code}}|conjonction de subordination|quand, si, lorsque, quoique…
14 +|{{code}}CLO{{/code}}|Pronom clitique objet (pronoms toujours collés au verbe)|me, te, se, s', nous, vous, y, en…
15 +|{{code}}CLS{{/code}}|Pronom clitique sujet (pronoms toujours collés au verbe)|je, j', tu, il, elle, on, nous, ça…
16 +|{{code}}DET{{/code}}|déterminant (défini, indéfini, démonstratif, possessif, interrogatif)|la, le, un, certains, aucun, mon…
17 +|{{code}}ET{{/code}}|mot étranger|//the//, //in//, //of//…
18 +|{{code}}I{{/code}}|interjection|non, oui, ah, oh, si…
19 +|{{code}}NC{{/code}}|nom commun (adjectifs sans majuscules, possessifs)|vie, fois, propriété, premier, mien…
20 +|{{code}}NP{{/code}}|nom propre (noms de personnes, lieux, etc.)|Dieu, Fabrice, Paris…
21 +|{{code}}P+D{{/code}}{{footnote}}Dans la recherche avancée, afin que le caractère + ne soit pas interprété comme un quantificateur dans l'expression régulière, il convient d'utiliser un caractère d'échappement et d'écrire par exemple [pos="P\+D"].{{/footnote}}|préposition + déterminant|du (de+le), des (de+les), au (à+le)…
22 +|{{code}}PONCT{{/code}}|ponctuation|, . ; : ! ?
23 +|{{code}}PRO{{/code}}|pronom (tonique, indéfini, démonstratif)|tout, plusieurs, moi, lui, personne, rien…
24 +|{{code}}PROREL{{/code}}|pronom relatif|qui, que, qu', quoi, dont, où, lequel…
25 +|{{code}}PROWH{{/code}}|pronom interrogatif|comment, quoi, pourquoi, quand…
26 +|{{code}}P{{/code}}|préposition|de, d', à, pour, par, vers, contre, avec…
27 +|{{code}}V{{/code}}|verbe conjugué (ainsi que voilà et voici)|est, a, était, voilà…
28 +|{{code}}VINF{{/code}}|verbe à l’infinitif|faire, être, avoir…
29 +|{{code}}VPP{{/code}}|verbe participe passé|été, fait, dit…
30 +|{{code}}VPR{{/code}}|verbe participe présent|ayant, étant, faisant…
31 +|{{code}}X{{/code}}|mot non traité (numéros de chapitres ou de listes, (((
32 +t et l épenthétiques, déterminants partitifs, etc.)
33 +)))|–, –, ii…
34 +
35 +(% class="box infomessage" %)
36 +(((
37 +Les nombres ont reçu une étiquette en fonction de leur position : DET, NC, ADJ ou PRO. Les dates ont été étiquetées : NC.
38 +)))
39 +
40 +**Des étiquettes spécifiques aux textes médiévaux ont été ajoutées à Frantext en janvier 2019 :**
41 +
42 +(% class="doOddEven sortable table-bordered table-condensed table-striped" id="tableid" %)
43 +(% class="sortHeader" %)|=(% style="background-color:#EEE;" %)CODES|=(% style="background-color:#EEE;" %)Notions grammaticales|=(% style="background-color:#EEE;" %)Exemples
44 +|{{code}}ADV+CLO{{/code}}|adverbe + clitique objet|nel, nes, sil…
45 +|{{code}}ADV+DET{{/code}}|adverbe + déterminant|nel
46 +|{{code}}CLS+CLO{{/code}}|clitique sujet + clitique objet|jol, jeol, jel…
47 +|{{code}}CLS+V{{/code}}|clitique sujet + verbe|cestoit, javois
48 +|{{code}}CS+CLO{{/code}}|conjonction de subordination + clitique objet|kes
49 +|{{code}}CS+CLS{{/code}}|conjonction de subordination + clitique sujet|kil
50 +|{{code}}V+CLS{{/code}}|verbe + clitique sujet|atil, estce
51 +
52 +(% class="box infomessage" %)
53 +(((
54 +Du fait de la complexité du processus d'étiquetage pour certains textes, il est possible que d'autres combinaisons soient disponibles - notamment dans la recherche assistée pour les versions 1.2.x de l'application en ligne. Ces combinaisons vont disparaitre lors des mises à jour successives du corpus.
55 +)))
56 +
57 +>Pour aller plus loin, consultez la documentation dédiée aux [[jeux d'étiquettes>>doc:Main.Manuel d'utilisation.Expressions.Les codes grammaticaux.Correspondance des codes grammaticaux.WebHome]].
58 +
59 +{{putFootnotes/}}
Frantext - ATILF (CNRS/UL) - 2018-2025

Logo CNRS   Logo ATILF   Logo Université de Lorraine