Depuis la version < 15.1 >
modifié par Gilles Toubiana
sur 2018/05/28 11:03
À la version < 23.1 >
modifié par Gilles Toubiana
sur 2020/03/09 17:10
< >
Commentaire de modification : Il n'y a aucun commentaire pour cette version

Résumé

Détails

insert_drive_file Propriétés de la Page
Parent
... ... @@ -1,1 +1,1 @@
1 -xwiki:Main.Les expressions Frantext.Correspondances entre les versions.WebHome
1 +xwiki:Main.Manuel d'utilisation.Expressions.WebHome
Tags
... ... @@ -1,0 +1,1 @@
1 +manuel|v1.2.x|pos|ana|parties du discours|catégories|catégories grammaticales|codes grammaticaux|corpus|étiquetage|étiquettes
Contenu
... ... @@ -1,37 +1,48 @@
1 1  (% class="lead" %)
2 -L'ensemble des textes ont été catégorisés (étiquetés en partie de discours, ou POS). Cela signifie que chaque mot a reçu une étiquette grammaticale.
2 +Les textes ont tous été catégorisés (étiquetés en partie de discours, ou POS). Cela signifie que chaque mot a reçu une étiquette grammaticale.
3 3  
4 -Pour les textes postérieurs à 1850, le jeu d’étiquettes proposés par Crabbé et Candito{{footnote}}Benoît Crabbé and Marie Candito. Expériences d’analyse syntaxique statistique du français. In //5ème conférence sur le Traitement Automatique des Langues Naturelles - TALN’08//, pages pp. 44–54, Avignon, France, June 2008.{{/footnote}} a été utilisé, et modifié à la marge{{footnote}}Ulrike Fleury, Lolita Bérard et Christophe Benzitoun. Campagne de catégorisation des textes post 1850 de la base Frantext, 2016.{{/footnote}}.
4 +**Voici la liste des codes grammaticaux utilisés pour cet étiquetage :**
5 5  
6 -* Une étiquette {{code}}X{{/code}} a été ajoutée, pour les cas les plus problématiques.
7 -* Sept étiquettes ont été supprimées. Il s’agit d’étiquettes qui étaient associées à peu de formes et d’étiquettes davantage bénéfiques pour l’analyse syntaxique que pour la seule catégorisation.
8 -* Les étiquettes spécifiques aux clitiques sujets (//je, tu, il, elle, on, ça, nous, vous, ils, elles//) et objets (//le, la, les, lui, leur, y, en//) ont été conservées. Elles rendent compte d’un emploi particulier des pronoms personnels en tant que sujet ou objet de verbes.
6 +(% class="doOddEven sortable table-bordered table-condensed table-striped" id="tableid" %)
7 +(% class="sortHeader" %)|=(% style="background-color:#EEE;" %)CODE|=(% style="background-color:#EEE;" %)Notion grammaticale|=(% style="background-color:#EEE;" %)Exemples
8 +|{{code}}ADJ{{/code}}|adjectif|tous, même, grand…
9 +|{{code}}ADV{{/code}}|adverbe|ne, pas, plus…
10 +|{{code}}CC{{/code}}|conjonction de coordination|et, mais, ou…
11 +|{{code}}CS{{/code}}|conjonction de subordination|que, si, quand…
12 +|{{code}}CLO{{/code}}|clitique objet|se, me, lui…
13 +|{{code}}CLS{{/code}}|clitique sujet|il, je, elle…
14 +|{{code}}DET{{/code}}|déterminant|la, le, un…
15 +|{{code}}ET{{/code}}|mot étranger|the, in, of…
16 +|{{code}}I{{/code}}|interjection|non, oui, ah…
17 +|{{code}}NC{{/code}}|nom commun|vie, fois, propriété…
18 +|{{code}}NP{{/code}}|nom propre|Dieu, Fabrice, Paris…
19 +|{{code}}P+D{{/code}}|préposition + déterminant|du (de+le), des (de+les), au (à+le)…
20 +|{{code}}PONCT{{/code}}|ponctuation|, . ;
21 +|{{code}}PRO{{/code}}|pronom|ce, moi, lui…
22 +|{{code}}PROREL{{/code}}|pronom relatif|qui, que, qu'…
23 +|{{code}}PROWH{{/code}}|pronom interrogatif|comment, quoi, pourquoi…
24 +|{{code}}P{{/code}}|préposition|de, à, d'…
25 +|{{code}}V{{/code}}|verbe conjugué|est, a, était…
26 +|{{code}}VINF{{/code}}|verbe à l’infinitif|faire, être, avoir…
27 +|{{code}}VPP{{/code}}|verbe participe passé|été, fait, dit…
28 +|{{code}}VPR{{/code}}|verbe participe présent|ayant, étant, faisant…
29 +|{{code}}X{{/code}}|mot non traité|–, –, ii…
9 9  
10 -**Voici la liste des codes grammaticaux utilisés pour cet étiquetage :**
31 +**Des étiquettes spécifiques aux textes médiévaux ont é ajoutées à Frantext en janvier 2019 :**
11 11  
12 12  (% class="doOddEven sortable table-bordered table-condensed table-striped" id="tableid" %)
13 -(% class="sortHeader" %)|=(% style="background-color:#EEE;" %)CODE|=(% style="background-color:#EEE;" %)Notion grammaticale
14 -|{{code}}ADJ{{/code}}|adjectif
15 -|{{code}}ADV{{/code}}|adverbe
16 -|{{code}}CC{{/code}}|conjonction de coordination
17 -|{{code}}CS{{/code}}|conjonction de subordination
18 -|{{code}}CLO{{/code}}|clitique objet
19 -|{{code}}CLS{{/code}}|clitique sujet
20 -|{{code}}DET{{/code}}|déterminant
21 -|{{code}}ET{{/code}}|mot étranger
22 -|{{code}}I{{/code}}|interjection
23 -|{{code}}NC{{/code}}|nom commun
24 -|{{code}}NP{{/code}}|nom propre
25 -|{{code}}P+D{{/code}}|préposition + déterminant
26 -|{{code}}PONCT{{/code}}|ponctuation
27 -|{{code}}PRO{{/code}}|pronom
28 -|{{code}}PROREL{{/code}}|pronom relatif
29 -|{{code}}PROWH{{/code}}|pronom interrogatif
30 -|{{code}}P{{/code}}|préposition
31 -|{{code}}V{{/code}}|verbe conjugué
32 -|{{code}}VINF{{/code}}|verbe à l’infinitif
33 -|{{code}}VPP{{/code}}|verbe participe passé
34 -|{{code}}VPR{{/code}}|verbe participe présent
35 -|{{code}}X{{/code}}|mot non traité
34 +(% class="sortHeader" %)|=(% style="background-color:#EEE;" %)CODE|=(% style="background-color:#EEE;" %)Notion grammaticale|=(% style="background-color:#EEE;" %)Exemples
35 +|{{code}}ADV+CLO{{/code}}|adverbe + clitique objet|nel, nes, sil…
36 +|{{code}}ADV+DET{{/code}}|adverbe + déterminant|nel
37 +|{{code}}CLS+CLO{{/code}}|clitique sujet + clitique objet|jol, jeol, jel…
38 +|{{code}}CLS+V{{/code}}|clitique sujet + verbe|cestoit, javois
39 +|{{code}}CS+CLO{{/code}}|conjonction de subordination + clitique objet|kes
40 +|{{code}}CS+CLS{{/code}}|conjonction de subordination + clitique sujet|kil
41 +|{{code}}V+CLS{{/code}}|verbe + clitique sujet|atil, estce
36 36  
37 -{{putFootnotes/}}
43 +(% class="box infomessage" %)
44 +(((
45 +Du fait de la complexité du processus d'étiquetage pour certain textes, il est possible que d'autres combinaisons soient disponibles - notamment dans la recherche assistée pour les versions 1.2.x de l'application en ligne. Ces combinaisons vont disparaitre lors des mises à jour successives du corpus.
46 +)))
47 +
48 +>Pour aller plus loin, consultez la documentation dédiée aux [[jeux d'étiquettes>>doc:Main.Manuel d'utilisation.Expressions.Les codes grammaticaux.Correspondance des codes grammaticaux.WebHome]].
Frantext - ATILF (CNRS/UL) - 2018-2025

Logo CNRS   Logo ATILF   Logo Université de Lorraine