Modifications du document Les catégories grammaticales
modifié par Gilles Toubiana
sur 2018/05/25 16:39
sur 2018/05/25 16:39
modifié par Gilles Toubiana
sur 2020/03/09 16:23
sur 2020/03/09 16:23
Commentaire de modification : Il n'y a aucun commentaire pour cette version
Résumé
-
Propriétés de la Page (3 modifications, 0 ajouts, 0 suppressions)
Détails
- Propriétés de la Page
-
- Parent
-
... ... @@ -1,1 +1,1 @@ 1 -xwiki:Main. LesexpressionsFrantext.Correspondances entrelesversions.WebHome1 +xwiki:Main.Manuel d'utilisation.Expressions.WebHome - Tags
-
... ... @@ -1,0 +1,1 @@ 1 +manuel|v1.2.x|pos|ana|parties du discours|catégories|catégories grammaticales|codes grammaticaux|corpus|étiquetage|étiquettes - Contenu
-
... ... @@ -1,6 +1,8 @@ 1 1 (% class="lead" %) 2 -L 'ensembledestextes ont été catégorisés (étiquetés en partie de discours, ou POS). Cela signifie que chaque mot a reçu une étiquette grammaticale.Voici la liste des codes grammaticaux utilisés pour cet étiquetage.2 +Les textes ont tous été catégorisés (étiquetés en partie de discours, ou POS). Cela signifie que chaque mot a reçu une étiquette grammaticale. 3 3 4 +**Voici la liste des codes grammaticaux utilisés pour cet étiquetage :** 5 + 4 4 (% class="doOddEven sortable table-bordered table-condensed table-striped" id="tableid" %) 5 5 (% class="sortHeader" %)|=(% style="background-color:#EEE;" %)CODE|=(% style="background-color:#EEE;" %)Notion grammaticale 6 6 |{{code}}ADJ{{/code}}|adjectif ... ... @@ -26,10 +26,21 @@ 26 26 |{{code}}VPR{{/code}}|verbe participe présent 27 27 |{{code}}X{{/code}}|mot non traité 28 28 29 - Pour les textespostérieursà 1850, le jeud’étiquettesproposés par Crabbéet Candito*aété utilisé,etmodifiéàlamarge.31 +**Des étiquettes spécifiques aux textes médiévaux ont été ajoutées à Frantext en janvier 2019 :** 30 30 31 -* Une étiquette **X** a été ajoutée, pour les cas les plus problématiques. 32 -* Sept étiquettes ont été supprimées. Il s’agit d’étiquettes qui étaient associées à peu de formes et d’étiquettes davantage bénéfiques pour l’analyse syntaxique que pour la seule catégorisation. 33 -* Les étiquettes spécifiques aux clitiques sujets (//je, tu, il, elle, on, ça, nous, vous, ils, elles//) et objets (//le, la, les, lui, leur, y, en//) ont été conservées. Elles rendent compte d’un emploi particulier des pronoms personnels en tant que sujet ou objet de verbes. 33 +(% class="doOddEven sortable table-bordered table-condensed table-striped" id="tableid" %) 34 +(% class="sortHeader" %)|=(% style="background-color:#EEE;" %)CODE|=(% style="background-color:#EEE;" %)Notion grammaticale 35 +|{{code}}ADV+CLO{{/code}}|adverbe + clitique objet 36 +|{{code}}ADV+DET{{/code}}|adverbe + déterminant 37 +|{{code}}CLS+CLO{{/code}}|clitique sujet + clitique objet 38 +|{{code}}CLS+V{{/code}}|clitique sujet + verbe 39 +|{{code}}CS+CLO{{/code}}|conjonction de subordination + clitique objet 40 +|{{code}}CS+CLS{{/code}}|conjonction de subordination + clitique sujet 41 +|{{code}}V+CLS{{/code}}|verbe + clitique sujet 34 34 35 -(% class="small" %)* Benoît Crabbé and Marie Candito. Expériences d’analyse syntaxique statistique du français. In //5ème conférence sur le Traitement Automatique des Langues Naturelles - TALN’08//, pages pp. 44–54, Avignon, France, June 2008. 43 +(% class="box infomessage" %) 44 +((( 45 +Du fait de la complexité du processus d'étiquetage pour certain textes, il est possible que d'autres combinaisons soient disponibles - notamment dans la recherche assistée pour les versions 1.2.x de l'application en ligne. Ces combinaisons vont disparaitre lors des mises à jour successives du corpus. 46 +))) 47 + 48 +>Pour aller plus loin, consultez la documentation dédiée aux [[jeux d'étiquettes>>doc:Main.Manuel d'utilisation.Expressions.Les codes grammaticaux.Correspondance des codes grammaticaux.WebHome]].