Modifications du document Les catégories grammaticales
modifié par Gilles Toubiana
sur 2018/05/25 16:36
sur 2018/05/25 16:36
modifié par Gilles Toubiana
sur 2020/03/09 16:23
sur 2020/03/09 16:23
Commentaire de modification : Il n'y a aucun commentaire pour cette version
Résumé
-
Propriétés de la Page (3 modifications, 0 ajouts, 0 suppressions)
Détails
- Propriétés de la Page
-
- Parent
-
... ... @@ -1,1 +1,1 @@ 1 -xwiki:Main. LesexpressionsFrantext.Correspondances entrelesversions.WebHome1 +xwiki:Main.Manuel d'utilisation.Expressions.WebHome - Tags
-
... ... @@ -1,0 +1,1 @@ 1 +manuel|v1.2.x|pos|ana|parties du discours|catégories|catégories grammaticales|codes grammaticaux|corpus|étiquetage|étiquettes - Contenu
-
... ... @@ -1,6 +1,8 @@ 1 1 (% class="lead" %) 2 -L 'ensembledestextes ont été catégorisés (étiquetés en partie de discours, ou POS). Cela signifie que chaque mot a reçu une étiquette grammaticale.Voici la liste des codes grammaticaux utilisés pour cet étiquetage.2 +Les textes ont tous été catégorisés (étiquetés en partie de discours, ou POS). Cela signifie que chaque mot a reçu une étiquette grammaticale. 3 3 4 +**Voici la liste des codes grammaticaux utilisés pour cet étiquetage :** 5 + 4 4 (% class="doOddEven sortable table-bordered table-condensed table-striped" id="tableid" %) 5 5 (% class="sortHeader" %)|=(% style="background-color:#EEE;" %)CODE|=(% style="background-color:#EEE;" %)Notion grammaticale 6 6 |{{code}}ADJ{{/code}}|adjectif ... ... @@ -26,10 +26,21 @@ 26 26 |{{code}}VPR{{/code}}|verbe participe présent 27 27 |{{code}}X{{/code}}|mot non traité 28 28 29 - Pour les textespostérieursà 1850, le jeud’étiquettesproposés par Crabbéet Candito*aété utilisé,etmodifiéàlamarge.31 +**Des étiquettes spécifiques aux textes médiévaux ont été ajoutées à Frantext en janvier 2019 :** 30 30 31 -* Une étiquette X a été ajoutée, pour les cas les plus problématiques. 32 -* Sept étiquettes ont été supprimées. Il s’agit d’étiquettes qui étaient associées à peu de formes et d’étiquettes davantage bénéfiques pour l’analyse syntaxique que pour la seule catégorisation. 33 -* Les étiquettes spécifiques aux clitiques sujets (je, tu, il, elle, on, ça, nous, vous, ils, elles) et objets (le, la, les, lui, leur, y, en) ont été conservées. Elles rendent compte d’un emploi particulier des pronoms personnels en tant que sujet ou objet de verbes. 33 +(% class="doOddEven sortable table-bordered table-condensed table-striped" id="tableid" %) 34 +(% class="sortHeader" %)|=(% style="background-color:#EEE;" %)CODE|=(% style="background-color:#EEE;" %)Notion grammaticale 35 +|{{code}}ADV+CLO{{/code}}|adverbe + clitique objet 36 +|{{code}}ADV+DET{{/code}}|adverbe + déterminant 37 +|{{code}}CLS+CLO{{/code}}|clitique sujet + clitique objet 38 +|{{code}}CLS+V{{/code}}|clitique sujet + verbe 39 +|{{code}}CS+CLO{{/code}}|conjonction de subordination + clitique objet 40 +|{{code}}CS+CLS{{/code}}|conjonction de subordination + clitique sujet 41 +|{{code}}V+CLS{{/code}}|verbe + clitique sujet 34 34 35 -~* Benoît Crabbé and Marie Candito. Expériences d’analyse syntaxique statistique du français. In 5ème conférence sur le Traitement Automatique des Langues Naturelles - TALN’08, pages pp. 44–54, Avignon, France, June 2008. 43 +(% class="box infomessage" %) 44 +((( 45 +Du fait de la complexité du processus d'étiquetage pour certain textes, il est possible que d'autres combinaisons soient disponibles - notamment dans la recherche assistée pour les versions 1.2.x de l'application en ligne. Ces combinaisons vont disparaitre lors des mises à jour successives du corpus. 46 +))) 47 + 48 +>Pour aller plus loin, consultez la documentation dédiée aux [[jeux d'étiquettes>>doc:Main.Manuel d'utilisation.Expressions.Les codes grammaticaux.Correspondance des codes grammaticaux.WebHome]].