Modifications du document Les catégories grammaticales
modifié par Gilles Toubiana
sur 2020/03/09 17:14
sur 2020/03/09 17:14
modifié par Gilles Toubiana
sur 2018/05/25 16:37
sur 2018/05/25 16:37
Commentaire de modification : Il n'y a aucun commentaire pour cette version
Résumé
-
Propriétés de la Page (3 modifications, 0 ajouts, 0 suppressions)
Détails
- Propriétés de la Page
-
- Parent
-
... ... @@ -1,1 +1,1 @@ 1 -xwiki:Main. Manueld'utilisation.Expressions.WebHome1 +xwiki:Main.Les expressions Frantext.Correspondances entre les versions.WebHome - Tags
-
... ... @@ -1,1 +1,0 @@ 1 -manuel|v1.2.x|pos|ana|parties du discours|catégories|catégories grammaticales|codes grammaticaux|corpus|étiquetage|étiquettes|Frantext 19.4 - Contenu
-
... ... @@ -1,48 +1,35 @@ 1 1 (% class="lead" %) 2 -Les textes ont tousété catégorisés (étiquetés en partie de discours, ou POS). Cela signifie que chaque mot a reçu une étiquette grammaticale.2 +L'ensemble des textes ont été catégorisés (étiquetés en partie de discours, ou POS). Cela signifie que chaque mot a reçu une étiquette grammaticale. Voici la liste des codes grammaticaux utilisés pour cet étiquetage. 3 3 4 -**Voici la liste des codes grammaticaux utilisés pour cet étiquetage :** 5 - 6 6 (% class="doOddEven sortable table-bordered table-condensed table-striped" id="tableid" %) 7 -(% class="sortHeader" %)|=(% style="background-color:#EEE;" %)CODE|=(% style="background-color:#EEE;" %)Notion grammaticale |=(% style="background-color:#EEE;" %)Exemples8 -|{{code}}ADJ{{/code}}|adjectif |tous, même, grand…9 -|{{code}}ADV{{/code}}|adverbe |ne, pas, plus…10 -|{{code}}CC{{/code}}|conjonction de coordination |et, mais, ou…11 -|{{code}}CS{{/code}}|conjonction de subordination |que, si, quand…12 -|{{code}}CLO{{/code}}|clitique objet |se, me, lui…13 -|{{code}}CLS{{/code}}|clitique sujet |il, je, elle…14 -|{{code}}DET{{/code}}|déterminant |la, le, un…15 -|{{code}}ET{{/code}}|mot étranger |the, in, of…16 -|{{code}}I{{/code}}|interjection |non, oui, ah…17 -|{{code}}NC{{/code}}|nom commun |vie, fois, propriété…18 -|{{code}}NP{{/code}}|nom propre |Dieu, Fabrice, Paris…19 -|{{code}}P+D{{/code}}|préposition + déterminant |du (de+le), des (de+les), au (à+le)…20 -|{{code}}PONCT{{/code}}|ponctuation |, . ;21 -|{{code}}PRO{{/code}}|pronom |ce, moi, lui…22 -|{{code}}PROREL{{/code}}|pronom relatif |qui, que, qu'…23 -|{{code}}PROWH{{/code}}|pronom interrogatif |comment, quoi, pourquoi…24 -|{{code}}P{{/code}}|préposition |de, à, d'…25 -|{{code}}V{{/code}}|verbe conjugué |est, a, était…26 -|{{code}}VINF{{/code}}|verbe à l’infinitif |faire, être, avoir…27 -|{{code}}VPP{{/code}}|verbe participe passé |été, fait, dit…28 -|{{code}}VPR{{/code}}|verbe participe présent |ayant, étant, faisant…29 -|{{code}}X{{/code}}|mot non traité |–, –, ii…5 +(% class="sortHeader" %)|=(% style="background-color:#EEE;" %)CODE|=(% style="background-color:#EEE;" %)Notion grammaticale 6 +|{{code}}ADJ{{/code}}|adjectif 7 +|{{code}}ADV{{/code}}|adverbe 8 +|{{code}}CC{{/code}}|conjonction de coordination 9 +|{{code}}CS{{/code}}|conjonction de subordination 10 +|{{code}}CLO{{/code}}|clitique objet 11 +|{{code}}CLS{{/code}}|clitique sujet 12 +|{{code}}DET{{/code}}|déterminant 13 +|{{code}}ET{{/code}}|mot étranger 14 +|{{code}}I{{/code}}|interjection 15 +|{{code}}NC{{/code}}|nom commun 16 +|{{code}}NP{{/code}}|nom propre 17 +|{{code}}P+D{{/code}}|préposition + déterminant 18 +|{{code}}PONCT{{/code}}|ponctuation 19 +|{{code}}PRO{{/code}}|pronom 20 +|{{code}}PROREL{{/code}}|pronom relatif 21 +|{{code}}PROWH{{/code}}|pronom interrogatif 22 +|{{code}}P{{/code}}|préposition 23 +|{{code}}V{{/code}}|verbe conjugué 24 +|{{code}}VINF{{/code}}|verbe à l’infinitif 25 +|{{code}}VPP{{/code}}|verbe participe passé 26 +|{{code}}VPR{{/code}}|verbe participe présent 27 +|{{code}}X{{/code}}|mot non traité 30 30 31 - **Desétiquettesspécifiquesauxtextesmédiévauxont étéajoutéesàFrantexten janvier2019 :**29 +Pour les textes postérieurs à 1850, le jeu d’étiquettes proposés par Crabbé et Candito* a été utilisé, et modifié à la marge. 32 32 33 -(% class="doOddEven sortable table-bordered table-condensed table-striped" id="tableid" %) 34 -(% class="sortHeader" %)|=(% style="background-color:#EEE;" %)CODE|=(% style="background-color:#EEE;" %)Notion grammaticale|=(% style="background-color:#EEE;" %)Exemples 35 -|{{code}}ADV+CLO{{/code}}|adverbe + clitique objet|nel, nes, sil… 36 -|{{code}}ADV+DET{{/code}}|adverbe + déterminant|nel 37 -|{{code}}CLS+CLO{{/code}}|clitique sujet + clitique objet|jol, jeol, jel… 38 -|{{code}}CLS+V{{/code}}|clitique sujet + verbe|cestoit, javois 39 -|{{code}}CS+CLO{{/code}}|conjonction de subordination + clitique objet|kes 40 -|{{code}}CS+CLS{{/code}}|conjonction de subordination + clitique sujet|kil 41 -|{{code}}V+CLS{{/code}}|verbe + clitique sujet|atil, estce 31 +* Une étiquette X a été ajoutée, pour les cas les plus problématiques. 32 +* Sept étiquettes ont été supprimées. Il s’agit d’étiquettes qui étaient associées à peu de formes et d’étiquettes davantage bénéfiques pour l’analyse syntaxique que pour la seule catégorisation. 33 +* Les étiquettes spécifiques aux clitiques sujets (je, tu, il, elle, on, ça, nous, vous, ils, elles) et objets (le, la, les, lui, leur, y, en) ont été conservées. Elles rendent compte d’un emploi particulier des pronoms personnels en tant que sujet ou objet de verbes. 42 42 43 -(% class="box infomessage" %) 44 -((( 45 -Du fait de la complexité du processus d'étiquetage pour certains textes, il est possible que d'autres combinaisons soient disponibles - notamment dans la recherche assistée pour les versions 1.2.x de l'application en ligne. Ces combinaisons vont disparaitre lors des mises à jour successives du corpus. 46 -))) 47 - 48 ->Pour aller plus loin, consultez la documentation dédiée aux [[jeux d'étiquettes>>doc:Main.Manuel d'utilisation.Expressions.Les codes grammaticaux.Correspondance des codes grammaticaux.WebHome]]. 35 +(% class="small" %)* Benoît Crabbé and Marie Candito. Expériences d’analyse syntaxique statistique du français. In 5ème conférence sur le Traitement Automatique des Langues Naturelles - TALN’08, pages pp. 44–54, Avignon, France, June 2008.