Depuis la version < 22.1 >
modifié par Gilles Toubiana
sur 2020/03/09 16:23
À la version < 12.1 >
modifié par Gilles Toubiana
sur 2018/05/25 16:53
< >
Commentaire de modification : Il n'y a aucun commentaire pour cette version

Résumé

Détails

insert_drive_file Propriétés de la Page
Parent
... ... @@ -1,1 +1,1 @@
1 -xwiki:Main.Manuel d'utilisation.Expressions.WebHome
1 +xwiki:Main.Les expressions Frantext.Correspondances entre les versions.WebHome
Tags
... ... @@ -1,1 +1,0 @@
1 -manuel|v1.2.x|pos|ana|parties du discours|catégories|catégories grammaticales|codes grammaticaux|corpus|étiquetage|étiquettes
Contenu
... ... @@ -1,8 +1,14 @@
1 1  (% class="lead" %)
2 -Les textes ont tous été catégorisés (étiquetés en partie de discours, ou POS). Cela signifie que chaque mot a reçu une étiquette grammaticale.
2 +L'ensemble des textes ont été catégorisés (étiquetés en partie de discours, ou POS). Cela signifie que chaque mot a reçu une étiquette grammaticale.
3 3  
4 -**Voici la liste des codes grammaticaux utilisés pour cet étiquetage :**
4 +Pour les textes postérieurs à 1850, le jeu d’étiquettes proposés par Crabbé et Candito{{footnote}}Benoît Crabbé and Marie Candito. Expériences d’analyse syntaxique statistique du français. In //5ème conférence sur le Traitement Automatique des Langues Naturelles - TALN’08//, pages pp. 44–54, Avignon, France, June 2008.{{/footnote}} a été utilisé, et modifié à la marge{{footnote}}Ulrike Fleury, Lolita Bérard et Christophe Benzitoun. Campagne de catégorisation des textes post 1850 de la base Frantext, 2016.{{/footnote}}.
5 5  
6 +* Une étiquette **X** a été ajoutée, pour les cas les plus problématiques.
7 +* Sept étiquettes ont été supprimées. Il s’agit d’étiquettes qui étaient associées à peu de formes et d’étiquettes davantage bénéfiques pour l’analyse syntaxique que pour la seule catégorisation.
8 +* Les étiquettes spécifiques aux clitiques sujets (//je, tu, il, elle, on, ça, nous, vous, ils, elles//) et objets (//le, la, les, lui, leur, y, en//) ont été conservées. Elles rendent compte d’un emploi particulier des pronoms personnels en tant que sujet ou objet de verbes.
9 +
10 +Voici la liste des codes grammaticaux utilisés pour cet étiquetage.
11 +
6 6  (% class="doOddEven sortable table-bordered table-condensed table-striped" id="tableid" %)
7 7  (% class="sortHeader" %)|=(% style="background-color:#EEE;" %)CODE|=(% style="background-color:#EEE;" %)Notion grammaticale
8 8  |{{code}}ADJ{{/code}}|adjectif
... ... @@ -28,21 +28,4 @@
28 28  |{{code}}VPR{{/code}}|verbe participe présent
29 29  |{{code}}X{{/code}}|mot non traité
30 30  
31 -**Des étiquettes spécifiques aux textes médiévaux ont été ajoutées à Frantext en janvier 2019 :**
32 -
33 -(% class="doOddEven sortable table-bordered table-condensed table-striped" id="tableid" %)
34 -(% class="sortHeader" %)|=(% style="background-color:#EEE;" %)CODE|=(% style="background-color:#EEE;" %)Notion grammaticale
35 -|{{code}}ADV+CLO{{/code}}|adverbe + clitique objet
36 -|{{code}}ADV+DET{{/code}}|adverbe + déterminant
37 -|{{code}}CLS+CLO{{/code}}|clitique sujet + clitique objet
38 -|{{code}}CLS+V{{/code}}|clitique sujet + verbe
39 -|{{code}}CS+CLO{{/code}}|conjonction de subordination + clitique objet
40 -|{{code}}CS+CLS{{/code}}|conjonction de subordination + clitique sujet
41 -|{{code}}V+CLS{{/code}}|verbe + clitique sujet
42 -
43 -(% class="box infomessage" %)
44 -(((
45 -Du fait de la complexité du processus d'étiquetage pour certain textes, il est possible que d'autres combinaisons soient disponibles - notamment dans la recherche assistée pour les versions 1.2.x de l'application en ligne. Ces combinaisons vont disparaitre lors des mises à jour successives du corpus.
46 -)))
47 -
48 ->Pour aller plus loin, consultez la documentation dédiée aux [[jeux d'étiquettes>>doc:Main.Manuel d'utilisation.Expressions.Les codes grammaticaux.Correspondance des codes grammaticaux.WebHome]].
37 +{{putFootnotes/}}
Frantext - ATILF (CNRS/UL) - 2018-2025

Logo CNRS   Logo ATILF   Logo Université de Lorraine