Depuis la version 1.1 >
modifié par Gilles Toubiana
sur 2018/04/03 14:32
À la version < 6.1 >
modifié par Gilles Toubiana
sur 2018/05/25 16:39
>
Commentaire de modification : Il n'y a aucun commentaire pour cette version

Résumé

Détails

insert_drive_file Propriétés de la Page
Titre
... ... @@ -1,1 +1,1 @@
1 -Les codes grammaticaux
1 +Les catégories grammaticales
Parent
... ... @@ -1,1 +1,1 @@
1 -Main.Correspondances entre les versions.WebHome
1 +xwiki:Main.Les expressions Frantext.Correspondances entre les versions.WebHome
Contenu
... ... @@ -1,8 +2,7 @@
1 -
2 2  (% class="lead" %)
3 3  L'ensemble des textes ont été catégorisés (étiquetés en partie de discours, ou POS). Cela signifie que chaque mot a reçu une étiquette grammaticale. Voici la liste des codes grammaticaux utilisés pour cet étiquetage.
4 4  
5 -(% id="tableid" class="doOddEven sortable table-bordered table-condensed table-striped" %)
4 +(% class="doOddEven sortable table-bordered table-condensed table-striped" id="tableid" %)
6 6  (% class="sortHeader" %)|=(% style="background-color:#EEE;" %)CODE|=(% style="background-color:#EEE;" %)Notion grammaticale
7 7  |{{code}}ADJ{{/code}}|adjectif
8 8  |{{code}}ADV{{/code}}|adverbe
... ... @@ -26,3 +26,11 @@
26 26  |{{code}}VPP{{/code}}|verbe participe passé
27 27  |{{code}}VPR{{/code}}|verbe participe présent
28 28  |{{code}}X{{/code}}|mot non traité
28 +
29 +Pour les textes postérieurs à 1850, le jeu d’étiquettes proposés par Crabbé et Candito* a été utilisé, et modifié à la marge.
30 +
31 +* Une étiquette **X** a été ajoutée, pour les cas les plus problématiques.
32 +* Sept étiquettes ont été supprimées. Il s’agit d’étiquettes qui étaient associées à peu de formes et d’étiquettes davantage bénéfiques pour l’analyse syntaxique que pour la seule catégorisation.
33 +* Les étiquettes spécifiques aux clitiques sujets (//je, tu, il, elle, on, ça, nous, vous, ils, elles//) et objets (//le, la, les, lui, leur, y, en//) ont été conservées. Elles rendent compte d’un emploi particulier des pronoms personnels en tant que sujet ou objet de verbes.
34 +
35 +(% class="small" %)* Benoît Crabbé and Marie Candito. Expériences d’analyse syntaxique statistique du français. In //5ème conférence sur le Traitement Automatique des Langues Naturelles - TALN’08//, pages pp. 44–54, Avignon, France, June 2008.
Frantext - ATILF (CNRS/UL) - 2018-2025

Logo CNRS   Logo ATILF   Logo Université de Lorraine