Depuis la version < 4.2 >
modifié par Gilles Toubiana
sur 2018/05/25 16:37
À la version < 11.1 >
modifié par Gilles Toubiana
sur 2018/05/25 16:48
< >
Commentaire de modification : Il n'y a aucun commentaire pour cette version

Résumé

Détails

insert_drive_file Propriétés de la Page
Contenu
... ... @@ -1,6 +1,14 @@
1 1  (% class="lead" %)
2 -L'ensemble des textes ont été catégorisés (étiquetés en partie de discours, ou POS). Cela signifie que chaque mot a reçu une étiquette grammaticale. Voici la liste des codes grammaticaux utilisés pour cet étiquetage.
2 +L'ensemble des textes ont été catégorisés (étiquetés en partie de discours, ou POS). Cela signifie que chaque mot a reçu une étiquette grammaticale.
3 3  
4 +Pour les textes postérieurs à 1850, le jeu d’étiquettes proposés par Crabbé et Candito{{footnote}}Benoît Crabbé and Marie Candito. Expériences d’analyse syntaxique statistique du français. In //5ème conférence sur le Traitement Automatique des Langues Naturelles - TALN’08//, pages pp. 44–54, Avignon, France, June 2008.{{/footnote}} a été utilisé, et modifié à la marge.
5 +
6 +* Une étiquette **X** a été ajoutée, pour les cas les plus problématiques.
7 +* Sept étiquettes ont été supprimées. Il s’agit d’étiquettes qui étaient associées à peu de formes et d’étiquettes davantage bénéfiques pour l’analyse syntaxique que pour la seule catégorisation.
8 +* Les étiquettes spécifiques aux clitiques sujets (//je, tu, il, elle, on, ça, nous, vous, ils, elles//) et objets (//le, la, les, lui, leur, y, en//) ont été conservées. Elles rendent compte d’un emploi particulier des pronoms personnels en tant que sujet ou objet de verbes.
9 +
10 +Voici la liste des codes grammaticaux utilisés pour cet étiquetage.
11 +
4 4  (% class="doOddEven sortable table-bordered table-condensed table-striped" id="tableid" %)
5 5  (% class="sortHeader" %)|=(% style="background-color:#EEE;" %)CODE|=(% style="background-color:#EEE;" %)Notion grammaticale
6 6  |{{code}}ADJ{{/code}}|adjectif
... ... @@ -26,10 +26,4 @@
26 26  |{{code}}VPR{{/code}}|verbe participe présent
27 27  |{{code}}X{{/code}}|mot non traité
28 28  
29 -Pour les textes postérieurs à 1850, le jeu d’étiquettes proposés par Crabbé et Candito* a été utilisé, et modifié à la marge.
30 -
31 -* Une étiquette X a été ajoutée, pour les cas les plus problématiques.
32 -* Sept étiquettes ont été supprimées. Il s’agit d’étiquettes qui étaient associées à peu de formes et d’étiquettes davantage bénéfiques pour l’analyse syntaxique que pour la seule catégorisation.
33 -* Les étiquettes spécifiques aux clitiques sujets (je, tu, il, elle, on, ça, nous, vous, ils, elles) et objets (le, la, les, lui, leur, y, en) ont été conservées. Elles rendent compte d’un emploi particulier des pronoms personnels en tant que sujet ou objet de verbes.
34 -
35 -(% class="small" %)* Benoît Crabbé and Marie Candito. Expériences d’analyse syntaxique statistique du français. In 5ème conférence sur le Traitement Automatique des Langues Naturelles - TALN’08, pages pp. 44–54, Avignon, France, June 2008.
37 +{{putFootnotes/}}
Frantext - ATILF (CNRS/UL) - 2018-2025

Logo CNRS   Logo ATILF   Logo Université de Lorraine