Depuis la version < 15.1 >
modifié par Gilles Toubiana
sur 2018/05/28 11:03
À la version < 17.6 >
modifié par Gilles Toubiana
sur 2018/06/13 14:41
< >
Commentaire de modification : Le tag [v1.0.0] a été ajouté

Résumé

Détails

insert_drive_file Propriétés de la Page
Parent
... ... @@ -1,1 +1,1 @@
1 -xwiki:Main.Les expressions Frantext.Correspondances entre les versions.WebHome
1 +xwiki:Main.Les expressions de séquence.Correspondance des versions.WebHome
Tags
... ... @@ -1,0 +1,1 @@
1 +v1.0.0
Contenu
... ... @@ -1,12 +1,6 @@
1 1  (% class="lead" %)
2 2  L'ensemble des textes ont été catégorisés (étiquetés en partie de discours, ou POS). Cela signifie que chaque mot a reçu une étiquette grammaticale.
3 3  
4 -Pour les textes postérieurs à 1850, le jeu d’étiquettes proposés par Crabbé et Candito{{footnote}}Benoît Crabbé and Marie Candito. Expériences d’analyse syntaxique statistique du français. In //5ème conférence sur le Traitement Automatique des Langues Naturelles - TALN’08//, pages pp. 44–54, Avignon, France, June 2008.{{/footnote}} a été utilisé, et modifié à la marge{{footnote}}Ulrike Fleury, Lolita Bérard et Christophe Benzitoun. Campagne de catégorisation des textes post 1850 de la base Frantext, 2016.{{/footnote}}.
5 -
6 -* Une étiquette {{code}}X{{/code}} a été ajoutée, pour les cas les plus problématiques.
7 -* Sept étiquettes ont été supprimées. Il s’agit d’étiquettes qui étaient associées à peu de formes et d’étiquettes davantage bénéfiques pour l’analyse syntaxique que pour la seule catégorisation.
8 -* Les étiquettes spécifiques aux clitiques sujets (//je, tu, il, elle, on, ça, nous, vous, ils, elles//) et objets (//le, la, les, lui, leur, y, en//) ont été conservées. Elles rendent compte d’un emploi particulier des pronoms personnels en tant que sujet ou objet de verbes.
9 -
10 10  **Voici la liste des codes grammaticaux utilisés pour cet étiquetage :**
11 11  
12 12  (% class="doOddEven sortable table-bordered table-condensed table-striped" id="tableid" %)
... ... @@ -34,4 +34,4 @@
34 34  |{{code}}VPR{{/code}}|verbe participe présent
35 35  |{{code}}X{{/code}}|mot non traité
36 36  
37 -{{putFootnotes/}}
31 +> Pour aller plus loin, consultez la documentation dédiée aux [[jeux d'étiquettes>>doc:.Correspondance des codes grammaticaux.WebHome]] dans Frantext 2.
Frantext - ATILF (CNRS/UL) - 2018-2025

Logo CNRS   Logo ATILF   Logo Université de Lorraine