Depuis la version < 12.1 >
modifié par Gilles Toubiana
sur 2018/05/25 16:53
À la version < 11.1 >
modifié par Gilles Toubiana
sur 2018/05/25 16:48
< >
Commentaire de modification : Il n'y a aucun commentaire pour cette version

Résumé

Détails

insert_drive_file Propriétés de la Page
Contenu
... ... @@ -1,7 +1,7 @@
1 1  (% class="lead" %)
2 2  L'ensemble des textes ont été catégorisés (étiquetés en partie de discours, ou POS). Cela signifie que chaque mot a reçu une étiquette grammaticale.
3 3  
4 -Pour les textes postérieurs à 1850, le jeu d’étiquettes proposés par Crabbé et Candito{{footnote}}Benoît Crabbé and Marie Candito. Expériences d’analyse syntaxique statistique du français. In //5ème conférence sur le Traitement Automatique des Langues Naturelles - TALN’08//, pages pp. 44–54, Avignon, France, June 2008.{{/footnote}} a été utilisé, et modifié à la marge{{footnote}}Ulrike Fleury, Lolita Bérard et Christophe Benzitoun. Campagne de catégorisation des textes post 1850 de la base Frantext, 2016.{{/footnote}}.
4 +Pour les textes postérieurs à 1850, le jeu d’étiquettes proposés par Crabbé et Candito{{footnote}}Benoît Crabbé and Marie Candito. Expériences d’analyse syntaxique statistique du français. In //5ème conférence sur le Traitement Automatique des Langues Naturelles - TALN’08//, pages pp. 44–54, Avignon, France, June 2008.{{/footnote}} a été utilisé, et modifié à la marge.
5 5  
6 6  * Une étiquette **X** a été ajoutée, pour les cas les plus problématiques.
7 7  * Sept étiquettes ont été supprimées. Il s’agit d’étiquettes qui étaient associées à peu de formes et d’étiquettes davantage bénéfiques pour l’analyse syntaxique que pour la seule catégorisation.
Frantext - ATILF (CNRS/UL) - 2018-2025

Logo CNRS   Logo ATILF   Logo Université de Lorraine