Modifications du document Les catégories grammaticales
modifié par Gilles Toubiana
sur 2018/05/25 16:42
sur 2018/05/25 16:42
modifié par Gilles Toubiana
sur 2018/05/28 11:03
sur 2018/05/28 11:03
Commentaire de modification : Il n'y a aucun commentaire pour cette version
Résumé
-
Propriétés de la Page (1 modifications, 0 ajouts, 0 suppressions)
Détails
- Propriétés de la Page
-
- Contenu
-
... ... @@ -1,6 +1,14 @@ 1 1 (% class="lead" %) 2 -L'ensemble des textes ont été catégorisés (étiquetés en partie de discours, ou POS). Cela signifie que chaque mot a reçu une étiquette grammaticale. Voici la liste des codes grammaticaux utilisés pour cet étiquetage.2 +L'ensemble des textes ont été catégorisés (étiquetés en partie de discours, ou POS). Cela signifie que chaque mot a reçu une étiquette grammaticale. 3 3 4 +Pour les textes postérieurs à 1850, le jeu d’étiquettes proposés par Crabbé et Candito{{footnote}}Benoît Crabbé and Marie Candito. Expériences d’analyse syntaxique statistique du français. In //5ème conférence sur le Traitement Automatique des Langues Naturelles - TALN’08//, pages pp. 44–54, Avignon, France, June 2008.{{/footnote}} a été utilisé, et modifié à la marge{{footnote}}Ulrike Fleury, Lolita Bérard et Christophe Benzitoun. Campagne de catégorisation des textes post 1850 de la base Frantext, 2016.{{/footnote}}. 5 + 6 +* Une étiquette {{code}}X{{/code}} a été ajoutée, pour les cas les plus problématiques. 7 +* Sept étiquettes ont été supprimées. Il s’agit d’étiquettes qui étaient associées à peu de formes et d’étiquettes davantage bénéfiques pour l’analyse syntaxique que pour la seule catégorisation. 8 +* Les étiquettes spécifiques aux clitiques sujets (//je, tu, il, elle, on, ça, nous, vous, ils, elles//) et objets (//le, la, les, lui, leur, y, en//) ont été conservées. Elles rendent compte d’un emploi particulier des pronoms personnels en tant que sujet ou objet de verbes. 9 + 10 +**Voici la liste des codes grammaticaux utilisés pour cet étiquetage :** 11 + 4 4 (% class="doOddEven sortable table-bordered table-condensed table-striped" id="tableid" %) 5 5 (% class="sortHeader" %)|=(% style="background-color:#EEE;" %)CODE|=(% style="background-color:#EEE;" %)Notion grammaticale 6 6 |{{code}}ADJ{{/code}}|adjectif ... ... @@ -26,10 +26,4 @@ 26 26 |{{code}}VPR{{/code}}|verbe participe présent 27 27 |{{code}}X{{/code}}|mot non traité 28 28 29 -Pour les textes postérieurs à 1850, le jeu d’étiquettes proposés par Crabbé et Candito{{footnote}}Benoît Crabbé and Marie Candito. Expériences d’analyse syntaxique statistique du français. In 5ème conférence sur le Traitement Automatique des Langues Naturelles - TALN’08, pages pp. 44–54, Avignon, France, June 2008.{{/footnote}} a été utilisé, et modifié à la marge. 30 - 31 -* Une étiquette **X** a été ajoutée, pour les cas les plus problématiques. 32 -* Sept étiquettes ont été supprimées. Il s’agit d’étiquettes qui étaient associées à peu de formes et d’étiquettes davantage bénéfiques pour l’analyse syntaxique que pour la seule catégorisation. 33 -* Les étiquettes spécifiques aux clitiques sujets (//je, tu, il, elle, on, ça, nous, vous, ils, elles//) et objets (//le, la, les, lui, leur, y, en//) ont été conservées. Elles rendent compte d’un emploi particulier des pronoms personnels en tant que sujet ou objet de verbes. 34 - 35 35 {{putFootnotes/}}