Un corpus de travail correspond à l’ensemble de textes sur lesquels vont porter vos recherches. L'ajout de textes dans un corpus s'effectue en sélectionnant les métadonnées de la base textuelle Frantext. Il est ainsi possible de créer un corpus par auteur, date, genre littéraire, etc.

Mes corpus

La page Mes corpus vous permet de créer, éditer et charger des corpus que vous pourrez exploiter à l'aide des outils de recherche de Frantext.

La page Mes corpus se décompose en 2 zones :

  1. la zone supérieure Mes corpus contient vos créations
  2. la zone inférieure Corpus prédéfinis contient des exemples de corpus

Si la page contient uniquement les noms des zones, sans aucun autre contenu visible, cliquez sur le titre de la zone afin d'en afficher le contenu.

Mes corpus (zone)

La zone Mes corpus vous permet de créer vos propres sélections de textes. Vos corpus sont personnels et sont conservés dans votre compte si vous êtes authentifié, ou à défaut dans votre navigateur.

Après avoir cliqué sur le bouton add CRÉER UN CORPUS, saisissez un Nom* de corpus de moins de 30 caractères ainsi qu'une Description (facultative) de moins de 140 caractères. Cliquez sur le bouton CRÉER en bas à droite de la fenêtre courante.

La page Voir le corpus qui s'affiche est alors vide. Cliquez sur le bouton AJOUTER DES TEXTES pour accéder à la page qui vous permettra d'Éditer le corpus.

L'ajout des textes dans un corpus s'effectue en filtrant les métadonnées de la base textuelle Frantext. Pour en savoir plus, consultez la page de documentation consacrée à l'édition d'un corpus.

L'interface d'édition de corpus permet d'afficher et de sélectionner les ouvrages. Ceux-ci ne seront réellement mémorisés dans votre corpus que lorsque vous aurez cliqué sur le bouton save SAUVEGARDER situé en haut à droite de la page. Par sécurité, si vous quittez par inadvertance la page sans avoir enregistré, un message vous demandera de confirmer cette action.

Corpus prédéfinis

Des corpus ont étés prédéfinies à titre d'exemples :

  • Ancien français : corpus des œuvres antérieures à 1300
  • Moyen français : corpus des œuvres de la période du moyen français (1300-1549)
  • Préclassique : corpus des œuvres de la période préclassique (1550-1649)
  • Classique : corpus des œuvres de la période classique (1650-1799)
  • Moderne : corpus des œuvres de la période moderne (1800-1979)
  • Contemporain : corpus des œuvres de la période contemporaine (1980-aujourd'hui)
  • intégral : corpus de tous les documents
  • 20ème siècle : corpus des œuvres du 20ème siècle
  • RL-fr : 1950+ :  Corpus de référence pour le Réseau Lexical du Français (RL-fr) : textes à partir de 1950

Les périodes temporelles correspondent aux dates des ouvrages et non à la date de naissance des auteurs.

Les corpus prédéfinis sont communs à l'ensemble des utilisateurs. En cliquant sur le bouton CHARGER d'un corpus prédéfini, vous rendez ce corpus exploitable par les outils de recherche de Frantext.

Il n'est pas possible de modifier directement un corpus prédéfini, mais vous pouvez le dupliquer. Pour cela, cliquez sur le bouton ACTIONS correspondant, choisissez content_copy Dupliquer, puis dans la nouvelle fenêtre, donnez un Nom* à votre corpus avant de cliquer sur le bouton CRÉER situé en bas à droite. Le nouveau corpus est disponible et vous pouvez alors le modifier en cliquant sur l'onglet Ajouter des textes. N'oubliez pas de l'enregistrer en cliquant sur le bouton save SAUVEGARDER situé en haut à droite de la page.

Utiliser un corpus

Une fois que votre corpus est correctement constitué et enregistré, vous pouvez l'activer en cliquant sur le bouton CHARGER du bloc correspondant dans la page Mes corpus. Vous pouvez alors visualiser le contenu du corpus dans la page Voir le corpus. Si vous retournez sur la page Mes Corpus, vous verrez que le bouton CHARGER est devenu gris et inutilisable tandis qu'une icône orange s'affiche dans la partie supérieure droite de ce même bloc, précisant que le corpus est bien actif.

L'onglet bookCorpus situé dans la partie supérieure droite de l'interface permet également d'activer rapidement votre corpus afin de l'utiliser dans Frantext. Le menu déroulant propose en premier lieu vos corpus personnalisés (MES CORPUS), puis les corpus prédéfinis dans Frantext. Pour activer un corpus, il suffit de cliquer sur l'onglet bookCorpus, puis sur le nom du corpus dans la liste qui s'affiche.

Depuis la partie inférieure droite du bloc correspondant à votre corpus, le bouton ACTIONS permet quant à lui de :

  • add Ajouter des textes
  • edit Éditer le nom et la description du corpus
  • content_copy Dupliquer le corpus
  • get_app Exporter le corpus
  • delete Supprimer le corpus

Voir le corpus

Lorsqu'un corpus est actif, la page Voir le corpus vous permet de chercher dans les métadonnées du corpus. Il est ainsi possible de trier et filtrer les œuvres de différentes manières. Il est même possible de télécharger les œuvres du domaine public au format XML.

Pour en savoir plus sur la manière de filtrer les métadonnées de la base textuelle Frantext, consultez la page de documentation consacrée à l'édition d'un corpus.

Ajouter des textes

Lorsqu'un corpus est en cours de constitution, la page Ajouter des textes vous permet de chercher dans les métadonnées du corpus afin de trier et filtrer les œuvres de différentes manières. Il vous est alors possible de les ajouter au corpus.

Pour en savoir plus sur la manière de filtrer les métadonnées de la base textuelle Frantext, consultez la page de documentation consacrée à l'édition d'un corpus.

Statistiques

La page Statistiques vous permet de visualiser le nombre de textes du corpus actif à l'aide de graphiques correspondants aux métadonnées suivantes :

  • Date : Nombre de textes par périodes temporelles
  • Auteurs : Nombre de textes par auteurs
  • Genres textuels : Nombre de textes par genres textuels
  • Genre social : Nombre de textes par genre social
  • Statut juridique : Nombre de textes par statut juridique

En bas à droite de chaque graphique, vous pouvez spécifier le nombre de résultats à afficher dans la page. Les indicateurs Page suivante navigate_next et Page précédente navigate_before vous permettent ensuite de passer d'une page à l'autre.

Par défaut, la période temporelle utilisée dans le graphique Date est de 100 ans. Vous pouvez modifier cette période à l'aide du menu déroulant situé en bas à gauche du graphique et choisir une période plus courte comme 25, 50 ou 100 ans.

Vous pouvez filtrer les données affichées en cliquant sur des colonnes ou des portions de graphiques. Ainsi, si vous sélectionnez le corpus intégral, et que vous survolez la première ligne du graphique Auteurs, vous trouverez 122 textes de Pierre CORNEILLE. Si vous cliquez sur cette ligne, et que vous consultez le graphique Genres textuels, vous pourrez noter que parmi les 122 textes de CORNEILLE, 55 sont des pièces de théâtre. Et si vous cliquez enfin sur cette nouvelle ligne, et que vous consultez le graphique du Statut juridique, vous trouverez 50 textes du domaine public.

Les filtres qui correspondent à vos sélections de métadonnées s'affichent en haut de la page. Vous pouvez supprimer un filtre en cliquant sur l'icône close correspondante, ou supprimer l'ensemble des filtres en cliquant sur SUPPRIMER LES FILTRES.

Enfin, vous pouvez désactiver l'affichage de certaines données en cliquant sur leur label dans la zone de légende d'un graphique.

Frantext - ATILF (CNRS/UL) - 2018-2024

Logo CNRS   Logo ATILF   Logo Université de Lorraine