Frantext est une base de données comportant 5350 références, soit 251 millions de mots, développée à l’ATILF (Analyse et Traitement Informatique de la Langue Française) et mise en ligne depuis 1998.

Sa particularité est de coupler un corpus échantillonné du IXe au XXIe siècle et un outil de recherche performant. Frantext contient entre autres une importante proportion de textes modernes et contemporains. Frantext permet de faire des recherches simples et complexes sur des formes, des lemmes ou des catégories grammaticales et d’afficher les résultats dans un contexte de 700 signes.

En 2018, Frantext a fait peau neuve : nouvelle interface, nouvelles fonctionnalités, incluant l’usage des expressions régulières et CQL, un corpus enrichi, lemmatisé et désormais entièrement catégorisé. On y retrouve les fonctionnalités de la version précédente, mais aussi de nouveaux outils de recherche et de visualisation. 

Note sur la documentation :

Il peut y avoir des différences entre les fonctionnalités décrites dans cette documentation et celles de Frantext, dans ce cas vous pouvez comparer les numéros de version :

  • celui en vigueur lors de la rédaction de la documentation se trouve en bas à gauche des pages, dans la section Tags
  • celui de la base Frantext se trouve en bas à droite de sa page d'accueil.

Principales fonctionnalités

Corpus

Un corpus de travail est l’ensemble de texte prédéfinis sur lesquels vont porter vos recherches. Dans cette section vous pouvez charger, créer, visualiser et éditer vos corpus de travail.

Des corpus ont été prédéfinis : le corpus « intégral » contient, par exemple, l'ensemble des textes de la base. Il est possible de dupliquer un corpus prédéfini mais pas de le modifier. Les corpus prédéfinis sont communs à l'ensemble des utilisateurs.

Mais vous pouvez aussi créer vos propres corpus de travail en utilisant divers paramètres : auteurs, date, genre littéraire. Ces corpus sont personnels et sont stockés dans votre navigateur.

Vous trouverez également les statistiques du corpus de travail : le corpus de travail correspond au corpus actuellement chargé et utilisé lors de vos recherches.

Le nombre de textes du corpus de travail est toujours affiché  dans la barre de navigation en haut à droite. Sa composition peut être modifiée à tout moment depuis cet endroit.

Recherche

Dans cette section vous pouvez effectuer différents types de recherches.

La recherche simple vous permet de rechercher rapidement dans les textes du corpus de travail un mot ou une suite de mots.

La recherche assistée vous permet de faire des recherches complexes de manière simplifiée en utilisant des menus déroulants et en combinant diverses informations (par exemple forme + lemme)

La recherche avancée vous permet de faire vos recherches en utilisant directement le langage CQL.

L'onglet fréquences vous permet de calculer la fréquence d'un mot ou d'une expression régulière au sein de votre corpus.

L'onglet co-occurrences vous permet de rechercher l'apparition simultanée de deux ou trois séquences (mot(s), expression régulière, liste de mots ou encore grammaire) et de visualiser leurs contextes gauche et droit.

L'onglet voisinage vous permet d'étudier le voisinage d'un mot, d'une expression régulière, d'une liste de mots ou encore d'une grammaire.

Liste de mots

Dans cette section vous pouvez créer, éditer et visualiser des listes de mots.

Les listes de mots peuvent contenir des mots simples ou des suites de mots mais également être générées en utilisant des expressions régulières ou encore des expressions CQL. Vos listes sont personnelles et sont stockées dans votre navigateur.

Des listes de mots ont été prédéfinies à titre d'exemples. Il est possible de dupliquer une liste prédéfinie mais pas de la modifier. Les listes prédéfinies sont communes à l'ensemble des utilisateurs.

Les listes de mots sont ensuite réutilisables pour effectuer notamment des recherches ou des études de voisinage.

Grammaires

On entend par « grammaire » une série de recherches combinées.

Les grammaires sont utiles pour réaliser des recherches avancées et sont définies à l'aide d'un langage propre à la plate-forme. Les grammaires peuvent contenir des listes et des règles. Les règles de grammaire sont des sous-ensembles que l’on peut combiner entre eux en utilisant des liens logiques.

Dans cette section vous pouvez créer, éditer et visualiser des grammaires.

Des grammaires ont été prédéfinies à titre d'exemples. Il est possible de dupliquer une grammaire prédéfinie mais pas de la modifier. Les grammaires prédéfinies sont communes à l'ensemble des utilisateurs.

Les grammaires que vous créez pour vos recherches sont personnelles et sont stockées dans votre navigateur.

Les grammaires sont ensuite utilisables pour effectuer notamment des recherches ou des études de voisinage.

Tags: v1.0.0
Créé par Etienne Petitjean le 2009/09/09 02:00
Traduit en fr par Etienne Petitjean le 2009/09/09 02:00
    

Liens externes

Documentation Frantext
ATILF - 2018