Frantext est une base de données comportant 5350 références, soit 251 millions de mots, développée à l’ATILF (Analyse et Traitement Informatique de la Langue Française) et mise en ligne depuis 1998.

Sa particularité est de coupler un corpus échantillonné du IXe au XXIe siècle et un outil de recherche performant. Frantext contient entre autres une importante proportion de textes modernes et contemporains. Frantext permet de faire des recherches simples et complexes sur des formes, des lemmes ou des catégories grammaticales et d’afficher les résultats dans un contexte de 700 signes.

En 2018, Frantext a fait peau neuve : nouvelle interface, nouvelles fonctionnalités, incluant l’usage des expressions régulières et CQL, un corpus enrichi, lemmatisé et désormais entièrement catégorisé. On y retrouve les fonctionnalités de la version précédente, mais aussi de nouveaux outils de recherche et de visualisation. 

Note sur la documentation :

Il peut y avoir des différences entre les fonctionnalités décrites dans cette documentation et celles de Frantext, dans ce cas vous pouvez comparer les numéros de version :

  • celui en vigueur lors de la rédaction de la documentation se trouve en bas à gauche des pages, dans la section Tags
  • celui de la base Frantext se trouve en bas à droite de sa page d'accueil.

Principales fonctionnalités

Corpus

Un corpus de travail est l’ensemble de texte prédéfinis sur lesquels vont porter vos recherches. Dans cette section vous pouvez charger, créer, visualiser et éditer vos corpus de travail.

Des corpus ont été prédéfinis : le corpus « intégral » contient, par exemple, l'ensemble des textes de la base. Il est possible de dupliquer un corpus prédéfini mais pas de le modifier. Les corpus prédéfinis sont communs à l'ensemble des utilisateurs.

Mais vous pouvez aussi créer vos propres corpus de travail en utilisant divers paramètres : auteurs, date, genre littéraire. Ces corpus sont personnels et sont stockés dans votre navigateur.

Vous trouverez également les statistiques du corpus de travail : le corpus de travail correspond au corpus actuellement chargé et utilisé lors de vos recherches.

Le nombre de textes du corpus de travail est toujours affiché  dans la barre de navigation en haut à droite. Sa composition peut être modifiée à tout moment depuis cet endroit.

Recherche

Dans cette section vous pouvez effectuer différents types de recherches.

La recherche simple vous permet de rechercher rapidement dans les textes du corpus de travail un mot ou une suite de mots.

La recherche assistée vous permet de faire des recherches complexes de manière simplifiée en utilisant des menus déroulants et en combinant diverses informations (par exemple forme + lemme)

La recherche avancée vous permet de faire vos recherches en utilisant directement le langage CQL.

L'onglet fréquences vous permet de calculer la fréquence d'un mot ou d'une expression régulière au sein de votre corpus.

L'onglet co-occurrences vous permet de rechercher l'apparition simultanée de deux ou trois séquences (mot(s), expression régulière, liste de mots ou encore grammaire) et de visualiser leurs contextes gauche et droit.

L'onglet voisinage vous permet d'étudier le voisinage d'un mot, d'une expression régulière, d'une liste de mots ou encore d'une grammaire.

Liste de mots

Dans cette section vous pouvez créer, éditer et visualiser des listes de mots.

Les listes de mots peuvent contenir des mots simples ou des suites de mots mais également être générées en utilisant des expressions régulières ou encore des expressions CQL. Vos listes sont personnelles et sont stockées dans votre navigateur.

Des listes de mots ont été prédéfinies à titre d'exemples. Il est possible de dupliquer une liste prédéfinie mais pas de la modifier. Les listes prédéfinies sont communes à l'ensemble des utilisateurs.

Les listes de mots sont ensuite réutilisables pour effectuer notamment des recherches ou des études de voisinage.

Grammaires

On entend par « grammaire » une série de recherches combinées.

Les grammaires sont utiles pour réaliser des recherches avancées et sont définies à l'aide d'un langage propre à la plate-forme. Les grammaires peuvent contenir des listes et des règles. Les règles de grammaire sont des sous-ensembles que l’on peut combiner entre eux en utilisant des liens logiques.

Dans cette section vous pouvez créer, éditer et visualiser des grammaires.

Des grammaires ont été prédéfinies à titre d'exemples. Il est possible de dupliquer une grammaire prédéfinie mais pas de la modifier. Les grammaires prédéfinies sont communes à l'ensemble des utilisateurs.

Les grammaires que vous créez pour vos recherches sont personnelles et sont stockées dans votre navigateur.

Les grammaires sont ensuite utilisables pour effectuer notamment des recherches ou des études de voisinage.

Navigation par mot-clés

  1. Abonnements
  2. accès
  3. Alt
  4. Alt Gr
  5. ambiguïté
  6. ascendant
  7. assistée
  8. avancée
  9. calculer
  10. caractères
  11. chronologique
  12. clavier
  13. co-occurrences
  14. codes
  15. combinaison
  16. Concordancier
  17. corpus prédéfini
  18. CQL
  19. CSV
  20. date
  21. document
  22. domaine public
  23. droits
  24. dupliquer
  25. English
  26. ENT
  27. Espace
  28. Excel
  29. Exporter
  30. expression
  31. FAQ
  32. forme composée
  33. Frantext
  34. fréquence
  35. fréquences
  36. grammaire
  37. grammaire prédéfinie
  38. hal
  39. interface
  40. IP
  41. liste de mots
  42. macintosh
  43. mot
  44. ouvrages
  45. Prices
  46. proxy
  47. prédéfinie
  48. publications
  49. recherche assistée
  50. recherche avancée
  51. recherche simple
  52. requête
  53. règle
  54. rédiger
  55. segmentation
  56. Shift
  57. simple
  58. Subscriptions
  59. Tarifs
  60. textes
  61. theses
  62. tokenisation
  63. touches
  64. tri
  65. trier
  66. télécharger
  67. utiliser
  68. v1.0.0
  69. v1.1.0
  70. v1.2.10
  71. vidéos
  72. voisinage
  73. windows
  74. youtube
  75. étiquetage

 

Tags : v1.0.0
Créé par Etienne Petitjean le 2009/09/09 02:00
Traduit en fr par Etienne Petitjean le 2009/09/09 02:00
    

Liens externes

Documentation Frantext
ATILF - 2018