Guide de l'utilisateur


Frantext est une base de données comportant plus de 5000 références et 250 millions de mots, développée à l’ATILF (Analyse et Traitement Informatique de la Langue Française) et mise en ligne depuis 1998.


Frantext a la particularité de proposer un large corpus échantillonné du IXe au XXIe siècle, contenant entre autres une importante proportion de textes modernes et contemporains. Il permet d'effectuer des recherches complexes sur des formes graphiques, des lemmes et des catégories grammaticales grâce à l'utilisation d'expressions régulières et d'expressions CQL. Les résultats sont affichés dans un contexte de 700 signes.


Corpus

Un corpus de travail est l’ensemble de texte prédéfinis sur lesquels vont porter vos recherches. Dans cette section vous pouvez charger, créer, visualiser et éditer vos corpus de travail.

Des corpus ont été prédéfinis : le corpus « intégral » contient, par exemple, l'ensemble des textes de la base. Il est possible de dupliquer un corpus prédéfini mais pas de le modifier. Les corpus prédéfinis sont communs à l'ensemble des utilisateurs.

Mais vous pouvez aussi créer vos propres corpus de travail en utilisant divers paramètres : auteurs, date, genre littéraire. Ces corpus sont personnels et sont stockés dans votre navigateur.

Vous trouverez également les statistiques du corpus de travail : le corpus de travail correspond au corpus actuellement chargé et utilisé lors de vos recherches.

Le nombre de textes du corpus de travail est toujours affiché  dans la barre de navigation en haut à droite. Sa composition peut être modifiée à tout moment depuis cet endroit.

Recherche

Dans cette section vous pouvez effectuer différents types de recherches.

La recherche simple vous permet de rechercher rapidement dans les textes du corpus de travail un mot ou une suite de mots.

La recherche assistée vous permet de faire des recherches complexes de manière simplifiée en utilisant des menus déroulants et en combinant diverses informations (par exemple forme + lemme)

La recherche avancée vous permet de faire vos recherches en utilisant directement le langage CQL.

L'onglet fréquences vous permet de calculer la fréquence d'un mot ou d'une expression régulière au sein de votre corpus.

L'onglet co-occurrences vous permet de rechercher l'apparition simultanée de deux ou trois séquences (mot(s), expression régulière, liste de mots ou encore grammaire) et de visualiser leurs contextes gauche et droit.

L'onglet voisinage vous permet d'étudier le voisinage d'un mot, d'une expression régulière, d'une liste de mots ou encore d'une grammaire.

Liste de mots

Dans cette section vous pouvez créer, éditer et visualiser des listes de mots.

Les listes de mots peuvent contenir des mots simples ou des suites de mots mais également être générées en utilisant des expressions régulières ou encore des expressions CQL. Vos listes sont personnelles et sont stockées dans votre navigateur.

Des listes de mots ont été prédéfinies à titre d'exemples. Il est possible de dupliquer une liste prédéfinie mais pas de la modifier. Les listes prédéfinies sont communes à l'ensemble des utilisateurs.

Les listes de mots sont ensuite réutilisables pour effectuer notamment des recherches ou des études de voisinage. 

Grammaires

On entend par « grammaire » une série de recherches combinées.

Les grammaires sont utiles pour réaliser des recherches avancées et sont définies à l'aide d'un langage propre à la plate-forme. Les grammaires peuvent contenir des listes et des règles. Les règles de grammaire sont des sous-ensembles que l’on peut combiner entre eux en utilisant des liens logiques.

Dans cette section vous pouvez créer, éditer et visualiser des grammaires.

Des grammaires ont été prédéfinies à titre d'exemples. Il est possible de dupliquer une grammaire prédéfinie mais pas de la modifier. Les grammaires prédéfinies sont communes à l'ensemble des utilisateurs.

Les grammaires que vous créez pour vos recherches sont personnelles et sont stockées dans votre navigateur.

Les grammaires sont ensuite utilisables pour effectuer notamment des recherches ou des études de voisinage.

Navigation par mot-clés

  1. 2023-2024
  2. abonnement
  3. Abonnements
  4. actions
  5. actualités
  6. administration
  7. agrégation
  8. Agrégation 2025
  9. Alt
  10. Alt Gr
  11. ambiguïté
  12. ana
  13. ancien frantext
  14. août 2021
  15. ascendant
  16. assistée
  17. avancée
  18. bibliographie
  19. calculer
  20. caractères
  21. catégories
  22. catégories grammaticales
  23. chronologique
  24. citation
  25. citer
  26. clavier
  27. co-occurrences
  28. codes
  29. codes grammaticaux
  30. collaborateurs
  31. combinaison
  32. comparaison
  33. comparatif
  34. cookies
  35. corpus prédéfini
  36. CQL
  37. créer
  38. csv
  39. date
  40. diachronie
  41. DMF
  42. document
  43. domaine public
  44. droits
  45. dupliquer
  46. décembre 2019
  47. Décembre 2022
  48. Décembre 2023
  49. démo
  50. démonstration
  51. développement informatique
  52. English
  53. ENT
  54. erreur
  55. Espace
  56. Excel
  57. exemple
  58. expression
  59. expression CQL
  60. expressions
  61. expressions CQL
  62. expressions de séquences
  63. expressions régulières
  64. faq
  65. flexions
  66. forme composée
  67. formes
  68. Frantext
  69. Frantext 19.1
  70. Frantext 19.2
  71. Frantext 19.3
  72. Frantext 20.1
  73. Frantext 21.1
  74. Frantext 21.2
  75. Frantext 22.1
  76. Frantext 22.2
  77. Frantext 22.3
  78. Frantext 22.4
  79. Frantext 23.1
  80. Frantext 23.2
  81. Frantext 24.1
  82. Frantext 25.1
  83. frantext catégorisé
  84. frantext intégral
  85. Frantext Janvier 2019
  86. fréquence
  87. fréquences
  88. grammaire prédéfinie
  89. hal
  90. historique
  91. indésirables
  92. information générale
  93. inscription
  94. interface
  95. IP
  96. janvier 2019
  97. janvier 2022
  98. Janvier 2025
  99. juin 2019
  100. juin 2022
  101. Juin 2023
  102. Juin 2024
  103. KWIC
  104. langue
  105. lemmatisation
  106. lexique
  107. LGeRM
  108. logo
  109. macintosh
  110. maintien
  111. manuel
  112. mars 2021
  113. Morphalou
  114. mot
  115. mots
  116. octobre 2020
  117. ouvrages
  118. paramètres
  119. paramètres utilisateur
  120. parties du discours
  121. pos
  122. Prices
  123. proxy
  124. prédéfinie
  125. période
  126. questions fréquentes
  127. recherche assistée
  128. recherche simple
  129. recherches
  130. requête
  131. requête avancée
  132. responsable
  133. règle
  134. rédiger
  135. référence
  136. score
  137. segmentation
  138. septembre 2019
  139. Septembre 2022
  140. serveur
  141. Shift
  142. simple
  143. spam
  144. Subscriptions
  145. syntaxe
  146. séquence
  147. TAL
  148. Talismane
  149. Tarifs
  150. temporel
  151. temps
  152. textes
  153. theses
  154. tokenisation
  155. touches
  156. traitement des textes
  157. tri
  158. trier
  159. tutoriel
  160. téléchargement
  161. télécharger
  162. utiliser
  163. v1.2.10
  164. v1.2.18
  165. v1.2.19
  166. v1.2.21
  167. v1.2.22
  168. v1.2.23
  169. v1.2.29
  170. v1.2.30
  171. v1.2.6
  172. v1.2.x
  173. v1.3.10
  174. v1.3.11
  175. variantes
  176. version
  177. versions
  178. vidéos
  179. voisinage
  180. windows
  181. youtube
  182. éditer
  183. équipe
  184. étiquetage
  185. étiquette morphosyntaxique
  186. étiquettes
Tags :
Modifié par Gilles Toubiana le 2018/10/02 17:11
Frantext - ATILF (CNRS/UL) - 2018-2025

Logo CNRS   Logo ATILF   Logo Université de Lorraine