Guide de l'utilisateur


 
 

Frantext est une base de données développée à l’ATILF et mise en ligne depuis 1998. Elle comporte plus de 5000 références et 250 millions de mots.

Frantext a la particularité de proposer un large corpus échantillonné du IXe au XXIe siècle, contenant entre autres une importante proportion de textes modernes et contemporains. Il permet d'effectuer des recherches complexes sur des formes graphiques, des lemmes et des catégories grammaticales grâce à l'utilisation d'expressions régulières et d'expressions CQL. Les résultats sont affichés dans un contexte de 700 signes.



Corpus

Un corpus de travail est l’ensemble de texte prédéfinis sur lesquels vont porter vos recherches. Dans cette section vous pouvez charger, créer, visualiser et éditer vos corpus de travail.

Des corpus ont été prédéfinis : le corpus « intégral » contient, par exemple, l'ensemble des textes de la base. Il est possible de dupliquer un corpus prédéfini mais pas de le modifier. Les corpus prédéfinis sont communs à l'ensemble des utilisateurs.

Mais vous pouvez aussi créer vos propres corpus de travail en utilisant divers paramètres : auteurs, date, genre littéraire. Ces corpus sont personnels et sont stockés dans votre navigateur.

Vous trouverez également les statistiques du corpus de travail : le corpus de travail correspond au corpus actuellement chargé et utilisé lors de vos recherches.

Le nombre de textes du corpus de travail est toujours affiché  dans la barre de navigation en haut à droite. Sa composition peut être modifiée à tout moment depuis cet endroit.

Recherche

Dans cette section vous pouvez effectuer différents types de recherches.

La recherche simple vous permet de rechercher rapidement dans les textes du corpus de travail un mot ou une suite de mots.

La recherche assistée vous permet de faire des recherches complexes de manière simplifiée en utilisant des menus déroulants et en combinant diverses informations (par exemple forme + lemme)

La recherche avancée vous permet de faire vos recherches en utilisant directement le langage CQL.

L'onglet fréquences vous permet de calculer la fréquence d'un mot ou d'une expression régulière au sein de votre corpus.

L'onglet co-occurrences vous permet de rechercher l'apparition simultanée de deux ou trois séquences (mot(s), expression régulière, liste de mots ou encore grammaire) et de visualiser leurs contextes gauche et droit.

L'onglet voisinage vous permet d'étudier le voisinage d'un mot, d'une expression régulière, d'une liste de mots ou encore d'une grammaire.

Liste de mots

Dans cette section vous pouvez créer, éditer et visualiser des listes de mots.

Les listes de mots peuvent contenir des mots simples ou des suites de mots mais également être générées en utilisant des expressions régulières ou encore des expressions CQL. Vos listes sont personnelles et sont stockées dans votre navigateur.

Des listes de mots ont été prédéfinies à titre d'exemples. Il est possible de dupliquer une liste prédéfinie mais pas de la modifier. Les listes prédéfinies sont communes à l'ensemble des utilisateurs.

Les listes de mots sont ensuite réutilisables pour effectuer notamment des recherches ou des études de voisinage. 

Grammaires

On entend par « grammaire » une série de recherches combinées.

Les grammaires sont utiles pour réaliser des recherches avancées et sont définies à l'aide d'un langage propre à la plate-forme. Les grammaires peuvent contenir des listes et des règles. Les règles de grammaire sont des sous-ensembles que l’on peut combiner entre eux en utilisant des liens logiques.

Dans cette section vous pouvez créer, éditer et visualiser des grammaires.

Des grammaires ont été prédéfinies à titre d'exemples. Il est possible de dupliquer une grammaire prédéfinie mais pas de la modifier. Les grammaires prédéfinies sont communes à l'ensemble des utilisateurs.

Les grammaires que vous créez pour vos recherches sont personnelles et sont stockées dans votre navigateur.

Les grammaires sont ensuite utilisables pour effectuer notamment des recherches ou des études de voisinage.


Navigation par mot-clés

  1. 2023-2024
  2. abonnement
  3. Abonnements
  4. actions
  5. actualités
  6. administration
  7. agrégation
  8. Agrégation 2024
  9. Alt
  10. Alt Gr
  11. ambiguïté
  12. ana
  13. ancien frantext
  14. août 2021
  15. ascendant
  16. assistée
  17. avancée
  18. bibliographie
  19. calculer
  20. caractères
  21. catégories
  22. catégories grammaticales
  23. chronologique
  24. citation
  25. citer
  26. clavier
  27. co-occurrences
  28. codes
  29. codes grammaticaux
  30. collaborateurs
  31. combinaison
  32. comparaison
  33. comparatif
  34. cookies
  35. corpus prédéfini
  36. CQL
  37. créer
  38. csv
  39. date
  40. diachronie
  41. DMF
  42. document
  43. domaine public
  44. droits
  45. dupliquer
  46. décembre 2019
  47. Décembre 2022
  48. Décembre 2023
  49. démo
  50. démonstration
  51. développement informatique
  52. English
  53. ENT
  54. erreur
  55. Espace
  56. Excel
  57. exemple
  58. expression
  59. expression CQL
  60. expressions
  61. expressions CQL
  62. expressions de séquences
  63. expressions régulières
  64. faq
  65. flexions
  66. forme composée
  67. formes
  68. Frantext
  69. Frantext 19.1
  70. Frantext 19.2
  71. Frantext 19.3
  72. Frantext 20.1
  73. Frantext 21.1
  74. Frantext 21.2
  75. Frantext 22.1
  76. Frantext 22.2
  77. Frantext 22.3
  78. Frantext 22.4
  79. Frantext 23.1
  80. Frantext 23.2
  81. frantext catégorisé
  82. frantext intégral
  83. Frantext Janvier 2019
  84. fréquence
  85. fréquences
  86. grammaire prédéfinie
  87. hal
  88. historique
  89. indésirables
  90. information générale
  91. inscription
  92. interface
  93. IP
  94. janvier 2019
  95. janvier 2022
  96. juin 2019
  97. juin 2022
  98. Juin 2023
  99. KWIC
  100. langue
  101. lemmatisation
  102. lexique
  103. LGeRM
  104. logo
  105. macintosh
  106. maintien
  107. manuel
  108. mars 2021
  109. Morphalou
  110. mot
  111. mots
  112. octobre 2020
  113. ouvrages
  114. paramètres
  115. paramètres utilisateur
  116. parties du discours
  117. pos
  118. Prices
  119. proxy
  120. prédéfinie
  121. période
  122. questions fréquentes
  123. recherche assistée
  124. recherche simple
  125. recherches
  126. requête
  127. requête avancée
  128. responsable
  129. règle
  130. rédiger
  131. référence
  132. score
  133. segmentation
  134. septembre 2019
  135. Septembre 2022
  136. serveur
  137. Shift
  138. simple
  139. spam
  140. Subscriptions
  141. syntaxe
  142. séquence
  143. TAL
  144. Talismane
  145. Tarifs
  146. temporel
  147. temps
  148. textes
  149. theses
  150. tokenisation
  151. touches
  152. traitement des textes
  153. tri
  154. trier
  155. tutoriel
  156. téléchargement
  157. télécharger
  158. utiliser
  159. v1.2.10
  160. v1.2.18
  161. v1.2.19
  162. v1.2.21
  163. v1.2.22
  164. v1.2.23
  165. v1.2.29
  166. v1.2.30
  167. v1.2.6
  168. v1.2.x
  169. v1.3.10
  170. v1.3.11
  171. variantes
  172. version
  173. versions
  174. vidéos
  175. voisinage
  176. windows
  177. youtube
  178. éditer
  179. équipe
  180. étiquetage
  181. étiquette morphosyntaxique
  182. étiquettes
Tags :
Modifié par Gilles Toubiana le 2018/10/04 16:54
Frantext - ATILF (CNRS/UL) - 2018-2024

Logo CNRS   Logo ATILF   Logo Université de Lorraine