Frantext propose un ensemble d'outils afin d'effectuer des recherches dans les œuvres qui constituent votre corpus de travail. Il est ensuite possible de filtrer les résultats de la recherche à l'aide d'actions spécifiques ou d'exploiter les métadonnées contenues dans les œuvres. Vous pouvez aussi affiner la recherche grâce à l'utilisation d'outils de tri ou d'un menu contextuel.

Recherche simple

La recherche simple permet de rechercher une ou plusieurs formes graphiques et d'obtenir jusqu'à 100000 résultats. Cliquez dans le champ de recherche, saisissez une forme graphique, puis cliquez sur le bouton bleu RECHERCHER ou appuyez sur la touche ENTRÉE de votre clavier afin de lancer la recherche. Une liste de résultats s'affiche en fonction des paramètres de l'interface. Pour effectuer une nouvelle recherche ou modifier la recherche en cours, il vous suffit de cliquer sur l'icône edit dans le champ de recherche situé au dessus des résultats, puis de saisir une ou plusieurs formes graphiques avant d'appuyer à nouveau sur RECHERCHER ou ENTRÉE.

Les cases à cocher Sensible à la casse et Sensible aux diacritiques permettent de préciser si la recherche doit tenir compte des variantes de casses et d'accentuations. Par défaut, la recherche simple ne respecte ni la casse, ni les signes diacritiques de la forme graphique. Cela signifie qu'en cherchant un mot spécifique, vous obtiendrez des occurrences aussi bien en majuscules qu'en minuscules, avec et sans accents. Exemple : etat retourne aussi bien etat que Etat, état, ÉTAT, etc.

Le bouton save SAUVEGARDER situé à droite au dessus des résultats vous permet d'enregistrer les résultats de votre recherche.

La recherche simple ne permet pas d'exploiter les expressions régulières. Si vous souhaitez effectuer des recherches contenant des expressions régulières, vous pouvez utiliser la plupart des autres outils de recherche disponibles, et notamment la recherche avancée.

Pour aller plus loin, consultez la page de documentation : Filtrer les résultats.

Recherche assistée

La recherche assistée permet d'effectuer des recherches complexes à l'aide d'une interface graphique et d'obtenir jusqu'à 100000 résultats. Chaque unité lexicale qui doit être recherchée est saisie à l'aide d'un composant graphique qui se présente visuellement sous la forme d'un bloc.

À tout moment, vous pouvez modifier le type d'un bloc déjà existant en cliquant sur le bouton swap_vert en forme de flèches à double sens situé en haut à droite du bloc concerné. Choisissez ensuite dans la liste du menu déroulant qui s'affiche, le type de bloc que vous souhaitez utiliser : Mot, Joker, Liste de mots, Grammaire ou encore Flexion.

Il existe 5 types de blocs de recherche :

  1. Le bloc Mot permet de saisir une recherche sur une Forme graphique, un Lemme et une (ou plusieurs) Catégorie grammaticale. Il est possible de : 
    • cumuler ces 3 types de recherches
    • utiliser la négation avec la case à cocher N'est pas
    • rendre la recherche facultative avec la case à cocher Mot facultatif
    • rendre la recherche Sensible à la casse (majuscules et minuscules)
    • rendre la recherche Sensible aux diacritiques (accent, tréma, cédille, etc.)
  2. Utiliser un Joker permet de rechercher n'importe quel mot. Vous pouvez spécifier un nombre minimal et maximal de mots indéterminés à rechercher à l'aide des champs Distance minimale* et Distance maximale*. Il est également possible d'exclure des catégories grammaticales de cette recherche avec le menu Sauf la catégorie.
  3. Utiliser une Liste de mots permet d'utiliser une liste enregistrée. Cliquez dans le champ Liste*. Un menu déroulant vous propose de choisir parmi vos listes ou des listes prédéfinies. Cliquez simplement sur l'identifiant d'une liste pour la sélectionner. La description de la liste s'affiche alors à l'intérieur du bloc.
  4. Utiliser une Grammaire permet d'exploiter une grammaire enregistrée. Cliquez dans le champ Grammaire*. Un menu déroulant vous propose de choisir parmi vos grammaires ou des grammaires prédéfinies. Cliquez simplement sur l'identifiant d'une grammaire pour la sélectionner puis choisissez une Règle/liste de mots* dans le nouveau champ disponible.
  5. Utiliser une Flexion permet de tirer profit d'un lexique. Cliquez dans le champ Lexique*. Un menu déroulant vous propose de choisir parmi les lexiques disponibles. Cliquez sur l'identifiant d'un lexique pour le sélectionner puis spécifiez le Lemme* à rechercher ainsi qu'une éventuelle Catégorie grammaticale.

Un menu déroulant vient à votre aide en cours de saisie en vous proposant une liste de valeurs issues de votre corpus. Il vous suffit de cliquer sur une valeur afin de l'ajouter à la recherche. Les expressions régulières sont utilisables dans les champs Forme et Lemme. Pour AJOUTER un nouveau bloc à votre recherche, cliquez sur le bouton add situé à droite du dernier bloc affiché et choisissez le type du bloc à ajouter. Dès qu'il y a au moins 2 blocs affichés, il est possible d'en SUPPRIMER certains en utilisant le bouton situé en bas à droite de chaque bloc. Le bouton RÉINITIALISER permet de supprimer les valeurs déjà saisies dans un bloc.

Vous pouvez modifier l'ordre des blocs en cliquant sur le titre d'un bloc puis en le faisant glisser vers une nouvelle position, avant ou après un autre bloc.

Lorsque votre recherche assistée est correctement constituée, vous pouvez cliquer sur le bouton RECHERCHER situé sous les blocs afin de lancer la recherche. Les résultats s'affichent en mode concordancier ou contexte en fonction de vos paramètres d'affichage.

Un champ de recherche est alors disponible en haut de la page. Dans ce champ, vous pouvez y découvrir l'interprétation de votre recherche sous la forme d'une expression CQL. Pour modifier la recherche en cours cliquez dans le champ sur l'icône edit, les blocs de la recherche assistée s'affichent à nouveau et vous pouvez corriger votre recherche. Si vous n'effectuez pas de nouvelle recherche, vous pouvez cliquer sur le bouton MASQUER afin d'éclipser les blocs et d'afficher à nouveau les résultats en pleine page.

Le bouton save SAUVEGARDER situé à droite au dessus des résultats vous permet d'enregistrer les résultats de votre recherche.

Pour aller plus loin, consultez la page de documentation : Filtrer les résultats.

Recherche avancée

La recherche avancée permet de rechercher à l'aide d'expressions régulières, d'expressions CQL ou d'expressions de séquence propres à Frantext. Elle permet d'obtenir jusqu'à 100000 résultats. Cliquez dans le champ de recherche, saisissez une expression, puis cliquez sur le bouton bleu RECHERCHER ou appuyez sur la touche ENTRÉE de votre clavier afin de lancer la recherche. Une liste de résultats s'affiche en fonction des paramètres de l'interface. Pour effectuer une nouvelle recherche ou modifier la recherche en cours, il vous suffit de cliquer sur l'icône edit dans le champ de recherche situé au dessus des résultats, puis de saisir une nouvelle expression avant d'appuyer sur RECHERCHER ou ENTRÉE.

Le bouton save SAUVEGARDER situé à droite au dessus des résultats vous permet d'enregistrer les résultats de votre recherche.

Pour en savoir plus, vous pouvez consulter les pages de documentation sur le filtrage des résultats, les expressions régulières, les expressions CQL, les expressions de séquence, les listes de mots et les grammaires. Vous pouvez également télécharger un résumé des expressions au format PDF.

Fréquences

L'onglet Fréquences permet de calculer la fréquence d'un mot ou d'une expression régulière. Le nombre de résultats n'est pas limité. Dans le champ Mot ou expression régulière*, saisissez le mot ou l'expression régulière à quantifier. Le menu déroulant Ensemble de données vous permet de spécifier si la recherche doit porter sur les formes graphiques, les catégories grammaticales ou les lemmes du corpus. Le menu déroulant Type de fréquence* permet de préciser si les résultats doivent être calculés sur la base du nombre de mots ou du nombre de documents contenus dans le corpus actif. Trois cases à cocher vous donnent la possibilité de préciser si la recherche doit respecter la casse (majuscules et minuscules), les signes diacritiques (accent, tréma, cédille, etc.) ou des expressions régulières.
Cliquez ensuite sur le bouton RECHERCHER pour accéder aux résultats.

Deux zones d'affichent : une zone de résultats sur la droite et une zone d'Actions sur la gauche.

Un champ de recherche devient disponible en haut de la zone de droite. Pour modifier le calcul en cours cliquez dans ce champ sur l'icône search, le composant graphique (bloc) de Calcul de fréquence s'affiche à nouveau et vous pouvez corriger votre recherche. Si vous n'effectuez pas de nouvelle recherche, vous pouvez cliquer sur le bouton MASQUER afin d'éclipser le bloc et d'afficher à nouveau les résultats en pleine page.

Une ou plusieurs lignes de résultats s'affichent. En fonction de vos paramètres d'affichage, vous obtenez :

  • Fréquence par Mots : le Nombre d'occurrences et la Fréquence par millions de mots (qui correspond au Nombre d'occurrences divisé par le Nombre de tokens dans le corpus, le tout multiplié par 1000000)
  • Fréquence par Documents : le Nombre de documents avec occurrences

Vous pouvez facilement modifier ce paramètre à l'aide du menu déroulant Type de fréquence situé au dessus des lignes de résultats.
Si vous obtenez beaucoup de résultats, vous pouvez modifier le nombre de résultats affichés par pages à l'aide du bouton Résultats par page situé en bas à droite de l'interface, et passer d'une page à l'autre à l'aide des boutons Première page first_page Page précédente navigate_before Page suivante navigate_next et Dernière page last_page.

La zone d'Actions sur la gauche vous donne la possibilité de Réduire et Trier les résultats :

  • Réduire : spécifiez un nombre minimum et maximum d'occurrences à afficher
  • Trier : spécifiez un ordre de tri par nombre d'occurrences (Ascendant ou Descendant)

Le bouton save SAUVEGARDER situé à droite au dessus des résultats vous permet d'enregistrer les résultats de votre recherche.

Les actions sont appliquées les unes après les autres sur les résultats initiaux. Ces actions sont représentées en orange dans une liste située sous le champ de recherche.
En bas de la colonne Actions, dans la section intitulée Actions en cours, cliquez sur l'icône en forme de poubelle delete pour supprimer une action ou sur l'icône delete_sweep pour supprimer l'ensemble des actions appliquées.

Co-occurrences

L'onglet Co-occurrences permet de rechercher l'apparition simultanée de deux ou de trois séquences, en précisant un ordre et un nombre de mots pouvant séparer ces séquences au sein des textes. Le nombre de résultats n'est pas limité.

Dans le composant graphique (bloc) intitulé Séquence 1, commencez par préciser le type de séquence à rechercher :

  • Mot(s) : saisissez un Mot ou suite de mots*, et précisez si la recherche doit être Sensible à la casse (majuscule, minuscule), Sensible aux diacritiques (accent, tréma, cédille, etc.) ou au Expression régulières, en cochant les cases correspondantes
  • Expression CQL : saisissez une Expression CQL* en respectant la syntaxe
  • Flexion : cliquez sur le champ Lexique* et sélectionnez un lexique, puis saisissez un terme dans le champ Lemme* et une catégorie grammaticale éventuelle dans la partie Catégorie
  • Liste de mots : cliquez à l’intérieur du champ Liste* puis sélectionnez l’identifiant de votre liste dans le menu déroulant
  • Grammaire : cliquez à l’intérieur du champ Grammaire* avant de choisir l’identifiant de la grammaire puis la Règle/liste de mots* à utiliser

Remplissez le bloc Séquence 2 en suivant la même procédure. Une case à cocher supplémentaire Exclu vous permet éventuellement d'exclure la séquence 2 des résultats de co-occurrences.

Le bloc Séquence 3 respecte la même logique que le précédent. Pour accéder au contenu du bloc, il vous faudra cliquer sur son intitulé.

Si un bloc n’affiche que son intitulé (Séquence 1, Séquence 2 ou Séquence 3), cliquez sur l’intitulé afin d’afficher le contenu du bloc.

Enfin, un dernier bloc vous permet de préciser les positions respectives de chaque séquence. Si vous travaillez sur 2 séquences, vous pouvez signaler dans quel ordre elles doivent être traitées ainsi que le nombre de mots tolérés entre chaque séquence. Si vous travaillez sur 3 séquences, il vous faut préciser l’ordre de traitement de chaque séquences les unes par rapport aux autres.

Cliquez sur RECHERCHER. Les résultats s’affichent sous forme d’extraits de quelques lignes (vue contexte). Les séquences recherchées apparaissent en caractères gras et oranges.

En bas à droite de l’interface, vous pouvez modifier le nombre d’extraits à afficher par page à l’aide d’un menu déroulant. Vous pouvez choisir d’en afficher 10, 25, 50 ou 100 par pages. Utilisez les boutons Première page first_page Page précédente navigate_before Page suivante navigate_next et Dernière page last_page pour passer d’une page à l’autre.

Un champ de recherche est disponible en haut de la page. Pour éditer votre recherche cliquez dans ce champ sur l'icône search, les blocs de la recherche de co-occurrences s'affichent à nouveau et vous pouvez modifier la requête. Si vous n'effectuez pas de nouvelle recherche, vous pouvez cliquer sur le bouton MASQUER afin d'éclipser les blocs et d'afficher à nouveau les résultats en pleine page.

Le bouton save SAUVEGARDER situé à droite au dessus des résultats vous permet d'enregistrer les résultats de votre recherche.

Les résultats sont affichés sous formes d'extraits. Vous pouvez en consulter les métadonnées en cliquant sur la référence située en haut à gauche de l'extrait. Si ne numéro de page n'est pas visible dans l'extrait, cliquez en bas à gauche sur le bouton zoom_in zoomer et il s'affichera sous la référence de l'extrait en haut à gauche.

Voisinage

L'onglet Voisinage permet d'étudier le voisinage d'un mot, d'une expression régulière, d'une liste de mots ou d'une grammaire. Le nombre de résultats n'est pas limité. Dans le composant graphique (bloc) intitulé Étude de voisinage, commencez par préciser la recherche :

  • Mot(s) : saisissez un Mot ou suite de mots à étudier*
  • Expression CQL : saisissez une Expression CQL à étudier* en respectant la syntaxe
  • Flexion : cliquez sur le champ Lexique* et sélectionnez un lexique, puis saisissez un terme dans le champ Lemme* et une catégorie grammaticale éventuelle dans la partie Catégorie
  • Liste de mots : cliquez à l’intérieur du champ Liste* puis sélectionnez l’identifiant de votre liste dans le menu déroulant
  • Grammaire : cliquez à l’intérieur du champ Grammaire* avant de choisir l’identifiant de la grammaire puis la Règle/liste de mots* à utiliser

Précisez ensuite le Nombre de mots avant et le Nombre de mots après la séquence recherchée (de 0 à 5). Un dernier champ vous permet de limiter à la recherche à certaines catégories grammaticales. Cliquez enfin sur RECHERCHER. Les résultats s’affichent sous forme de tableau. Les données pertinentes apparaissent en caractères gras et oranges.

Un champ de recherche est disponible en haut de la page. Pour éditer votre recherche cliquez dans ce champ sur l’icône edit, le bloc de la recherche de voisinage s'affiche à nouveau et vous pouvez corriger votre recherche. Si vous n'effectuez pas de nouvelle recherche, vous pouvez cliquer sur le bouton MASQUER afin de cacher les blocs et d'afficher à nouveau les résultats en pleine page.

Sous le champ de recherche se trouve un bouton orange. Cliquez sur l’icône edit situé à droite du label Collocation pour accéder à des paramètres supplémentaires :

  • Ensemble de données : Par défaut, la recherche s’effectue sur la Forme graphique. Vous pouvez effectuer également une recherche de voisinage sur un Lemme ou une Catégorie grammaticale.
  • Ordre : Ascendant (du plus petit au plus grand) ou Descendant (du plus grand au plus petit)
  • Score : Fréquence, Fonction de vraisemblance (Loglikelihood), Variable centrée réduite (z-score), Variable centrée réduite (t-score), Indice de Sørensen-Dice ou Information mutuelle (MI). Détail des méthodes de calculs sur le site www.collocations.de.
  • Sensible à la casse : Oui ou Non
  • Nombre de mots avant et après : Nombre
  • Fréquence minimum : Nombre
  • Options avancées (cliquer sur Filtrer ou Exclure pour y accéder)
    • Filtrer : par Ensemble de données, Expression régulière ou forme exacte recherchée. Des cases à cocher permettent de préciser la sensibilité à la casse, aux diacritiques, et aux expressions régulières.
    • Exclure : les paramètre sont les mêmes que pour Filtrer

Cliquez sur CALCULER pour appliquer le filtre ou sur ANNULER pour fermer la fenêtre de Collocation.

Si vous cliquez sur le bouton bleu Résultats initiaux situé sous le champ de recherche, ou si vous supprimez l'action en cours, en bas de la colonne Actions et métadonnées, vous annulez le filtre d'étude de voisinage. Les résultats d'une recherche classique sur le Mot ou suite de mots à étudier* sont alors affichés. 

Au dessus du tableau des résultats, 3 menus déroulants vous permettent de modifier dynamiquement la méthode de calcul du Score, l’Ordre et le Type de fréquence. Les possibilités d’affichage sont les suivantes :

  • Score : Fréquence, Fonction de vraisemblance (Loglikelihood), Variable centrée réduite (z-score), Variable centrée réduite (t-score), Indice de Sørensen-Dice, Information mutuelle (MI). Détail des méthodes de calculs sur le site www.collocations.de.
  • Ordre : Ascendant (du plus petit au plus grand), Descendant (du plus grand au plus petit)
  • Type de fréquence :
    • Fréquence absolue (nombre d'occurrences d'une forme dans le corpus)
    • Fréquence relative (fréquence absolue divisée par la somme des fréquences absolues de toutes les formes dans le corpus)
    • Fréquence absolue et relative

Les premières colonnes du tableau de résultats présentent les mots trouvés (Clé), leur Score et leur Fréquence en fonction de vos paramètres d'affichage. Les colonnes suivantes précisent la fréquence pour chaque position. La position la plus fréquente est mise en évidence par l'utilisation de caractères gras et oranges. En plaçant votre curseur sur la fréquence d'une position, une bulle d'information vous précise le nombre de documents concernés pour obtenir ce chiffre.
Vous pouvez consulter chacun des résultats en vue concordancier :

  • si vous cliquez sur une position précise, le concordancier affiche les résultats d'une recherche sur le mot (Clé ou Pivot) en fonction de la position
  • si vous cliquez ailleurs dans une ligne, le concordancier affiche les résultats d'une recherche sur le mot (Clé ou Pivot) quelle que soit la position

En bas à droite de l’interface, vous pouvez modifier le nombre d’extraits à afficher par page à l’aide d’un menu déroulant. Vous pouvez choisir d’en afficher 25, 50 ou 100 par pages. Utilisez les boutons Première page first_page Page précédente navigate_before Page suivante navigate_next et Dernière page last_page pour passer d’une page à l’autre.

Le bouton save SAUVEGARDER situé à droite au dessus des résultats vous permet d'enregistrer les résultats de votre recherche.

Comme pour la recherche simple, la recherche assistée et la recherche avancée, l'étude de voisinage ne permet par d'obtenir plus de 100000 résultats. Cette limitation ne s'applique cependant pas aux études de fréquences et de co-occurrences.

Pour en savoir plus sur les méthodes de calcul du Score, consulter le site www.collocations.de.

Mes recherches

Le bouton save SAUVEGARDER situé à droite au dessus des résultats vous permet d'enregistrer les résultats de votre recherche. Donnez un Nom* et une Description (facultative) à votre recherche puis cliquez sur le bouton CRÉER. Si vous souhaitez mettre à jour une recherche, cliquez sur Remplacer une recherche existante puis sur le bouton REMPLACER. Pour récupérer une recherche sauvegardée, cliquez sur l'onglet Mes recherches dans la barre de navigation horizontale, puis sur le bouton CHARGER correspondant à votre précédente recherche.

Vous pouvez Filtrer les recherches par types en cliquant sur les boutons suivants :

  • concordances : recherches enregistrées depuis les onglets Simple, Assistée, Avancée et Voisinage
  • fréquences : recherches enregistrées depuis l'onglet Fréquences
  • co-occurrences : recherches enregistrées depuis l'onglet Co-occurrences

Pour travailler à nouveau avec une recherche sauvegardée, cliquez sur le bouton CHARGER dans le bloc correspondant. Le bouton ACTIONS vous permet de :

  • edit Éditer le Nom et/ou la description de la sauvegarde
  • delete Supprimer la sauvegarde
Frantext - ATILF (CNRS/UL) - 2018

Logo CNRS   Logo ATILF   Logo Université de Lorraine