Frantext 2 propose un ensemble d'outils afin d'effectuer des recherches dans les œuvres qui constituent votre corpus de travail. Il est ensuite possible de filtrer les résultats de la recherche à l'aide d'actions spécifiques ou d'exploiter les métadonnées contenues dans les œuvres. Vous pouvez aussi affiner la recherche grâce à l'utilisation d'outils de tri ou d'un menu contextuel.

Recherche simple

La recherche simple permet de rechercher une ou plusieurs formes graphiques et d'obtenir jusqu'à 100000 résultats. Cliquez dans le champ de recherche, saisissez une forme graphique, puis appuyez sur la touche ENTRÉE de votre clavier afin de lancer la recherche. Une liste de résultats s'affiche en fonction des paramètres de l'interface. Pour effectuer une nouvelle recherche ou modifier la recherche en cours, il vous suffit de saisir à nouveau une ou plusieurs formes graphiques dans le champ de recherche puis d'appuyer encore sur la touche ENTRÉE du clavier.

Certaines consignes sont cependant à respecter :

  1. UNITÉS LEXICALES DISTINCTES : Chaque unité lexicale doit être séparée par un espace (appelé aussi blanc). Pour chercher des mots séparés par des apostrophes, il est nécessaire d'ajouter un espace après l'apostrophe.
    Exemple : il faut ainsi saisir c' estl' avion, d' avoir, etc.
  2. PAS D'EXPRESSIONS REGULIÈRES : Les expressions régulières ne seront pas prises en compte.
    Exemple : aimer? retourne  aimer ?.
  3. LIMITER LE NOMBRE D'UNITÉS LEXICALES : La recherche de phrases trop longues ne retournera aucun résultat.

À la différence des recherches assistées ou avancées, la recherche simple ne respecte ni la casse, ni les signes diacritiques de la forme graphique. Cela signifie qu'en cherchant un mot spécifique, vous obtiendrez des occurrences aussi bien en majuscules qu'en minuscules, avec et sans accents. Exemple : etat retourne aussi bien etat que Etat, état, ÉTAT, etc.

Pour aller plus loin, consultez la documentation pour Filtrer les résultats.

Recherche assistée

La recherche assistée permet d'effectuer des recherches complexes à l'aide d'une interface graphique et d'obtenir jusqu'à 100000 résultats. Chaque unité lexicale qui doit être recherchée est saisie à l'aide d'un composant graphique qui se présente sous la forme d'un bloc.

À tout moment, vous pouvez TRANSFORMER un bloc déjà existant en cliquant sur le bouton swap_vert en forme de flèches à double sens situé en haut à droite du bloc concerné. Choisissez ensuite dans la liste du menu déroulant qui s'affiche, le type de transformation que vous souhaitez pour votre bloc : Mot, Joker, Liste de mots, Grammaire ou encore Flexion.

Il existe 5 types de blocs de recherche :

  1. Le bloc Mot permet de saisir une recherche sur une forme graphique, un lemme et une ou plusieurs catégories grammaticales. Il est possible de : 
    • cumuler ces 3 types de recherches
    • utiliser la négation avec la case à cocher N'est pas
    • rendre la recherche facultative avec la case à cocher Mot facultatif
    • rendre la recherche Sensible à la casse (majuscules et minuscules)
  2. Le bloc Joker permet de rechercher n'importe quel mot. Vous pouvez spécifier un nombre minimal et maximal de mots indéterminés à rechercher à l'aide des champs Distance minimale et Distance maximale. Il est également possible d'exclure des catégories grammaticales de cette recherche avec le menu Sauf la catégorie.
  3. Le bloc Liste de mots permet d'utiliser une liste enregistrée. Cliquez dans le champ Liste*. Un menu déroulant vous propose de choisir parmi vos listes ou des listes prédéfinies. Cliquez simplement sur l'identifiant d'une liste pour la sélectionner. La description de la liste s'affiche alors à l'intérieur du bloc.
  4. Le bloc Grammaire permet d'exploiter une grammaire enregistrée. Cliquez dans le champ Grammaire*. Un menu déroulant vous propose de choisir parmi vos grammaires ou des grammaires prédéfinies. Cliquez simplement sur l'identifiant d'une grammaire pour la sélectionner puis choisissez une Règle/liste de mots* dans le nouveau champ disponible.
  5. Le bloc Flexion permet d'utiliser un lexique. Cliquez dans le champ Lexique*. Un menu déroulant vous propose de choisir parmi les lexiques disponibles. Cliquez sur l'identifiant d'un lexique pour le sélectionner puis spécifiez le Lemme* à rechercher ainsi qu'une éventuelle Catégorie grammaticale.

Un menu déroulant vient à votre aide en cours de saisie en vous proposant une liste de valeurs issues de votre corpus. Il vous suffit de cliquer sur une valeur afin de l'ajouter à la recherche. Les expressions régulières sont utilisables dans les champs Forme et Lemme.Pour AJOUTER un nouveau bloc à votre recherche, cliquez sur le bouton add situé à droite du dernier bloc affiché et choisissez le type du bloc à ajouter. Dès qu'il y a au moins 2 blocs affichés, il est possible d'en SUPPRIMER certains en utilisant le bouton situé en bas à droite de chaque bloc. Le bouton RÉINITIALISER permet de supprimer les valeurs déjà saisies dans un bloc.

Lorsque votre recherche assistée est correctement constituée, vous pouvez cliquer sur le bouton RECHERCHER situé sous les blocs afin de lancer la recherche. Les résultats s'affichent en mode concordancier ou contexte en fonction de vos paramètres d'affichage.

Un champ de recherche est alors disponible en haut de la page. Dans ce champ, vous pouvez y découvrir l'interprétation de votre recherche sous la forme d'une expression CQL. Pour modifier la recherche en cours cliquez dans le champ, les blocs de la recherche assistée s'affichent à nouveau et vous pouvez corriger votre recherche. Si vous n'effectuez pas de nouvelle recherche, vous pouvez cliquer sur le bouton MASQUER afin d'éclipser les blocs et d'afficher à nouveau les résultats en pleine page.

Pour aller plus loin, consultez la documentation pour Filtrer les résultats.

Recherche avancée

La recherche avancée permet de rechercher à l'aide d'expressions régulières, d'expressions CQL ou d'expressions propres à Frantext 2 et d'obtenir jusqu'à 100000 résultats. Cliquez dans le champ de recherche, saisissez une expression, puis appuyez sur la touche ENTRÉE de votre clavier afin d'effectuer la recherche. Une liste de résultats s'affiche en fonction des paramètres de l'interface. Pour effectuer une nouvelle recherche ou modifier la recherche en cours, il vous suffit de saisir une expression dans le champ de recherche puis d'appuyer à nouveau sur la touche ENTRÉE du clavier.

Pour en savoir plus, vous pouvez consulter la documentation du filtrage des résultats, des expressions régulières, des expressions CQL et des expressions de séquence dont les listes de mots et les grammaires. Vous pouvez également télécharger un résumé des expressions au format PDF.

Fréquences

L'onglet Fréquences permet de calculer la fréquence d'un mot ou d'une expression régulière. Dans le champ Mot ou expression régulière*, saisissez le ou les termes à quantifier. Le menu déroulant Ensemble de données vous permet de spécifier si la recherche doit porter sur les formes graphiques, les catégories grammaticales ou les lemmes du corpus. Le menu déroulant Type de fréquence * permet de préciser si les résultats doivent être calculés sur la base du nombre de mots ou du nombre de documents contenus dans le corpus actif. Trois cases à cocher vous donnent la possibilité de préciser si la recherche doit respecter la casse (majuscules et minuscules), des signes diacritiques (accents) ou des expressions régulières.
Cliquez ensuite sur le bouton RECHERCHER pour accéder aux résultats.

Deux zones d'affichent : une zone de résultats sur la droite et une zone d'Actions sur la gauche.

Un champ de recherche devient disponible en haut de la zone de droite. Pour modifier le calcul en cours cliquez dans ce champ, le composant graphique (bloc) de Calcul de fréquence s'affiche à nouveau et vous pouvez corriger votre recherche. Si vous n'effectuez pas de nouvelle recherche, vous pouvez cliquer sur le bouton MASQUER afin d'éclipser le bloc et d'afficher à nouveau les résultats en pleine page.

Une ou plusieurs lignes de résultats s'affichent. En fonction de vos paramètres d'affichage, vous obtenez :

  • Fréquence par Mots : le Nombre d'occurrences et la Fréquence par millions de mots (qui correspond au Nombre d'occurrences divisé par le Nombre de tokens dans le corpus, le tout multiplié par 1000000)
  • Fréquence par Documents : le Nombre de documents avec occurrences

Vous pouvez facilement modifier ce paramètre à l'aide du menu déroulant Type de fréquence situé au dessus des lignes de résultats.
Si vous obtenez beaucoup de résultats, vous pouvez modifier le nombre de résultats affichés par pages à l'aide du bouton Résultats par page situé en bas à droite de l'interface, et passer d'une page à l'autre à l'aide des boutons Page suivante navigate_next et Page précédente navigate_before.

La zone d'Actions sur la gauche vous donne la possibilité de Réduire et Trier les résultats :

  • Réduire : spécifiez un nombre minimum et maximum d'occurrences à afficher
  • Trier : spécifiez un ordre de tri (Ascendant ou Descendant)

Les actions sont appliquées les unes après les autres sur les résultats initiaux. Ces actions sont représentées en orange dans une liste située sous le champ de recherche.
En bas de la colonne Actions, dans la section intitulée Actions en cours, cliquez sur l'icône en forme de poubelle delete pour supprimer une action ou l'ensemble des actions appliquées.

Co-occurrences

L'onglet Co-occurrences permet de rechercher l'apparition simultanée de deux ou de trois séquences, en précisant un ordre et un nombre de mots pouvant séparer ces séquences au sein des textes.

Dans le composant graphique (bloc) intitulé Séquence 1, commencez par préciser le type de séquence à rechercher :

  • Mot(s) : saisissez un Mot ou suite de mots*, et précisez si la recherche doit être Sensible à la casse, Sensible aux diacritiques ou au Expression régulières, en cochant les cases correspondantes
  • Expression CQL : saisissez votre expression en respectant la syntaxe CQL
  • Flexion : cliquez sur le champ Lexique* et sélectionnez un lexique, puis saisissez un terme dans le champ Lemme* et une catégorie grammaticale éventuelle dans la partie Catégorie
  • Liste de mots : cliquez à l’intérieur du champ Liste* puis sélectionnez l’identifiant de votre liste dans le menu déroulant
  • Grammaire : cliquez à l’intérieur du champ Grammaire* avant de choisir l’identifiant de la grammaire puis la Règle/liste de mots* à utiliser

Remplissez le bloc Séquence 2 en suivant la même procédure. Une case à cocher supplémentaire Exclu vous permet d'exclure la séquence 2 des résultats de co-occurrences.

Le bloc Séquence 3 respecte la même logique que le précédent. Pour accéder au contenu du bloc, il vous faudra cliquer sur son intitulé.

Enfin, un dernier bloc vous permet de préciser les positions respectives de chaque séquence. Si vous travaillez sur 2 séquences, vous pouvez signaler dans quel ordre elles doivent être traitées ainsi que le nombre de mots tolérés entre chaque séquence. Si vous travaillez sur 3 séquences, il vous faut préciser l’ordre de traitement de chaque séquences les unes par rapport aux autres.

Cliquez sur RECHERCHER. Les résultats s’affichent sous forme d’extraits de quelques lignes (vue contexte). Les séquences recherchées apparaissent en caractères gras et oranges.

En bas à droite de l’interface, vous pouvez modifier le nombre d’extraits à afficher par page à l’aide d’un menu déroulant. Vous pouvez choisir d’en afficher 10, 25, 50 ou 100 par pages. Utilisez les boutons Page suivante navigate_next et Page précédente navigate_before pour passer d’une page à l’autre.

Un champ de recherche est disponible en haut de la page. Pour éditer votre recherche cliquez dans ce champ, les blocs de la recherche de co-occurrences s'affichent à nouveau et vous pouvez modifier la requête. Si vous n'effectuez pas de nouvelle recherche, vous pouvez cliquer sur le bouton MASQUER afin d'éclipser les blocs et d'afficher à nouveau les résultats en pleine page.

Si un bloc n’affiche que son intitulé (Séquence 1, Séquence 2 ou Séquence 3), cliquez sur l’intitulé afin d’afficher le contenu du bloc.

Voisinage

L'onglet Voisinage permet d'étudier le voisinage d'un mot, d'une expression régulière, d'une liste de mots ou d'une grammaire. Dans le composant graphique (bloc) intitulé Étude de voisinage, commencez par préciser la recherche :

  • Mot(s) : saisissez un Mot ou suite de mots*
  • Expression CQL : saisissez votre expression en respectant la syntaxe CQL
  • Flexion : cliquez sur le champ Lexique* et sélectionnez un lexique, puis saisissez un terme dans le champ Lemme* et une catégorie grammaticale éventuelle dans la partie Catégorie
  • Liste de mots : cliquez à l’intérieur du champ Liste* puis sélectionnez l’identifiant de votre liste dans le menu déroulant
  • Grammaire : cliquez à l’intérieur du champ Grammaire* avant de choisir l’identifiant de votre grammaire puis la Règle/liste de mots* à utiliser

Précisez ensuite le Nombre de mots avant et le Nombre de mots après la séquence recherchée (de 0 à 5). Un dernier champ vous permet de limiter à la recherche à certaines catégories grammaticales. Cliquez enfin sur RECHERCHER. Les résultats s’affichent sous forme de tableau. Les données pertinentes apparaissent en caractères gras et oranges.

Un champ de recherche est disponible en haut de la page. Pour éditer votre recherche cliquez dans ce champ, le bloc de la recherche de voisinage s'affiche à nouveau et vous pouvez corriger votre recherche. Si vous n'effectuez pas de nouvelle recherche, vous pouvez cliquer sur le bouton MASQUER afin de cacher les blocs et d'afficher à nouveau les résultats en pleine page.

Sous le champ de recherche se trouve un bouton orange. Cliquez sur l’icône edit situé à droite du label Collocation pour accéder à des paramètres supplémentaires :

  • Ensemble de données : Par défaut, la recherche s’effectue sur la Forme graphique. Vous pouvez effectuer également une recherche de voisinage sur un Lemme ou une Catégorie grammaticale.
  • Ordre : Ascendant ou Descendant
  • Sensible à la casse : Oui ou Non
  • Score : Fréquence, Fonction de vraisemblance (Loglikelihood), Variable centrée réduite (z-score), Variable centrée réduite (t-score), Indice de Sørensen-Dice ou Information mutuelle (MI). Détail des méthodes de calculs sur le site www.collocations.de.
  • Nombre de mots avant et après : Nombre
  • Fréquence minimum : Nombre
  • Options avancées (cliquer sur Filtrer ou Exclure pour y accéder)
    • Filtrer : par Ensemble de données, Expression régulière ou forme exacte recherchée. Des cases à cocher permettent de préciser la sensibilité à la casse ou aux diacritiques.
    • Exclure : les paramètre sont les mêmes que pour Filtrer

Cliquez sur CALCULER pour appliquer le filtre ou sur ANNULER pour fermer la fenêtre de Collocation.

Si vous cliquez sur le bouton bleu Résultats initiaux situé sous le champ de recherche, ou si vous supprimez l'action en cours, en bas de la colonne Actions et métadonnées, vous annulez le filtre d'étude de voisinage. Les résultats d'une recherche classique sur le Mot ou la suite de mots à étudier* sont alors affichés. 

Au dessus du tableau des résultats, 3 menus déroulants vous permettent de modifier dynamiquement la méthode de calcul du Score, l’Ordre et le Type de fréquence. Les possibilités d’affichage sont les suivantes :

  • Score : Fréquence, Fonction de vraisemblance (Loglikelihood), Variable centrée réduite (z-score), Variable centrée réduite (t-score), Indice de Sørensen-Dice, Information mutuelle (MI). Détail des méthodes de calculs sur le site www.collocations.de.
  • Ordre : Ascendant, Descendant
  • Type de fréquence :
    • Fréquence absolue (nombre d'occurrences d'une forme dans le corpus)
    • Fréquence relative (fréquence absolue divisée par la somme des fréquences absolues de toutes les formes dans le corpus)
    • Fréquence absolue et relative

Les premières colonnes du tableau de résultats présentent les mots trouvés (Clé), leur Score et leur Fréquence en fonction de vos paramètres d'affichage. Les colonnes suivantes précisent la fréquence pour chaque position. La position la plus fréquente est mise en évidence par l'utilisation de caractères gras et oranges. En plaçant votre curseur sur la fréquence d'une position, une bulle d'information vous précise le nombre de documents concernés pour obtenir ce chiffre.
Vous pouvez consulter chacun des résultats en vue concordancier :

  • si vous cliquez sur une position précise, le concordancier affiche les résultats d'une recherche sur le mot (Clé ou Pivot) en fonction de la position
  • si vous cliquez ailleurs dans une ligne, le concordancier affiche les résultats d'une recherche sur le mot (Clé ou Pivot) quelle que soit la position

En bas à droite de l’interface, vous pouvez modifier le nombre d’extraits à afficher par page à l’aide d’un menu déroulant. Vous pouvez choisir d’en afficher 25, 50 ou 100 par pages. Utilisez les boutons Page suivante navigate_next et Page précédente navigate_before pour passer d’une page à l’autre.

Comme pour la recherche simple, la recherche assistée et la recherche avancée, l'étude de voisinage ne permet par d'obtenir plus de 100000 résultats. Cette limitation ne s'applique cependant pas aux études de fréquences et de co-occurrences.

Pour en savoir plus sur les méthodes de calcul du Score, consulter le site www.collocations.de.

Frantext - ATILF (CNRS/UL) - 2018

Logo CNRS  Logo ATILF  Logo Université de Lorraine