Rechercher toutes les occurrences du verbe suivre


Comment rechercher les formes de suis qui sont des occurrences du verbe suivre, en laissant de côté celles qui sont des occurrences du verbe être ?

Le problème :

  • Dans la recherche avancée, lorsque vous cherchez [lemma="suivre"%c & pos="V|VINF|VPP|VPR"%c], vous ne récupérez aucune occurrence de suis, car la lemmatisation dans Frantext ne gère pas encore l'ambiguïté. De façon déterministe, toutes les occurrences d'une forme donnée sont associées au même lemme. Dans le cas de suis, il s'agit du lemme être.
  • Si vous cherchez &lexique("moderne","suivre","VINF"), vous récupèrez des formes étiquetées NC, ADJ et P. Pourquoi ?
    1. à cause des formes suivantsuivisuiviesuivies et suivis qui peuvent bel et bien être des noms communs, des adjectifs ou des prépositions
    2. à cause de quelques erreurs d'étiquetage : 
      • Le suivait pris pour DET + NC
      • Les petites suivent pris pour DET + ADJ + NC
      • dont une suivie d'un immense passage d'avions pris pour DET + NC

Les solutions possible :

- [word=&lexique("moderne","suivre","VINF") & pos="V|VINF|VPP|VPR"%c] que l'on peut simplifier en :
- [word=&lexique("moderne","suivre","VINF") & pos="V.*"%c]

Ces expressions permettent de contourner les limites de la lemmatisation et d'obtenir des occurrences de l'ensemble des formes fléchies du verbe suivre, dont l'étiquette morphosyntaxique correspond à un verbe conjugué ou à l'infinitif.

Attention : il manquera toujours des occurrences, à cause des erreurs d'étiquetage, mais l'exploitation conjointe des listes de formes fléchies générée par un lexique ainsi que des étiquettes morphosyntaxiques permet d'obtenir des résultats pertinents.

Frantext - ATILF (CNRS/UL) - 2018

Logo CNRS   Logo ATILF   Logo Université de Lorraine