Yelle Koulibali soutiendra sa thèse mercredi 20 décembre à 14 heures à Cergy (salle des thèses).
Elle a pour titre : "Les constructions des verbes hyperfréquences dans des corpus d'écrits scolaires, Contribution d'une étude textométrique à la connaissance des usages des verbes de parole et d'états mentaux par des collégiens en éducation prioritaire"
Les recherches sur l’écriture scolaire ont longtemps privilégié des analyses qualitatives en raison des difficultés d’exploitation quantitative en traitement automatique du langage. Ces difficultés étaient principalement dues au caractère non normé de ces écrits qui les rendait jusqu’à présent réfractaires à la numérisation, à l’étiquetage et même à l’analyse (Elalouf & Boré, 2007). Un traitement avec le logiciel iTrameur, établi en collaboration avec le laboratoire CLESTHIA (Doquet, David & Fleury, 2017), nous a permis d’effectuer l’analyse textométrique d’un corpus d’écrits scolaires constitué de dix séries de dossiers génétiques comportant chacun l’ensemble des productions écrites d’une classe de l’avant-texte à la version finale. Ce corpus a été recueilli en classes de 6e et de 5e sur une durée de 3 ans dans le cadre d’une recherche collaborative visant à expérimenter un dispositif d’accompagnement à l’autonomie scripturale. Il est venu compléter un premier corpus d’écrits scolaires, scanné, transcrit et annoté, réalisé dans le cadre de notre stage de master au laboratoire ÉMA, et déposé sur le site Ortolang proposé par Huma Num[1].
Notre hypothèse est qu’un codage systématique des verbes de parole et d’état mental, s’appuyant sur la construction d’un lexique-grammaire (Dubois & Dubois-Charlier, 1997) ferait apparaître la variété des formes et des constructions attestées dans les usages langagiers des élèves. L’objectif de la thèse est de caractériser parmi ces emplois ceux des verbes hyperfréquents. Ces verbes, dont les travaux pionniers de Jacqueline Picoche (2002) ont montré l’importance dans l’organisation du lexique, ont la particularité d’être très polysémiques et d’entrer dans de nombreuses constructions. Notre analyse a consisté à comparer les constructions observées dans le corpus d’écrits scolaires à celles recensées dans des dictionnaires d’apprentissage ainsi que dans le corpus oral Orféo, en tenant compte de la fréquence des verbes que les élèves ont pu rencontrer dans leurs manuels de lecture du primaire grâce à la base Manulex. Nos résultats montrent que les structures fondamentales du français sont présentes dans notre corpus et que des réseaux lexicaux relient des verbes hyperfréquents à d’autres moins fréquents. Nous avons pu montrer que la présence ou l’absence de certains verbes était étroitement liée au genre de texte demandé par la consigne et aux possibilités de relecture, discussion orale et réécriture permises par le dispositif. Ces résultats confirment que le verbe est une catégorie majeure pour l’apprentissage du lexique et de l’écriture en raison de son rôle dans l’énonciation, la relation prédicative et l’organisation discursive.
Composition du jury
- Claire Doquet, Professeur des universités, 7e section, Université de Bordeaux, LabE3D EA 7441, en délégation CNRS, rapporteure
- Marie-Paule Jacques, Professeure des universités, 7e section, Université Toulouse 2 Jean Jaurès, CLLE (UMR 5263), rapporteure
- Marie-Noëlle Roubaud, Maitresse de conférences HDR émérite, 7e section, Université d’Aix-Marseille, Parole et Langage - UMR7309 CNRS, examinatrice
- Frédérique Sitri, Professeure des universités, 7e section, UPEC, Céditec, examinatrice
- Catherine Boré, Professeure des universités honoraire, 7e section, CY Cergy Paris Université, ÉMA ; examinatrice
- Marie-Laure Elalouf, Professeure des universités émérite, 7e section, CY Cergy Paris Université, ÉMA, directrice de thèse.