ANALYSE LEXICOLOGIQUE DE LA DIMENSION ÉNONCIATIVE
DE DISCOURS ARGUMENTÉS
(Application à l'étude des motivations de candidats à l'École normale)
Jean Moreau, Philippe Gervaix
Centre vaudois de recherches pédagogiques
34, ch. de Bellerive 1007 Lausanne, Suisse
Summary
The authors emphasize the necessity of taking into account enounciation in analysing textual data. One way of determining the structure of this dimension is to partition the corpus using a categorisation of the enounciative forms, allowing thus a finer analysis of different styles of enounciation within a corpus of texts written by different authors.
1. Introduction
Longtemps influencés par les travaux de F. de Saussure, les linguistes se sont intéressés au fonctionnement de la langue dun point de vue essentiellement lexicologique et syntaxique, et ont considéré la phrase comme unité signifiante. Pourtant, on assiste depuis une trentaine dannées à un regain dintérêt pour létude de phénomènes linguistiques qui dépassent le cadre de la phrase, et on a pu voir ainsi, suite aux avancées linguistiques dans le domaine de la pragmatique et de la sémantique, les sciences du langage ouvrir leur champ dinvestigation à la dimension énonciative de la phrase, puis à celle du discours. Mais la linguistique nest pas la seule à sêtre intéressée à lanalyse des discours, oraux ou écrits. Conjointement, par le biais dapproches documentaires et stylistiques, les statisticiens se sont également attachés à décrire et à rendre compte des phénomènes de langue en jeu dans les textes. Cependant, il est frappant de noter que les développements de lapproche linguistique et statistique semblent avoir suivi des cheminements parallèles : en effet, une bonne partie des travaux effectués dans le domaine de la statistique textuelle portent encore la marque de leurs origines et mettent laccent soit sur le lexique, soit sur le contenu. Peu détudes ayant recours à la statistique textuelle ont à notre connaissance tenté de prendre en compte la dimension énonciative des textes. Nous montrerons quil est possible de rendre compte de la dimension énonciative dun texte en appliquant les outils de la statistique textuelle à des discours argumentés.
2. Méthodologie
Une analyse des correspondances du tableau croisant les textes avec les mots met souvent en évidence des éléments liés à lénonciation ayant une forte contribution sur les premiers axes. En effet les formes énonciatives sont souvent très fréquentes dans certains types de discours. Mais il est difficile dans une telle analyse de séparer ce qui relève de l'énonciation (la manière dont le locuteur s'implique dans l'énoncé) de ce qui relève du contenu thématique.
Aussi, pour pouvoir réaliser une analyse plus fine de la dimension énonciative, nous proposons de procéder à une partition du corpus. On considérera ainsi dune part un corpus associé aux formes énonciatives et dautre part un corpus défini par les formes dénotées. L'analyse des correspondances du tableau croisant les textes et les formes énonciatives, permet d'obtenir une première approche de la structure de la dimension énonciative du corpus. On pourra ensuite déterminer les segments répétés dans le corpus des formes énonciatives et procéder à l'analyse des correspondances du tableau croisant les textes avec ces segments (analyse à laquelle on pourra ensuite subordonner celle des formes dénotées comme éléments supplémentaires).
Pour pouvoir procéder à ce partitionnement, il nous fallait déterminer des critères qui permettent de distinguer entre énonciation et contenu dénoté. Aussi, nous avons opté pour une conception élargie de lénonciation, inspirée des travaux récents dans le domaine de la sémantique et de la pragmatique, et notamment des acquis des recherches dans le domaine de la modalisation et de lénonciation. Nous sommes partis de lidée que lon peut distinguer, dans un énoncé ou un discours, ce qui relève du contenu dénoté (ou contenu propositionnel) et ce qui relève de la modalité, cest-à-dire du "point de vue du sujet parlant sur ce contenu" (Cervoni, 1987). Ainsi comme le dit Kerbrat-Orecchioni (1980) : "analyser l'énonciation, c'est évaluer le poids du locuteur dans l'énoncé, c'est rechercher les procédés linguistiques par lesquels le locuteur imprime sa marque à l'énoncé et se situe par rapport à lui."
Cette procédure nous a ainsi permis de différencier les textes en fonction de lusage que les candidats faisaient de lénonciation. Pour pouvoir procéder à une analyse plus fine de la dimension énonciative des textes, nous avons fondé la caractérisation des éléments énonciatifs sur la base de différents travaux qui prennent en compte à la fois la dimension déictique et la dimension modalisatrice du discours.
Nous avons ainsi distingué :
- les marques de laffectivité, que nous avons regroupées avec les marques de lévaluation axiologique (jaime, je sens, ...) ;
- les marques du jugement, catégorie dans laquelle nous avons regroupé les marques de lassertion, les proposition aléthiques, les marques de lopinion et de perception (ainsi les verbes penser, croire, trouver ; ...) ;
- les marques aspectuelles (temps des verbes) ;
- les marques de lintention ou de la volition (jaimerais, je voudrais) ;
- les marques liées à des énoncés normatifs (il faut, on doit...) ;
- les marques métadiscursives (je dirais que, ...) ;
- les marques logiques ou argumentatives.
3. Corpus et population
Notre recherche porte sur des textes rédigés par des candidats à la formation denseignant lors dun concours dentrée à l'École Normale. A côté dépreuves techniques portant sur leurs connaissances en français, mathématiques et allemand, les candidats avaient à rédiger un texte où ils explicitaient les motivations qui les avaient poussés à envisager la formation d'enseignant.
La consigne était la suivante : "Présentez les trois raisons principales qui vous motivent à choisir l'enseignement pour votre avenir professionnel, et trois raisons qui pourraient vous faire hésiter ou vous détourner de ce choix."
Par delà son utilisation dans le cadre de lexamen dentrée, ce corpus de textes a retenu notre attention dans la mesure où nous avions là une source de renseignements précieux quant aux motivations qui avaient pu pousser des candidats à la formation denseignant.
Notre population se compose de 380 candidats, répartis de la manière suivante en fonction des variables sexe, titre et section :
- 320 filles pour 60 garçons ;
- 328 candidats en possession dun diplôme de culture générale pour 52 en possession dun baccalauréat ;
- 260 candidats inscrits pour la formation dans les classes primaires pour 120 dans les classes enfantines ;
4. Résultats des analyses
4.1. Analyses globales
Après une analyse descriptive du corpus, nous avons procédé à une analyse des correspondances du tableau croisant les textes avec les mots (Lebart & Salem, 1994). Un premier inventaire des formes graphiques fait ressortir que l'ensemble des textes produits par les candidats à l'École normale se présente comme un corpus d'environ 200'000 mots contenant 4300 mots distincts. On a d'abord fait l'inventaire des formes les plus fréquentes (seuil doccurrence supérieur à 10).
Comme nous pouvions nous y attendre, ce qui frappe d'emblée, c'est la présence massive des formes personnelles relevant de lexpresion de la subjectivité : je (5679 occurrences), me (1899), mon, ma, mes (1825), moi (434). Par contraste, il ou elle revient 332 fois, se 883, son, sa ou ses 1019 et lui 334 fois. De manière générale, on constate donc que les candidats prennent largement en charge leur discours et simpliquent dans ce quils disent.
En second lieu, les candidats évoquent abondamment les différents acteurs du système éducatif. Ainsi ils mentionnent en priorité les élèves qui sont plus souvent désignés par le terme enfant (837 mentions au singulier, 1626 au pluriel) que par celui délève (qui revient 211 fois au singulier et 546 fois au pluriel) ; viennent ensuite les enseignants : lenseignant (à 781 reprises), le maître (172), la maîtresse (265), et enfin les parents (229).
Troisième phénomène frappant, les candidats ont généralement tendance à exprimer leur subjectivité sur un mode affectif, volitif et évaluatif plutôt que logique, neutre et objectif. Sont en effet largement présents :
- des verbes marquant la volonté ou le sentiment : je veux (91), j'aimerais (116), aimer (77) ;
- des adjectifs et substantifs liés aux sentiments : heureux (30), plaisir (80), joie (85), peur (113), amour (75) ;
- des adjectifs et substantifs évaluatifs, dénotant soit un jugement axiologique : bien (579), bon (129), bonne (96), important (260), essentiel (79) ; soit au contraire l'emphase et l'intensité : merveilleux (47), extraordinaire (18), très (629), beaucoup (554), énormément (100), toujours (476).
En ce qui concerne les termes renvoyant à des notions ou des concepts, on trouve en priorité des lexèmes liés au rôle ou à la fonction pédagogique de lenseignant. Ainsi sont largement présentes les notions liées à :
- la transmission : apprendre (499), transmettre (124), enseigner (457), mais aussi enseignement (650), connaissances (178), éducation (117) ;
- lapport : aider (167), apporter (107), donner (320),
- la relation : contact(s) (390), confiance (67).
4.2. Analyses différenciatrices
4.2.1. Analyse des correspondances du corpus lexical
Pour déterminer les facteurs de différenciation entre ces textes, nous avons eu recours à une analyse des correspondances du tableau croisant les mots et les textes. Cette première approche par lanalyse portant sur le lexique nous donne quelques indications quant à la manière quont les candidats de se situer face au métier denseignant.
Lanalyse des correspondances sur le lexique fait apparaître quatre pôles opposés selon deux axes.
Un premier axe fait apparaître une opposition portant sur lexpression de la subjectivité et la norme.
- Le premier pôle de laxe rassemble plutôt des candidats centrés sur leur expérience personnelle ou sur leurs affects et qui font souvent référence à leurs motivations passées ou leurs objectifs futurs.
On relève en effet sur ce pôle de laxe lutilisation fréquente de verbes conjugués à la première personne (je suis, jai, javais, je peux) ainsi que de déictiques personnels (ma, mon, moi).
On y distingue également des termes qui mettent en jeu une dimension temporelle passée (en référence à leur choix), mais aussi future, en rapport à des projets ou des perspectives que leur ouvre la formation à lécole normale. (Notons que ces perspectives semblent être soit laccomplissement dun désir denseigner, soit de poursuivre une formation, dans le sport notamment.)
- A lopposé, lautre pôle regroupe des candidats qui développent un discours normatif sur lenseignant et sur son rapport à lenfant.
Cela transparaît notamment dans l'utilisation des pronoms personnels à la 3e personne (il, sa, son, se, lui) et des verbes indiquant une forte connotation normative (faut, doit, peut) en relation avec des qualités quun enseignant devrait posséder.
Ce premier axe distingue entre elles les filles inscrites en section primaire : les diplômées sont plutôt associées au premier pôle de laxe, et les bachelières au second.
Un second axe différencie les candidats en fonction de leurs préoccupations pédagogiques.
- Sur lun des pôles de cet axe, on trouve un certain nombre de termes évoquant plutôt les acteurs de la relation pédagogique (maîtresse enfantine, enseignante, petit(s) enfant(s), enfants, apprendre) en rapport à toute une série de termes renvoyant à laffectivité et des activités relevant manifestement de lécole enfantine.
Les candidats proches de ce pôle sont en effet plutôt des filles inscrites en enfantine.
- A lopposé de ce pôle, les candidats ont recours à un vocabulaire plus abstrait et parlent plus volontiers denseignement, de formation, déducation, et évoquent leur formation comme un métier dans lequel il désirent se lancer.
Ce type de vocabulaire concerne plus particulièrement les garçons inscrits en primaire.
4.2.2. Partition du corpus et segmentation
Cette première analyse a mis en évidence le poids important de la dimension énonciative dans la différenciation des textes des candidats. Ce constat nous a donc conduits à partitionner le corpus.
Nous considérons ainsi :
- d'une part un corpus des formes énonciatives fondé sur la caractérisation des marques énonciatives précitées,
- et d'autre part un corpus des formes liées aux thèmes abordés.
Nous avons ensuite procédé à la segmentation du corpus des formes énonciatives dont la résultante est un nouveau corpus constitué par les segments énonciatifs.
4.2.3. Analyse des correspondances du corpus des segments
Une nouvelle analyse des correspondances du tableau croisant les segments et les textes permet de déterminer un espace factoriel dans lequel nous avons projeté les formes liés au contenu propositionnel.
Le premier axe permet dopposer :
- les candidats qui recourent à un vocabulaire normatif (faut pas, doit), privilégient le jugement (je pense, il me semble) et qui par ailleurs utilisent plus fréquemment des termes désignant les acteurs impliqués dans le système éducatif et son contexte (enfant, élève(s), parents, adulte, enseignant, collègues, société, monde), des lexèmes impliquant une action éducative (tâche, activités, agir, éduquer, apporter) ou évoquant la relation pédagogique (pédagogie, respect, disponibilité, adaptation, méthode).
- et les candidats qui privilégient la subjectivité déictique (je), laffectivité (jaime ), les marques aspectuelles (jai toujours ...) et ont recours à un vocabulaire centré sur leur cursus scolaire et personnel (école, études, allemand, anglais, enfance, collège, gymnase, cours, diplôme, examens, échec, stages, camps, profession).
La projection des variables sexe, titre, section et la considération des valeurs-test indiquent que le premier pôle concerne plutôt :
- les filles inscrites en primaire et en possession dun baccalauréat,
- les garçons inscrits en primaire et en possession dun diplôme,
- les garçons inscrits en enfantine et en possession dun diplôme,
- les filles inscrites en enfantine en possession dun baccalauréat.
Le second pôle concerne plutôt les filles primaires en possession dun diplôme et des bachelières inscrites en enfantine.
Le deuxième axe distingue :
- dune part les candidats qui privilégient
- les marqueurs affectifs (jaime),
- volitifs (jai envie, jaimerais),
- et évaluatifs (il est important, je trouve que, je pense que),
- de même que des termes liés aux sentiments (peur, joie).
- dautre part des candidats qui se distinguent moins sur le plan de lénonciation que sur celui du lexique dénotatif : ces candidats sexpriment en effet de manière très abstraite, à laide dun vocabulaire conceptuel emprunté au monde professionnel et éducatif (éducation, formation, culture, profession, enseignement, réussite, échec, tâche, ouverture, expérience, évolution).
Le troisième axe oppose les candidats :
- qui privilégient un vocabulaire normatif sur un mode impersonnel ;
- et ceux qui privilégient la dimension aspectuelle, les marqueurs de jugement (je pense que, il me semble, il me paraît) ainsi que les marqueurs argumentatifs (il est vrai que, du fait que). Le premier pôle concerne plutôt les garçons et le deuxième certains candidats inscrits en enfantine.
Comme on peut le voir, une telle analyse à partir des segments énonciatifs permet de faire émerger des styles énonciatifs étroitement liés à la modalisation : on peut ainsi distinguer une opposition entre un style plutôt objectif, normatif, associé à un vocabulaire abstrait, plutôt conceptuel, et un style de type subjectif et affectif, centré sur lhistoire de vie de la personne. A un second niveau, on peut distinguer une opposition entre laffirmation de soi et lobjectivation du discours ; et finalement une opposition de type plus rhétorique entre lassertion impersonnelle de type normative et la distanciation argumentative de type plus nuancée.
5. Conclusion
Lanalyse des correspondances portant sur lensemble des mots du corpus donné permet certes une première approche des éléments différenciateurs des textes des candidats. Mais comme on peut le constater à partir des nos analyses, la démarche empirique qui nous a conduits à une partition du corpus fondée sur la distinction entre énonciation et contenu propositionnel apparaît des plus fructueuses : elle permet en effet une analyse plus fine de la dimension énonciative en évitant que les éléments de contenu parasitent lanalyse des correspondances. Elle permet en outre une catégorisation des "styles énonciatifs" des candidats tout en laissant ouverte, dans un deuxième temps, la possibilité de projeter dans lespace énonciatif les éléments relevant du contenu.
Références
Cervoni, J. (1987). Lénonciation. Paris : PUF.
Kerbrat-Orecchioni, C. (1980). L'énonciation, de la subjectivité dans le langage. Paris : Armand Colin.
Lebart, L. & Salem, A. (1994). Statistique textuelle. Paris : Dunod.
Mucchielli, R. (1991). Lanalyse de contenu des documents et des communications. Paris : ESF.
Salem, A. (1984). La typologie des segments répétés dans un corpus, fondée sur l'analyse d'un tableau croisant mots et textes. Les cahiers de l'analyse des données, Vol IX, 4, 489-500.