Sommaire des JADT 1998   

ANALYSE LEXICOLOGIQUE DE LA DIMENSION ÉNONCIATIVE

DE DISCOURS ARGUMENTÉS

(Application à l'étude des motivations de candidats à l'École normale)

 

Jean Moreau, Philippe Gervaix

Centre vaudois de recherches pédagogiques

34, ch. de Bellerive 1007 Lausanne, Suisse

 

Summary

The authors emphasize the necessity of taking into account enounciation in analysing textual data. One way of determining the structure of this dimension is to partition the corpus using a categorisation of the enounciative forms, allowing thus a finer analysis of different styles of enounciation within a corpus of texts written by different authors.

1. Introduction

Longtemps influencés par les travaux de F. de Saussure, les linguistes se sont intéressés au fonctionnement de la langue d’un point de vue essentiellement lexicologique et syntaxique, et ont considéré la phrase comme unité signifiante. Pourtant, on assiste depuis une trentaine d’années à un regain d’intérêt pour l’étude de phénomènes linguistiques qui dépassent le cadre de la phrase, et on a pu voir ainsi, suite aux avancées linguistiques dans le domaine de la pragmatique et de la sémantique, les sciences du langage ouvrir leur champ d’investigation à la dimension énonciative de la phrase, puis à celle du discours. Mais la linguistique n’est pas la seule à s’être intéressée à l’analyse des discours, oraux ou écrits. Conjointement, par le biais d’approches documentaires et stylistiques, les statisticiens se sont également attachés à décrire et à rendre compte des phénomènes de langue en jeu dans les textes. Cependant, il est frappant de noter que les développements de l’approche linguistique et statistique semblent avoir suivi des cheminements parallèles : en effet, une bonne partie des travaux effectués dans le domaine de la statistique textuelle portent encore la marque de leurs origines et mettent l’accent soit sur le lexique, soit sur le contenu. Peu d’études ayant recours à la statistique textuelle ont à notre connaissance tenté de prendre en compte la dimension énonciative des textes. Nous montrerons qu’il est possible de rendre compte de la dimension énonciative d’un texte en appliquant les outils de la statistique textuelle à des discours argumentés.

 

2. Méthodologie

Une analyse des correspondances du tableau croisant les textes avec les mots met souvent en évidence des éléments liés à l’énonciation ayant une forte contribution sur les premiers axes. En effet les formes énonciatives sont souvent très fréquentes dans certains types de discours. Mais il est difficile dans une telle analyse de séparer ce qui relève de l'énonciation (la manière dont le locuteur s'implique dans l'énoncé) de ce qui relève du contenu thématique.

Aussi, pour pouvoir réaliser une analyse plus fine de la dimension énonciative, nous proposons de procéder à une partition du corpus. On considérera ainsi d’une part un corpus associé aux formes énonciatives et d’autre part un corpus défini par les formes dénotées. L'analyse des correspondances du tableau croisant les textes et les formes énonciatives, permet d'obtenir une première approche de la structure de la dimension énonciative du corpus. On pourra ensuite déterminer les segments répétés dans le corpus des formes énonciatives et procéder à l'analyse des correspondances du tableau croisant les textes avec ces segments (analyse à laquelle on pourra ensuite subordonner celle des formes dénotées comme éléments supplémentaires).

Pour pouvoir procéder à ce partitionnement, il nous fallait déterminer des critères qui permettent de distinguer entre énonciation et contenu dénoté. Aussi, nous avons opté pour une conception élargie de l’énonciation, inspirée des travaux récents dans le domaine de la sémantique et de la pragmatique, et notamment des acquis des recherches dans le domaine de la modalisation et de l’énonciation. Nous sommes partis de l’idée que l’on peut distinguer, dans un énoncé ou un discours, ce qui relève du contenu dénoté (ou contenu propositionnel) et ce qui relève de la modalité, c’est-à-dire du "point de vue du sujet parlant sur ce contenu" (Cervoni, 1987). Ainsi comme le dit Kerbrat-Orecchioni (1980) : "analyser l'énonciation, c'est évaluer le poids du locuteur dans l'énoncé, c'est rechercher les procédés linguistiques par lesquels le locuteur imprime sa marque à l'énoncé et se situe par rapport à lui."

Cette procédure nous a ainsi permis de différencier les textes en fonction de l’usage que les candidats faisaient de l’énonciation. Pour pouvoir procéder à une analyse plus fine de la dimension énonciative des textes, nous avons fondé la caractérisation des éléments énonciatifs sur la base de différents travaux qui prennent en compte à la fois la dimension déictique et la dimension modalisatrice du discours.

Nous avons ainsi distingué :

- les marques de l’affectivité, que nous avons regroupées avec les marques de l’évaluation axiologique (j’aime, je sens, ...) ;

- les marques du jugement, catégorie dans laquelle nous avons regroupé les marques de l’assertion, les proposition aléthiques, les marques de l’opinion et de perception (ainsi les verbes penser, croire, trouver ; ...) ;

- les marques aspectuelles (temps des verbes) ;

- les marques de l’intention ou de la volition (j’aimerais, je voudrais) ;

- les marques liées à des énoncés normatifs (il faut, on doit...) ;

- les marques métadiscursives (je dirais que, ...) ;

- les marques logiques ou argumentatives.

3. Corpus et population

Notre recherche porte sur des textes rédigés par des candidats à la formation d’enseignant lors d’un concours d’entrée à l'École Normale. A côté d’épreuves techniques portant sur leurs connaissances en français, mathématiques et allemand, les candidats avaient à rédiger un texte où ils explicitaient les motivations qui les avaient poussés à envisager la formation d'enseignant.

La consigne était la suivante : "Présentez les trois raisons principales qui vous motivent à choisir l'enseignement pour votre avenir professionnel, et trois raisons qui pourraient vous faire hésiter ou vous détourner de ce choix."

Par delà son utilisation dans le cadre de l’examen d’entrée, ce corpus de textes a retenu notre attention dans la mesure où nous avions là une source de renseignements précieux quant aux motivations qui avaient pu pousser des candidats à la formation d’enseignant.

Notre population se compose de 380 candidats, répartis de la manière suivante en fonction des variables sexe, titre et section :

- 320 filles pour 60 garçons ;

- 328 candidats en possession d’un diplôme de culture générale pour 52 en possession d’un baccalauréat ;

- 260 candidats inscrits pour la formation dans les classes primaires pour 120 dans les classes enfantines ;

4. Résultats des analyses

4.1. Analyses globales

Après une analyse descriptive du corpus, nous avons procédé à une analyse des correspondances du tableau croisant les textes avec les mots (Lebart & Salem, 1994). Un premier inventaire des formes graphiques fait ressortir que l'ensemble des textes produits par les candidats à l'École normale se présente comme un corpus d'environ 200'000 mots contenant 4300 mots distincts. On a d'abord fait l'inventaire des formes les plus fréquentes (seuil d’occurrence supérieur à 10).

Comme nous pouvions nous y attendre, ce qui frappe d'emblée, c'est la présence massive des formes personnelles relevant de l’expresion de la subjectivité : je (5679 occurrences), me (1899), mon, ma, mes (1825), moi (434). Par contraste, il ou elle revient 332 fois, se 883, son, sa ou ses 1019 et lui 334 fois. De manière générale, on constate donc que les candidats prennent largement en charge leur discours et s’impliquent dans ce qu’ils disent.

En second lieu, les candidats évoquent abondamment les différents acteurs du système éducatif. Ainsi ils mentionnent en priorité les élèves qui sont plus souvent désignés par le terme enfant (837 mentions au singulier, 1626 au pluriel) que par celui d’élève (qui revient 211 fois au singulier et 546 fois au pluriel) ; viennent ensuite les enseignants : l’enseignant (à 781 reprises), le maître (172), la maîtresse (265), et enfin les parents (229).

Troisième phénomène frappant, les candidats ont généralement tendance à exprimer leur subjectivité sur un mode affectif, volitif et évaluatif plutôt que logique, neutre et objectif. Sont en effet largement présents :

- des verbes marquant la volonté ou le sentiment : je veux (91), j'aimerais (116), aimer (77) ;

- des adjectifs et substantifs liés aux sentiments : heureux (30), plaisir (80), joie (85), peur (113), amour (75) ;

- des adjectifs et substantifs évaluatifs, dénotant soit un jugement axiologique : bien (579), bon (129), bonne (96), important (260), essentiel (79) ; soit au contraire l'emphase et l'intensité : merveilleux (47), extraordinaire (18), très (629), beaucoup (554), énormément (100), toujours (476).

En ce qui concerne les termes renvoyant à des notions ou des concepts, on trouve en priorité des lexèmes liés au rôle ou à la fonction pédagogique de l’enseignant. Ainsi sont largement présentes les notions liées à :

- la transmission : apprendre (499), transmettre (124), enseigner (457), mais aussi enseignement (650), connaissances (178), éducation (117) ;

- l’apport : aider (167), apporter (107), donner (320),

- la relation : contact(s) (390), confiance (67).

4.2. Analyses différenciatrices

4.2.1. Analyse des correspondances du corpus lexical

Pour déterminer les facteurs de différenciation entre ces textes, nous avons eu recours à une analyse des correspondances du tableau croisant les mots et les textes. Cette première approche par l’analyse portant sur le lexique nous donne quelques indications quant à la manière qu’ont les candidats de se situer face au métier d’enseignant.

L’analyse des correspondances sur le lexique fait apparaître quatre pôles opposés selon deux axes.

Un premier axe fait apparaître une opposition portant sur l’expression de la subjectivité et la norme.

- Le premier pôle de l’axe rassemble plutôt des candidats centrés sur leur expérience personnelle ou sur leurs affects et qui font souvent référence à leurs motivations passées ou leurs objectifs futurs.

On relève en effet sur ce pôle de l’axe l’utilisation fréquente de verbes conjugués à la première personne (je suis, j’ai, j’avais, je peux) ainsi que de déictiques personnels (ma, mon, moi).

On y distingue également des termes qui mettent en jeu une dimension temporelle passée (en référence à leur choix), mais aussi future, en rapport à des projets ou des perspectives que leur ouvre la formation à l’école normale. (Notons que ces perspectives semblent être soit l’accomplissement d’un désir d’enseigner, soit de poursuivre une formation, dans le sport notamment.)

- A l’opposé, l’autre pôle regroupe des candidats qui développent un discours normatif sur l’enseignant et sur son rapport à l’enfant.

Cela transparaît notamment dans l'utilisation des pronoms personnels à la 3e personne (il, sa, son, se, lui) et des verbes indiquant une forte connotation normative (faut, doit, peut) en relation avec des qualités qu’un enseignant devrait posséder.

Ce premier axe distingue entre elles les filles inscrites en section primaire : les diplômées sont plutôt associées au premier pôle de l’axe, et les bachelières au second.

Un second axe différencie les candidats en fonction de leurs préoccupations pédagogiques.

- Sur l’un des pôles de cet axe, on trouve un certain nombre de termes évoquant plutôt les acteurs de la relation pédagogique (maîtresse enfantine, enseignante, petit(s) enfant(s), enfants, apprendre) en rapport à toute une série de termes renvoyant à l’affectivité et des activités relevant manifestement de l’école enfantine.

Les candidats proches de ce pôle sont en effet plutôt des filles inscrites en enfantine.

- A l’opposé de ce pôle, les candidats ont recours à un vocabulaire plus abstrait et parlent plus volontiers d’enseignement, de formation, d’éducation, et évoquent leur formation comme un métier dans lequel il désirent se lancer.

Ce type de vocabulaire concerne plus particulièrement les garçons inscrits en primaire.

4.2.2. Partition du corpus et segmentation

Cette première analyse a mis en évidence le poids important de la dimension énonciative dans la différenciation des textes des candidats. Ce constat nous a donc conduits à partitionner le corpus.

Nous considérons ainsi :

- d'une part un corpus des formes énonciatives fondé sur la caractérisation des marques énonciatives précitées,

- et d'autre part un corpus des formes liées aux thèmes abordés.

Nous avons ensuite procédé à la segmentation du corpus des formes énonciatives dont la résultante est un nouveau corpus constitué par les segments énonciatifs.

4.2.3. Analyse des correspondances du corpus des segments

Une nouvelle analyse des correspondances du tableau croisant les segments et les textes permet de déterminer un espace factoriel dans lequel nous avons projeté les formes liés au contenu propositionnel.

Le premier axe permet d’opposer :

- les candidats qui recourent à un vocabulaire normatif (faut pas, doit), privilégient le jugement (je pense, il me semble) et qui par ailleurs utilisent plus fréquemment des termes désignant les acteurs impliqués dans le système éducatif et son contexte (enfant, élève(s), parents, adulte, enseignant, collègues, société, monde), des lexèmes impliquant une action éducative (tâche, activités, agir, éduquer, apporter) ou évoquant la relation pédagogique (pédagogie, respect, disponibilité, adaptation, méthode).

- et les candidats qui privilégient la subjectivité déictique (je), l’affectivité (j’aime ), les marques aspectuelles (j’ai toujours ...) et ont recours à un vocabulaire centré sur leur cursus scolaire et personnel (école, études, allemand, anglais, enfance, collège, gymnase, cours, diplôme, examens, échec, stages, camps, profession).

La projection des variables sexe, titre, section et la considération des valeurs-test indiquent que le premier pôle concerne plutôt :

- les filles inscrites en primaire et en possession d’un baccalauréat,

- les garçons inscrits en primaire et en possession d’un diplôme,

- les garçons inscrits en enfantine et en possession d’un diplôme,

- les filles inscrites en enfantine en possession d’un baccalauréat.

Le second pôle concerne plutôt les filles primaires en possession d’un diplôme et des bachelières inscrites en enfantine.

Le deuxième axe distingue :

- d’une part les candidats qui privilégient

- les marqueurs affectifs (j’aime),

- volitifs (j’ai envie, j’aimerais),

- et évaluatifs (il est important, je trouve que, je pense que),

- de même que des termes liés aux sentiments (peur, joie).

- d’autre part des candidats qui se distinguent moins sur le plan de l’énonciation que sur celui du lexique dénotatif : ces candidats s’expriment en effet de manière très abstraite, à l’aide d’un vocabulaire conceptuel emprunté au monde professionnel et éducatif (éducation, formation, culture, profession, enseignement, réussite, échec, tâche, ouverture, expérience, évolution).

Le troisième axe oppose les candidats :

- qui privilégient un vocabulaire normatif sur un mode impersonnel ;

- et ceux qui privilégient la dimension aspectuelle, les marqueurs de jugement (je pense que, il me semble, il me paraît) ainsi que les marqueurs argumentatifs (il est vrai que, du fait que). Le premier pôle concerne plutôt les garçons et le deuxième certains candidats inscrits en enfantine.

Comme on peut le voir, une telle analyse à partir des segments énonciatifs permet de faire émerger des styles énonciatifs étroitement liés à la modalisation : on peut ainsi distinguer une opposition entre un style plutôt objectif, normatif, associé à un vocabulaire abstrait, plutôt conceptuel, et un style de type subjectif et affectif, centré sur l’histoire de vie de la personne. A un second niveau, on peut distinguer une opposition entre l’affirmation de soi et l’objectivation du discours ; et finalement une opposition de type plus rhétorique entre l’assertion impersonnelle de type normative et la distanciation argumentative de type plus nuancée.

5. Conclusion

L’analyse des correspondances portant sur l’ensemble des mots du corpus donné permet certes une première approche des éléments différenciateurs des textes des candidats. Mais comme on peut le constater à partir des nos analyses, la démarche empirique qui nous a conduits à une partition du corpus fondée sur la distinction entre énonciation et contenu propositionnel apparaît des plus fructueuses : elle permet en effet une analyse plus fine de la dimension énonciative en évitant que les éléments de contenu parasitent l’analyse des correspondances. Elle permet en outre une catégorisation des "styles énonciatifs" des candidats tout en laissant ouverte, dans un deuxième temps, la possibilité de projeter dans l’espace énonciatif les éléments relevant du contenu.

 

 

Références

Cervoni, J. (1987). L’énonciation. Paris : PUF.

Kerbrat-Orecchioni, C. (1980). L'énonciation, de la subjectivité dans le langage. Paris : Armand Colin.

Lebart, L. & Salem, A. (1994). Statistique textuelle. Paris : Dunod.

Mucchielli, R. (1991). L’analyse de contenu des documents et des communications. Paris : ESF.

Salem, A. (1984). La typologie des segments répétés dans un corpus, fondée sur l'analyse d'un tableau croisant mots et textes. Les cahiers de l'analyse des données, Vol IX, 4, 489-500.

Sommaire des JADT 1998