Nouveautés
Appels à communication
Comités
JADT
Soumission
Articles
Thèmes
Archives
Carnet d'adresses
Index des auteurs
La page CORPORA
JADT (1998-2008) et GADT
La page des liens
Comptes-rendus d'ouvrages
La page Forum

Accueil Contact

Max Reinert
Université de Toulouse-Le Mirail (reinert@cict.fr)

Les "mondes lexicaux" et leur "logique"
à travers l'analyse statistique de divers corpus.

Notre pratique dans le domaine de l'analyse statistique des données textuelles[1] a abouti à la mise au point d'une méthodologie particulière : la méthodologie "Alceste" (pour "Analyse des Lexèmes Cooccurrents dans les Enoncés Simples d'un Texte" ). Nous désirons donner ici un aperçu de nos objectifs et espérons, de cette manière, ouvrir un débat sur le statut des "objets" cernables à travers ce type d'approche statistique pour le sociologue ou le linguiste. On présentera :

(1) En introduction, quelques réflexions et interrogations sur le sens de la démarche "Analyse des Données" pour l'analyse de corpus de textes ;

 (2) La méthodologie "Alceste" et la notion de "mondes lexicaux" (qui est au centre de la stratégie proposée). 

(3) Les principaux résultats de l'analyse d'un corpus de récits de cauchemars. 

(4) Un essai d'interprétation : on ne souhaite pas tant mettre en valeur des résultats particuliers que de présenter, à travers eux, une articulation des notions évoquées en (2).
 
 

1. L' Analyse des données textuelles.

Les techniques d'Analyse des Données appliquées à des tableaux statistiques construits à partir de décompte d'unités textuelles se développent actuellement du fait de la multiplication des textes sur supports informatiques. Cette orientation renoue avec les premiers intérêts de Jean-Paul. Benzécri[2]. En effet, l'Analyse Factorielle des Correspondances a été conçue principalement pour l'approche de données linguistiques : "C'est principalement en vue de l'étude des langues que nous nous sommes engagés dans l'analyse factorielle des correspondances" (1973) ou encore :"L'analyse des correspondances a été initialement proposée comme une méthode inductive d'analyse des données linguistiques" (1982)
 
 

1.1 Analyse des Données et Induction

Les méthodes d'Analyse des Données ont été élaborées en vue d'une approche inductive des données textuelles et, plus généralement, qualitatives, en opposition avec l'usage des modèles probabilistes qui étaient jugés "riches en hypothèses qui ne sont jamais satisfaites" (1973). 

Une méthode inductive est utilisée lorsqu'aucun langage précis n'existe pour parler d'un nouvel objet. On en cherche alors une représentation analogique en utilisant un cas particulier ou une représentation approximative à l'aide d'une image, d'une métaphore, d'un schéma, etc... Un mode de représentation spatiale (espaces, classes, réseaux) se prête bien à cette première mise en forme. C'est le retour à une figuration sensible, "iconique", de l'objet. Il semble même que cette technique soit déjà utilisée chez divers animaux supérieurs, où des sortes de raisonnements peuvent être effectués à partir d'images mentales, voire de cartes cognitives (Vauclair, 1990). 

L'avantage d'un tel "outil" de représentation est sans doute dans sa capacité à s'adapter à la résolution de problèmes divers. Son inconvénient est la contrepartie de cet avantage : il implique une représentation globale qui ne permet pas de bien différencier un système d'unités clairement définies. Mais l'enjeu est justement d'apprendre à poser le problème progressivement avant de trouver le langage adéquat qui permettra de le formuler en finesse. Ce cheminement traduit d'ailleurs bien le cheminement classique de la sémiose : de la représentation iconique totalisante globale, on passe peu à peu à un système de signes organisés, c'est à dire à un langage de plus en plus précis et différencié. Par là, on perd sans doute en pouvoir évocateur de l'icône ce que l'on gagne en précision analytique (à un niveau de réalité donné). 

L'analyse des données donne une première représentation iconique globale, schématique, des relations formelles modélisées dans un tableau de données. Elle ne décrit aucun objet en lui-même mais visualise une forme déjà enregistrée dans le tableau au même titre qu'un microscope ou qu'un télescope le fait pour une forme physique (au prix d'une certaine déformation[3]), l'analyste restant libre d'interpréter cette forme en relation avec un système sémiotique de son choix.

 En tant qu'approche inductive, l'approche "Analyse des Données" gagnerait à être replacée dans le cadre d'une théorie sémiotique : en effet, de nombreux "objets" (notamment en Sciences Humaines) ne peuvent être pensés dans un modèle de représentation aux lois complètement explicitées a priori, hors contexte. Ils ne peuvent pas être décrits analytiquement[4]. Doit-on pour cela les exclure de toute tentative de représentation contrôlée (si possible automatisable) ? On rejoint là certaines des thèses de J. Bertin sur la sémiologie graphique et reprenons une réflexion déjà entamée par S Bolasco (1982)).
 
 

1.2 Analyse des Données Textuelles.

Dans le cas des tableaux qualitatifs à double entrée, les relations entre lignes et colonnes sont exprimables dans un langage propositionnel, l'une des entrées renvoyant à un ensemble d'"objets" et l'autre à leurs "qualités". Il existe une sorte de parenté logique entre la définition d'un tel tableau et la considération d'un ensemble de propositions "sujet-prédicat". Pour reprendre l'exemple proposé par Benzécri (1981), supposons un corpus dont toutes les phrases sont constituées d'un sujet et d'un verbe. Par exemple, {l'avion vole ; l'avion ronfle ; le chacal mange ; le chacal aboie ; l'oiseau vole ; etc...}. Il est possible de représenter ce corpus par un tableau de données avec, en lignes, les différents sujets et, en colonnes, les différents prédicats. Si l'ordre des "propositions" est indifférent, la donnée du tableau de correspondances est même équivalente, dans ce cas, à la donnée du corpus (à partir de l'un, on peut reconstruire l'autre et réciproquement). 

En ce sens, l'analyse de données de ce tableau permet de donner une représentation spatiale de la forme du corpus associé. Par cet aspect, comme l'a noté Benzécri (1983), cette application de l'analyse des données a un objectif voisin de celui de l'analyse distributionnelle : non pas chercher le sens d'un texte mais déterminer comment sont organisés les éléments qui le constituent , même si les notions de distributions et d'éléments utilisées par Z.S. Harris sont différentes.

 On sait que l'objectif initial du distributionnalisme (Bloomfield, sous l'influence du béhaviorisme, objectif repris par Harris ensuite) était de réunir un corpus constitué par un ensemble d'énoncés émis par les utilisateurs d'une langue donnée, ensemble aussi varié et exhaustif que possible, puis, d'en relever les régularités afin d'en déduire, sans présupposition, les lois de la grammaire. Si cet objectif ne put être atteint, Harris s'aperçut que cette technique pouvait être efficace pour dégager des structures textuelles reflétant des lois de production d'un texte particulier (c'est à dire d'un discours) :"L'analyse distributionnelle à l'intérieur d'un seul discours, considéré individuellement, fournit des renseignements sur certaines corrélations entre la langue et d'autres formes de comportement." et aussi "Il résulte de tout ce qui précède que notre méthode devra établir les occurrences d'éléments et en particulier les occurrences relatives de tous les éléments d'un discours dans les limites de ce seul discours." (1952).

2. Méthodologie "Alceste" et "Mondes lexicaux".

Cette méthodologie est associée à une orientation particulière des recherches en analyse des données textuelles (1986). Il s'agit, non pas de comparer les distributions statistiques des "mots" dans différents corpus, mais d'étudier la structure formelle de leurs cooccurrences dans les "énoncés" d'un corpus donné. A ce titre, elle renoue avec l'approche distributionnelle évoquée par Benzécri, mais avec une volonté plus affirmée d'être d'abord une "analyse du discours" : en effet, on se propose de mettre en évidence une dimension d'organisation du texte qui "mémorise" ses conditions de production.
 
 

2.1 Objectifs et modélisation du corpus utilisé

Benzécri a évoqué l'analyse distributionnelle dans le cadre d'une modélisation du corpus sous la forme d'un tableau de correspondances entre "sujets" et "prédicats". Il ne s'agit pourtant pas du principal modèle utilisé en analyse des données textuelles. L'autre modèle provient plutôt de la statistique linguistique (Ch. Muller, E. Brunet, M. Tournier) : il consiste à comparer les distributions de vocabulaire entre plusieurs productions (réponses de sujets, oeuvre, etc...)[5]

C'est ce modèle que nous utilisons dans une perspective harissienne (en ce sens que l'on cherche à mettre en évidence la structure des distributions dans un discours singulier). Pour cela, on considère le texte analysé comme un ensemble d' "énoncés élémentaires". A la notion d' "individu" se substitue celle "de "sujet-énonciateur" (qui se distingue donc de celle d'auteur ou de producteur du texte). On relève une certaine analogie[6] de cette démarche avec la théorie polyphonique de Oswald Ducrot (1989, p12), qui différencie le locuteur de l'énonciateur, le locuteur pouvant choisir d'investir ou de se distancier à un moment donné de l'énonciateur. 

Au niveau du traitement envisagé, un texte produit par un seul auteur est peu différent d'un texte co-produit par plusieurs auteurs, celui-là mettant toujours en jeu plusieurs sujets-énonciateurs.

 En résumé, un corpus est modélisé par un tableau croisant en lignes, les "énoncés simples" d'un corpus et, en colonnes, les "formes" utilisées comme marqueurs de la référence (les bases lexicales ou lexèmes). Par là, on met en relation deux niveaux d'analyse : le discours comme ensemble d'énoncés ; l'énoncé (élémentaire) comme ensemble de vocables. La notion d'énoncé renvoie à celle d'un "sujet-énonciateur" et la notion de lexème, à celle d'un "objet" de référence (au moins pour l'énonciateur... nous ne faisons aucune conjoncture par rapport à la réalité cernable par cette dénomination : c'est le problème du sujet-énonciateur).

 Cela dit, la notion d'énoncé élémentaire est ambiguë. Pierre Jacob propose dans un article introductif sur les sciences cognitives de considérer l'énoncé (en première approximation) comme "une représentation (externe) de second ordre d'une représentation (interne) de l'environnement [7]". Si cette formulation a le mérite d'insister sur le processus d'une double représentation - un énoncé est associé à la construction d'une "référence" par le sujet (sa représentation de l'environnement) - elle a tendance à constituer l'environnement comme une "chose en soi" et gommer la place particulière du sujet qui énonce. En effet, dans le langage naturel, celui-ci coordonne la représentation qu'il se fait de l'environnement avec la représentation qu'il a de lui-même ; cela se traduit au niveau linguistique par un jeu de distanciation et de prise en charge entre celui qui propose et celui qui parle (entre énonciateur et locuteur selon la distinction de Ducrot). Cette distanciation est, de plus, démultipliée par les possibilités de reflets multiples du locuteur dans l'énoncé s'appuyant sur divers marqueurs de l'énonciation (les modalisations notamment). De ce point de vue, l'énoncé renvoie donc davantage à la représentation d'un acte engageant celui qui énonce à travers ses images, aussi bien qu'à travers ses choix d'objets.

 Un énoncé traduit donc davantage un "point de vue" particulier plutôt qu'une représentation, le point de vue impliquant en son centre l'existence d'un "sujet" dans une certaine modalité du faire ou de l'être. Cette notion n'a donc rien d'absolu. Elle est relative à l'activité ou à l'état d'un sujet et ne renvoie pas obligatoirement à un système de références préétabli, celui-ci pouvant l'être ou non, reconstruit, imaginé... Notre hypothèse principale consiste justement à considérer le vocabulaire d'un énoncé particulier comme une trace pertinente de ce "point de vue" : il est à la fois la trace d'un lieu référentiel et d'une activité cohérente du sujet-énonciateur. Nous appelons "mondes lexicaux", les traces les plus prégnantes de ces activités dans le lexique.
 
 

2.2. Monde, sujet et logique locale

Les "mondes lexicaux" étant définis statistiquement, ils renvoient à des espaces de référence associés à un grand nombre d'énoncés. Autrement dit, ils superposent, dans un même "lieu", différents moments de l'activité du sujet, différents "points de vue". Ce lieu agit donc comme un attracteur pour cette activité. Un sujet l'habite d'une certaine manière. Dans le cas où ce sujet est collectif (cas de l'étude présentée ci-après), ces "lieux" deviennent des sortes de "lieux communs" (à un groupe, une collectivité, une époque, etc...). De ce fait, ils peuvent s'imposer davantage à l'énonciateur qu'ils ne sont choisis par lui, même si celui-ci les reconstruit, leur donne une coloration propre. Un recouvrement avec la notion de représentations sociales [8] apparaît donc ici assez clairement : dans les deux cas, ces notions évoquent un lieu situé entre les représentations individuelles et les préconstruits culturels. 

Pour désigner ces "lieux" ou "points de vue" plus généraux, nous utiliserons le terme de "monde"[9] qui est moins spécifique d'une théorie, d'un type de construction sociale. Ce terme de "monde" n'a pas de connotation "réaliste". Nous le distinguons très nettement d'un réel (qui reste, selon la belle expression de B. D'Espagnat[10], "voilé") même s'il peut donner l'illusion de son extériorité (voir le débat entre J.P. Changeux et A. Connes, à propos du monde du mathématicien[11]).

 Un monde apparaît, au niveau cognitif, à travers un ensemble plus ou moins organisé de signes relatifs à des objets, des actes, des jugements, etc... S'il n'est pas directement montrable, il transparaît à travers la cohérence des actes et la prévision de leurs effets[12].

 L'approche statistique proposée, ne peut étudier cette cohérence d'un monde que globalement, par opposition à d'autre monde. Si l'on ne peut dire en quoi consiste la cohérence particulière d'un monde, on peut, en revanche, tracer les frontières entre deux mondes du fait d'une absence d'opérations cognitives reliant les objets de l'un aux objets de l'autre.

 Au niveau de l'analyse lexicale, cette opposition entre mondes s'inscrit dans une discrimination du vocabulaire, dans une opposition de leurs traces lexicales. Un monde lexical est donc à la fois la trace d'un lieu référentiel et l'indice d'une forme de cohérence liée à l'activité spécifique du sujet-énonciateur que l'on appellera une logique locale. Monde lexical, sujet-énonciateur et logique locale sont donc trois aspects d'une même "mise en scène" de l'énoncé (comme le décor, les personnages et l'intrigue peuvent l'être dans une pièce de théâtre).
 
 

2.3. Dynamique des points de vue et sujet multiple.

Un "monde lexical" est la trace du monde propre d'un sujet-énonciateur, trace des "objets" qui sont à la fois "objets du monde" et "cibles" de son activité ; ce monde est perçu par le sujet selon différents "points de vue" qui sont autant d'expressions d'un même lieu. Ainsi un point de vue correspond à une position plus consciente et immédiate du sujet-énonciateur alors que le monde dont ce point de vue dépend, a une plus grande permanence, une plus grande stabilité. Il est aussi plus inconscient (plus il est présupposé, plus il est inconscient : voir les paradigmes de Kuhn). Ces mondes n'ont rien d'absolu : ce sont des espaces intermédiaires médiatisant l'action. Ils ne peuvent être définis en eux-mêmes du fait de l'imprécision de leur contour mais sont identifiables par contraste ou par conflit. Leur multiplicité conduit à concevoir une démultiplication du sujet-énonciateur. Cette démultiplication est l'expression même de son activité. Elle peut être temporaire. Tout l'effort de construction suivant consiste à unifier ces différents points de vue en une seule représentation d'ensemble[13]. Cet essai d'unification de différents points de vue en un système organisé et cohérent passe donc par une étape "transitoire" où différentes représentations sont en conflit et où le sujet doit se démultiplier pour les maîtriser (c'est dans cette transition que se jouent les stratégies argumentatives : entre la logique et la dialectique). La représentation iconique peut être perçue comme un premier essai de représentation unifiée des conflits entre "mondes"[14].

 Au niveau du langage, ce dédoublement imposé par l'action est signalé par la possibilité de se distancier de sa propre image (et donc de la nommer : auto-référence). Si nous reprenons à notre compte la terminologie de Oswald Ducrot, l'énonciateur serait celui qui énonce en fonction de la logique d'un monde particulier et le locuteur, celui qui cherche à se distancier de ce monde afin de pouvoir envisager d'autres points de vue et gérer ainsi l'univers des mondes possibles.
 
 

3 L'Analyse d'un corpus de 212 récits de cauchemars.

3.1. Origine de l'étude 

Ce corpus a été constitué en 1972 par Hector Rodriguez Tomé et Françoise Bariaud afin de poursuivre, chez l'adolescent, une étude commencée par Michel Zlotowicz[15] (1978) sur les récits de cauchemar de l'enfant, dans le cadre d'une enquête plus générale sur les peurs et l'angoisse chez les adolescents (1975).

 Rodriguez Tomé avait fait retranscrire les textes des adolescents afin de réduire la part énonciative au profit de la seule description événementielle. Cette opération, qui nous avait semblé utile à l'époque (1980), serait gênante pour une analyse du discours tel qu'on l'entend habituellement. Elle ne peut avoir qu'une faible incidence sur les résultats obtenus ici, le vocabulaire "plein" utilisé par les adolescents n'ayant pas été modifié dans cette retranscription (vocabulaire plein sur lequel porte l'analyse "Alceste")[16]

Concrètement, le corpus[17] que nous avons étudié se présente sous la forme d'"énoncés élémentaires" d'une ligne maximum, ainsi que l'extrait ci-dessous le montre[18]:
 
 

**** *0011 *P_Paris_laïque *A_12ans *S_garçon *réveil *repet
Je me sens soulevé, transporté devant un puits sans fond ; 
De là, je me sens tomber dans ce puits ; 

Je pousse des cris ;

**** *0021 *P_Paris_laïque *A_12ans *S_garcon

Je suis dans une charrette remplie de serpents ;

Je n'ose bouger ;
 
 

3.2. La mise en oeuvre opératoire [19].

L'objectif est d'obtenir un classement des énoncés d'un corpus donné en fonction de la ressemblance ou de la dissemblance statistique des lexèmes qui les compose afin de mettre en évidence des "mondes lexicaux". Au niveau technique, ces "ressemblances et dissemblances" sont modélisées par un tableau binaire dont les colonnes seraient définies par les différents lexèmes et les lignes par les différents énoncés.

Reste à préciser opérationnellement ce que l'on peut entendre par "énoncé" et "lexème": a) Un énoncé peut se concevoir selon plusieurs points de vue, syntaxique, pragmatique, sémantique voire cognitif. Le niveau syntaxique permet de délimiter approximativement des frontières possibles en l'identifiant plus ou moins à la notion de proposition, de phrase ou de paragraphe. Mais de telles frontières restent, en partie, arbitraires et nous avons préféré utiliser une heuristique[20] statistique pour délimiter ce que nous n'osons pas appeler des "énoncés" mais des "unités de contexte" ; b) De même, le lexème n'est pas directement accessible à l'approche formelle ; seule la forme graphique des mots l'est (si l'on entend par là l'ensemble des lettres séparées par un espace ou une ponctuation). La procédure permettant d'extraire la base lexicale d'une forme est loin d'être évidente. On n'a pas cherché à résoudre ce problème en soi, mais dans le contexte de la modélisation du corpus proposée[21].

Une fois ces unités définies, le corpus est modélisé par un tableau de données croisant "unités de contextes" par "formes réduites". Une "classification descendante hiérarchique[22]" de ce tableau permet de distinguer des classes d'unités de contexte en fonction de la distribution différenciée du vocabulaire

A partir d'un corpus de textes, définir les unités d'analyse, construire le tableau de données associé, détecter les classes puis les décrire selon plusieurs points de vue (vocabulaire spécifique des classes, unités de contexte caractéristiques, segments répétés, concordances etc...), telles sont les principales opérations effectuées par le logiciel. 

Par exemple, le tableau traité dans cette étude comprend, en colonnes, 236 "formes réduites" ; en lignes, 1677 "unités de contexte élémentaire" qui correspondent ici aux différents énoncés d'événements retranscrits. 

L'unité de contexte élémentaire (ou u.c.e.) n'est pas l'unité de contexte retenu pour la classification. Celle-ci est constituée de plusieurs u.c.e. successives. Elle est de grandeur variable, ce qui permet de faire plusieurs essais pour contrôler la stabilité des classes obtenues.[23]. Les unités classifiées ici ne sont donc pas les "événements"(u.c.e.) mais des "micro-récits" (succession de plusieurs événements). 

Par cette procédure, trois classes ont été isolées : leur intersection dans les deux essais regroupe 66,37% des 1677 u.c.e. du corpus[24]. La première contient 639 u.c.e., la seconde 263 et la troisième 211. La classe qui se différencie le plus des deux autres est la troisième. Nous l'avions déjà mis en évidence avec la version du logiciel de 1985 en prenant comme unité d'analyse l'u.c.e. ce qui prouve sa forte spécificité (1987). 

3.3. Les résultats obtenus [25]


 
 

Tableau 1 : distribution du vocabulaire dans les trois classes.

 (l'ordre de présentation est par chi2 décroissant au seuil de 5%).
 
 


 
 

Tableau 2 : liste des segments répétés par classe

(fréquents plus de 3 fois) 

Quelques remarques et hypothèses interprétatives se dessinent :

Classe 1 : Des 10 noms que comporte la liste présentée (tableau 1), 5 sont directement relatifs à la famille ou à l'environnement social proche du sujet (6, si l'on considère "maison" avec un sens métaphorique) contre 1, dans les deux autres classes. Présence aussi des verbes d'action (courir, faire, venir, aller, mettre, attraper, (se) sauver) . La distribution des segments répétés (tableau 2) suggère de lier la référence à la famille avec la peur de la solitude (je suis tout seul) et la référence à l'action avec l'impuissance (je ne peux, je n'arrive).

Classe 2 : De nombreux termes, notamment des adjectifs, sont relatifs à un monde visuel (tableau 1). D'autre part, 5 noms font directement référence à des éléments de la chambre (chambre, fenêtre, lit, plafond, porte) et même, plus spécifiquement, de la chambre du rêveur (tableau 2).

Classe 3 : Cette classe très caractéristique regroupe un grand nombre de mots évoquant la chute. Notons la présence de la forme "eau", dont les 14 occurrences appartiennent à des u.c.e. de cette classe (c'est la forme la plus caractéristique de la classe). L'élément "eau" est associé à la préposition "dans" (tableau 2) : l'eau n'est pas présente par sa superficialité mais par sa profondeur.
 
 

a) Première classe [26]
 
 


 
 

Tableau 3 : liste des u.c.e. par classe 

(ordonnée en fonction de la spécificité de leur vocabulaire[27])
 
 

La liste des u.c.e. de la première classe (tableau 3) évoque deux thématiques : le sujet risque de perdre sa famille ou le sujet est seul et menacé dans un environnement dangereux.

Dans la seconde classe, la menace est associée à des formes indistinctes qui grossissent devant lui ou font intrusion dans sa chambre. Le sujet est passif. Le "Je" est principalement suivi du verbe "voir". Il n'est qu'un regard effrayé devant ce qui l'envahit. Contrairement à ceux de la première classe, les personnages évoqués sont des inconnus à peine humains, imprécis dans leur rôle, leur identité, mais identifiés à l'aide de nombreux détails visuels. 

Quant à la troisième classe, elle est parfaitement homogène : chute, cris et anéantissement... L'anéantissement du sujet est associé soit à l'écrasement soit à sa dissolution dans l'eau. Le sujet perd sa pesanteur qui est aussi la perte d'un soutien, la perte de toute référence. L'eau est bien le symbole de cette dissolution. Dans sa profondeur maternante, ne porte-t-elle pas une Ophélie noire, qui est, dit Bachelard, comme "une invitation à mourir" ?.

3.4. Quelques résultats complémentaires

Une fois les énoncés classés, il est possible d'observer la distribution de différentes catégories de mots (même si ceux-ci n'ont pas contribué aux calculs) :
 
 


 
 

Tableau 4 : distribution des catégories grammaticales

(chi2 signés[28]

Les verbes sont significativement présents dans la classe 1 alors que les adjectifs sont significativement absents. Dans la classe 2, c'est l'inverse. Cela renforce l'interprétation précédente : les énoncés de la classe 1 sont davantage des énoncés d'action alors que ceux de la classe 2, sont davantage des descriptions. 

Notons que le style descriptif est un choix du narrateur mais ce choix est cohérent avec l'attitude passive de l'acteur du drame (classe 2). Nous voyons là une double structuration de l'énoncé, dans sa forme et son contenu, relative à cette même thématique de la passivité. 


 
 

Tableau 5 : distribution des catégories de "mots-outils"[29]
 
 

Remarque : La distribution des mots-outils est plus aisée à obtenir puisque les formes associées peuvent être assez facilement discriminées à l'aide d'un dictionnaire (intégré dans le logiciel)... aux aléas statistiques près. Leur classement ne peut qu'être approximatif. L'objectif n'est pas le même que pour le linguiste. Il ne s'agit pas de proposer une taxinomie mais d'avoir un échantillonnage de formes suffisant dans chaque catégorie pour comprendre le rôle éventuel de cette catégorie dans l'organisation des lexèmes spécifiques d'une classe.

 L'échantillonnage des verbes modaux a été limité ici à 4 : falloir, pouvoir, vouloir, devoir. Les marqueurs de l'espace, du temps, de la quantité regroupent aussi bien des prépositions que des adverbes. Les modalisations assertives regroupent principalement dans cette étude les négations. Les organisateurs de l'argumentation comprennent les conjonctions ainsi que des locutions adverbiales du type, "autrement dit", "au contraire", etc.... Les autres catégories de mots sont des catégories grammaticales, celles-ci étant relativement bien identifiables.
 
 

La classe 1 est caractérisée par la présence des verbes modaux (pouvoir, vouloir, devoir) les marqueurs du temps (après, quand) de la négation (ne). Dans les divers corpus traités, nous avons remarqué que ces caractéristiques sont souvent associées aux énoncés d'action. Cette première classe est aussi caractérisée par la présence de pronoms ou adjectifs indéfinis, démonstratifs ou relatifs (autre, ça, ce, celle, cet, chaque, on, qui, tous, tout, toute<). Les démonstratifs mettent en valeur l'activité argumentative du narrateur qui renforce donc au niveau du style énonciatif le dynamisme de l'acteur. Nous retrouvons là encore une relation entre la manière de dire et ce qui est dit. Cette relation est d'autant plus claire qu'elle n'a pas interféré dans le calcul des classes (Rappelons que ces catégories de mots-outils n'ont pas été retenues dans le calcul). La présence des marqueurs temporels va aussi dans le sens d'un intérêt pour l'action. En cela cette classe 1 s'oppose à la classe 2 plus associée aux marqueurs de l'espace. Ces marqueurs sont, plutôt caractéristiques de la classe 3 qui est associée au thème de la chute et, principalement, dans, devant, sur

La classe 2 semble assez atypique. Notons cependant que les marqueurs de la quantité y sont un peu plus fréquents qu'ailleurs, ce qui va dans le sens de l'interprétation déjà évoquée : l'intensité de la menace est corrélative à l'accroissement de la taille de l'agresseur potentiel. Le sujet est envahi par l'impression perceptive.
 
 

4. Un essai d'interprétation

4.1 Le récit de cauchemar : approches et objectifs.

Nous évoquerons rapidement quelques aspects des travaux de Michel Zlotowicz, notamment, ceux regroupés dans son livre "Les cauchemars de l'enfant" (1978). Bien qu'il utilise une méthodologie différente de la nôtre, il aboutit à des constats qui nous paraissent assez voisins (à chacun d'en juger). Comme son approche est nettement orientée vers la mise en évidence d'une logique du récit, elle va nous servir à mettre en évidence concrètement la complémentarité déjà évoquée entre approche "logique" et approche statistique des "mondes lexicaux". Insistons encore sur le fait que ce sont les aspects méthodologiques qui nous intéresse ici et nous ne prétendons pas faire une revue des études sur les récits de cauchemars...

 Pour Michel Zlotowicz, "une analyse de contenu classique des rêves montre les limites de cette technique : le contenu y est morcelé en des unités telles que lieux, objets, personnages, qui sont ensuite comptabilisées ; mais cette analyse ne prend pas en considération ce qui nous paraît l'essentiel dans les textes de rêves : le fait que ce sont des récits, c'est-à-dire une suite ordonnée d'événements. L'analyse morphologique inspirée de V. Propp (1928) et codifiée par A. Régnier (1974) retient au contraire, dans un récit, ses deux propriétés essentielles : sa structure temporelle et sa substance événementielle". (1976, p16)

 Cet auteur se situe donc dans une perspective qui privilégie l'ordre temporel et les actions en opposition avec les techniques d'analyse de contenu alors en vigueur, centrées sur l'étude des "objets" du cauchemar : "les textes recueillis ont la forme de récits, c'est-à-dire qu'ils se présentent fondamentalement comme une suite d'événements ordonnés. La technique d'analyse du contenu qu'on leur appliquera doit tenir compte de ces deux caractères; en particulier, les unités de l'analyse devront être les événements." 

Dans l'analyse de Propp, auquel cet auteur se réfère, les unités d'analyse sont organisées autour d'une fonction, c'est à dire, "l'action d'un personnage, définie du point de vue de sa signification dans le déroulement de l'intrigue" (Propp, p31). Zlotowicz décrit son corpus de récits à l'aide de trois "fonctions" principales, déjà dégagées par Propp dans son analyse des contes : victime, agresseur et auxiliaire. Ces fonctions interagissent dans des événements qui peuvent être décrits à l'aide de sorte de méta-proposition que cet auteur appelle "constituant". Cinquante constituants du cauchemar enfantin sont différenciés à partir d'une analyse des actes, allant de "la victime tombe" à "l'agresseur réduit l'auxiliaire à l'impuissance" (p38)

 De plus, tout récit étant "constitué d'une suite d'événements ordonnés", cet auteur, à l'instar de Propp, se pose la question de l'existence d'une suite fondamentale de constituants.

Par l'étude statistique de son corpus, il dégage une suite de 9 constituants toujours ordonnés (p126) :
 
 

L'agresseur fait irruption chez la victime.
L'agresseur s'approche de la victime.
L'agresseur poursuit la victime.
L'agresseur s'empare de la victime.
L'agresseur enlève la victime.
L'agresseur transporte la victime dans son repaire.
L'agresseur réduit la victime à l'impuissance.
L'agresseur inflige des sévices à la victime.
L'agresseur met à mort la victime.

Zlotowicz s'interroge ensuite sur la validité de cette suite, sur ces variantes, sur son intérêt pour le psychologue s'interrogeant sur la nature de l'angoisse.

 Formellement, notre approche est très différente pour ne pas dire opposée à celle qu'il propose. En effet, l'analyse de la distribution du vocabulaire dans les énoncés met en valeur les lieux, les objets, les personnages dans leur dénomination ou leur description physique et non dans leur fonction, non dans leur position comme actants. De plus, l'aspect séquentiel du déroulement temporel (essentiel selon Zlotowicz) est négligé.

 Ainsi, dans notre approche les éléments du décor, de la mise en scène, vont jouer un rôle prédominant par rapport au drame lui-même, à son déroulement. On ne peut donc que constater l'opposition complète de nos choix méthodologiques, en définitive, beaucoup plus proches de ceux de l'analyse de contenu critiqué par cet auteur. 

Notons cependant deux points d'accord essentiels. L'un concerne les unités de l'analyse : dans les deux cas les unités de base sont les "événements", même si, dans le cas de l'analyse de Zlotowicz, l'expression de ces événements est réduite à la forme de constituants. L'autre point d'accord concerne l'"objet" même de l'analyse, qui est de pouvoir décrire les récits individuels en relation avec une représentation collective du récit, représentation que l'on cherche à fonder dans les deux cas sur l'étude exhaustive d'un corpus. Mais comme on l'a vu, il y a au moins deux manières d'étudier le récit (a) à travers la succession des actes des acteurs, et (b) à travers les mondes qu'ils parcourent et, si Zlotowicz a plutôt choisi la manière (a), nous avons plutôt choisi la manière (b)...
 
 

Après avoir constitué sa suite fondamentale, cet auteur s'est interrogé sur la signification des variantes de cette suite. Il écrit notamment :"Nous avons donc déterminé deux variantes principales de la suite fondamentale, selon que l'agresseur fait irruption chez la victime ou qu'il se manifeste à elle après que la victime s'est exposée au danger. Nous avons aussi remarqué que les récits commençant par une poursuite pouvaient être assimilés à ceux où la victime s'expose au danger." Il ajoute plus loin : "dans les récits où elle s'expose au danger la victime non seulement fait preuve de plus d'activité, mais elle parvient dans un nombre non négligeable de cas à s'échapper du danger par sa propre activité ; ce qui fait contraste avec les récits où l'agresseur fait irruption chez la victime." . Zlotowicz esquisse ensuite l'idée d'un gradient parmi la variété des récits qui actualise la suite fondamentale, en fonction du degré d'activité de la victime qui est aussi, pour cet auteur, un degré de sa détresse, son hypothèse fondamentale étant que le cauchemar exprime l'angoisse et que l'angoisse est manifestée par la détresse de la victime. Cela lui permet de distinguer quatre degrés dans "le continuum de la détresse", en partant de ceux "où elle est la plus totale" :
 
 

degré 0 : les cauchemars "abstraits"

degré 1 : les cauchemars sans agresseurs (chute, maladie, mort...)

degré 2 : les cauchemars où l'agresseur fait irruption chez la victime.

degré 3 : les cauchemars où la victime s'expose à l'agresseur.

degré 4 : les cauchemars où l'agresseur poursuit la victime.
 
 

La pertinence de ces observations pour nos résultats est d'autant plus remarquable qu'elles ont été effectuées avec une méthodologie complètement différentes de la notre et sur un autre corpus (concernant les enfants de 6 à 12 ans et non les adolescents de 12 à 16 ans).

 Cette convergence de résultats nous conduisent à penser que les classes d'événements obtenues précédemment sont, en fait, des classes de récits. 

Aussi pour étayer ces interprétations, nous avons choisi quelques exemples de récits complets caractéristiques de chaque classe. Cela permettra de rendre plus sensible ce que nous entendons par une logique "locale", notion qui se rapproche, dans le cas des récits, de la notion de scénario. 

4.2. La logique de la séparation (classe 1) 

Le contexte établi par la classe 1 est le plus "banal". Rappelons que cette classe est la plus importante en volume (57,4 % des u.c.e.). Les informations relevées à partir du vocabulaire spécifique, des u.c.e. représentatives et des segments répétés ont permis de dégager trois pôles d'attraction : a) l'évocation de la famille ; b) l'évocation d'actions, de déplacements sous-tendant un scénario de type "poursuite-fuite" ; c) une impuissance du sujet. Nous faisons l'hypothèse que cette "impuissance" est directement liée à l'éloignement de la famille, que celle-ci soit imposée par une menace ou par une action du sujet. Voici deux récits types de la classe 1: 

*1473 *P_Limousin *A_16ans *S_garcon *liber (11 u.c.e. sur 12 appartiennent à la classe 1)

Un homme me poursuit avec une hache en pleine nuit $ J'essaye de courir j'ai les jambes coupées $ I est presque a ma hauteur $ Je ne peux avancer $ Je fais du surplace $ Je me refugie dans l'église apres maints efforts $

Comme l'église est un domaine où on ne doit violenter quelqu'un $ I bondit sur moi comme un fauve $ Mais le paroissien le fait lacher prise $ I Lui dit ici mon fils c'est la maison du seigneur pas de violences $ L'homme s'avoue vaincu $ I part $ 

Ce récit actualise le thème de la "poursuite-fuite", avec l'apparition d'un auxiliaire. L'église est l'image même de la maison protectrice, "la maison du seigneur". Ce scénario évoque la suite définie par Zlotowicz :"la victime s'expose au danger ; l'agresseur se montre". Cela nous conduit à placer les récits de ce type au degré 3 et 4 de son "continuum" de détresse. L'analyse que nous proposons permet toutefois de replacer dans un contexte particulier cette logique narrative. Notamment, la liaison avec la famille et plus généralement, avec un environnement social protecteur est plus explicite. Cela permet d'envisager la présence de l'agresseur en relation avec la peur de la séparation[30]

Le second récit a été choisi pour montrer l'existence de scénarios assez différents pour cette classe (ces deux aspects ont été séparés dans certaines analyses mais la discrimination est peu stable. Dans l'analyse sur les cauchemars d'enfants, par contre, le premier scénario est très nettement discriminé (1992) :
 
 

*2093 *P_Limousin *A_16ans *S_fille (9 u.c.e. sur 9 appartiennent à la classe 1) 

parents* et frère* ont un accident $ I sont blesses $ mais je vois mère* mourir $ E m'appelle $ mais je ne peux intervenir $ c'est le tour de père* de frère* $ je suis toujours a les regarder sans pouvoir rien faire $ je suis honteuse indignée $ que vais je devenir seule $ 

Dans ce cas la victime est moins active et l'éloignement de la famille est causée par un agresseur. Cela dit, il exprime sous une autre forme la peur de séparation.

 Peut-on parler de "logique de la séparation" à propos de cette classe ? La prémisse semble être : "Plus on s'éloigne de ses proches plus on est menacé d'anéantissement". Les deux opérateurs de mise en relation du sujet avec les siens sont donc l'éloignement ou le rapprochement. On notera que dans le thème de la poursuite-fuite, ce sont ces deux mêmes opérateurs qui fonctionnent comme en miroir pour positionner le sujet relativement à l'agresseur.

 Notons que la personnalisation de la menace en un agresseur précis permet un certain contrôle de l'angoisse par le rêveur (par la distance qu'il peut avoir avec lui). Cette logique de la proximité et de l'éloignement opère dans un monde socialisé et temporalisé. 

4.3. La logique de la clôture (classe 2)

Les énoncés de cette classe sont surtout marqués par un style très descriptif. Ce style est toutefois révélateur de l'attitude plus passive du sujet. Celui-ci est dans sa chambre et il est menacé par l'apparition d'un agresseur dont la taille s'accroît au fur et à mesure que se précise la menace. Dans la description de l'agresseur, les yeux, les dents, ou des armes sont parfois évoqués. Ce type de récit a été bien caractérisé par l'analyse et nous le rapprochons sans difficulté du degré 2 de l'échelle de détresse de Zlotowicz. En voici deux exemples :
 
 

*1463 *P_Limousin *A_16ans *S_garcon *liber (13/14) 

ma chambre est noire $ je me trouve au beau milieu $ le vampire arrive$ I a des canines très grandes et brillantes $ E paraissent en or $ I me regarde longuement $ je prends peur $ je essaie de parlementer avec Lui $ I m'écoute $ I se jette sur moi $ je réussis au bout de la deuxième fois a le retenir $ même I me regarde $ ses yeux deviennent rouges $ I disparait $ 

*0671 *P_Paris_laïque *A_16ans *S_fille *repet (11/18)

Je suis allongée sur un lit$ la pièce est très crue$ puisque je suis sur le dos je vois très bien le plafond$ la lumière est glauque$ je vois un peu$ il y a une corniche au plafond$ je vois le départ des murs de ce plafond$ tout est blanc casse$ D'un point sombre sur la corniche débouche une espèce de petit monstre$ I est petit couleur de terre peut être plus gris$ La peau est très plissée et rugueuse$ I marche dans les airs mais le dos quasiment colle au plafond$ I évolue avec une lenteur effroyable $ I rit d'un petit rire sinistre $ I découvre des dents grises et pointues $ I vient a moi $ I descend toujours aussi lentement $ I rit toujours les yeux grands ouverts et brillants de plaisir 

L'approche lexicale permet de mettre en évidence les références visuelles et perceptives. Dans la terminologie de Zlotowicz, le scénario actualisé ici est décrit par le constituant : "l'agresseur fait irruption chez la victime" . Dans son étude, il évoque que ce constituant est souvent suivi par "l'agresseur enlève la victime ; L'agresseur transporte la victime dans son repaire ; l'agresseur inflige des sévices à la victime" ce que nous n'avons pas mis en évidence dans ce corpus. Au niveau du contexte, on notera qu'il y a peu de références à un environnement social protecteur. 

Nous parlerons de "logique de la clôture". Elle repose sur un essai de différenciation nette entre un dedans et un dehors (sans pouvoir y arriver vraiment, dans le cas du cauchemar). 

Le cercle de sécurité qui est menacé n'est plus constitué par la famille ou les proches mais par l'environnement physique, corporel du sujet lui-même. L'effraction dans la chambre est accompagnée d'une menace directe d'atteinte à l'intégrité physique. Dans les deux récits présentés, cette menace est symbolisée par le type d'agresseur (vampire) ou par certaines de ses caractéristiques (canines, dents). Cela rapproche cette interprétation de celle sous-jacente au scénario de Zlotowicz. 

Au niveau de l'interprétation psychologique, nous pouvons remarquer avec lui que "l'identité personnelle a pour condition l'intégrité physique, et celle-ci peut en retour être l'image et un symbole d'identité. En ce sens , toute atteinte à l'intégrité est aussi remise en cause et, à la limite, abolition de l'identité personnelle." (p254). Le psychanalyste D. Anzieu a d'ailleurs créé son concept de Moi-peau sur"l'idée que la première différenciation du moi au sein de l'appareil psychique s'étale sur les sensations de la peau et consiste en une figuration symbolique de celle-ci." (Le Moi-peau, DUNOD, 1985). Selon cette perspective, la notion d'atteinte à l'intégrité physique doit être comprise comme une menace contre l'identité même du sujet dans sa structuration la plus archaïque. 

Comme indice de cette interprétation remarquons l'importance du regard (les 8 occurrences de la forme "yeux" sont dans la classe 2). Dans les deux récits présentés, le regard de l'agresseur menace l'intégrité psychologique de la victime. Notons qu'il est l'écho du regard même de la victime sur lui, qui cherche à le contenir dans une description précise en le disloquant dans de nombreux détails.
 
 

4.4. La logique de la chute (classe 3)

Comme on l'a vu, cette classe est la classe de récits la plus caractéristique : elle est distinguée dès la première itération des calculs.

 Son scénario est simple : le sujet tombe. Mais c'est le monde qui bascule avec lui. Le sujet n'existe plus ni comme personne sociale ni même comme personne physique puisque même sa pesanteur, qui l'ancre au sol, disparaît. Tout alors s'écroule autour de lui et il n'est plus lui-même que cette aspiration vers le néant. Zlotowicz a noté la spécificité du cauchemar de chute : "le sentiment de la chute peut, à lui seul, constituer la matière du cauchemar", la détresse "étant corrélative d'un manque de soutien". Le cercle de sécurité évoqué dans les deux premiers types de cauchemar se rétrécit encore ici pour ne cerner qu'un "Je" problématique dont l'existence ne tient plus qu'à la perception de ce vertige. Voici plusieurs exemples de récits de chute actualisant cet anéantissement :
 
 

**** *0101 *P_Paris_laïque *A_12ans *S_garcon 

La maison ou j'habite se désagrège tout à coup $ je verse dans le vide a une hauteur de 400 mètres $ Je me sens brusquement verser vers l'arrière $ Je glisse $ Je tombe lentement comme dans un film passé au ralenti $ Je m'écrase dans la rue sur le sol $ 

**** *0611 *P_Paris_laïque *A_16ans *S_fille 

je suis sur une plaine avec plein des trous et de tous petits chemins $ des que je marche sur le chemin I s'écroule $ je tombe en criant $ mon cri s'étouffe et se perd $ les trous sont rouges et très très profonds $ 

**** *1513 *P_Limousin *A_16ans *S_garcon *reveil 

je tombe dans un lac profond de plusieurs mètres $ je ne sais nager $ l'eau m'engloutit $ je essaie de me maintenir en surface $ je me enfonce* $ je sens la mort proche $ 

Ce dernier récit met explicitement en relation le thème de la chute et de l'anéantissement dans l'eau. Si la chute est l'expression d'une perte de toutes références, et donc une perte du monde, l'eau est communément évoquée comme symbole de la non-différenciation, à la fois origine et fin. 

La menace n'est plus circonscrite à une élément extérieur. Elle dépend d'une perception interne, proprioceptive. Peut-on encore parler de logique ? Le sujet du verbe est celui qui subit. Il n'existe plus que comme argument grammatical car l'énonciation oblige à le distinguer d'un mouvement avec lequel pourtant il se confond. La dissolution dans l'eau est de ce point de vue signifiante de l'anéantissement de tout sujet.
 
 

4.5. Schématisation 

Pour conclure cette partie, nous présentons un schéma récapitulatif de l'état de nos interprétations qui ne constitue qu'un "point de vue" possible, sur les "structures" lexicales obtenues.. Mais que sont ces "structures" hors de toute interprétation ? La notion de signifiant a-t-elle un sens en dehors de celle de signifié ? (et vice-versa). Nous rejoignons là Umberto Eco pour qui la structure n'existe pas en soi :"c'est le produit d'opérations que j'ai moi-même orientées. La structure est un modèle que j'élabore pour pouvoir désigner des choses différentes de manière homogène" (1972). 

Dans le cas présent d'une utilisation inductive de la statistique, si les choix de l'interprète sont orientées par l'analyse statistique, ils ne peuvent être déterminés par elle et la schématisation "modélise"(ou "iconise") nécessairement un point de vue. 


 
 

5. Conclusion

Dans l'étude présentée, le récit de cauchemar renvoie à un monde imaginaire qui apparaît, par là même, comme l'expression d'un "mode d'être" du sujet. C'est donc naturellement qu'est mise en évidence une certaine dualité Monde/Sujet. Cet aspect, évident dans ce cas, n'est cependant pas spécifique de ce type de monde et exemplifie, d'une certaine manière, l'aphorisme de Wittgenstein selon lequel "Le Moi apparaît en philosophie du fait que <<le monde est mon propre monde>>" .

 Le "monde" est considéré à la fois comme l'expression d'un imaginaire et le reflet d'un "réel". C'est en cela qu'il est à la fois "monde" du sujet et "monde objectif". Ce que Bachelard exprime dans cette mise en garde : "Il suffit que nous parlions d'un objet pour nous croire objectifs. Mais par notre premier choix, l'objet nous désigne plus que nous ne le désignons et ce que nous croyons nos pensées fondamentales sur le monde sont souvent des confidences sur la jeunesse de notre esprit." Cette subjectivation des objets fait de tout objet un signe et, du monde, une image de notre propre activité psychique (Jung 31).

Il n'est pas étonnant que cette dualité du monde se reflète dans les logiques mises en oeuvre qui apparaissent à la fois, "logique d'objet" et "logique de sujet" pour reprendre la terminologie de J.B. Grize. 

Par exemple, dans l'analyse des récits de cauchemars, le premier type de récit mis en évidence évoque le monde relationnel du sujet ; mais celui-ci peut être vu comme l'expression même de son Moi social. De ce fait, la logique mise en oeuvre est à la fois logique externe, puisque l'opérateur "s'éloigner/ s'approcher" prend sens dans des distances physiques, et logique interne, puisque cet opérateur mesure l'intensité même du sentiment de détresse du rêveur devant la séparation avec les proches.

 Cela dit, si cette étude met en évidence trois types de mondes et de logiques (qui renvoient en définitive à trois types de vécu du rêveur), que signifie leur co-détermination réciproque ? Dans quelle représentation l'intégrer ?

Si l'on convient que le récit de cauchemar met en scène la peur fondamentale de l'anéantissement, la trace de l'intensité de cette peur apparaît, dans l'analyse, sous différentes dynamiques du récit : distance à l'agresseur dans la première, changement de taille de l'agresseur dans la seconde, et sentiment de la chute dans la troisième. Autrement dit, ce qui semble transparaître dans la structure inter-monde de cette analyse, c'est la trace d'un même processus psychique dynamique qui est situé à un autre niveau d'analyse que celui de la mise en scène dans chacun des mondes. Notons que ce processus est à la base même de ce qu'est, au moins pour les adolescents interrogés, un cauchemar.

 Au niveau linguistique, cette spécificité est intéressante car elle amène à réfléchir sur la notion de référence ... Le référent du mot "cauchemar" est modélisé par la structure des récits qui "imitent" un cauchemar. C'est par le fait que les différents récits ont certaines régularités structurelles, que l'on peut induire l'existence d'un élément stable que dénote justement le mot de "cauchemar" (du moins, pour les adolescents interrogés).

 Cela dit, cette "réalité" du référent n'est pas directement observable : seule la mise en scène imaginaire exprimée par le récit l'est. Aussi doit-on distinguer la notion de "monde" de la notion de "référent réel". Le monde reste la construction imaginaire d'un sujet (éventuellement générique ou collectif), et ne peut que refléter, par sa structure, ces aspects "hors-monde", qu'on nomme la "réalité" (et qui n'est donc accessible que par la métaphore... ou la mathématique).

 Cela dit, si pour Hintikka, le fait de pouvoir formuler une proposition, c'est en même temps concevoir un monde possible dans lequel elle est vraie (Meyer, 1982), pour nous qui traitons de propositions en langage naturel, c'est aussi, la possibilité pour le sujet qui propose, de se créer une autre identité, une autre forme de rapport à une réalité qui sans cesse lui échappe. Le fameux "Je est un autre" d'A. Rimbaud ne traduit-il pas aussi cette propension du poète à s'échapper d'un monde quotidien déjà dépassé et qui ne peut plus être "sa réalité". Il doit chercher un autre Monde, c'est à dire, un autre "Je". 

A son niveau, la méthodologie proposée permet de pister cette démarche identitaire d'un auteur, individuel ou collectif, à travers les mondes lexicaux qui ne sont que la trace, dans son discours, des mondes qu'il échafaude pour asseoir ses points de vue et construire son oeuvre.
 
 

Bibliographie : 

Grize, J.B. (1982) De la logique à l'argumentation (DROZ, Genève)

 Grize, J.B. (1990) Logique et langage (Ophrys)

 Harris, Z.S; (1952)"Discourse Analysis" Language 28 ndeg.1 (traduction française, F. Dubois-Charlier 1969 langages 13 8-45)

 Jodelet, D. (1989) Les représentations sociales (PUF)

 Jung, C.G. (1971 ; traduction française de Yves Le Lay) Les racines de la conscience (Buchet/Chastel)

 Lebart, L., Salem, A.(1988) L'analyse statistique des données textuelles (DUNOD) 

Meyer, M. (1982) Logique, langage et argumentation (Hachette)

 Muller C. (1977) Principes et méthodes de statistique lexicale (Hachette).

 Piaget, J. et al, (1967) Logique et connaissance scientifique (Gallimard)

 Pottier, B, et col. (1973) Le langage (C.E.P.L., Paris)

 Achard, P. (1991) Une approche discursive des questionnaires : l'exemple d'une enquête pendant la guerre d'Algérie, Langage et Société, 55, 5-40.

 Achard, P. (1993) La sociologie du langage (PUF)

 Bolasco,S. (1982) Vers une interprétation sémiotique de l'analyse des données, METRON, vol XL, ndeg. 1-2, p 93-102

 Bachelard, G. (1949) La psychanalyse du feu (Gallimard)

 Bariaud, F., Rodriguez-Tomé, H. (1975) Peurs et angoisse chez des adolescents de milieu rural et urbain, Bulletin de Psychologie, XXIX, 324, 813-823

 Benzécri, J.P. (1973) l'Analyse des Données (DUNOD) 

Benzécri, J.P. (1981) Pratique de l'Analyse des Données : linguistique et lexicologie (DUNOD)

 Benzécri, J.P. (1982) Histoire et Préhistoire de l'Analyse des Données (DUNOD)

 Benzécri, J.P. (1991) Typologie de textes grecs d'après les occurrences des formes des mots outils, Cahiers de l'Analyse des Données 1, 61-86

 Ducrot, O.(1989) Topoi et sens, 9éme colloque d'Albi, (in George Morand, Le Texte et l'Image, C.A.L.S. 1989, Toulouse) 

Eco,U. (1988) Le Signe, Le livre de poche (édition originale 1973).

 Propp, V. (1970, traduction française) Morphologie du conte (Seuil)

 Reinert, M.(1983) Une méthode de classification descendante hiérarchique : Application à l'analyse lexicale par contexte, Cahiers de l'Analyse des Données 3,187-198.

 Reinert, M. (1986) Un logiciel d'analyse lexicale [ALCESTE], Cahiers de l'Analyse des Données, 4, 471-484.

 Reinert, M. (1990). ALCESTE, une méthodologie d'analyse des données textuelles et une application: Aurélia de Gérard de Nerval, Bulletin de Méthodologie Sociologique, 26, 24-54.

 Reinert, M. (1992). Les mondes lexicaux d'un corpus de 304 récits de cauchemars, Ricerca Qualitativa e Computer nelle Scienze Sociali, (Rome 1992) (Actes à paraître)

 Robin, R. (1973) Histoire et Linguistique (Armand Colin)

 Salem, A.(1987) Pratique des segments répétés (Publication de l'INaLF, collection "ST-CLOUD", KLINCKSIECK)

 Vauclair, J. (1990) Les images mentales chez l'animal, La Recherche, 224, 1006-1014.

 Ullmo, J. (1969) La pensée scientifique moderne (Flammarion)

 Wittgenstein, L. (1961: traduction P. Klosowski) Tractatus logico-philosophicus (Gallimard)

 Zlotowicz, M. (1978) Les cauchemars de l'enfant (PUF)


LEXICOMETRICA (ISSN 1773-0570)
Coordinateurs de la rédaction : André Salem, Serge Fleury
Contacts:  lexicometrica@univ-paris3.fr
ILPGA, 19 rue des Bernardins, 75005 Paris France



Site Meter