CONVERGENCES ET SPÉCIFICITÉS DE LA STATISTIQUE LEXICALE ET DE L'INDEXATION SYNTAXO-SÉMANTIQUE AUTOMATIQUE : ANALYSE DES INTERVENTIONS DES JOURNALISTES DURANT UNE CAMPAGNE ÉLECTORALE.
Pascal Marchand Groupe de Recherche sur la Parole (Paris 8) IUT Information & Communication 115, route de Narbonne F-31077 TOULOUSE CEDEX. Tel : 05 62 25 81 87. Fax : 05 62 25 81 97. e-mail : pamarc@ic.iut-tlse3.fr |
Pierre Molette Groupe de Recherche sur la Parole Université de Paris 8 2, rue de la Liberté 93526 SAINT DENIS CEDEX 02 e-mail : grp@univ-paris8.fr |
Abstract
In this paper, we analyse a political corpus (journalists questions and interventions during the last european campaign) under many complementary angles, that is statistical analysis of textual data (SPADT), or logico-syntactic categorizations of words (TROPES). The results converge to show that both lexical and syntactical distributions are organized in accordance with given/new electoral rolls, rather than left/right wings ones.
Introduction
La campagne des Elections européennes (12 juin 1994), enregistrée du 19 avril au 10 juin, a été marquée, dans la presse, par une atténuation de la virulence partisane, qui trouvera son apogée, en France, dans le débat pour les élections présidentielles entre Jacques Chirac et Lionel Jospin.
Opérationnellement, il s'agissait pour nous d'enregistrer, et de retranscrire, les introductions, questions et réactions des journalistes à un invité politique au cours des interviews-débats radiodiffusés d'une campagne électorale, et d'effectuer une analyse statistique textuelle, en considérant principalement les variables inhérentes aux différentes listes en présence.
L'unité d'analyse a été définie comme une séquence de deux interlocuteurs : lorsqu'un journaliste recevait un invité, l'unité d'analyse était l'émission dans sa totalité. Lorsque plusieurs journalistes interrogeaient le même invité, l'unité d'analyse étaient définie par le tour de parole (changement locuteur).
Un tableau lexical a été construit de façon à croiser les formes graphiques avec les listes électorales : Autre Europe (Philippe de Villiers), Autre Politique (Jean-Pierre Chevènement), CPNT (André Gousta), Europe Solidaire (Michel Rocard), Front National (Jean-Marie Le Pen), Génération Écologie (Brice Lalonde), Parti Communiste (Francis Wurtz), Radicale (Bernard Tapie), Union RPR/UDF (Dominique Baudis), Verts (Marie-Anne Isler-Béguin).
Analyses
La démarche approfondit une réflexion, entamée aux premières JADT (Barcelonne, 1992), et poursuivie aux deuxièmes et troisièmes (Montpellier, 1994 ; Rome, 1996), sur l'association de méthodes issues de la statistique textuelle et de l'analyse automatique des communications, pour l'étude d'un corpus politique.
Il s'agit de montrer qu'au delà de leurs spécificités disciplinaires, ces deux approches se posent les mêmes questions : comment étudier un texte en évitant les a priori de l'analyste, et uniquement sur la base de lois générales (statistiques vs linguistiques) ? qu'est-ce qu'une ambiguïté, et comment désambiguïser automatiquement les formes (lemmatisation, indexation sémantique) ? quels sont les rapports qu'entretiennent le lexique et la syntaxe ?
Les spécificités sont alors à envisager dans la définition de l'unité d'analyse (forme graphique vs proposition), l'analyse elle-même (distribution vs catégorisation) et l'opérationalisation des cooccurrences (segments et quasi-segments vs distinction de la fonction prédicative).
Analyses lexicales
Analyse lexicologique
NOMBRE TOTAL DE MOTS = 58242
NOMBRE DE MOTS DISTINCTS = 4046
POURCENT. MOTS DISTINCTS = 6.9
SEUIL DE FREQUENCE = 6
TOTAL DES MOTS RETENUS = 51719
MOTS DISTINCTS RETENUS = 915
SELECTION DES MOTS (après suppression des noms propres)
NOMBRE DE MOTS DISTINCTS = 839
Une classification ascendante hiérarchique des 10 modalités (listes électorales) au plan de leurs coordonnées factorielles (n=9) permet d'éditer le dendogramme suivant :
(INDICES EN POURCENTAGE DE LA SOMME DES INDICES : .25929)
Une coupure en deux classes, fortement liée au premier facteur de l'analyse (valeur-propre=.0394 ; inertie=15.20), distingue, en premier lieu, les listes Autre Europe et Radicale (valeur-test=2.38) des 8 autres listes (valeur-test=-3.14). Le second facteur (valeur-propre=.0389 ; inertie=15.01), isole la liste Parti Communiste (valeur-test=-2.23) des 7 autres (valeur-test=2.18). Le troisième facteur (valeur-propre=.0349 ; inertie=13.47), distingue les deux premières listes, mais ces partitions cessent d'être significatives (valeurs-test<2). Le quatrième facteur (valeur-propre=.0294 ; inertie=11.35), distingue les listes Front National, Génération Écologie, Autres, et Union (valeur-test=-2.08), des listes Europe Solidaire, Autre Politique et Verts (valeur-test=1.90). Ce n'est qu'au plan des cinquième (valeur-propre=.0283 ; inertie=10.90) et sixième facteurs (valeur-propre=.0271 ; inertie=10.46) que la liste Front National s'isole des listes Génération Écologie, Autres, et d'Union, et que la liste d'Europe Solidaire s'isole de l'Autre Politique et des Verts, ces deux dernières se séparant en septième facteur (valeur-propre=.0240 ; inertie=9.27). Dans un dernier temps, la liste d'Union s'isole des listes Génération Écologie et Autres, elles-mêmes se séparant en neuvième facteur (valeur-propre=.0164 ; inertie=6.31).
Le premier résultat de cette analyse se rapporte donc aux caractéristiques lexicologiques communes des interventions des journalistes face à un représentant des listes Autre Europe et Radicale, opposées à celles des autres listes. En effet, à l'exception du Parti Communiste, qui semble susciter un vocabulaire bien particulier, les autres listes semblent recourir à un vocabulaire globalement identique, puisque qu'il faut attendre le quatrième facteur pour trouver une partition entre les deux listes majoritaires : Union, avec les listes Front National, Génération Écologie, et Autres, d'une part, Europe Solidaire, avec Autre Politique et Verts, d'autre part. L'essentiel de cette information étant révélée par le premier facteur, nous interpréterons essentiellement celui-là.
Description du premier axe factoriel
Les 204 formes spécifiques du premier axe factoriel sont rapportées ci-dessous par contributions absolues décroissantes, suivies de leurs coordonnées :
Coordonnées positives :
AUTREUROPE (39,3 ; 0,38), RADICALE (25,1 ; 0,26), juge (2,1 ; 1,92), *je (1,7 ; 0,27), monde (1,5 ; 1,09), vous (1,3 ; 0,1), page (1,2 ; 1,7), udf (1,2 ; 0,87), ai (1,2 ; 0,56), autreeurope (1,1 ; 1,29), mandats (1,0 ; 1,65), question (1,0 ; 0,28), attendez (0,9 ; 0,6), si (0,9 ; 0,28), répondu (0,7 ; 0,89), trop (0,7 ; 0,72), de~gaulle (0,6 ; 1,12), entreprise (0,6 ; 1,04), auditeurs (0,6 ; 0,68), oui (0,6 ; 0,28), salariés (0,5 ; 1,04), décidé (0,5 ; 0,93), forcément (0,5 ; 0,91), allez~y (0,5 ; 0,9), justice (0,5 ; 0,88), siéger (0,5 ; 0,83), élu (0,5 ; 0,79), parlementair (0,5 ; 0,76), avez~vous (0,5 ; 0,74), réponse (0,5 ; 0,69), moi (0,5 ; 0,63), reste (0,5 ; 0,53), pourquoi (0,5 ; 0,42), quand (0,5 ; 0,37), votre (0,5 ; 0,17), c~est (0,5 ; 0,13), chacun (0,4 ; 1,08), déclaré (0,4 ; 1,03), lu (0,4 ; 0,98), extrêmement (0,4 ; 0,92), voulais (0,4 ; 0,89), pas~du~tout (0,4 ; 0,74), simple (0,4 ; 0,69), nos (0,4 ; 0,62), auriez (0,4 ; 0,6), pose (0,4 ; 0,45), d~accord (0,4 ; 0,32), fait (0,4 ; 0,21), non (0,4 ; 0,18), avez (0,4 ; 0,16), ça (0,4 ; 0,13), générale (0,3 ; 0,95), soutenez (0,3 ; 0,89), dis (0,3 ; 0,86), quitter (0,3 ; 0,86), lyonnais (0,3 ; 0,85), crédit (0,3 ; 0,82), argent (0,3 ; 0,79), emplois (0,3 ; 0,73), engagement (0,3 ; 0,73), ensuite (0,3 ; 0,63), hommes (0,3 ; 0,58), vote (0,3 ; 0,52), TRAITROUT (0,3 ; 0,46), crois (0,3 ; 0,46), ma (0,3 ; 0,46), pourcent (0,3 ; 0,36), été (0,3 ; 0,25), voudrait (0,2 ; 0,78), fisc (0,2 ; 0,77), complètement (0,2 ; 0,76), façon (0,2 ; 0,73), comprends (0,2 ; 0,72), préciser (0,2 ; 0,71), créer (0,2 ; 0,7), opération (0,2 ; 0,69), sorte (0,2 ; 0,68), côtés (0,2 ; 0,65), réussi (0,2 ; 0,65), cours (0,2 ; 0,63), or (0,2 ; 0,61), arrive (0,2 ; 0,6), conseil (0,2 ; 0,6), force (0,2 ; 0,59), par~rapport (0,2 ; 0,56), adversaire (0,2 ; 0,55), entreprises (0,2 ; 0,53), opinion (0,2 ; 0,52), appeler (0,2 ; 0,51), solution (0,2 ; 0,51), assemblée (0,2 ; 0,5), suis (0,2 ; 0,49), minutes (0,2 ; 0,48), auditeur (0,2 ; 0,47), considérez (0,2 ; 0,42), affaire (0,2 ; 0,35), sens (0,2 ; 0,35), savoir (0,2 ; 0,34), voilà (0,2 ; 0,29), puisque (0,2 ; 0,27), majorité (0,2 ; 0,24), avoir (0,2 ; 0,21), peut~être (0,2 ; 0,18), mais (0,2 ; 0,1), qui (0,2 ; 0,08).
Coordonnées négatives :
PS (18,5 ; -0,19), PC (13,7 ; -0,22), ADVERSOUT (1,6 ; -0,56), UNION (1,6 ; -0,06), PROCHOUT (1,5 ; -0,52), parti (1,4 ; -0,52), VERTS (1,4 ; -0,15), communiste (1 ; -0,81), socialiste (0,9 ; -0,49), socialistes (0,6 ; -0,63), gauche (0,6 ; -0,32), pacte (0,5 ; -1,09), passé (0,5 ; -0,75), présidentiel (0,5 ; -0,53), europe (0,5 ; -0,18), est~ce~que (0,5 ; -0,14), unitaire (0,4 ; -1,03), forces (0,4 ; -0,82), ps (0,4 ; -0,53), soir (0,4 ; -0,35), est~ce~qu (0,4 ; -0,32), ou (0,4 ; -0,18), et (0,4 ; -0,08), accord (0,3 ; -0,81), heures (0,3 ; -0,81), changer (0,3 ; -0,8), second (0,3 ; -0,79), évoqué (0,3 ; -0,79), franchement (0,3 ; -0,78), élargissemen (0,3 ; -0,78), secrétaire (0,3 ; -0,75), clinton (0,3 ; -0,74), rwanda (0,3 ; -0,7), fin (0,3 ; -0,54), seul (0,3 ; -0,49), gens (0,3 ; -0,47), fond (0,3 ; -0,38), point (0,3 ; -0,35), hier (0,3 ; -0,29), aujourd~hui (0,3 ; -0,26), ils (0,3 ; -0,26), être (0,3 ; -0,23), TRAITRIN (0,3 ; -0,17), plus (0,3 ; -0,17), FN (0,3 ; -0,04), nationales (0,2 ; -0,73), résultat (0,2 ; -0,73), espère (0,2 ; -0,72), instants (0,2 ; -0,71), 1995 (0,2 ; -0,66), social (0,2 ; -0,64), genre (0,2 ; -0,62), réforme (0,2 ; -0,62), conduite (0,2 ; -0,6), différents (0,2 ; -0,6), presse (0,2 ; -0,6), communistes (0,2 ; -0,59), sociale (0,2 ; -0,58), italien (0,2 ; -0,57), camp (0,2 ; -0,54), progrès (0,2 ; -0,54), initiative (0,2 ; -0,53), penser (0,2 ; -0,53), verts (0,2 ; -0,53), constitution (0,2 ; -0,52), nouveau (0,2 ; -0,51), sondage (0,2 ; -0,49), certaine (0,2 ; -0,46), train (0,2 ; -0,46), projet (0,2 ; -0,44), airinter (0,2 ; -0,43), disent (0,2 ; -0,43), grand (0,2 ; -0,43), nouvelle (0,2 ; -0,43), populisme (0,2 ; -0,43), état (0,2 ; -0,42), semble (0,2 ; -0,4), an (0,2 ; -0,39), envie (0,2 ; -0,39), plan (0,2 ; -0,39), tour (0,2 ; -0,39), premier (0,2 ; -0,36), quelque~chose (0,2 ; -0,34), aller (0,2 ; -0,33), sentiment (0,2 ; -0,32), élection (0,2 ; -0,32), européens (0,2 ; -0,31), finalement (0,2 ; -0,31), veut (0,2 ; -0,28), candidat (0,2 ; -0,27), 12-Jun (0,2 ; -0,26), élections (0,2 ; -0,24), président (0,2 ; -0,22), elle (0,2 ; -0,2), ont (0,2 ; -0,2), faire (0,2 ; -0,19), au (0,2 ; -0,1), un (0,2 ; -0,08), *le (0,2 ; -0,04).
Analyse syntaxique : TROPES
Selon son projet de sens, qui lui-même dépend des caractéristiques du locuteur (engagement), de caractéristiques de la situation de communication (entretien non-directif), et de facteurs idéologiques (le marquage politique et les objets abordés), le sujet va opérer un certain nombre de choix dans sa production discursive, lesquels choix se traduiront par la mise en uvre de stratégies qui le conduiront à utiliser préférentiellement certaines catégories logiques (catégories de verbes, d'adjectifs ...) ou syntaxiques (temps et modes verbaux, catégories de connecteurs, modalisateurs ...).
Nous poserons donc par hypothèse que l'analyse des catégories logico-syntaxiques doit confirmer et préciser l'opposition évoquée plus haut entre les listes Autre Europe et Radicale, d'une part (coordonnées négatives), et les listes Europe Solidaire, Parti Communiste, Union, Verts, et Front National, d'autre part (coordonnées positives).
Pour traiter un texte, le logiciel travaille en cinq étapes :
1. découpage des phrases en propositions ;
2. levée dambiguïté des mots du texte ;
3. élaboration de statistiques ;
4. identification des classes déquivalents et de leurs relations ;
5. affichage du résultat.
Ainsi peut-on extraire un tableau des effectifs de chacune des catégories logico-syntaxiques reconnues par TROPES pour chacune des listes, et en faire une représentation factorielle (faite ici à laide du logiciel SPHINX).
La figure 1 permet de retrouver lopposition entre les listes dégagée par lAFC des formes graphiques et confirme lhypothèse dun lien étroit entre sélection référentielle et stratégie énonciative, ce que nous avons déjà évoqué comme texture et structure langagières.
Interprétations
Pronoms et déictiques
Les déictiques significatifs du premier facteur de lAFC lexicale sont essentiellement de première personne du singulier (déictiques de locution : *je, moi, ma) et du pluriel (nos), ainsi que de deuxième personne du pluriel (vous, votre), pour le pôle "Autre Europe et Radicale". Par opposition, le pôle des autres listes se caractérise davantage par des formes pronominales moins présentes et de troisième personne (elle, ils) associées à une présence d'articles (au, un, *le).
Figure 1 : AFC des 50 catégories logico-syntaxiques
La figure 1 montre une opposition de premier facteur entre les formes de première et de deuxième personnes (je, vous) et celles de troisième personne (ils, il), qui confirme deux logiques interlocutoires :
- pour les deux nouvelles listes, l'emploi fréquent des déictiques de locution (rétroréférence, chez Jacques,1979), caractérise une appropriation ou une prise en charge de leurs interventions par les journalistes ("discours" chez Benveniste), qui associée aux formes plus conatives (Jakobson), traduit un souci de construire un contrat de communication réellement dialogique basé sur l'implication des deux interlocuteurs. Il est intéressant de noter que la forme "chacun", bien qu'elle renvoie à des acteurs différents (chacun de nous, chacun de vous, chacun en général), joue toujours sur ce renforcement de leur implication dans le discours.
- pour les listes plus traditionnelles, l'absence de déictiques de locution, corrélative de la présence de formes plus objectales que subjectales, traduit un procès de neutralisation dans le mode référentiel (Jakobson) ou représentatif ("récit" chez Benveniste).
Cette opposition entre dialogue engagé et entretien non-directif va servir de fil conducteur à l'interprétation des autres formes. Ainsi, la référence à des acteurs extérieurs fait-elle appel aux témoins directs de l'émission (auditeur, auditeurs), pour les deux premières listes, tandis qu'on se réfère à des témoins indirects (les gens) pour les autres.
Verbes et prédicats
Sur le premier facteur de lAFC des formes graphiques, les verbes sont, quantitativement, plus fréquents pour les deux nouvelles listes (28 contre 11), et y sont, conformément à ce que l'on peut attendre de l'analyse des pronoms, majoritairement conjugués à la première personne du singulier (ai, voulais, dis, crois, comprends, suis), ou à la deuxième personne du pluriel (attendez, allez-y, avez-vous, auriez, avez, soutenez, considérez). Si l'on ajoute les participes (répondu, décidé, déclaré, lu), on observe que ces verbes ont trait à une activité verbale : l'invité est ici amené à se justifier (question, réponse, pose). Enfin, outre des verbes plus modaux (c'est, fait, été, arrive, avoir), qu'il est toujours délicat dinterpréter, d'autres verbes sont cités à l'infinitif, et renvoient, soit à la même dynamique dialogique (préciser, savoir), soit à un thème lié à l'élection (siéger, quitter, créer, appeler), qui sera plus clair avec l'analyse des substantifs.
Les verbes plus spécifiques des listes traditionnelles sont plus modaux (être, semble, aller, veut, faire) ou renvoient également à des activités verbo-intellectuelles, mais d'une moindre force illocutoire (évoqué, espère, penser, disent).
TROPES effectue lindexation des verbes suivante :
∆
factifs expriment des actions∆
statifs expriment des états ou des notions de possession∆
déclaratifs expriment une déclaration sur un état, un être, un objet ...∆
performatifs expriment un acte par et dans le langage.Les résultats de cette analyse diffèrent sensiblement des précédents : si lAutre Europe présente un recours préférentiel au passé, aux participes, et aux verbes daction, Radicale se distingue moins sur ce plan, étant plutôt dans le présent et linfinitif. Par contre, on voit apparaître deux spécificités notables dans le fait que les questions adressées aux listes PC et FN ont recours à des verbes plus déclaratifs, et que celles posées aux Verts privilégient le conditionnel et le subjonctif. La catégorie des performatifs représente des effectifs extrêmement faibles, mais on peut noter quelle napparaît que dans le cas des listes Radicale (êtes/a déçu) et Autre Europe (serez/sera déçu).
Modalisateurs et joncteurs
Sur le premier facteur de lanalyse des formes graphiques, les "mots-outils" (adverbes et conjoncteurs) des listes nouvelles sont essentiellement de type affirmatif (si, trop, oui, forcément, pourquoi, quand, extrêmement, pas du tout, d'accord, non, or, complètement, par rapport, voilà, puisque, peut-être, mais, qui), tandis qu'ils sont, pour les listes traditionnelles, de types interrogatif (est-ce que, est-ce qu') ou atténuatif (franchement, au fond, quelque chose, finalement, mais également dans l'idée d'avoir le "sentiment" que).
Si TROPES distingue les joncteurs et les modalisateurs, lanalyse de ce corpus ne permet pas de distinguer lemploi préférentiel de lune ou lautre de ces catégories. Par contre, se confirme ici lopposition entre, dune part des joncteurs de condition (si, compte_tenu_de), temps (quand, enfin, lorsque, et_puis, maintenant_que, et_ensuite, une_fois_que, dès_que), cause (donc, parce_que, alors, puisque, c_est_à_dire, en_sorte_que, en_effet, par_conséquent), opposition (mais, quand_même, au_contraire, non_seulement, alors_que, au_lieu_de, pourtant, encore_que, en_tout_cas, en_revanche, même_si, si_ce_n_est, bien_que) et comparaison (comme, moins-que, par_rapport_à, tel_que), associés à des modalisateurs daffirmation (justement, sans_doute, oui, d_ailleurs, absolument, aussi, vraiment, oui_ou_non, évidemment, sûrement, tout_à_fait), négation (pas, ni, rien, jamais, non, pas_du_tout), et doute (peut_être), et liés aux listes Radicale et Autre Europe, et dautre part des joncteurs de disjonction (ou, ou_bien), addition (et, aussi), associés à des modalisateurs de temps (aujourd_hui, d_abord, tout_de_suite, maintenant, tout_le_temps, cette_fois, toujours, tard, en_train_de, tout_à_l_heure, depuis, en_général, déjà, après, souvent, auparavant, depuis_longtemps, désormais, au_cours_de), manière (vite, librement, plutôt, seulement, comment, mal, curieusement, instinctivement, authentiquement, autrement, publiquement, naturellement, typiquement, implicitement, éminemment, indépendamment, durablement, personnellement, éventuellement ...) et dintensité (assez, trop, quelques, très, plus, autant, meilleur, un_peu, plusieurs, plus_ou_moins, tellement, un_petit_peu ...), et liés aux listes majoritaires du Parti Socialiste et de lunion RPR/UDF.
Les adjectifs qualificatifs
TROPES distingue deux catégories dadjectifs :
- "subjectifs", qui indiquent une appréciation sur quelque chose ou quelquun, et que lon retrouve ici plutôt du côté des listes Autre Europe (possible, obligé, principal, véritable, nocif, fondamental, mauvais, étonnant, désastreux, évident, capable, énorme, tragique, simple, positif, conscient, extrême, inéluctable, favorable, classique), Front National (incontestable, difficile, clair, efficace, sûr, fondamental, représentatif, funeste, proche, important, prioritaire, honteux, acceptable, sincère, dangereux, surpris, contestable, essentiel, sévère, indulgent, possible, satisfaisant, ambitieux, bon), et dans une moindre mesure Union RPR/UDF et Radicale ;
- "objectifs", qui indiquent lexistence ou labsence dune propriété, et que lon retrouve ici plutôt du côté des listes Verts (actuelle, internationale, dernier, électoral, absent, ouvert, premier, présidentielle, second, deuxième, nucléaire, nouveau), Parti Communiste (politique, nucléaire, droite, social, futur, unitaire, prochain, deuxième, national, privé, nouveau, démocratique, ancien, fédérale, confédérale, municipales, unitaire, premier, seul, médiatique, publique, ainsi que de nombreux chiffres et pourcentages), et dans une moindre mesure Parti Socialiste et Autre Politique.
Analyse sémantique
Sur le premier facteur de lAFC des formes graphiques, la proportion de substantifs est inversement proportionnelle à celle des verbes, ce qui vient renforcer l'opposition prédication / référentialisation déja évoquée.
Ainsi, les substantifs traduisent, tout d'abord, une certaine gestion de l'entretien avec les listes nouvelles : "simple" (associée à "question"), "façon", "(une)-sorte-(de)" et "générale", mais aussi opinion, solution. Certaines formes renvoient ensuite aux "affaires" de Bernard Tapie (crédit Lyonnais, fisc, affaire), à la situation des élections (juge, justice, de-Gaulle, mandats, élu, parlementaire, engagement, hommes, vote, (aux)-côtés-(de), assemblée), et à une analyse socio-économique (page, monde, entreprise, salariés, argent, emplois, pourcent, conseil, entreprises).
Pour ce qui est des listes traditionnelles, les thèmes sont plus nombreux : les formes qui se rapportent à l'élection dépassent le scrutin européen pour évoquer les échéances présidentielles (présidentiel, 1995, sondage, tour, premier, résultat, élection, candidat, 12juin, élections, président). Le thème de l'Europe est présent (europe, élargissement, européens), mais est englobé dans des considérations nationales (pacte, unitaire, nationales, AirInter, populisme) et internationales (Clinton, Rwanda, italien).
TROPES permet danalyser sémantiquement un corpus en repérant des classes déquivalents, qui regroupent les mots (noms communs ou noms propres) qui apparaissent fréquemment dans le texte et qui possèdent une signification voisine. Par exemple : père et mère seront regroupés dans la classe famille par le logiciel.
Plusieurs niveaux peuvent ainsi être utilisés pour visualiser les classes déquivalents, et les univers de référence regroupent les mots contenus dans les classes déquivalents. Ainsi, le dictionnaire des équivalents est construit selon 3 niveaux de hiérarchie. Au niveau le plus bas se situent les références utilisées, elles-mêmes regroupées de façon plus large dans les univers de référence 2, qui à leur tour sont regroupés dans les univers de référence 1.
Lanalyse des univers de références 1 ne donne pas, ici, de résultat très significatif, la "loi du genre" conduisant à privilégier, pour tous les invités, les catégories générales politique, Europe, France, conflit, emploi, accord, média, communication, sentiment, droit, nation, etc.
Lanalyse des univers de références 2 permet de dresser le plan factoriel suivant :
Figure 2 : univers de référence
Il est remarquable que lanalyse du contenu opère une rupture avec les analyses lexicale et syntaxique précédentes. On retrouve, au centre du graphique, les univers de référence 1 : élections, Europe, liste et politique. Lopposition ne se situe plus ici entre Radicale et Autre Europe, dune part, et les autres listes dautre part, mais entre quatre types de discours :
- sur les élections elles-mêmes (sondage, campagne, discours, candidat) et quelques considérations internationales (ONU, Allemagne), pour les candidats dunion RPR/UDF ;
- sur le monde politique : homme_politique (ministres, députés, parlementaires), doctrine_politique (socialistes, communistes), gauche, accord (alliance) pour les listes Parti Communiste, Parti Socialiste, et dans une moindre mesure lAutre Politique ;
- sur les Pays_bas (Maastricht), les Instances_politiques (Parlements, Assemblées), la Justice et la France, pour lAutre Europe ;
- sur les Moyens_de_paiement (argent, millions_de_francs), la Télévision, lentreprise et le chômage, la question de lintervention en Bosnie (Ex-Yougoslavie, armée, embargo, combat), le tout au plan de la pensée, du raisonnement, de lopinion, pour Radicale, et dans une moindre mesure les Verts.
Conclusion
L'analyse lexicologique des interventions de journalistes nous a permis (1) de déterminer que des termes différents ne renvoyaient pas à la même réalité d'usage social et n'appelaient pas les mêmes réponses, et que (2) l'utilisation préférentielle de l'une ou l'autre de ces formes était liée à la liste politique que représentait l'invité. Cette discrimination ne se fait ni en fonction du temps de présence à l'antenne, comme le laisserait attendre une approche chronométrique, ni en fonction de l'idéologie politique, comme le prévoiraient des politologues institutionnels, mais en fonction de la notoriété des invités dans l'opinion publique, qui recouvre en partie la représentativité parlementaire :
- les listes bien repérées, faisant l'objet de représentations claires (Union RPR/UDF, PC, PS),
- les listes bien repérées mais non représentées au parlement (FN) font l'objet de questions,
- les listres "alternatives" (Autre Europe, Radicale) sont celles envers lesquelles les questions sont les plus précises.
Tout se passe comme si les médias avaient renoncé à l'analyse des contenus idéologiques des programmes électoraux pour privilégier celle des contenus du sens commun, ce qui les conduiraient à mettre en place des filtres cognitifs destinés à traiter différemment la question du chômage en fonction des attentes qu'ils décèlent de la part de l'opinion (sur la foi des sondages), dans le sens d'une implication et d'une complexification renforcées pour les "listes alternatives".