Groupe d'Analyse des Données Textuelles - Ressources Textométriques

 

Le groupe GADT-Ressources Textométriques réunit des chercheurs de la communauté des statistiques textuelles

La démarche textométrique repose sur l'hypothèse, vérifiée à partir de très nombreuses expériences, que pour comparer les différentes parties d'un ensemble de textes, que l'on peut considérer comme autant de contenants, il est utile d'observer, au sein de ces textes, les variations de fréquence de systèmes d'unités textuelles : lexèmes, graphèmes, etc., que l'on peut considérer comme des contenus. L'analyse de ces variations constatées au plan statistique fournit, en général, un éclairage précieux sur les ressemblances et les oppositions pouvant exister entre ces textes sur des plans d'analyse qui intéressent plus directement les chercheurs qui entreprennent ces expériences (linguistes, analystes de discours, sociologues, politologues, etc.). Une description formelle de ces deux systèmes d'unités (contenants et contenus) permet d'obtenir, à l'aide de procédures informatisées, des décomptes qui se présentent sous formes de vastes tableaux statistiques (à une ou à plusieurs dimensions). Dans la pratique, la taille de ces tableaux constitue un obstacle à toute utilisation directe par le chercheur. Une série de méthodes d'analyse statistique adaptées au traitement des données textuelles (analyses textométriques) doivent alors être requises pour aider le chercheur à repérer des points saillants, liés à la répartition statistique des contenus au sein du corpus, et, si possible à établir des synthèses statistiques qui constitueront des points de départ précieux pour la mise en évidence des principales dimensions de variation du corpus analysé.
Les contrastes entre textes (ou parties de textes) mis en évidence au plan textométrique trouvent leur explication dans différents plans d'analyse textuelle (lexicologie, syntaxe, sémantique, stylistique, analyse du discours, etc.). Le retour systématique au texte s'impose alors comme seule possibilité de contrôle et de validation des différences entrevues au plan statistique. Pour cette raison, les logiciels de textométrie articulent en général plusieurs ensembles de méthodes : certaines sont destinées à produire des synthèses statistiques ; les autres sont mobilisables pour obtenir des restitutions du contexte, organisées autour des points saillants du texte mises en évidence par les premières.


Söze-Duval Keyser. Pour une textométrie opérationnelle, 2008 (DOC)

Le Trameur, réalisé par Serge Fleury, [Fleury 2007], fournit l'exemple un outil opérationnel, capable de construire une trame et un cadre un cadre textométriques à partir d'une ressource textuelle.
Lien : http://www.tal.univ-paris3.fr/trameur/

 

Contacts

Serge Fleury
François Daoust
André Salem