Groupe d'Analyse des Données Textuelles - Textométrie multilingue

 

 

Le groupe GADT-Textométrie multilingue réunit des chercheurs de la communauté des statistiques textuelles intéressés par l'analyse de corpus multilingues.

La textométrie regroupe l'ensemble des méthodes quantitatives permettant d'opérer des réorganisations formelles de la séquence textuelle et des analyses statistiques portant sur l'ensemble des unités textuelles d'un corpus. La particularité de l'analyse textométrique réside dans l'existence d'un rapport étroit entre les données textuelles, les modes d'observation de ces données et les résultats visés.

Les méthodes d'analyse textuelle développées en textométrie trouvent actuellement des applications de plus en plus nombreuses dans des domaines variés qui s'étendent de la lexicographie à l'analyse du discours politique, de la recherche documentaire à la recherche en marketing, de la linguistique computationnelle, à la sociolinguistique, etc.

Dans un contexte multilingue, cette approche offre des perspectives de recherches prometteuses pour de multiples dimensions d'analyse de corpus dans des langues différentes (alignement automatique, extraction de ressources traductionnelles, navigation intertextuelle, synthèse de l'information, etc.).

 

Contacts

Serge Fleury (Email : serge.fleury@univ-paris3.fr)
André Salem (Email : salem@msh-paris.fr)