Groupe d'Analyse des Données Textuelles - Ressources Textométriques
Liens
Corpus
Discours Sarkozy par Fabien Poulard. Le corpus est placé sous licence LGPL-LR en tant qu’œuvre dérivée des discours originaux. Le corpus distribué contient : les discours originaux au format PDF ; une conversion propre des discours originaux en texte brut ; un nettoyage et une structuration XML des discours (extraction des titres, de la date, ...). Le tout réorganisé chronologiquement. Les fichiers sont en effet préfixés de la date de prononciation du discours.
...
...
...
...
Applications
...
...
...
...
...