Newer
Older
explore-corpus / Niveau-2 / Polaris récent / README.md
@camille camille on 10 Jul 2018 793 bytes directory name change
POLARIS - Corpus récent
=======================

Le corpus ***Polaris récent*** contient des documents extraits de l'archive Istex, circonscrits à la zone polaire arctique et publiés entre 2000 et 2015.

L'exploration thématique de ce corpus a été réalisée au moyen de l'outil **[IRaMuTeQ](http://iramuteq.org/)**. 

Cet outil nécessite un prétraitement des données pour n'ingérer qu'un fichier unique, comportant à la fois les métadonnées et les textes correspondants. Ce prétraitement s'opère en deux étapes  :

- constitution du fichier de données en entrée = textes concaténés et précédés chacun des métadonnées que l’on souhaite explorer selon une syntaxe précise ;

- Sélection des métadonnées suivantes : titre de revue, langue, type de document.