diff --git a/Niveau-2/README.md b/Niveau-2/README.md index 4d16ddf..30ada85 100644 --- a/Niveau-2/README.md +++ b/Niveau-2/README.md @@ -5,11 +5,23 @@ Cette exploration a pour objectif de mettre en évidence les différentes thématiques abordées ou les différents points de vue sous lesquels est abordée une thématique. Elle vise également à identifier les éventuels manques et/ou anomalies dans les thématiques. Elle permettra ainsi d’améliorer la qualité du corpus et de cibler la meilleure manière de le valoriser. + + ## Corpus ### Polaris -Les corpus Polaris sont constitués de documents Istex relatifs à l'Arctique. +Les corpus Polaris contiennent des publications issus de l'archive ISTEX et relatifs à l'Arctique. Deux corpus ont été constitués correspondant l'un à des documents publiés récemment, et l'autre à des documents datant de plus d'un siècle. L'objectif visé est de mettre en évidence les évolutions temporelles des sujets de recherche sur une zone géographique précise, au moyen d'une exploration des thématiques contenues dans chacun des corpus. + +- #### Corpus ancien : + + - ***Polaris ancien v1 (sans documents de l'éditeur Cambridge)*** : 583 documents + - ***Polaris ancien v2 (avec documents de l'éditeur Cambridge)*** : 783 documents + +- #### Corpus récent : + + - ***Polaris récent v1 (sans documents de l'éditeur Cambridge)*** : 11 731 documents + - ***Polaris récent v2 (avec documents de l'éditeur Cambridge)*** : 12 303 documents ### Vieillissement @@ -19,6 +31,8 @@ **vieillissement v2** : 8 707 documents + + ## Outils Le logiciel d’analyse statistique **[IRaMuTeQ](http://iramuteq.org/)** est utilisé pour détecter les thématiques pertinentes et les représenter sous forme de dendrogrammes et de nuages de mots dans les corpus Polaris et Vieillissement.