explore-corpus / Niveau-1 / Iramuteq /
@besagni besagni authored on 1 Dec 2017
..
Construction_Dictionnaires_Nom_Espèce.pl Ajout du module Perl “Encode” 6 years ago
Préparation_Données_entrée_Iramuteq.pl 6commits 6 years ago
Préparation_Données_entrée_Iramuteq2.pl 6commits 6 years ago
README.md Information complémentaire 6 years ago
README.md

IRaMuTeQ

Ensemble de scripts Perl développés par Panpan Hu pour générer les fichiers utilisables par le logiciel d’analyse statistique IRaMuTeQ.

Programmes

Construction_Dictionnaires_Nom_Espèce.pl :

Script Perl qui prend en entrée une liste de noms d'espèce animales et végétales, un nom par ligne suivi d’une tabulation et de la mention “animalia” ou “plantae”. Comme par exemple :

    Abies bifida    plantae
    Gadus morhua    animalia

Le programme sélectionne les noms d'espèces d'un règne et génère un ou deux fichiers pour IRaMuTeQ. D’une part, il transforme les noms d'espèce en une expression formant un seul mot puisqu’IRaMuTeQ travaille mot à mot :

    Abies bifida    Abies_bifida
    Gadus morhua    Gadus_morhua

D’autre part, il définit cette expression comme une entrée du lexique avec un lemme (l’expression elle-même) et le type grammatical “nom” :

    Abies bifida    Abies_bifida    nom
    Gadus morhua    Gadus_morhua    nom

Syntaxe

    Construction_Dictionnaires_Nom_Espèce.pl -i input -o output -t ("animalia"|"plantae") [ -l lexique ]

Le fichier de sortie output est à ajouter dans le dictionnaire “expression_en.txt” d’IRaMuTeQ. Sous Unix/Linux, ce dictionnaire se trouve dans le répertoire “~/.iramuteq/dictionnaires”. Optionnellement, ce programme peut créer un fichier lexique à ajouter au dictionnaire “lexique_en.txt” dans le même répertoire.

Préparation_Données_entrée_Iramuteq.pl :

Concatène les données du sous-corpus Arthropodes préparées pour TXM.

Préparation_Données_entrée_Iramuteq2.pl :

Concatène les données de l'ensemble du corpus systématique animale v1 préparées pour TXM. Etant donné que ce corpus comprend 11 sous-corpus, un critère de sous-corpus est nécessaire dans les données d’entrée.