Bonjour (ou plutot bonsoir)
Tropes est un logiciel des plus puissant pour la conduite de lanalyse des données variées. Sa combinaison avec Zoom lui permettait de traiter des fichier différents et d'obtenir des résultat sous forme de feuille de données type tableur. Or, si notre logiciel favoris est désormais grauit, il ne dispose plus de la puissance de Zoom. Est ce à dire que nous devons nous contenter de traiter différents fichiers comme s'il ne s'agissait que d'un unique corpus volumineux? bien entendu non. Depuis que Pierre à implémenté lexport sous Gephi (logiciel d'analyse en réseaux sociaux), la puissance de TROPES a été démultipliée. Si une prise en mains de Gephi dépasse le cadre de ce post, quelques précisions ne sont cependant pas du luxe...
Gephi permet de dépasser la seule prise en compte de l'importance d'un RN (ou thème, créer via l'outil scénario de TROPES) par la prise en compte des coocurences entre RN (ou thèmes). Dès lors, l'analyse de la centralité d'un item (thème, RN, à vous de faire le choix du bon vocable) dans un corpus se mesure :
via les mesures de degrés (nombre de coocurences entre cet item et les autres items).
via le coefficient d'intermédiarité (betweenness dans GEPHI : statisitques > plus court chemin, Exécuter
via le coefficient de proximité (closeness, meme démarche que ci dessus.
Egalement, et c'est un point particulièrement intéressant dans la combinaison TROPES + GEPHI, il est possible de faire ressortir des univers sémantiques via l'analyse en modularité (dans GEPHI : Statistiques > modularité, executer). Dans ce cas, GEPHI analyse et repère, ce que nous pouvons appeler des univers sémantiques par l'analyse des multiples cooccurences entre items. Des groupes d'items fortement cooccurents entre eux mais faiblement cooccurents avec d'autres items peuvent être considéré comme des modules relativement indépendant les uns des aurtes (c'est un raccourci, mais dans l'idée, c'est cela). Pour une visibilité optimal de vos différents module (Qui pourraient correspondre aux UCE d'alceste sans doute), je vous conseille de sélectionner, dans la fenêtre classement (en haut a gauche) et après avoir cliquez sur "noeuds"), -> modularity class (c'est dans une liste déroulante). Vous sélectionner couleur (la palette) et vous validez. Normalement, vos différents modules seront regroupé par affinité de couleur... et vous aurez un lisibilité optimale des regroupements des différents RN.
Un autre atout de GEPHI (car c'était de cela que je venais parler en fait...) c'est de retrouver la puissance de Zoom donc... comment faire? en bidouillant (mais c'est un peu ma spécialité apparemment). Pour cela, je parts du principe que vous avez exporter dans gephi les résultats de tropes obtenus à partir de plusieurs fichiers / Dossiers (matrice document x concepts).
1. Ouvrez votre fichiers TROPES ontology
2. allez dans laboratoire de données
3. Cliquez sur lien
4. Exportez le tableau au format csv (en neguardant que source, destination et poids (Weight)
5. Sous un tableur quelconque, restructurer au besoin votre fichier csv de manière q ce que les trois colonne soient bien nommées
6. Passez sous R (environnement libre de traitement de données statistiques (http://cran.r-project.org/)
7. installer le package (reshape2) -> install.package("reshape2")
8. Charger le package -> library("reshape2")
9. Charger votre fichier csv précédant
MAintenant, voilà l'idée : Il va falloir que votre tableau de données composé de 2 colonnes spécifiant l'ensemble des relations entre vos documents et les RN (ou thèmes, ou items....) devienne une matrice dans laquelle pour chaque document (en ligne) sont associés en colonnes les termes de votre scénario (comme ce que l'on avait avant sous ZOOM). Il faut donc transposer votre tableau de données. Pour cela, rien de plus simple :
tableau <- read.csv("le chemin_de_votre_fichier_exporter_de_gephi.csv")
tableau$Weight<-as.numeric(tableau$Weight) #transformer poids (Weight) en variable numérique (au cas où)
nouveau.tableau<-dcast(tableau,Source~Destination,fun.aggregate=sum,value.var='Weight') #création de la feuille de donnée avec document en ligne, items du scénario en colonne)
ici, dcast est la fonction appelée, tableau est l'identité du tableau de départ, Source est le nom de la colonne source dans le fichier Gephi, Destination est le nom de la colonne destination dans le fichier GEPHI, fun.aggregate=sum mentionne que l'on veut que soient additionner les différents poids des items (sinon, cela converti seulement en 0 ou 1, présent ou absent), value.var="Weight" désigne la colonne mentionne le poids des relations)
après, soit vous aimez R et vous continuez à travailler avec le fichier nouveau.tableau, soit vous exportez ce nouveau fichier au format csv pour travailler avec vos logiciels habituels : write.table(nouveau.tableau,"chemin de destination du fichier.csv")
et voilà, la puissance de TROPES, le Moteur de zoom en 2 scripts !!!! Vive le logiciel libre
Sur ce, bonne nuit (il est tard, vous me pardonnerez pour les fautes et erreurs grammaticales diverses)
Brice
Tropes est un logiciel des plus puissant pour la conduite de lanalyse des données variées. Sa combinaison avec Zoom lui permettait de traiter des fichier différents et d'obtenir des résultat sous forme de feuille de données type tableur. Or, si notre logiciel favoris est désormais grauit, il ne dispose plus de la puissance de Zoom. Est ce à dire que nous devons nous contenter de traiter différents fichiers comme s'il ne s'agissait que d'un unique corpus volumineux? bien entendu non. Depuis que Pierre à implémenté lexport sous Gephi (logiciel d'analyse en réseaux sociaux), la puissance de TROPES a été démultipliée. Si une prise en mains de Gephi dépasse le cadre de ce post, quelques précisions ne sont cependant pas du luxe...
Gephi permet de dépasser la seule prise en compte de l'importance d'un RN (ou thème, créer via l'outil scénario de TROPES) par la prise en compte des coocurences entre RN (ou thèmes). Dès lors, l'analyse de la centralité d'un item (thème, RN, à vous de faire le choix du bon vocable) dans un corpus se mesure :
via les mesures de degrés (nombre de coocurences entre cet item et les autres items).
via le coefficient d'intermédiarité (betweenness dans GEPHI : statisitques > plus court chemin, Exécuter
via le coefficient de proximité (closeness, meme démarche que ci dessus.
Egalement, et c'est un point particulièrement intéressant dans la combinaison TROPES + GEPHI, il est possible de faire ressortir des univers sémantiques via l'analyse en modularité (dans GEPHI : Statistiques > modularité, executer). Dans ce cas, GEPHI analyse et repère, ce que nous pouvons appeler des univers sémantiques par l'analyse des multiples cooccurences entre items. Des groupes d'items fortement cooccurents entre eux mais faiblement cooccurents avec d'autres items peuvent être considéré comme des modules relativement indépendant les uns des aurtes (c'est un raccourci, mais dans l'idée, c'est cela). Pour une visibilité optimal de vos différents module (Qui pourraient correspondre aux UCE d'alceste sans doute), je vous conseille de sélectionner, dans la fenêtre classement (en haut a gauche) et après avoir cliquez sur "noeuds"), -> modularity class (c'est dans une liste déroulante). Vous sélectionner couleur (la palette) et vous validez. Normalement, vos différents modules seront regroupé par affinité de couleur... et vous aurez un lisibilité optimale des regroupements des différents RN.
Un autre atout de GEPHI (car c'était de cela que je venais parler en fait...) c'est de retrouver la puissance de Zoom donc... comment faire? en bidouillant (mais c'est un peu ma spécialité apparemment). Pour cela, je parts du principe que vous avez exporter dans gephi les résultats de tropes obtenus à partir de plusieurs fichiers / Dossiers (matrice document x concepts).
1. Ouvrez votre fichiers TROPES ontology
2. allez dans laboratoire de données
3. Cliquez sur lien
4. Exportez le tableau au format csv (en neguardant que source, destination et poids (Weight)
5. Sous un tableur quelconque, restructurer au besoin votre fichier csv de manière q ce que les trois colonne soient bien nommées
6. Passez sous R (environnement libre de traitement de données statistiques (http://cran.r-project.org/)
7. installer le package (reshape2) -> install.package("reshape2")
8. Charger le package -> library("reshape2")
9. Charger votre fichier csv précédant
MAintenant, voilà l'idée : Il va falloir que votre tableau de données composé de 2 colonnes spécifiant l'ensemble des relations entre vos documents et les RN (ou thèmes, ou items....) devienne une matrice dans laquelle pour chaque document (en ligne) sont associés en colonnes les termes de votre scénario (comme ce que l'on avait avant sous ZOOM). Il faut donc transposer votre tableau de données. Pour cela, rien de plus simple :
tableau <- read.csv("le chemin_de_votre_fichier_exporter_de_gephi.csv")
tableau$Weight<-as.numeric(tableau$Weight) #transformer poids (Weight) en variable numérique (au cas où)
nouveau.tableau<-dcast(tableau,Source~Destination,fun.aggregate=sum,value.var='Weight') #création de la feuille de donnée avec document en ligne, items du scénario en colonne)
ici, dcast est la fonction appelée, tableau est l'identité du tableau de départ, Source est le nom de la colonne source dans le fichier Gephi, Destination est le nom de la colonne destination dans le fichier GEPHI, fun.aggregate=sum mentionne que l'on veut que soient additionner les différents poids des items (sinon, cela converti seulement en 0 ou 1, présent ou absent), value.var="Weight" désigne la colonne mentionne le poids des relations)
après, soit vous aimez R et vous continuez à travailler avec le fichier nouveau.tableau, soit vous exportez ce nouveau fichier au format csv pour travailler avec vos logiciels habituels : write.table(nouveau.tableau,"chemin de destination du fichier.csv")
et voilà, la puissance de TROPES, le Moteur de zoom en 2 scripts !!!! Vive le logiciel libre
Sur ce, bonne nuit (il est tard, vous me pardonnerez pour les fautes et erreurs grammaticales diverses)
Brice