Bonjour,
Je suis confronté à un problème avec un groupe d’étudiants que j’encadre dans l’analyse d’un corpus collecté sur un blog. Le corpus est assez important (> 93.000 mots). Par conséquent, j’ai proposé aux étudiants de construire un scénario qui s’applique au corpus et qui permet de répondre aux questions de recherche (plutôt que de se limiter au scénario par défaut). Le nouveau scénario ne reprend qu’une partie des références du scénario par défaut. Nous nous attendions donc à obtenir moins de propositions remarquables et, surtout, moins d’épisodes. En effet, une des caractéristiques du corpus est que les internautes se répondent. Nous aimerions donc pouvoir examiner s’il y a une évolution dans le temps de l’utilisation de certaines références. Cependant, même en construisant les relations sur le nouveau scénario, en plaçant le seuil de détection des classes à 400 de facteur de pertinence et en demandant à Tropes d’afficher le moins de propositions remarquables possible, nous obtenons 67 propositions remarquables (ce qui n’est pas vraiment un problème; cela reste lisible et interprétable) et 65 épisodes (ce qui, par contre, est plus problématique car complique beaucoup la lecture des résultats). Est-il possible de faire diminuer le nombre d'épisodes affichés ? Existe-t-il une autre solution que celle qui consisterait à diviser le corpus par semaine (i.e., un fichier par semaine, sachant que le corpus s’étend sur 7 semaines) ?
D'avance, merci.
Je suis confronté à un problème avec un groupe d’étudiants que j’encadre dans l’analyse d’un corpus collecté sur un blog. Le corpus est assez important (> 93.000 mots). Par conséquent, j’ai proposé aux étudiants de construire un scénario qui s’applique au corpus et qui permet de répondre aux questions de recherche (plutôt que de se limiter au scénario par défaut). Le nouveau scénario ne reprend qu’une partie des références du scénario par défaut. Nous nous attendions donc à obtenir moins de propositions remarquables et, surtout, moins d’épisodes. En effet, une des caractéristiques du corpus est que les internautes se répondent. Nous aimerions donc pouvoir examiner s’il y a une évolution dans le temps de l’utilisation de certaines références. Cependant, même en construisant les relations sur le nouveau scénario, en plaçant le seuil de détection des classes à 400 de facteur de pertinence et en demandant à Tropes d’afficher le moins de propositions remarquables possible, nous obtenons 67 propositions remarquables (ce qui n’est pas vraiment un problème; cela reste lisible et interprétable) et 65 épisodes (ce qui, par contre, est plus problématique car complique beaucoup la lecture des résultats). Est-il possible de faire diminuer le nombre d'épisodes affichés ? Existe-t-il une autre solution que celle qui consisterait à diviser le corpus par semaine (i.e., un fichier par semaine, sachant que le corpus s’étend sur 7 semaines) ?
D'avance, merci.