Bonjour,
je travaille sur un corpus de réponses à des questions fermées : il s'agit exclusivement de noms de marques.
Je rencontre le problème suivant :¨
La mrque "Saint Agaume" n'est pas prise en compte, le logiciel comptabilise le nom "saint" et le nom "agaume"séparément, ce qui fausse les résultats puisque les noms sont comptabilisés 2 fois pour une seule occurrence renvoyant à une locution figée, non prise en compte.
J'obtiens le même constat pour "Justin Bridou" :
-soit la locution est prise en compte et comptabilisée.
- soit elle ne l'est pas , les deux noms sont comptabilisés séparément ce qui fausse les résultats. Pourquoi la locution n'est elle pas toujours prise en compte, alors que pourtant les noms sont collés, lorsque c'est soit bridou, soit justin qui sont comptabilisés.
Merci de votre réponse.
LC
je travaille sur un corpus de réponses à des questions fermées : il s'agit exclusivement de noms de marques.
Je rencontre le problème suivant :¨
La mrque "Saint Agaume" n'est pas prise en compte, le logiciel comptabilise le nom "saint" et le nom "agaume"séparément, ce qui fausse les résultats puisque les noms sont comptabilisés 2 fois pour une seule occurrence renvoyant à une locution figée, non prise en compte.
J'obtiens le même constat pour "Justin Bridou" :
-soit la locution est prise en compte et comptabilisée.
- soit elle ne l'est pas , les deux noms sont comptabilisés séparément ce qui fausse les résultats. Pourquoi la locution n'est elle pas toujours prise en compte, alors que pourtant les noms sont collés, lorsque c'est soit bridou, soit justin qui sont comptabilisés.
Merci de votre réponse.
LC
lelan a écrit:Bonjour,
Je travaille sur un corpus fermé de noms de marques.
J'aimerais que le logiciel reconnaisse et comptabilise des locutions comme "just un bridou" ou "juste un bridou" pour justin bridou.
Comment faire? je vous remercie de votre réponse.
lc
lelan a écrit:Bonjour,
Je travaille sur un corpus de réponses fermées comprenant seulement des noms de marque, sans phrases. Il y a des noms de marques qui ne sont pas pris en compte, ex : "bridous " ou "bridon", alors que "bridoux" ou " bridou" sont répertoriés. Comme faire pour éviter que ces occurrences passent à la trappe ?
merci de votre réponse.
LC