• Aide
  • Eurêkoi Eurêkoi

Article

Longueur de branches et arbres de mots

dans Bases ; corpus et langage - UMR 6039


  • Éditeur(s)
  • Date
    • 2013-06-27T02:00:00Z
  • Notes
    • Les arbres de mots constituent un des outils de la statistique textuelle pour visualiser les relations sémantiques entre mots d’un texte. Les méthodes de construction de ces arbres à partir d’une distance de co-occurrence dans le texte produisent des arbres dont les longueurs d’arêtes se prêtent mal à l’analyse. Pour faciliter l’interprétation visuelle de l’arbre, l’idéal serait que des longues arêtes séparent des classes sémantiques de mots. Ainsi, découper les arêtes les plus longues de l’arbre devrait conduire à une partition de l’ensemble des mots qui fournit des classes pertinentes. A l’aide de deux corpus dont un sous-ensemble de mots a été partitionné en un ensemble de classes sémantiques, nous évaluons plusieurs formules permettant de recalculer les longueurs d’arêtes de l’arbre construit à partir des distances de co-occurrence, afin de rendre l’interprétation de l’arbre plus facile et plus fiable.
  • Langues
    • Français
  • Sujet(s)
  • Droits
    • info:eu-repo/semantics/openAccess .
    • All rights reserved
  • Résultat de :