• Aide
  • Eurêkoi Eurêkoi

Article

Représentations du texte pour la classification arborée et l’analyse automatique de corpus. Application à un corpus d’historiens latins

dans Centre d’analyse et de mathématique sociales de l’EHESS


  • Éditeur(s)
  • Date
    • 2009-12-15T01:00:00Z
  • Notes
    • Nous exposons ici différentes méthodes de classification automatique des textes littéraires et nous en comparons les performances, notamment en ce qui concerne leur aptitude à traduire les structurations génériques du corpus. Nous montrons qu’une approche topologique des textes, qui prend en compte leur linéarité fondamentale, c’est-à-dire l’ordre macro- et micro-structurel de leurs différentes unités constitutives, permet d’obtenir de meilleurs résultats classificatoires que les méthodes traditionnelles qui tendent à négliger cette structure linéaire.
  • Langues
    • Français
  • Sujet(s)
  • Droits
    • info:eu-repo/semantics/openAccess .
    • All rights reserved
  • Résultat de :