• Aide
  • Eurêkoi Eurêkoi

Article

Le projet ORFÉO : un corpus d’étude pour le français contemporain

dans Bases ; corpus et langage - UMR 6039


  • Éditeur(s)
  • Date
    • 2018-01-26T01:00:00Z
  • Notes
    • L’article présente le projet ORFEO (outils pour l’étude du Français écrit et oral). Ce projet a consisté à rassembler 4M de mots de Français oral et 6M de mots d’écrit à partir de ressources existantes. Les ressources orales ont été unifiées dans un format trs et alignées avec les fichiers sons au phonème. Les corpus sont présentés avec des métadonnées qui permettent de constituer des sous-corpus d’étude. Les données orales ont été segmentées et annotées en POS et relations de dépendance semi automatiquement. La précision des annotations a fait l’objet d’une évaluation. L’ensemble est interrogeable à partir d’une plateforme adaptée du logiciel libre ANNIS. La ressource sera mise à disposition en open source courant 2017.
  • Langues
    • Français
  • Sujet(s)
  • Droits
    • info:eu-repo/semantics/openAccess .
    • All rights reserved
  • Résultat de :