• Aide
  • Eurêkoi Eurêkoi

Article

Mutualisation et uniformisation de ressources de français parlé

dans Presses universitaires de la Méditerranée


  • Éditeur(s)
  • Date
    • 2013-10-16T02:00:00Z
  • Notes
    • La constitution de corpus oraux étant très coûteuse, il apparaît à l’heure actuelle incontournable de mettre des ressources en commun afin d’obtenir un corpus significatif pour la description du français. Notre expérience a consisté à réunir six corpus de français parlé, chacun étant transcrit et annoté en fonction d’un objectif particulier (sociolinguistique, phonologique, syntaxique). Nous présentons dans cet article la méthodologie adoptée pour obtenir des données unifiées et mises en forme dans une optique d’utilisation de logiciels d’enrichissement/exploitation de corpus. En effet, l’étape suivante sera de recourir à des outils de traitement automatique de corpus (analyseurs morpho-syntaxiques) ainsi que des outils de requêtes (concordanciers). Cette expérience nous a montré à quel point il est primordial de définir des recommandations pour les conventions de transcription, afin de faciliter l’échange et la mise en commun des données.
  • Langues
    • Français
  • Sujet(s)
  • Droits
    • info:eu-repo/semantics/openAccess .
    • https://creativecommons.org/licenses/by-nc-nd/4.0/
  • Résultat de :