• Aide
  • Eurêkoi Eurêkoi

Article

Corpus linguistics for low-density varieties. Minority languages and corpus-based morphological investigations

dans Bases ; corpus et langage - UMR 6039


  • Éditeur(s)
  • Date
    • 2022-03-02T01:00:00Z
  • Notes
    • La linguistique de corpus s’est développée dans le cadre des variétés écrites (et littéraires), tandis que sa récente révolution méthodologique est due à la capacité assistée par ordinateur d’élaborer des quantités massives de données textuelles. D’autre part, les variétés dites ‘à faible densité’ comprenant les variétés parlées ainsi que les variétés parlées dans les communautés minoritaires, ont été confinées à un rôle plutôt marginal. Cela est dû, entre autres, aux problèmes techniques liés au faible degré de normalisation en termes linguistiques, y compris graphémiques, de ces variétés ainsi qu’à la rareté des ressources linguistiques pour leur traitement automatique. Dans cet article, nous allons exploiter les possibilités offertes par la linguistique de corpus pour acquérir et analyser le patrimoine textuel des communautés allemandes Walser du Piémont et de la Vallée d’Aoste. Les variétés d’alémanique supérieur qui y sont parlées, dramatiquement exposées à des processus avancés de décadence linguistique, fournissent une quantité limitée mais significative de données, qui s’accompagne d’une documentation lexicale substantielle due à la collaboration active des communautés dans la collecte et la compilation de dictionnaires locaux. Après une brève présentation de nos archives et la discussion des solutions particulières adoptées pour la construction de la plate-forme, nous présenterons également des investigations morphologiques basées sur corpus concernant la représentation des préfixes verbaux, du groupe clitique, ainsi que du comportement flexionnel des classes de verbes.
  • Langues
    • Anglais
  • Sujet(s)
  • Droits
    • info:eu-repo/semantics/openAccess .
    • All rights reserved
  • Résultat de :