• Aide
  • Eurêkoi Eurêkoi

Article

Discourse on climate and energy justice: a comparative study of Do It Yourself and Bootstrapped corpora

dans Bases ; corpus et langage - UMR 6039


  • Éditeur(s)
  • Date
    • 2018-07-10T02:00:00Z
  • Notes
    • Cet article décrit et analyse les différentes étapes de constitution d’un corpus représentatif des questions de justice climatique et énergétique. Le corpus contient cinq millions de mots en tout et rassemble des rapports, des lettres d’information et pages web traitant des solutions équitables à faible empreinte carbone pour limiter le changement climatique. Il est divisé en six sous-corpus selon les types de communautés de discours et de méthodes de constitution. Nous commençons par la présentation du petit corpus fait maison que nous utilisons comme point de départ. Trois communautés de discours ont été sélectionnées afin d’observer d’éventuelles variations dans leur traitement de ces questions : Organisations Non Gouvernementales, institutions onusiennes et organisations du secteur de l’énergie renouvelable. Les sources ont été sélectionnées en fonction des auteurs, dates et mots clés présents dans les titres. Grâce aux logiciels de concordance AntConc et WMatrix, nous avons testé la comparabilité de ces corpus du point de vue de leur contenu thématique, de leur terminologie et de la classification de leurs unités lexicales. Nos premiers résultats nous permettent de confirmer l’existence de variations entre communautés de discours. Le caractère chronophage de notre démarche de constitution d’un corpus « maison », ainsi que le déséquilibre entre le nombre de mots obtenus pour chaque sous-corpus nous conduisent à utiliser BootCat afin de constituer un corpus plus fourni. L’outil utilise des mots clés comme « semences » pour la récupération et le téléchargement automatiques de pages web. Nous pouvons ainsi comparer une méthodologie traditionnelle de constitution de corpus à une méthodologie qui utilise le web en tant que corpus. Nos résultats BootCat sont confrontés à ceux du corpus maison pour voir s’ils révèlent aussi bien les spécificités des sous-corpus. Cette démarche aboutit à des conclusions sur les possibles utilisations de corpus relativement petits, et d’en souligner la pertinence pour l’étude de discours spécialisés.
  • Sujet(s)
  • Droits
    • info:eu-repo/semantics/openAccess .
    • All rights reserved
  • Résultat de :