Analyse des opinions dans les interactions
De la fouille de données à l'interaction humain-agent
Chloé Clavel
iSTE editions
Avant-propos1
Introduction. De la fouille d'opinions aux interactions humain-agent5
Chapitre 1. Corpus d'interactions orales et écrites27
1.1. Corpus H-H oraux : centres d'appels et enquêtes de satisfaction28
1.1.1. CallSurf et Vox Factory : corpus des centres d'appels28
1.1.2. Enquêtes de satisfaction : corpus NPS07-0930
1.2. Corpus H-H écrits : forums32
1.2.1. Données de forum : corpus WebGRC32
1.2.2. Corpus externes d'analyse d'opinions utilisés comme référence33
1.2.2.1. Corpus Deft07-jeuxvidéo33
1.2.2.2. Corpus Movies Polarity Dataset33
1.3. Corpus H-A oraux : personnage virtuel et robot34
1.3.1. Corpus Semaine : vers une situation d'interaction humain-agent34
1.3.2. Corpus WoZ de négociation humain-agent35
1.3.3. Corpus humain-robot : UE-HRI35
1.3.3.1. Collecte et scénario d'interaction36
1.3.3.2. Annotation de l'engagement de l'utilisateur37
1.4. Corpus H-A écrit : chatbot humain-agent40
1.5. Étude comparative des différents corpus42
1.5.1. Corpus d'entreprise versus corpus académiques en contexte H-H42
1.5.1.1. Spécificités langagières43
1.5.1.2. Labels implicites et explicites43
1.5.2. Corpus H-A44
1.6. Conclusion45
Chapitre 2. L'analyse des opinions de l'utilisateur dans les interactions humain-humain47
2.1. De la modélisation linguistique à l'apprentissage automatique48
2.1.1. Système à base de règles et apprentissage automatique48
2.1.2. Recherche de chaînes caractéristiques d'opinions et catégorisation52
2.1.2.1. Évaluation sur différents corpus53
2.1.3. Extraction des chaînes reliant des sujets et des opinions55
2.1.3.1. Repérer des sujets55
2.1.3.2. Repérer les n-grammes d'opinions au voisinage du sujet56
2.1.3.3. Extraction de la chaîne de caractère reliant l'opinion au sujet58
2.2. Vers la prise en compte des spécificités langagières58
2.2.1. Spécificités de l'écrit conversationnel : cas des forums59
2.2.1.1. Nettoyage en amont59
2.2.1.2. Extraction de spécificités rédactionnelles des corpus web60
2.2.2. Spécificités de l'oral conversationnel61
2.3. Conclusion64
Chapitre 3. L'analyse des opinions de l'utilisateur dans les interactions humain-agent65
3.1. Choix des phénomènes étudiés en fonction de l'application67
3.1.1. Modélisation des goûts de l'utilisateur68
3.1.2. Phénomènes caractéristiques des problèmes d'interactions68
3.2. Système à base de règles pour la prise en compte de l'interaction69
3.2.1. Approche : analyse de corpus70
3.2.1.1. Annotation des phénomènes liés aux opinions70
3.2.1.2. Analyse quantitative73
3.2.2. Analyse des énoncés de l'utilisateur74
3.2.2.1. Niveau lexical75
3.2.2.2. Niveau syntagmatique76
3.2.2.3. Niveau phrastique77
3.2.3. Prise en compte du contexte dialogique78
3.2.3.1. Paire adjacente78
3.2.3.2. Historique des énoncés de l'utilisateur79
3.2.4. Prise en compte de la structure thématique de l'interaction80
3.3. Approche hybride pour la prise en compte de l'interaction80
3.3.1. Extraction de caractéristiques linguistiques81
3.3.1.1. Représentation au niveau du mot81
3.3.1.2. Représentation au niveau du tour de parole82
3.3.2. Modèles HCRF83
3.4. Évaluation en interaction humain-agent83
3.4.1. Annotation pour l'évaluation de système84
3.4.1.1. Likes et dislikes du corpus Semaine85
3.4.1.2. Likes et dislikes du corpus de négociation88
3.4.1.3. Interactions problématiques du corpus de chatbot90
3.4.2. Évaluation des différents niveaux d'analyse91
3.4.2.1. Au niveau de la paire adjacente : règles sur Semaine91
3.4.2.2. Au niveau de la paire adjacente : règles sur le corpus de négociation91
3.4.2.3. Au niveau de la paire adjacente : HCRF93
3.4.2.4. Au niveau du segment thématique93
3.5. Conclusion94
Chapitre 4. Stratégies d'interactions socio-émotionnelles : l'exemple de l'alignement95
4.1. Modèles théoriques97
4.1.1. Comportements socio-émotionnels étudiés97
4.1.2. Fondements théoriques en analyse conversationnelle97
4.2. Analyses qualitatives et quantitatives de corpus98
4.2.1. Analyse des fonctions communicatives de l'HR98
4.2.2. Mesure et quantification de l'alignement verbal98
4.3. Modèle computationnel d'alignement verbal100
4.3.1. Planification du positionnement émotionnel de l'agent101
4.3.2. Module d'hétéro-répétition102
4.4. Méthode pour l'évaluation d'un module d'alignement103
4.4.1. Questionnaire soumis à la fin de l'interaction103
4.4.2. Analyse qualitative des enregistrements105
4.5. Conclusion105
Chapitre 5. Génération de comportements socio-émotionnels107
5.1. Génération de la prosodie de l'agent107
5.1.1. Choix méthodologiques108
5.1.2. Intonation, actes de dialogue et attitudes sociales109
5.1.2.1. Attitudes sociales et actes de dialogue109
5.1.2.2. Attitudes sociales et intonation111
5.1.2.3. Intonation et actes de dialogue111
5.2. Intonation, expressions faciales et sequence mining112
5.2.1. Extraction automatique de caractéristiques et symbolisation112
5.2.2. Paramétrage de la temporalité des signaux113
5.2.3. Premiers résultats115
5.3. Génération des gestes coverbaux de l'agent116
5.3.1. Choix méthodologiques116
5.3.2. Du texte au geste : Image Schemas117
5.3.3. Analyse du contenu verbal118
5.3.3.1. Attribuer une Image Schema à chaque mot118
5.3.3.2. Sélection des Image Schemas dominantes au sein d'un chunk119
5.3.4. Analyse du contenu prosodique120
5.3.5. Illustration sur un exemple120
5.4. Conclusion121
Conclusion. Bilan et perspectives de recherche123
Bibliographie127
Index145