Recherche d'information contextuelle, assistée et personnalisée
Patrice Bellot
Hermes Sciences
Lavoisier
Introduction15
Première partie. Contexte et robustesse25
Chapitre 1. Recherche d'information contextuelle : le cas des requêtes27
Josiane Mothe
1.1. Introduction27
1.2. Types de requêtes29
1.2.1. Requêtes populaires ou répétées30
1.2.2. Requêtes reformulées et historique des requêtes33
1.2.3. Requêtes difficiles35
1.2.3.1. Variabilité des systèmes35
1.2.3.2. Prédiction de la difficulté d'une recherche37
1.3. Classification de requêtes39
1.3.1. Classification thématique40
1.3.2. Classification de requêtes basée sur leurs caractéristiques42
1.3.3. Classer les requêtes selon leurs performances42
1.4. Adapter les traitements aux requêtes44
1.4.1. Variabilité et fusion de systèmes comme point de départ44
1.4.2. Choisir les traitements en fonction des requêtes45
1.4.3. Choisir le meilleur moteur pour chaque requête45
1.4.3.1. Choix du meilleur système pour chaque besoin d'information46
1.4.3.2. Performance en fonction du groupe de besoin d'information46
1.5. Conclusion48
1.6. Bibliographie50
Chapitre 2. Robustesse et analyse syntaxique57
Philippe Blache et Stéphane Rauzy
2.1. Introduction57
2.2. Les situations58
2.3. Le cas de la recherche d'information60
2.4. Les techniques60
2.4.1. Etiquetage et désambiguisation61
2.4.2. Analyse syntaxique62
2.4.2.1. Analyse syntaxique superficielle symbolique63
2.4.3. Analyse syntaxique superficielle stochastique64
2.4.4. Bilan65
2.5. Une approche syntaxique intrinsèquement robuste : les Grammaires de Propriétés66
2.5.1. Les caractéristiques des Grammaires de Propriétés66
2.5.2. Les mécanismes d'analyse en GP67
2.6. Conclusion69
2.7. Bibliographie70
Chapitre 3. La recherche d'information face à des corpus et requêtes bruités73
Laurianne Sitbon
3.1. Introduction73
3.2. Les bruits de l'information74
3.2.1. Les erreurs de pré-traitement75
3.2.1.1. Requêtes et corpus audio75
3.2.1.2. Requêtes translingues75
3.2.1.3. Corpus manuscrits76
3.2.2. Les erreurs de l'utilisateur76
3.2.2.1. Les échecs de la dictée76
3.2.2.2. Les handicaps de langage77
3.2.2.3. Les erreurs volontaires77
3.2.3. L'évolution des langues77
3.3. L'impact du bruit sur l'efficacité des systèmes de recherche d'information78
3.3.1. Campagnes d'évaluation78
3.3.2. Evaluation de la recherche documentaire avec des données bruitées79
3.4. Evaluation détaillée d'un système de questions-réponses face à des requêtes non standards80
3.4.1. Sélection des requêtes80
3.4.2. Collecte des requêtes81
3.4.3. Analyse des échecs de SQuALIA82
3.4.3.1. Analyse de la question83
3.4.3.2. Sélection des passages et des réponses84
3.4.3.3. Résultats finaux85
3.5. Systèmes de recherche documentaire robustes au bruit85
3.5.1. Modélisation des erreurs et entraînement des systèmes en conditions bruitées86
3.5.2. Prise en compte de l'incertitude - Utilisation de scores de confiance86
3.5.3. Utilisation de modèles thématiques88
3.6. Prise en compte de solutions multiples pour la réécriture de questions88
3.6.1. Approche grapho-phonémique à la réécriture de questions88
3.6.2. Modèle probabiliste pour la prise en compte de l'incertitude dans les SRI complexes90
3.6.3. Evaluation du pré-traitement en vue d'une utilisation avec un modèle basé sur l'incertitude92
3.7. Conclusion95
3.8. Bibliographie96
Chapitre 4. Questions-réponses sur des documents audio99
Olivier Galibert, Sophie Rosset et Lori Lamel
4.1. Introduction99
4.2. Campagnes d'évaluation101
4.2.1. Les documents102
4.2.2. Les questions103
4.2.3. Les métriques105
4.3. Systèmes de questions-réponses sur de la parole105
4.3.1. Systèmes de questions-réponses106
4.3.2. Traiter la parole108
4.3.3. Approches utilisées dans QAst109
4.3.3.1. Analyse des documents110
4.3.3.2. Recherche d'information112
4.3.4. Résultats113
4.3.4.1. Résultats globaux113
4.3.4.2. Discussions115
4.4. Conclusions et perspectives120
4.5. Bibliographie121
Deuxième partie. Personnalisation et collaboration125
Chapitre 5. Recherche d'information et modélisation usagers127
Guillaume Cabanac, Max Chevalier, Alexandra Ciaccia, Céline Clavel, Christine Julien, Gilles Hubert, Chantal Soulé-Dupuy et André Tricot
5.1. Introduction127
5.2. Modélisation informatique des usagers dans les SRI128
5.2.1. Dimensions de l'usager exploitées par les SRI pour la personnalisation129
5.2.2. Sources privilégiées pour la collecte d'informations pour la modélisation usager131
5.2.3. Modèles usager (stockage des informations dans le SRI)132
5.3. Les usagers des outils de RI : aspects cognitifs133
5.3.1. Tâche et RI134
5.3.2. Outils et RI135
5.3.3. Caractéristiques individuelles et RI136
5.4. Discussion sur la prise en compte des usagers dans les SRI138
5.4.1. Limites de l'utilisation des modèles usagers dans les SRI139
5.4.2. Recommandations générales141
5.4.2.1. Recommandations relatives aux modèles usagers informatisés141
5.4.2.2. Recommandations relatives aux aspects cognitifs de l'usager142
5.5. Conclusion144
5.6. Bibliographie144
Chapitre 6. Recherche d'information collaborative153
Nathalie Denos
6.1. Introduction153
6.2. Qu'est-ce que la recherche d'information collaborative ?153
6.2.1. Contexte et motivation153
6.2.2. Définition et vue d'ensemble des approches154
6.3. Origines156
6.3.1. La collaboration telle qu'observée sur le terrain156
6.3.2. L'émergence de paradigmes de recherche d'information collaborative157
6.4. Cadre d'analyse158
6.4.1. Les principaux axes de classification158
6.4.2. Classification des paradigmes de recherche d'information collaborative médiatisée158
6.4.2.1. Temps et espace158
6.4.2.2. Intention159
6.4.2.3. Profondeur de la médiation159
6.5. Recherche d'information collaborative asynchrone160
6.5.1. Filtrage collaboratif et systèmes de recommandation160
6.5.1.1. Principe du filtrage collaboratif160
6.5.1.2. Technique de base et principal intérêt161
6.5.1.3. Evolution des techniques162
6.5.2. Partage de traces163
6.5.2.1. Principe du partage de traces163
6.5.2.2. Description des principales techniques163
6.5.3. Reclassement collaboratif des résultats de recherche164
6.5.3.1. Principe du reclassement collaboratif164
6.5.3.2. Description des principales techniques164
6.5.4. Synthèse sur la recherche collaborative asynchrone166
6.6. Recherche d'information collaborative synchrone166
6.6.1. Recherche synchrone à distance166
6.6.1.1. Outils de conscience réciproque (group awareness)167
6.6.1.2. Outils de coordination168
6.6.2. Recherche collaborative synchrone en présence173
6.6.2.1. Principe de la recherche synchrone en présence173
6.6.2.2. Description des principales techniques173
6.6.3. Synthèse sur la recherche collaborative synchrone175
6.7. Evaluation des systèmes de recherche d'information collaborative176
6.7.1. Objectifs de qualité176
6.7.1.1. Caractéristiques des recherches collaboratives176
6.7.1.2. Critères d'évaluation176
6.7.2. Approches d'évaluation178
6.7.2.1. Tests utilisateurs en laboratoire178
6.7.2.2. Evaluation en laboratoire avec simulation des utilisateurs179
6.7.2.3. Bases de comparaison180
6.7.3. Synthèse sur l'évaluation181
6.8. Conclusion182
6.8.1. Synthèse sur la recherche d'information collaborative182
6.8.2. Perspectives182
6.9. Bibliographie184
Chapitre 7. Difficultés de lecture, dyslexies et recherche d'information191
Patrice Bellot
7.1. Introduction191
7.2. Modélisation cognitive de la lecture194
7.3. Critères pour estimer la difficulté de lecture d'un texte199
7.4. Mesures de lisibilité204
7.4.1. Les mesures de lisibilité FOG, SMOG et celles de Flesch204
7.4.2. Des mesures apprises automatiquement et adaptées aux utilisateurs205
7.5. Prise en compte de la lisibilité en RI207
7.5.1. La pertinence en recherche documentaire207
7.5.2. Réordonnancement des documents trouvés selon la mesure de Flesch207
7.5.3. Vers d'autres combinaisons de la pertinence et de la lisibilité208
7.6. La dyslexie comme trouble du langage211
7.6.1. Différentes dyslexies212
7.6.2. Proposition d'une mesure de lisibilité adaptée à la dyslexie214
7.7. Perspectives et conclusion216
7.8. Bibliographie218
Troisième partie. Assistance et aide à la navigation227
Chapitre 8. Navigation dans les documents audio par le résumé automatique229
Benoit Favre
8.1. Introduction229
8.2. Recherche d'information parlée231
8.2.1. Recherche documentaire231
8.2.2. Résumé automatique233
8.3. Interactions avec l'utilisateur235
8.3.1. Navigation locale235
8.3.2. Navigation orientée contenu237
8.4. Conclusion243
8.5. Bibliographie244
Chapitre 9. Interaction249
Mountaz Hascoët
9.1. Introduction249
9.2. Analyse de l'interaction par l'analyse des tâches250
9.3. Les styles d'interaction classiques253
9.3.1. Les facettes253
9.3.2. Le filtrage dynamique254
9.3.3. Le brossage255
9.3.4. Le pliage256
9.3.5. Le zoom : bitmap, structurel ou sémantique257
9.3.6. La conciliation détails et contexte258
9.3.6.1. Fisheye déformant261
9.3.6.2. Fisheye déformant et structurel261
9.3.7. Interaction coopérative et dispositifs d'affichage distribués262
9.3.8. Passage à l'échelle262
9.3.9. Vers une interaction plus directe263
9.4. Conclusion265
9.5. Bibliographie266
Chapitre 10. Prédiction de mots et saisie de requêtes sur interfaces limitées : dispositifs mobiles et aide au handicap273
Jean-Yves Antoine
10.1. Introduction : saisie de message sur interfaces limitées273
10.2. Interfaces limitées : dispositifs d'entrée275
10.2.1. Dispositifs d'entrée de texte pour systèmes informatiques mobiles275
10.2.2. Dispositifs d'entrée de texte pour systèmes d'aide à la communication279
10.2.3. Evaluer l'intérêt de la prédiction de mots pour la saisie de message282
10.3. Prédiction de lettres et claviers virtuels dynamiques283
10.4. Prédiction de mots : retour historique et modèles markoviens de base285
10.5. Modèles adaptatifs pour la prédiction de mots287
10.5.1. Adaptation utilisateur287
10.5.2 Adaptation au contexte courant du discours : analyse sémantique latente290
10.6. Conclusion : pour une meilleure intégration ergonomique de la prédiction295
10.7. Bibliographie295
Index299