Découverte interactive de connaissances à partir de traces d’activité : Synthèse d’automates pour l’analyse et la modélisation de l’activité de conduite automobile
MATHERN
Type de document
THESE
Langue
anglais
Auteur
MATHERN
Résumé / Abstract
Comprendre la genèse d’une situation de conduite requiert d’analyser les choix faits par le conducteur au volant de son véhicule pendant l’activité de conduite, dans sa complexité naturelle et dans sa dynamique située. Le LESCOT a développé le modèle COSMODRIVE, fournissant un cadre conceptuel pour la simulation cognitive de l’activité de conduite automobile. Pour exploiter ce modèle en simulation, il est nécessaire de produire les connaissances liées à la situation de conduite sous forme d’un automate par exemple. La conception d’un tel automate nécessite d’une part de disposer de données issues de la conduite réelle, enregistrées sur un véhicule instrumenté et d’autre part d’une expertise humaine pour les interpréter. Pour accompagner ce processus d’ingénierie des connaissances issues de l’analyse d’activité, ce travail de thèse propose une méthode de découverte interactive de connaissances à partir de traces d’activité. Les données de conduite automobile sont considérées comme des M-Traces, associant une sémantique explicite aux données, exploitées en tant que connaissances dans un Système à Base de Traces (SBT). Le SBT permet de filtrer, transformer, reformuler et abstraire les séquences qui serviront à alimenter la synthèse de modèles automates de l’activité de conduite. Nous reprenons des techniques de fouille de workflow permettant de construire des automates (réseaux de Petri) à partir de logs. Ces techniques nécessitent des données complètes ou statistiquement représentatives. Or les données collectées à bord d’un véhicule en situation de conduite sont par nature des cas uniques, puisqu’aucune situation ne sera jamais reproductible à l’identique, certaines situations particulièrement intéressantes pouvant en outre être très rarement observées. La gageure est alors de procéder à une forme de généralisation sous la forme de modèle, à partir d’un nombre de cas limités, mais jugés pertinents, représentatifs, ou particulièrement révélateurs par des experts du domaine. Pour compléter la modélisation de telles situations, nous proposons donc de rendre interactifs les algorithmes de synthèse de réseau de Petri à partir de traces, afin de permettre à des experts-analystes de guider ces algorithmes et de favoriser ainsi la découverte de connaissances pertinentes pour leur domaine d’expertise. Nous montrerons comment rendre interactifs l’algorithme α et l’algorithme α+ et comment généraliser cette approche à d’autres algorithmes. Nous montrons comment l’utilisation d’un SBT et de la découverte interactive d’automates impacte le cycle général de découverte de connaissances. Une méthodologie est proposée pour construire des modèles automates de l’activité de conduite automobile. Une étude de cas illustre la méthodologie en partant de données réelles de conduite et en allant jusqu’à la construction de modèles avec un prototype logiciel développé dans le cadre de cette thèse.