Mining recurrent patterns in a dynamic attributed Graph. : Application on aquaculture pond monitoring by satellite images. - Archive ouverte HAL Accéder directement au contenu
Thèse Année : 2018

Mining recurrent patterns in a dynamic attributed Graph. : Application on aquaculture pond monitoring by satellite images.

Extraction des motifs récurrents dans un graphe dynamique attribué. : Application au suivi des bassins d' aquaculture en Indonésie.

(1)
1

Résumé

In this thesis, we are interested in analyzing spatio-temporal data. Numerous algorithms have been developed to extract local models (also called "patterns") such as sequential patterns or dynamic subgraphs. However, these approaches suffer from severa!limitations when dealing with complex spatio-temporal phenomena. These pattern demains do not consider all possible spatio-temporal interactions or only consider limited information about studied objects. For example, sequential pattern mining methods focus on temporal evolutions without considering spatial ones. Besicles, most of graph mining algorithms study labeled graphs. They only consider one attribute per vertex instead of all object's characteristics. In our work, we propose to study dynamic attributed graph, because they provide a richer representation of spatio-temporal phenomena. Extraction of patterns in dynamic attributed graph is a particularly complex task because graph structure, vertices and attributes associated with each vertex can change over time. For this purpose, we define a new pattern domain called recurrent patterns. These patterns, which are sequences of connected ubgraph, œpreent recurrent evolutions of subsets of attributes associated to vertices. To extract these patterns, we develop a new algorithm, RPMiner, using an original strategy based on successive intersections of connected components. We use severa! constraints to reduce the search space and make the computation feasible. Experimental study on both syndetic and two real-world datasets (DBLP dataset and Domestic US Flight dataset) show the genericity of our approach, the interest of extracted patterns and the efficiency of our algorithm. We also do an in-depth experimental evaluation of our approach on the INDESO project data (aquaculture pond monitoring in lndonesia by satellite images). A complete KDD process has been developed: from pre-processing of data to visualization and interpretation of results. It aims to better understand farming practices for sustainable development of these coastal resources in Indonesia.This process is firstly based on an automatic and robust method to extract aquaculture ponds from low contrast satellite images. Next, this process extracts frequent patterns to highlight sorne farming practices. For this, we have firstly applied a sequential pattern mining to analyze temporal evolutions of aquaculture ponds and to understand farming practices. In parallel, we also apply our algorithm, RPMiner, which considers both spatial and temporal aspects. Extracted patterns were interpreted by aquaculture experts. Results confirm severa!practices and highlight ethers.
Dans cette thèse, nous nous sommes intéressés à l'analyse de données spatio-temporelles. Plusieurs algorithmes de fouille de données ont été développés pour extraire des modèles locaux (appelés aussi "motifs") tels que les motifs séquentiels ou les sous-graphes dynamiques. Cependant, ces approches souffrent de plusieurs limitations lorsqu 'on traite des phénomènes spatio-temporels complexes. Ces domaines de motifs ne prennent pas en compte toutes les interactions spatio-temporelles possibles ou ne considèrent que des informations limitées sur les objets étudiés. Par exemple, les motifs séquentiels se concentrent sur les évolutions temporelles sans tenir compte des évolutions spatiales. En outre, la plus part des algorithmes d'extraction de sous-graphes étudient des graphes dynamiques labélisés. Cependant, ils ne considèrent qu'un seul attribut par nœud et ignorent les autres caractéristiques des objets étudiés. Dans ce manuscrit, nous proposons d'étudier un graphe dynamique attribué pour fournir une représentation plus riche des phénomènes spatio-temporels. L'extraction de motifs dans des graphes dynamiques attribués est une tâche particulièrement complexe car la structure du graphe, les nœuds et les attributs associés à chaque nœud peuvent changer dans le temps. Pour cela, nous avons défini un nouveau domaine de motifs appelé motifs récurrents. Ces motifs, qui sont des séquences de sous-graphes connexes, représentent des évolutions récurrentes des sous-ensembles d'attributs associés à des sous-ensembles de nœuds. Pour extraire ces motifs, nous avons développé un nouvel algorithme, appelé RPMiner, utilisant une stratégie originale basée sur des intersections successives de composantes connexes apparaissant dans la séquence. Nous avons utilisé plusieurs contraintes pour réduire l 'espace de recherche et rendre le calcul possible. Une étude expérimentale sur des jeux de données synthétiques et réels (réseau de co-auteurs DBLP et données de trafic aérien US Flight) montre la généricité de notre approche, l 'intérêt des motifs extraits et l'efficacité de notre algorithme. Nous avons effectué également une évaluation poussée de notre approche sur les données du projet INDESO (suivi de bassins aquacoles en Indonésie par imagerie satellitaire). Pour cela, un processus d' extraction de connaissances (KDD) complet a été développé : du prétraitement des données à la visualisation et à l 'interprétation des résultats. Il vise à mieux comprendre les pratiques des fermiers pour un développement durable de ces ressources côtières en Indonésie. Ce processus s'appuie tout d'abord sur une méthode automatique et robuste pour extraire les bassins d'aquacoles à partir d'images satellitaires à faible contraste. Ensuite, il utilise des méthodes d'extraction de motifs fréquents afin de mettre en avant certaines pratiques des fermiers. Pour cela, nous avons appliqué dans un premier temps un algorithme d'extraction de motifs séquentiels pour analyser l'évolution des bassins dans le temps et comprendre les pratiques des fermiers. En parallèle nous avons aussi appliqué notre algorithme RPMiner, qui prend en compte à la fois les dimensions spatiales et temporelles. Les motifs extraits ont été interprétés par des experts en aquaculture. Les résultats obtenus ont permis de confirmer certaines pratiques et d'en mettre en avant d'autres.
Fichier principal
Vignette du fichier
These2018ZhiCheng version Facile.pdf (16.84 Mo) Télécharger le fichier
Origine : Fichiers produits par l'(les) auteur(s)

Dates et versions

tel-03228270 , version 1 (18-05-2021)

Identifiants

  • HAL Id : tel-03228270 , version 1

Citer

Zhi Cheng. Mining recurrent patterns in a dynamic attributed Graph. : Application on aquaculture pond monitoring by satellite images.. Image Processing [eess.IV]. Université de la Nouvelle-Calédonie, 2018. English. ⟨NNT : 2018NCAL004⟩. ⟨tel-03228270⟩
89 Consultations
75 Téléchargements

Partager

Gmail Facebook Twitter LinkedIn More