Z.H YANG
Soutenance : 5 décembre 2022
Thèse de doctorat en Electronique, microélectronique, nanoélectronique et micro-ondes, Université de Lille, ENGSYS Sciences de l’ingénierie et des systèmes,
Summary:
Dans cette thèse, nous avons proposé deux contributions principales liées à l’analyse par apprentissage profond des parasites Malaria et Cryptosporidium à partir d’images microscopiques. Plus spécifiquement, dans la première contribution, nous avons proposé un framework pour diagnostiquer une infection par le parasite Malaria chez les humains en utilisant des images microscopiques de frottis sanguins fins. Comparé aux méthodes de l’état de l’art, notre framework est basé sur des approches de segmentation et de classification permettant l’analyse directe du parasite au lieu de la cellule qui le contient. Dans ce sens, le framework permet de segmenter directement le parasite Malaria et de distinguer son espèce parmi quatre classes principales : P. Falciparum, P. Ovale, P. Malaria et P. Vivax. Nous démontrons l’efficacité de notre framework et notamment son potentiel de généralisation sur des données interclasses en exploitant plusieurs jeux de données publiques. De plus, nous montrons que la technique d’augmentation des données que nous proposons, appelée Local Parasite Texture Scanning (LPTS), améliore davantage la précision de notre modèle de classification. Dans la deuxième contribution, nous avons proposé un framework pour diagnostiquer une infection par le parasite Cryptosporidium chez les vaches laitières en utilisant des images microscopiques de fluorescence. À cette fin, nous avons proposé une méthodologie originale de segmentation des parasites basée sur une approche grossière à fine, qui atteint une grande précision sur notre jeu de données généré de Cryptosporidium et qui permet de dépasser en termes de performance les méthodes de segmentation de l’état de l’art. Nous avons également proposé un modèle de classification à haut pouvoir discriminant permettant d’identifier efficacement le stade de vie des parasites parmi 4 stades asexués : oocyste, trophozoïte, méronte, et forme libre. Nous montrons à travers une étude expérimentale que notre modèle atteint une grande précision en analysant uniquement le parasite lui-même et sans avoir besoin d’informations supplémentaires liées à la taille et au nombre de noyaux qui sont nécessaires au biologiste afin de réaliser sa classification.
Abstract:
In this thesis, we proposed two main contributions related to deep learning analysis of Malaria and Cryptosporidium parasites from microscopic images. More specifically, in the first contribution, we proposed a framework for diagnosing Malaria parasite infection in humans using microscopic images of thin blood smears. Compared to the state of the art methods, our framework is based on segmentation and classification approaches allowing the direct analysis of the parasite instead of the cell that contains it. In this sense, the framework allows to directly segment the Malaria parasite and to distinguish its species among four main classes: P. Falciparum, P. Ovale, P. Malaria and P. Vivax. We demonstrate the efficiency of our framework and in particular its potential for generalization on inter-class data by exploiting several public datasets. Moreover, we show that our proposed data augmentation technique, called Local Parasite Texture Scanning (LPTS), further improves the accuracy of our classification model. In the second contribution, we proposed a framework to diagnose Cryptosporidium parasite infection in dairy cows using fluorescence microscopy images. To this end, we proposed an original parasite segmentation methodology based on a coarse to fine approach, which achieves high accuracy on our generated Cryptosporidium dataset and outperforms state-of-the-art segmentation methods. We have also proposed a classification model with high discriminating power to efficiently identify the life stage of parasites among 4 asexual stages: oocyst, trophozoite, meront, and free form. We show through an experimental study that our model achieves a high accuracy by analyzing only the parasite itself and without the need for additional information related to the size and number of nuclei that are necessary for the biologist to perform its classification.