Le cancer est une maladie mortelle considérée comme la deuxième cause de décès dans le monde. Toute avancée dans le diagnostic et la détection du cancer est donc cruciale pour sauver des vies. L'analyse des images histologiques - également appelées Whole Slide Images (WSI) - est considérée comme la référence en matière de diagnostic et de stadification du cancer. L'analyse manuelle des WSI par les pathologistes reste cependant le processus de diagnostic principal, qui prend du temps, est laborieux, sujet aux erreurs, difficile à classer de manière reproductible. Pour aider les pathologistes à cet égard, des techniques de diagnostic assisté par ordinateur (CAD) pourraient être ajoutées au flux de travail des pathologistes afin de fournir un deuxième avis. Les techniques d'apprentissage automatique, en particulier les algorithmes d'apprentissage en profondeur, tels que les réseaux de neurones à convolution (CNN), sont couramment utilisés par les chercheurs pour créer un tel système de CAO. Le succès des modèles CNN, cependant, dépend de plusieurs paramètres d'hyper-paramètres, par exemple, l'architecture du réseau, les données utilisées pour entraîner le modèle, la distribution de classe des données d'apprentissage. À notre connaissance, parmi les hyper-paramètres, la distribution de classe des données d'apprentissage n'est pas encore étudiée dans la littérature pour les données WSI, alors qu'elle est l'une des plus importantes qui régulent les performances du modèle. Un domaine crucial comme la détection du cancer dans le WSI nécessite donc une étude distincte dédiée à ce sujet. Cette thèse vise à cet effet. De plus, grâce à cette recherche, nous avons constaté que les méthodes d'évaluation de pointe (par exemple, les caractéristiques de fonctionnement du récepteur, la courbe ROC) utilisées dans ce domaine de la détection du cancer présentent certaines limites, par exemple l'incapacité de séparer les performances des modèles. , ne donnant pas beaucoup d'informations sur les fausses prédictions, étant optimiste face aux données déséquilibrées. Cette thèse contribue également à ce thème des méthodes d'évaluation. Toutes les contributions issues de cette thèse sont les suivantes: La première contribution de cette thèse étudie l'efficacité du choix par défaut, la distribution équilibrée, dans la détection du cancer à partir de WSI. De plus, nous introduisons une méthode d'évaluation basée sur les patchs (c'est-à-dire basée sur la région d'image) sur l'évaluation habituelle basée sur les pixels pour correspondre à la manière du pathologiste de vérifier le WSI. Bien que cette analyse donne une idée préliminaire du comportement du modèle vis-à-vis de la distribution différente des classes dans l'ensemble d'apprentissage, elle exige une analyse plus approfondie que nous abordons dans notre deuxième contribution. Comme deuxième contribution, nous proposons différentes hypothèses sur la distribution de classe des données WSI en tant qu'ensemble d'apprentissage du modèle CNN et testons ces hypothèses à l'aide de trois ensembles de données WSI et de deux architectures CNN. Pour aborder les limites de la contribution précédente, nous proposons également une approche systématique pour analyser la distribution des classes de l'ensemble d'apprentissage pour un modèle profond. La troisième contribution de cette thèse est le développement de la représentation par seuil des courbes de précision et de rappel (PR-T) comme alternative aux mesures d'évaluation de pointe, à la courbe des caractéristiques de fonctionnement du récepteur (ROC) et au rappel de précision. (PR), utilisées pour la classification binaire comme la détection du cancer. De plus, nous développons également des algorithmes de bout en bout pour calculer la courbe PR moyenne et l'aire moyenne sous la courbe (PR-AUC). |
Cancer is a fatal disease considered the second leading cause of death globally. Any advances in diagnosis and detection of cancer thus are crucial for saving lives. Analyzing the histological images -also known as Whole Slide Images (WSIs)- is considered as the gold standard in cancer diagnosis and staging. The manual analysis of WSIs by pathologists, however, is still the primary diagnosis process, which is time-consuming, laborious, prone to error, difficult to grade in a reproducible manner. To assist the pathologists in this regard, computer-aided diagnosis (CAD) techniques could be added to the pathologists' workflow to provide a second opinion. Machine learning techniques, specifically, deep learning algorithms, such as Convolutional Neural Networks (CNNs), are popularly utilizing by researchers to create such a CAD system. The success of CNN models, however, depends on several hyper-parameter settings, e.g., network architecture, data used to train the model, the class distribution of the training data. To the best of our knowledge, among the hyper-parameters, the class distribution of the training data is not studied yet in the literature for the WSI data, while it is one of the most important ones that regulate the model performance. A crucial domain like cancer detection in WSI, thus, requires a separate dedicated study on this topic. This thesis aims for this purpose. In addition, through this research, we found that the state-of-the-art evaluation methods (e.g., the Receiver Operating Characteristics, ROC Curve) utilized in this domain of cancer detection have some limitations, e.g, the inability of model performance separation, not being much informative regarding false predictions, being optimistic to imbalanced data. This thesis also contributes to this topic of evaluation methods. All the contributions resulting from this thesis are as follows:
The first contribution of this thesis is investigating the effectiveness of the default choice, the balanced distribution, in cancer detection from WSI. Moreover, we introduce a patch-based (i.e., image region-based) evaluation method over the usual pixel-based evaluation to match with the pathologist's way of checking the WSI. Although this analysis gives a preliminary flavor of the model behavior towards the different distribution of classes in the training set, it demands deeper analysis that we address in our second contribution.
As a second contribution, we propose different hypotheses on the class distribution of the WSI data as a training set to the CNN model and test those hypotheses using three WSI data sets and two CNN architectures. To address the limitations of the previous contribution, we also propose a systematic approach to analyze the training set class distribution for a deep model.
The third contribution of this thesis is developing the threshold-wise representation of precision and recall (PR-T) curves as an alternative to the state-of-the-art evaluation metrics, the Receiver Operating Characteristics (ROC) curve and Precision-Recall (PR) curves, used for the binary classification like cancer detection. Additionally, we also develop end-to-end algorithms to compute the mean PR curve and the mean Area Under the Curve (PR-AUC). |