Cette thèse s’inscrit dans une démarche d’amélioration de la sécurité de la prise en charge médicamenteuse (PECM) à l’hôpital, en abordant la gestion des erreurs médicamenteuses (EM). Ces événements, souvent déclarés par des professionnels de santé sous forme de textes descriptifs libres dans les systèmes de déclaration internes ou externes, demeurent largement sous-exploités en raison de leur nature non structurée et de l’absence des outils d’analyse adaptés.
Dans cette thèse, la première étape a consisté à formaliser les connaissances sous la forme d’un modèle de structuration standardisant la déclaration des erreurs médicamenteuses et intégrant les éléments essentiels à leur exploitation automatisée.
La deuxième étape de la thèse s’est concentrée sur la caractérisation automatique des déclarations d’EM, en extrayant leurs principales caractéristiques à partir des déclarations textuelles via des techniques de traitement du langage naturel (NLP) et d’apprentissage supervisé. L’objectif visé est de structurer l’information pour permettre une compréhension et une analyse plus fines ainsi qu’une aide à la décision.
Pour combler le manque de données accessibles et annotées, la troisième étape de la thèse s’est attachée à proposer une approche de génération de données synthétiques représentant des déclarations des EM (en français). Cette approche s’appuie sur des modèles de langage (LLMs) selon différents scénarios (zéro-shot, one-shot, few-shot). Les données synthétiques ainsi obtenues ont été soumises à une double validation : (1) des experts métiers du domaine, et (2) une intelligence artificielle de classification automatique. Cette validation a confirmé que les données générées étaient pertinentes et fiables.
Les données obtenues après les deux étapes précédentes ont permis de proposer une méthode de priorisation des erreurs. Elle s’appuie sur des approches d'aide à la décision multicritère, notamment les méthodes AHP et AHP Fuzzy. L’analyse par paire des critères a été réalisée par les experts métiers ce qui a permis d’obtenir un score propre à chaque déclaration. Cette méthode est destinée à aider les professionnels de santé dans l’identification objective des EM les plus prioritaires à analyser.
Ainsi, cette recherche propose une approche intégrée combinant l'intelligence artificielle, la science des données et l'expertise métier, en vue d’améliorer le traitement des déclarations des erreurs médicamenteuses à l’hôpital. |
This thesis is part of an initiative to improve medication management safety in hospitals by addressing the management of medication errors (MEs). These events are often reported by healthcare professionals as free-text descriptive entries in internal or external reporting systems, yet they remain largely underutilized due to their unstructured nature and the lack of appropriate analysis tools.
The first step of this research involved formalizing knowledge into a structured model that standardizes the reporting of medication errors and integrates the essential elements needed for automated processing. The goal was to create a framework that would allow for consistent and effective data handling.
The second step focused on the automatic characterization of ME reports by extracting key features from the textual declarations using natural language processing (NLP) techniques and supervised learning. This step aimed to structure the information, allowing for more refined analysis and aiding decision-making. By converting the free-text data into structured formats, the research seeks to provide a better understanding of the errors and a foundation for more accurate decision support tools.
Given the scarcity of accessible and annotated data, the third step of this thesis proposed an approach for generating synthetic data representing MEs (in French). This approach leverages language models (LLMs) under different scenarios such as zero-shot, one-shot, and few-shot learning. The synthetic data generated was then subjected to dual validation: (1) by domain experts, and (2) by an AI-based classification model. This validation ensured that the synthetic data was both relevant and reliable for further analysis.
The data generated from the previous steps led to the development of a prioritization method for medication errors. This method utilizes multi-criteria decision support approaches, specifically the AHP (Analytic Hierarchy Process) and Fuzzy AHP methods. Pairwise comparison of criteria was conducted by domain experts, which resulted in a priority score for each ME report. This scoring system is intended to assist healthcare professionals in objectively identifying the most critical medication errors to analyze.
In conclusion, this research proposes an integrated approach combining artificial intelligence, data science, and domain expertise, aimed at improving the processing of medication error reports in hospitals. By creating a standardized reporting framework, automating the extraction of key features, generating synthetic data for model training, and offering a prioritization tool, the work provides a comprehensive solution to enhance the safety of medication management in healthcare settings. |