Soutenance de thèse de Vincent ROCHER

Analyse de données et modèle pour l'étude de la chromatine, des G-quadruplexes et de la réparation de l'ADN


Titre anglais : Data analysis and model for the study of chromatin, G-quadruplexes and DNA repair
Ecole Doctorale : BSB - Biologie, Santé, Biotechnologies
Spécialité : Bio-informatique, Génomique et Biologie des systèmes
Etablissement : Université de Toulouse
Unité de recherche : UMR 5077 - MCD - Molecular, Cellular and Developmental Biology Unit


Cette soutenance a eu lieu mardi 23 novembre 2021 à 14h00
Adresse de la soutenance : Centre de Biologie Intégrative Université Paul Sabatier 118 Route de Narbonne 31062 TOULOUSE - salle Salle de conférence 4R4 - RDC

devant le jury composé de :
Raphael MOURAD   Maîtresse de conférences   Centre de Biologie Intégrative   Directeur de thèse
Benoît BALLESTER   Chargé de recherche   TAGC - Aix-Marseille Université - INSERM (U1090)   Examinateur
Cédric VAILLANT   Directeur de recherche   Laboratoire de Physique (UMR CNRS 5672) - ENS Lyon   Rapporteur
Julien MOZZICONACCI   Professeur des universités   Laboratoire Structure et Instabilité des Génomes - Muséum National d'Histoire Naturelle, Paris   Rapporteur
Nathalie VIALANEIX   Directrice de recherche   INRAE, UR875 MIA-T   Examinateur
Gaëlle LEGUBE   Directeur de recherche   Centre de Biologie Intégrative   Examinateur


Résumé de la thèse en français :  

Les cassures double brin de l’ADN (DSB) sont des lésions délétères qui peuvent survenir sur le génome suite à une exposition à des agents génotoxiques, mais aussi de façon endogène, parmi lesquelles la formation de structures secondaires de l’ADN, telles que les G-quadruplexes (G4). Des méthodes computationnelles antérieures ont été développées pour prédire les G4 en fonction de motifs spécifiques, mais des approches récentes, basées sur le séquençage à haut débit ont permis d’identifier les G4 à l’échelle du génome. J’ai développé un nouveau modèle de Deep Learning pour prédire les régions G4 actives en utilisant les séquences d’ADN et l’accessibilité de la chromatine. En utilisant ce modèle, nous avons identifié de nouveaux motifs prédicteurs, y compris des facteurs de transcription connus qui pourraient réguler directement ou indirectement l’activité des G4. Nous avons également cartographié des milliers de régions G4 actives qui peuvent être utilisées dans le traitement du cancer pour identifier des cibles potentielles de médicaments récents à base de ligand-G4.

De plus, une fois induites sur le génome, les DSB déclenchent des modifications locales de la chromatine, comme la phosphorylation du variant d’histone H2AX (gH2AX) par la kinase ATM, pour former des foyers de réparation à l’échelle du mégabase. Comment ces domaines sont formés pour permettre la signalisation rapide des DSB, et comment ces changements locaux de la chromatine sont gérés par la cellule n’est pas encore bien connu. Nous avons découvert que le recrutement des composants de réparation et la phosphorylation de H2AX sont régis par des domaines topologiques associatifs (TAD) préexistants. De plus, nous avons mis en évidence un processus d’extrusion de boucle unidirectionnel médié par le complexe de cohésine des deux côtés des DSB, ce qui permet la formation de foyers de réparation par ATM. Nous avons également découvert qu’à grande échelle, les DSB peuvent former un nouveau compartiment “D” de chromatine, composé de domaines de chromatine décorés par gH2AX, mais aussi de gènes de la réponse aux dommages à l’ADN (DDR), suggérant un rôle du regroupement des DSB dans l’activation de la DDR.

 
Résumé de la thèse en anglais:  

DNA Double-strand breaks (DSBs) are harmful lesions that can occur on the genome following exposure to genotoxic agents but also due to endogenous causes, among which the formation of DNA secondary structures, such as G-quadruplexes (G4). Previous methods were developed to computationaly predict G4s based on specific motifs, and recent Next Generation sequencing approaches identified G4 distribution genome-wide. I developed a novel Deep learning model to predict active G4 regions using the DNA sequences and chromatin accessibility. Using this model, we found new motifs predictors including known transcription factors that could regulate directly or indirectly G4s activity. We also mapped thousand of active G4s regions that can be used in cancer therapy to identify potential targets of recent G4-ligand drugs.
Moreover, once induced on the genome, DSBs trigger local chromatin modifications including the phosphorylation of the H2AX histone variant by the ATM kinase, to form megabase-sized repair foci. How these domains are formed to enable rapid signaling of DSBs, and how these local chromatin changes are handled by the cell is still unclear. We found, that the recruitment of repair components and the phosphorylation of H2AX is governed by pre-existing Topologically Associating Domain (TADs). Moreover we discovered that a unidirectional loop-extrusion process mediated by the cohesin complex takes place on both side of the DSBs, which allow repair foci formation by ATM. We also found, at a global scale, that DSBs can form a novel “D” chromatin compartment, composed of gH2AX-decorated chromatin domains, but also of DNA Damage responsive genes, suggesting a role of DSB clustering in activating the DNA Damage Response.

Mots clés en français :Chromatine,Réparation de l'ADN,Cassures double-brin,Biologie computationnelle,Transcription,G-quadruplexes
Mots clés en anglais :   Chromatin,DNA repair,Double-strand breaks,Computational biology,Transcription,G-quadruplexes