Thèse de Clémence Réda

Combinaison de réseaux de régulation génique et d'apprentissage statique séquentiel pour le repositionnement de médicatments

À cause du coût toujours croissant de la conception de molécules de novo ciblant les causes d'une maladie, et la masse considérable de données biologiques disponibles actuellement, la création de méthodes d'exploration systématique pour le développement de thérapies est devenue un enjeu crucial. Lors de ma thèse, je me suis concentrée sur le paradigme du repositionnement de médicaments, qui vise l'identification de nouvelles indications thérapeutiques pour des molécules chimiques connues. Étant donné la quantité déjà importante de données transcriptionnelles (relative à la production de protéines à travers la transcription des séquences ADN géniques) qui est accessible, j'ai cherché à déterminer comment traiter ces données sur l'activité génique de manière transparente et contrôlable pour le criblage de molécules. Une revue de l'état de la recherche en développement de médicaments montre que de telles approches génériques peuvent permettre de considérablement accélérer la découverte de thérapies prometteuses, plus particulièrement contre les maladies rares ou tropicales négligées. Premièrement, en remarquant que les mesures d'activité transcriptionnelle résultent d'un réseau dynamique complexe d'interactions coordonnées de régulation génique, j'ai travaillé sur l'intégration de façon automatique d'information biologique de formes variées afin de construire un modèle de ces régulations géniques. C'est là que les réseaux de régulation génique, et, plus spécifiquement, les réseaux booléens, interviennent. Ces modèles permettent à la fois d'expliquer les mesures d'origine transcriptionnelle observées, et de prédire le résultat de perturbations de l'activité de certains gènes par des molécules. Ensuite, ces modèles permettent d'effectuer des essais in silico de médicaments. Tandis que l'utilisation des prédictions faites par des réseaux booléens peut s'avérer coûteuse, l'hypothèse centrale de ma thèse est que leur combinaison avec des algorithmes d'apprentissage statistique séquentiels, comme les bandits à bras multiples, peuvent non seulement réduire ce coût, mais également contrôler le taux d'erreur dans les recommandations de candidats thérapeutiques. Cette démarche est la procédure d'essai clinique in silico analysée tout au long de mon travail de thèse. Le problème, capital, d'intégration des caractéristiques connues des composants chimiques dans les bandits à bras multiples a également été étudié plus en profondeur. Enfin, j'ai appliqué une partie de mon travail de thèse au classement de différents protocoles de traitement pour de la neuroréparation dans le cas d'encéphalopathies chez des enfants prématurés. D'un point de vue théorique, j'ai également contribué à la conception d'un algorithme qui permet d'étendre la procédure d'essai médicamenteux in silico à un cadre distribué à travers plusieurs populations test, modèles de maladies, ou équipes de recherche.

Jury

DELAHAYE-DURIEZ Andrée - Directeur de Thèse - Université Paris Cité REMY Elisabeth - Rapporteur - Institut de Mathématiques de Marseille HONDA Junya Rapporteur - Kyoto University VILLOUTREIX Bruno - Examinateur - Université Paris CIté AZENCOTT Chloé-Agathe - Examinatrice - Mines Paris Tech THIEFFRY Denis - Examinateur - Institut de Biologie ENS de Paris KOOLEN Wouter Examinateur - Centrum Wiskunde & Informatica KAUFMANN Emilie - Membre invitée - INRIA Lille

Thèse de l'équipe SCOOL soutenue le 09/09/2022