Hdr de Mikael Salson

Méthodes sans alignement et indexation pour l'analyse de données nucléiques massives

Alors que les technologies de séquençage de l'ADN et de l'ARN se démocratisent, les données produites par les laboratoires se démultiplient. Les besoins de méthodes capables de traiter ces données, sans nécessiter le recours à des infrastructures de calcul gigantesques, est alors criant. Mes recherches, comme maître de conférences dans l'équipe de bioinformatique Bonsai depuis 2010, ont eu pour but d'offrir la capacité aux équipes intéressées de tirer parti, à moindre coût, de ces données produites. Deux axes principaux de recherche correspondent à mes travaux sur la période afin de remplir cet objectif. L'un de ces axes consiste à proposer des méthodes de comparaison qui évitent de recourir à de coûteuses étapes d'alignement, il s'agit des méthodes sans alignement. Avec mes collègues, j'ai proposé des méthodes d'analyse sans alignement, efficaces en temps et en espace qui fournissent des résultats pertinents pour les recherches ou les soins en oncologie. L'un de ces projets, Vidjil, est un logiciel désormais utilisé par des dizaines d'hôpitaux autour du monde dont certains financent deux ingénieurs qui continuent à maintenir et améliorer le logiciel. L'autre axe correspond à l'indexation des données de séquençage avec l'objectif de faciliter leur exploitation, voire leur réexploitation. L'indexation de données est une étape indispensable afin d'obtenir rapidement des informations recherchées. Néanmoins, le type d'information qui peut être recherché dépend de la nature de l'indexation. Les méthodes présentées sont de différentes natures : certaines visent à offrir des recherches plus souples, tandis que d'autres ont pour objectif de favoriser la réexploitation de données existantes.

soutenue le 21/11/2023