Thesis of Pierre Marijon

Nouveaux composants à la périphérie des outils d'assemblages des génomes dong read

Le séquençage de l'information génétique a permis de mieux comprendre un grande nombre de phénomènes biologiques, maladies génétiques, évènements de spéciations, mécanismes fondamentaux du fonctionnement de nos cellules. Les techniques de séquençage ont beaucoup évolué depuis la méthode de Sanger (1977). De nos jours, les technologies de séquençage de troisième génération permettent le séquençage d'un génome complet à moindre coût, produisent des lectures (fragments de genomes) plus longs, mais nécessitent la création d'outils d'assemblage spécifiques pour tenir compte d'un taux d'erreur élevé dans les lectures produites. L'étude des méthodes utilisées par les outils d'assemblage de lectures de troisième génération a permis d'observer que des améliorations des assemblages étaient possibles sans toutefois modifier les outils eux-mêmes. Certaines améliorations sont proposées dans ce travail de thèse, et sont mises en œuvre à travers des outils proposés à la communauté. yacrd et fpa interviennent en amont de l'assemblage en lui-même pour améliorer l'ensemble des lectures données en entrée à un assembleur. knot analyse et combine le résultat d'un assemblage avec les données brutes, pour donner des pistes permettant d'améliorer l'assemblage final.

Jury

M. Tobias MARSCHALL Max-Planck-Institut Rapporteur M. Jean-Stéphane VARRẾ Université De Lille Directeur de thèse M. Rayan CHIKH Institut Pasteur & CNRS Examinateur Mme Blerina SINAIMERI Université Lyon I – INRIA Examinateur Mme Clarisse DHAENENS Université de Lille Examinateur M. Pierre PETERLONGO Inria Rennes - Bretagne Atlantique Examinateur Mme Marie-France SAGOT INRIA Grenoble Rhône-Alpes Rapporteur

Thesis of the team Bonsai defended on 02/12/2019