Responsable de l'équipe d'accueil

Muller
Jean
This email address is being protected from spambots. You need JavaScript enabled to view it.
0627125457

Personne encadrant le stage

Muller
Jean
0627125457

Lieu du stage

1 place de l'Hôpital
67000 Strasnpirg

Sujet du stage

Évaluation et implémentation d'un pipeline d'analyse des variations du génome humain affectant l'épissage: application aux rétinopathies pigmentaires.
L'équipe de bioinformatique (UF7363) du CHRU de Strasbourg développe ses activités d’analyse de données de séquençage à haut débit (NGS) depuis 2012, dans le cadre de l’identification de variations génétiques impliquées dans les maladies rares et les cancers. En particulier dans l’unité de Génétique Moléculaire, une des applications développées vise à identifier les causes moléculaires de patients atteints de rétinopathies pigmentaires (RP). La RP est une dégénérescence rétinienne se caractérisant par une atteinte des cellules photoréceptrices de la rétine, les cônes et les bâtonnets, provoquant une hespéranopie, une réduction progressive du champ visuel puis une perte de la vision centrale. Elle a la particularité de présenter une triple hétérogénéité : clinique (début congénital, dans la petite enfance ou à l’âge adulte ; atteinte de type rod-cone ou cone-rod, formes syndromiques), génétique (tous les modes de transmission ont été décrits) et moléculaire (>200 gènes identifiés à ce jours). Ainsi un panel de gènes ciblant les gènes déjà connus dans la littérature a été développé (n>260 gènes). Afin de pouvoir augmenter encore le taux de diagnostics positifs une étude ciblée sur les variations affectant possiblement l’épissage des gènes est proposée.
En effet, parmi les différentes variations génétiques identifiées lors du reséquençage de génomes humains, certaines peuvent affecter l’épissage des gènes. Ce processus est une étape de maturation essentielle lors de la transcription du gène en ARN messager en permettant de retirer les introns du gène. Ces variations peuvent être localisées classiquement dans les introns (sites canoniques donneur et accepteur, site de branchement…) ou bien encore plus particulièrement dans les exons (« enhancer » ou « silencer »). Même si plusieurs études ont déjà permis l’élaboration d’approches d’identification de ces variations complexes dans un cadre diagnostic, les nombreux logiciels développés nécessitent de faire un choix et un travail d’intégration spécifique. Les travaux les plus récents ont notamment utilisés les techniques d’apprentissage voire d’intelligence artificielle pour prédire un effet sur l’épissage.
Ainsi, afin de répondre aux besoins grandissants, le but de ce stage est d’identifier ces solutions, de les tester sur des variants déjà identifiés et validés expérimentalement au laboratoire, et d’évaluer leurs performances. Le sujet sera divisé en 2 parties faisant écho aux 2 stages classiques du M2 :
M2S3:
• Étude bibliographique pour la sélection des outils de prédictions adéquats.
• Constitution du jeu de données de test (variations identifiées dans notre laboratoire, panel de gènes à tester, exomes et génomes).
• Choix des outils.
M2S4:
• Implémentation des outils sous Docker.
• Réalisation des calculs de prédiction sur les jeux de données.
• Analyse des données et choix de l’arbre décisionnel optimal.

Le·a stagiaire devra donc réaliser les tâches suivantes :
• Maîtrise des concepts biologiques des variations affectant possiblement l’épissage et de leurs implications en diagnostic
• Prise en main des outils existants pour l'analyse des variants affectant possiblement l’épissage sur des données de séquençage à haut débit.
Les compétences suivantes sont donc requises pour le bon accomplissement du stage :
• Connaissance des bonnes pratiques et standards d'analyses de données de séquençage.
• Maîtrise de l'environnement Unix et Windows.
• Maîtrise de langages et environnements de programmation (ex : Bash, Python, Java, R, Docker).
• Utilisation d'outils bioinformatiques classiques : BWA, GATK, BEDTOOLS, BCFTOOLS, PICARD.
• Bon relationnel, très bonne organisation, savoir rendre-compte, esprit d’initiative et de synthèse, autonomie et rigueur.
• Bonne maîtrise de l’anglais lu, écrit, parlé.

Le·a stagiaire sera accueilli·e au sein de l’équipe de bioinformatique (UF7363) du CHRU de Strasbourg, et encadré·e par un MCU-PH (Jean Muller) et le responsable de l’équipe (Antony Le Béchec). L’équipe est composée également de deux autres ingénieurs qui seront un support technique.