Responsable de l'équipe d'accueil

Poch
Olivier
This email address is being protected from spambots. You need JavaScript enabled to view it.
0368853295

Personne encadrant le stage

Thompson
Julie
0368853296

Lieu du stage

11 rue Humann, Strasbourg

Sujet du stage

Evaluation de l'annotation structurale de génomes
Les technologies NGS ont révolutionné les sciences de la vie, conduisant à de nouvelles découvertes fondamentales et à des applications importantes en médecine, agronomie, biotechnologies. Récemment, le coût et le temps nécessaires pour produire les données brutes du génome ont été considérablement réduits et la technologie n'est plus le facteur limitant. Les besoins en calcul pour l'annotation et l'analyse du génome sont devenus les principaux goulets d'étranglement. L'une des étapes des plus importantes de la compréhension du génome est l'identification des régions de l'ADN qui codent pour les gènes (protéines ou ARN) et la définition de la structure des transcrits (position initiale, exon-intron). Nous développons actuellement une nouvelle approche combinant l’apprentissage profond (deep learning) avec des algorithmes évolutifs afin de construire des modèles géniques représentant les structures exon-intron, ainsi que les sites d’épissage alternatif.
Dans ce contexte, nous avons besoin d’un jeu de données fiable pour l’apprentissage. Cette étape est essentielle puisque la qualité des données et les informations utiles qui peuvent en être tirées influent directement sur la capacité d'apprentissage du modèle. Nous avons déjà identifié une liste de gènes mal prédits dans les banques publiques. A partir de cette liste ; l’objectif du stage est de proposer des modèles géniques plus fiables. Pour ce faire, le stagiaire (i) interrogera les banques génomiques publiques (Uniprot, Ensembl) afin d’identifier les exons/introns et les sites d’épissage connus, (ii) exploitera des informations de protéines homologues pour chercher des exons manquants. Ceci permettra de corriger les modèles géniques, et de construire le jeu d’apprentissage.