Responsable de l'équipe d'accueil

Poch
Olivier
This email address is being protected from spambots. You need JavaScript enabled to view it.
0368853295

Personne encadrant le stage

Thompson
Julie
0368853296

Lieu du stage

11 rue Humann, Strasbourg

Sujet du stage

Nouvelles stratégies d’annotation pour les projets de séquençage du génome
Les technologies NGS ont révolutionné les sciences de la vie, conduisant à de nouvelles découvertes fondamentales et à des applications importantes en médecine, agronomie, biotechnologies. Récemment, le coût et le temps nécessaires pour produire les données brutes du génome ont été considérablement réduits et la technologie n'est plus le facteur limitant. Les besoins en calcul pour l'annotation et l'analyse du génome sont devenus les principaux goulets d'étranglement. L'une des étapes des plus importantes de la compréhension du génome est l'identification des régions de l'ADN qui codent pour les gènes (protéines ou ARN) et la définition de la structure des transcrits (position initiale, exon-intron). Nous développons actuellement une nouvelle approche combinant l’apprentissage profond (deep learning) avec des algorithmes évolutifs afin de construire des modèles géniques représentant les structures exon-intron, ainsi que les sites d’épissage alternatif.
L’objectif du stage est de faire une étude comparative des algorithmes existants pour la prédiction de sites d’épissage. L’étude comportera les étapes suivantes :
(i) Une étude bibliographique pour identifier les algorithmes les plus récentes pour la prédiction de sites d’épissage,
(ii) La construction d’un jeu de données (benchmark) de sites d’épissage, contentant des exemples positifs (sites connus dans les gènes venant de banques publiques) et des exemples négatifs (sites mal prédits déjà identifiés dans un stage précédent),
(iii) L’évaluation de la spécificité et la sensibilité des différents algorithmes.


Les résultats de l’étude nous permettront d’identifier les forces et les faiblesses des algorithmes existants, et de rechercher des sites d’épissage alternatif dans des gènes impliqués dans des maladies génétiques étudiées dans l’équipe.