Responsable de l'équipe d'accueil

Cianférani
Sarah
This email address is being protected from spambots. You need JavaScript enabled to view it.
0368852679

Personne encadrant le stage

Bertile
Fabrice
0368852681

Lieu du stage

Institut Pluridisciplinaire Hubert Curien (IPHC)
Département Sciences Analytiques (DSA)

Laboratoire de Spectrométrie de Masse Bio-Organique (LSMBO)
ECPM, Bât R5-0
25, rue Becquerel
F - 67087 STRASBOURG Cedex 2

Sujet du stage

Amélioration de la protéomique pour les espèces non modèles et la médecine personnalisée : un pas de bioinformatique en avant
L’étude de l’ensemble des protéines dans une cellule, un organe ou un organisme à l’aide de l’analyse protéomique est largement prépondérante dans les sciences de la vie. Les protéines régissent en effet la plupart des processus et fonctions biologiques. La protéomique reste indissociable de la bioinformatique. Par exemple, l’identification des protéines contenues dans un échantillon donné repose sur utilisation d’algorithmes qui comparent les données expérimentales massives provenant d’analyses de spectrométrie de masse aux données théoriques contenues dans les bases de données protéiques. Toutefois, des bases de données protéiques adéquates ne sont pas toujours disponibles. C’est le cas pour les études réalisées chez un certain nombre d’espèces exotiques, ou lorsqu’il devient nécessaire de personnaliser l’analyse pour des individus donnés. De nouveaux outils de bioinformatique pour générer à façon des bases de données protéiques adéquates sont donc nécessaires.
Le projet sera consacré au développement de protocoles d’annotation in silico des séquences nucléotidiques disponibles. Aujourd’hui, des milliers de séquences génomiques sont disponibles pour la communauté, et le nombre augmente à une vitesse sans précédent. Cependant, les génomes ne sont pas toujours entièrement séquencés et leur annotation n’est pas toujours effectuée. Parfois, seules des données de transcriptomique sont disponibles. La prédiction et l’annotation des séquences génomiques codantes, c’est-à-dire la localisation des gènes (+ la reconnaissance intron-exon pour les eucaryotes) auxquelles une fonction biologique est ensuite affectée, permettront la génération de bases de données protéiques personnalisées et pertinentes. Plusieurs outils d’annotation sont disponibles aujourd’hui, cependant, leur utilisation et la qualité de l’annotation nécessitent un certain nombre de paramètres à contrôler (par exemple la taille des régions codantes, la prédiction des sites d’initiation/terminaison/épissage, la conservation des fonctions au cours de l’évolution). Avant que la mise en œuvre de l’annotation in silico des séquences génomiques ne soit couramment utilisée en laboratoire, un certain nombre de tests doivent être effectués, afin de comprendre comment utiliser les outils bioinformatiques choisis, comment en adapter le paramétrage en fonction des caractéristiques des séquences disponibles et comment évaluer la qualité des annotations générées.
En choisissant une plateforme d’annotation bien acceptée, puis en mettant en place son utilisation experte, ce projet devrait ouvrir la voie à de nouvelles études protéomiques sur des espèces non modèles ainsi qu’à des études personnalisées considérant les exacts variants de séquence des gènes/protéines qu’un individu exprime. Le projet examinera d’abord le cas des procaryotes (pas d’intron), et en fonction des résultats, il sera possible d’augmenter la complexité avec les cas d’eucaryotes.