Responsable de l'équipe d'accueil

Brehelin
Laurent
This email address is being protected from spambots. You need JavaScript enabled to view it.
04 67 41 86 71

Personne encadrant le stage

Linard
Benjamin
04 67 14 97 62

Lieu du stage

LIRMM - equipe MAB
Batiment 5 - 860 rue de St Priest
34095 Montpellier

Sujet du stage

Etablissement d'un benchmark bioinformatique d'évènement de réticulation génomique chez les virus
Aujourd'hui, une expérience de métaviromique produit aisément plusieurs millions, voir dizaines de millions de séquences d'ADN courtes dont une fraction seulement correspond au génomes viraux (le métavirome). Identifier ces virus requiert la comparaison de tous ces fragments à des bases de données de référence pour (1) déterminer leur niveau d'homologie aux génomes connus (2) prendre une décision quand à classification taxonomique associée au read. Ce processus est lent et souvent réduit à des recherches par Blast et l'assignation taxonomique devient imprécise quand un fragment d'ADN appartient à un genre viral encore inconnu ou démontrant des évenements de « réticulation ». Ce dernier point est une caractéristique prépondérante chez de nombreux genres viraux : les recombinaisons (intravirus ou avec l'hôte) et les réassortiment (virus polysegments) sont monnaie courante.

Valider le placement phylogénétique sur de nombreuses familles virales nécessite de nombreuses connaissances liées à ces particularités. Nous proposons donc un stage dont le but est l'établissement d'un « benchmark » d'évenements de réticulation viraux. Ceci se fera via la séléction de gènes informatifs, l'établissement d'alignements et d'arbres de références de qualité dans plusieurs famille virale. Ces alignments/arbres de références seront alors enrichis en évenements de réticulation sous forme de métadonnées afin de construire un benchmark sous forme de base de données SQL.

Le candidat se focalisera sur 3 points :

1) Le choix des genres introduits dans le benchmark, qui optera pour la maximisation des scénarios d'analyses possibles. Actuellement, les Coronavirus, les Poxvirus, les Herpesvirus et les Orthomyxovirus sont des candidats prioritaires, mais libre au candidat d'étendre le benchmark à d'autres familles.

2) Pour chaque candidat au benchmark, le candidat établira des alignments et des arbres phylogénétiques de références : un pipeline basique permettant de télécharger et formater les données correspondantes sera mis en place.

3) Finalement, le candidat utilisera sur le benchmark plusieurs outils de placement phylogénétique de métaviromes (dont celui du laboratoire). Des métagénomes seront placés sur le benchmark pour tester son intégrité et confirmer sa polyvalence. Ici, le candidat pourrait être amené à interagir avec notre logiciel qui en cours de développement, participer à son amélioration, son extension voir directement intervenir dans sa programmation (selon motivation). Cependant, l'analyse des résultats de placement phylogénétique et la validation du benchmark resteront la priorité.

Déroulement du stage :

Le candidat effectuera un stage de 6 mois sous la tutelle de Benjamin Linard et Fabio Pardi, au LIRMM de Montpellier (campus St-Priest), équipe MAB (Méthodes et Algorithmes pour la Bioinformatique) sous le projet européen VIROGENESIS. Le stage pourra commencer au choix en janvier ou février 2016.

Le candidat sera rémunéré selon la valeur actuelle des gratifications de stage ( ~554€ / mois).

Profil souhaité :

-Motivation : un intérêt à la fois porté sur les analyses et développements bioinformatiques / informatiques (alignments, arbres phylogénétiques, pipelines) mais aussi l'aspect biologique du projet (beaucoup de recherche et de réflexion sur la génomique des virus).

-Bioinformatique : Le scripting en bash ou un autre langage seront obligatoires pour la construction du benchmark et l'analyse de données car des centaines de Gb seront manipulés. Selon l'avancement, le benchmark pourrait être implémenté sous forme de base de donnée SQLite + interface basique ou site web.

-Biologie : De bonne bases en génomique seront grandement appréciées, la première partie du stage demandant un minimum de jugement biologique.