Bonjour,

Merci de déposer votre proposition de stage pour le M2S4 BSIB 2018-2019.

Le stage se déroulera de janvier à juin. La soutenance est prévue vers le mardi 18 et mercredi 19 juin 2019.

Responsable de l'équipe d'accueil

Angelique
Fontana
This email address is being protected from spambots. You need JavaScript enabled to view it.
+33 4 67 61 55 19

Personne encadrant le stage

Constancias
Florentin
+33 4 67 61 75 66

Lieu du stage

TA 176 / 16 - 73 rue Jean-François Breton - 34398 Montpellier Cedex 5
France

Sujet du stage

Comparaison de stratégies analytiques pour les données de métabarcoding et de métagenomique dans le cadre de deux projets de recherche.
Contexte & problématique :

Le développement des outils de séquençage de seconde génération (i.e., NGS) a révolutionné l’écologie microbienne en permettant l’obtention massive de séquences provenant des communautés microbiennes d’environnements variés (e.g., sol, aliments, compartiments du corps humain) via des approches de métabarcoding (a.k.a., métagenomique ciblée) ou de métagenomique shot-gun. En revanche, les stratégies analytiques, bio-informatiques et statistiques développées pour l’analyse de ces données ont connues des développements plus récents.

Par exemple, la normalisation de données issues des approches de métabarcoding fait l’objet de débats, tout comme les métriques de diversité adaptées à ce type de données. Similairement, de nouveaux outils de profilage taxonomique de données de métagenomique shot-gun sont fréquemment publiés sans réel information sur la résolution taxonomique à laquelle ils permettent d’accéder.

Dans ce contexte, le but de ce stage est de (i) comparer différents pipelines bio-informatiques adaptés aux données métabarcoding et d’évaluer leurs apports vis à vis des approches classiques, de (ii) statuer sur le potentiel de métriques de diversité (alpha/beta) récemment développées, et enfin (iii) d’évaluer le potentiel de différents outils bio-informatiques adaptés au données de métagenomique shot-gun en terme de caractérisation taxonomique et fonctionnelle.

L’ensemble de ces analyses comparatives serra réalisée dans le cadre de projets de recherche concrets au travers des données de métabarcoding et métagenomique shot-gun.



Objectifs détaillés :

Les objectifs de se stage sont :

Pour les données de type métabarcoding, de :
Comparer les différents pipeline bio-informatiques (e.g., swarm2, dada2, deblur), en terme de diversité (alpha), de structure de communautés et taxonomie.
Explorer les différentes métriques de diversité récemment développées (i.e., TINA & PINA; Breakaway, betta & divnet, …) et comparer les pattern obtenus avec des métriques classiques (e.g., bray-curtis, unifrac)
Pour les donnes métagenomique shot-gun, d’explorer le potentiel de caractérisation taxonomique et fonctionnelle des outils :
de (i) profilage, taxonomique (i.e., Metataxa2, kraken, centrifuge, metaphlan2, SLIMM), intra-spécifique (i.e., panphlan, strainphlan) ainsi que fonctionnel (i.e., humann2, superfocus)
complémentaires (ii), basées sur la reconstruction et l’analyses de MAGs (i.e., Genomes assemblés à partir de metagenomes), via la plateforme Anvi’o.


Projets - Données disponibles :

Afin de répondre à l’ensemble des problématiques, le(a) candidat(e) serra amené(e) à travailler dans le cadre de deux projets de recherché, sur les deux jeux de données suivants (déjà séquencés et non publiés) :

- Un jeu de données comprenant 375 échantillons de pommes caractérisées par métabarcoding 16S et ITS (marqueur taxonomiques bactériens et fongiques, respectivement). Ce projet vise à inventorier les communautés bactériennes et fongiques à la surface des fruits et à comprendre l’influence de différents facteurs (i.e., variété, pratiques culturales, parcelle) sur ces communautés.

- Un second jeu de données comprenant 50 échantillons issus de différents sites de la cavité buccale de patients caractérisés par métagenomique shot-gun. Un des objectifs de ce projet est de caractériser la diversité microbienne spécifique et intrapsecifique entre les patients et les sites de la cavité buccale. N.B. : Pour ce second projet, certaines étapes nécessitant des temps de calculs important ont déjà été effectuées.

Des communautés mock communities séquencés, publiées et disponibles seront également analysées en tant que contrôles pour les différents tests/comparaisons.



Profil recherché :

Nous recherchons un(e) candidat(e) motivé(e), curieux(se) et ambitieux(se) afin de contribuer activement à ces projets de recherche. Un fort attrait pour l’écologie microbienne, de solides compétences en linux, une maitrise du langage R ainsi que des connaissances en analyses statistiques des communautés microbiennes sont nécessaires. L’ensemble des analyses devant être facilement lisibles et reproductibles, une maitrise des outils de bonne pratiques de reproductibilité scientifique serait considérée comme un plus (e.g., github, Rmarkdown).

Le (la) stagiaire travaillera étroitement avec d’autres doctorants impliqués dans ces projets ainsi qu’avec des membres du Collectif de Bioinformatique de Baillarguet (C2B).

Il (elle) aura pour missions : (i) l’installation des outils et dépendances manquantes sur le cluster de calcul – la plupart des outils étant déjà installés, (ii) le traitement bio-informatique (cluster linux, SGE), (iii) la visualisation (R : ggplot2 – Anvi’o)) et (iv) l’analyse biostatistique (R : phyloseq, vegan, mvabund) des résultats.

Ce stage n’aboutira - a priori – pas sur un sujet de thèse mais à l’issue de ce travail le (la) candidat(e) disposera d’une expertise dans l’analyse de données métabarcoding et de métagenomique facilement valorisable par la suite.



Gratification :

Nous ne pouvons pas proposer plus que le minimum légal, soit ~525 – 577 €/ mois.



Lieu du stage :

Le (la) stagiaire serra localisé au CIRAD de Montpellier sur les sites de Lavalette et de Baillarguet.



Contact :

Pour toute information concernant ce stage de M2, merci de contacter Florentin Constancias et Julie Reveillaud par email (florentin.constancias@cirad.fr Julie [dot] reveillaud [at] cirad [dot] fr)">This email address is being protected from spambots. You need JavaScript enabled to view it.) en renseignant comme objet [STAGE Bioinfo].

Pour candidater, merci de joindre un curriculum vitae ainsi qu’une lettre de motivation succincte.



Mots clefs :

Microbiome, 16S/ITS Métabarcoding, Benchmarking, NGS, metagenomique shot-gun, Ecologie microbienne.



Références :

McMurdie, P.J. & Holmes, S. (2014) Waste Not, Want Not: Why Rarefying Microbiome Data Is Inadmissible. PLoS Comput Biol 10(4). https://doi.org/10.1371/journal.pcbi.1003531

Eren, A.M. et al. (2015) Anvi’o: an advanced analysis and visualization platform for ‘omics data. PeerJ 3:e1319 https://doi.org/10.7717/peerj.1319

Callahan, B.J., et al. (2016). DADA2: High-resolution sample inference from Illumina amplicon data Nat. Methods, 13 pp. 581-583

Schmidt, T.S. B. et al. (2017). A family of interaction-adjusted indices of community similarity. ISME Journal, 11(3), 791–807. https://doi.org/10.1038/ismej.2016.139

Weiss, S. et al. (2017). Normalization and microbial differential abundance strategies depend upon data characteristics. Microbiome 5, 27

Walsh, A.M. et al. (2018). Species classifier choice is a key consideration when analysing low-complexity food microbiome data. Microbiome, 6(1), 50. https://doi.org/10.1186/s40168-018-0437-0

Modalités de l’évaluation de l’UE « Stage expérimentale en laboratoire » de la mention de Master Sciences du Vivant

L’UE « stage expérimentale en laboratoire » se compose de 3 blocs pédagogiques de même coefficient : un rapport écrit (coefficient 8), une soutenance orale (coefficient 10) et une épreuve de réponses aux questions (coefficient 12).

Le jury est constitué de 5 membres au moins dont le responsable de la spécialité de Master. Des sous-jurys (par parcours) de 5 membres au moins dont un représentant du responsable de la spécialité de Master peuvent être constitués. Chaque rapport sera examiné par au moins 2 rapporteurs et 3 dans la mesure du possible. Les rapporteurs font partie du jury. Chaque rapporteur évaluera au minimum 3 rapports.

L’avis du maître de stage sera demandé sous forme d’un questionnaire standard et pourra être pris en compte par le président du jury lors de l’établissement de la note finale.
 

Rapport écrit (coefficient 8) 
 

Il a pour but d’évaluer les compétences de l’étudiant à rédiger un rapport scientifique écrit tant sur le fond que sur la forme. Les candidats seront jugés sur la cohérence de la démarche scientifique et sur l’enchaînement logique du travail plus que sur les résultats eux-mêmes. Il est rappelé que l'essentiel du travail exposé dans le mémoire doit représenter le travail effectif qu'a réalisé l'étudiant durant son semestre de stage.

Les candidats remettront 4 exemplaires papier du rapport de stage et une version informatique (format PDF), courrier adressé à Pr. Jean Cavarelli, date limite de réception sera communiqué aux étudiants.

La version PDF devra être déposée sur le site moodle UNISTRA, rubrique stage M2S4 BSIBB, tout au début du mois de juin (la date sera communiquée aux étudiants (début  juin en 2019). Les versions PDF et papier devront être identiques.

  • Toutes les parties du document seront rédigées en interligne de 1,5 en utilisant une police de type Times et des caractères de taille 12.
    Le rapport écrit devra obligatoirement comporter les parties suivantes : introduction, Matériels et Méthodes, Résultats, Discussion / Perspectives et n’excèdera pas 20 pages numérotées. Les pages seront imprimées en recto simple.
  • L’ensemble figures, tableaux, bibliographie ne dépassera pas 10 pages supplémentaires (non paginées). Les figures et leur légende sont présentées en regard du texte (Figures au verso, texte au recto de la page suivante). Les légendes des figures doivent permettre de comprendre les figures sans avoir besoin de consulter le texte, tout en évitant une trop grande redondance avec le texte.
  • Les modalités de présentation de la bibliographie sont celles de la revue CELL (revue généraliste dans laquelle les références sont indiquées dans le texte à l'aide des auteurs et de l'année de publication). Elles peuvent être retrouvées en utilisant un logiciel de type EndNote .
  • Le document sera complété par une page de sommaire et une page d’abréviations en début de rapport.
  • Chaque mémoire doit être accompagné d’un résumé d’une page au maximum (police type Times caractère taille 12, interligne 1,5). Ce résumé doit être suffisamment informatif pour permettre d'orienter le choix des rapporteurs qui examineront le manuscrit. Il devra comporter les informations suivantes :
    Nom et prénom du candidat : Spécialité de Master :
    Laboratoire d'accueil :
    Responsable du stage :
    Titre du rapport
    Mots clés ………………….
    Résumé .............................

 

Présentation orale : durée 12 mn (coefficient 10) 
 

Les soutenances auront lieu mi-juin. La date sera précisé au cours du semestre. Elle a pour but d’évaluer sur la forme et sur le fond les compétences des étudiants à exposer dans un temps limité un travail expérimental, à le situer dans son contexte et à en discuter la stratégie
expérimentale, les résultats et les perspectives. Le candidat devra déposer déposera une version pdf de son exposé oral sur le site moodle du stage la date sera communiquée aux étudiants (mi-juin en 2019). 


Entretien avec les membres du jury.
Questions : durée 12 mn (coefficient 12) 
 

Les questions visent à évaluer et à préciser les connaissances de l‘étudiant sur le thème abordé, son esprit critique et ses compétences expérimentales. Elles pourront ainsi porter sur les techniques mises en œuvre, leur principe, la culture générale dans le domaine abordé et plus généralement la capacité à analyser les résultats et à en dégager des perspectives.


Les questions pourront s’appuyer sur l’exposé oral et sur le manuscrit. Dans ce dernier cas, elles concerneront le fond et non la forme (orthographe, mise en page , etc …)